I.7.2. L'outil de l'ETL (Extract Transform Loading)
Il collecte, nettoye et consolide les données de
l'entreprise étendue. Sachant que la collecte des données est une
fonction remplie par une famille d'outil dénommée ETL.
Figure n° 5 Principe ETL
I.7.3. Les Le processus ou fonctions d'ETL
L'ETL est une opération de migration de données
qui représente une part majeure des traitements et nécessite une
attention régulière tout au long du cycle de vie du
système. Pour pouvoir obtenir ce sous -ensemble, l'outil utilise trois
fonctions principales.
1. L'extraction des données
Il s'agit d'abord de rechercher les données là
ou elles se trouvent, car l'outil ETL a la capacité d'être en
contact avec différentes applications, bases de données ou
fichier c.à.d. dans les différentes sources de données,
pour trouver l'information pertinente effectuer les mises à jour (sur
les bases légataires ou les fichiers de l'entreprise).
Mémoire KIAKA MUSITU Héritier Page 20
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 21 sur 91
2. La transformation et le contrôle des
données
Les outils ETL sont des ateliers spécialisés
dans la migration de données. La transformation des données est
leur fonctionnalité principale. C'est pourquoi ils disposent une
fonction permettant de vérifier qu'une donnée est
cohérente par rapport aux données déjà existantes
dans la base ciblée, ils ont alors des outils de conversion de
données et ils sont conçus pour manipuler de gros volumes de
données. L'étape de contrôle s'effectue par application de
règles adaptées sur les flux de données entrants.
3. Le chargement de données et le transfert des
données
Le chargement prend en compte la gestion du format final des
données pour la mise en oeuvre du transfert de ces données. En
outre une fois que les données extraites, retravaillées,
validées, il reste à les sauvegarder dans une structure
permettant à terme leur interrogation optimisée et
uniformisée.
|