IV.4.2. L'architecture du système d'ETL
L'élaboration d'une architecture du système d'ETL
au début de tout projet
d'alimentation est très importante. En effet,
d'après (FILALI, 2010), le choix d'une architecture affecte pratiquement
toutes les composantes du projet.
Il devient donc nécessaire d'élaborer une
architecture consistante qui prendra en charge toutes les contraintes
auxquelles on doit faire face.
Le processus de l'ETL peut se faire de différentes
manières. Dans notre cas, nous avons choisi la méthode
«Pull». D'autant plus que nous avons
décidé du chargement mensuel et à des heures
d'inactivité du système de production. La figure suivante
illustre l'architecture du processus d'alimentation que nous avons
adoptée dans le cadre de ce travail.
![](Mise-en-oeuvre-d-applications-geo-decisionnelles-Implementation-d-un-systeme-ETl-avec-geokettle35.png)
Figure IV. 8: Architecture du processus
ETL
57
Bassirou Mohamet
Chapitre IV : Conception du système d'ETL
Spatial
Au niveau du serveur ETL, les données sont extraites
à partir des sources de données. Quelques transformations seront
appliquées pour les préparer au chargement dans l'EDS qui se
trouve dans la zone d'entreposage. Après chaque chargement, il faut
mettre à jour les Meta Data.
Afin de détecter les changements effectués sur
les données sources, il est impératif de
développer une sentinelle et de l'implémenter
au niveau des sources. C'est elle qui enverra le signal au système ETL
pour déclencher le processus.
IV.4.3. Processus global d'alimentation de
l'entrepôt
Le diagramme d'activités défini dans la figure
IV.9 ci-dessous décrit de manière globale le processus
d'alimentation de l'EDS.
![](Mise-en-oeuvre-d-applications-geo-decisionnelles-Implementation-d-un-systeme-ETl-avec-geokettle36.png)
Figure IV. 9: Diagramme d'activité du
processus global d'alimentation
IV.4.3.1. Processus de chargement des dimensions
Les dimensions constituent le contexte des faits. Une
dimension est généralement constituée d'une clé
artificielle, d'une clé naturelle et des attributs. Le processus de
chargement de dimensions doit, non seulement transformer et charger les
données, mais aussi assurer :
· La gestion des clés artificielles: affectation
des clés et mise en correspondance avec les clés naturelles ;
58
Bassirou Mohamet
Chapitre IV : Conception du système d'ETL
Spatial
· La gestion de l'évolution de dimension :
gérer les changements que subissent les dimensions. Il existe trois
types de traitements par rapport à l'évolution d'une dimension
:
1. « Écraser l'ancien
enregistrement» : consiste à mettre à jour
l'attribut qui a subi le changement ;
2. «Créer nouvel
enregistrement» : consiste à créer un nouvel
enregistrement afin de sauvegarder tout le cycle d'évolution de la
dimension ;
3. «Déplacer l'ancienne valeur qui a
changé dans un attribut ancien» : consiste à
prévoir des attributs pour enregistrer les changements éventuels.
Il permet de sauvegarder un nombre défini de changements.
Le diagramme d'activité représenté dans
la figure ci-dessous illustre le processus de chargement des dimensions dans
l'EDS.
![](Mise-en-oeuvre-d-applications-geo-decisionnelles-Implementation-d-un-systeme-ETl-avec-geokettle37.png)
Figure IV. 10: Diagramme d'activité ETL des
dimensions
|