V.2. Différents processus ETL de l'EDS avec
GeoKettle
Dans cette section, nous allons décrire les
différents processus : extraction
(génération si les données n'existent pas),
transformation et de chargement des dimensions et faits en utilisant l'atelier
ETL GeoKettle.
V.2.1. Chargement de la dimension «dim_temps»
Pour charger la dimension temps, nous avons construit un
calendrier de cent
ans à compter du 1er janvier 2014. La
transformation illustrée dans la figure ci-dessous présente le
processus de génération des données de cette dimension.

Figure V. 5: Génération du calendrier
et chargement dans l'EDS
V.2.2. Chargement de la dimension « dim_abonnement
»
Pour charger cette dimension, il nous a fallu
générer un certain nombre d'abonnés puisque nous ne
disposions pas de la base de données de production. Comme nous avons mis
sur pied une base de données de production de facturation pour le besoin
de test, nous avons d'abord chargé celle-ci. Après nous avons
donc extrait les données sur les abonnés et leur branchement pour
charger enfin la dimension « dim_abonnement
» dans l'entrepôt de données spatial. Les deux
processus sont illustrés dans les figures ci-dessous. Dans la Figure V.
6, nous
Chapitre V : Résultats et commentaires

Bassirou Mohamet
65
Figure V. 6: Génération et chargement
de la table "ABONNE"
Figure V. 7: Processus ETL des
abonnements
générons un nombre d'abonnés pour
alimenter la table « abonne » dans la base
de données de production que nous appelons « bdprod
» implémentée dans MySQL. La Figure V. 7, quant
à elle présente le processus d'extraction des abonnés et
leur branchement à partir de « bdprod » pour
les charger dans la table de dimension « dim_abonnement
» au niveau de l'entrepôt de données
nommé « edgeo_ndere ».
Chapitre V : Résultats et commentaires
V.2.3. Chargement de la dimension « dim_transfo
»
Quelques données sur les transformateurs nous ont
été fournies par le LG dans un fichier Excel. Cependant, pour
avoir une bonne cohérence des données, nous devons charger la
base de données de production et l'entrepôt de données
spatiales. Le processus devient un peu complexe. Nous avons extrait les
données du fichier Excel, et la table « quartier ». Nous les
avons croisées afin de récupérer les identifiants des
quartiers. D'une part, après quelques transformations nous avons
procédé au chargement dans la table « Transformateur »
au niveau de la base de données de production. D'autre part, à
partir de l'étape de la jointure, des procédures de
transformation ont été nécessaires pour permettre le
chargement dans la dimension « dim_transfo
» et créer en même temps un fichier de forme
(transfo.shp). La Figure V. 8 ci-dessous illustre le processus que nous venons
de décrire.

Figure V. 8: ETL des
transformateurs
67
Bassirou Mohamet
Chapitre V : Résultats et commentaires
|