IV.3. SGBD D'ENTREPOSAGE SPATIAL
Le choix du SGBD spatial s'est fait suivant plusieurs
critères. Premièrement nous devons travailler dans un
environnement open source. De plus, il nous a fallu un système
performant pouvant supporter un très grand volume de données
spatiales. Ainsi, nous avons choisi d'implémenter notre entrepôt
de données sous le SGBD open source PostgreSQL/PostGIS.
IV.4. CONCEPTION DU PROCESSUS D'ETL
L'ETL est l'une des étapes la plus importantes dans le
processus de mise sur pied d'un système de GéoBI. Beaucoup
d'auteurs de commun accord, estiment à 80% sa charge de travail. En
effet, son objectif principal est d'assurer le transfert de données des
systèmes source jusqu'à l'entrepôt de données, en
passant par les différentes phases de nettoyage et de transformations
nécessaires.
La conception du processus d'alimentation nécessite les
phases suivantes :
· Étude et planification ;
· Choix de l'architecture du système d'ETL ;
· Conception des processus de chargement des tables:
o Dimension ;
o Faits ;
o Temps.
IV.4.1. Étude et planification
C'est la phase préliminaire de l'ensemble du processus.
Elle consiste à :
· Étudier les sources de données ;
· Détecter les emplacements des données
source ;
· Définir la périodicité du chargement
des données.
55
Bassirou Mohamet
Chapitre IV : Conception du système d'ETL
Spatial
IV.4.1.1. Les sources de données
Dans la section de l'étude de l'existant, nous avons
souligné que les sources des données de notre entrepôt sont
:
· Une base de données de production de
facturation que nous avons implémentée ;
· Des fichiers (shapefile, Excel) mis à notre
disposition par le Laboratoire de Géomatique ;
· Des fichiers shapefile du territoire Camerounais
téléchargés sur le site :
http://www.sogefi-sig.com/donnees-sig/137-donnees-sig-openstreetmap.
IV.4.1.2. Détection des emplacements des
données
L'étude des différentes informations que le
Laboratoire de Géomatique, à travers notre encadreur industriel,
a mises à notre disposition nous a permis de déterminer les
emplacements des données source et d'en choisir ceux qui sont
pertinentes et plus fiables.
Au vu des volumes importants de données que nous
avions à étudier et le
manque de systèmes opérationnels, cette
tâche n'était pas facile à réaliser.
Néanmoins, après la réalisation du schéma
étoile de l'EDS, nous devons :
· Lister les données nécessaires pour l'EDS
;
· Lister les emplacements de chaque donnée ;
· Choisir la source la plus fiable et la valider comme
source de chargement ;
· Dresser un tableau, selon (Kimball, 2004), qui
établit le lien entre données sources et donnée cibles
avec les transformations nécessaires.
|