1.1.3.2 La transformation et le chargement des
données
Dans la dernière phase, les données qui
proviennent des bases de production sont souvent brutes et nécessitent
des transformations afin de devenir significatives pour l'utilisateur final et
prêtes à être chargées dans la nouvelle base
(l'entrepôt de données). A l'aide de la fonctionnalité
« Drag and drop » dans un espace de travail appelé
« job » sous TOS, nous déposons les tables à
extraire, les composants nécessaires à la transformation (ici
tMap, tRowLog...) et le composant de sortie (ici tPostgresqlOutput) pour la
Dimension ou le Fait. Voici un schéma illustratif relatif à l'ETL
des dimensions « PoliceAssurance » et « Temps
» de « job » sous TOS.
Figure 64: Préparation de la transformation des
données
DJYAMO Azore - Mémoire de fin de cycle Master
CSI/IAI-siège/2015-2016 Page | 92
Conception des systèmes décisionnels basée
sur l'analyse des processus métiers
Les composants dénommés « Datawarehouse
» représentent la connexion à notre entrepôt de
données (PostgreSQL). Une fois la connexion déposée dans
le « job » comme dans la figure (figure 65), une
configuration de cet élément permet d'indiquer le nom de la
dimension (ou du Fait) et de définir certaines politiques de chargement
telles que l'action à exécuter lors du chargement (suppression de
le table existante ou mise à jour, ou encore simple création)
ainsi que de renseigner les paramètres de connexion à
l'entrepôt de données.
La transformation des données en question se passe sous
le composant de mappage « tMap » situé au centre du « job
» préalablement présenté. A cette étape, il
s'agit notamment d'adapter le schéma des tables sources par rapport au
schéma des dimensions conçues plus haut. Sous TOS, il est
possible, à l'aide de bout de code java, d'ajouter des fonctions (somme,
moyenne, concaténation, . . .) lors de la transformation. Voici un
exemple illustratif de transformation de données sous TOS toujours pour
les mêmes dimensions.
Figure 65: Transformation des données
L'opération de chargement ne consiste qu'en
l'exécution du « job » une fois la transformation
effectuée.
DJYAMO Azore - Mémoire de fin de cycle Master
CSI/IAI-siège/2015-2016 Page | 93
Conception des systèmes décisionnels basée
sur l'analyse des processus métiers
1.2 Choix des autres outils
1.2.1 Outils de modélisation
PowerAMC est un logiciel de conception
créé par la société SDP, qui permet de
modéliser les traitements informatiques et leurs bases de données
associées. Créé par SDP sous le nom AMC Designor,
racheté par Powersoft, ce logiciel est produit par Sybase depuis le
rachat par cet éditeur en 1995. Hors de France, la version
internationale est commercialisée par Sybase sous la
marque PowerDesigner. PowerAMC permet de réaliser tous
les types de modèles
informatiques.
|
Edraw Max : c'est un logiciel de
création de diagrammes techniques d'affaires 2D qui aide à
créer des organigrammes, diagrammes de réseau, etc.
|
|