1.1.2.2 Lancement de Talend Open Studio(TOS)
Talend Open Studio s'ouvre sur une fenêtre à zones
multiples.
Figure 61: Page d'accueil TOS
1.1.3 Politique et opérations d'entreposage des
données
Notre entrepôt de données étant situé
dans PostgreSQL, nous effectuons l'extraction depuis la source MySQL, qui est
alimentée par notre SIO.
DJYAMO Azore - Mémoire de fin de cycle Master
CSI/IAI-siège/2015-2016
Page | 90
Conception des systèmes décisionnels basée
sur l'analyse des processus métiers
Dans cette partie, nous allons nous servir du schéma
conceptuel créé dans le chapitre précédent, nous
allons nous intéresser aux étapes d'alimentations du Data
warehouse. Le schéma conceptuel de l'entrepôt de données
que nous avons créé précédemment nous oblige
à adapter la structure des données source à fin de
réaliser notre entreposage. C'est pour cette raison que l'ETL est la
phase la plus importante dans un projet Data warehouse. Selon Yazid
Grim[5] : « Il est important de savoir que la
réalisation de l'ETL constitue 70% d'un projet décisionnel en
moyenne. Et ce n'est pas pour rien, ce système est complexe et ne doit
rien laisser s'échapper, sous peine d'avoir une mauvaise information
dans l'entrepôt, donc des données fausses, donc inutilisables
».
Mais avant de faire un ETL, il est conseillé
d'étudier tout d'abord les sources de données. En effet, c'est
d'après les sources que les stratégies de chargement vont
être définies. Par la suite, il faut poser des questions
fondamentales qui dessineront les caractéristiques des sources des
données comme la disponibilité, comment accéder à
ces données, comment assurer les chargements incrémentiels de
données etc.
L'opération d'extraction, de transformation et de
chargement peut alors être possible et méthodique après
cette étude.
1.1.3.1 L'extraction des données
Cette opération se réalise sous Talend Open
Studio (TOS) après avoir mis à jour les pilotes de connexion aux
bases de données concernées. Cette étape passée, le
test de la connexion est visible via la création de la connexion
à la source comme indiqué dans la figure ci-dessous.
Figure 62: Configuration de la connexion à la
source
DJYAMO Azore - Mémoire de fin de cycle Master
CSI/IAI-siège/2015-2016 Page | 91
Conception des systèmes décisionnels basée
sur l'analyse des processus métiers
L'opération d'extraction des tables s'effectue ensuite
grâce à un clic droit sur la connexion et en choisissant
« Récupérer le schéma ». La figure
suivante (figure 64) nous montre comment la base source se
présente lors de cette opération.
Figure 63: Extraction des tables
|