I.4 ARCHITECTURE DE DATA WARE
HOUSE
Méta données
Fig.01 architecture de dataware
house
L'architecture d'un ED, représentée dans la
figure ci - dessus, s'articule autour de trois phases : l'intégration,
la restructuration, et l'exploitation (Inmon, 1996b).
Les systèmes opérationnels, bases de
données indispensable à la vie d'une entreprise, permet d'avoir
une activité journalière (gestion de stocks, base des
fournisseurs/clients, etc.). Ceci n'est pas le rôle d'un Data warehouse,
couplé à des outils de datamining, il n'a pour unique but de
faciliter la prise de décision en apportant une vue
synthétisée de l'ensemble des données de l'entreprise
éparpillées dans toutes ces bases opérationnelles.
Les données ayant été identifiées,
elles doivent être extraites de leurs système sources,
transformées puis acheminées jusqu'aux serveurs de
présentation. Elles sont en suite mise à disposition dans le but
d'être utilisées efficacement par les clients du Data warehouse.
L'élaboration de l'architecture et
l'établissement des priorités doivent en premier lieu être
piloté par les besoins métier. L'architecture du Data warehouse
présente les processus et les outils qui s'appliquent aux
données. Elle répond aux questions : comment
récupérer les données sources, comment leur donner une
forme répondant aux besoins et comment les placer à un endroit
accessible ? Les outils, les utilisateurs, le code, tout ce qui donne vie
à l'entrepôt de données fait partie de l'architecture. Ces
composants constituent les pompes et les canalisations qui régulent les
flux des données et les dirigent au bon endroit au bon moment. Les
emplacements d'origine et de destination des données font
également partie de l'architecture. Cette dernière répond
aux questions suivantes :
Ø Comment récupérer les
données sources ?
Ø Comment leur donner une forme répondant aux
besoins ?
Ø Comment les placer à un endroit
accessible ?
Ø Les outils, les utilisateurs, le code, tout ce qui
donne vie à l'entrepôt de données fait partie de
l'architecture. Cette dernière s'articule aussi autour de trois
phases :
- L'intégration : cette étape est assez
délicate, car elle consiste à extraire et regrouper les
données provenant des sources multiples et
hétérogènes. Certain nombre des problèmes est
à résoudre à ce niveau : les données doivent
être filtrées, tirées, homogénéisées
et nettoyées ;
- La restitution : cette étape consiste à
réorganiser les données dans des magasins afin d'apporter
efficacement les processus d'analyses et d'interrogations, et d'offrir aux
différents utilisateurs, des vues appropriées à leurs
besoins ;
- Interrogation et analyse : l'exploitation de
l'entrepôt, pour l'aide à la décision peut se faire des
différentes façons, dont :
- L'interrogation à travers un langage de
requêtes ;
- La connexion à des composants de report, pour des
représentations graphiques et tabulaires ;
- L'utilisation des techniques OLAP (Online Analytical
Process) ;
- L'utilisation des techniques de fouille de données
(Datamining).
|