3.1 Concepts principaux des entrepôts de
données
Bill Inmon définit le Data Warehouse, dans son livre
considéré comme étant la référence dans le
domaine «Building the Data Warehouse» [Inmon, 2002] comme suit:
« Le Data Warehouse est une collection de
données orientées sujet, intégrées, non volatiles
et évolutives dans le temps, organisées pour le support d'un
processus d'aide à la décision. »
Les paragraphes suivants illustrent les caractéristiques
citées dans la définition d'Inmon.
Orienté sujet : le Data Warehouse est
organisé autour des sujets majeurs de l'entreprise, contrairement
à l'approche transactionnelle utilisée dans les systèmes
opérationnels, qui sont conçus autour d'applications et de
fonctions telles que : cartes bancaires, solvabilité client..., les Data
Warehouse sont organisés autour de sujets majeurs de l'entreprise tels
que : clientèle, ventes, produits.... Cette organisation affecte
forcément la conception et l'implémentation des données
contenues dans le Data Warehouse. Le contenu en données et en relations
entre elles diffère aussi. Dans un système opérationnel,
les données sont
essentiellement destinées à satisfaire un processus
fonctionnel et obéit à des règles de gestion, alors que
celles d'un Data Warehouse sont destinées à un processus
analytique.
Intégrée : le Data Warehouse va
intégrer des données en provenance de différentes sources.
Cela nécessite la gestion de toute incohérence.
Evolutives dans le temps : Dans un
système décisionnel il est important de conserver les
différentes valeurs d'une donnée, cela permet les comparaisons et
le suivi de l'évolution des valeurs dans le temps, alors que dans un
système opérationnel la valeur d'une donnée est simplement
mise à jour. Dans un Data Warehouse chaque valeur est associée
à un moment « Every key structure in the data warehouse contains -
implicitly or explicitly -an element of time » [Inmon, 2000].
Non volatiles : c'est ce qui est, en quelque
sorte la conséquence de l'historisation décrite
précédemment. Une donnée dans un environnement
opérationnel peut être mise à jour ou supprimée, de
telles opérations n'existent pas dans un environnement Data
Warehouse.
Organisées pour le support d'un processus
d'aide à la décision : Les données du Data
Warehouse sont organisées de manière à permettre
l'exécution des processus d'aide à la décision (Reporting,
Data Mining...).
|