I.6 SCHÉMAS D'UN DATA
WAREHOUSE
Un schéma est un ensemble d'objets de la base de
données tels que les tables, des vues, des vues
matérialisé, des index et des synonymes. La conception du
schéma d'un Data Warehouse est guidée par le modèle des
données source et par les besoins utilisateurs. L'idée
fondamentale de la modélisation dimensionnelle est que presque tous les
types de données peuvent être représentés dans un
cube de données, dont les cellules contiennent des valeurs
mesurées et les angles les dimensions naturelles de données
.
A. les objets d'un schéma de Data
Warehouse
Les deux types d'objet les plus courants dans les
schémas de Data Warehouse sont les tables de faits et les tables de
dimension.
a) Tables de faits
La table de faits est la clef de voûte du modèle
dimensionnel où sont stockés les indicateurs de performances. Le
concepteur s'efforce de considérer comme indicateurs les informations
d'un processus d'entreprise dans un système d'information. Les
indicateurs étant les données les plus volumineuses d'un
système d'information, on ne peut se permettre de les dupliquer dans
d'autres tables mais de les rationaliser au sein de la table de faits.
Une table de faits comprend généralement des
colonnes de deux types : celles qui contiennent des faits
numériques (souvent appelés indicateurs) et celles qui servent de
clé étrangère vers les tables de dimension. Une table de
faits peut contenir des faits détaillés ou
agrégées. Les tables contenant des faits agrégés
sont souvent appelées tables agrégées. Une table
de faits contient généralement de faits de même niveau
d'agrégation. La plupart des faits sont additifs, mais ils peuvent
être semi additifs ou non additifs.
Les faits additifs peuvent être agrégés
par simple addition arithmétique. C'est par exemple le cas des ventes.
Les faits non additifs ne peuvent pas être additionnés du tout.
C'est le cas des moyennes. Les faits semi additifs peuvent être
agrégés selon certaines dimensions mais pas selon d'autres. C'est
le cas, par exemple des niveaux de stock. Une table de faits doit être
définie pour chaque schéma. Du point de vue de la
modélisation, la clé primaire de la table de faits est
généralement une clé composée qui est formée
de toutes les clés étrangères associées.
b) Tables de dimensions
Une dimension est une structure comprenant une ou plusieurs
hiérarchies qui classe les données en catégories. Les
dimensions sont des étiquettes descriptives fournissant des informations
complémentaires sur les faits, qui sont stockées dans les tables
de dimension. Il s'agit normalement de valeurs textuelles descriptives.
Plusieurs dimensions distinctes combinées avec les faits permettant de
répondre aux questions relatives à l'activité de
l'entreprise.
Les données de dimension son généralement
collectées au plus bas niveau de détail, puis
agrégées aux niveaux supérieurs en totaux plus
intéressants pour l'analyse, ces agrégations ou cumuls naturels
au sein d'une table de dimension sont appelés des
hiérarchies. Les hiérarchies sont des structures
logiques qui utilisent les niveaux ordonnées pour organiser les
données.
Pour une dimension temps, par exemple, une hiérarchie
peut agréger les données selon le niveau mensuel, le niveau
trimestriel, le niveau annuel. Au sein d'une hiérarchie, chaque niveau
est connecté logiquement aux niveaux supérieurs et
inférieurs. Les valeurs des niveaux inférieurs sont
agrégées en valeurs de niveau supérieur.
|