2.5 La Modélisation Dimensionnelle
La modélisation dimensionnelle considère les
données comme des points dans un espace à plusieurs dimensions.
Ces points représentent les centres d'intérêts
décisionnels (sujets) analysés en fonction des différents
axes d'analyse.
2.5.1
Terminologie
2.5.1.1 Concept dimension
Une dimension peut être définie comme l'axe sur
lequel on porte les différentes analyses. Lorsqu'on fait un
schéma de Base de données pour un système d'information
classique, on parle en termes de tables et de relations, une table étant
une représentation d'une entité et une relation une technique
pour établir des liens entre ces entités.
2.5.1.2 Concept fait
Un fait est tout ce qu'on voudra analyser. Les faits, en
complément aux dimensions, sont ce sur quoi va porter l'analyse. Ce sont
des tables qui contiennent les mesures de performance qui relatent la vie de
l'entreprise.
2.5.1.3 Processus de modélisation
La construction d'un entrepôt de données
multidimensionnel est itérative et incrémentale. Au fur et
à mesure de sa construction l'entrepôt de données
doit devenir global et transversal via l'intégration de mesures de
processus clés.
Les étapes de construction d'un entrepôt de
données :
Ø Sélection d'un processus clé ;
Ø Choix de la granularité
stockée ;
Ø Choix des axes d'analyse ;
Ø Détermination du Fait.
Sélection d'un processus clé
Le choix du processus clé doit se faire en fonction de
son importance au sein de l'organisation.
Pour arriver à la sélection de processus
clé vous devez arriver à répondre à un certain
nombre de question :
Ø Quel est l'objectif que nous voulons atteindre avec
la mise en place d'un entrepôt de données par rapport au but
premier de notre entreprise ?
Ø Quels sont les processus qu'il est nécessaire
d'analyser ?
Ø Quels sont les indicateurs de performance,
d'éclairage ou de risque pertinents aux niveaux stratégique,
analytique et opérationnel ?
Ø Quels gains réels pour l'organisation
apporteraient ces décisions ?
Choix de la granularité
stockée
Au niveau de cette étape nous devons faire le choix du
niveau de détail de l'information que nous souhaitons conserver. Prendre
ce qui peutinfluence la prise de décision.
Choix des axes d'analyse
Le but de cette étape est de choisir quels sont les
axes d'analyse adéquats pour le processus en question.
Pour trouver les dimensions adéquates au processus
mesuré, posez-vous les questions suivantes :
Ø à qui ces données
pourraient-elles être utiles ?
Ø comment les analystes regrouperaient-ils les
données ?
Ø comment les analystes filtreraient-ils les
données ?
Ø quels sont les titres de colonne des rapports
actuellement produits ?
Détermination du Fait
Nous devons définir les mesures sur lesquels les
analyses doivent se base .En effet, le système décisionnel se
limitera toujours à des faits tangibles.
Une question est très importante :
Ø Quelles mesures de performance, d'éclairage ou
de risque serait-il pertinent de rattacher à au processus
clé.
2.5.2
Schématisation
2.5.3.1 Le schéma en étoile
Une étoile est une façon de mettre en relation
les dimensions et les faits dans un entrepôt de données. Le
principe est que les dimensions sont directement reliées à un
fait (schématiquement, ça fait comme une étoile).Ce nom
vient faite qu'il y a la table de fait qui jouer le rôle de
l'élément centralisateur sur laquelle les dimensions sont
reliées
251602944
Figure 9 Schéma d'un modèle en
Etoile
Le schéma en étoile est reconnu comme une
approche de Ralph Kimball. Il se prête mieux à la
modélisation des data mart.
Avantage : Lisibilité et performance des
requêtes.
2.5.3.2 Le schéma en flocon
C'est un autre modèle de mise en relation des
dimensions et des faits dans un entrepôt de données. Le principe
étant qu'il peut exister des hiérarchies de dimensions et
qu'elles sont reliées aux faits, ça fait comme un Flocon.
251603968
Figure 10 schémas du modèle en flocon
Ce modèle s'inscrit dans l'approche de Bill Inmon. Son
principal avantage est la performance des Updates et aussi un atout du
côté de l'espace disque.
2.5.3.3 Le schéma en Constellation
Le schéma en constellation consiste à placer
plusieurs schémas en étoile avec des tables de faits
reliées hiérarchiquement. Les liens entre les différentes
tables de faits permettent de visionner les différents niveaux de
détail.
Donc ce schéma consiste à fusionner plusieurs
modèles en étoile qui utilisent des dimensions Communes.
|