3.4 Conception du modèle décisionnel
La modélisation par schéma en étoile, par
opposition aux schémas normalisés en 3NF, permet de
répondre à deux besoins caractéristiques des
systèmes décisionnels : la performance et la simplicité
des requêtes.
En effet, en tant que structures redondantes les
schémas en étoiles permettent d'agréger la table des faits
avec n'importe qu'elle dimension en une seule opération de jointure
(deux ou trois pour les schémas en flocons).
Ce gain de performance est souvent critique puisque les
volumes de données sont généralement d'un ordre de
grandeur très supérieur à celui des systèmes
transactionnels.
Cette redondance ne pose pas les mêmes problèmes
que dans les systèmes transactionnels, en effet :
? les données étant statiques
(importées), il n'y a pas de risque de divergence d'information lors de
mises à jour
? l'usage du data warehouse étant essentiellement
statistique (regroupement), la conséquence d'une éventuelle
erreur n'est pas du même ordre que dans un système
transactionnel.
La présentation en étoile des données,
avec les faits au centre et les dimensions autour, est particulièrement
adaptée à l'écriture rapide de requêtes simples pour
agréger des données de la table des faits selon des regroupements
sur les tables de dimensions.
L'enjeu est de pouvoir répondre simplement et
rapidement à une question simple, tandis qu'un modèle
transactionnel, qui répond à d'autres contraintes,
nécessitera souvent un code SQL complexe et des opérations
multiples pour répondre à la même question. Cela permet
notamment aux utilisateurs finaux de construire facilement de nouvelles
requêtes au fil de leur exploration des données.
On appelle donc « dimension » un axe d'analyse. Dans
notre contexte il peut s'agir des clients ou des services d'une entreprise,
d'une période de temps comme un exercice financier, des activités
menées au sein d'une société, etc.
« Une table de dimension établit l'interface
homme / entrepôt, elle comporte une clé primaire »
[Kimball, 2002]
Une table de fait est une table qui contient les
données observables (les faits) que l'on possède sur un sujet et
que l'on veut analyser, selon divers axes d'analyse (les dimensions). Les
« faits », dans un entrepôt de données, sont en principe
numériques,
DJYAMO Azore - Mémoire de fin de cycle Master
CSI/IAI-siège/2015-2016 Page | 57
Conception des systèmes décisionnels basée
sur l'analyse des processus métiers
puisque d'ordre quantitatif. Il peut s'agir du montant en argent
des primes couverts, du nombre de polices contractés dans une compagnie
ou agence d'une compagnie, etc.
|