III.8. CONCEPTION D'UN ENTREPOT DE
DONNEES
La conception d'un entrepôt de données se
fait de deux façon, la première consiste à construire
d'abord plusieurs mini-entrepôts selon les directions ou les
départements ensuite les intègres dans un seul entrepôt
pour l'entreprise ; la deuxième consiste à construire un
entrepôt pour l'entreprise ensuite mettre en place un ou plusieurs
mini-entrepôts pour chaque direction ou départements que compte
l'entreprise.
La conception d'un entrepôt de données peut
se faire en utilisant la modélisation relationnelle classique (pour les
bases de données transactionnelles) ou en utilisant la
modélisation dimensionnelle.
Dans un entrepôt de données les
requêtes pour l'interrogation des données utilisent beaucoup des
jointures qui demandent trop de temps ce qui constitue un problème pour
le système transactionnel. C'est pourquoi il est
préférable d'utiliser l'approche multidimensionnelle.
III.8.1
Modélisation Multidimensionnelle
Pour arriver à construire un modèle
approprie pour un entrepôt de données ou un DataMart, nous pouvons
choisir, soit un schéma relationnel (le schéma en étoile,
en flocon de neige ou en constellation) ; soit un schéma
multidimensionnel.
Avant de décrire les différents
schémas, nous commençons par quelques concepts de base. La
modélisation multidimensionnelle consiste à considérer un
sujet analyse comme un point dans un espace a plusieurs dimensions. Les
données sont organisées de manière à mettre en
évidence le sujet (le fait) et les différentes perspectives de
l'analyse(les dimensions). Le fait représente le sujet d'analyse. Il est
compose d'un ensemble de mesures qui représentent les différentes
valeurs de l'activité analysée.
Par exemple, dans le fait ventes, nous pouvons avoir la
mesure "quantité de produits vendus par magasin". Les mesures doivent
être valorisées de manière continue et elles peuvent
être additives (pour résumer une grande quantité
d'enregistrements) ; semi-additives (si elles peuvent seulement être
additionnées pour certaines dimensions) et non additives.
Une dimension modélise une perspective de
l'analyse. Elle se compose de paramètres(ou attributs) qui servent
à enregistrer les descriptions textuelles.
A. Méthodologie de design de la base de
données pour l'entrepôt des données :
Dans cette section nous décrivons une
méthodologie par étapes pour construire la base de données
d'un entrepôt de données cette méthode a été
initialement proposées par Kimball et s'appelle méthodologie a
neuf étape dans la modélisation d'un entrepôt des
données :
Etape
|
Activité
|
1
|
Choisir la procédure
|
2
|
Choisir le grain
|
3
|
Identifier les dimensions et s'y conformer
|
4
|
Choisir les faits
|
5
|
Emmagasiner les calculs préliminaires dans la table
des faits
|
6
|
Finaliser les tables de dimensions
|
7
|
Choisir la durée de la base de
données
|
8
|
Suivre les dimensions a modification lente
|
9
|
Les décideurs doits décidé des
priorités de requêtes et des modes de requêtes
|
Tableau III. 3:La méthodologie a neuf
étapes de Kimball
|