I.6.1 Le Schéma en
Etoile
Le schéma en étoile peut être le type le
plus simple de schéma de Data Warehouse, il est dit en étoile
parce que son diagramme entité/relation ressemble à une
étoile, avec des branches partant d'une table centrale.
Un schéma en étoile est
caractérisé par une ou plusieurs tables de faits, très
volumineuses, qui contiennent les informations essentielles du Data Warehouse
et par un certain nombre de tables de dimension, beaucoup plus petites, qui
contiennent chacune des informations sur les entrées associées
à un attribut particulier de la table de faits. Une interrogation en
étoile est une jointure entre une table de faits et un certain nombre de
table de dimensions. Chaque table de dimension est jointe à la table de
faits à l'aide d'une jointure de clé primaire à clé
étrangère, mais les tables de dimension ne sont pas jointes entre
elles.
Dans un schéma en étoile, une table centrale de
faits contenant les faits à analyser, référence les tables
de dimensions par des clefs étrangères. Chaque dimension est
décrite par une seule table dont les attributs représentent les
diverses granularités possibles.
Dimensions 1
Id_dim1
Dimensions 1
Id_dim1
Table des Faits
Id_f (Pk)
Id_dim1 (Fk)
Id_dim2 (Fk)
Id_dim3 (Fk)
Id_dim4 (Fk)
Dimensions 2
Id_dim2
Dimensions 3
Id_dim3
Dimensions 4
Id_dim4
Les schémas en étoile présentent les
avantages suivants : ils fournissent une correspondance directe et
intuitive entre les entités fonctionnelles analysées par les
utilisateurs et la conception du schéma. Ils sont pris en charge par un
grand nombre d'outils décisionnels. La manière la plus naturelle
de modéliser un Data Warehouse est la représenter par un
schéma en étoile dans lequel une jointure unique établit
la relation entre la table de faits et chaque table de dimension. Un
schéma en étoile optimise les performances en contribuant
à simplifier les interrogations et à raccourcir les temps de
réponse. Les schémas en étoile présentent
néanmoins quelques limites.
Fig.2 schéma en
étoile
I.6.2 Le Schéma en
Flocon
Les schémas en flocons normalisent les dimensions pour
éliminer les redondances. Autrement dit, les données de dimension
sont stockées dans plusieurs tables et non dans une seule table de
grande taille. Cette structure de schéma consomme moins d'espace disque,
mais comme elle utilise davantage de tables de dimension, elle nécessite
un plus grand nombre de jointures de clé secondaire. Les interrogations
sont par conséquent plus complexes et moins performantes.
Dans un schéma en flocon, cette même table de
faits, référence les tables de dimensions de premier niveau, au
même titre que le schéma en étoile. La différence
réside dans le fait que les dimensions sont décrites par une
succession de tables (à l'aide de clefs étrangères)
représentant la granularité de l'information. Ce schéma
évite les redondances d'information mais nécessite des jointures
lors des agrégats de ces dimensions.
Le principal avantage du schéma en flocons est une
amélioration des performances des interrogations due à des
besoins réduits en espace de stockage sur disque et la petite taille
des tables de dimension à joindre.
Dimensions 1
Id_dim1
Dimensions 1
Id_dim1
Table des Faits
Id_f (Pk)
Id_dim1 (Fk)
Id_dim2 (Fk)
Id_dim3 (Fk)
Id_dim4 (Fk)
Dimensions 2
Id_dim2
Id_dim 5
Dimensions 3
Id_dim3
Id_dim 6
Dimensions 4
Id_dim4
Dimensions 6
Id_dim 6
Dimensions 5
Id_dim5
Le principal inconvénient de ce schéma est le
travail de maintenance supplémentaire imposé par le nombre accru
de tables de dimension.
Fig 3 : schéma en flocon
|