3.3.1 Serveur SOLAP (Spatial On-Line Analytical
Processing)
La technologie SOLAP peut être définie comme "un
type de logiciel qui permet la navigation rapide et facile dans les bases de
données spatiales et qui offre plusieurs niveaux de granularité
d'information, plusieurs thèmes, plusieurs époques et plusieurs
modes d'affichage synchronisés ou non : cartes, tableaux et diagrammes "
[Bédard 2004].
3.3.1.1 Fonctionnalités d'un serveur SOLAP
Un serveur SOLAP fournit aux utilisateurs une vue
multidimensionnelle des données qui peuvent être analysées
grâce à un ensemble d'opérateurs SOLAP (Roll-Up,
Drill-Down, etc.). De plus, le serveur SOLAP permet de gérer de
façon transparente les données spatiales et non spatiales,
agrégées et variantes dans le temps destinées à
l'analyse d'un sujet en particulier.
3.3.1.2 Opérateurs SOLAP
Les opérateurs OLAP permettent d'explorer les
données multidimensionnelles en utilisant les concepts de dimensions et
hiérarchies.
Un panorama des opérateurs OLAP proposés dans la
littérature est présenté par Rafanelli en [Rafanelli,
2003]. Les plus communs sont :
> Les opérateurs de forage
- Roll-up permet de monter dans les
hiérarchies des dimensions, et d'agréger les mesures.
- Drill-Down est l'inverse du Roll-Up et permet
de descendre dans une hiérarchie. > Les opérateurs de coupe
- Slice utilise un prédicat
défini sur les membres des dimensions pour couper une partie de
l'hypercube limitant le champ d'analyse et permettant à l'utilisateur de
se concentrer sur des aspects particuliers du phénomène. En
utilisant la terminologie de l'algèbre relationnelle, l'opération
de slice est l'équivalent de la sélection.
- Dice réduit la dimensionnalité
de l'hypercube en éliminant une dimension. Cette opération est
équivalente à la projection de l'algèbre relationnelle.
- Drill-Accross met en relation plusieurs
hypercubes pour comparer leurs mesures. En effet dans un processus
d'exploration et d'analyse, comparer plusieurs phénomènes est
fondamental pour aboutir à une connaissance finale.
Corréler plusieurs hypercubes pour avoir une vision
unique des différentes mesures est donc nécessaire dans le
processus d'analyse multidimensionnel. L'opération de drill-accross
fusionne plusieurs hypercubes en utilisant les axes d'analyse en commun.
3.3.1.3 Implémentation physique d'un serveur
SOLAP
Les approches principales pour l'implémentation de
serveurs SOLAP sont Multidimensional OLAP (MOLAP), Relational OLAP (ROLAP) et
Hybrid OLAP (HOLAP).
Les serveurs MOLAP extraient les
données de l'entrepôt de données Spatiale et les
mémorisent en utilisant des structures de données
particulières et ils appliquent des techniques d'indexation et de
hachage pour localiser les données lors de l'exécution des
requêtes multidimensionnelles.
Les serveurs ROLAP [Kimball, 1996] utilisent
la technologie des bases de données relationnelles pour mémoriser
les données. Pour obtenir de performances acceptables, ces
systèmes utilisent des structures d'indexation particulières
comme l'index bitmap, et les vues matérialisées [Winter,
1998].
La modélisation logique d'une base de données
multidimensionnelle selon l'approche ROLAP ne systématise pas
l'utilisation de la 3ième forme normale, contrairement aux
systèmes OLTP. Le modèle logique le plus utilisé est le
schéma en étoile [Kimball, 1996]. Le schéma en
étoile (Figure 3.4a) se constitue d'une table de faits et de
tables de dimensions. Chaque entrée dans la table de faits
représente un fait ou une cellule du cuboïde de base, et elle est
liée, à travers des clés étrangères,
à des dimensions. Les tables de dimensions sont des tables
dénormalisées contiennent des attributs descriptifs et des
attributs qui représentent les hiérarchies des dimensions. Par
exemple, un produit est caractérisé par un code, par un nom, qui
représente un attribut descriptif, et un type. Le type est
utilisé pour regrouper les produits en catégories
différentes. La dénormalisation améliore les performances
des requêtes car elle réduit le nombre de jointures. Une variante
du schéma
en étoile est le schéma en flocon (Figure
3.4b). Il présente des dimensions partiellement ou totalement
dénormalisées. La normalisation est utilisée pour
réduire la redondance, surtout dans le cas où chaque niveau
hiérarchique présente différents attributs et/ou quand la
dimension est constituée de nombreux niveaux. Enfin, classiquement, un
entrepôt de données est formé par différents
hypercubes liés entre eux par des dimensions. La structure logique
utilisée dans ce cas est le schéma en constellation. Il s'agit de
plusieurs tables des faits qui partagent des tables des dimensions et qui
peuvent être vu comme une collection d'étoiles (schéma en
galaxie ou constellation de faits) (Figure 3.4c). Cette
représentation logique permet d'utiliser l'opération de
drill-accross.
Figure 3.4 : a) Schéma en
étoile b) Schéma en flocon c) Schéma en
constellation.
En général, les serveurs MOLAP
[Thomsen, 1997] sont plus rapides et nécessitent moins d'espace de
stockage, car les données sont stockées par le serveur SOLAP de
façon à garantir ces aspects. Les serveurs ROLAP permettent le
passage à l'échelle et sont plus adaptés pour des mises
à jour très fréquentes.
Enfin, il existe une autre typologie qui combine les deux
technologies le Hybrid OLAP. Selon cette approche, une partie des
données sont stockées en relationnel et l'autre en utilisant des
techniques particulières.
|