CHAPITRE III. LES ENTREPOTS DE DONNEES
[1][5][7][8][12][18]
III.1 INTRODUCTION
Les entrepôts des données intègrent
les informations en provenance de différentes sources, souvent reparties
et hétérogènes ayant pour objectif de fournir une vue
globale de l'information aux analystes et aux décideurs.
La construction et la mise en oeuvre d'un entrepôt
de données représentent une tâche complexe qui se compose
de plusieurs étapes.
La première à l'analyse des sources de
données et à l'identification des besoins des utilisateurs, la
deuxième correspond à l'organisation des données à
l'intérieur de l'entrepôt. Finalement, la troisième sert
à établir divers outils d'interrogation, analyse, de fouille de
données.
Chaque étape présente des
problématiques spécifiques. Ainsi, par exemple, lors de la
première étape, la difficulté principale consiste à
l'intégration des données, de manière qu'elles soient de
qualité pour leur stockage .pour l'organisation, il existe
plusieurs problèmes comme : la sélection des vues à
matérialiser, le rafraichissement de l'entrepôt, la gestion de
l'ensemble de données courantes et historiées. En ce qui
concerne le processus d'interrogation, nous avons besoin des outils performants
et conviviaux pour l'accès et l'analyse de l'information.
Notre travail se focalise principalement sur une
étape du processus décisionnel, avec une proposition de la
définition d'un modèle multidimensionnel, pour boucle par une
conclusion.
III.2.
DEFINITION CLASSIQUE D'UN ENTREPOT DES DONNEES
Un entrepôt de données est une collection de
données orientées sujet, intégrées, non volatiles
et historiées, organisées pour le support d'un processus d'aide
à la décision. Nous détaillons ces
caractéristiques :
Orientées sujet : les données des
entrepôts sont organisés par sujet plutôt que par
application : par exemple, une chaine de magasins d'alimentation organise
les données de son entrepôt par rapport aux ventes qui ont
été réalisées par produit et par magasin, au cours
d'un certain temps.
Intégrées :
les données provenant des différentes sources doivent être
intégrées, avant leur stockage dans l'entrepôt de
données. L'intégration c'est à dire la mise en
correspondance des formats, permet d'avoir une cohérence de
l'information.
Non volatiles : à la
différence des données opérationnelles, celles de
l'entrepôt sont permanentes et ne peuvent pas être
modifiées .le rafraichissement de l'entrepôt consiste
à ajouter de nouvelles données, sans modifier ou perdre celles
qui existent.
Historiées : la
prise en compte de l'évolution des données est essentielle pour
la prise de décision qui, par exemple, utilise des techniques de
prédication en s'appuyant sur les évolutions passées pour
prévoir les évolutions futures.
|