Chapitre Deuxième : CONCEPT DE BASE SUR
L'ENTREPOT DE DONNEES
II.1. INTRODUCTION
Une fois l'information structurée et validée, il
existe deux solutions d'exploitation. La première est de garder ces
informations en mémoire dans une structure virtuelle temporaire pour
l'interrogation. L'autre solution est de stocker de manière permanente
les données sur disques magnétiques.
Nous nous intéressons à la deuxième
solution au cours de ce travail, plus complexe à mettre en oeuvre ; elle
permet alors de fournir tous les renseignements nécessaires.
Certes, l'analyse décisionnelle se base sur la
dimension temporelle de l'information, ce qui nécessite une sauvegarde
permanente. Le data warehouse est le terme anglais qui veut dire entrepôt
de données.
Un entrepôt de données est une structure
informatique dans la quelle est centralisé un volume important de
données consolidées à partir des différentes
sources de renseignements d'une entreprise (notamment les bases de
données internes) et qui est conçue de manière que les
personnes intéressées aient accès rapidement à
l'information stratégique dont elles ont besoin.
Si, dans le passé, l'entrepôt de données
servait davantage à l'archivage, aujourd'hui il est devenu une
pièce maitresse de l'information décisionnelle (ou informatique
d'aide à la décision). Il représente l'un des
éléments essentiels d'un ensemble matériel et logiciel
dynamique de recherche d'informations. Dans un entrepôt de
données, les données sont sélectionnées et
préparées (pour répondre aux questions vitales de
l'entreprise), intégrées (à partir des différentes
sources de renseignements) et datées (elles gardent la trace de leur
origine). Le terme entrepôt de données, employé
très
Mémoire KIAKA MUSITU Héritier Page 27
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 28 sur 91
fréquemment, semble vouloir supplanter ses concurrents
dépôt de données et centrale de données.
Figure n°7 Datawarehouse et Datamart
Cette définition est tirée de celle Bill Inmon
que l'on nomme le père des entrepôts de données et
l'inventeur de ce qu'on appelle EDW pour entreprise Data warehouse ou CIF pour
Corporate Information factory.
II.2. DEFINITION D'UN ENTREPOT DE DONNEES
De nombreuses définitions ont été
proposées, soit académiques, soit par les éditeurs
d'outils de bases de données ou encore par des constructeurs, cherchant
à orienter ces définitions dans un sens mettant en valeur leur
produit.
Une définition pourrait être qu'un Data
Warehouse est l'ensemble des données historiées,
nettoyées, valides, complètes et cohérentes d'une
entreprise, organisées de telle façon à ce que des non
informaticiens puissent en comprendre la structure et l'exploiter, sans
l'intervention d'un informaticien. La définition la plus
appropriée du data warehouse est celle proposée par Bill Inmon :
c'est une collection de données orientées sujet,
Mémoire KIAKA MUSITU Héritier Page 28
Conception d'un Datamart pour le pilotage du système de
gestion des impôts (cas de la DGI)
Page 29 sur 91
intégrées, non volatiles et historisées,
organisées pour le support d'un processus d'aide à la
décision.
D'ailleurs les grands de l'informatique décisionnelle
Bill Inmon et Kimball, définissent un entrepôt de données
par ses caractéristiques :
Dans un entrepôt de données, les informations
sont organisées par fonction dans l'entreprise (comptabilité,
stocks, ventes, etc.), afin de répondre à des besoins
(métier), elles sont classées par thème ( les
données propres à un thème) nous dirons que dans un
entrepôt de données, les données sont
structurées ou organisées autour des sujets
majeurs de l'entreprise, contrairement aux données de systèmes
de production (OLTP= OneLine transaction processing) ceux-ci sont
généralement organisées par processus fonctionnels.
II.2.1. Données orientées sujets
L'intérêt de cette organisation est de disposer
de l'ensemble des informations utiles sur un sujet le plus souvent transversal
aux structures fonctionnelles et organisationnelles de l'entreprise. Cette
orientation sujet va également permettre de développer son
système décisionnel via une approche par itérations
successives, sujet après sujet c'est-à-dire Les données
sont organisées pour répondre à des besoins «
métiers » : elles sont classées par thème. Les
données propres à un thème, les ventes par exemple, seront
rapatriées des différentes bases OLTP (OneLine transaction
processing) de production et regroupées.
|