CHAPITRE I : GENERALITES SUR
LE DATA WARE HOUSE (ENTREPOT DE DONNEES) [3],[5],[4]6],[8],[9], [17]
Ce chapitre explicite de manière claire les concepts
fondamentaux et arguments généralement utilisés dans les
discussions ayant trait au data ware house. Ceux-ci y sont
présentés concernant l'entrepôt de données mais en
général ils seront autant que possible étayés par
des exemples provenant du secteur de la télécommunication
notamment dans son volet de la réduction de l'attrition.
I.1 INTRODUCTION
Le concept d'entrepôt de données a
été formalisé pour la première fois en 1990 par
Bill Immon. Il s'agissait de constituer une base de données
orientée sujet, intégrée et contenant des informations
historisées, non volatiles et exclusivement destinés aux
processus d'aide à la décision.
En effet, la simple logique de production (produire pour
répondre à une demande) ne suffit plus pour pérenniser.
Elle est un système ouvert sur son environnement au coeur des
systèmes d'informations confrontées à des
phénomènes économiques et sociaux lourds de
conséquences. Pour faire face aux nouveaux enjeux , l'entreprise doit
collecter , traiter , analyser les informations de son environnement pour
anticiper le changement.
Il devient fondamental de rassembler et
d'homogénéiser les données afin de permettre l'analyse des
indicateurs pertinents pour faciliter la prise de décision. L'objet de
l'entrepôt de données est de définir et d'intégrer
une architecture qui serve de fondation aux applications
décisionnelles.
I.1.1 Définition
Un entrepôt de données ou data warehouse se
définit comme un ensemble des données orienté sujet non
volatile, historisée, résumée, disponible pour
l'interrogation et l'analyse et organisée pour le support d'un processus
d'aide à la décision. « Bill Inmon ».
Les données d'un data warehouse possèdent les
caractéristiques suivantes :
a) Intégrées
Les données de l'entrepôt proviennent de
différentes sources éventuellement
hétérogènes. L'intégration consiste à
résoudre les problèmes
d'hétérogénéité des systèmes de
stockage, des modèles de données, de sémantique de
données.
b) Orientées sujet
Le Data Warehouse est organisé au tour des sujets
majeurs de l'entreprise. L'intérêt de cette organisation est de
disposer de l'ensemble des informations utiles sur un sujet le plus souvent
transversal aux structures fonctionnelles et organisationnelles de
l'entreprise.
c) Non volatiles
Tout se conserve, rien ne se perd : cette
caractéristique est primordiale dans les entrepôts de
données. En effet, et contrairement aux bases de données
classiques, un entrepôt de données est accessible en ajout ou en
consultation uniquement. Les modifications ne sont autorisées que pour
des cas particuliers (correction d'erreurs...etc.).
d) Historisées
La conservation de l'évolution des données dans
le temps, constitue une caractéristique majeure des entrepôts de
données. Elle consiste à s'appuyer sur les résultats
passés pour la prise de décision et faire des prédictions
; autrement dit, la conservation des données afin de mieux
appréhender le présent et d'anticiper le futur.
e) Résumées
Les informations issues des sources de données doivent
être agrégées et réorganisées afin de
faciliter le processus de prise de décision.
f) Disponibles pour l'interrogation et l'analyse
Les utilisateurs doivent pouvoir consulter les données
en fonction de leurs droits d'accès. L'entrepôt de données
doit comporter un module de traitement des requêtes, exprimées
dans un langage, doté d'opérateurs puissants, pour l'exploitation
de la richesse du modèle.
|