I.4.1 Caractéristique d'un
Data Warehouse
a. Un Data Warehouse est une collection de données
conçue pour l'interrogation et l'analyse plutôt que le traitement
de transactions. Il contient généralement des données
historiques dérivées de données transactionnelles, mais il
peut comprendre des données d'autres origines. Les Data Warehouse
séparent la charge d'analyse de la charge transactionnelle. Ils
permettent aux entreprises de consolider des données de
différentes origines. Au sein d'une même entité
fonctionnelle, le Data Warehouse joue le rôle d'outil analytique.
b. En complément d'une base de données, un Data
Warehouse inclut une solution d'extraction, de transformation et de chargement
(ETL), des fonctionnalités de traitement analytique en ligne (OLAP) et
de Data mining, des outils d'analyse client et d'autres applications qui
gèrent le processus de collecte et de mise à la disposition de
données.
I.4.2 Les composants de base du
Data Warehouse
a. Le système source : est
le système d'opération d'enregistrement, dont la
fonction consiste à capturer les transactions liées à
l'activité.
b. Zone de préparation des
données : ensemble des processus qui nettoient,
transforment, combinent, archivent, suppriment les doublons,
c'est-à-dire prépare les données sources en vue de leur
intégration puis de leur exploitation au sein du Data Warehouse. La zone
de préparation des données ne doit offrir ni service des
requêtes, ni service de présentation.
c. Serveur de présentation :
machine cible sur laquelle l'entrepôt de données est stocké
et organisé pour répondre en accès direct aux
requêtes émises par des utilisateurs, les
générateurs d'état et les autres applications.
d. Data Mart : sous-ensemble logique
d'un Data Warehouse, il est destiné à quelques utilisateurs d'un
département.
e. Entrepôt de données :
source de données interrogeable de l'entreprise. C'est tout
simplement l'union des Data Marts qui le composent. L'entrepôt de
données est alimenté par la zone de préparation des
données. L'administrateur de l'entrepôt de données est
également responsable de la zone de préparation des
données.
f. OLAP (On Line Analytic Processing) :
Activité globale de requêtage et de présentation de
données textuelles et numériques contenues dans l'entrepôt
de données ; style d'interrogation et de présentation
spécifiquement dimensionnel.
g. ROLAP (Relational OLAP) : ensemble
d'interface utilisateur et d'applications donnant une vision dimensionnelle des
bases de données relationnelles.
h. MOLAP (Multidimensional OLAP) :
ensemble d'interface utilisateur et d'applications dont l'aspect dimensionnel
est prépondérant.
i. Application utilisateur : ensemble
d'outils qui interrogent, analysent et présente des informations
répondant à un besoin spécifique. L'ensemble des outils
minimal se compose d'outil d'accès aux données, d'un tableur,
d'un logiciel graphique et d'un service d'interface utilisateur, qui suscite
les requêtes et simplifie la présentation de l'écran aux
yeux de l'utilisateur.
j. Outil d'accès aux
données : client de l'entrepôt de données.
k. Outil de requête : types
spécifique d'outil d'accès aux données qui invite
l'utilisateur à formuler ses propres requêtes en manipulant
directement les tables et leurs jointures.
l. Application de modélisation :
type de client de base de données sophistiqués
doté de fonctionnalités analytiques qui transforment ou mettent
en forme les résultats obtenus ; on peut
avoir :
- les modèles prévisionnels, qui tentent
d'établir des prévisions d'avenir ;
- les modèles de calcul comportemental, qui
catégorisent et classent les comportements d'achat ou d'endettement des
clients ;
- la plupart des outils de Data mining.
g. Métadonnées : toutes
informations de l'environnement du Data Warehouse qui ne constituent pas les
données proprement dites.
|