II.3 CARACTERISTIQUES D'UN DATA WAREHOUSE [8]
Un Data Warehouse est une base de données conçue
pour l'interrogation et l'analyse plutôt que le traitement de
transactions. Il contient généralement des données
historiques dérivées de données transactionnelles, mais il
peut comprendre des données d'autres origines.
Les Data Warehouse séparent la charge d'analyse de la
charge transactionnelle. Ils permettent aux entreprises de consolider des
données de différentes origines.
Au sein d'une même entité fonctionnelle, le Data
Warehouse joue le rôle d'outil analytique.
En complément d'une base de données, un Data
Warehouse inclut une solution d'extraction, de transformation et de chargement
(ETL), des fonctionnalités de traitement analytique en ligne (OLAP) et
de Data mining, des outils d'analyse client et d'autres applications qui
gèrent le processus de collecte et de mise à la disposition de
données.
Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016
14
|
MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET
L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC
|
II.4 ENTREPOTS ET BASES DE DONNEES [7]
Dans l'environnement des entrepôts de données,
les opérations, l'organisation des données, les critères
de performance, la gestion des métadonnées, la gestion des
transactions et le processus de requêtes sont très
différents des systèmes de bases de données
opérationnels.
Par conséquent, les SGBD relationnels orientés
vers l'environnement opérationnel, ne peuvent pas être directement
transplantés dans un système d'entrepôt de
données.
Les SGBD ont été crées pour les
applications de gestion de systèmes transactionnels. Par contre, les
entrepôts de données ont été conçus pour
l'aide a la prise de décision. Ils intègrent les informations qui
ont pour objectif de fournir une vue globale de l'information aux analystes et
aux décideurs.
Le tableau suivant résume les différences entre
les systèmes de gestion de bases de données et les
entrepôts de données.
|
SGBD
|
entrepôts de données
|
Objectifs
|
gestion et production
|
consultation et analyse
|
Utilisateurs
|
Gestionnaires de production
|
décideurs, analystes
|
Taille de la base
|
plusieurs giga-octets
|
plusieurs téraoctets
|
Organisation des
données
|
par traitement
|
par métier
|
type de données
|
Donnée de gestion (courantes)
|
données d'analyse
(résumées, historisées )
|
Requêtes
|
simples,
prédéterminées,
données détaillées
|
complexes, spécifiques, agrégations et group by
|
Transactions
|
Courte et nombreuse, temps réel
|
longues ,peu nombreuses
|
Tableau II.1.Différence entre SGBD et entrepôts de
données
II.4.1 ROLE D'UN ENTREPOT DE DONNE
Le rôle primordiale d'un data warehouse apparait ainsi
évident dans une stratégie décisionnelle. L'alimentation
du data warehouse en est la phase la plus critique.
En effet, importer des données inutiles en portera de
nombreux problèmes, cela consommera des ressources système et du
temps. De plus, cela rendra le service d'analyse plus lent. Autre point
à prendre en compte est la périodicité d'extraction des
données ; effectivement, le plus souvent, les opérations de
collecte de données sont couteuses en ressource pour la base
accédée.
Mémoire MANKAMBA YANKUMBA Jean Luc UKA 2015 - 2016
15
|
MISE EN PLACE D'UN SYSTEME DECISIONNEL BASE SUR LE DATA MART ET
L'ARBRE DE DECISION POUR LE RECRUTEMENT DU PERSONNEL A LA DGR KOC
|
|