II.3.3. Pourquoi un ED à la place d'un SGBD
Opérationnel ?
Les ED et les SGBD5 opérationnels ont des objectifs
différents et font des traitements différents. Leurs modes de
stockage et leurs types de requêtes sont également
différents. D'où ils doivent être physiquement
séparés pour optimiser leur fonctionnement.
Les SGBD opérationnelles sont des systèmes dont
le mode de travail est transactionnel (OLTP : On-line Transaction Processing).
Ils permettent de faire :
· L'insertion, la modification ;
· L'interrogation rapide des informations et de
manière sécurisée. Les SGBD ont comme objectifs
principaux:
· La sélection, faire des ajouts ;
· De mettre à jour et supprimer des tuples.
Ces opérations doivent être effectuées
très rapidement, et par de nombreux utilisateurs
simultanément.
Les data warehouse quant à eux, sont des
systèmes conçus pour l'aide à la prise de décision
dont le mode de travail est analytique (OLAP On-Line Analytical Processing).
Les ED sont utilisés la plupart du temps en lecture.
Les objectifs principaux sont :
5 Système de gestion des bases de
données
19
Bassirou Mohamet
Chapitre II : Généralités sur les
entrepôts de données et les SIG
· Extraire, regrouper, organiser des informations
provenant de sources diverses ;
· Intégrer les informations et les stocker pour
donner à l'utilisateur une vue orientée métier ;
· Retrouver et analyser l'information facilement et
rapidement.
Le tableau ci-dessous présente un récapitulatif
comparatif des ED et SGBD (Batouré, 2011).
Caractéristiques
|
SGBD/Opérationnel
|
Entrepôt de données
|
Applications
|
Production
|
Aide à la prise de décision
|
Utilisateurs
|
Professionnels de l'informatique
|
Décideurs non informaticiens
|
Données
|
Normalisées, non agrégées
|
Dénormalisées, agrégées
|
Requêtes
|
Simples, nombreuses, régulières,
prévisibles, répétitives
|
Complexes, peu
nombreuses, irrégulières, non
prévisibles
|
Nombre tuples invoqués par
requête
|
Des dizaines
|
Des millions
|
Taille données
|
100 MB à 1 GB
|
1 GB à 1 TB et plus
|
Ancienneté des données
|
récente, mises à jour
|
historique
|
|
Tableau II. 1: Différence entre ED et
système transactionnel
II.3.4. Modélisation conceptuelle des
entrepôts de données
II.3.4.1. La modélisation par sujet
Un entrepôt de données est
généralement basé sur un SGBD relationnel. La
modélisation par sujet est une technique de conception logique qui vise
à organiser et classifier les informations des bases légataires
en données classées par sujet fonctionnel. Elle est basée
sur la modélisation " Entité/Relation " et est
préliminaire à la modélisation dimensionnelle. Chaque
sujet correspond à une table gérée au sein de
l'entrepôt. Il faut isoler les données stratégiques,
déterminer les informations de détails nécessaires
(profondeur, granularité) et conserver les métadonnées.
20
Bassirou Mohamet
Chapitre II : Généralités sur les
entrepôts de données et les SIG
|