III.3.
ARCHITECTURE D'UN ENTREPOT DE DONNEES
L'architecture des entrepôts de données
repose souvent sur un SGBD séparé du système de production
de l'entreprise qui contient les données de l'entrepôt.
Le processus d'extraction des données permet
d'alimenter périodiquement ce SGBD. Néanmoins avant
d'exécuter ce processus, une phase de transformation est
appliquée aux données opérationnelles.
Celle-ci consiste à les préparer (mise en
correspondance des formats de données), les nettoyer, les filtrer,...,
pour finalement aboutir à leur stockage dans l'entrepôt.
Dans cette figure III.1, nous présentons une
architecture simplifiée d'un entrepôt selon Doucet et Gangarski.
Les différents composants ont été intègres dans
trois parties : les sources de données, l'entrepôt et les outils
existants dans le marché.
Données anciennes
Archivées
O
U
T
I
L
S
Entrepôt de données
Métadonnées
Données fortement résumées
Données légèrement
résumées
Données de détail
Données externes
Données de production
(SGBD ,ODS,système légués)
E
T
L
0
Figure III.1 Architecture
d'un entrepôt de données
a) Les sources : les
données de l'entrepôt sont extraites de diverses sources souvent
reparties et hétérogènes, et qui doivent être
transformées avant leur stockage dans l'entrepôt.
Nous avons deux types de sources des donnes : internes et
externes à l'organisation :
· Internes : la plupart des
données sont saisies à partir des différents
systèmes de production qui rassemblent les divers SGBD
opérationnels, ainsi que des anciens systèmes de production qui
contiennent des données encore exploitées par
l'entreprise.
· Externes : ils
représentent des données externes à l'entreprise et qui
sont souvent achetées.
Magasin des données opérationnel (ODS
operational data store) : c'est un mini annuaire des données
opérationnelles actualisées et intégrées aux
analyses pour un département spécifique au sein de
l'entreprise.
b) Les types de données de
l'entrepôt de données : il existe plusieurs types de
données dans un entrepôt, qui correspondent à diverses
utilisations, comme :
· Données de détail
courantes : ce sont l'ensemble des données
quotidiennes et plus couramment utilisées. Ces données sont
généralement stockées sur le disque pour avoir un
accès rapide. Par exemple, le détail des ventes de l'année
en cours, dans les différents magasins.
· Données de détail
anciennes : ce sont des données quotidiennes
concernant des événements passés, comme par exemple le
détail des ventes des deux dernières années. Nous les
utilisons pour arriver à l'analyse des tendances ou des requêtes
prévisionnelles. Néanmoins ces données sont plus rarement
utilisées que les précédentes, et elles sont souvent
stockes sur des mémoires d'archives.
· Donnes résumées ou
agrégées : ce sont des données moins
détaillées que les deux premières et elles permettent de
réduire le volume des données à stocker. Le type de
données, en fonction de leur niveau de détail, permet de les
classifier commandes données légèrement ou fortement
résumées.
· Les métadonnées
: ce sont des données essentielles pour parvenir
à une exploitation efficace du contenu d'un entrepôt. Elles
représentent des informations nécessaires à l'accès
et l'exploitation des données dans l'entrepôt comme : la
sémantique (leur signification), l'origine (leur provenance), les
règles d'agrégation (leur périmètre), le stockage
(leur format, par exemple : francs, euro,...) et finalement l'utilisation (par
quels programmes sont-elles utilisées).
· Données archives et
sauvegarder : cette partie de l'entrepôt
emmagasine les données détaillées résumées
pour le besoins d'archivage et de sauvegarde. Les données sont
transférées dans des stockages d'archivage tel que des bandes
magnétiques ou disques optiques.
c) Outils : il existe sur le
marché différents outils pour l'aide à la décision,
comme les outils de fouille de données ou datamining (pour
découvrir des liens sémantiques), outils d'analyse en ligne (pour
la synthèse et l'analyse des données multidimensionnelles),
outils d'interrogation (pour faciliter l'accès aux données en
fournissant une interface conviviale au langage de requêtes).
|