CHAPITRE 1. INTÉGRATION DE DONNÉES
1.3 Hétérogénéité des
données
nous parlons cela sur le problèmeème complexe
dans les pluparts des systèmes d'intégration, telque les
différences de ces systèmes basent sur les différents
étapes ou les différentes vues ou les différentes
manières qui ont été conçu par ce
problèmeème, donc il faut éétudier les
façons d'hétérogénéité des
données qui effectuer lors de l'intégration. les deux grands
types d'hétérogénéité :
1. Hétérogénéité
Sémantique:
c'est-à-dire on exprime le même concept mais
avec des significations différentes[6], on peut définir deux
types des hétérogénéités
sémantiques;
-- hétérogénéité
sémantique lié au schéma c'est de donner même terme
par des terminologies différentes;
-- hétérogénéité
sémantique lié aux données c'est le cas de données
qui ayant des différentes origines, des différents contenants; et
différentes structures et utilisent des conventions
différentes.[7]
2. Hétérogénéité
structurelle:
on l'appelle aussi
hétérogénéité des schémas,
c'est-à-dire il existe des mêmes concepts avec de
différentes présentations, où en utilisant des
modèles différents pour décrire les mêmes
données ou d'une manière inverse.
Il existe quatre types principaux
d'hétérogénéité sémantiques(conflits
sémantiques ) [2] :
-- Conflits de représentation : c'est le cas d'utiliser
des différentes schémas ou des différentes
propriétés pour décrire le même concept,
-- Conflits de noms (termes) : Ces conflits se trouvent dans
le cas où on utilise soit des noms différents pour le même
concept ou propriété (synonyme), soit des noms identiques pour
des concepts (et des propriétés) différents (homonyme),
-- Conflits de contextes : dans ce cas on donne des
différentes représentations d'un seul objet
dans les sources de données tel que chaque source ayant
un contexte local pour ce objet, -- Conflits de mesure de valeur : on trouve
dans ce cas l'utilisation des unités différentes pour
mesurer les valeurs des mêmes concepts.
1.4 Entrepôt de données
un entrepôt de données a été
défini comme une méthode de stockage de données
intégrées pour être utilisées dans les
systèmes, en offrant des méthodes d'analyse comme OLAP(On-Line
Analytical processing), un cube OLAP contient des données servant
à faire des analyses de données provenant de différentes
sources hétérogènes et distribuées. Cette analyse
est effectuée en organisant les données de manière
multidimensionnelles .[8],[9]
L'entrepôt de données a été
réalisé par passer des étapes qui correspondent au
processus ETL (Extract,Transform and Load)[10], c'est a dire :
6
|