CHAPITRE 2. ETAT DE L'ART D'INTÉGRATION DE
DONNÉES
schéma global avec le modèle LAV(Local as View),
le premier travail concerne sur les techniques de grille informatiques comme le
rapprochement des champs d'un source avec des différentes sources
indépendamment, un autre travail étudie l'utilisation d'ontologie
dans l'intégration de données par la description des
scénarios contiennent des fonctions basées sur le traitement de
notion sémantique .Par ailleurs la manipulation des requêtes
propose l'architecture de VISS qui est composé par des proessus et
structures suivre l'opération d'interrogation en première
étape à donner les requêtes jusqu'aux répondre son
satisfaires.
2.2 Grille informatique :Rapprochement de
données
Grille informatique rassemble les sources des données
diverses, dispersées qui ayant le domaine administratif multiple pour
réaliser une commune fonction.
L'une des techniques plus valides dans l'intégration
des données hétérogènes c'est : la technique de
rapprochement qui cherche les similarités entre les sources de
données dans la phase sémantique, si on dispose qu'il y a aucune
information commune entre eux.[1]
2.2.1 Techniques de comparaison
La comparaison de deux bases différentes doit passes en
deux étapes :
1. une étape de comparaison de tous les champs communs
entre les deux bases,
2. une étape de compilation et d'analyse des
résultats de comparaisons pour la prise de décision sur le
rapprochement.
Méthodes empiriques
Cette méthode correspond de mesurer la similarité
entre deux champs.
la comparaison de deux valeurs entières s1 et
s2 est présentées par cette méthode : comparateur
champ par champ.
2.2.2 Méthodes évoluées de
comparaisons de chaînes de caractères
Dans cette partie on a des méthodes de comparaison
entre les chaînes de caractères, telque on distingue deux grandes
familles :
-- les algorithmes de mesure de similarité appelés
aussi « pattern matching », on utilise les deux algorithmes :LCS qui
donne la plus grande sous sequence commune de chaînes de
caractères,
17
|