CHAPITRE 3. CONSTRUCTION D'UN SYSTÈME
D'INTÉGRATION DE DONNÉES
Implémentation d'Algorithme de
Wrinkler-Jarro 
L'algorithme de Wrinkler-Jarro c'est l'un des plus algorithmes
meilleurs de rapprochement, elle s'agit de mesurer la similarité entre
deux séquences sur lesquelles, elle pose des pourcentages
supérieurs s'ils sont les mêmes sens, nous implémentons cet
algorithme dans les comparaisons entre les attributs de sources de
données différents en prise en compte tous les types de
conflits. 
Algorithm 4 Algorithme de Wrinkler-Jarro 
S1 : chainesdecaracteres. 
S2 : chainesdecaracteres. 
C1 : chainedecaracteres; 
C2 : chainedecaracteres; intt ? 0; 
C1 ? caracterecomunes(S1, S2) 
C2 ? caracterecomunes(S2, S1) N
? lalongueurdeC1 
for i ? 0 N
do 
if C1[i] =6
C2[i] then t ? t +
0.5 
C1 · longueur() - t 
 
| 
 N 
réelR ?  + S1 ·
longueur 
 | 
 C2 · longueur() + S2
· longueur 
 | 
 C2 · longueur 
 | 
 
| 
 3 
 | 
 
  
Implémentation d'Algorithme de LCS(Longuest Common
Subsequences) 
Nous utilisons l'algorithme de LCS pour plus précise
les opérations de comparaison sur lesquelles en assurent les
comparaisons entre les attributs caractère par caractère en prise
en compte tous les cas posés sur les attributs n'en objectivent que : 
Algorithm 5 Algorithme de LCS(Longuest Common
Subsequences) 
S1 : chainesdecaracteres. 
S2 : chainesdecaracteres. N :
LalongueurdeS1. M : lalongueurdeS2 
function LCS(<S1, S2,N,M >)
:chaine de caracteres 
if N > 0etM > 0 et
S1[N] == S2[M] then
retourner LCS(S1[N - 1], S2[M -
1],N-1,M-1 ) 
else if N > 0etM > 0 et
S1[N] =6 S2[M]
thenMax((N,M-1),(N-1,M) retourner null 
39 
40 
CHAPITRE 3. CONSTRUCTION D'UN SYSTÈME
D'INTÉGRATION DE DONNÉES
Implémentation des dictionnaires de
données 
La création du dictionnaire de données permet de
prendre les attributs de chaque wrapper depuis les quatre (Xwrapper, Hwrapper,
Jwrapper, Swrapper) comme des termes référencés par ses
synonymes extraits de Word net. Nous implémentons une fonction qui prend
les attributs de données pour chaque wrapper et d'importer que trois
synonymes parmi Word Net, enfin nous collections tous les attributs de
quatre wrappers avec ses synonymes dans un seul dictionnaire. 
Algorithm 6 Construction d'un dictionnaire de données 
wrappers = Xwrapper, Jwrapper, Hwrapper, Swrapper
word +- impoterlefichiercompléWordNet 
HashMap < String, ArrayList < String>>
dictionnaire w +- 0 
while wrapper[w]< le nombre de wrappers do w
+- w + 1 
for i +- 0 le nombre de attributs de chaque wrapper
do 
for j +- 0 le nombre de word do 
if wrapper[w] · attributi==word
then dictionnaire ·put
<wrapper[w]·attributi,word > 
Implémentation d'Algorithme de
médiateur 
Notre algorithme proposé mit tous les avantages de ces
précidentes algorithmes, telque nous essayons de combiner les parts des
algorithmes qui vérifie ces avantages dans notre algorithme. nous
importons aussi les exécutions des algorithmes : 
-- Algorithme de Wrinkler-Jarro : pour donner la mesure de
similaritée entre deux attributs; -- Algorithme de LCS : pour obtenir la
plus longue sous-séquence entre deux attributs sur 
lesquels nous posons la chaîne caractères
résulte comme un attribut Global qui fusionne les 
valeurs de ces deux attributs comparés; 
-- Le dictionnaire de données résulte parmi
l'algorithme de construction d'un dictionnaire de donnée. 
41 
 |