CHAPITRE 3. CONSTRUCTION D'UN SYSTÈME
D'INTÉGRATION DE DONNÉES
Implémentation d'Algorithme de
Wrinkler-Jarro
L'algorithme de Wrinkler-Jarro c'est l'un des plus algorithmes
meilleurs de rapprochement, elle s'agit de mesurer la similarité entre
deux séquences sur lesquelles, elle pose des pourcentages
supérieurs s'ils sont les mêmes sens, nous implémentons cet
algorithme dans les comparaisons entre les attributs de sources de
données différents en prise en compte tous les types de
conflits.
Algorithm 4 Algorithme de Wrinkler-Jarro
S1 : chainesdecaracteres.
S2 : chainesdecaracteres.
C1 : chainedecaracteres;
C2 : chainedecaracteres; intt ? 0;
C1 ? caracterecomunes(S1, S2)
C2 ? caracterecomunes(S2, S1) N
? lalongueurdeC1
for i ? 0 N
do
if C1[i] =6
C2[i] then t ? t +
0.5
C1 · longueur() - t
N
réelR ? + S1 ·
longueur
|
C2 · longueur() + S2
· longueur
|
C2 · longueur
|
3
|
Implémentation d'Algorithme de LCS(Longuest Common
Subsequences)
Nous utilisons l'algorithme de LCS pour plus précise
les opérations de comparaison sur lesquelles en assurent les
comparaisons entre les attributs caractère par caractère en prise
en compte tous les cas posés sur les attributs n'en objectivent que :
Algorithm 5 Algorithme de LCS(Longuest Common
Subsequences)
S1 : chainesdecaracteres.
S2 : chainesdecaracteres. N :
LalongueurdeS1. M : lalongueurdeS2
function LCS(<S1, S2,N,M >)
:chaine de caracteres
if N > 0etM > 0 et
S1[N] == S2[M] then
retourner LCS(S1[N - 1], S2[M -
1],N-1,M-1 )
else if N > 0etM > 0 et
S1[N] =6 S2[M]
thenMax((N,M-1),(N-1,M) retourner null
39
40
CHAPITRE 3. CONSTRUCTION D'UN SYSTÈME
D'INTÉGRATION DE DONNÉES
Implémentation des dictionnaires de
données
La création du dictionnaire de données permet de
prendre les attributs de chaque wrapper depuis les quatre (Xwrapper, Hwrapper,
Jwrapper, Swrapper) comme des termes référencés par ses
synonymes extraits de Word net. Nous implémentons une fonction qui prend
les attributs de données pour chaque wrapper et d'importer que trois
synonymes parmi Word Net, enfin nous collections tous les attributs de
quatre wrappers avec ses synonymes dans un seul dictionnaire.
Algorithm 6 Construction d'un dictionnaire de données
wrappers = Xwrapper, Jwrapper, Hwrapper, Swrapper
word +- impoterlefichiercompléWordNet
HashMap < String, ArrayList < String>>
dictionnaire w +- 0
while wrapper[w]< le nombre de wrappers do w
+- w + 1
for i +- 0 le nombre de attributs de chaque wrapper
do
for j +- 0 le nombre de word do
if wrapper[w] · attributi==word
then dictionnaire ·put
<wrapper[w]·attributi,word >
Implémentation d'Algorithme de
médiateur
Notre algorithme proposé mit tous les avantages de ces
précidentes algorithmes, telque nous essayons de combiner les parts des
algorithmes qui vérifie ces avantages dans notre algorithme. nous
importons aussi les exécutions des algorithmes :
-- Algorithme de Wrinkler-Jarro : pour donner la mesure de
similaritée entre deux attributs; -- Algorithme de LCS : pour obtenir la
plus longue sous-séquence entre deux attributs sur
lesquels nous posons la chaîne caractères
résulte comme un attribut Global qui fusionne les
valeurs de ces deux attributs comparés;
-- Le dictionnaire de données résulte parmi
l'algorithme de construction d'un dictionnaire de donnée.
41
|