CHAPITRE 3. CONSTRUCTION D'UN SYSTÈME
D'INTÉGRATION DE DONNÉES
1. les wrappers,
2. le médiateur.
Dans cette section nous intéressons à
étudier la performance d'algorithmes de fusion dans la structure
médiateur tel qu'elle valide le concept d'intégration.
3.4.1 Évaluation d'algorithme de fusion dans le
médiateur
C'est l'algorithme le plus important dans notre système
d'intégration celui qui contient plusieurs algorithmes qui influence au
fonctionnement de médiateur, nous étudions les évaluations
de deux algorithmes que nous posons dans cet algorithme
-- les techniques de rapprochement : nous avons l' algorithme
Wrinkler-Jarro .
-- Comparaison avec dictionnaire de données.
Les techniques de rapprochement
nous implémentons dans ce contexte l'algorithme
Wrinkler-Jarro dont nous analysons la performance d'algorithme Wrinkler-Jarro
que nous basons pour mesurer la similarité entre les données,
dans cette phase la performance de Wrinkler-Jarro est étudiée par
la table de contingence et les mesures d'efficacité.
pour afficher les mesures de similarité selon
Wrinkler-Jarro nous sélectionnons une comparaison entre deux attributs
de sources de données comme un exemple, la table suivante affiche les
valeurs.
Attribut
|
Zip
|
PayRate
|
CitizenDesc
|
Position
|
ManagerName
|
Sex
|
Department
|
89.0
|
93.0
|
85.0
|
88.0
|
87.0
|
89.0
|
DateFirstHired
|
85.0
|
87.0
|
85.0
|
84.0
|
83.0
|
87.0
|
FullName
|
89.0
|
89.0
|
85.0
|
86.0
|
89.0
|
91.0
|
AssignmentCategory
|
81.0
|
83.0
|
79.0
|
82.0
|
83.0
|
83.0
|
OvertimePay20l7
|
85.0
|
89.0
|
83.0
|
84.0
|
87.0
|
85.0
|
Division
|
91.0
|
85.0
|
87.0
|
92.0
|
83.0
|
91.0
|
Gender
|
91.0
|
89.0
|
91.0
|
88.0
|
91.0
|
93.0
|
GrossPayReceived20l7
|
79.0
|
83.0
|
77.0
|
78.0
|
77.0
|
81.0
|
EmployeePositionTitle
|
84.0
|
84.0
|
84.0
|
93.0
|
80.0
|
86.0
|
PositionUnderFilled
|
80.0
|
80.0
|
82.0
|
89.0
|
78.0
|
82.0
|
CurrentAnnualSalary
|
78.0
|
78.0
|
78.0
|
77.0
|
78.0
|
80.0
|
48
|