CHAPITRE 3. CONSTRUCTION D'UN SYSTÈME
D'INTÉGRATION DE DONNÉES
Matrice de confusion
Dans ce contexte nous étudions la performance de
comparaison avec le dictionnaire de données dans les mêmes
étapes que l'analyse d'algorithme Wrinkler-Jaro, tel que nous utilisons
le langage R pour calculer la performance et la matrice de confusion tel que
nous avons les résultats suivants.
FIGURE 3.10 - Matrice de confusion des
comparaisons avec dictionnaire de données
3.4.2 Discussion
En général, notre algorithme ayant le but de fusion
les attribtuts simulées puis le regroupement de leurs valeurs, par
conséquent nous obtenons la complexité générale de
notre algorithme en basant sur les études précidentes.
Premier cas
C'est le cas que l'algorithme de fusion base totalement sur la
distance de Wrinkler-jaro pour obtient la similarité entre les attributs
dans ce cas nous considérons que la performance de notre algorithme
étudiée selon la performance d'algorithme Wrinkler-Jaro, on
obtient le résultat suivant :
51
|