WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Intégration de sources de données hétérogènes dans les entrepôts de données


par Sara Djebrit
Université de Ghardaia - Master Systèmes Intelligents pour l’Extraction de Connaissances 2019
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

CHAPITRE 3. CONSTRUCTION D'UN SYSTÈME D'INTÉGRATION DE DONNÉES

Implémentation d'Algorithme de Wrinkler-Jarro

L'algorithme de Wrinkler-Jarro c'est l'un des plus algorithmes meilleurs de rapprochement, elle s'agit de mesurer la similarité entre deux séquences sur lesquelles, elle pose des pourcentages supérieurs s'ils sont les mêmes sens, nous implémentons cet algorithme dans les comparaisons entre les attributs de sources de données différents en prise en compte tous les types de conflits.

Algorithm 4 Algorithme de Wrinkler-Jarro

S1 : chainesdecaracteres.

S2 : chainesdecaracteres.

C1 : chainedecaracteres;

C2 : chainedecaracteres; intt ? 0;

C1 ? caracterecomunes(S1, S2)

C2 ? caracterecomunes(S2, S1) N ? lalongueurdeC1

for i ? 0 N do

if C1[i] =6 C2[i] then t ? t + 0.5

C1 · longueur() - t

N

réelR ? +
S1 · longueur

C2 · longueur() + S2 · longueur

C2 · longueur

3

Implémentation d'Algorithme de LCS(Longuest Common Subsequences)

Nous utilisons l'algorithme de LCS pour plus précise les opérations de comparaison sur lesquelles en assurent les comparaisons entre les attributs caractère par caractère en prise en compte tous les cas posés sur les attributs n'en objectivent que :

Algorithm 5 Algorithme de LCS(Longuest Common Subsequences)

S1 : chainesdecaracteres.

S2 : chainesdecaracteres. N : LalongueurdeS1. M : lalongueurdeS2

function LCS(<S1, S2,N,M >) :chaine de caracteres

if N > 0etM > 0 et S1[N] == S2[M] then retourner LCS(S1[N - 1], S2[M - 1],N-1,M-1 )

else if N > 0etM > 0 et S1[N] =6 S2[M] thenMax((N,M-1),(N-1,M) retourner null

39

40

CHAPITRE 3. CONSTRUCTION D'UN SYSTÈME D'INTÉGRATION DE DONNÉES

Implémentation des dictionnaires de données

La création du dictionnaire de données permet de prendre les attributs de chaque wrapper depuis les quatre (Xwrapper, Hwrapper, Jwrapper, Swrapper) comme des termes référencés par ses synonymes extraits de Word net. Nous implémentons une fonction qui prend les attributs de données pour chaque wrapper et d'importer que trois synonymes parmi Word Net, enfin nous collections tous les attributs de quatre wrappers avec ses synonymes dans un seul dictionnaire.

Algorithm 6 Construction d'un dictionnaire de données

wrappers = Xwrapper, Jwrapper, Hwrapper, Swrapper word +- impoterlefichiercompléWordNet

HashMap < String, ArrayList < String>> dictionnaire w +- 0

while wrapper[w]< le nombre de wrappers do w +- w + 1

for i +- 0 le nombre de attributs de chaque wrapper do

for j +- 0 le nombre de word do

if wrapper[w] · attributi==word then dictionnaire ·put <wrapper[w]·attributi,word >

Implémentation d'Algorithme de médiateur

Notre algorithme proposé mit tous les avantages de ces précidentes algorithmes, telque nous essayons de combiner les parts des algorithmes qui vérifie ces avantages dans notre algorithme. nous importons aussi les exécutions des algorithmes :

-- Algorithme de Wrinkler-Jarro : pour donner la mesure de similaritée entre deux attributs; -- Algorithme de LCS : pour obtenir la plus longue sous-séquence entre deux attributs sur

lesquels nous posons la chaîne caractères résulte comme un attribut Global qui fusionne les

valeurs de ces deux attributs comparés;

-- Le dictionnaire de données résulte parmi l'algorithme de construction d'un dictionnaire de donnée.

41

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Les esprits médiocres condamnent d'ordinaire tout ce qui passe leur portée"   François de la Rochefoucauld