WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Prédiction des liens dans les réseaux sociaux.

( Télécharger le fichier original )
par Oussama Rouane
Amar Telidgi - Laghouat - Master en systèmes dà¢â‚¬â„¢information et de décision 2015
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

2.3 Techniques de prédiction des liens

Dans un réseau social, il existe deux façons pour prédire l'évolution des liens [Wp15] : les approches non superviséet les approches basées sur l'apprentissage supervisé. Les approches non supervisécalculent une valeur de similarité,c'est un score attribuéà chaque paire de noeuds non connectés (x, y), un score élevéindique une grande probabilitéque x et y seront liés dans le futur et vice versa, après une liste des scores ordonnées est construite et les liens qui ont des grandes valeurs de similaritésont les plus susceptibles d'être liée.

Les approches basées sur l'apprentissage supervisétraitent ce problème comme un

Chapitre 2. État de l'art 19

problème de classification binaire, par conséquent, nombreux modèles d'appren-tissage et de probabilitépeuvent être utilisépour résoudre ce problème.

2.3.1 Les approches non supervisé

Ils existent beaucoup de méthodes de prédiction des liens non supervisés, simples et basiques, utilisent l'information de noeuds, la topologie et la théorie social pour

calculer la similaritéentre les paires de noeuds non connectés, les méthodes basésur l'apprentissage supervisésont les plus complexe, mais ils ont composépar des mesures de cette classe, nous allons présentéune vue systématique des ces mesures.

2.3.1.1 Mesures basées sur le contenu d'un noeud

Le calcul de la similaritéentre les pairs de noeuds est une solution intuitive dans la tâche de la prédiction des liens. Il est basésur une idée simple : les paires les plus similaires sont des noeuds ayant une grande vraisemblance et donc se sont les plus susceptibles d'être reliéet vice versa.

Cette hypothèse conforme au concept que les personnes tendent à créer des relations avec d'autres personnes qui sont similaires dans l'éducation, religions, les intérêts et localisation... ces caractéristiques peuvent être mesurées par une si-milaritéattribuée à chaque pair de noeuds, une grande valeur de similaritéentre deux noeuds indique qu'ils ont une grande probabilitéd'être liée dans le futur.

Dans les réseaux sociaux réels, un noeud est généralement à un ou plusieurs attributs qui le caractérisent comme les profiles des utilisateurs dans les réseaux sociaux, nom d'un email dans les réseaux des emails, des publications dans les réseaux sociaux académiques, ces informations peuvent être exploitées directement pour calculer la similaritéentre les pairs de noeuds. Dans la plus part des cas, les valeurs de ces attributs ayant une forme textuelle ce qu'il facilite le calcul de la similarité.

Bhattacharyya et Garg [BP11] ont remarquépar exemple qu'une personne dans

un réseau social aime le football et une autre aime le soccer ou bien sport, malgréqu'ils n'ont aucune relation directe ils ont une similaritépar ce qu'ils aiment le

même contexte c'est le sport, en se basant sur cette idée, ils ont construit plusieurs modèles d'arbres de catégorisation pour étudier les mots-clés de profile des utilisateurs puis, ils ont définit des distances entre les mots clés pour déterminer la similaritéentre les pairs d'utilisateurs. Leur observation la plus importante est que, sauf pour les amis directs, la similaritéentre les utilisateurs sont approximativement la même, quelles que soient les paramètres topologiques de réseau. Ils

Chapitre 2. État de l'art 20

montrent également que l'augmentation du nombre d'amis et les mots clés diminue la similaritéentre une personne et leurs amis...

Anderson et Huttenlocher [And12] Utilisent principalement les intérêts des utilisateurs comme une mesure de similarité, ces intérêts sont présentés par des activités, par exemple éditer un article dans WIKIPEDIA, poser une question dans StackOverflow, commenter un statu dans Facebook, évaluer des produits d'un site e-commerce, évaluéune application dans le PlayStore... tous ces actions sont présentées dans un vecteur de poids en calculant les nombres d'interactions par rapport aux interactions avec d'autres groupes, personnes etc. une grande valeur indique que cette personne favorise par exemple des status d'une telle page, produits, d'autres utilisateurs. . .

En conclusion, ils existent des dizaines de méthodes qui utilisent comme référence les attributs et les activités des utilisateurs dans les réseaux sociaux, ces approches donnent des très bons résultats si nous pouvons capturer le maximum de ceux-ci, ce qui nous permettre de connaitre de plus en plus les comportements et les personnalités des internautes dans les réseaux sociaux.

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"En amour, en art, en politique, il faut nous arranger pour que notre légèreté pèse lourd dans la balance."   Sacha Guitry