2.3 Techniques de prédiction des liens
Dans un réseau social, il existe deux façons
pour prédire l'évolution des liens [Wp15] : les approches non
superviséet les approches basées sur l'apprentissage
supervisé. Les approches non supervisécalculent une valeur de
similarité,c'est un score attribuéà chaque paire de noeuds
non connectés (x, y), un score élevéindique une grande
probabilitéque x et y seront liés dans le futur et vice versa,
après une liste des scores ordonnées est construite et les liens
qui ont des grandes valeurs de similaritésont les plus susceptibles
d'être liée.
Les approches basées sur l'apprentissage
supervisétraitent ce problème comme un
Chapitre 2. État de l'art 19
problème de classification binaire, par
conséquent, nombreux modèles d'appren-tissage et de
probabilitépeuvent être utilisépour résoudre ce
problème.
2.3.1 Les approches non supervisé
Ils existent beaucoup de méthodes de prédiction
des liens non supervisés, simples et basiques, utilisent l'information
de noeuds, la topologie et la théorie social pour
calculer la similaritéentre les paires de noeuds non
connectés, les méthodes basésur l'apprentissage
supervisésont les plus complexe, mais ils ont composépar des
mesures de cette classe, nous allons présentéune vue
systématique des ces mesures.
2.3.1.1 Mesures basées sur le contenu d'un
noeud
Le calcul de la similaritéentre les pairs de noeuds est
une solution intuitive dans la tâche de la prédiction des liens.
Il est basésur une idée simple : les paires les plus similaires
sont des noeuds ayant une grande vraisemblance et donc se sont les plus
susceptibles d'être reliéet vice versa.
Cette hypothèse conforme au concept que les personnes
tendent à créer des relations avec d'autres personnes qui sont
similaires dans l'éducation, religions, les intérêts et
localisation... ces caractéristiques peuvent être mesurées
par une si-milaritéattribuée à chaque pair de noeuds, une
grande valeur de similaritéentre deux noeuds indique qu'ils ont une
grande probabilitéd'être liée dans le futur.
Dans les réseaux sociaux réels, un noeud est
généralement à un ou plusieurs attributs qui le
caractérisent comme les profiles des utilisateurs dans les
réseaux sociaux, nom d'un email dans les réseaux des emails, des
publications dans les réseaux sociaux académiques, ces
informations peuvent être exploitées directement pour calculer la
similaritéentre les pairs de noeuds. Dans la plus part des cas, les
valeurs de ces attributs ayant une forme textuelle ce qu'il facilite le calcul
de la similarité.
Bhattacharyya et Garg [BP11] ont remarquépar exemple
qu'une personne dans
un réseau social aime le football et une autre aime le
soccer ou bien sport, malgréqu'ils n'ont aucune relation directe ils ont
une similaritépar ce qu'ils aiment le
même contexte c'est le sport, en se basant sur cette
idée, ils ont construit plusieurs modèles d'arbres de
catégorisation pour étudier les mots-clés de profile des
utilisateurs puis, ils ont définit des distances entre les mots
clés pour déterminer la similaritéentre les pairs
d'utilisateurs. Leur observation la plus importante est que, sauf pour les amis
directs, la similaritéentre les utilisateurs sont approximativement la
même, quelles que soient les paramètres topologiques de
réseau. Ils
Chapitre 2. État de l'art 20
montrent également que l'augmentation du nombre d'amis
et les mots clés diminue la similaritéentre une personne et leurs
amis...
Anderson et Huttenlocher [And12] Utilisent principalement les
intérêts des utilisateurs comme une mesure de similarité,
ces intérêts sont présentés par des
activités, par exemple éditer un article dans WIKIPEDIA, poser
une question dans StackOverflow, commenter un statu dans Facebook,
évaluer des produits d'un site e-commerce, évaluéune
application dans le PlayStore... tous ces actions sont présentées
dans un vecteur de poids en calculant les nombres d'interactions par rapport
aux interactions avec d'autres groupes, personnes etc. une grande valeur
indique que cette personne favorise par exemple des status d'une telle page,
produits, d'autres utilisateurs. . .
En conclusion, ils existent des dizaines de méthodes
qui utilisent comme référence les attributs et les
activités des utilisateurs dans les réseaux sociaux, ces
approches donnent des très bons résultats si nous pouvons
capturer le maximum de ceux-ci, ce qui nous permettre de connaitre de plus en
plus les comportements et les personnalités des internautes dans les
réseaux sociaux.
|