4.4 Résultats des regroupements et
validation
sémantique
4.4.1 Agrégation par regroupement en cliques sur
réseau AOL-17/04/2006 et validation manuelle
Matériel et conditions de test
Pour cette validation nous avons travaillé sur
l'échantillon AOL-17/04/2006
Résultats
L'algorithme a créé 108446 cliques
de 3 à 9 mots-clés, avec en
moyenne 3.75 mots-clés par clique. 18600
mots-clés ne sont dans aucune clique.
En choisissant un système de regroupement favorisant
fortement la cohérence du groupe, nous avons créé des
groupes possédant une faible distance entre eux. Cette faible distance
des agrégats a pour conséquence un grand nombre d'agrégats
par rapport au nombre de mots-clés (3,2 cliques par mot-clé
agrégé) et un nombre de mots-clés présents dans de
très nombreuses cliques (plus de 50 mots-clés appartiennent
à plus de 1000 cliques). Un système de regroupement créant
plus de groupes qu'il n'existe d'objets individuels n'était pas ce que
nous recherchions.
south
jobs
hospital
park
florida
beach
commun
auty
Island
north
Figure 4.11. Clique à neuf
éléments.
|