3.5 : Méthode 4 : Méthode d'enrichissement
d'agrégats par gravité 113
Chapitre 3. Les méthodes d'agrégations
proposées
TMA. Si tel n'est pas le cas (taille
inférieure), l'exécution de la boucle fine permet l'introduction
de noeuds rares ou très souvent utilisés dans l'agrégat,
sans dépasser la TMA, en respectant donc statistiquement la
cohérence sémantique des agrégats.
Une limite de la méthode
Une limite de la méthode est son incapacité
à ordonner les noeuds dans un agrégat ou encore à
pondérer l'appartenance des noeuds à un agrégat. Les
noeuds représentent l'espace sémantique d'un agrégat tout
en y étant rattachés. La complexité de ce lien rend
difficile toutes pondérations.
De plus, il existe plusieurs combinaisons graphiques qui ne
permettent pas à un noeud de rejoindre un agrégat. Sans chercher
à les citer toutes, disons simplement qu'une figure identifiable comme
un sous-graphe bi-connexe ou un k-clique ne peut pas par, définition,
intégrer un noeud seulement connecté à une diade (cf.
image 3.6).
Noeud connecté à un seul agrégat
mais par un lien unique
|
Noeuds connectés par un lien unique à
plusieurs agrégats
|
Noeuds connectés par un lien
unique mais retrouvant une proximité par
d'autres noeuds
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Figure 3.12 : Exemple de figures où des noeuds
proches d'agrégats ne sont pas intégrés car ne
répondant pas à la condition de rigidification.
Cette méthode consiste en une recherche de zone ayant
une forte cohérence sémantique. Elle peut être
éventuellement complétée par des post-traitements si l'on
souhaite que chaque mot puisse être rattaché à un ou
plusieurs agrégats. La méthode d'enrichissement d'agrégats
par gravité présentée dans le paragraphe 3.5 est un
exemple de méthode pouvant être utilisée dans ce but.
3.5 Méthode 4 : Méthode
d'enrichissement
d'agrégats par gravité
La méthode d'enrichissement d'agrégats par
gravité peut être incluse en tant que phase supplémentaire
d'une méthode plus générale. Elle permettrait à une
méthode «mono phase » de rejoindre alors la famille des
méthodes en plusieurs phases. Dans cette famille, la phase 3
3.5 : Méthode 4 : Méthode d'enrichissement
d'agrégats par gravité 114
Chapitre 3. Les méthodes d'agrégations
proposées
de l'algorithme RaRe\IS présenté au paragraphe
2.3.2 [Baumes&al-2005-1] est un exemple de méthode
d'enrichissement incluse dans une méthode plus générale.
Elle pourrait aussi être utilisée en tant que phase d'assemblage
dans les méthodes issues de HLS (cf. paragraphe 3.3.2)
Cependant, la méthode que nous avons
créée est une solution indépendante de toutes
méthodes et peut être implantée sur un graphe quelconque si
celui-ci contient des agrégats identifiés ou connus.
3.5.1 Les objectifs d'une méthode d'enrichissement
des agrégats.
L'enrichissement a pour but de créer une relation
pondérée ou non-pondérée entre un noeud et un ou
plusieurs agrégats.
Cependant avant de proposer une méthode
d'enrichissement posons-nous la question suivante : un mot peut-il être
plus ou moins proche d'un agrégat ?
Les linguistes définissent bien plusieurs zones
d'influences autour d'une thématique.
Le champ lexical est défini par Marc Farayet
[Fayaret-2011] comme « l'ensemble des mots qui, dans
un texte, se rapportent à une même réalité ou
à une même idée. Ces mots ont pour point commun
d'être synonymes, d'appartenir à la même famille, au
même domaine ou encore à renvoyer à la même notion.
».
Le réseau lexical est défini dans le même
ouvrage comme : « Le réseau [lexical] qui regroupe l'ensemble
des mots qui désignent des idées ou des réalités
qui renvoient à un même thème (=le champ lexical)
plus tous les mots qui à cause du contexte et de certains
aspects de leur signification (du fait des connotations) évoquent aussi
ce thème. ». Ainsi le réseau lexical incorpore un champ
lexical en l'enrichissant.
Nous trouvons dans le schéma proposé par Marc
Farayet deux espaces sémantiques où un réseau lexical
incorpore un champ lexical.
Figure 3.13 : Exemple d'espaces sémantiques
incorporés l'un dans l'autre « tel que » fourni par Marc
Farayet [Fayaret-2011].
|