3.4.2.3 Heuristiques complémentaires
Les heuristiques de cette classe ne conduisent pas toutes
seules à la désambiguïsation des toponymes mais plutôt
elles sont utilisées comme des procédures complémentaires
dans les méthodes de désambiguïsation.
H18 Un référent par discours
Il s'agit de supposer que tous les toponymes identiques
partagent le même référent, c'est-à-dire propager le
sens des toponymes résolus à ceux qui ont la même forme
dans le document. Cette heuristique a des origines dans le domaine de la
désambiguïsation des sens des mots (Gale, Church et Yarowsky
1992).
Cette heuristique est utilisée par (Leidner, Sinclair
et Webber 2003), (Li, Srihari, et al. 2003), (Amitay, et al. 2004), (Schilder,
Versley et Habel 2004), (Pouliquen, et al. 2004), (Hauptmann and Olligschlaeger
1999).
H19 Attribuer les référents aux toponymes
non ambigus
Un toponyme est dit non ambigu s'il a exactement un seul
référent comme candidat. L'affectation des
référents aux toponymes non ambigus est une étape triviale
utilisée par tous les systèmes de désambiguïsation
des toponymes, et habituellement invoquée en premier lieu avant le
traitement des toponymes ambigus.
La Figure 3-6 résume les différentes
heuristiques de l'état de l'art de désambiguïsation des
toponymes. Et le Tableau 3-3 distribue ces heuristiques selon leurs
références.
H6 Contexte géographique unifié
H7 Le chemin le plus court entre les
référents
H9 La densité conceptuelle
H3.2 Les patterns de type
H3 L'appariement des patterns
Désambiguïsation par le contexte
H2 Chevauchement entre les chemins hiérarchiques
des
H3.1 Les patterns de relation hiérarchique
Heuristiques de désambiguïsation des toponymes
H5 Espace géométrique (polygone /
distance) minimaliste
H18 Un référent par discours
H4 Modèle de cooccurrence
H1 Distance aux voisins textuels non ambigus
H8 Les noeuds de l'arbre couvrant maximum
Autres heuristiques
H16 Supprimer les petites places
H19 Attribuer les référents aux toponymes
non ambigus
H11 Le référent de
niveau supérieur
H13 Préférer un type
Désambiguïsation par les règles de
préférences
H14 Ordre de préférence des ressources
H17 Concentration sur une zone géographique
H12 Le référent le plus connu
H15 Le sens le plus fréquent dans un corpus
H10 La plus grande population
Figure 3-6. Classification des heuristiques de
désambiguïsation des toponymes
État de l'art
Tableau 3-3. Distribution des heuristiques de
désambiguïsation des toponymes utilisées dans la
littérature17
Désambiguïsation par le contexte
Désambiguïsation par les règles de
préférences
H1
|
H2 H3.1 H3.2 H4
|
H5 H6
|
H7
|
H8
|
H9
|
(Hauptmann and Olligschlaeger 1999) (Smith and Crane 2001)
(Leidner, Sinclair et Webber 2003)
|
|
|
|
|
|
|
|
|
(Li, Srihari, et al. 2003)
|
|
|
|
|
|
|
|
|
(Rauch, Bukatin and Baker 2003)
|
|
|
|
|
|
|
|
|
(Smith et Mann 2003)
|
|
|
|
|
|
|
|
|
(Amitay, et al. 2004)
|
|
|
|
|
|
|
|
|
(Pouliquen, et al. 2004)
|
|
|
|
|
|
|
|
|
(Schilder, Versley et Habel 2004)
|
|
|
|
|
|
|
|
|
(Clough 2005)
|
|
|
|
|
|
|
|
|
(Li, et al. 2006)
|
|
|
|
|
|
|
|
|
(Overell et Rüger 2007)
|
|
|
|
|
|
|
|
|
(Buscaldi et Rosso 2008a)
|
|
|
|
|
|
|
|
|
(Stokes, et al. 2008)
|
|
|
|
|
|
|
|
|
H10 H11 H12 H13 H14 H15 H16 H17 H18
|