2.3.4.2 Navigation géo-spatiale
Il s'agit d'étiqueter des collections de documents
textuels qui se trouvent soit dans le web ou dans les bibliothèques
numériques avec les toponymes qu'ils renferment, puis, les afficher sur
une carte géographique pour permettre une navigation avec une dimension
géo-spatiale. Cela facilite le parcours des documents qui mentionnent le
même emplacement géographique.
Par exemples, si un article de presse contient le toponyme
Mila. Il sera estampé dans la carte dans Mila, mais cela après la
désambiguïsation des toponymes qui décide s'il s'agit de
Mila>Algérie ou
Mila>Northumberland>Virginie>États-Unis.
Exemples réels
1. La Figure 2-5, (voir Page 34) montre le site Google
Maps6 qui fourni une navigation géo-spatiale dans les
articles de Wikipedia7.
2. Le site AuthorMapper8 permet une navigation
géo-spatiale dans la bibliothèque numérique de
Springer9 selon les lieux des universités des auteurs (voir
Figure 2-4).
6
http://maps.google.com
7
http://www.wikipedia.org
8
http://www.authormapper.com
9
http://www.springer.com
Figure 2-5. Naviguer dans les articles de Wikipedia
à travers Google Maps
Figure 2-4. AuthorMapper: navigation géo-spatiale
dans la bibliothèque Springer
41
2.3.4.3 Analyse visuelle des évènements
Figure 2-6. Biocaster: suivie des éclosions des
maladies dans le monde
Il s'agit de projeter les évènements extraits du
texte dans une carte selon l'endroit où se sont passés. Cela
permet une analyse rapide des évènements rapportés dans un
grand ensemble de documents textuels. Ça aide par exemple à
détecter les évènements identiques, les suivre
(c'est-à-dire ce qui s'est passé ensuite dans le même
endroit), et les regrouper.
Exemples réels
1. Biocaster10 (voir Figure 2-6 ) est un
système de surveillance mondiale de la santé qui sert à
détecter et à suivre les éclosions de maladies
infectieuses à partir d'une analyse continue des documents
signalés dans plus de 1700 flux RSS. Le système visualise les
évènements de maladies dans Google Maps après leur
géo-localisation (Collier, et al. 2008).
10
http://biocaster.nii.ac.jp
Figure 2-7. La page du service MedISys : Système
d'analyse des informations médicales
2. Le site de EMM11 (Europ Media Monitor) fournit un
ensemble de services d'analyse des évènements écrits en
plusieurs langues par leur visualisation sur
la carte ou en utilisant des graphes de statistique. La Figure
2-7 représente la page MedISys : le service d'analyse des informations
médicales.
2.4 Domaines en relation avec la
désambiguïsation des toponymes
La désambiguïsation des toponymes est un domaine
qui relie l'espace et le texte (Leidner 2007). Conséquemment, ses
techniques sont issues principalement de deux disciplines qui sont le
traitement automatiques des langues naturelles (TALN) qui s'occupe du
traitement des données textuelles et les systèmes d'informations
géographiques (SIG) qui s'occupent du traitement des données
spatiales (voir Figure 2-8). Par ailleurs, la désambiguïsation des
toponymes une tâche importante dans plusieurs domaines à savoir la
recherche d'information géographique et l'extraction d'information.
11
http://emm-labs.jrc.it
Traitement automatique des langues naturelles
DSM
DT
Systèmes d'informations géographiques
Géocodage
Figure 2-8. Position de la DT par rapport à
d'autres domaines
Dans cette section, nous faisons un tour d'horizon sur les
domaines en relation avec la désambiguïsation de toponymes.
|