1.6.3 Des exemples de travaux sur l'utilisation du texte
comme une source de données géographiques
Dans cette section nous présentons quelques travaux
dans la littérature dont les données géographiques sont
extraites du texte en langue naturelle puis utilisées dans des
applications différentes.
1.6.3.1 Extraction des descriptions des villes pour la
mise à jour d'un SIG urbain
Borges, Laender, Medeiros, Silva, et Davis (2003) ont
utilisé le Web comme une source importante d'informations
géographiques urbaines. Ils ont proposé un environnement qui
permet d'extraire des données géographiques à partir des
pages Web (comme les noms des villes, des rues, des boulevards, et autres), les
convertir au format XML, puis les utiliser pour mettre à jour une base
de données géographique d'un SIG urbain.
1.6.3.2 Data mining spatial sur des données
géographiques extraites des pages web
Dans (Morimoto, et al. 2003) les auteurs ont
présenté un système d'extraction de connaissances
spatiales à partir des collections de pages web contenant des
informations géographiques comme les adresses et les codes postaux. Pour
chaque information géographique, ils ont appliqué des techniques
du géocodage (voir le chapitre suivant pour plus d'informations
sur le géocodage) pour calculer ses coordonnées
géographiques. Ensuite, ils ont extrait les concepts-clés des
pages web, puis formé une table d'associations géographiques dont
chaque tuple contient les concepts-clé d'une page web et les
coordonnées géographiques des lieux qu'elle renferme. Finalement
des techniques du data mining spatial sont appliquées pour trouver des
patterns spatiaux par exemples les collocations spatiales.
1.6.3.3 L'extraction et la visualisation des
événements
Li, Srihari, Niu, et Li (2003) ont construit un
entrepôt dynamique de connaissances à partir des documents
textuelles (articles d'actualités et guide de touristes). Le but de la
construction de cet entrepôt est de supporter plusieurs applications
comme le data mining, et la visualisation et l'analyse des
évènements. Parmi les informations contenues dans cet
entrepôt des profiles des personnes et des descriptions des
évènements. Ces derniers sont des informations
géographiques du fait qu'elles sont composées d'une donnée
spatiale qui est le lieu de naissance dans les profiles de personnes et le lieu
d'occurrence dans les évènements.
1.6.3.4 Base de données géographique pour la
conscience de la situation
L'extraction des évènements7 à
partir des documents textuelles à été utilisé
aussi pour crées une base de données géographiques pour
la conscience de situation8 (Kalashnikov, Ma, et al. 2006,
Kalashnikov, Ma, et al. 2006). La base de donnée est
7 Les évènements sont des informations
géographiques.
construite pour être analysée probablement par le
data mining, ou tout simplement pour l'interrogation9.
Le Tableau 1-2 résume les travaux présentés
ci-dessus.
Tableau 1-2. Quelques travaux qui utilisent les
documents textuels comme une source d'informations
géographiques
Buts d'extraction des
Sources textuelles informations
géographiques
(Borges, et al.
2003) Page web
|
Mise à jour une base de données
géographique d'un SIG urbain
|
|
(Morimoto, et al.
2003) Page web Data mining spatial
Génération des profiles de personnes
(Li, et al. 2003) Articles d'actualités
et guide de touristes Visualisation et analyse des
évènements
Text mining
(Kalashnikov, Ma, et al. 2006)
|
Les registres de communications transcrites et les rapports
déposés par les premiers intervenants après la catastrophe
du 9/11.
Articles de journaux et rapports de blog portant sur le tsunami
de l'Asie.
|
Construire une BD des évènements pour la
conscience de situation
|
|
|