WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

La désambiguà¯sation des toponymes

( Télécharger le fichier original )
par Imene BENSALEM
Université Mentouri de Constantine, Algérie - magistère en informatique 2009
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

1.6.3 Des exemples de travaux sur l'utilisation du texte comme une source de données géographiques

Dans cette section nous présentons quelques travaux dans la littérature dont les données géographiques sont extraites du texte en langue naturelle puis utilisées dans des applications différentes.

1.6.3.1 Extraction des descriptions des villes pour la mise à jour d'un SIG urbain

Borges, Laender, Medeiros, Silva, et Davis (2003) ont utilisé le Web comme une source importante d'informations géographiques urbaines. Ils ont proposé un environnement qui permet d'extraire des données géographiques à partir des pages Web (comme les noms des villes, des rues, des boulevards, et autres), les convertir au format XML, puis les utiliser pour mettre à jour une base de données géographique d'un SIG urbain.

1.6.3.2 Data mining spatial sur des données géographiques extraites des pages web

Dans (Morimoto, et al. 2003) les auteurs ont présenté un système d'extraction de connaissances spatiales à partir des collections de pages web contenant des informations géographiques comme les adresses et les codes postaux. Pour chaque information géographique, ils ont appliqué des techniques du géocodage (voir le chapitre suivant pour plus d'informations sur le géocodage) pour calculer ses coordonnées géographiques. Ensuite, ils ont extrait les concepts-clés des pages web, puis formé une table d'associations géographiques dont chaque tuple contient les concepts-clé d'une page web et les coordonnées géographiques des lieux qu'elle renferme. Finalement des techniques du data mining spatial sont appliquées pour trouver des patterns spatiaux par exemples les collocations spatiales.

1.6.3.3 L'extraction et la visualisation des événements

Li, Srihari, Niu, et Li (2003) ont construit un entrepôt dynamique de connaissances à partir des documents textuelles (articles d'actualités et guide de touristes). Le but de la construction de cet entrepôt est de supporter plusieurs applications comme le data mining, et la visualisation et l'analyse des évènements. Parmi les informations contenues dans cet entrepôt des profiles des personnes et des descriptions des évènements. Ces derniers sont des informations géographiques du fait qu'elles sont composées d'une donnée spatiale qui est le lieu de naissance dans les profiles de personnes et le lieu d'occurrence dans les évènements.

1.6.3.4 Base de données géographique pour la conscience de la situation

L'extraction des évènements7 à partir des documents textuelles à été utilisé aussi
pour crées une base de données géographiques pour la conscience de situation8
(Kalashnikov, Ma, et al. 2006, Kalashnikov, Ma, et al. 2006). La base de donnée est

7 Les évènements sont des informations géographiques.

construite pour être analysée probablement par le data mining, ou tout simplement pour l'interrogation9.

Le Tableau 1-2 résume les travaux présentés ci-dessus.

Tableau 1-2. Quelques travaux qui utilisent les documents textuels comme une source d'informations géographiques

Buts d'extraction des

Sources textuelles informations

géographiques

(Borges, et al.

2003) Page web

Mise à jour une base de données géographique d'un SIG urbain

 

(Morimoto, et al.

2003) Page web Data mining spatial

Génération des profiles de personnes

(Li, et al. 2003) Articles d'actualités et guide de touristes Visualisation et analyse des

évènements

Text mining

(Kalashnikov, Ma, et al. 2006)

Les registres de communications transcrites et les rapports déposés par les premiers intervenants après la catastrophe du 9/11.

Articles de journaux et rapports de blog portant sur le tsunami de l'Asie.

Construire une BD des évènements pour la conscience de situation

 

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Ceux qui rĂªvent de jour ont conscience de bien des choses qui échappent à ceux qui rĂªvent de nuit"   Edgar Allan Poe