REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET
POPULAIRE Ministère de l'enseignement supérieur et de la
recherche scientifique Université Mentouri de
Constantine Faculté des sciences de
l'ingénieur Département d'Informatique
Mémoire en vue de l'obtention du diplôme
Magistère en informatique
Numéro d'ordre : 356/mag/2009 Numéro de
série : 013/inf/2009
La Désambiguïsation des
Toponymes
Présenté par : Imene Bensalem
Encadrée par: Dr. Mohamed Kireddine Kholladi Le jury est
composé de :
Président: Dr. Alloua Chaoui
Rapporteur: Dr. Mohammed Kireddine Kholladi
Examinateur : Dr. Saidouni Djamel Eddine Examinateur : Dr. Salim
Chikhi
Résumé
L'espace géographique est une dimension
omniprésente. La façon de se référer à un
lieu dans cet espace, peut être formelle basée sur les
coordonnées spatiales, ou informelle, que nous employons dans la langue
naturelle en utilisant les toponymes (les noms des lieux). La
présentation formelle est la base de tous les traitements spatiaux que
peut effectuer la machine. Ces traitements ne sont pas possible en utilisant
les toponymes. Les informations géographiques sont parmi les
informations qui peuvent être extraites du texte en utilisant les
techniques du traitement automatique des langues naturelles, mais
malheureusement, elles ne peuvent être exploitées que si les lieux
géographiques sont représentés d'une manière
formelle, ce qui n'est pas souvent le cas dans les documents textuels. La
conversion entre la représentation formelle et la représentation
informelles des lieux géographiques est donc une nécessité
pour pouvoir bénéficier des informations géographiques
extraites du texte. La désambiguïsation de toponyme associe aux
occurrences de toponymes dans le texte leurs représentations formelles.
Cette tâche est problématique à cause de
l'ambiguïté des toponymes. En effet un toponyme peut être le
nom de plusieurs lieux dans le monde. La désambiguïsation des
toponymes est une tâche primordiale dans une multitude d'application
entre autre le data mining spatial. Ce mémoire traite le problème
de la désambiguïsation de toponymes en présentant une
nouvelle heuristique qui utilise une source d'évidence qui n'a pas
encore été exploité dans les méthodes le
l'état de l'art.
Mots clé : désambiguïsation
de toponymes, informations géographiques, relations arborescentes.
???????? íÖÇíÑ ???? ???
ÁÇÖáÇ ??? ?? ????
|
???
|
??????
|
???
|
. ???? ?? ?? ?????? ??? ?? ????????
ÁÇÖáÇ
|
??
|
????? ?????
|
?? ?????
|
??? ?
|
??
|
??? . ??? 14?
|
??51.1 ????
|
????
|
ÉíÇÑÛÌáÇ
??????? ÁÇãÓ ?? ? ?? ????? ??? ???? ??
ÉíäÇßãáÇ ?????????
???????? ? ????????? ?? ???? ?? ??????? ????? . ???????? ?????
????????
??????? ???????? ???????? ?????? ?????? ?????? ???? . ??????
ÁÇãÓ ???????? ????? ????
?? ??????? ??? ??????? ???? ??? ?? ???? ???????? ? ? ?????????
??? ?????? ???? ? ???? ???? ?????? ?? ??????? ??????? ?? .
???????? ?????? ?????? ????? ?????? ?? ???????? ???? ??? ??? ?
íÖÇíÑ ???? ???? ? ????????? ????????? ??
???????? ?????? ???? ??? ????????? ??????? ?????? ??????? ???? ??????? ?????
???
?? ???????? ????????? ÁÇãÓ?Ç
??? ????? ? ? ?????? ÁÇãÓ ????? . ?????? ??
????????? ?????????
?? . ?????? ÁÇãÓ ???? ???? ??? ? ????
??????? ??????? ?????? ??? ????? . ??????? ???????? ??????
?????? ??????? ??? ÁÇÑÌÅ
|
?? ?????? ÁÇãÓ ????? .?????? ??
????? ???
|
???? ??
|
??????
|
???? ????
|
?? ??????
|
??? ? ?????? ÁÇãÓ
|
?????
|
?????
|
??????? ??? ??????
|
. ???????? ????????
|
?? ??????? ????? ??
|
?????????
|
??
|
. ???????? ???????? ?? ???????
|
??????? ???????
ÉíÇÑÛÌáÇ ?????????
äßÇã?Ç ÁÇãÓ
?????
|
|
????????
|
???????
|
. ????? ???????? ??????? ?? ??? ?? ????????? ??? ?? ?????? ?????
?????? ?????? ????? ???????? ???????
|