![]() |
La désambiguà¯sation des toponymes( Télécharger le fichier original )par Imene BENSALEM Université Mentouri de Constantine, Algérie - magistère en informatique 2009 |
3.5 Les connaissancesLes connaissances représentent l'ensemble des informations à propos du toponyme ambigu et ces référents candidats. Les connaissances sont les éléments de base derrière le choix du référent correcte. Sans connaissances il n'est pas possible ni pour l'homme ni pour la machine de déterminer le sens des mots ambigus (Navigli 2009) y compris les toponymes. Nous présentons dans cette section une synthèse des connaissances manipulées dans l'état de l'art des méthodes de DT. 17 La représentation de ce tableau est inspirée de (Leidner 2007, p.116), mais la signification des heuristiques est différente de celle de (Leidner 2007) comme j'ai déjà expliqué dans la section 3.2. 3.5.1 Classification des connaissancesD'après notre point de vue, les connaissances peuvent être classifiées selon 5 critères : la cible, la source, le domaine, la nature, et la méthode d'acquisition. Le Tableau 3-4 fourni une explication de ces critère avec les classes engendrées. Tableau 3-4. Critères de classification des connaissances utilisées pour la désambiguïsation des toponymes Critère Classes Explication Cible ~ Connaissances à propos des référents On veut dire par « cible » celui qui est concerné par les connaissances. Les noms des classes répondent à la question : cette connaissance est à propos de quoi ? Sources
Classification selon la ressource à partir de laquelle une connaissance est obtenue. (Voir Section 3.6 pour plus de détails sur les sources de connaissances.) Domaine
Les connaissances linguistiques sont extraites du texte, tandis que les connaissances géographiques sont concrètes et concerne le monde réel. Nature
Exemple : pour un toponyme ambigu, le nombre de son apparition dans le texte (la fréquence d'occurrence) est une valeur. Cependant, les toponymes qui apparaissent avec lui dans le même contexte (les cooccurrences) sont des relations.
Le critère de classification des connaissances le plus
discriminant est la cible. Selon en 2 classes : connaissances à propos du toponyme à résoudre et connaissances à propos des référents. Dans le reste de cette section nous présentons une vue d'ensemble sur ces deux classes de connaissances. Le schéma de la Figure 3-7 illustre cette description. Dans cette sous-section le terme toponyme est utilisé pour désigner un mot qui représente un nom géographique mais qui n'a pas encore une représentation concrète dans le monde, tandis que le terme référent désigne un toponyme dont son sens est connu. |
|