Chapitre1
Les Systèmes de Questions-Réponses
1.1 Introduction
Le Question-Answering est un domaine de recherche qui a connu un
intérêt remarquable durant ces dernières années, ce
qui a permis une avancée majeure par les chercheurs de ce domaine. Ce
chapitre résume l'étude bibliographique effectuée. Il
porte sur la qualitédes systèmes existants en
général et les multiples dimensions qui permettent de les
caractériser, les évaluer et de les classifier afin de
connaître l'état de l'art de ce domaine. Nous avons aussi
présentéles ensembles de données les plus utilisés
pour leur développement.
1.2 Les systèmes de Questions-Réponses
Les systèmes de réponse aux questions est une
forme sophistiquée de Recherche d'Information
caractérisée par des besoins d'information qui sont au
moins partiellement exprimés sous forme d'énoncés ou de
questions en langage naturel, et constituent l'une des formes les plus
naturelles d'interaction entre l'homme et l'ordinateur. Leur défi
consiste à fournir une réponse concise à une question en
langage naturel, étant donnéla grande quantitéde documents
textuels. La réponse à une question est une tâche de
Recherche d'Information limitée par l'expression de
tout ou partie du besoin d'informations sous la forme d'un ensemble de
questions ou d'énoncés en langage naturel [Kolomiyets and Moens,
2011a]. L'utilisateur est intéressépar une réponse
concise, compréhensible et correcte par exemple: »Who is the
inventor of the telephone?» la réponse sera: »Alexander Graham
Bell».
1.3 État de l'art des systèmes de
Questions-Réponses
Dans le domaine des QAS, nous faisons souvent
référence à leur classification selon leur domaine
d'appli-cation, c-à-dire le domaine dans lequel ils opèrent et
répondent aux questions. Comme le montre la taxonomie
6
CHAPITRE 1. LES SYSTÈMES DE
QUESTIONS-RÉPONSES
illustrée dans la Figure 1.1, il existe principalement
deux classes qui sont: Closed-domain QAS et Open-domain QAS.
Dans notre étude bibliographique, nous avons
constatéque les systèmes QA peuvent aussi être
catégorisés selon les sources de connaissances sur lesquelles ils
se basent pour extraire les informations afin de répondre aux questions.
Nous avons également remarquéque les systèmes peuvent
répondre à différentes formes de questions, ce qui nous a
incitéà aussi les catégoriser par type de questions. Dans
ce qui suit, nous allons présenter une vue globale puis
détaillée de différentes catégories de
classification des systèmes QA.
1.3.1 Classification par domaine
d'application
1- Open-domain QAS
Les QAS du domaine ouvert (START, QuALIM, DeepQA, FALCON,
Lasso, DrQA, YodaQA, AskMSR) ne sont pas limités à un domaine
spécifique et fournissent une réponse courte à une
question, traitée en langage naturel. En outre, les questions peuvent
être sur quasiment n'importe quel sujet [ElKafrawy et al., 2018]. Ces
systèmes recherchent généralement des réponses au
sein d'une vaste collection de documents. Il existe un grand nombre de
questions qui peuvent être posées par des utilisateurs
occasionnels dans les systèmes questions-réponses du domaine
ouvert, et afin de répondre à ces questions, ce type de
systèmes exploit l'onto-logie générale et la connaissance
du monde dans leurs méthodologies pour générer des
réponses. En général, la qualitédes réponses
fournies par ces systèmes n'est pas aussi précise que les
systèmes questions-réponses du domaine fermé. Les QAS du
domaine ouvert ne nécessitent pas de vocabulaire spécifique au
domaine. Ils recherchent des réponses dans des grandes collections de
documents [Reddy and Madhavi, 2017]. En contrepartie, ils permettent aux
utilisateurs la possibilitéde poser des questions sans connaître
les mots clés du domaine spécifique pour formuler des questions.
Ceci favorise l'utilisation des QAS du domaine ouvert par tous les utilisateurs
de différents niveaux d'instruction et de différents domaines de
spécialisation. De plus, Ces systèmes ne nécessitent pas
le dictionnaire d'un domaine spécifique, ce qui veut dire que
Wikipédia peut être utilisée comme une source
d'information.
2- Closed domain QAS
Les systèmes QAS du domaine fermé(BASEBALL,
LUNAR, MedQA, MYCIN, HONqa, EAGLi, as-kHERMES, KAAS, WEBCOOP) permettent de
répondre aux questions relatives à un domaine particulier
(médecine, cinématographie, aquariophilie, etc) en se basant sur
les connaissances spécifiques aux domaines souvent formalisés
dans des ontologies. Par ailleurs, des types limités de questions sont
acceptés dans ces systèmes [ElKafrawy et al., 2018]. Ce domaine
nécessite une disposition linguistique pour comprendre le texte en
langue naturelle afin d'apporter une réponse précise aux
requêtes [Ojokoh and Adebisi, 2019].
|