Youtaqa : système de questions-réponses intelligent basé sur le deep learning et la recherche d’informationpar Rayane Younes & Asma AGABI & TIDAFI Université d'Alger 1 Benyoucef BENKHEDDA - Master 2020 |
CHAPITRE 3. CONCEPTION ET IMPLÉMENTATION DE YOUTAQA3.7 Déploiement du système YouTaQA Afin d'interagir avec les utilisateurs de notre système, nous avons mis en oeuvre une application web SPA8 complète qui fournit une expérience utilisateur facile en appliquant les dernières normes UI9 et l'utilisation du Material Design 10 fourni par Google comme nous pouvons le voir dans la capture d'écran de notre interface dans la Figure 3.8. Pour cela, nous avons utilisépour le front-end un template Colorlib 11 bâtis en utilisant VueJs 12, Bootstrap13 pour le front-end et le framework python Django14 pour le back-end. FIGURE 3.8: Capture d'écran de l'application web YouTaQA 3.8 Conclusion Dans ce chapitre nous avons décrit l'architecture de notre système de la saisie de la question par l'utili-sateur jusqu'àl'obtention des résultats en passant par plusieurs étapes qui sont: (i) La sélection des passages pertinents, (ii) La classification de ces derniers par probabilitéet (iii) L'extraction de la réponse exacte à partir du meilleur passage choisi. Nous présenterons dans le chapitre suivant nos résultats ainsi que leurs discussions.
35 Chapitre4Analyse et discussion des résultats 4.1 Introduction Durant ce dernier chapitre, nous présenterons les résultats de chaque module de notre système. La deuxième partie de ce chapitre consiste à présenter les résultats globaux de notre système YouTaQA ce qui nous permettra de positionner et de comparer ce dernier avec les travaux antérieurs et de mettre en évidence la valeur ajoutée que ce système apporte à l'état de l'art de ce domaine. 4.2 Prétraitement et fractionnement des données Comme mentionnéprécédemment, le moteur de recherche et les modules de classification et d'extraction de réponses ont étéentrainés et testésur l'ensemble de données SQUAD. Le jeu de données »Train set» est diviséen 2 parties. La première partie représente 80% du total et est utilisée pour l'entraînement des modèles de Deep Learning. Les 20% restantes représentent le »Validation set» qui est utilisépour équilibrer le modèle et choisir les bons hyper-paramètres. Tans dis que le »Test set» est utilisépour évaluer les différents modules du système et voir l'amélioration des résultats obtenus. 4.3 Résultats du module de recherche d'information MRI Après avoir établi un premier prototype de notre système, nous l'avons testéen utilisant l'évaluateur TREC-Eval en nous appuyant sur le dataset SQuAD. Nous avons utiliséles questions présentes dans ce dernier en les considérant comme requêtes pour notre moteur de recherche et comparer ses résultats avec les passages fournis par SQuAD. 36 |
|