Youtaqa : système de questions-réponses intelligent basé sur le deep learning et la recherche d’information

par Rayane Younes & Asma AGABI & TIDAFI
Université d'Alger 1 Benyoucef BENKHEDDA - Master 2020

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

CHAPITRE 3. CONCEPTION ET IMPLÉMENTATION DE YOUTAQA

3.7 Déploiement du système YouTaQA

Afin d'interagir avec les utilisateurs de notre système, nous avons mis en oeuvre une application web SPA⁸ complète qui fournit une expérience utilisateur facile en appliquant les dernières normes UI⁹ et l'utilisation du Material Design ¹⁰ fourni par Google comme nous pouvons le voir dans la capture d'écran de notre interface dans la Figure 3.8. Pour cela, nous avons utilisépour le front-end un template Colorlib ¹¹ bâtis en utilisant VueJs ¹², Bootstrap¹³ pour le front-end et le framework python Django¹⁴ pour le back-end.

FIGURE 3.8: Capture d'écran de l'application web YouTaQA

3.8 Conclusion

Dans ce chapitre nous avons décrit l'architecture de notre système de la saisie de la question par l'utili-sateur jusqu'àl'obtention des résultats en passant par plusieurs étapes qui sont: (i) La sélection des passages pertinents, (ii) La classification de ces derniers par probabilitéet (iii) L'extraction de la réponse exacte à partir du meilleur passage choisi. Nous présenterons dans le chapitre suivant nos résultats ainsi que leurs discussions.

8. SPA (Single page application) : c'est une application qui n'a pas besoin de recharger la page dans le navigateur

pendant son utilisation.

9. UI (user interface): signifie »interface utilisateur», c'est la présentation graphique d'une application.

10. Material Design: C'est un ensemble de règles de design proposées par Google et qui s'appliquent à l'interface

graphique.

11. https://colorlib.com/wp/templates/

12. VueJs : c'est un framework pour construire des interfaces utilisateur à base de javascript.

13. Bootstrap : c'est un framework CSS pour construire des interfaces utilisateur.

14. Django : c'est un framework web gratuit écrit en Python qui sert à développer des applications web.

Chapitre4

Analyse et discussion des résultats

4.1 Introduction

Durant ce dernier chapitre, nous présenterons les résultats de chaque module de notre système. La deuxième partie de ce chapitre consiste à présenter les résultats globaux de notre système YouTaQA ce qui nous permettra de positionner et de comparer ce dernier avec les travaux antérieurs et de mettre en évidence la valeur ajoutée que ce système apporte à l'état de l'art de ce domaine.

4.2 Prétraitement et fractionnement des données

Comme mentionnéprécédemment, le moteur de recherche et les modules de classification et d'extraction de réponses ont étéentrainés et testésur l'ensemble de données SQUAD. Le jeu de données »Train set» est diviséen 2 parties. La première partie représente 80% du total et est utilisée pour l'entraînement des modèles de Deep Learning. Les 20% restantes représentent le »Validation set» qui est utilisépour équilibrer le modèle et choisir les bons hyper-paramètres. Tans dis que le »Test set» est utilisépour évaluer les différents modules du système et voir l'amélioration des résultats obtenus.

4.3 Résultats du module de recherche d'information MRI

Après avoir établi un premier prototype de notre système, nous l'avons testéen utilisant l'évaluateur TREC-Eval en nous appuyant sur le dataset SQuAD. Nous avons utiliséles questions présentes dans ce dernier en les considérant comme requêtes pour notre moteur de recherche et comparer ses résultats avec les passages fournis par SQuAD.

précédent sommaire suivant

Changeons ce systeme injuste, Soyez votre propre syndic

"L'imagination est plus importante que le savoir" Albert Einstein