WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Traduction automatisée des langues africaines. Cas du lingala.


par Assandé Jacob TANO
International Data Science Institute - Master Data Science - Big Data 2020
  

précédent sommaire suivant

Extinction Rebellion

PARTIE II: ETUDE DES APPROCHES EXISTANTES DE TRADUCTION AUTOMATIQUE ET CHOIX

D'UNE APPROCHE

7

I- PRESENTATION DES METHODES DE TRADUCTION AUTOMATIQUE

8

II- CHOIX D'UNE APPROCHE

11

PARTIE III : DESCRIPTION DE LA TRADUCTION AUTOMATIQUE NEURONALE

12

I- LA TRADUCTION AUTOMATIQUE NEURONALE

13

II- LES RÉSEAUX DE NEURONES RÉCURRENTS

17

III- MODÈLES NEURONAUX DE TRADUCTION AUTOMATIQUE

24

IV- EVALUATION D'UN MODÈLE DE TRADUCTION AUTOMATIQUE

28

 

PARTIE IV : IMPLEMENTATION DU MODELE DE TRADUCTION AUTOMATIQUE

33

I- PRÉSENTATION DU PROCESSUS GLOBALE DE TRAITEMENT

34

II- COLLECTE ET PRÉPARATION DES DONNÉES

36

III- CONSTRUCTION DU MODÈLE DE TRADUCTION AUTOMATIQUE

40

IV- PRESENTATION DES RESULTATS

41

CONCLUSION GENERALE

44

BIBLIOGRAPHIE

.X

WEBGRAPHIE

.XI

ANNEXES

.XII

TABLE DES MATIÈRES

XV

Master Data Science - Big Data III

Master Data Science - Big Data IV

 

TANO Assandé Jacob

LISTE DES TABLEAUX

Tableau 1 : Planning prévisionnel d'exécution du projet 6

Tableau 2 : Calcul de la précision modifiée (P1) des unigrams 30

Tableau 3 : Calcul de la précision modifiée (P2) des bigrams 30

Tableau 4 : Calcul de la précision modifiée (P3) des 3-grams 31

Tableau 5 : Calcul de la précision modifiée (P4) des 4-grams 31

Tableau 6 : Caractéristiques du jeu de données 36

Tableau 7 : Exemple de mise en minuscule des mots du jeu de données 37

Tableau 8 : Exemple de suppression de bruts du jeu de données 37

Tableau 9 : Exemple d'harmonisation des écrits du jeu de données 38

Tableau 10 : Modèles de traduction automatique 40

Tableau 11 : Quelques hyperparamètres des modèles construits 40

Tableau 12 : Présentation des résultats des différents modèles de traduction automatique 41

Tableau 13 : Extrait de traduction machine et humaine 43

Master Data Science - Big Data V

 

TANO Assandé Jacob

LISTE DES FIGURES

Figure 1 : Statistiques des univers linguistiques 5

Figure 2 : Traduction automatique à base de règles 8

Figure 3 : Traduction automatique statistique 9

Figure 4 : Traduction automatique neuronale 10

Figure 5 : Mise en correspondance neurone biologique / neurone artificiel 14

Figure 6 : Structure d'un neurone artificiel j 14

Figure 7 : Génération de texte caractère par caractère 19

Figure 8 : Traitement d'une séquence de taille T un réseau de neurone récurrent 19

Figure 9 : Prédiction de la probabilité du caractère suivant à partir d'une séquence initiale 20

Figure 10 : Une couche RNN, prenant en entrée des séquences de 10 caractères 21

Figure 11 : Représentation simplifiée d'une cellule LSTM 22

Figure 12 : Représentation simplifiée d'une cellule GRU 23

Figure 13 : Représentation fermée d' un modèle séquence-à-séquence 24

Figure 14 : Représentation ouverte d' un modèle séquence-à-séquence 25

Figure 15 : Représentation détaillée d'un seq2seq pour une traduction anglais vers lingala 25

Figure 16 : Représentation simplifiée d'un `Transformer' 27

Figure 17 : Processus global de la mise en place de l'outil de traduction 34

Figure 18 : Exemple de vectorisation d'une entrée 39

Figure 19 : Répartition des données 39

Figure 20 : Interface web de traduction 42

Figure 21 : Extrait du script de traduction XII

Figure 22 : Extrait du corpus parallèle XIII

Figure 23 : Extrait du script de l'encodeur et du décodeur XIV

Master Data Science - Big Data VI

 

TANO Assandé Jacob

précédent sommaire suivant






Extinction Rebellion





Changeons ce systeme injuste, Soyez votre propre syndic





"Et il n'est rien de plus beau que l'instant qui précède le voyage, l'instant ou l'horizon de demain vient nous rendre visite et nous dire ses promesses"   Milan Kundera