WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Traduction automatisée des langues africaines. Cas du lingala.


par Assandé Jacob TANO
International Data Science Institute - Master Data Science - Big Data 2020
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

PARTIE II: ETUDE DES APPROCHES EXISTANTES DE TRADUCTION AUTOMATIQUE ET CHOIX

D'UNE APPROCHE

7

I- PRESENTATION DES METHODES DE TRADUCTION AUTOMATIQUE

8

II- CHOIX D'UNE APPROCHE

11

PARTIE III : DESCRIPTION DE LA TRADUCTION AUTOMATIQUE NEURONALE

12

I- LA TRADUCTION AUTOMATIQUE NEURONALE

13

II- LES RÉSEAUX DE NEURONES RÉCURRENTS

17

III- MODÈLES NEURONAUX DE TRADUCTION AUTOMATIQUE

24

IV- EVALUATION D'UN MODÈLE DE TRADUCTION AUTOMATIQUE

28

 

PARTIE IV : IMPLEMENTATION DU MODELE DE TRADUCTION AUTOMATIQUE

33

I- PRÉSENTATION DU PROCESSUS GLOBALE DE TRAITEMENT

34

II- COLLECTE ET PRÉPARATION DES DONNÉES

36

III- CONSTRUCTION DU MODÈLE DE TRADUCTION AUTOMATIQUE

40

IV- PRESENTATION DES RESULTATS

41

CONCLUSION GENERALE

44

BIBLIOGRAPHIE

.X

WEBGRAPHIE

.XI

ANNEXES

.XII

TABLE DES MATIÈRES

XV

Master Data Science - Big Data III

Master Data Science - Big Data IV

 

TANO Assandé Jacob

LISTE DES TABLEAUX

Tableau 1 : Planning prévisionnel d'exécution du projet 6

Tableau 2 : Calcul de la précision modifiée (P1) des unigrams 30

Tableau 3 : Calcul de la précision modifiée (P2) des bigrams 30

Tableau 4 : Calcul de la précision modifiée (P3) des 3-grams 31

Tableau 5 : Calcul de la précision modifiée (P4) des 4-grams 31

Tableau 6 : Caractéristiques du jeu de données 36

Tableau 7 : Exemple de mise en minuscule des mots du jeu de données 37

Tableau 8 : Exemple de suppression de bruts du jeu de données 37

Tableau 9 : Exemple d'harmonisation des écrits du jeu de données 38

Tableau 10 : Modèles de traduction automatique 40

Tableau 11 : Quelques hyperparamètres des modèles construits 40

Tableau 12 : Présentation des résultats des différents modèles de traduction automatique 41

Tableau 13 : Extrait de traduction machine et humaine 43

Master Data Science - Big Data V

 

TANO Assandé Jacob

LISTE DES FIGURES

Figure 1 : Statistiques des univers linguistiques 5

Figure 2 : Traduction automatique à base de règles 8

Figure 3 : Traduction automatique statistique 9

Figure 4 : Traduction automatique neuronale 10

Figure 5 : Mise en correspondance neurone biologique / neurone artificiel 14

Figure 6 : Structure d'un neurone artificiel j 14

Figure 7 : Génération de texte caractère par caractère 19

Figure 8 : Traitement d'une séquence de taille T un réseau de neurone récurrent 19

Figure 9 : Prédiction de la probabilité du caractère suivant à partir d'une séquence initiale 20

Figure 10 : Une couche RNN, prenant en entrée des séquences de 10 caractères 21

Figure 11 : Représentation simplifiée d'une cellule LSTM 22

Figure 12 : Représentation simplifiée d'une cellule GRU 23

Figure 13 : Représentation fermée d' un modèle séquence-à-séquence 24

Figure 14 : Représentation ouverte d' un modèle séquence-à-séquence 25

Figure 15 : Représentation détaillée d'un seq2seq pour une traduction anglais vers lingala 25

Figure 16 : Représentation simplifiée d'un `Transformer' 27

Figure 17 : Processus global de la mise en place de l'outil de traduction 34

Figure 18 : Exemple de vectorisation d'une entrée 39

Figure 19 : Répartition des données 39

Figure 20 : Interface web de traduction 42

Figure 21 : Extrait du script de traduction XII

Figure 22 : Extrait du corpus parallèle XIII

Figure 23 : Extrait du script de l'encodeur et du décodeur XIV

Master Data Science - Big Data VI

 

TANO Assandé Jacob

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Des chercheurs qui cherchent on en trouve, des chercheurs qui trouvent, on en cherche !"   Charles de Gaulle