PARTIE II: ETUDE DES APPROCHES EXISTANTES DE TRADUCTION
AUTOMATIQUE ET CHOIX
D'UNE APPROCHE
|
7
|
I- PRESENTATION DES METHODES DE TRADUCTION AUTOMATIQUE
|
8
|
II- CHOIX D'UNE APPROCHE
|
11
|
PARTIE III : DESCRIPTION DE LA TRADUCTION AUTOMATIQUE NEURONALE
|
12
|
I- LA TRADUCTION AUTOMATIQUE NEURONALE
|
13
|
II- LES RÉSEAUX DE NEURONES RÉCURRENTS
|
17
|
III- MODÈLES NEURONAUX DE TRADUCTION AUTOMATIQUE
|
24
|
IV- EVALUATION D'UN MODÈLE DE TRADUCTION AUTOMATIQUE
|
28
|
|
PARTIE IV : IMPLEMENTATION DU MODELE DE TRADUCTION AUTOMATIQUE
|
33
|
I- PRÉSENTATION DU PROCESSUS GLOBALE DE TRAITEMENT
|
34
|
II- COLLECTE ET PRÉPARATION DES DONNÉES
|
36
|
III- CONSTRUCTION DU MODÈLE DE TRADUCTION AUTOMATIQUE
|
40
|
IV- PRESENTATION DES RESULTATS
|
41
|
CONCLUSION GENERALE
|
44
|
BIBLIOGRAPHIE
|
.X
|
WEBGRAPHIE
|
.XI
|
ANNEXES
|
.XII
|
TABLE DES MATIÈRES
|
XV
|
Master Data Science - Big Data
III
Master Data Science - Big Data IV
LISTE DES TABLEAUX
Tableau 1 : Planning prévisionnel d'exécution du
projet 6
Tableau 2 : Calcul de la précision modifiée (P1)
des unigrams 30
Tableau 3 : Calcul de la précision modifiée (P2)
des bigrams 30
Tableau 4 : Calcul de la précision modifiée (P3)
des 3-grams 31
Tableau 5 : Calcul de la précision modifiée (P4)
des 4-grams 31
Tableau 6 : Caractéristiques du jeu de données
36
Tableau 7 : Exemple de mise en minuscule des mots du jeu de
données 37
Tableau 8 : Exemple de suppression de bruts du jeu de
données 37
Tableau 9 : Exemple d'harmonisation des écrits du jeu
de données 38
Tableau 10 : Modèles de traduction automatique 40
Tableau 11 : Quelques hyperparamètres des
modèles construits 40
Tableau 12 : Présentation des résultats des
différents modèles de traduction automatique 41
Tableau 13 : Extrait de traduction machine et humaine 43
Master Data Science - Big Data
V
LISTE DES FIGURES
Figure 1 : Statistiques des univers linguistiques 5
Figure 2 : Traduction automatique à base de
règles 8
Figure 3 : Traduction automatique statistique 9
Figure 4 : Traduction automatique neuronale 10
Figure 5 : Mise en correspondance neurone biologique / neurone
artificiel 14
Figure 6 : Structure d'un neurone artificiel j 14
Figure 7 : Génération de texte caractère
par caractère 19
Figure 8 : Traitement d'une séquence de taille T un
réseau de neurone récurrent 19
Figure 9 : Prédiction de la probabilité du
caractère suivant à partir d'une séquence initiale 20
Figure 10 : Une couche RNN, prenant en entrée des
séquences de 10 caractères 21
Figure 11 : Représentation simplifiée d'une
cellule LSTM 22
Figure 12 : Représentation simplifiée d'une
cellule GRU 23
Figure 13 : Représentation fermée d' un
modèle séquence-à-séquence 24
Figure 14 : Représentation ouverte d' un modèle
séquence-à-séquence 25
Figure 15 : Représentation détaillée d'un
seq2seq pour une traduction anglais vers lingala 25
Figure 16 : Représentation simplifiée d'un
`Transformer' 27
Figure 17 : Processus global de la mise en place de l'outil de
traduction 34
Figure 18 : Exemple de vectorisation d'une entrée 39
Figure 19 : Répartition des données 39
Figure 20 : Interface web de traduction 42
Figure 21 : Extrait du script de traduction XII
Figure 22 : Extrait du corpus parallèle XIII
Figure 23 : Extrait du script de l'encodeur et du
décodeur XIV
Master Data Science - Big Data VI
|