PARTIE II : ETUDE DES APPROCHES EXISTANTES
DE TRADUCTION AUTOMATIQUE ET CHOIX D'UNE
APPROCHE
Nous présenterons dans cette partie, les
différentes approches de traduction automatique existantes. Cette
présentation permettra de montrer le mode de fonctionnement de ces
différentes approches, leurs points forts et points faibles puis au vu
des points forts et faibles de chacune d'entre elles nous choisirons une
approche pour le traitement de notre sujet d'étude.
Master Data Science - Big Data 8
I - PRÉSENTATION DES APPROCHES DE TRADUCTION
AUTOMATIQUE
Le domaine de la traduction a connu un essor
considérable ces dernières années, les limites des
traductions humaines ont suscité le désir de mettre en place des
algorithmes dans le but de permettre à la machine d'effectuer ces
tâches de traduction. L'on distingue aujourd'hui plusieurs approches de
traduction automatique, nous nous évertuerons à présenter
les plus utilisées puis nous choisirons dans la suite une approche pour
le traitement de notre cas d'étude. [ 1 ]
1 - Traduction Automatique Basée sur des
Règles (TABR)
Le système de Traduction Automatique Basée sur
des Règles(TABR) ou Rules-Based Machine Translation (RBMT) prend en
entrée des phrases dans une langue dite source pour produire en sortie
des phrases dans une langue dite langue cible. Cette traduction se base sur une
analyse morphologique, syntaxique et sémantique de la langue source et
cible impliquée dans la tâche de traduction.
Dans un RBMT, Le programme de traduction automatique va
associer des dictionnaires de mots courants ainsi que des règles
linguistiques et grammaticales pour procéder à la traduction. Il
arrive de même que la traduction obtenue avec un RBMT n'est pas à
la hauteur de nos attentes, il est cependant possible d'enrichir les
dictionnaires de mots afin d'améliorer la qualité de la
traduction. [ 2]
Source : Enquête de Barbara Vignaux(
https://www.liglab.fr/files/qa_traduction_auto_bd.pdf)
Figure 2 : traduction automatique à base de
règles
Les systèmes basés sur des règles
présentent un certain nombre d'avantages et inconvénients :
Avantages
l Rapidité dans la restitution de traduction;
l Vu que les différents paramètres de traduction
sont établis par l'humain, il est donc possible de les personnaliser
pour un résultat de traduction optimal.
Inconvénients
l La construction de nouveaux dictionnaires est
coûteuse.
Master Data Science - Big Data 9
l Élaboration manuelle de règles linguistiques,
qui peuvent être coûteuses;
l Il est difficile de gérer les interactions de
règles dans les grands systèmes, l'ambiguïté dans
dans la traduction des expressions idiomatiques;
l Incapacité d'adapter automatiquement la traduction
à un nouveau domaine, il va falloir revoir les règles de
traduction;
l Bien que les systèmes RBMT fournissent
généralement un mécanisme pour créer de nouvelles
règles pour étendre et adapter le lexique, les changements sont
généralement très coûteux et les résultats,
souvent, ne sont pas rentables.
|