II- PRÉSENTATION DU CAHIER DES CHARGES
De nos jours, de nombreux africains vivent en Europe, en
Amérique ou même Afrique dans un milieu citadin où ils ont
peu de chance d'apprendre leurs valeurs traditionnelles. Fort est de constater
que de nombreuses personnes éprouvent assez de difficultés
à s'exprimer dans leurs langues maternelles parce qu'elles n'ont jamais
été ou n'ont pas passé un grand nombre de temps dans un
environnement favorisant un échange en langue maternelle.
Cette situation nous laisse souvent dans des situations
très inconfortables, surtout lors des échanges avec les parents
des milieux ruraux ou avec ceux des milieux urbains mais qui se sentent plus
à l'aise dans les échanges en langue maternelle.
La maîtrise de la langue est utile pour
s'intégrer dans un groupe social donné et favorise la
création et le renforcement des liens amicaux surtout lors des visites
dans des pays africains où une langue locale est reconnue et
parlée comme langue nationale.
De ce fait data354, dans l'optique de permettre un
apprentissage des langues africaines aux africains ayant perdus le lexique de
leurs langues maternelles ou à tout autre personne physique
désireuse d'apprendre une langue africaine ou à une personne
morale voulant traduire un certain nombre de documents en langue africaine de
pouvoir le faire aisément via une plateforme de traduction qu'elle
voudrait mettre en place.
Pour le début, ce projet de création de
système de traduction vise à traduire dans un premier temps des
phrases écrites en anglais vers le lingala et par la suite permettre la
traduction de d'autres langues africaines.
1- Motivation du choix des langues
Plusieurs raisons ont motivé le choix des deux langues
retenues :
ANGLAIS
l L'une des langues ayant plus de locuteurs natifs;
l La langue la plus utilisée sur internet;
l La langue la plus utilisée dans le monde du travail et
pour la communication internationale.
Master Data Science - Big Data 5
Sources : W3techs, Ethnologue
Figure 1 : Statistiques des univers linguistiques
LINGALA
l Se situe dans le top 10 des langues Africaines les plus
parlées;
l Expansion de la langue à travers la musique;
l Statut de langue Nationale en république
démocratique du Congo;
l L'une des langues africaines les plus parlées et pas
encore pris en compte dans les systèmes de traduction tels que google
translate, DeepL.
2. Objectif général
L'objectif lors ce stage c'est de mettre en place un outil
pour la traduction automatique de phrases écrites en Anglais vers le
Lingala à l'aide des algorithmes d'intelligence artificielle.
3. Objectifs spécifiques
Pour atteindre l'objectif général, nous
identifions trois objectifs spécifiques du projet à savoir :
l Collecter et préparer un ensemble de données
bilingue où l'on aura des phrases en anglais et leur équivalent
en Lingala ;
l Implémenter un modèle de traduction
automatique ;
l Produire une interface utilisateur conviviale offrant des
services de traduction.
Master Data Science - Big Data 6
|