LISTE DES ABREVIATIONS
BLEU : BiLingual Evaluation Understudy
CTO : Chief Technical Officer
ENSEA : École Nationale
Supérieure de Statistique et d'Economie Appliquée
FFN : Feed Forward network
GRU : Gated recurrent unit
IA : Intelligence Artificielle
IDSI : International Data Science
Institute
INP-HB : Institut National Polytechnique
Félix Houphouët Boigny
LSTM : Long Short-Term Memory
NMT : Neural Machine Translation
NLP : Natural Language Processing
OOV : Out Of Vocabulary
RBMT : Rules Based Machine Translation
RPA : Robotics Process Automation
(Automatisation des Processus Robotiques)
RNN : Recurrent Neural Network
SMS : Short Message Service
SMT : Statistical Machine Translation
TA : Traduction Automatique
TAL : Traitement Automatique du Langage
TALN : Traitement Automatique du Langage
Naturel
TAN : Traduction Automatique Neuronale
TAS : Traduction Automatique Statistique
GLOSSAIRE
l Anglais: langue indo-européenne
germanique originaire d'Angleterre et parlée comme langue officielle
dans plusieurs pays du monde.
l Arabe : C'est la langue officielle de plus
de vingt pays et de plusieurs organismes internationaux, dont l'une des six
langues officielles de l' Organisation des Nations unies.
l Haoussa : Haoussa, hausa ou hawsa, est une
langue africaine de la famille des langues afro-asiatiques1
parlée en Afrique de l'Ouest, principalement au Niger et au Nigeria,
mais aussi au Bénin.
l Igbo : L'igbo, ou ibo est une langue
parlée au Nigéria par environ 20 à 35 millions de
personnes, les Igbos, en particulier dans le sud-est du Nigéria.
l Intelligence artificielle : elle
désigne l'ensemble des théories et des techniques mises en oeuvre
en vue de réaliser des machines capables de simuler l'intelligence
humaine.
l Langue Africaine : une langue est tout
d'abord un instrument permettant la communication entre individus. L'on doit
donc entendre par langue africaine, une langue parlée sur le continent
africain.
2
l Lingala : c'est une langue de la famille
des langues bantoues , parlée en République democratique
du Congo (communément appelé Congo-Kinshasa) et en
République du Congo (appelé communément
Congo-Brazzaville).
l Natural Language Processing (NLP) : encore
appelée en français traitement automatique du langage naturel
(abr. TALN), ou traitement automatique des langues (abr. TAL) c'est un domaine
qui vise à créer des outils de traitement de la langue naturelle
par des algorithmes d'Intelligence artificielle.
l Swahili : Le Swahili ou Kiswahili est une
langue d'origine africaine, parlé dans dix pays à savoir le
Malawi, le Rwanda, la Somalie, le Mozambique, la RDC, le Kenya, l'Ouganda, le
Burundi, la
Tanzanie puis aux Comores.
l Traduction automatique : consiste à
traduire un texte (ou d'une conversation audio, en direct ou en
différé) d'une langue source vers une langue cible en utilisant
un ou plusieurs programmes informatiques, sans qu'un traducteur humain n'ait
à intervenir.
3
l Wolof : langue sénégambienne
principalement parlée au Sénégal et en Mauritanie.
l Word Embedding : Le word embedding est une
technique de vectorisation de mots où les mots se rapprochant
sémantiquement sont représentés par des vecteurs plus
proches.
l Yoruba : est une langue d'Afrique de
l'ouest principalement parlée au Nigeria, Bénin et au Togo.
l Zulu : Le zulu est une langue de la
famille des langues bantoues, parlée en Afrique australe.
1 Afro-asiatiques : une famille de langues
parlées principalement en Afrique du Nord, dans la Corne de l'Afrique,
au Moyen-Orient, dans le Sahara et dans une partie du Sahel.
2 Langues bantoues : La famille des langues
bantoues est un ensemble de langues africaines qui regroupe environ 400 langues
parlées dans une vingtaine de pays de la moitié sud.
3 Langues sénégambiennes : Les
langues sénégambiennes sont des langues africaines
rattachées à la branche nord des langues atlantiques.
Master Data Science - Big Data VIII
|