INTRODUCTION
nombreux et complexes (cf. schéma - Typologie
des logiciels d'apprentissage automatique selon le Conseil de
l'Europe), l'étude ci-après vise à saisir les
étapes de traitement des données de manière
simplifiée36 et non technique37.
i. L'apprentissage automatique
supervisé
L'apprentissage automatique supervisé38
fonctionne en traitant des données d'entrée «
annotées », qualifiées par l'humain,
c'est-à-dire qu'à chaque donnée fournie, un label ou une
catégorie lui est attribué. Par exemple, à
côté de la photo de chien est associé le mot «
chien ». Le logiciel définit ensuite les règles
à partir d'exemples qui sont autant de cas validés39
lors de l'initialisation. Il sera donc capable de déterminer des
standards permettant de déterminer avec un niveau de probabilité
élevé un chien sur une photo. Il pourra ensuite traiter
l'information sur n'importe quelle photo entrée, et afficher en sortie
s'il s'agit bien d'un chien. On peut donc décrire les étapes du
fonctionnement d'un algorithme de machine learning de la
manière suivante :
Rédaction du logiciel
Initialisation
données annotées
Traitement
Entrée probabilités
Sortie Résultat
Il s'agit par exemple du système de « Google
recaptcha », où les utilisateurs du moteur de recherche
définissent les zones d'une image où se situe un panneau de
signalisation. Ainsi, l'utilisateur annote la donnée et permet au
logiciel d'initialiser son fonctionnement à partir
d'elle40.
ii. L'apprentissage automatique non
supervisé
L'Apprentissage automatique non supervisé41,
est un type de machine learning. Dans ce système, «
l'algorithme apprend à partir de données brutes et
élabore sa propre classification qui est libre d'évoluer vers
n'importe quel état final lorsqu'un motif ou un élément
lui est présenté »42. Cette méthode
d'apprentissage ne permet pas de calculer le taux d'erreur en l'absence
d'informations en amont. Les données ne sont ici plus annotées
mais « brutes ». Par exemple, en initialisation, le logiciel
traitera un ensemble de photos sans savoir
36 M. Zimmer, «Apprentissage par
renforcement développemental », intelligence artificielle,
thèse, [cs.AI]. Université de Lorraine, NNT : 2018LORR0008, 2018,
p.10
37 O. Padilla, «Cheat sheets for AI»,
LinkedIn, février 2020, p.6
38 C. M. Bishop, «Pattern recognition and machine
learning», Springer, 2006
39 Vocabulaire de l'intelligence artificielle
(liste de termes, expressions et définitions adoptés), JORF
n°0285, 9 décembre 2018
40 CNIL, les enjeux éthiques des
algorithmes de l'intelligence artificielle, op. cit., p. 17
41 H. B. Barlow, «Unsupervised learning.
Neural computation», 1(3):295-311, 1989
42 Vocabulaire de l'intelligence artificielle, JORF
n°0285, op. cit.
- 8 -
|