6 CONCLUSION
La question du transfert des connaissances est essentielle
pour les organisations. Une entreprise souhaite migrer ses bases documentaires
vers un outil récent pour profiter des fonctionnalités qui
facilitent le partage des connaissances. Cependant, ces documents doivent
être étiquetés avant la migration, au prix d'un travail
conséquent de classification manuelle. Les récents progrès
de l'intelligence artificielle permettent d'automatiser certaines tâches
lourdes et rébarbatives. La problématique de cette étude
était de rechercher les facteurs clés de réussite d'un
projet de Machine Learning pour automatiser la classification de documents.
Les outils récents, comme SharePoint, proposent de
structurer les bases documentaires à travers une classification
basée sur les métadonnées des documents, cette technique
facilite la circulation des informations. Pour cela chaque document doit
être étiqueté. Cependant, les bases documentaires
contiennent des centaines de milliers d'éléments, ce qui rend
impossible l'étiquetage manuel.
L'automatisation de la tâche de classification est
à la portée des solutions proposées par l'intelligence
artificielle, notamment le Machine Learning. Cette méthode est
déjà utilisée par certaines grandes entreprises pour
classer des documents. Elles se basent sur une démarche empirique qui
tranche avec les méthodes classiques de développement, le Machine
Learning explore les données pour construire un modèle de
classification automatique uniquement à partir d'exemples et sans
code.
Nous avons exploré différentes techniques sans
les mettre en pratique, cependant la littérature et les retours
d'expérience de professionnels confirment les capacités attendues
des méthodes du Machine Learning, à condition de respecter
certains principes et bonnes pratiques.
Ces principes sont assez simples et peuvent se résumer
en deux points. D'abord, posséder suffisamment d'exemples, cette
condition est un prérequis. Ensuite, impliquer le métier, la
classification en Machine Learning s'appuie sur des caractéristiques
clairement identifiées qui sont propres à chaque
métier.
Ces conditions doivent être accompagnées de
bonnes pratiques : Adopter une méthode de projet Agile, qui convient
parfaitement à une démarche empirique. Inclure le métier
dès le début du projet pour qu'il se sente concerné, et le
faire monter en compétence sur le ML pour qu'il comprenne ce qu'on
attend de lui. Choisir un expert technique surtout sur la base de ses
compétences en analyse de données, car un profil
développeur ne suffit pas, il faut comprendre ce qui se cache dans la
boite noire. Débuter le processus de modélisation en utilisant
des méthodes simples pour établir une référence.
Concentrer les efforts d'optimisation sur la phase de sélection des
variables. Enfin, la dernière condition concerne l'outillage qui doit
être adapté à la tâche de classification de
données textuelles, et qui sont notamment disponibles sur les
plateformes MLaaS dont l'utilisation est très intuitive, grâce
à des interfaces graphique qui vulgarisent la construction de
modèles.
Les progrès en matière de performance des
programmes utilisés sur ces plateformes cloud permettent d'automatiser
certaines tâches qui sont habituellement réalisées par les
data scientistes. Cela augure un virage dans l'adoption des solutions ML. En
effet, la première conséquence de ces progrès
technologiques est la vulgarisation progressive de la modélisation, les
profils aptes à intégrer ces solutions seront
mécaniquement plus nombreux. Ce phénomène
accélèrera probablement l'adoption de ces technologies par les
entreprises, car en parallèle, les données de ces
dernières sont en train de migrer massivement vers le cloud.
51
Enfin, la problématique de résistance au
changement induit par la classification basée sur les
métadonnées, qui est un problème adjacent mais
néanmoins corrélé au sujet initial, peut également
être solutionnée avec le Machine Learning. Ce changement d'usage
peut inclure un agent intelligent qui jouera le rôle d'assistant pour
aider les utilisateurs lors de la création d'un nouveau document,
l'agent pourra proposer, en analysant le contenu du document, une ou plusieurs
catégories que l'utilisateur devra valider ou modifier.
52
|