Table des matières
Remerciements 1
Résumé 2
Table des matières 3
Table des figures 5
Liste des tableaux 5
1 INTRODUCTION GENERALE 6
1.1 Contexte de l'étude 7
1.1.1 Etat des lieux 7
1.1.2 Les bases documentaires IT 7
1.2 Problématique 8
1.2.1 Questions de recherche 8
1.3 Méthodologique 9
1.3.1 Revues de littératures 9
1.3.2 Entretiens 9
2 GESTION DES CONNAISSANCES ET CLASSIFICATION 11
2.1 La gestion des connaissances 11
2.1.1 Définition du KM 11
2.1.2 La connaissance 12
2.1.3 Création et transfert de la connaissance 13
2.2 Gestion documentaire 14
2.2.1 Outils et méthodes 14
2.2.2 Classification de documents 16
2.2.3 Accès à l'information 16
2.2.4 Métadonnée 17
2.3 Etiquetage manuel 17
2.4 Conclusion 18
3 L'INTELLIGENCE ARTIFICIELLE ET LA CLASSIFICATION DE DOCUMENTS
19
3.1 L'intelligence artificielle 19
3.1.1 Différentes définitions 19
3.1.2 Historique de l'intelligence artificielle 19
3.1.3 L'intelligence artificielle est déjà
là ! 20
3.1.4 Enjeux pour les entreprises 21
3.2 Les domaines de l'intelligence artificielle 22
3.2.1 Les approches 23
4
3.2.2 Les sous-domaines de l'intelligence artificielle 23
3.3 La classification de document 25
3.4 Le traitement automatique du langage naturel 25
3.5 Le Machine Learning 26
3.5.1 Les modes d'apprentissage et les types de problèmes
à résoudre 27
3.5.2 Les étapes du Machine Learning supervisé
27
3.5.3 Les données 29
3.5.4 Les algorithmes utilisés en Machine Learning 30
3.5.5 Algorithmes adaptés à la classification de
document textuel 32
3.5.6 La mesure des performances du modèle 33
3.5.7 Leviers d'ajustement 35
3.6 Spécificités de la classification de texte
37
3.6.1 Etapes du pré-traitement des données
textuelles 37
3.7 Outils 40
3.8 Conclusion 41
4 ENTRETIENS 42
4.1 Aspect projet 42
4.1.1 Quelle méthode de projet choisir ? 42
4.1.2 Phase de cadrage 42
4.1.3 Quels sont les rôles et compétences
nécessaires ? 43
4.1.4 Comment définir la qualité du livrable ?
43
4.1.5 Comment estimer l'opportunité ? 43
4.1.6 Quels sont les principaux risques ? 44
4.1.7 Faut-il prévoir une MCO particulière ? 44
4.2 Aspect technique 45
4.2.1 Comment préparer les données ? 45
4.2.2 Choix de l'algorithme 45
4.2.3 Validation et régularisation du classifieur 46
4.2.4 Outillage 46
4.3 Conclusion 47
5 RECOMMANDATIONS SYNTHÉTISÉES 48
6 CONCLUSION 50
BIBLIOGRAPHIE 52
ANNEXE 58
5
Table des figures
FIGURE 1- INTERDISCIPLINARITE DE LA GESTION DES CONNAISSANCES
(DALKIR, 2013) 12
FIGURE 2 - PYRAMIDE DIKW (ERMINE, ET AL., 2012) 12
FIGURE 3 - MODELE SECI (NONAKA, ET AL., 2000) 13
FIGURE 4 - CYCLE CONNAISSANCE-INFORMATION (BLUMENTRITT &
JOHNSTON, 1999) 14
FIGURE 5 - INTEGRATION DE LA GESTION DOCUMENTAIRE DANS L'ECM
(KATUU, 2012) 15
FIGURE 6 - CYCLE DE VIE DU DOCUMENT (CABANAC & AL, 2006)
16
FIGURE 7 - ADOPTION DE L'IA PAR LES ENTREPRISES (MIT, 2017) 21
FIGURE 8 - CHAMPS DE L'IA (VILLANUEVA & SALENGA, 2018) 23
FIGURE 9 - L'IA : UNE INTERCONNEXION D'APPLICATIONS, DE DOMAINES
ET DE METHODES (SEE, 2016) 24
FIGURE 10 - LA CLASSIFICATION, A LA CROISEE DES CHEMINS DE L'IA
25
FIGURE 11 - LES DEUX PHASES DE L'APPRENTISSAGE AUTOMATIQUE
(CHAOUCHE, 2018) 26
FIGURE 12 - ETAPES DE MODELISATION D'UN CLASSIFIEUR 28
FIGURE 13 - IMPORTANCE DES DONNEES PAR RAPPORT AUX ALGORITHMES
(BANKO ET BRILL - 2001) 29
FIGURE 14 - EXEMPLE DE MATRICE DE CONFUSION ACCOMPAGNEE DE LA
F-MESURE (F1) (AWS, S.D.) 35
FIGURE 15 - CONSEQUENCES DU SOUS-APPRENTISSAGE ET DU
SUR-APPRENTISSAGE SUR LE TAUX D'ERREUR (AL-BEHADILI, ET AL.,
2018) 35
FIGURE 16 - PROCESSUS DE MODELISATION D'UN CLASSIFIEUR (OSISANWO,
2017) 36
FIGURE 17 - PRE-TRAITEMENT DES DONNEES TEXTUELLES 37
FIGURE 18 - ETAPES DU PRE-TRAITEMENT DES DONNEES TEXTUELLES
(OSISANWO, 2017) 38
FIGURE 19 - COMPARAISON DES MLAAS DE AWS, MS, GOOGLE ET IBM
(ALTEXSOFT, 2018) 40
FIGURE 20 - AZURE ML TEXT CLASSIFICATION WORKFLOW (ABDEL-HADY,
2015) 40
|