MÉMOIRE
pour obtenir le grade de Master délivré par
Université Paris 8 Vincennes à Saint Denis
Mention Informatique
Parcours Big data et Fouille de
données
présenté et soutenu publiquement
par
Amassin NACERDDINE
le 12 septembre 2022
Prévison de date de passage des jalons avec les
méthodes de machine learning
Directeur de mémoire: Guille BERNARD
Maître d'apprentissage : Céline PREL
|
|
Alternance effectué à : Groupe Renault 1 Av.
du Golf,
78280 Guyancourt
COMUE Paris Lumières
Laboratoire d'Informatique Avancée de Saint
Denis Laboratoire Paragraphe
|
M
A
S
T
E
R
|
Remerciements
Je tiens à apporter toute ma gratitude à mon
encadrant universitaire Monsieur Gilles BERNARD pour ses précieux
conseils son encadrement irréprochable ainsi que son écoute et sa
disponibilité.
Mes professeurs qui m'ont suivi durant tout mon parcours
académique Monsieur Sofian Aissani Monsieur Youcef TOUATI Monsieur
Jean-Jacques MARIAGE Madame Rakia JAZIRI.
Un grand merci à Madame Ana FERNANDEZ pour son
management et ses motivations. Madame Marie-Claire FEYEL pour ses avis toujours
très affûtés. Mais aussi Monsieur Abdel-Djalil OURABAH pour
son aide.
Enfin, merci aux membres de ma promo avec qui j'ai
passé des moments inoubliables, Ainsi que ma famille et mes amis qui
sont constamment restés à l'écoute Rayan Iness Maman et ma
mamie.
Sommaire
Remerciements 3
Introduction 7
I Problématique 9
I Le contexte de résolution du problème 13
II Le problème à résoudre 19
II État de l'art 35
III Techniques de traitement 39
IV Techniques d'évaluation 49
V Résultats obtenus 53
III Système réalisé 61
VI Méthodologie d'analyse et de conception 65
VII Outils utilisés 69
Conclusion 77
6 SOMMAIRE
Amassin NACERDDINE Université Paris 8 Vincennes
Table des figures 81
Liste des tableaux 83
Introduction
En cette ère moderne, on a de plus en plus besoin de
prédire ce qui va se passer dans un futur proche.
Dans le cadre de mon alternance que j'effectue au sein du
groupe Renault à la direction de la DEAGOM où nous sommes en
charge du suivi et du monitoring des projets véhicules nous devons
respecter un jalonnement bien spécifique pour les projets.
Néanmoins il s'avère que ces date
prévisionnelles qui sont saisies dans nos outils d'entreprise ne
s'avère pas toujours fiables et ne sont pas toujours
respectées.
Pour se faire j'ai réalisé deux outils dans le
cadre de ce travail qui permettent de faire,la prédiction de ces dates
en utilisant des méthodes de machine learning,et de la visualisation
pour faciliter la prise de décision.
En effet avoir une meilleure visibilité des dates
permet une meilleure planification ainsi qu'une meilleure répartition
des tâches des ressources, mais aussi directement impacter la
satisfaction client,car un client qui reçois sa voiture dans les temps
sera plus satisfait.
Par conséquent,des méthodes plus modernes et
plus performantes afin de déterminer toutes les caractéristiques
d'entrée des données que nous avons a notre disposition doivent
être proposées.
Cette étude se concentre sur une approche de Machine
Learning car elle a un potentiel élevé dans ce domaine,ces
méthodes de ML peuvent apprendre à partir de grands ensembles de
données.
Ce rapport est structuré comme suite :
· Chapitre 1 :Le contexte de résolution du
problème
· Chapitre 2 :Je présenterai la
problématique auquel nous faisons face en entreprise.
·
8 Introduction
Amassin NACERDDINE Université Paris 8
Vincennes
Chapitre 3 :Je dresserai un état de l'art de ce qui est
fait dans la littérature.
· Chapitre 4 :Je montrerai ensuite la méthode de
conception que nous adoptons.
· Chapitre 5 :Je vais lister les outils et technologies
utilisé durant le projet ainsi qu'un aperçu du résultat
final.
· Quant à la conclusion, elle dressera les
perspectives et la vue d'ensemble du projet.
9
partie I
Problématique
Table des matières
I Le contexte de résolution du problème
13
I.1 Introduction 14
I.2 Contexte 14
I.3 Contexte Logiciel 14
I.4 Jalonnement adopté 15
I.5 Semaines entre chaque jalon 16
I.6 Indicateurs 17
I.7 Conclusion 17
II Le problème à résoudre
19
II.1 Objectif 20
II.2 Règle 20
II.3 Données 21
II.4 Difficultés rencontrées 24
II.5 Décomposition du problème 24
II.6 Data pre-processing 24
II.7 Conclusion 33
|