ABSTRACT
The covid-19 crisis quickly went beyond the strictly medical
field to impact all sectors of activity. The "Gabon" system was subjected to a
series of successive major shocks: a health crisis, followed by an economic
crisis. The public health authorities had to take up the challenge of health in
a highly disrupted environment: understanding the present, anticipating the
future, understanding the possible levers of action, and studying scenarios
have become key elements for decision-makers. Modelling and simulation have
thus acquired a new visibility linked to these needs. However, limitations have
appeared in the sole consideration of the dynamics of the epidemic. Other
factors have proved essential: the geographical or spatial dimension. Machine
learning approaches aim to develop models with greater generalisation
capability and prediction reliability for longer time frames.
The aim of this thesis is to explore the application of
Machine Learning to model the COVID-19 pandemic. The aim is to develop a
regression model, based on the "Facebook Prophet" algorithm, to predict the
temporal dynamics of the epidemic in the city of Libreville. Secondly, to
develop a clustering model, based on the K-means algorithm and the geographic
information system (GIS), to determine the risk clusters at the district and
neighbourhood levels. Finally, using an inductive approach, we generalise the
results obtained to all the communes of Libreville, based on data collected at
the University Hospital of Libreville.
Key words: Covid-19- machine learning - Facebook Prophet -
K-means - GIS - Cluster - modelling - simulation- Moran's autocorrelation
test.
SOMMAIRE
DEDICACE
I
EPIGRAPHE
II
REMERCIEMENTS
III
AVANT-PROPOS
IV
RESUME
V
ABSTRACT
VI
SOMMAIRE
VII
TABLE DES ILLUSTRATIONS
VIII
LISTE DES TABLEAUX
X
LISTE DES SIGLES ET ABREVIATIONS
XI
INTRODUCTION GENERALE
1
PREMIERE PARTIE : CONTEXTE GENERAL DE L'ETUDE
2
A. CHAPITRE I : PRESENTATION DE LA STRUCTURE
D'ACCUEIL ET DU SUJET D'ETUDE
3
B. CHAPITRE II : CONCEPTS LIÉS A LA
DYNAMIQUE D'UNE EPIDEMIE
6
C. CHAPITRE III : ETAT DE L'ART DE LA
MODELISATION DES EPIDEMIES
14
DEUXIEME PARTIE : MODELISATION DE LA COVID-19 PAR
UNE APPROCHE MACHINE LEARNING
19
D. CHAPITRE IV : PRESENTATION DU MACHINE
LEARNING
20
E. Chapitre V : démarche Machine
Learning pour la modélisation
25
F. CHAPITRE VI: l'étude de
l'algorithme facebook prophet et conception du modèle de
prédiction
35
TROISIEME PARTIE : REALISATION DU SIMULATEUR
EVAL_EPI
40
G. Chapitre VI : MÉTHODOLOGIE DE
DÉVELOPPEMENT
41
H. Chapitre VII : MISE EN OEUVRE DE LA
SOLUTION
46
QUATRIEME PARTIE : FINALISATION DE LA SOLUTION
66
I. Chapitre VIII : IMPLEMENTATION ET
RESULTATS
67
J. CHAPITRE IX : GESTION DE PROJET ET
BILAN
74
CONCLUSION GÉNÉRALE
78
RÉFÉRENCES BIBLIOGRAPHIQUES
79
ANNEXES
82
TABLE DES ILLUSTRATIONS
Figure 1: Organigramme de l'IAI
2
Figure 2 : la dynamique d'une
épidémie selon le modèle SIR
9
Figure 3: Dynamique temporelle du
modèle SIR, Source: (Avhad, 2020)
9
Figure 4 : Cartographie des cas actif au
Gabon au 17 fevrier 2022 au 19 mai 2022 (COPIL, 2022)
14
Figure 5: diagramme du modèle SEAIRD
(MATONDO MANANGA, 2021)
15
Figure 6: Représentation graphique des
éléments de RdP
16
Figure 7: modèle SVEIR-RDP de LAIMA
17
Figure 8 : Représentation
imagée d'un agent en interaction avec son environnement et les autres
agents, (Ferber, 1995)
18
Figure 9 : Diagramme de classe des
entités COMOKIT (Taillandier, Drogoul, & Gaudou, 2020)
19
figure 10 : branches de l'intelligence
artificielle, (Mohammed, 2019)
22
Figure 11 : cycle de vie du processus
KDD, source : (Swamynathan, 2017)
28
Figure 12 : méthode CRISP-DM,
adapté de (Shearer, 2000)
29
Figure 13 : Capture d'écran des cas
de guérison dans le monde (partiellement)
31
Figure 14 extraction des lignes et colonnes
32
Figure 15 les captures d'écran du
dataset avant et après le nettoyage
33
Figure 16 : partitionnement des données
en données d'entrainement et données de test
33
Figure 17 : les courbes de nombre
cumulés de cas de guérison à Libreville avant et
après le prétraitement
34
Figure 18 : Courbe d'apprentissage du
modèle
40
Figure 19 : code pour tester la
performance du modèle
41
Figure 20 : la courbe de comparaison entre
les valeurs réelles et les valeurs prédites
41
Figure 21 : la schématisation en Y
utilisée pour représenter la méthode de
développement 2TUP, source : Bassim, K.A. et Akaria, R., 2007
45
Figure 22: Les diagrammes d'UML (UMLversion
1.5), source : (Guiochet, 2009)
47
Figure 23 : Diagramme global de cas
d'utilisation
51
Figure 24:Diagramme de cas d'utilisation -
gérer les utilisateurs.
51
Figure 25: Diagramme de cas d'utilisation
« gestion des données »
52
Figure 26 : Diagramme de cas d'utilisation
«Gestion du prétraitement des données »
52
Figure 27 : Diagramme de cas d'utilisation
- Simuler la dynamique spatio-temporelle
53
Figure 28 : Diagramme de cas d'utilisation
- Gérer les indicateurs épidémiologiques.
53
Figure 29: Diagramme de cas d'utilisation -
Gérer des modèles de simulation
54
Figure 30 : Diagramme de cas d'utilisation
- gérer une visualisation
55
Figure 31: diagramme d'activités du cas
d'utilisation «charger les données »
56
Figure 32 : diagramme d'activités
du cas d'utilisation « gestion du prétraitement »
56
Figure 33: diagramme d'activités du cas
d'utilisation «simuler la dynamique épidémique »
57
Figure 34:diagramme d'activités du cas
d'utilisation « calculer un indicateur »
58
Figure 35 : diagramme d'activités
du cas d'utilisation « Visualiser un indicateur »
58
Figure 36 : diagramme d'activités
du cas d'utilisation «ajouter un indicateur»
59
Figure 37 : diagramme d'activités
du cas d'utilisation « modifier un indicateur»
60
Figure 38 : Diagramme de classes
61
Figure 39 : Architecture applicative de
notre solution. (EVAL_EPI)
62
Figure 40 : Architecture logicielle de
notre solution.
65
Figure 41 : Le prototype
général du simulateur EVAL_EPI
66
Figure 42 : Architecture physique de notre
solution.
67
Figure 43 - Interface de RStudio sous
Windows
73
Figure 44- Diagramme de déploiement.
74
Figure 45 : Page d'accueil du logiciel
« EVAL_EPI ».
74
Figure 46 : Capture d'écran d'une
simulation de la dynamique temporelle
75
Figure 47 : Capture d'écran d'une
simulation de la dynamique temporelle
75
|