16. Modélisation : Choix de
l'algorithme d'entrainement.
Pour ce faire il plusieurs méthodes parmi les lequel
la sélection du modèle par la revue systématique de la
littérature ou la méthode expérimentale avec comparaison
des performances des modèles. Dans le cadre de ce mémoire nous
avons opté pour la revue systématique de la
littérature.
D'abord le chef-ouvre de Zenah ALZUBAIDI, consignés
dans leurs travaux de recherche pour le mémoire de Master de Institut de
technologie de Rochester de Dubaï, sur le thème : «A
Comparative Study on Statistical and Machine Learning Forecasting
». Elle a procédé à une étude
comparative des modèles de prédictions les plus usuelles et a
établi les avantages et les inconvénients de ces modèles
qui sont résumés dans le tableau 7 suivant :
Tableau 7: comparaison de
modèle de Machine Learning la prédiction des séries
temporelles
Avantages et inconvénients des
prévisions du modèle S/ARIMAAvantagesIncontinentsPeut
gérer les composants de tendance et de saisonnalitéSuppose que la
série chronologique ne contient pas d'anomaliesPrévisions
impartiales et niveaux de confiance réalistesLes paramètres du
modèle et le terme d'erreur sont constantsAvantages et
inconvénients des prévisions du modèle
FBPAvantages Incontinents Robuste aux points de données
manquants et aux valeurs aberrantesLes modèles multiplicatifs ne peuvent
pas être utilisés dans le prophètePrend en compte les
effets de vacancesRéglage manuellement pour des données à
saisonnalité multiple Avantages et inconvénients des
prévisions du modèle LSTMAvantages Incontinents Capable
d'apprendre la saisonnalité et les oscillations dans les données
nécessite une grande quantité de données historiques pour
créer de prédiction fiable Utile pour les données
séquentiellesNécessite une Grande capacité mémoire
de calcul nécessaire.
|
Source:(ALZUBAIDI, 2020)
En effet une bonne partie des travaux de prédiction de
la covid-19 à l'aide du modèle de Facebook Prophet ont
donné des résultats satisfaisants. Parmi ceux travaux trois
méritent d'êtrecités ici.
· D'abord les travaux du Dr Zahra Taheride
l'université de Téhéran, dans l'article intitulé
« Spread Visualization and Prediction of the Novel Coronavirus
Disease COVID-19 Using Machine Learning »où elle a
testé une dizaine de modèle de Machine Learning sur des
données de la Covid-19 provenant de l'Université de Johns
Hopkins. Elle est parvenu à la conclusion suivante : sur l'ensemble
de données de la covid-19, Facebook Prophet avait en moyen un temps
d'exécution plus faible et une bonne performance par aux autres
modèle comme ARIMA.
· Ensuite les travaux de BOULEKCHER Rachida et KABOUR
Oussama, consignés dans leurs travaux de recherche pour le
mémoire de Master, sur le thème : « Une approche
basée Machine Learning pour la prédiction du Covid-19 en
Algérie ». Ils ont réussi a montré que le
modèle FacebookProphet était plus performant et plus
adapté que le modèle ARIMA, pour la prédiction de la
Covid-19, selon la métrique R2-score (tableau 8).
Tableau 8 : Performances de
Prophet et de ARIMA selon la metrique R2-score
|
Prophet
|
ARIMA
|
Cas confirmées en Algérie au 23/04/2021
|
0.904
|
0.846
|
Source : (BOULEKCHER & KABOUR, 2021)
Enfin les travaux de Arnau Gispert BECERRA,
consignés dans ses travaux de recherche pour le mémoire de
« bachelor's degree in telecommunications technologies and
services engineering », sur le thème : «Time
series forecasting using SARIMA and SANN models». Où il a pu
montrer que sur un dataset de 1000 entrées, le modèleFacebook
Prophet (FBP)était 7 sept fois plus rapide que le modèle SARIMA
et 40 fois plus rapide que le modèle LTSM (voir le tableau 9).
Tableau 9:récapitulatif
des paramètres de performance de prévision
Modèle
|
Temps d'exécution en seconde
|
Erreur moyenne absolue (MAE)
|
Erreur quadratique moyenne (RMSE)
|
ARIMA saisonnier
|
7,962
|
0,721
|
0,965
|
LSTM
|
43,912
|
0,906
|
1,172
|
prophète
|
1,992
|
0,640
|
0.802
|
Source: (Becerra, 2021)
On peut retenir de cette revue de la littérature que
Prophet s'efforce de fournir un modèle simple à utiliser et
suffisamment sophistiqué pour fournir des résultats
significatifs. La robustesse, la facilité de configuration et la
rapidité d'installation de Prophet attirent les non-experts et les
utilisateurs ayant des connaissances statistiques limitées pour
déployer Prophet au sein de leur organisation.
Au final nous avons choisi l'algorithme facebook prophet pour
concevoir le modèle de prédiction proposée. En
effet :
· Prophet est fort dans le traitement des données
manquantes, capturant les changements de tendance et les grandes valeurs
aberrantes.
· Prophet arrive à une estimation raisonnable des
données mixtes sans effort manuel.
· Prophet est optimisé pour les prévisions
commerciales observées sur le réseau socialFacebook.
a) Évaluation et validation
A la fin de cette phase, une décision sur
l'utilité des résultats des modèles de Machine Learning
conçus doit être prise. Pour ce faire, nous allons évaluer
les métriques du modèle. Pour le modèle de Facebook
Prophet, nous allons utiliser comme métrique le Rscore2 et le RMSE (voir
le chapitre suivant).
|