c) Évaluation d'un modèle en Machine
Learning
L'évaluation permet de tester le modèle par
rapport à des données qui n'ont jamais été
utilisées pour l'entrainement. Cela permet de voir comment le
modèle pourrait fonctionner par rapport à des données
qu'il n'a pas encore vues. Ceci est censé être
représentatif de la façon dont le modèle pourrait
fonctionner dans le monde réel. Il existe plusieurs méthodes pour
calculer le score de chaque algorithme pour ensuite choisir le meilleur pour la
prédiction. Voici quelques méthodes de calcul du score.
(1) Score R-carré (R²)
Le R-carré est appelé coefficient de
détermination. C'est un indicateur utilisé en statistiques pour
juger de la qualité d'une régression linéaire.
Mathématiquement, il s'agit de la proportion de la variance d'une
variable dépendante qui s'explique par une ou plusieurs variables
indépendantes dans le modèle de régression. On l'exprime
soit entre 0 et 1, soit en pourcentage. Le R² se calcule à partir
de la formule suivante :
![](Evaluation-de-la-dynamique-spatio-temporelle-de-levolution-de-la-covid-a-Libreville-par-une-appr31.png)
Avec :
· yi la valeur du point i,
· yi la valeur prédite pour le point i
par la régression linéaire,
· ? la moyenne empirique des points donnés.
(2) Erreur quadratique moyenne ou le
« Root Mean Square Error » (RMSE)
L'erreur quadratique moyenne d'un estimateur F d'un
paramètre O de dimension 1 est une mesure caractérisant la «
précision » de cet estimateur. Elle est plus souvent appelée
« erreur quadratique » (« moyenne » étant
sous-entendu) ; elle est parfois appelée aussi « risque quadratique
». L'erreur quadratique moyenne est définie via l'équation
mathématique :
![](Evaluation-de-la-dynamique-spatio-temporelle-de-levolution-de-la-covid-a-Libreville-par-une-appr32.png)
Où
· Fi = les valeurs de la prévision du
paramètre en question
· Oi = la valeur de vérification
correspondante
· N = le nombre de points de vérification dans la
zone de vérification
|