2.2.1. Analyse de la variance
ANOVA
Tout comme la régression simple,
l'interprétation débute en évaluant la qualité du
modèle.
On vérifie si la première étape du
modèle explique significativement plus de variabilité qu'un
modèle sans prédicteur (VI).
Ensuite, il s'agit de s'assurer que toutes les variables
introduites contribuent à améliorer significativement la
variabilité expliquée par le modèle final.
Le tableau d'ANOVA nous donne cette information. Il nous
permet de déterminer si nous rejetons l'hypothèse nulle
(H0) ou non.
Dans notre exemple, nous voulons savoir dans un premier temps
si les secteurs d'activités prédisent mieux le PIB que ne le
fait un modèle sans prédicteur (avec seulement la moyenne)
L'hypothèse nulle est donc que le modèle est équivalent
à la moyenne du PIB.
Tableau n°4 : Analyse de la variance
ANOVA
|
|
|
|
d.f.
|
SS
|
MS
|
F
|
Valeur p
|
Régression
|
4
|
13864362475267300
|
3466090618816830
|
671546963,232386
|
0
|
Residus
|
26
|
134195166,880796
|
5161352,57233829
|
|
|
Total
|
30
|
13864362609462500
|
|
|
|
On constate à la lecture du tableau que selon la valeur
F obtenue pour les deux modèles, on peut rejeter l'hypothèse
nulle.
En effet, la valeur de 671546963,232386 est significative
à p < 0,05, ce qui indique que nous avons moins de 5 % de chance de
se tromper en affirmant que le modèle contribue à mieux
prédire le PIB que la simple moyenne.
2.2.2. Modèle de
régression statistique
Maintenant que l'on sait que le modèle est
significatif, le tableau récapitulatif des modèles permet de
déterminer la contribution de chaque bloc de variables.
Ce tableau indique le R2 cumulatif à
chaque étape du modèle (colonne R-deux)) ainsi que l'apport
spécifique de chaque bloc (colonne Variation de R-deux).
Tableau n°5 : Régression
statistique
|
|
|
|
R
|
0,999999995160428
|
R-carré
|
0,999999990320856
|
R-carré ajusté
|
0,999999989204031
|
MSE
|
5161352,57233829
|
S
|
2271,86103719798
|
MAPE
|
0,766743259100702
|
Durbin-Watson (DW)
|
1,92255605943497
|
Log de vraisemblance
|
-272,272281784492
|
|
|
Critère d'Akaike (AIC)
|
18,4181521189661
|
AICc
|
18,4694341702482
|
|
|
Critère de Schwarz (BIC)
|
18,6049784365211
|
Critère de Hannan-Quinn (HQC)
|
18,4779194631532
|
|
|
PRESS
|
136462655,507168
|
PRESS RMSE
|
2132,78109133879
|
R-carré prévu
|
0,999999990157308
|
|
|
|
|
|
|
|
Le tableau contient donc plusieurs informations utiles.
Premièrement, la valeur de la corrélation multiple (R) correspond
à l'agglomération des points dans la régression simple.
Elle représente la force de la relation entre la Valeur
Dépendante et la combinaison des Variable indépendante du
modèle. Des valeurs de 0,999999995160428 et 0,999999990320856
suggèrent que les données sont ajustées de
manière très satisfaisante au modèle.
La colonne du test de Durbin-Watson donne aussi des
informations importantes, il n'y a pas de seuil de signification
associé, seulement la valeur de la statistique qui est acceptable
lorsqu'elle se situe entre 1 et 3. Il est convenu que plus la valeur est
près de 2, moins il y a de problème au niveau de
l'indépendance des erreurs. Avec une valeur de 1,92255605943497, nous
pouvons croire que nous respectons cette prémisse.
Enfin, on se rappelle que la valeur du R², lorsqu'elle
est multipliée par 100, indique le pourcentage de variabilité de
la Variable Dépendante expliquée par le modèle (les
prédicteurs). Les résultats suggèrent que 99,9 % du PIB
sont expliqué par les secteurs d'activités.
|