4.2 Diagnostic du modèle
Ici, il est question de d'etecter et de traiter les
observations pouvant influencer les coefficients du modèle de
facon significative. Plus sp'ecifiquement, dans l'objectif d'obtenir
un bon ajustement, nous devons rep'erer les observations qui influencent sur la
validit'e du modèle et par cons'equent, qui biaisent les analyses.
Une plus grande attention est accord'ee sur les observations
jug'ees trop 'eloign'ees du nuage de point. Il s'agit des outliers (pour les
observations qui ne suivent pas le mouvement g'en'eral des autres observations
de la s'erie) et des leverage (pour des observations qui ont un effet de levier
important sur l'estimation du modèle). Les résidus de Pearson, la
distance de Cook et le Dbeta sont les principaux indicateurs utilis'es.
4.2.1 Description des principaux indicateurs
Le résidu de Pearson
Il s'agit du r'esidu ri qui permet de mesurer l'efficacit'e de
bpi = F(Xi bâ) comme estimateur de Yi. Mais, l'incertitude
li'ee a` la loi de ri contraint d'utiliser les r'esidus de Pearson
~ > 2.
standardis'es rstd
i . On parle d'outlier lorsque ~rstd
i
Le Dbeta et distance de cook
Le Dbeta est une statistique permettant de mesurer l'influence
d'une observation sur le coefficient de r'egression, notamment la variation du
signe ou de la valeur des coefficients si elle est retir'ee de la base. En
pratique, l'on suspecte les observations dont la valeur absolue du Dbeta est
sup'erieure a`2 vn. Pour ce qui est
de la distance de cook, une observation est int'eressante lorsque sa distance
de Cook est inf'erieure a` l'unit'e.
Th`eme : Mesures et déterminants de la confiance
des ménages sur la situation économique au Cameroun : Cas de la
ville de Yaoundé.
TAB. 4.11 - Récapitulatif du diagnostic du
modèle
INDICATEURS
|
VALEUR AVANT DIAGNOSTIC
|
VALEUR APRES DIAGNOSTIC
|
DIFFERENCE
|
Nombres d'observations
|
2433
|
2390
|
-43
|
Nombre de covariate pattern
|
2274
|
2240
|
-34
|
Hosmer et Lemeshow
|
2 (prob=0,9)
|
4,67 (prob=0,7920)
|
2,67
|
AIC
|
3184,27
|
3080,963
|
-103,307
|
BIC
|
3387,161
|
3265,893
|
-121,268
|
Log pseudo likelihood
|
-1557,1351
|
-1508,4817
|
48,6534
|
pseudo R2
|
0,0652
|
0,0772
|
0,012
|
Sensibilité
|
80,51%
|
80,25%
|
-0,26%
|
Spécificité
|
41,78%
|
42,50%
|
0,28%
|
Taux de bon classement
|
63,67%
|
63,93%
|
0,26%
|
Surface de ROC
|
0,6635
|
0,6742
|
0,0107
|
LR chi2
|
217,16
|
252,22
|
35,06
|
chi2 Pearson
|
2293,70
|
2230,38
|
-63,32
|
Source : Nos calculs sur STATA, a` partir de ICMY, ISSEA 2010
4.2.2 Résultats du diagnostic
Après diagnostic du modèle, nous avons
relevé43 valeurs suspectes. Comme nous pouvons le voir sur le tableau
ci-dessus, le modèle s'est globalement amélioré. Ce qui
traduit un effet positif du diagnostic effectué
|