Paragraphe 2 : L'analyse économétrique
Un modèle dichotomique est un modèle dans lequel
la variable endogène qualitative ne peut prendre que deux
modalités disjointes. L'objectif de ces modèles est d'expliquer
la survenue ou la non survenue d'un évènement.
Pourquoi ces modèles ?
Pour répondre à cette question, supposons que nous
observons d'une part k variables exogènes continues
(X1, X2, ..., Xk)
et d'autre part une variable exogène
dichotomique codée (yi = 1 ou
yi = 0) sur N individus numérotés de
1 à N. Du fait :
Dynamique de l'achèvement du cycle primaire par les
filles au Bénin Décembre 2006
- de la nature différente des variables de droites
(continues) et de celle de gauche (qualitative dichotomique) ;
- de l'impossibilité d'ajuster de façon
satisfaisante le nuage des points qu'on pourrait associer à une variable
dichotomique qui, par nature, est répartie sur deux droites
parallèles ;
- de la perturbation åi du
modèle qui admet une loi discrète mettant ainsi à
défaut
l'hypothèse de normalité des résidus ;
- de la présence
d'hétéroscédasticité (la matrice de variance
covariance des résidus est fonction des caractéristiques
associées aux variables exogènes Xi et des
paramètres â à priori inconnus) ;
la spécification linéaire par les moindres
carrés ordinaires MCO, yi
= x i â +
åi
n'est plus adaptée à la modélisation des
variables endogènes qualitatives en particulier dichotomiques. C'est
pour cette raison qu'on a recours aux modèles
Logit et Probit. La
particularité de ces modèles est qu'ils admettent pour variable
expliquée la probabilité de réalisation d'un
évènement, conditionnellement aux variables
explicatives. Ainsi, ces modèles s'écrivent :
i ( i i ) (
iâ)
p = Pr ob y =
1 / x = F x
Où F(.)
désigne une fonction de répartition.
- Pour un modèle logit, la fonction de répartition
Ë correspond à la fonction logistique ( ) x
IR
e x
Ë
x = ? ?
1 e x
+
1
- Pour un modèle probit, la fonction de
répartition Ö est celle de la loi normale
x 2
1
centrée réduite définie par : x
IR ( x ) e
du
- u
2
? ? =
, Ö
-82ð
Dynamique de l'achèvement du cycle primaire par les
filles au Bénin Décembre 2006
Les deux modèles donnent généralement des
résultats relativement similaires. En effet, les fonctions de
répartition des lois normales centrées réduites et des
lois logistiques simples ou transformées sont extrêmement proches.
Ainsi, la question du choix entre les deux modèles ne présente
que peu d'importance. Cependant, le modèle logit permet la
simplification des calculs et facilite l'interprétation des
paramètres 8 associés aux variables explicatives
Xi . Pour cette raison, nous avons
retenu de faire nos estimations à l'aide du modèle
logit. L'hypothèse retenue pour les modèles logit est que les
résidus suivent une loi logistique.
> Test de significativité du modèle
et des paramètres
Lorsque l'on procède à l'estimation d'un
modèle, il faut tester d'abord sa significativité et celle de ses
différents paramètres avant de le retenir. Pour apprécier
la significativité du modèle même, nous utiliserons le test
du Rapport de Vraisemblance. Le test consistera à comparer la valeur du
« Probability (LR stat) » à celle du seuil que nous
avons fixé à 5%. Si cette valeur est inférieure à
0,05 alors nous dirons que le modèle obtenu est globalement
significatif. Dans le cas contraire, on conclut que ce n'est pas un bon
modèle
Pour voir la significativité des paramètres du
modèle, nous allons utiliser le test de Wald dont les hypothèses
sont :
H0 :8
j = 0 H1
:8 j ? 0
Où 8j désigne
la ième
jcomposante du vecteur de paramètres
8= (8 1 ,
82 ,
83 ,
84 , 85) du
modèle.
Le logiciel EViews nous propose la statistique Z
j définie comme suit :
Dynamique de l'achèvement du cycle primaire par les
filles au Bénin Décembre 2006
à
Zj
â
= qui suit asymptotiquement une loi normale centrée
réduite N ( 0,1) où
j
à
v jj
vàjj désigne
l'estimateur de la variance de l'estimateur du
coefficientâj .
Au seuil de 5%, t /
P(T -<
t) = 0,975 vaut1,96. Le principe du
test consiste
à accepter l'hypothèse nulle
H0 si
|
Zj
|
-< 1,96 et à rejeter
H0 si
|
Zj
|
>- 1,96
|
.
|
|
|
|
|
|
|
> Qualité globale du modèle
Ici on fait un test qui permet d'évaluer la
qualité globale de l'ajustement par le modèle logit. Après
avoir fixé un seuil de probabilité qui vaut
généralement (0,5), on construit un tableau de contingence
appelé tableau de vérité croisant les prédictions
et les observations réelles de la variable. On calcule alors par la
suite le pourcentage d'observations bien prédites qui donne un
critère de performance du modèle. La limite de ce test est qu'il
est effectué sur le même échantillon que celui
utilisé pour estimer le modèle.
Dynamique de l'achèvement du cycle primaire par les
filles au Bénin Décembre 2006
Dynamique de l'achèvement du cycle primaire par les
filles au Bénin Décembre 2006
|