2.3 Théorie sur l'économétrie des
variables qualitatives
L'économétrie des variables qualitatives est
utilisée pour des modèles dont la variable dépendante est
qualitative et les variables explicatives sont quantitatives, qualitatives ou
une combinaison des deux. Lorsque les modalités de la variable
dépendante comptent deux modalités, on parle de modèle
dichotomique. En fonction de la loi suivie par les résidus du
modèle, on parlera de modèle Probit (s'ils suivent une loi
normale) ou de modèle Logit (s'ils suivent une loi logistique). Nous
présenterons le modèle Logit dichotomique dans cette partie. Le
choix du modèle Logit (modèle introduit comme approximation du
Probit) vient du fait qu'il est simple à mettre en oeuvre et que les
résultats sont presque similaires au modèle Probit (HURLIN,
2003).
Ce modèle servira à évaluer
l'efficacité des mesures de prévention sur le paludisme.
EVALUATION DE L'EFFICACITE DES MOUSTIQUAIRES
IMPREGNEES A LONGUE DUREE D'ACTION SUR LA REDUCTION DU PALUDISME DANS LA
LOCALITE DE
LIBAMBA
Juin
2013
2.3.1 Spécification du modèle
On dispose de n couples de variables aléatoires {(Yi,
Xi), i=1...N} où Yi est une variable qualitative à deux
modalités et Xi un vecteur de k+1 variables quantitatives ou
qualitatives. Supposons Yi la manifestation d'une variable inobservable
continue Yi *, elle même reliée aux variables explicatives Xi. Le
modèle de régression s'écrit :
Yi *= Xif3+ åi
yi
|
si y *
i 1 = 0
i
*
? ? 0 si y=0
i
|
f3 le vecteur des coefficients et åi
le terme de l'erreur.
|
Le modèle Logit s'écrit :
P (y= 1)
i
|
e
|
X' i
|
â ó
|
|
1+
|
e
|
X' i
|
â ó
|
Les résidus åi sont iid
(indépendants et identiquement distribués) de loi logistique, de
fonction de répartition F, de fonction de densité f et de
variance ó 2 .
2.3.2 Interprétation des paramètres
Comme nous l'avons vu lors du calcul des probabilités,
les paramètres estimés ne sont pas les f3 mais plutôt f3/a.
Or dans le modèle Logit (comme le Probit) la variance a2 des
erreurs est inconnue : elle est normalisée à p2/4 dans
le modèle Logit. De ce fait f3 n'est identifiable qu'à 1/a
près. Ainsi le paramètre estimé n'a pas
d'interprétation directe dans la mesure où elle ne correspond pas
aux paramètres de la spécification. La seule information
directement interprétable est le signe des coefficients. Ce signe
indique si la variable associée influence la probabilité à
la hausse ou à la baisse.
Toutefois, pour interpréter l'impact de la variable Xi
sur la probabilité de survenance d'une modalité de Yi, on calcule
les effets marginaux et des odds ratio.
- Les effets marginaux
Ils mesurent la sensibilité de la probabilité
P(yi = m) de l'évènement
y i = m par rapport à la
variation des variables explicatives Xki (la
kème composante de Xi)
ä p y = m
i ) ( ' à ) à = f X b
b
i k
ä X ki
à
bk sont les coefficients de Xki
(
p % =
où les
Rédigé par Hokameto Rodrigue Junior
EDORH, Elève Ingénieur d'Application de la
Statistique, 4ème Année
26
Si Xi est qualitative, l'effet marginal s'obtient en faisant les
différences de probabilité :
p à P ( y 1) ( 1)
ki = = - y =
i ' '
| X 1 i | X 0
ki = ki =
EVALUATION DE L'EFFICACITE DES MOUSTIQUAIRES
IMPREGNEES A LONGUE DUREE D'ACTION SUR LA REDUCTION DU PALUDISME DANS LA
LOCALITE DE
LIBAMBA
Juin
2013
Rédigé par Hokameto Rodrigue Junior
EDORH, Elève Ingénieur d'Application de la
Statistique, 4ème Année
27
Ces formules fournissent des mesures individuelles qu'il faut
compléter par les effets marginaux au point moyen pour répondre a
la question : quel est l'impact moyen de la
variation de Xki d'une unité ?
L'effet marginal au point moyen dans le cas d'une variable
qualitative Xk est donné par :
p à P ( y 1) ( 1)
k = = - y =
i ' '
| X 1 i | X 0
k = k =
|