4.5.1 Spécification du modèle logistique
Formulation du modèle
Il s'agit de choisir un modèle nous permettant de
rechercher les facteurs explicatifs qui prédisposent un enfant à
la vulnérabilité. Pour un modèle de régression dont
la variable dépendante est dichotomique, il existe deux approches pour
développer un tel modèle : le modèle logit et le
modèle probit .
Ce sont les fonctions de distribution cumulative qui font la
différence entre ces deux modèles. Tandis que le logit utilise
une fonction de distribution cumulative logistique, le probit utilise une
fonction cumulative normale. Il a été démontré que
ces deux modèles produisent des résultats identiques, le choix du
logistique dans de nombreuses études réside surtout dans sa
simplicité mathématique.
La formulation du modèle sur les déterminants de
la vulnérabilité se fait selon la classe d'apppartenance de
l'enfant à un groupe vulnérable, la variable expliquée du
modèle prend la valeur (Y, = 1) si l'enfant fait partie du groupe
concerné et (Y, = 0) sinon.
Le modèle logit (DAMODAR (N. Gujarati), 2004) que nous
utiliserons se présente sous la forme générale
ci-après :
11), = F {(17, = 11X)}
désigne la probabilité conditionnelle d'être
vulnérable pour le i-ème enfant connaissant l'ensemble des
valeurs du paramètre X.
- X = (1, X1, ..., Xk) est une
matrice où chaque Xk est un facteur de
vulnérabilité auquel les enfants se trouvent exposés ;
- Soit A = (A0, ..., Ak), le vecteur des
paramètres du modèle ;
Pi
= expA*X
- pi
est appelé odds ratio et correspond au risque relatif en
faveur de l'appartenance de l'enfant au groupe des enfants vulnérables
;
Le logit est donc :
log (119--pi) = Ao + *
Xj + Et
j=1
Ce sont les paramètres du modèle qui seront
estimés. 6 est le vecteur des erreurs, qui suit une loi
normale. La fonction de distribution logistique étant F(x) =
1/(1 + exp(--x)).
Aide à l'interprétation
Le plus important est l'interprétation des
résultats de ce modèle. Ce sont le signes des paramètres
ou coefficients du modèle qui sont interprétables. Pour une
modalité donnée, si le signe est négatif, cela signifie
que la variable diminue la probabilité d'être vulnérable.
Par contre, si le signe est positif cela signifie que cette modalité
augmente la probabilité d'être vulnérable. La
qualité du modèle estimée sera évaluée
à partir du test de spécification du modèle et de la
log-vraisemblance. En plus le modèle sera globalement significatif si la
valeur du test de Khi-deux est inférieure au seuil fixé (nous
avons choisi 5%).
|