2.1. Présentation du modèle et des variables
du modèle
En statistique, l'analyse explicative de données
consiste à expliquer une variable d'intérêt Y (variable
dépendante) par plusieurs variables explicatives x1, x2, x3, .... xn.
Faire une analyse deux à deux dans ce contexte s'avère
limité puis qu'elle ne permet pas de prendre en compte l'effet
combiné des variables. Cependant, la méthode à utiliser
dépend de la nature de la variable Y et aussi de la nature des variables
explicatives x1, x2, x3, .... xn. Dans notre cas ici, en plus que notre
variable dépendante est qualitative dichotomique, presque toutes nos
variables explicatives sont aussi qualitatives (à la différence
de l'âge). Ainsi le modèle logistique simple est une
méthode adaptée pour l'estimation. Le modèle logistique
simple est utilisé lorsque la variable Y à modéliser est
qualitative dichotomique, comportant la modalité 1 si le
phénomène à étudier est observé et 0 sinon.
Dans cette situation, au lieu de modéliser directement la
probabilité P (qui est à valeurs dans [0,1]), on utilise
une fonction de lien g à valeurs dans R. Cela fait
référence à la famille des modèles linéaires
généralisés dont l'expression s'écrit :
g (P(??=1/
??=??))=??f3 Où X désigne le vecteur
des variables explicatives, f3 le vecteur des coefficients dans la
partie linéaire et g la fonction de lien.
Le choix de la fonction de lien dépend de la nature de la
variable Y. Lorsqu'elle
est dichotomique, la fonction logit définie par g(x)=ln
??(??)
1-??(??) est souvent indiquée.
37
Le modèle devient donc :
ln ??(??)
1-??(??)
|
= ???? d`où p(x) = ??xâ
1+??xâ avec p(x) = P(Y=1 /X=x).
|
L`estimation des paramètres se fait par la
méthode du maximum de vraisemblance, et plusieurs logiciels statistiques
permettent d'accomplir cette tâche.
Les effets marginaux notés dy/dx qui mesurent la
variation de la probabilité que Y soit 1 pour une variation dx d`un
régresseur x donné seront utilisés pour
l`interprétation. La formule de l`effet marginal d`une variable ???? est
donnée par :
? Cas où ???? est une variable
quantitative
??????
??
dx??
|
??????â
(1+??????â)2 ??j
|
? Cas où ???? est une variable
qualitative (on parle d'effet discret)
??????
??
dx??
|
= P (Y=1/ Xj+1) - P (Y=1 / Xj)
|
Dans notre contexte, la variable dépendante est «
Statut socioprofessionnel » prenant la valeur 1 si la personne est
chômeur et 0 sinon. Les variables explicatives retenues dans notre
modèle sont celles que l'analyse descriptive (analyse bivariée et
l'analyse multidimensionnelle) a suggéré comme ayant de lien de
causalité avec notre variable dépendante. Il s'agit de : «
âge », « milieu de résidence » et «
Diplôme le plus élevé obtenu ».
38
|