2.7.2.2 La qualité d'ajustement du modèle :
la probabilité log
Comme pour la régression linéaire, l'objectif de
la régression logistique est que la variable ajoutée au
modèle permette plus efficacement de prédire l'appartenance au
groupe que ne le fait le modèle initial (sans prédicateur). La
probabilité log (log likelihood), qui s'apparente à la somme des
carrés résiduelle (SCR), permet de comparer la valeur
observée et prédite pour une personne et ainsi d'évaluer
le degré d'imprécision du modèle. Cette probabilité
indique quelle proportion de variance il reste à expliquer après
avoir intégré le prédicateur au modèle. Lorsque la
valeur de la probabilité log reste élevée, le
modèle est peu ajusté aux données, puisqu'il demeure
beaucoup de variance à expliquer. La signification de la diminution de
la probabilité log est évaluée dans une distribution
÷2. La statistique ÷2 remplit donc le
même rôle que la valeur F et nous indique si le modèle est
significatif.
Les éléments régulièrement
utilisé pour la qualité d'ajustement du modèle logit ou
probit sont les suivantes :
70
Ononino Jean Charles
Le rapport de vraisemblance (likelihood-ratio, LR) : cette
variable contribue à la qualité de l'ajustement. La statistique
conditionnelle : il s'agit d'un critère moins exigeant que le LR, donc
il est préférable de prioriser le 1er. La statistique
Wald : cette fois, le logiciel retire toutes les variables pour lesquelles la
statistique Wald est inférieure à 0,1. Cette méthode peut
être utilisée avec un petit échantillon. Sinon, il est
préférable de privilégier le LR.
2.7.2.3. Autres outils : le Chi2 de Qualité
d'Ajustement
Les degrés de liberté du
Chi2 sont égaux à la différence entre
le nombre de paramètres du modèle nul et du modèle
ajusté ; ainsi, le nombre de degrés de liberté est
égal au nombre de variables indépendantes dans la
régression logit ou probit. Si le niveau p associé
à ce Chi2 est significatif, nous pouvons dire que le
modèle estimé produit significativement un meilleur ajustement
des données que le modèle nul, c'est-à-dire que les
paramètres de régression sont statistiquement significatifs.
Y i
2.7.2.4. Odds ratio dans un modèle logit
Dans le cadre d'un modèle logistique,
généralement on ne présente pas les coefficients
du modèle mais leur valeur exponentielle, cette dernière
correspondant en effet à des odds ratio, également
appelés rapports des cotes. L'odds ratio diffère du
risque relatif. Cependant son interprétation est similaire.
Un odds ratio de 1 signifie l'absence d'effet. Un odds ratio
largement supérieur à 1 correspond à une augmentation
du phénomène étudié et un odds ratio
largement inférieur à 1 correspond à une diminution
du phénomène étudié. Pour savoir si un odds
ratio diffère significativement de 1 (ce qui est identique au fait
que le coefficient soit différent de 0), on pourra se
référer à la colonne Pr (>|z|).
NB : il est bon de noter que les différents logiciels
utiliser pour fournir les résultats par les sorties de machines
vérifient automatiquement tous ces critères
X1i
|