![]() |
Facteurs explicatifs de l'inadequation professionnellepar Espoir LUKAU MATEZO Institut supérieur de statistique de Kinshasa - Licence en statistique / production et analyse des données 2016 |
2.2.3.5. Méthode d'estimation de la régression logistique binaireL'estimation du modèle logistique binaire se fait avec la méthode de maximum de vraisemblance car la relation entre la moyenne de Y et les paramètres des variables explicatives n'est pas linéaire35(*). La méthode du maximum de vraisemblance permet de calculer la probabilité P de réalisation de l'événement dans chaque groupe d'individus par rapport à un autre groupe retenu comme groupe de référence. · Pour effectuer l'estimation, nous disposons d'un
échantillon · P (Y=1) (respectivement P (Y=0) est la probabilité à priori pour que Y=1(respectivement Y=0). Pour simplifier, nous écrirons P(1) (respectivement P(0)). · P(X/1) (respectivement P(X/0)) est la distribution conditionnelle des X sachant la valeur prise par Y ; Enfin, la probabilité a posteriori d'obtenir la modalité 1 de Y (respectivement 0) sachant la valeur prise par X est représentée par P(1/X) (respectivement P(0/X) 2.2.3.6. Interprétation des coefficientsL'un des succès des modèles logistiques est que les coefficients peuvent s'interpréter comme des rapports de cotes ou odds ratio (OR). Les résultats des modèles peuvent être présentés sous forme de coefficients â ou sous forme d'odds ratios. Si les résultats sont présentés sous formes de coefficients â et qu'on voudrait retrouver les odds ratios, il suffit de calculer « exp(â) ». Et à l'inverse, si l'on veut passer de l'OR au coefficient â, il suffit de calculer « ln(OR) » Selon le logiciel statistique utilisé, il est possible d'avoir directement soit les coefficients â, soit les odds ratios. Il faudra donc bien spécifier le type de résultats que l'on désire. Rappelons que le modèle logit est en fait une fonction multiplicative : Les effets additifs au niveau des logits sont multiplicatifs au niveau des odds36(*). Nous allons voir en détails comment interpréter les odds ratios en tenant compte de la modalité de référence choisie. Lorsque le résultat d'une modalité affiche un OR de 2, cela signifie, sur base de la fonction multiplicative, que cette modalité est deux fois plus susceptible de connaître l'événement étudié que la modalité de référence (qui a OR=1). En revanche, si on a un OR=0,5, cela signifie que la modalité concernée est deux fois moins susceptible de connaître l'événement étudié que la modalité de référence. En fait en dessous de 1, il faut penser à diviser pour retrouver le nombre de fois que la modalité est moins susceptible de connaitre l'événement. En gros, les résultats en termes d'odds ratio s'interprètent en « nombre de fois ». Lorsque les résultats se présentent sous forme de coefficients â, l'interprétation se fait suivant le principe additif par comparaison à la modalité de référence qui est égal à 0. Si l'on reprend le cas ci-dessus, un OR de 2 correspond à un coefficient â=0,6931. Tandis qu'un OR=0,5 correspond à un coefficient â=-0,6931. Contrairement aux OR, les coefficients â admettent des valeurs négatives ; ce qui permet parfois de bien visualiser le sens de la relation entre les modalités d'une variable donnée par rapport à la modalité de référence en ce qui concerne l'influence de la variable sur le phénomène étudié. Les valeurs positives des coefficients â correspondent à des OR supérieurs à 1, tandis que les valeurs négatives correspondent à des OR inférieurs à 1. * 35Albert Phongi, cours de questions approfondies de statistique L1 UPN, page 33 * 36 Albert Phongi..... |
|