WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Facteurs explicatifs de l'inadequation professionnelle


par Espoir LUKAU MATEZO
Institut supérieur de statistique de Kinshasa - Licence en statistique / production et analyse des données 2016
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

2.2.3.2. Signification des prédicteurs et interprétation des rapports de cotes

Il s'agit d'observer quelles variables ont été inclues dans l'équation et d'examiner ensuite lesquelles sont significatives. Lorsque tel est le cas, c'est-à-dire que les coefficients de Wald sont significatifs, on procède à l'interprétation des rapports de cotes (ou «odds ratio») qui se situent dans la case Exp(B).

Les rapports de cotes correspondent au nombre de fois d'appartenance à un groupe lorsque la valeur du prédicteur estmultiplié de 1. Plus précisément, un rapport de cote plus grand que 1 indique une multiplication des chances de faire partie du groupe qui connait l'évènement étudié, tandis qu'un rapport de cote inférieur à 1 (modalité de référence) divise les probabilités d'appartenance à ce groupe34(*)par rapport à la modalité de référence.

2.2.3.3. Principes et propriétés de la régression logistique binaire

Lorsque nous voulons modéliser une variable à réponse binaire, la forme de la relation est souvent non linéaire. On recourt alors à une fonction non-linéaire, de type logistique par exemple, en pareils cas. Le principe de la régression logistique binaire est de considérer une variable à prévoir binaire (variable cible admettant uniquement deux modalités possibles) Y = {0,1} d'une part, et p variables explicatives notées X = (X1, X2, ..., Xp),  continues, binaires ou qualitatives.

L'objectif de la régression logistique est de modéliser l'espérance conditionnelle E (Y/X=x), par l'estimation d'une valeur moyenne de Y pour toute valeur de X. Pour une valeur Y valant 0 ou 1 (loi de Bernoulli), cette valeur moyenne est la probabilité que Y=1.

On a donc :

E (Y/X=x) = Prob (Y=1/X=x)

La propriété principale de la régression logistique est qu'elle n'exige pas que les prédicteurs (variables indépendantes) suivent une loi normale, ou soient distribués de façon linéaire, ou encore qu'ils possèdent une variance égale entre chaque groupe. La fonction logistique est donnée sous la forme :

E(Y) = pi = prob (Y=1/X=x)

En fait, en cherchant à expliquer la probabilité de réalisation de l'évènement Prob(Y=1/X=x), il nous faudrait une transformation de E(Y) qui étende l'intervalle de définition [0,1]. C'est le calcul des ratios de chance « odds ratio » qui permet d'envisager cette transformation. Ainsi le quotient pi / (1-pi)est appelé « odds », et la fonction f(p)=ln (pi/1-pi) est appelée « logit ».

2.2.3.4.Odds et odds-ratio

Le succès de la régression logistique est en partie dû aux capacités d'interprétabilité du modèle. On définit par odds le rapport : Odds= pi/1-pi qui représente combien de fois on a plus de chance d'avoir Y=1 au lieu de Y=0 lorsque X=x.

On définit de même les odds-ratio (OR) par le rapport : OR (xi, xp) =odds (xi)/odds qui représente combien de fois on a plus de chance d'avoir Y=1 au lieu d'avoir Y=0 lorsque X=xi au lieu de X=xp.Concrètement, on calcule l'odds ratio de la manière suivante :

Le fonctionnement consiste à calculer des coefficients de régression de façon itérative. En d'autres termes, le programme informatique, à partir de certaines valeurs de départ pour Y=0 et Y=1, vérifiera si les logs chances (odds-ratios) estimés sont bien ajustés aux données, corrigera les coefficients, réexaminera le bon ajustement des valeurs estimées, jusqu'à ce qu'aucune correction ne puisse atteindre un meilleur résultat (Howell, 1998).

Sous ce rapport, le modèle logistique défini précédemment peut être utilisé pour :

· décrire la nature de la relation entre la probabilité espérée d'un succès pour la variable et une variable explicative X;

· prédire la probabilité espérée d'un succès étant donné la valeur de la variable X.

* 34Albert Phongi., cours de questions approfondies de statistique L1 UPN, page 36

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Et il n'est rien de plus beau que l'instant qui précède le voyage, l'instant ou l'horizon de demain vient nous rendre visite et nous dire ses promesses"   Milan Kundera