Analyse de la vulnérabilité de la santé de la femme: cas du cameroun( Télécharger le fichier original )par Monde MAMBIMONGO WANGOU Institut Sous-régional de Statistique et d'Economie Appliquée (ISSEA) - Ingénieur Statisticien 2009 |
4.1.4.3 : Evaluation du pouvoir discriminant du modèleLa modélisation de la probabilité de réalisation des différents attributs de la variable d'intérêt (mauvaise santé ou non) à partir de certaines co-variables fournit des probabilités estimées pour chaque observation. En utilisant ces probabilités, on peut se fixer un seuil pour pouvoir classer les individus dans la catégorie 1 si la probabilité estimée est supérieure au seuil et dans la catégorie 0 sinon. Etant donné que la proportion est un estimateur sans biais de la probabilité dans le cas d'un grand échantillon, nous choisissons de fixer le seuil à 5%. Ainsi toutes les femmes dont les probabilités estimées sont supérieures à ce seuil sont considérées comme en mauvaise santé par le modèle. Nous allons utiliser la notion de spécificité et de sensibilité30(*) pour juger de la performance du classement effectué à partir de ce seuil. La lecture du tableau suivant présente le classement effectué par le modèle au seuil fixé. Tableau 19: Résultats du classement des observations
Source: MICS 2006 et nos calculs A partir de ce tableau, on constate que la sensibilité du modèle est égale à 57,26%. Tandis que la spécificité est située à 65%. Le modèle prédit mieux les femmes qui n'ont pas subi le phénomène (être malade pendant au moins 3 mois au cours des 12 derniers mois) que celles qui l'ont subi. Dans l'ensemble, le modèle fournit 65,26% de bonnes réponses. Etant donné que la spécificité et la sensibilité varient en fonction du seuil. On peut utiliser la courbe ROC31(*) comme indicateur de la capacité du modèle à discriminer. Ainsi la visualisation de la courbe suivante montre que le modèle proposé est acceptable car la valeur du ROC est supérieure à 70%. Graphique 5: la courbe ROC relative à l'estimation Source : MICS 2006 et nos calculs Le diagnostic du modèle a montré que certaines observations sont mal ajustées au modèle mais qu'aucune d'entre elles n'influence significativement les coefficients de l'estimation. Le modèle donne environ 65 bonnes réponses sur 100. En somme, le modèle ainsi proposé est acceptable et peut ainsi être utilisé pour l'extrapolation des résultats à l'ensemble de la population étudiée (les camerounaises âgées de 18 à 49 ans). * 30 La sensibilité (respectivement spécificité) peut se définir comme la probabilité de classer l'individu dans la catégorie y=1 (respectivement y=0) étant donné qu'il est effectivement observé comme tel. * 31 Si l'aire ROC=0,5 on dit qu'il n'ya pas discrimination. Quand elle est située entre 0,7 et 0,8, on dit que la discrimination est acceptable. La discrimination est qualifiée d'excellente si l'aire ROC est comprise entre 0,8 et 0,9 puis exceptionnelle si l'aire ROC est supérieure à 0,9. |
|