Annexe D : Résultat de
la régression logistique
Tableau D.2 : Pouvoir
prédictif du modèle logit évaluant l'effet des variables
explicatifs retenues sur la survenance d'une grossesse chez les adolescentes
issues des ménages « Pauvres ». (au seuil
de 0.26 )
Classement
|
Enceinte
|
Pas enceinte
|
Prédits
|
Enceinte
|
179
|
269
|
448
|
Pas enceinte
|
38
|
363
|
401
|
Observé
|
217
|
632
|
849
|
Bon classement
|
|
63,84 %
|
Tableau D.3 : Pouvoir
prédictif du modèle logit évaluant l'effet des variables
explicatifs retenues sur la survenance d'une grossesse chez les adolescentes
issues des ménages « Non pauvres »
(au seuil de 0.18)
Classement
|
Enceinte
|
Pas enceinte
|
Prédits
|
Enceinte
|
91
|
145
|
236
|
Pas enceinte
|
21
|
365
|
386
|
Observé
|
112
|
510
|
622
|
Bon classement
|
|
73,31 %
|
Figure D.1 : Courbe ROC de
qualité de précision du modèle logit évaluant
l'effet des variables explicatifs retenues sur la survenance d'une grossesse
chez les adolescentes issues des ménages « pauvres »
Figure D.2 : Courbe ROC de
qualité de précision du modèle logit évaluant
l'effet des variables explicatifs retenues sur la survenance d'une grossesse
chez les adolescentes issues des ménages « non
pauvres »
Annexe E : Compléments
sur les notions utilisées
Encadré E.1 :
Présentation de l'AFC
L'analyse des correspondances binaires (ACORBI) ou analyse
factorielle des correspondances (AFC) permet d'étudier la
dépendance de 2 variables qualitatives. Elle est basée sur une
décomposition du Chi-Deux de contingence. Elle s'applique par excellence
aux tableaux de contingence (dits aussi tableaux de dépendance ou
tableaux croisés) formés d'individus décrits par 2
caractères qualitatifs. Une AFC sur un tableau de contingence se
justifie si : (i) on est intéressé par l'analyse des relations
entre les catégories de l'une et l'autre variable (ii) on dispose au
moins 3 modalités par variable et suffisamment bien remplies (par
regroupement au besoin)
· L'AFC est simultanément une analyse des
profils-lignes et des profils-colonnes. La métrique utilisée pour
mesurer la proximité entre deux individus est la distance du Chi-Deux.
L'objectif de l'AFC est de résumer et de décrire les liens entre
les profils-lignes et les profils-colonnes puis mettre en relief les
proximités entre les profils- lignes, entre profils-colonnes et la
nature de la liaison entre les lignes et les colonnes ;
· La qualité globale de la représentation
du nuage initial par le sous-espace de dimension q [] est mesurée par le
pourcentage d'inertie pris en compte par les q premiers axes factoriels
définissant ce sous-espaces non corrélés. Cela signifie
que la valeur de l'inertie totale (somme des valeurs propres) est un indicateur
de la dispersion du nuage et mesure la liaison entre 2 variables A et B, et
avant toute interprétation, il faut s'assurer que le dans la table de
contingence est suffisamment grand et supérieur au point critique pour
que la liaison entre les deux variables qualitatives A et B soit jugée
significative. C'est seulement dans une telle circonstance qu'exhiber l'AFC
interviendra utilement, pour décrire cette dépendance entre
lignes et colonnes du tableau de contingence ; On rappelle que,
avec : : effectif observé ; : effectif
théorique d'indépendance ; i = 1,...,n ; j = 1,...,p et
k : l'effectif total de la table de contingence.
Source :
Cléophas Ondo, Cours analyse des données, IAS 3,
ISSEA-2008/2009 ; LEBART L. et al (1994)
Encadré E.2 : Indices
d'aide à l'interprétation en ACM
La contribution relative d'un axe à un
individu : elle représente la qualité de la
représentation d'un individu par le sous-espace qui ajuste le nuage
initial. Elle se mesure par l'indice CO2 ; le cosinus carré de
l'angle formé par l'individu i et l'axe factoriel. Si CO2 est proche de
1, l'individu est bien représenté sur cet axe, si au contraire
CO2 est proche de 0, l'individu i est très mal représenté
sur cet axe. On peut généraliser cette notion en passant d'un
axe à un sous-espace généré par les q premiers axes
factoriels.
? La contribution relative du sous-espace
généré par les q premiers axes factoriels :
elle est désignée par QLT. Si un point est bien
représenté sur un sous-espace à q dimensions
(c'est-à-dire,), on en déduira qu'il est inutile de chercher
à améliorer la représentation de ce point par la prise en
compte d'autres axes factoriels ;
? La contribution relative d'un individu à un
axe : on dispose pour la mesurer d'un indice
désigné CTR. La somme des CTR vaut 1 et une modalité est
d'autant plus importante dans la construction du ième axe factoriel que
son CTR est élevée ;
Remarques
? La faible part de la variance (inertie) expliquée sur
les premiers axes est une caractéristique de l'ACM qui donne
généralement des mesures pessimistes de l'information
extraite ;
? L'ACM présente une propriété
particulière redevable à la nature même du tableau
disjonctif complet. En effet, elle met en évidence des types d'individus
ayant des profils semblables quant aux attributs choisis ;
? On exprime : (i) la proximité entre individus en
terme de ressemblances : deux individus se ressemblent s'ils ont choisi
globalement les mêmes modalités ; (ii) la proximité
entre modalités de variables différentes en terme d'association :
ces modalités sont proches si elles concernent globalement les
mêmes individus (individus semblables) ; (iii) la proximité
entre 2 modalités d'une même variable en terme de ressemblance :
par construction, les modalités d'une même variable s'excluent et
si elles sont proches, cette proximité s'interprète en terme de
ressemblance entre les groupes d'individus qui les ont choisies
(vis-à-vis d'autres variables actives de l'analyse) ;
? L'inertie totale est donnée par et exprime le
nombre moyen des J modalités par les p variables actives,
diminué d'une unité. Dépendant uniquement du nombre de
variables et de modalités et non des liaisons entre les variables, elle
n'a donc pas de signification statistique. Mais contrairement à cette
somme des valeurs propres (inertie totale) qui n'a pas de sens statistique, la
somme des carrés des valeurs propres est un indicateur de liaison entre
variables : elle est d'autant plus élevée que les liaisons sont
plus fortes ;
Source : LEBART L. et al (1994).
|