![]() |
Analyse du statut sérologique au VIH / sida et de ses déterminants chez les femmes enceintes au Cameroun.( Télécharger le fichier original )par Harris Bénito KOUBEMBA MONA Institut sous-régional de statistique et d'économie appliquée (I.S.S.E.A) - Ingénieur d'application de la statistique ( I.A.S) 2010 |
V.3. Analyse multivariéeLe logiciel utilisé pour exploiter les données dans cette partie est SPAD 5.5. Les variables choisies, dites variables actives, pour évaluer les similitudes entre les individus, sont au nombre de 8 et sont toutes de type nominal. Leur liste ainsi que les modalités sur lesquelles elles sont réparties apparaissent dans le tableau 18. Tableau 18 : Variables actives et nombre de modalités correspondantes
Dans toute la suite, J désignera le nombre de modalités actives et Q le nombre de variables actives. Le statut sérologique est introduit comme variable supplémentaire. Ce choix résulte du fait que cette dernière variable doit s'expliquer par les variables actives afin de se placer dans une optique de prévision. Il s'agit aussi d'éviter les risques de tautologie que pourrait entrainer l'interprétation «interne'' à l'aide des seules variables actives21(*). V.3.1. Nombre d'axes à retenir La
somme des valeurs propres22(*), en ACM, vaut Le tableau 22 (ANNEXE), donne l'histogramme des valeurs propres et aide à décider du nombre d'axes factoriels à archiver et sur lesquels seront faites les interprétations ultérieures. En effet, en l'observant, on se rend compte que la décroissance des valeurs propres n'est pas régulière. Il laisse aussi apparaître des différences d'inertie importantes entre la deuxième et la troisième valeurs propres (pourcentages respectifs de 5,77 % et 4,32 %). L'un des constats faits est que le premier axe n'explique que 7,47 % de l'information que contiennent l'ensemble des données et le second 5,77 %. Le cumul de la variance expliquée par les deux premiers axes s'établit autour de 13,25 %. Cette faible part de variance expliquée sur les premiers axes est une caractéristique de l'analyse factorielle des correspondances multiples qui donne généralement des mesures pessimistes de l'information extraite. Or, il est conseillé en analyse des données d'utiliser en général au moins la moitié de la variance totale (environ les 13 premiers axes dans le cas présent pour lesquels le cumul de la variance expliquée s'établit autour de 50,3704 %). Le choix des 13 premiers axes ne facilitant pas l'interprétation en ce sens que plusieurs axes (à partir du troisième) n'expliquent individuellement que moins de 5% de l'inertie totale, l'interprétation se fera sur les 2 premiers axes factoriels ce qui s'avère acceptable dans le cadre d'une ACM. * 21 SAPORTA G., (1990), «Probabilités, analyse des données et statistique'', Éditions Technip, Paris. * 22 Valeur propre : inertie associée à l'axe * 23 En analyse factorielle, l'inertie totale peut être vue comme la quantité d'information contenue dans les données. C'est une valeur qui traduit la dispersion des individus par rapport aux variables actives. Le principe de l'ACM est de trouver un sous-espace de dimension réduite sur lequel sera projeté l'ensemble des données, tout en respectant dans la mesure du possible, les proximités qui existaient entre les individus dans le tableau initial. |
|