![]() |
Analyse multidimensionnelle de l'avortement en république du congo( Télécharger le fichier original )par Anaclet Géraud NGANGA KOUBEMBA Institut Sous-régional de Statistique et d'Economie Appliquée (ISSEA) - Elève Ingénieur Statisticien 3è année 2007 |
III.1.2 l'AFC en BrefL'analyse des correspondances binaires (ACORBI) ou analyse factorielle des correspondances (AFC) permet d'étudier la dépendance de 2 variables qualitatives. Elle est basée sur une décomposition du Chi-Deux de contingence et l'étude de la dépendance est réalisée par des représentations graphiques. C'est une généralisation de l'ACP et s'applique par excellence aux tableaux de contingence (dits aussi tableaux de dépendance ou tableaux croisés) formés d'individus décrits par 2 caractères qualitatifs. La première formalisation mathématique de l'AFC est due à Hirschfeld (1935), et celle de l'ACM à Guttman (1941), ce qui dresse un historique de l'évolution de l'analyse des correspondances anglo-saxone alors qu'en France, l'analyse des correspondances a été proposée par Benzécri (1973)17(*). - Une AFC sur tableau de contingence se justifie si : (i) on est intéressé par l'analyse des relations entre les catégories de l'une et l'autre variable ; (ii) on dispose au moins de 3 modalités par variable et suffisamment bien remplies (par regroupement au besoin) ; - On dit que 2 variables sont liées si la connaissance de l'une d'entre elles pour un individu modifie la distribution attendue de l'autre ; - L'AFC peut être définie comme une double ACP : ACP du tableau des profils-lignes et ACP du tableau des profils-colonnes. La métrique utilisée pour mesurer la proximité entre deux individus n'est plus la métrique usuelle (distance euclidienne), mais la distance du Chi-Deux. Ce faisant, l'AFC peut être considérée comme une ACP avec une métrique spéciale, la métrique du Chi-Deux. Son objectif est de résumer et de décrire les liens entre l'ACP des profils-lignes et l'ACP des profils-colonnes et de construire des graphiques mettant en évidence les proximités entre les profils- lignes, les proximités entre profils-colonnes, et la nature de la liaison entre les lignes et les colonnes du tableau de contingence ; - La métrique du Chi-Deux possède la propriété d'équivalence distributionnelle, propriété de stabilité de l'AFC : si 2 lignes de la table de contingence sont proportionnelles, on ne modifie pas l'AFC de la table en remplaçant les deux lignes par leur somme. La propriété demeure aussi vraie pour les colonnes ; - Il existe bien un lien avec le Chi-Deux de Karl Pearson. En règle générale, constater une dépendance c'est bien mais l'expliciter est mieux. L'AFC vise précisément à décomposer cette dépendance selon un ensemble de dimensions indépendantes de même que l'ACP décompose la variance totale selon un ensemble de facteurs non corrélés. INDICES D'AIDE À L'INTERPRÉTATION
· Inertie et test d'indépendance L'inertie totale est donnée par la formule
suivante : · Qualité globale La qualité globale de la représentation du nuage
initial par le sous-espace de dimension q [ · Contribution relative d'un axe à un individu Cette contribution représente la qualité de la représentation d'un individu par le sous-espace qui ajuste le nuage initial. Elle se mesure par l'indice CO2 donné par :
Si Si un point est bien représenté sur un
sous-espace à q dimensions (c'est-à-dire, · Contribution relative d'un individu à un axe L'AFC présente une particularité du fait que les
individus sont affectés de poids différents (fi.) : un
individu peut donc avoir plus ou moins d'influence dans le lien entre les
variables qualitatives; on dispose pour la mesurer d'un indice appelé
contribution relative d'un individu à un axe donné par la
relation La somme de toutes les contributions vaut 1 et qu'un profil-
ligne (resp. profil-colonne) est d'autant plus important dans la construction
du · Choix du nombre de composantes principales Des nombreux critères de choix pour q existent dans la
littérature. On utilisera essentiellement la règle de la part
d'inertie expliquée et la règle du coude de Cattell. On admet que
le nombre d'axes factoriels est égal à * 17 C'est l'approche française de Benzécri qui est ici exposée. |
|