Analyse multidimensionnelle de l'avortement en république du congo( Télécharger le fichier original )par Anaclet Géraud NGANGA KOUBEMBA Institut Sous-régional de Statistique et d'Economie Appliquée (ISSEA) - Elève Ingénieur Statisticien 3è année 2007 |
Chapitre III : TECHNIQUES D'ANALYSE DES DONNÉES UTILISÉESOn distingue trois démarches principales d'analyse des données : l'analyse factorielle qui cherche à réduire un nombre important d'informations par un nombre aussi restreint que possible de variables appelées composantes (ou facteurs), la classification qui consiste à classer les unités statistiques et les variables statistiques à l'aide d'algorithmes préalablement établis et l'analyse discriminante qui permet de construire une règle de décision permettant d'affecter un groupe d'individus donné. Les méthodes16(*) d'analyse de données les plus utilisées dans le traitement des enquêtes sont : l'analyse en composantes principales (ACP), l'analyse factorielle des correspondances (AFC), l'analyse des correspondances multiples (ACM), l'analyse discriminante (AD) dont l'AD décisionnelle et l'AD descriptive et les méthodes de classification que sont la classification ascendante hiérarchique (ACH) et la classification ascendante non hiérarchique (ACNH). Dans les sections suivantes nous n'explicitons que les méthodes factorielles et la CAH qui s'adaptent à nos objectifs définis plus haut. III.1 MÉTHODES FACTORIELLESBasées sur des représentations graphiques (conversion automatique d'un gros tableau de données en images synthétiques), les méthodes d'analyse factorielle trouvent leur intérêt dans le sens où, en statistique, « un bon graphique est plus parlant qu'une montagne de chiffres », Xavier BRY (1995, p.3). III.1.1 l'ACP en BrefL'ACP consiste à décrire un ensemble d'individus et un ensemble de variables quantitatives. Le but est d'analyser les proximités des vecteurs individus, les corrélations entre les variables et, simultanément, les individus et les variables. Elle considère que les q nouvelles variables (dites composantes principales ou variables définies par les facteurs principaux), sont des combinaisons linéaires des p (p>q) variables initiales et, qu'elles sont non corrélées linéairement. En somme, les objectifs poursuivis par une ACP sont : o la représentation graphique "optimale" des individus en minimisant les déformations du nuage des points, dans un sous-espace de dimension réduit q ; o la représentation graphique des variables dans un sous-espace en explicitant au mieux les liaisons entre ces variables.
NOTA BENE : - La dispersion du nuage autour de son centre de gravité est mesurée à l'aide de l'inertie totale du nuage de points donnée par la formule Un des objectifs de l'ACP étant de décrire les proximités entre les individus, on a besoin de mesurer la similarité de 2 vecteurs individus qui seront dits proches s'ils ont à peu près les mêmes valeurs des variables associés ; Ainsi, l'ACP permet, entre autre, de décrire les ressemblances et les oppositions entre des individus. Elle va nous permettre de réduire la dimension de l'espace en projetant les données sur des axes (aussi appelés facteurs ou dimensions) bien choisis ; - La qualité des résultats auxquels conduit l'ACP dépend, de façon évidente, du choix de la dimension q du sous-espace de représentation, c'est-à-dire du nombre de composantes principales retenues pour faire des interprétations graphiques. Le nombre de composantes principales à retenir et les interprétations qui en découlent sont rappelés via AFC et ACM dans les sections suivantes ; - Les variables actives sont utilisées directement dans l'ACP pour construire les axes principaux. Au contraire, les variables supplémentaires sont introduites après avoir construit les axes principaux ; les individus et les variables n'étant pas dans le même espace, dans le cadre d'une ACP, on ne peut pas les représenter sur le même graphique. * 16 Les techniques et notations ici définies (et exhibées en suite au chapitre 4) sont essentiellement extraites des ouvrages « Analyses Factorielles Multiples », Tome 2,1996, Xavier BRY et « Statistique Exploratoire Multidimensionnelle », 2nd édition DUNOD, 1994, L. Ludovic, MORINEAU Alain et PIRON Marie ainsi que des notes de cours IAS, 3 ème (année 2006-2007) avec M. Jean Cléophas ONDO. |
|