WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Analyse multidimensionnelle de l'avortement en république du congo

( Télécharger le fichier original )
par Anaclet Géraud NGANGA KOUBEMBA
Institut Sous-régional de Statistique et d'Economie Appliquée (ISSEA) - Elève Ingénieur Statisticien 3è année 2007
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

III.2 MÉTHODE DE CLASSIFICATION

Pourquoi une classification ? (i)Il est toujours difficile d'interpréter les axes factoriels au-delà du plan factoriel ;(ii) la compression excessive de l'espace de projection peut entraîner des distorsions fâcheuses et des superpositions de points occupant des positions distinctes dans l'espace ;(iii) les visualisations peuvent manquer de robustesse et (iv) les visualisations peuvent concerner des milliers de points et donner lieu à des graphiques illisibles.

D'où la nécessité d'une classification réalisée sur l'espace tout entier, méthode robuste en ce sens que, les parties basses des dendrogrammes produits sont indépendantes des éventuels points marginaux isolés.

La technique de classification fournit une autre forme de synthèse des données qu'une analyse factorielle. Elle constitue des classes homogènes d'individus, les classes étant distinctes les unes des autres le plus probable relativement aux variables considérées. Les individus qui se ressemblent au niveau des variables actives sont rassemblés dans une même classe et la synthèse de toute l'information contenue dans le tableau de données se ramène alors à la caractérisation de ce petit nombre de classes homogènes. Il s'agit d'une classification sur facteurs issus de l'AFC ou de l'ACM. Elle revient à créer une variable qualitative qui correspond à l'appartenance à une classe ; SPAD propose la classification hiérarchique (CAH/RECIP) qui fournit une hiérarchie de partitions, et la méthode d'agrégation autour de centres mobiles qui conduit directement à une seule partition. Dans notre étude, nous n'utiliserons uniquement que la CAH ;

NOTA BENE :

- La méthode de classification sur les facteurs de SPAD effectue une classification des individus à partir d'un ensemble de p variables (ou p facteurs) issus d'une analyse factorielle préalable ;

- Le logiciel SPAD effectue une CAH selon le critère de Ward. C'est une méthode qui consiste en une ascendance hiérarchique qui minimise à chaque étape la perte d'inertie inter-classes. La procédure effectue la classification hiérarchique d'un ensemble d'individus caractérisés par leurs premières coordonnées factorielles créées par une procédure d'analyse factorielle (avec le critère d'agrégation de Ward !). L'arbre d'agrégation appelé dendrogramme ainsi créé peut ensuite être coupé en un nombre donné d'éléments ``terminaux» où les individus sont regroupés selon une hiérarchie18(*) H de façon ascendante : on regroupe les individus les plus proches et on recommence pour les n-1 points suivants... On produit donc une suite de partitions emboîtées ;

- L'Indice de niveau19(*) donnera la valeur de l'indice d'agrégation (ou indice de niveau) de chaque noeud et mesurera, au sens de Ward, la dissimilarité entre les classes. Et le choix du niveau de coupure du dendrogramme, et donc, du nombre de classes de la partition n'étant pas toujours facilité par simple inspection visuelle, nous utiliserons l'examen de l'histogramme des indices croissants de niveau et réaliserons la coupure après agrégation correspondant à des valeurs peu élevées qui regroupent les éléments les plus proches à des valeurs élevées de l'indice, qui dissocient, les groupes bien distincts dans la population (coupure au niveau pour lequel cet histogramme marque un palier important).

- La CAH présente l'avantage de laisser libre le choix du nombre de classes qui est imposé avec la méthode des centres mobiles. De plus, elle est déterministe.

* 18 On rappelle qu'une hiérarchie H sur un ensemble I est un ensemble de parties de I tel que I et les singletons de I appartiennent à cette hiérarchie et les éléments de H sont soit disjoints soit emboîtés.

* 19 L'indice de niveau d'un noeud est en fait la perte d'inertie inter-classes occasionnée par la formation du noeud.

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Qui vit sans folie n'est pas si sage qu'il croit."   La Rochefoucault