II-1. L'Analyse des correspondances multiples (ACM)
L'ACM permet d'étudier les liaisons (ou
correspondances entre plusieurs variables qualitatives sur une même
population. Lorsque les variables étudiées ne sont pas
qualitatives, il est toujours possible d'utiliser l'ACM en transformant les
variables quantitatives en variables qualitatives (en regroupant les valeurs
des variables initiales en classes). C'est donc une technique statistique
utilisée pour mettre en évidence les associations entre les
différentes modalités des variables qualitatives décrivant
la population. Ces correspondances permettent de faire ressortir des facteurs
indépendants dont l'interprétation permet d'expliquer certains
phénomènes. En utilisant exclusivement des représentations
graphiques, il sera possible d'étudier et de mettre en évidence
les associations entre les modalités des variables
étudiées.
Il est important de noter ici que l'interprétation se
fait suivant les axes factoriels (combinaisons linéaires des variables
initiales) et sous certaines conditions :
- Un des critères de sélection des axes
factoriels est de ne retenir que les axes correspondants aux valeurs propres
supérieurs à 1/p où p est le nombre de variables de
l'étude.
- Les modalités doivent avoir une qualité de
représentation assez grande au sens où les distances sont
les moins altérées par la projection.
En ce qui concerne l'interprétation proprement
dite :
* Proximité entre
individus : deux individus sont proches si leur distance est faible,
c'est-à-dire s'ils prennent à peu près les mêmes
modalités des différentes variables.
* Proximités entre
modalités de variables différentes : deux points
modalité de variables différentes sont proches si leur distance
est faible : ce sont les mêmes individus qui prennent
simultanément ces modalités.
* Proximité entre
individus et modalité : un individu et un point
modalité sont proches si l'individu prend cette modalité. Cette
interprétation n'a de sens que si l'individu et la modalité sont
bien représentés sur l'axe factoriel.
* Proximité entre
modalités différentes de la même variable :
théoriquement, les modalités d'une variables sont
éloignées l'une de l'autre : elles s'excluent mutuellement.
II-2. Régression Logistique
La régression logistique est une technique statistique
qui a pour objectif, à partir d'un fichier d'observations, de produire
un modèle permettant de prédire les valeurs prises par une
variable catégorielle, le plus souvent binaire, à partir d'une
série de variables explicatives continues et/ou binaires. Contrairement
à l'analyse discriminante, la régression logistique recourt
à l'approche du Maximum de Vraisemblance pour estimer les
paramètres du modèle. Le terme d'erreur est supposé suivre
une distribution logistique.
SECTION 2 - L'APPREHENSION DES DETERMINANTS DE
L'OCTROI DU CREDIT (le test de khi-2, l'analyse des composantes multiples et la
régression logistique)
|