Analyse factorielle des correspondances
I. Définition :
L'analyse Factorielle des Correspondances ou AFC constitue une
technique d'analyse
statistique d'un ou de plusieurs tableaux de contingences
permettant une représentation graphique des attractions et des distances
entre les modalités des variables choisies.
L'analyse factorielle des correspondances (AFC) peut
être considérée comme une extension de l'analyse en
composantes principales (ACP). Elle est adaptée au traitement de
données qualitatives sans restrictions fortes, son but répond
à tout essai d'analyse d'un tableau formé par des observations
qualitatives sur des individus ou des catégories.
L'analyse des correspondances va effectuer l'analyse
générale d'un nuage de points pondérés
dans un espace muni de la métrique . Donc on se
référera donc à l'analyse générale avec des
métriques et des critères quelconques.
II. Eléments de base de l'analyse
- Tableau de données, distances,
géométrie des nuages
A. Tableau de contingence :
Le tableau de contingence (ou tableau croisé) est
obtenu en ventilant une population selon deux variables nominales. L'ensemble
des colonnes du tableau désigne les modalités d'une variable et
l'ensemble des lignes correspond à celles de l'autre variable. De ce
fait, les lignes et les colonnes, qui désignent deux partitions d'une
population, jouent des rôles symétriques et sont traitées
de façon analogue.
Considérons le tableau de contingence K à n lignes
et p colonnes.
A l'intersection d'une ligne et d'une colonne, nous avons le
nombre d'individus ayant
simultanément la modalité i de la variable ligne et
la modalité j de la variable colonne.
kj .
ki.
Le total est le nombre d'individus ayant la modalité i de
la variable ligne.
Le total est le nombre d'individus ayant la modalité j de
la variable colonne. On a les relations suivantes :
Chapitre Iii Analyse des correspondances
Qui, en termes de fréquences relatives, donnent lieu aux
relations :
Transformation du tableau de contingence :
Pour analyser un tableau de contingence, ce n'est pas le
tableau d'effectifs bruts qui nous intéresse mais les tableaux des
profils-lignes et celui des profils-colonnes c'est-à-dire les
répartitions en pourcentages à l'intérieur d'une ligne ou
d'une colonne.
Contrairement à l'analyse en composantes principales,
le tableau de données subit deux transformations, l'une en
profils-lignes, l'autre en profils-colonnes, à partir desquelles vont
j
kij
i
être construits les nuages des points dans et dans
ki.
Tableau de contingence K
k
k.j
Fréquences relatives F
j
fi.
Profils-colonnes
fi.
i
fij
f.j
i
j
Profils-lignes
j
i
1
fij
fi.
*
*
*
*
*
* *
R n
*
dans R p
nuage des p points
dans R n
·
· ·
·
·
·
·
·
nuage des n points
· ·
·
·
·
·
R p
·
·
USTHB Page 41
Transformation du tableau de contingence
Chapitre Iii Analyse des correspondances
Les transformations opérées sur le tableau des
données peuvent s'écrire à partir des trois
matrices F, et qui définissent les éléments
de base de l'analyse. F d'ordre (n,p) désigne
le tableau des fréquences relatives ; d'ordre (n,n) est la
matrice diagonale dont les
éléments diagonaux sont les marges en lignes ; est
la matrice diagonale d'ordre (p,p) des marges en colonnes .
Fréquences
relatives F
f.j 0
0
i
j
fij
Marges-lignes D n
Profils-lignes D F
-1
n
fi. 0
{ }(j)
fij
fi.
0
p
Profils-colonnes D F '
-1
p
{ }(i)
Marges-colonnes Dp
f.j
n
Fréquences, marges, profils
fij
|