II.5 NOTION
Soit S le nombre des questions posées a un individu, le
tableau V (n, s) n lignes et s questions sous forme de codage condensés,
le terme général
P a g e | 31
xiq désigne la modalité de la question q choisit
par le sujet i, I étant l'ensemble de n sujet ayant répondu au
questionnaire.
Pqs : nombre des modalités des réponses a une
question q, p donc recoder les variables.
?pq, un tel tableau n'est pas exploitable ; il faut donc recoder
les variables.
II.6 PRATIQUE DE L'ANALYSE FACTORIELLE DES
CORRESPONDENCES
Considérons le nuage de profils des individus de Rp et
supposons p? n. Soit g le centre de gravité : qj= {qj|j£J} ; qj=?
j|i. i=? ij= j.
a) Distance de X2
La distance de X2 entre i et i' du centre
j est : matériellement
d2 (i, i')=d2j ( j|i- j|i')2 ?(
j|i- j|i') ( j|i- j|i').
Cette distance du 2 a la propriété
d'équivalence distributionnelle c'esta-dire deux éléments
i et i' dont I a le même profil ( j|i= j|i') ; on peut le remplacer par
un seul élément i» affecter de la somme des poids
correspondants sans modifier la distance entre les éléments de
j».
b) Analyse du nuage N(I) : ACP
Soient le nuage N(I) du point i dans Rp de
coordonnée j|i affecté des masses i. N(I)= j|i|i I}
avec j|i=
On munit l'espace Rp de la distance du X2
entre deux points i et i'
d2X2 (i, i') = d2 2( j|I, j|I')
=
2
)
l'espace Rp est le centre = {g,j J} ou g= j. ainsi la
distance du X2 est : d2X2(i,i') =
~ 2 ; d'o~ les coordonnées des points i dans Rp
sont modifiés pour avoir :
; nous avons les nouvelles
coordonnées des points i par la métrique du X2
.
L'analyse du nuage se ramène a l'ACP du triplet : ( j|i ;
?p= i ; ).
1) Axe, facteurs principaux et composantes
principales
> Forme quadratique : l'inertie et la matrice
a diagonalise :
ajj'= ? ( j|i- j)( j'|i- j')
Sous l'espace Rp munit de la métrique , la
forme quadratique d'inertie
est donc : m0jj'= ~
~ ~
~ ~ si on pose xij=
, on
remarque que la forme quadratique devient :
m0 ojj'=?Xij. Xij' est la matrice associée a cette forme
d'inertie est la matrice à diagonaliser.
2 -1) _ _
Trace m0o-jj'=??Xij= , tp 1) (n-1)
X2 est la distance entre la loi marginale ( ,j) et la
situation d'indépendance i j.
d2x= ( ij; i j) = 2
2 Pi 2
La trace de m0= i Pi= car ij= ? ij. i= ij.
Sous l'hypothèse des diverses modalités ij : la
trace de la matrice a diagnostiquer est un X2 a (n-1)(p-1)
degré de liberté(ddl) qui est égale a la
somme des valeurs propres :
~ .
+ Facteurs principaux :
On diagonalise la matrice associée a la forme quadratique
d'inertie de terme général :
jj'=
i i i
i i
i Y ~
~ ~
Apres diagonalisation, on trouve : Trace m0jj'=1+
~
A la valeur propre 1, associée au vecteur propre jt0= j
(centre du nuage) ; correspond a la situation d'indépendance.
On l'appelle valeur triviale a laquelle est associé le
facteur principal trivial qu'on ne considère pas dans l'analyse.
Il vient que les valeurs propres de l'analyse factorielle de
correspondance sont toujours 0?ë?1 car plus grande des ces valeurs est
triviale et égale a 1, ces valeurs propres provenant d'une forme
quadratique semi-définie, elles ne peuvent qu'être
supérieur a 0. 0?ë?1.
· · Composantes principales de N(I)
:
La protection du point i de coordonné réduit
~ est Ci = ~~
~ .
~
(la nouvelle coordonnée du point i). 2) Analyse du
nuage :
On peut trouver les représentations des points j en
renversant les rôles de i et de i et de j.
Sii'= j
n étant souvent très élevé, le calcul
de la
j '
~
diagonalisation d'une matrice nxn sont très couteux, par
des relations des transitions, on montre que les composantes de l'une des
analyses se déduisent de celles des autres.
Ainsi : C = . Ou est le ieme facteur.
Ainsi les facteurs nuage N (J) sont proportionnels aux
coordonnées des points représentatifs des N(I) sur l'axe
factoriel du nuage et réciproquement.
On peut représenter les proximités entre les
éléments des nuages N(I) dans le plan principal et sur le
même plan, les proximités entre les éléments du
nuage N(J).
Cette représentation simultanée se justifie par le
fait que les facteurs de l'une de l'analyse sont les barycentres des facteurs
de l'autre analyse a près.
Ainsi on passe du barycentre de C1 pondérée par les
i|j au point d'abscisse C j par le rapport
le long de chaque axe principal. Il s'agit d'une dilatation
des nuages, d'autant plus fort que ë est petit ; l'axe est de rang
élevé.
|