CHAPITRE II : THEORIE SUR L'ANALYSE FACTORIELLE DES
CORRESPONDANCES MULTIPLES
II. 1 GENERALITES
Le but des méthodes d'analyse factorielle est de
décrire les ensembles i et j en vue d'avoir une visualisation de
l'ensemble des données. Cette
structure sera définie par la distance aux
proximités entre les points représentant les individus ou et les
caractères.
II. 2 CONCEPTS FONDAMENTAUX
La proximité traduit la ressemblance entre les individus
ou entre les caractères, le degré d'association existant entre
eux plus généralement entre les groupes d'éléments
extrait de l'un ou de l'autre de ces ensembles. Pas scellement concis, le
résumé également doit être fidele ; il s'agit la de
faire une restitution de `information analysée ainsi grand que possible
dans un volume sensiblement inferieur.
Cependant, trois possibilités s'offrent pour mesurer la
proximité, les distances, les indices géométriques ainsi
que les similarités. Ces trois possibilités sont
différentes entre elles suivant que l'on recherche a la mettre en
évidence ainsi que sur les caractères plus ou moins contraignant
des propriétés qu'elles doivent satisfaire.
II.2.1 La distance
Dans Rp la distance entre deux individus i et j
constitue un nombre caractéristique de la ressemblance des deux
observations correspondantes :
d2 (xi, xi') = ?p(xij,xi'j)'(xij,xi'j)
cette mesure doit satisfaire aux trois axiomes fondamentaux :
d (i,i')=0 et d (i,i')=0
i= (xij,xij')= ?xij.xij'
Symmetries: d (i,i') = d(i', i) pour i, i'= 1,2,3,...,n
inégalité triangulaire: d (i, I')= d (i, i»)+
d (i»+i').
a) Distance euclidienee
Existence des corrélations entre variables:
Xij= {xij|i Rp} ; Xij={ xij|i Rp} et
d2 (i, i-1)=?(xij-xi' j)
Dans cette optique, la distance entre les variables est
pondérée. On introduit un système de pondération.
Pour les indices, ce système est souvent donné par l'importance
relative que l'on accorde aux différents individus.
Ces unités ayant servi à mesurer chacun de p
caractères étudiés, peuvent ne pas être comparable.
On recourt alors a des transformations : centrer et renduite.
b) Distance de X2 d2 (i, i-1)=
~
~
et cette distance est définie dans Rn qui
mesure la proximité de deux modalités différentes choisies
par le même individu qui coïncide et les deux individus sont
proches, s'ils ont choisis la même modalité, ils sont
éloignés, s'ils n'ont pas répondus de la même
manière.
c) Distance de MINKOWSKI
Cas des coordonnées orthogonaux :
D (k, k') =
= 1|n avec n=1.
~
II.2.2 Indice géométrique
Ces indices expriment une relation sur les vecteurs
caractères.
- Les produits scalaires dans l'espace des individus : 4U V)N=
(it)'V ce
qui correspond a une matrice N égale a Idn.
- Le produits scalaire dans l'espace des variables it v)N =
(it)'v, alors,
~
N est égale a : idn.
~
Mais d'autres produits scalaires peuvent être
définis ; N étant une matrice systématique définie
positive d'élément Nij, le produit s'écrit de
la manière générale :
1 v)N= N
~ = ij Ui Vi
~
=
Dans ce cas le produit scalaire à utiliser est )N=?xij
xi'j
- La covariance cov (xij,xj)= '
- Le coefficient de corrélation : caractère
centré réduit.
|