II. 3 CRITERES DE CLASSIFICATION DES METHODES D'ANALYSE
DES DONNEES
Les méthodes d'analyse des données peuvent
être classées selon un certain nombre des critères relevant
soit de leurs propriétés ou caractéristiques
mathématiques, soit des leurs domaines d'applications.
II.3.1 Partition ou nom du tableau des données
Ce critère sépare les méthodes descriptives
(ou des structures des phénomènes), des méthodes
explicatives (ou méthodes de liaisons entre
phénomènes).
II. 3.2 Notion de métrique et de forme
quadratique
Soit l'individu noté xij = {xij|i I} en (I) CRP
et le caractère j, xij = {xij|j J} en (J) CRP.
On a : xij = e
~ ou (e1, e2, ..., ep) est la base canonique de Rp
et
xij=
. . Ou ( 1, 2, ..., n) est la base canonique de Rn.
Ainsi, est associé aux lignes de xij le nuage
des individus N(I)= {xij|i I} et à la colonne de xkj, le
nuage des caractères N(J) = {xij|j J}.
Soient R*p et R*n, les espaces duaux de
Rp et Rn mais respectivement des duales (e*,
j=1,2,..., p) et ( *|i I) :
xkj= e )
xkj= )
c'est-a-dire dans Rp, xjk est la
coordonnée par rapport a eij pour tout ij et dans
Rp , xij est la coordonnée par rapport a
i pour xkj.
Considérons l'application linéaire :
R*n ?Rp e ? ij
Qui a la forme linéaire ~ ij,
représentation du caractère j dans R*p fait
correspondre le vecteur xij, représentation du
caractère j dans Rn, la matrice associée x n'est que
tableau xij (n.p). De même :
R*n ?Rn
*
j? xij
Et la matrice associée x' transposé de xij
(p.n).
a) Métrique euclidienne dans l'espace
Rn des caractères
Pour mesurer la proximité entre caractère et pour
juger de leurs colinéarité on munira l'espace des
caractères Rn d'une métrique m. on a :
d (xij-xi'j)= ou Rn ?Rn *
Alors si R*p on cherche une métrique
euclidienne V telle que :
n= e e v
R*p? Rn R*u? Rp
V= x' ou ox qui définit sur R*p, une forme
binaire symétrique semidéfinie positive c'est-a-dire une forme
quadratique.
V(e* j-e* j')= V(e*
j-e* j', e* j-e* j')= 2n
Ainsi la métrique euclidienne V mesure les
proximités entre les vecteurs caractéristiques de
Ru.
b) Métrique de poids dans Rn, centre
de gravité de nuage et forme quadratique d'inertie
On a: N (I) = {xij|i I} CRp.
A tout individu i I c'est-a-dire a tout xij de N (I),
associons le poids pi (pi?0 et ?pi=1).
Soit gi= {gi|j J}, le centre de gravité de N(I).
gi= ? pi.xij, jieme coordonnée du centre de gravité
dans la base {ej|j J}
On sait que le centre de gravité est le point le plus de
N(I) ou sens de la métrique définit sur Rp puisque
l'inertie est minimum (variance) au point gj.
On place alors l'origine de Rp au centre de
gravité, c'est-a-dire gj=0, par ailleurs, la variance du
caractère j et j'est : cov (xij,xi'j)=?pi xij xi'j. La métrique
dans Rn est la métrique des poids définie par la
matrice diagonale de poids ?p.
D'oü V (xij)= 2 ?p et cov(xij)= d2 (xij,xi'j)= ,
?p
= ?pi (xij, xij)2= V(xij)+V(xij)- 2 cov
(xij, xij)
V= xo.?p ox, forme bilinéaire symétrique
semi-définie positive dont la matrice associée est la matrice de
variance covariance. C'est la forme quadratique d'inertie associée a
N(I) des points xij munis des masses pi.
N(I)= {xij, pi?0}
|