IV. Analyse des T nuages d'individus :
Une fois ce phénomène d'évolution dans le
temps observé et analysé, il est possible de l'éliminer
par centrage des différents tableaux ; nous allons ensuite chercher
à faire apparaitre des phénomènes de variation autour de
la moyenne.
Pour cela, la méthode proposée ne
présente là encore aucune difficulté technique,
puisqu'elle consiste en une analyse en composantes principales des T nuages de
points-individus, centrés par rapport à leurs centres de
gravité.
2eme étape : on effectue T ACP des tableaux (de taille
n x p) définis par :
=
pour t=1,...,T
USTHB Page 12
Chapitre II Double analyse en composantes principales
USTHB Page 13
Ces T analyses en composantes Principales vont nous fournir deux
types de résultats :
- il sera possible, d'une part, d'interpréter chacune des
ACP à l'aide des représentations graphiques et des aides à
l'interprétation bien connues de tous ; cette analyse apparait toutefois
fastidieuse dès que l'on dispose de nombreux tableaux.
- D'autre part, ces T ACP nous fournissent chacune deux
systèmes d'axes orthogonaux. Si l'on note q le nombre d'axes retenus
dans les ACP ( q < Min(p,n) ), on a :
- T systèmes de facteurs principaux (vecteur de taille p)
pour t=1...T
- T systèmes de composantes principales (vecteurs de
taille n) pour
t=1...T
V. Étude de l'intrastructure : recherche d'un
espace de représentation commun aux études :
La troisième et dernière phase de la DACP
répond à son objectif principal, à savoir : trouver un
espace dans lequel il sera possible de représenter les trajectoires des
individus au cours du temps.
Quatre critères de sélection d'axes ont
été proposés par J-M Bouroche dans sa thèse, nous
allons les présenter dans la suite de ce paragraphe.
A. Généralités : définition
des indices
Nous disposons, à l'issue de la deuxième phase de
la DACP, de 2T systèmes d'axes orthonormés :
- T systèmes de facteurs principaux (vecteurs de taille p)
pour t=1...T ; ce
sont les vecteurs propres des matrices M associés aux deux
plus grandes valeurs
propres , I=1...q ;
- T systèmes de composantes principales (vecteurs de
taille n) pour
t=1...T ; ce sont les vecteurs propres des matrices D,
associés aux mêmes q plus
grandes valeurs propres , I=1...q ;
Avant de présenter les quatre critères, nous allons
commencer par définir deux indices mesurant la proximité entre
les systèmes d'axes.
Chapitre II Double analyse en composantes principales
USTHB Page 14
Les critères de sélection d'axes sont basés
sur deux indices :
On a M = et les facteurs principaux sont orthonormés ; la
quantité
représente donc l'inertie expliquée par le facteur
principal l pour le tableau (t). En se basant sur cette
propriété, on peut définir l'inertie expliquée par
un facteur quelconque v.
Définition de l'inertie expliquée par un
facteur quelconque :
On définit l'inertie expliquée par un facteur v
quelconque par la quantité : v.
Pour un système d'axe , on définit alors l'indice
Ö (t, v) par :
Ö (t, v) = ? ?
?
Cet indice mesure la perte en pourcentage de l'inertie de nuage
des individus définis par
le tableau (t) lorsqu'on le projette sur le sous-espace
défini par les au lieu de le
projeter sur ses q premiers facteurs principaux.
En d'autres termes, lorsque l'on projette le nuage sur le
sous-espace engendré par les
), son inertie diminue en pourcentage de .
La proximité entre deux facteurs u et v peut
également être mesurée par l'angle entre ces deux vecteurs
u et v (de dimension p), ou plus précisément par le cosinus
carrée de leur angle.
Ainsi, le deuxième indice mesurant la proximité
entre un système d'axe et un
système d'axes est : =? .
On écrira également par la suite : =? ?
Cet indice mesure la proximité du système d'axe v=
systèmes de facteurs
principaux.
Chapitre II Double analyse en composantes principales
USTHB Page 15
|