II. Présentation générale de la
méthode et notations :
La double analyse en composantes principales peut être
décomposée en trois phases distinctes ; ces trois phases sont les
suivantes :
-La première étape analyse un
phénomène d'analyse globale, qualifié de «
déplacement des nuages au cours du temps ». Cette évolution
est étudiée par une analyse en composantes principales des
centres de gravité des nuages ; elle correspond à ce que nous
avons appelé « l'étude de l'interstructure ».
-La seconde étape consiste à étudier la
déformation des nuages autour de leur centre de gravité, pour
cela, on effectue T analyses en composantes principales des T nuages de points,
centrés par rapport à leur centre de gravité pour
éliminer le phénomène d'évolution global.
-Enfin, la troisième phase consiste à
représenter dans un même espace les évolutions des
différents individus au cours du temps ; le problème majeur de
cette phase consiste précisément à rechercher un espace de
représentation commun. C'est là l'objectif ultime de toutes les
méthodes d'analyse des données évolutives ; trouver un
espace dans lequel pourront être représentées les
trajectoires des individus.
Nous rappelons brièvement les notations
utilisées jusqu'à présent : les tableaux
étudiés seront
notés , (t=1,..., T), ce sont des tableaux à n
lignes (les individus) et p colonnes (les variables).
Chapitre II Double analyse en composantes principales
USTHB Page 11
Notation des tableaux de données dans la Double
ACP :
[ =( n
A l'instant t, une variable j est identifiée au vecteur
:
Et un individu i sera identifié au vecteur [ ]
Les individus seront munis des poids et on notera :
Dn = [Où les pi vérifient : ?
A l'instant t, le centre de gravité du tableau Xt
associé à la matrice est le vecteur défini
par :
Où : = ?
Enfin, on note ={ , i=1, , , } le nuage des individus
définis par le tableau .
Chapitre II Double analyse en composantes principales
III. Etude de l'interstructure : analyse du nuage des
centres de gravite :
L'objectif de la première phase de la
double analyse en composantes principales est de décrire
l'évolution globale de la population d'individu étudiée.
Cette phase peut être mise en parallèle avec la première
phase de la méthode STATIS, c'est à dire l'étude de
l'interstructure. Toutefois, l'approche est légèrement
différente puisque STATIS et l'AFM étudient les ressemblances et
les différences entre tableaux centrés par rapport à leur
centre de gravité, alors que la DACP étudie l'évolution
des tableaux par l'intermédiaire de leur centre de gravité
Cette phase ne présente aucune difficulté
théorique particulière, elle consiste simplement en une analyse
en composantes principales du nuage de points défini par les centres de
gravité de chaque tableau.
On obtient alors une image euclidienne des tableaux dans un
espace de dimension souhaitée. Souvent, on peut vérifier que le
premier axe de cette image s'explique en termes d'évolution globale dans
le temps : les centres de gravités 9 (t) varient en
général de manière continue dans le temps le long de cet
axe.
1er étape : on effectue une ACP sur le tableau (de
taille T x p) défini par :
|
9(1)
|
|
(x1)(1)
|
... (xp)(1)
|
G=
|
|
=
|
[(x1)(t)
|
... (xp)(t)
|
|
9(T)
|
|
(x 1)(T)
|
... (xp)(T)
|
|