1.3.4 Formule de reconstitution des densités de
probabilités
Si g1, g2, ..., gT le
système de vecteurs propres de l'opérateur V,
oi T désigne le nombre de valeurs propres non nulles
de V (resp. W), alors chaque densité ft
s'écrit comme suit [31:
ft = XT < ft,gj >H gj
(1.13)
j=1
La coordonnée < ft,gj >H de ft
suivant gj, est égale a la
t-ième composante du vecteur U*gj. De la
relation,
1 1 p
U*gj = pëjU* o Uuj
= v Wuj = ëj uj; (1.14)
ëj
on déduit:
|
? ????
????
|
< ft,gj >H = pëj uj,t
= jL 4/ëj uj,t gj
ft j=1 PT
gj = vëj
1t=1 uj,t ft
|
(1.15)
|
oi uj,t désigne la
t-ième composante du vecteur propre uj de W.
Pour obtenir une représentation approchée du
nuage initial, il suffit de tronquer la relation
(1.15).
1.3.5 Qualité Globale de l'ACP
On mesure la qualité globale de
l'ACP par la somme des proportions d'inertie expliquée par
les axes retenus, l'axe j expliquant une
quantité d'inertie égale ëj
>IT r=1 ër.
1.3.6 Qualité de représentation de ft suivant
gj
Elle est égale a:
ft = fu +
|
XT j=1
|
qëjut,j
gj (1.20)
|
1.3.7 ACP normée
L'ACP normée de densités de probabilité
consiste a diviser chaque densité par sa norme
associée dans H; cette ACP conduit alors a
diagonaliser la matrice de terme
général:
1 1
Ws,t = Ilft1111fs11 < ft,fs > (1.17)
Remarque: Cette normalisation conserve dans H
les angles entre les densités mais déforme leurs
distances.
1.3.8 ACP centree
Pour obtenir une représentation approchée
qui restitue les distances entres les densités, on définit
un autre nuage dont le centre de gravité est lui
même l'origine de l'espace vectoriel ou les densités
sont représentées. Kneip et Utikal (2001) ont choisi cette ACP
pour étudier sur plusieurs années, la relation entre le revenu
annuel des foyers britanniques et l'age
moyen des personnes actives au sein de ces foyers.
Théoriquement elle consiste a prendre comme
nuage l'ensemble des fonctions ft = ft -
fu dans L2(Rp), ou
fu = L EsL fs. L'ACP de ce
nuage conduit a diagonaliser la matrice W, de
terme général:
Wt,s =< ft - fu,fs - fu > .
(1.18)
L'opérateur de covariance associé
s'écrit:
T
V = j=1 (ft - fu)
? (ft - fu). (1.19)
Les densités ft, t ? {1,...,L}
s'écrivent dans la bases des fonctions propres
g1,g2,... de
l'opérateur V comme suit [20]
Exemple: ACP centrée de L distributions
gaussiennes multidimensionnelles.
Soient X1, . . . ,XL des variables
aléatoires de distribution gaussienne a p
dimensions, de moyenne u1, . . . ,uL et de
variance Ó1,. . . ,ÓL respectivement. Les
densités f1, f2,..., fL constituent un
nuage F dans l'espace de Hilbert H =
L2(IRp).
L'ACP centrée de ces L densités conduit
a diagonaliser la matrice de terme général
donné par la relation (1.18), qu'on calcule en utilisant la
formule (1.4).
On visualise (Fig.1) les projections des dens
ités ft (t = 1, . . . ,30) sur le premier
plan principal dans les cas suivants:
1. ut = cos(t), Ót =
et,
2. ut = cos(t), Ót =
1,
3. ut = 0, Ót =
et.
Les deux premiers éléments propres de W
( ACP centrée) fournissent une représentation approchée
des densités sur les deux premiers axes principaux et les
pourcentages d'inertie expliquée par ces axes. "Au
cours du temps l'évolution de la moyenne est
périodique et l'évolution de la variance est
exponentielle, l'évolution des densités devrait etre la
résultante" [31.
Les graphiques de la figure 1
donnent les projections des densités sur le premier plan principal.
L'évolution des densités sur ce plan, dans le cas ut =
cos(t) et Ót = et, ne
fait pas apparaItre la périodicité de la moyenne, ceci
est du au fait que la variance croissant exponentiellement,
" L'évolution de la moyenne est "
noyée " dans l'évolution de la variance" [31 . Cet
aspect est bien montrer lorsque ut =
cos(t) et Ót = 1, oi la
périodicité de la moyenne est bien visible sur le
premier plan principal.
11t = cos(t), Ót
= et
2
8% 12%
0280 0200 0120
|
|
01700 01275 00850
|
|
|
4 0
11t = cos(t), Ót
= 1
2
21 23 1
7
91% 81%
11t = 0, Ót = et
Fig.1: Nuage centré des
densités sur le premier plan principal
.0850
|