2.3.3 Approche de Kneip et Utikal
Soit (xt,1,...,xt,nt), nt
réalisations de la variable aléatoire Xt de
densité inconnue ft et dans L2(R) muni du
produit scalaire suivant [201:
< ft,fs
>= J RI
ft(x)fs(x)w(x)dx,
(2.27)
w désigne une fonction de poids,
positive, continue et uniformément bornée sur un intervalle
D de R.
Les densités ft, t ? {1,...,L},
forment un nuage dans L2(R) dont l'ACP
centrée conduit a diagonaliser la matrice M de
terme général donné par la formule suivante.
Mt,s =< ft - fu,fs - fu > .
(2.28)
avec: fu = 1
ELr=1 fr .
L
Pour estimer efficacement les éléments de la
matrice M, Kneip and Utikal ont procédé en deux
étapes:
1ereetape:
En se basant sur l'estimation par noyau de
ft, t ? {1,...,L}, définie par:
fh,t(x) = 1
nth
|
nt i=1
|
K (x - hxt,i
(2.29)
|
oil
Xnt Z ux - xt,i
K2 w(x)dx. (2.32)
h
i=1
1
A(t) = n2th2
l'estimation naturelle Mt,s de Mt,s
est donnée par:
avec:
|
Mt,s =
|
M(1)
t,s- M(2)
t,s +M(3)
t,s ,
(2.30)
|
M(1)
t,s =
|
? ????
????
|
nt ns
1 h2 Z-d vi=nt 1 L-a
vj =1 J h s K(x -x h t,i)
K(x-xs,j) w(x)dx, t
s
1 nt Ent f
Kix- hxt,i,
K(x-Xt,j) w(x)dx +
A(t), t = s
n2th2
Ei=1 ) h
|
(2.31)
|
P P
M(2)
t,s = 1 PL l=1( M(1)
t,l + M(1)
l,s ) et M(3)
t,s = 1 r M(1)
l,r .
L L2 l
2eme etape:
Dans cette etape Kneip et Utikal proposent de prendre comme
estimation de M, la matrice M de terme general:
Mt,s = fM(1) t,sMa(2)
M(3)-- t,s .(2.33)
avec:
fM(1)
t,s =
|
? ?
?
|
Mt,s ) t s
(2.34)
M(1)
t,t -- A(t) sinon
|
X
fM(2) t,s1
= L
l=1
(fM(1)
t,l + fM(1)
l,s ). (2.35)
L
X
fM(3)
t,s = L2 1
l
|
X r
|
fM(1)
l,r . (2.36)
|
L'ACP centree estimee de l'ACP centree theorique, par
l'approche de Kneip et Utikal, est obtenue en diagonalisant la
matrice de terme general donne par la relation (2.33).
Remarque
Contrairement a M, M peut avoir des
valeurs propres negatives, en pratique ces valeurs
peuvent etre interpreter par 0.
2.3.4 Application de l'approche d'estimation de Kneip and
Utikal à une ACP estimee non centree et non normee
Soit (xt,1,...,xt,nt), t ?
{1,...,L}, nt réalisations de la variable
aléatoire Xt dans R de densité inconnue ft
dans L2(R) muni du produit scalaire:
< ft,fs >=
Jft(x)fs(x)dx.
(2.37)
Les densités ft, t ? {1,...,L},
forment un nuage dans L2(R) dont l'ACP non
centrée et non normée conduit a diagonaliser la
matrice W de terme général:
Wt,s =< ft,fs > . (2.38)
Les estimations par la méthode du noyau:
fh,t(x) = 1
ntht
|
i=nt i=1
|
K(x - xt,i) (2.39)
ht
|
forment un nuage de L densités
dans L2(R) dont l'ACP non centrée et non
normée conduit a diagonaliser la matrice de terme
général:
1
Wts =
ntns
|
1
|
i=nt i=1
|
j=ns j=1
|
< K(x - xt,i ),K(x -
xs,j ) > . (2.40)
ht hs
|
hths
|
Cette ACP fournit l'estimation de l'ACP
théorique précédente. Soit
fW la matrice de terme général:
Wt,s =
|
? ?
?
|
1 'nt r K (
ht x--xt,i
n2t h? dx
si t = s
J
àWt,s sinon
|
(2.41)
|
Considérons maintenant le cas oil nt = n
et ht = h, ?t ? {1, ... ,L} et posons:
àëk l'estimation de
ëk, la k-ieme valeur propre de la matrice W,
obtenue en diagonalisant la matrice des produits scalaires
àW.
Si K est un noyau choisi parmi les 4
noyaux précédents, on a alors la
propriété suivante:
àëk =
eëk + á. (2.42)
avec:
1 1
á = n2
h2
K2(
n I
E x -h xt,i )dx.
(2.43)
i=1
1
á = 2vÐ
Dans le cas du noyau gaussien:
1
(2.44)
nh
Dans le cas du noyau triangulaire:
2
á = v3
1 nh. (2.45)
Dans le cas du noyau d'Epanechnikov:
1 nh. (2.46)
á = 3v5
25
Dans le cas du noyau rectangulaire:
1
á = 2
1 nh. (2.47)
Remarque
On peut aboutir a la relation (2.42), grâce a la
propriété matricielle suivante: 1. Si ë est valeur
propre de M alors:
ë + á est valeur propre de la
matrice M + áI (I est la matrice identité).
Exemple: ACP estimée non centrée et non
normée de densités bimodales.
Soient (xt,1,...,xt,n), t ?
{1,...,30} n réalisations de la variable
aléatoire Xt de lois 21 N(t,vt)+
21N(t+ 15,
v0.1t) et de densité ft. Pour illustrer
la méthode d'estimation précédente dans le cas oil les
densités sont estimées en utilisant le noyau
gaussien et h = n-1, nous avons
procédé a une ACP non centrée et non normée de 3
manieres différentes:
1. En diagonalisant la matrice des produit scalaire
des densités théoriques.
2. En diagonalisant la matrice des produits scalaires
des densités estimées, àW.
3. En diagonalisant la matrice
fW.
On peut voir dans le tablau 1, que la meilleure
estimation des valeurs propres ëk de W, sont les valeurs
propres eëk de fW.
k
|
ëk
|
àëk
|
eëk
|
àëk -
eëk
|
1
|
0.710
|
0.995
|
0.713
|
0.282
|
2
|
0.376
|
0.639
|
0.357
|
0.282
|
3
|
0.306
|
0.622
|
0.340
|
0.282
|
4
|
0.242
|
0.554
|
0.272
|
0.282
|
5
|
0.208
|
0.528
|
0.246
|
0.282
|
6
|
0.181
|
0.472
|
0.190
|
0.282
|
7
|
0.160
|
0.458
|
0.176
|
0.282
|
8
|
0.140
|
0.435
|
0.153
|
0.282
|
9
|
0.118
|
0.397
|
0.115
|
0.282
|
10
|
0.097
|
0.387
|
0.105
|
0.282
|
Tab.1: Les valeurs propres ëk,
àëk et eëk, obtenue en
diagonalisant les matrices W, àW,
fW respectivement (h = n-1,
n = 30).
La valeur de a dans ce tabeau, est 0.282
v 1
2H
|
|