4.3 Choix de la fenêtre de lissage
Posons maintenant:
h4 4 R(K)
AMISE(h,t) = 4
óKR(ft ) +
t ? {1,...,L} (4.29)
nth
l'erreur quadratique
asymptotique entre ft et fh,t. Si les
densités ft, t ? {1,...,L} et le
noyau K vérifient les conditions des
théoremes 2.2.1 et 2.2.2. Nous proposons de choisir la fenetre dite
optimale, celle qui minimisera la fonction suivante:
Ö(h) =
|
XL t=1
|
AMISE(h,t). (4.30)
|
En utilisant le théoreme 2.2.3 on obtient:
L
hoptimale = á(K)
[ER(ft ")
t=1
|
#--
|
5 XL
1 !
1
t=1 nt
|
1 5
|
.
|
(4.31)
|
L --
hoptimale = á(K)
[ER(ft )i
5
(L
1 )1 5 .
(4.32)
n
t=1
Si nt = n, pour t ? {1,...,L}
alors:
Exemples de calcul de R(ft "):
a) Cas de la famille de densites de lois
12N(t,vt)+
12N(0,vt)
?x ? R, ft(x) = 1 (2 ( x vt
)2'
e- 1 2 ( x-t
vt )2 + e- 1
(4.33)
2vtv2ð
· vt )2
(x - t
f00
t (x) = 1 vt )2 -
e- 1 2 ( x
v vt )2e- 1 2 (
x-t
vt )2 - e- 1 2 ( x-t
vt )2 + ( x vt)2e-
1 2 ( x . (4.34)
2t 2Ðt Par un calcul simple on
trouve:
f00t2
(x)dx = 1
R(ft ") = I81E3
[2I1(t) - 4I2(t) +
2I3(t) + 2I4(4) - 4I5(t)
+ 2I6(t)]
avec:
) ( x.vtt )2
dx,
I1(t) = L(x.`7:\ 4e-
I2(t) = fa(x.`7:)2e-(xvt t
2 dx
), I3(t) = RIe-( xvt
t )2dx.
[(w)2#177;( :t)2] dx
I5(t) = 16(t) , )2e
[(w)2#177;(:t)2]dx, = e[(w)2+(
:t)2]dx.
I4(t) = L(
x-tvt )2(
\x/t)2e
Calculons maintenant les Ii(t), i =
1,6.
I1(t) =
L(x-t
t-le-
) (xt t)2dx =
vtL y4e-y2dy
= 4vÐvt.
v
I2(t) = R IR(x-t
vt (xvt
t)2dx = vt L
y2e-y2dy = 1
Ðvt.
2
v
I3(t) = RIe (xvt
t)2 dx = vt L
e-y2dy = Ðvt.
Soit le changement de variable y
= xvt, alors:
I4(t) =
f( ) - t\2( ) X \ 2e- 12
[(x-t)2+( ,74 )2] dx v.
t
a
= f (y -
a I (y -
.0)2y2e-[(y-vt)2+y2]dy
v
t)2y2e-[(y-
1/2t )2- 4]dy = v
te-4 f(y - v
t)2y2e-(yvP2dy
a
= vte- t 4 I y4e-(y-
a v2 t )2dy - 2te- t
4 I y3e-(y-
a 1/2t )2 dy + I
y2e-(y-2t)2dy
a
= v te- 4 f(y+
2)4e-y2dy-2te4
f(y +
2)3e-y2dy I
(y + 2)2 e-y2
a
· v
v v

t(3 v v
Ð + 3 v v
Ðt + 1 Ð + 1 v
Ðt2) - 2t(3
t + 1
v v v t(1 e- t
= Ð Ðt t) + t Ðt) 4
.
4 4 16 4 8 2 4
En utilisant la même démarche on trouve:
v i
I5(t) = vte- t h1
v
Ð + 1
4 Ðt
2 4
(t) = vÐvte- 4. Par
conséquent:
vt ·1
R(f00
t ) = v 8t2e- t 4
- 3 2te- t 4 + 3 2(e- t 4 + 1) (4.35)
8 Ðt3
b) Cas de la famille de densités de lois
12N(t,vt)+
12N(0,1)
?x ? R, ft(x) = 1
2vtv2ð e
2 (xvt t )2 + 1
2v2ð e
1 2
2 x .(4.36)
· 1 2 x2
f00
t (x) = v 1 tvt e-
1 2 ( x-t
tvt(x - t
vt )2e- 2 1 (
x-t
vt )2 - 1 vt )2 +
x2e- 1 2 x2 - e- 1 . (4.37)
2 2Ð
En utilisant les notations de l'exemple précédent,
nous avons:
· 1
R(f00
t ) = 1 t3 I1(t) -
t3 2 I2(t) + t3 1 I3(t) +
2
tvtI0 1(t) - 2
tvtI0 2(t) - 2
tvtI0 3(t) + 2
tvtI0 4(t) +
I0 5(t)
8Ð
(4.38)
avec:
I1 (t) =
fri(xv-tt)2
x2e-12[( x.itt )2+x21 _x,
'd (t) =
fil(x.`7:)2e-12[(
x.7:)2+x2]dx,
I3(t) =
f,x2e-[(x%.7t t)2+x2]dx,
[(x.tt
)2+x21 _x,
4(t) = fit e 'd 4
(t) = fE(x4 -
2x2 +1)e-x2dx.
Il reste a calculer
I0i(t), i = 1,5. En
utilisant le changement de variable y = x
vt,nous avons:
fli,(x v- tt )2
x2e-[(xtt)2+x2]dx
(t) = = tvt (y- vt)2
y2e-[(y-NA)2+ty2]dy
RI
= I(y - .0)2
y2e-[(t+1)y2-2vty]dy
= I(y- vt)2
y2e-11[y2
dy
a
= Wte2+ 2(t+1) f(y
vt)2 y2e-[vt21
(y-t,/Ft1)] 2 dy.
Posons z = qt+1
2 (y- t+1), alors:
vt
2 2
(t) =
z t v+ t1 e-z2dz
Wt\/ 2 e2+
2(tt +1) 2z
t +1 t + 1 t t+ 1 t
+ 2
r " v #
v 2 v
= t t t + 1e- 2 t + t
3 Ð
2(t+1) (t + 1)2 + t3 -
4t2 + t v Ð + t4 Ð
.
(t + 1)3 (t + 1)4
En utilisant la même démarche on trouve:
i.
I02(t) = vt
q 2 hv v
t+1e- t 2 + t Ð
2(t+1) t+1 + t3
Ð
(t+1)2
i.
I0 3(t) = tvt q
2 hv v
t+1e- t 2 + t Ð
2(t+1) t+1 + t Ð
(t+1)2
q 2
I0 4(t) = vt
v 2(t+1)
.
Ð t+1e- t 2 + t
I5(t) =
34vÐ.
En remplacant ces termes dans la formule (4.38), on
obtient:
v2 ·t4 -
6t3 - 3t2 + 6t +
3 vt
R(f00 e- 2 t + t
2(t+1) + 3
t ) = v (t +
1)4vt + 1 v Ð( t3 + 1).
(4.39)
4 Ð 32
c) Cas de la famille de densites de lois
N(t,vt).
1 -
?x ? R, ft(x) = 1
vtv2ð e- 2 ( \ xvt )2
.(4.40)
· vt )2
f00 2 ( x-t
t (x) = 1 (x - t vt
)2 - e- 1
v vt )2e- 1 2 (
x-t . (4.41)
t 2Ðt
Avec les notations de l'exemple 1, nous avons:
vt
R(f00
t ) = 1
2Ðt3 [I1(t) -
2I2(t) + I3(t)] = v 3
(4.42)
8 Ð t3 .
Nous souhaitons maintenant a l'aide des 4 exemples
traités dans le paragraphe 3.1, de faire une comparaison
entre la qualité de l'estimation de l'ACP
théorique obtenue en utilisant la fenêtre optimale
donnée par la relation 4.31 et celle obtenue en associant a
chaque densité la fenêtre optimale au sens de
l'erreur quadratique intégrée
asymptotique donnée par la formule 2.17.
Pour des raisons de simplicité nous avons choisi
d'estimer les densités en utilisant le noyau
gaussien. Le caractére asymptotique des
fenêtres précédentes, nous exige de choisir des
tailles d'échantillons suffissament grandes, ici nt
= n = 30, t ? {1,...,30}.
a) Cas de la famille de densités de
lois1 2N(t,vt) +
1 2N(0,vt).
Les valeurs des aj sur les 3 premiers axes principaux,
ainsi celles des â obtenues dans les deux situations
précédentes sont données par le tableau 6.
|
fenêtres AMISE
|
hoptimale = 1.16
|
a1
|
1.34
|
2.38
|
a2
|
3.36
|
2.89
|
a3
|
2.91
|
2.61
|
â
|
1.71
|
5.72
|
Tab.6: Valeurs des áj sur les 3 premiers axes
principaux, ainsi celle de â, obtenues lors d'une ACP sur les
densités estimées, dans le cas des fenëtres AMISE
et la fenëtre hoptimale. (Famille de
densités de lois 1 2 N(t,V't) + 1 2
N(0,V't)), n = 30
Les projections des densités estimées sur le
premier plan principal, ainsi que les pourcentages
d'inertie sur les deux premiers axes principaux dans le cas des deux situations
précédentes, sont données par les
graphiques de la figure 20.
12% Fenëtres AMISE 11% hoptimale =
1.16
0.6
0.4
0.2

3 . 8 65
0.6 0.4
70% 0.2
64%

Fig.20: Allure du nuage des densités
sur le premier plan principal, obtenues lors d'une ACP
16 17 19 . 1 17
19
sur les densités estimées en utilisant les
fenëtres AMISE et la fenëtre hoptimale.
-.2
. 18
2829
(cas de la famille de densités de lois 1
. 2 . 21
. 22 25 2 N(t,V't) + 1 2
N(0,V't)), n = 30.
26
b) Cas de la famille de densités de
lois1 2N(t,vt) +
1 2N(0,1).
Les valeurs des aj sur les 3 premiers axes principaux,
ainsi celles des â obtenues dans les deux situations
précédentes sont données par le tableau 7.
|
fenêtres AMISE
|
hoptimale = 0.43
|
a1
|
5.32
|
5.36
|
a2
|
2.00
|
1.90
|
a3
|
2.91
|
2.66
|
â
|
9.52
|
9.56
|
Tab.7: Valeurs des áj sur les 3 premiers axes
principaux, ainsi celle de â, obtenues lors d'une ACP sur les
densités estimées,
dans le cas des fenëtres AMISE et la fenëtre
hoptimale. (Famille de densités de lois 1 2
N(t,./t) + 1 2 N(0,1)), n = 30
Les projections des densités estimées sur le
premier plan principal, ainsi que les pourcentages
d'inertie sur les deux premiers axes principaux dans le cas des deux situations
précédentes sont données par les
graphique de la figure 21.
7% Fenëtres AMISE 7% hoptimale =
0.43
Fig.21: Allure du nuage des
densités sur le premier plan principal, obtenues lors d'une ACP
.
17 1 . . 4
1
0.0 17
sur les densités estimées en utilisant les
fenëtres AMISE et la fenëtre hoptimale.
1
18
02
(cas de la famille de densités de lois 1
22 21
. 2 N(0,1)), n =
30.
24526 2 N(t,./t) + 1
c) Cas de la famille de densités de lois
N(t,vt).
Les valeurs des aj sur les 3 premiers axes principaux,
ainsi celles des â obtenues dans les deux situations
précédentes sont données par le tableau 8.
|
fenêtres AMISE
|
hoptimale = 1.00
|
a1
|
1.43
|
1.51
|
a2
|
1.64
|
1.73
|
a3
|
2.37
|
2.38
|
â
|
2.81
|
2.76
|
Tab.8: Valeurs des áj sur les 3 premiers axes
principaux, ainsi celle de â, obtenues lors d'une ACP sur les
densités estimées, dans le cas des fenëtres AMISE
et la fenëtre hoptimale. (Famille de
densités de lois N(t,v't)), n = 30
Les projections des densités estimées sur le
premier plan principal, ainsi que les pourcentages
d'inertie sur les deux premiers axes principaux dans le cas des deux situations
précédentes sont données par les
graphique de la figure 22.
26% Fenëtres AMISE 25% hoptimale =
1.00
Fig.22: Allure du nuage des densités
sur le premier plan principal, obtenues lors d'une ACP
16 17 16
. 17
sur les densités estimées en utilisant les
fenëtres AMISE et la fenëtre hoptimale.
. 18
(cas de la famille de densités de lois
N(t,v't)), n = 30.
0.1
20
d) Cas de la famille de densités de Gumbel.
Les valeurs des aj sur les 3 premiers axes principaux,
ainsi celles des â obtenues dans les deux situations
précédentes sont données par le tableau 9.
|
fenêtres AMISE
|
hoptimale = 0.76
|
a1
|
1.93
|
2.56
|
a2
|
2.31
|
2.66
|
a3
|
1.71
|
1.71
|
â
|
1.61
|
3.65
|
Tab.9: Valeurs des áj sur les 3 premiers axes
principaux, ainsi celle de â, obtenues lors d'une ACP sur les
densités estimées, dans le cas des fenëtres AMISE
et la fenëtre hoptimale. (Famille de
densités de Gumbel), n = 30
Les projections des densités estimées sur le
premier plan principal, ainsi que les pourcentages
d'inertie sur les deux premiers axes principaux dans le cas des deux situations
précédentes sont données par les
graphiques de la figure 23.
23% Fenëtres AMISE 21% hoptimale =
0.76

13 .




38%
33%
Fig.23: Allure du nuage des densités
sur le premier plan principal, obtenues lors d'une ACP
9 9
sur les densités estimées en utilisant les
fenëtres AMISE et la fenëtre hoptimale.
0
(cas de la famille de densités de Gumbel), n =
30.
. 22
Les résultats obtenus précédemment
concernant les valeurs des áj sur les 3 premiers axes
principaux donnés par les tableaux 6, 7, 8 et 9, ainsi celles des
valeurs des â, montrent que la différence
entre les deux procédures d'estimations n'est pas très
importante.
L'allure du nuage des densités sur le
premier plan principal donnée par les graphiques
des figures 20, 21, 22 et 23 ainsi que les
pourcentages d'inertie expliqués par les deux
premiers axes principaux, montrent aussi que les deux
procédures d'estimation ont donné des résultats
très proches, a l'exception du premier exemple, oi nous avons
enregistré une différence du pourcentage
d'inertie de 6% sur le premier axe principal.
En conclusion, nous pouvons dire que dans les deux
cas, nous sommes amenés a minimiser l'erreur
quadratique entre la densité f et son
estimation. La différence réside dans le fait que,
l'emploi de la fenêtre hoptimale, signifie
que l'ACP sur les densités estimées est faite en
minimisant globalement toutes les erreurs
quadratiques intégrées
asymptotiques. Tandis que dans l'autre
procédure d'estimation, l'ACP est faite en minimisant localement les
erreurs quadratiques intégrées
asymptotiques et cela en associant a chaque
densité la fenêtre de lissage optimale au sens de
l'AMISE.
Remarque.
La largeur de la fenêtre
hoptimale dépend, a travers les paramètres
R(f00
t ), t ? {1,...,L} des
densités inconnues ft, et ne peut donc être
utilisée telle quelle dans les calculs. Pour remédier
a ce problème nous proposons d'estimer les quantités
R(f00
t ), en remplaçant les ft
par un modèle
paramétrique approprié, par exemple le
modèle de Park et Marron (1990) suivant:
gë(x) =
ëg1(x
1 ë)
|
(4.43)
|
oi ë représente une mesure d'échelle
de la densité ft, par exemple sont
écart-type, et g1 désigne une
densité de référence connue d'echelle 1.
Si xt,1,...,xt,n, n
réalisations de la variable aléatoire de densité
ft d'ecart-type ót et g1 la
densité gaussienne N(0,1), alors
l'estimation de R(f00
t ) est donnée par:
àR(f0'
t ) = v 3 (4.44)
8 Ðs2 t
st l'estimation par maximum de vraisemblance de
ót
|