WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Prédiction de l'interaction génotype à— environnement par linéarisation et régression PLS-mixte

( Télécharger le fichier original )
par Ibnou DIENG
Universite Montpellier II - Doctorat 2007
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

4.3.2 La méthode PLS-Mixte sur un modèle a` effets aléatoires corrélés de variances hétérogènes

La méthode PLS-Mixte, présentée ci-dessus et appliquée aux données de NIRS, a étéécrite avec les hypothèses classiques de normalitédes effets aléatoires et surtout de la forme particulière des matrices de variance de ces effets aléatoires. En effet, il a fallu supposer que cette variance pour chaque effet aléatoire Uk était de la forme ó2 kIqk.

Ici, nous allons légèrement relâcher cette hypothèse et considérer que la va-
riance pour chaque effet aléatoire pourrait être de la forme ó2 kAk o`u Ak est

Variation du PRESS selon les dix premières variables latentes

FIG. 4.4 quand le nombre maximum de variables a initialement étéfixéde façon successive a` 10, 20, 30, 40 et 50 pour le modèle fondésur

ML pour les données de NIRS. Le modèle fondésur REML donne des résultats voisins de ceux présentés ici.

ML

20 25 30 35 40

PRESS

2 4 6 8 10

une matrice quelconque symétrique connue. Nous allons alors voir comment la méthode PLS-Mixte s'écrira avec ces nouvelles données du problème.

Nous nous plaçons toujours dans le cadre du modèle (4.2) que nous allons rappeler.

Y = Xâ + Xr ZkUk (4.7)

k=0

Nous supposons cette fois-ci donc que Uk ~ N(0, ó2 kÄk), d'o`u V = Xr ZkÄkZ'2 k.

k=0

Avant de présenter notre méthode avec un modèle o`u n < p et la variance
V des observations écrite comme ci-dessus, nous traiterons dans un premier

temps, du cas plus simple n > p o`u nous verrons comment s'effectuent les estimations des paramètres inconnus â et ó2 k a` l'aide de l'algorithme EM fondésur ML.

Le modèle mixte a` effets aléatoires corrélés

L'algorithme EM, nous le rappelons, permet de calculer l'espérance condi-
tionnelle des effets aléatoires sachant les données incomplètes Y. Pour cela, il
est nécessaire d'avoir la loi jointe de Y et u = [ u'1 u' 2 ... u' r ]'. Nous avons

Cov(Y, u' k') = Cov(Xâ + Xr Zkuk,u' k') = Zk'Cov(uk',u' k') = ó2 k'Zk'Äk' (4.8)

k=0

car Var(uk) = ó2 kÄk V k, et Cov(uk,u'k') = 0 pour k =6 k'.

Ainsi, avec les suppositions du modèle (4.7), la loi jointe de Y et u est gaussienne de la forme .IV(12,Ó) o`u

12 =

Xâ
0
...

0

?

? ? ? ? et Ó =

?

" #

V Cov(Y,u')

Cov(u,Y') Var(u)

(4.9)

avec Cov(Y,u') = [ ó2 1Z1Ä1 . . . ó2 rZrÄr ]

21Ä1Z'1

?

Cov(u,Y') = ? ..

? .

ó2 rÄrZ' r

ó2 1Ä1

et Var(u) = 0 ... 0

ó2 rÄr

Ce qui implique la fonction de densitésuivante

Pr

fY,u1,··· ,ur(Y, u1, · · · , ur) = (2ð)- 1 k=0 qk|Ó|- 1

o`u

2 2 exp(-1 2Q) (4.10)

[ ]

Q = (Y - Xâ)' u' 1 · · · u' Ó-1

r

Y - Xâ
u1
...

(4.11)

ur

Nous allons donc avec les développements qui vont suivre, trouver les valeurs de |Ó| et de Ó-1 dans le but de simplifier la densité(4.10). Il s'agira par la suite, de dériver tout simplement cette densité, pour avoir les estimations des paramètres.

Pour calculer |Ó|, nous faisons appel au résultat déjàétabli (Searle et alp 453, 1992) : Si A, B, C et D sont quatre matrices avec les bonnes dimensions, alors

~~~~~

A B
C D

~~~~~

= |D||A - BD-1C|

Ainsi,

|Ó| =

~~~~~

V Cov(Y,u')

Cov(u,Y') Var(u)

~~~~~

= |Var(u)||V - Cov(Y, u')(Var(u))-1Cov(u, Y')|

|Var(u)| =

~~~~~~~~

ó21Ä1

0 ... 0

ó2 rÄr

~~~~~~~~

= |ó21Ä1| × ··· × |ó2 rÄr| =

Lr
k
=1

2 k)qk|Äk|

Or,

car chaque matrice Äk est carree de nombre de lignes qk D'autre part,

Cov(Y, u')(Var(u))-1Cov(u, Y')

= [ ó21Z1Ä1 ··· ó2 rZrÄr ]

ó1 2Ä1-1

0
·
·
·

0

ó-2

r Ä

-1 r

ó2 1Ä1Z' 1

·
·
·

ó2rÄrZ'r

=

Xr
k
=1

ó2kZkÄkZ' k

Or,

(Var(u))-1Cov(u, Y') =

0
·
·
·

0

ó-2

r

Ä

ó21Ä1Z'1

·
·
·

ó2rÄrZ'r

-1

r

ó-2

1 Ä1-1

=

Z'1

·
·
·

Z'r

D'o`u

|Ó| = Yr (ó2k)qk|Äk||V - Xr ó2 kZkÄkZ' k|

=

Yr
k
=1

k=1 k=1

2k)qk|Äk||ó20Ä0|

=

Yr
k
=0

2k)qk|Äk|

Pour calculer Ó-1, nous utilisons les resultats des inverses generalisees (Searle et al p 450, 1992) et etablissons que

" #

=

0 0

0 (Var(u))-1

"+

# I

ó,:72Ä:7, 1 [ I -Cov(Y, u')(Var(u))-1

-(Var(u))-1Cov(u, Y')

Par ailleurs,

Cov(Y, u')(Var(u))-1 = [ Z1 · · ·Zr

Par cons'equent,

Ó-1 = Ó1 -1 + Ó-1

2

o`u Ó1 1 =

ó-2

1 Ä-1

1

?

m ?0

... 0

ó-2

r Ä-1

r

I

et Ó2 -1 =

-

Z'1

...

h h i i

ó-2

0 Ä-1 I - Z1 · · · Zr

0

Z' r

Nous allons donc remplacer Ó-1 par Ó-1

1 -1

2 dans (4.11) pour avoir la valeur

de Q.

Ainsi,

Q = Q1 + Q2

o`u Q1 = [ (Y - Xâ)' u'1 · · · u' Ó-1

r 1

Y - Xi3
u1

...

ur

et Q2 = [ (Y - Xâ)' u'1 · · · u'Ó-1

r 2

Y - Xi3
u1

...

ur

m 0

m ?0

?

? ó-2

1 Ä-1

1

... 0

r 2Är-1

ó

Q1 = [ (Y - Xâ)' uc. · · · u'r ]

Y - Xi3
u1

...

ur

= I 0 [ u'1 · · · u'r ]

 

ó-2

1 Ä-1

1

0

...

0
ór 2Är-1

Y - Xi3
u1

...

ur

= [ u'1 · · · u'r ]

ó-2

1 Ä-1

1

0

...

0
ór 2Är-1

u1

...

ur

u'kÄk 1uk

=

ó2

k

Er
k=1

Pour calculer Q2, trouvons d'abord une formule simplifiée de Ó-1

2

I

Ó-1

2 =

-

Z'1

...

Z'r

ó

0 2Ä,Y1 [ I - [ Z1 ··· Zr ] ]

 

Ä01 ,y1 [ Z1 ·

1

·· Zr ]

 

= ó-2

0

-

Z'1

...

Z'r

? ?

Ä-1 ?

0 ?

Z'1

...

Z'r

Ä01 [ Z1 · · · Zr ]

 

Ainsi Q2 = ó02 [ Q21 Q22 ]

Y - Xi3
u1

...

ur

 

Z'1
...

Z'r

Ä0-1

 

?

?

avec Q21 = (Y - Xâ)'Ä-1

0 - [ u' 1 · · · u' r ] ? ?

Ä-1

0 [ Z1 · · · Zr ]

Z' r

Z' 1

...

? ?

et Q22 = -(Y-Xâ)'Ä-1

0 [ Z1 · · · Zr ]+[ u' 1 · · · u' r ] ? ?

D'o`u,

Z'1

...

Z'r

? ?

Q2 = ó-2 ? r ]

0 ?(Y - Xâ)'Ä-1

0 - [ u' 1 · · · u'

? ?

? ?

? Ä-1 ? (Y - Xâ) ? 0 ?

Z'1

...

Z'r

?
? ? ?

- ó-2

0

? ?

(Y - Xâ)'Ä-1

0 [ Z1 · · · Zr ] - [ u' 1 · · · u' r ] ? ?

?

? ?Ä-1

0 [ Z1 · · · Zr ]

?

u1

×

...
ur

 

- 2 (Y - Xâ)'Ä-1

0 -

Xr
k
=1

!

u' kZ'-1 (Y - Xâ)

ó0

=

0

- ó-2

0

(Y - Xâ)'Ä-1

0

Xr
k
=1

Zkuk -

Er
k=1

u'kZ'0-1

Xr
k
=1

!Zkuk

 

!

Xr Xr

Zkuk - ó-2 u' kZ'-1 Y - Xâ - Zkuk

0 0

k=1 k=1

- 2 (Y - Xâ)'Ä-1 Y - Xâ -

0

Er
k=1

ó

=

0

! Xr

u' kZ'-1 Y - Xâ - Zkuk

0

k=1

- 2 (Y - Xâ)'Ä-1

0 -

Xr
k
=1

= ó 0

= ó-2 Y - Xâ -

0

Xr
k
=1

!' Xr

Zkuk Ä-1 Y - Xâ -

0

k=

1

Zkuk)

u' -1

k uk + ó-2 Y - Xâ -

ó2 0

k

) !

X

Zkuk Ä-1 Y - Xâ - Zkuk (4.12)

0

k=1

Q = Xr

k=1

Er
k=1

' r

En ajoutant Q1 et Q2, nous obtenons

En remplaçant (4.11) dans (4.9) et en passant au logarithme, nous avons

l = -1

2

X r
k
=0

log27r --

) k -

k=0 k=1

1 Er (gkiegOlc + loglAkl) -- 1 `-r uk' Ä-1u1 qk '

2

2 L--1

ó2

k

Zkuk) Ä0 1 Y

- Xâ-

-2 ó0

2

Y - Xâ -

Xr
k
=1

EZkuk)

k=

1

1

-

2

X r
k
=0

) 1(qklogó

r r 1.1' Ä-1uk

qk log27r -- Nlc + log|Äk |) - V k k

2 1---/ 2 L--/ ,.,.2

"

k=0 k=0 k

car Y - X0 - Xr Zkuk = e = u0

k=1

De ce fait, il suffira de d'eriver la fonction l ci-dessus par rapport a` chacun des param`etres inconnus du mod`ele (4.7) pour trouver les estimateurs suivants

= ukÄk 1uk/qk, k = 0,1,· · · r (4.13)

et

XS = X(X'Ä,y1X)-X'Ä,y1 Y -

k=1 Zkuk) ) (4.14)

Ainsi, comme les uk ne sont pas connus, nous avons besoin des esp'erances conditionnelles de

u'k k 1uk

et de

r
Y - Zkuk

k=1

sachant les donn'ees incompl`etes Y.

Pour cela, nous pouvons utiliser le r'esultat suivant : si

I # I # I

x1 u1 V11 V12

~ N ,

x2 u2 V21 V22

alors la loi conditionnelle de x1 sachant x2 est

x1|x2 ~ N[u1 + V12V-1

22 (x2 - u2), V11 - V12V-1

22 V21]

Avec uk ~ N(0,ó2 kÄk) et Y ~ N(Xâ,V), nous avons

I # I # I #!

uk 0 ó2 kÄk Cov(uk, Y')

~ N ,

Y Xâ Cov(Y,u' k) V

D'apr`es (4.8), il vient

uk|Y ~ N (ó2 )

kÄkZ' kV-1(Y - Xâ), ó2 kÄk - ó2 kÄkZ' kV-1ó2 kZkÄk

D'o`u

kV-1(Y - Xâ)

[(uk|Y) = ó2 kÄkZ' (4.15)

Ensuite, en utilisant le th'eor`eme suivant (Searle p 231, 1987)

Théorème 1

si x ~ N(u, V) alors[(x'Ax) = tr(AV) + u'Au ? A

et d'apr`es ce qui pr'ec`ede, nous avons

-1-1

E(u' k uk|Y) = tr(ó2-1

k Äk - ó4 k ÄkZ' kV-1ZkÄk)

4k(Y - Xâ)'V-1ZkÄ;cÄk 1ÄkZ'kV-1(Y - Xâ)

D'o`u

E(u'-1 k uk|Y) = tr(ó2kIqk - ó4kZ'kV-1ZkÄk) 4k(Y - Xâ)'V-1ZkÄ'kZ'kV-1(Y - Xâ) (4.16)

Nous pouvons alors établir l'algorithme EM dans le cas du modèle linéaire mixte o`u chaque effet aléatoire est de variance ó2kÄk. L'estimation, fondée sur ML, s'effectue en plusieurs itérations. Des valeurs initiales ók 2(0) et â(0) sont choisies au départ. A la me itération de l''Etape-E, sont calculées les espérances conditionnelles suivantes, a` partir de (4.16),

g(k m) = E(ukÄk 1uk|Y)|0=0(0) et óZ=óZ(m) (4.17)

= tr(ók(m)Iqk) - ó4(m)

k tr(Z' kV-1(m)ZkÄk)

+ók 4(m) (Y - Xâ(m))'V-1(m)ZkÄ'kZ'kV-1(m)(Y - Xâ(m)) = qkók + (ó4(m)

2(m) k )

× [ (Y - Xâ(m))'V-1(m)ZkÄ'kZ'kV-1(m) (Y - Xâ(m)) - tr(Z'kV-1(m)ZkÄk)]

Et, a` partir de (4.15)

b(m) =E(Y -

Xr
k
=1

Zkuk|Y)0=0(0) et ó2 (4.18)

k=ó2(m)

k

= Y - Xr ZkÄkZ;2k (m)V-1(m)(Y - Xâ(m)) k=1

= Y - (V(m) - ó,!,(m)Ä0)V-1(m)(Y - Xâ(m))

= Y - V(m)V-1(m)(Y - Xâ(m)) + ó02(m)Ä0V-1(m)(Y - Xâ(m)) = Xâ(m) + ó0 2(m)Ä0V-1(m)(Y - Xâ(m))

A l''Etape-M, pour trouver les estimateurs, il suffit de prendre

ók

2(m+1)

.ik m)/qk (4.19)

= 4,(m) + (4(m)/qk)

× [(Y - Xâ(m))'V-1(m)ZkÄ;,Z'kV-1(m)(Y - Xâ(m)) - tr(Z'kV-1(m)ZkÄk)]

Et, a` partir de (4.14)

Xâ( 1)

= X(X'Ä,y1X)-X'Ä,y1 (Xâ(m) + ó0 2(m)Ä0V-1(m)(Y - Xâ(m)) ) (4.20)

= X(X'Ä-1

0 X)-X'Ä-1

0 Xâ(m) + ó0(m)X(X'Ä,y1X)-X'ÄC,1Ä0V-1(m)(Y - Xâ(m)) = Xâ(m) + 4(m)X(X'Ä1X)-X'V-1(m)(Y - Xâ(m))

A la place d'itérer pour obtenir a` la fois les valeurs de â et de ó2k, Laird (1982) suggère de trouver les valeurs de ó2k et seulement, a` la fin des itérations, de calculer la valeur de â. En effet, a` la place de calculer V-1(m)(Y - Xâ(m)) dans l'équation (4.19), il est calculéP(m)Y o`u

P(m) = V-1(m) - V-1(m)X(X'V-1(m)X)-X'V-1(m)

ne depend pas de â.

En effet, si Xâ(m) etait l'estimation de Xâ, c'est-`a-dire

Xâ(m) = X(X'V-1(m)X)-X'V-1(m)Y

alors

V-1(m)(Y - Xâ(m)) = V-1(m)Y - V-1(m)Xâ(m)

= V-1(m)Y - V-1(m)X(X'V-1(m)X)-X'V-1(m)Y = (V-1(m) - V-1(m)X(X'V-1(m)X)-X'V-1(m)) Y

= P(m)Y

De ce fait, il ne sera pas necessaire de disposer de â(m) dans les iterations et a`
l''Etape-E. Il ne sera alors plus calculequ'une seule esperance conditionnelle

ó2(m+1)

k =

bs(m)

k /qk (4.21)

= ó2k (m) + (4(m)/qk) [ Y'P(m)ZkÄ'kZ'kP(m)Y - tr(Z'kV-1(m)ZkÄk)]

Nous presentons ci-dessous l'algorithme EM fondesur ML appliqueaux effets aleatoires corr'el'es du mod`ele mixte.

'Etape 0 Mettre m = 0 et choisir des valeurs initiales ó2k(0)

'Etape 1 ('Etape-E) Calculer

Q(ó2 | ó2(m))

= Eó2(m) (ukÄk 1uk | Y)

= qkók (Irk2(m) + 4(m) [Y'P(m)Zk k Ä' Z' P(m)Y -- tr(Z'kV-1(m)ZkÄk)1

o`u P(m) = V-1(m) -- V-1(m)X(X'V-1(m)X~-X'V-1(m)

'Etape 2 ('Etape-M) Determiner ó2k(m+1) qui maximise Q(ó2 | ó2(m)) c'est-`a-dire,

tel que Q(ó2(m+1) | ó2(m)) ?. Q(ó2 | ó2(m)). Alors,

ók2(m+1) = E 2(m) (ukÄi;1uk | Y)/qk for k = 0,1,
·
·
· , r

'Etape 3 A la convergence c`ad L(ó2k (m+1) | Y) -- L(ó2k (m) | Y) ,.... ç o`u

ç est une quantitearbitrairement petite et L la fonction de vraisemblance, prendre2k = ók2(m+1) et alors calculer

X-â = X(X'V-1(m+1)X)-X'V-1(m+1)Y

sinon ajouter 1 a` m et retourner a` l''Etape 1.

Simulations pour la convergence de l'algorithme EM appliqu'e aux effets al'eatoires corr'el'es du mod`ele mixte :

Pour tester la convergence de cet algorithme et verifier la qualitedes estima-
tions, nous avons effectuedes simulations numeriques. Nous avons considerea` cet effet le modele simple suivant :

Y = X/3 + Z1u1 + Z2u2 + Z0u0 (4.22)

o`u la dimension du vecteur des reponses Y est 120x1, celle de la matrice des observations X est 120x5 et le vecteur 13 des parametres fixes est de longueur 5. Aussi, avons-nous suppose

? ????

????

u1 ~ N(0,ó21Ä1)

u2 ~ N (0, ó2 2Ä2)
u
0 ~ N (0, ó2 0Ä0)

?

o`u Ä1 =

???????

2 1 1 1 1

1 1 1 1 1

1

1

2
1
1

1
1

1

2
1

1 1 1 1 1

?

,

???????

?

? ? ? ? ? ? ? ? ? ?

Ä2 =

3 1 1 1 1 1

1

2 1 1 1 1

1 1 1 1 1 1

1
1
1

3
1
1

1 1 1 1

3
1

1 1 1 1

1

2

?

et Ä0 = I120.

??????????

Nous avons choisi un dispositif équilibréavec le facteur 2 (6 niveaux) hiérarchisédans le facteur 1 (5 niveaux). Les matrices Z1 et Z2 sont donc les matrices

d'incidence correspondantes a` ces deux facteurs tandis que la matrice Z0 est l'identitéd'ordre 120.

Nous présentons au Tableau 4.3 les résultats des simulations obtenues avec le modèle 4.22 sur 300 jeux de données.

 

Valeurs simulées

Valeurs estimées

 

0,5402
0,8948

Moyenne

0,5380

0,8974

'Ecart-type

0,0937

0,0931

â

0,6476

0,6423

0,0912

 

0,9513

0,9526

0,0921

 

0,0772

0,0748

0,0933

ó21

0,4653

0,4241

0,4416

ó2 2

0,2458

0,2471

0,3324

ó2 0

0,9226

0,8874

0,1233

TAB. 4.3 - Résultats des simulations pour un modèle mixte a` effets aléatoires corrélés effectuées sur 300 jeux de données.

Au vu de ces résultats, les valeurs estimées pour les paramètres ne sont pas, en moyenne, éloignées des valeurs simulées.

Le modèle PLS-Mixte a` effets aléatoires corrélés

Nous venons ainsi de voir, a` la section pr'ec'edente, l'estimation des paramètres
fixes et des composantes de variance dans un modèle lin'eaire mixte, a` l'aide
de l'algorithme EM, o`u chaque effet al'eatoire est de variance ó2 kÄk et o`u n > p.

Le cas n < p avec cette même structure de variance des effets al'eatoires, n'ecessite, comme au chapitre pr'ec'edent, d'imbriquer la r'egression PLS, en tant que m'ethode de r'eduction de dimension, a` l'algorithme EM. Nous proposons l'algorithme PLS-Mixte suivant, fond'e sur la variation de ML propos'ee par Laird

'Etape 0 Mettre m = 0 et choisir des valeurs de depart ó2k(0)

'Etape 1 Centrer et reduire X et Y : x0 = X, y0 = Y

'Etape 1.1 For h = 1, 2, ... , rang(X)

(a) Calculer les p-vector wh = [w1h · · · wph]' o`u wph = Cov(xph, yh)/ E Cov2(xph, yh) et xph la pe

p

colonne de xh

(b) Normer wh : wh = wh/ II wh II

(c) Calculer les variables latentes t(m)

h = xh-1wh

(d) Calculer ch par regression GLS de yh-1 sur t(m)

h

yh-1 = t(h m)ch + yh o`u Var(yh-1) = V(m) =

Er
k
=0

ZkÄk Z'2k m)

ch =(t(h m)'V-1(m)t(hm))-t(h m)'V-1(m)yh-1

(e) Calculer ph par regression de xh-1 sur t(m)

h

xh-1 = t(h m)p'h+ xh p'h =(t(h m)'t(hm) )-1t(h m)'xh-1

(f) Calculer les residus xh and yh

(g)

Er
i
=0

Ziui

Finalement Y = T(m)C +

o`u T(m) =[t(m)

1 ···t(h m)] et C = [c1 · · · ch]'

'Etape 1.2 Calculer

2m+1)

ók( = ó2k (m) (ók (m) / qk) [YP(m) Z k Ä'kZ'kP(m)Y - tr(Z'kV -1(m) Zk k)1

o`u P(m) = V-1(m)-V-1(m)T(m)(T(m)'V-1(m)T(m))-T(m)'V-1(m)

'Etape 2 Si convergence, prendre2k = ó2k(m+1) ; sinon ajouter 1 a` m

et retourner a` 'Etape 1.1

Bien evidemment, le changement par rapport a` l'algorithme de la section precedente concerne l''Etape 1.1 (d) et l''Etape 1.2 o`u l'estimation des ó2k tient compte de la variance ó2kÄk des effets aleatoires uk.

En resume, les estimations dans le mod`ele PLS-Mixte a` effets aleatoires
corr'el'es ont ete'ecrites de mani`ere explicite. Neanmoins, pour l'algorithme

itératif proposéa` cet effet, la convergence n'a pas étéétablie et est restée locale.

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"I don't believe we shall ever have a good money again before we take the thing out of the hand of governments. We can't take it violently, out of the hands of governments, all we can do is by some sly roundabout way introduce something that they can't stop ..."   Friedrich Hayek (1899-1992) en 1984