I/I - X(X'X)-1X')Y1J/J
bg1 = (II - 1I1'
bE' 1 =
1'IY(IJ -
1J1' J/J -
Z(Z'Z)-1Z')I
b =
(X'X)-1X'YZ(Z'Z)-1
I/I - X(X'X)-1X')YZ(Z'Z)-1
bg3 = (II - 1I1'
bE' 3=
(X'X)-1X'Y(IJ
-
Z(Z'Z)-1Z')
Cependant, cette facon d'ecrire le mod`ele et les
calculs qui en decoulent sont lies a` la structure des donnees. En effet, dans
ce que nous avons presente, les observations sont supposees àetre dans
une matrice a` I lignes et J colonnes, ce qui
prevoit cette matrice de donnees compl`ete. Cela s'interpr`ete dans le cas d'un
essai multienvironnement par exemple, par le fait que chaque genotype doit
àetre present dans chaque environnement. Or la realiteest souvent
autre.
Pour les essais o`u toutes les varietes ne sont pas dans tous
les environnements, cette methode, qui est ici generalisee avec
p covariables associees au facteur genotype et q
covariables liees au facteur environnement, peut se presenter sous forme
indicielle.
Yij = m (E
p
|
xiMp + gi) + (E
q
|
zj áq 3
E ) + E
p,q
|
xp. zqjã+
e · · (2.3)
z pq z3
|
|
o`u gi represente la part des effets moyens
non expliquee par les covariables X et Ej
celle non expliquee par les covariables Z ;
xpi etant la valeur de la
pe covariable associee au genotype i
et zqj la valeur de la
qe covariable associee a` l'environnement
j.
Les vecteurs ã =
|
r11
lfp 713.
|
, á =
|
(
|
á1
... áq
|
? ? ? ?
|
et â =
|
(
â1
)
.
âp
|
|
sont estimes par regression du vecteur Y des
observations, de longueur IJ, respectivement sur
le produit semi-tensoriel ligne (Dieng, 2003) des deux
matrices des covariables, sur la matrice de covariable
attach'ee au facteur environnement et sur la matrice de covariable attach'ee au
facteur g'enotype. Nous reprenons ci-après la d'efinition du produit
semi-tensoriel ligne.
D'efinition 1 Produit semi-tensoriel ligne Si A est une
matrice rectangulaire (m,r),
Si B est une matrice rectangulaire (m,s),
A ? B est dit produit semi-tensoriel ligne de A par B.
C'est une matrice rectangulaire (m,rs) qui se présente ainsi
a11 · B[1,]
?
a21 · B[2,]
? ? ? ? ? ...
am1 · B[m,]
|
a12 · B[1,] a22
· B[2,]
...
am2 · B[m,]
|
· ·
· ·
· ·
|
· ·
·
|
a1r · B[1,]
?
a2r · B[2,]
... ?????
amr · B[m,]
|
o`u B[m,] est la me ligne
de B. Autrement dit, A ? B est la juxtaposition de tous les produits termes a`
termes possibles entre une colonne de A et une colonne de B.
Nous nous servons du produit semi-tensoriel ligne pour obtenir
la matrice d'incidence pour l'interaction a` partir des matrices d'incidence
des effets simples.
Avec cette pr'esentation indicielle, la r'egression
factorielle est effectu'ee en deux 'etapes : d'abord la r'egression des
observations sur le produit semitensoriel ligne des deux matrices de
covariables et celle sur les deux matrices des covariables auxquelles est
ajout'ee par la suite l'estimation des r'esidus de ces r'egressions.
Nous pr'esentons ci-dessous un modèle, plus g'en'eral, o`u
tous les paramètres sont estimables en une seule 'etape.
Y = m1IJ + X ·a1
+X·n2 + Z ·b2
+L·Ib2 + X ? Z ·
(ab)11
- Xn1 est la régression sur les
covariables génotypes
+x? Z ·
(ab)21 + X ?7L·
(ab)12
+X?7L·
(ab)22 + e
- Y est le vecteur des observations, de longueur
IJ
- m1IJ est la moyenne générale des
observations
->Xn2 est l'écart des effets génotype a` la
régression sur les covariables génotypes,
-7Lb2 est l'écart des effets environnements a` la
régression sur les covariables - Zb2 est la
régression sur les covariables environnements
Xétant la matrice d'incidence des génotypes
-x?Z(ab)21 est l'effet des
covariables environnements modulépar les génotypes - X ?
Z(ab)11 est l'effet des covariables environnements
modulépar les cova-
environnements,7Létant la matrice d'incidence des
environnements
riables génotypes
non expliquépar les covariables génotypes
- X ?L(nb)12
est l'effet des covariables génotypes modulépar les
environnements non expliquépar les covariables environnements
-x?7L(ab)22
est l'interaction G×E expliquée ni par les
covariables génotypes, ni par les covariables environnements.
Ainsi, les paramètresa1,a2,b2,b2,
(ab)11,
(ab)21,
(ab)12,
(rb)22, sont estimés par simple
régression linéaire sur les matrices et vecteurs
adéquats.
Exemple d'écriture pour un essai multilocal :
Pour un essai multilocal de 3 génotypes effectuéen 2
lieux différents o`u nous avons 2 covariables associées au
facteur lieu et 1 covariable associée au facteur variété,
les vecteurs et matrices se présentent comme suit :
39
? ? ? ? ? ? ? ? ? ? ?
? ? ? ? ? ? ? ? ? ? ?
Y11
Y21
Y31
Y12
Y22
Y32
Y=
? ? ? ? ? ? ? ? ? ? ?
X=
? ? ? ? ? ? ? ? ? ? ?
? ? ? ? ? ? ? ? ? ? ?
? ? ? ? ? ? ? ? ? ? ?
Z=
X=
X111 X211
X311 X121 X221
X321
? ? ? ? ? ? ? ? ? ? ?
? ? ? ? ? ? ? ? ? ? ?
XeZ=
X111Z111
X111Z112
X211Z121
X211Z122
X311Z211
X311Z212
X121Z221
X121Z222
X221Z311
X221Z312
X321Z321
X321Z322
? ? ? ? ? ? ? ? ? ? ?
I
? ? ? ? ? ? ? ? ? ? ?
Z=
1 0 1 0 1 0
0 1 0 1 0 1
Z111 Z112
Z121 Z122 Z211
Z212 Z221 Z222
Z311 Z312 Z321
Z322
1 0 0 0 1 0 0 0
1 1 0 0 0 1 0 0 0
1
? ? ? ? ? ? ? ? ? ? ?
?
XeZ=
? ? ? ? ? ? ? ? ? ?
|
Z111
0 0
Z221
0 0
|
Z112
0 0
Z222
0 0
|
0
Z121
0 0
Z311
0
|
0 0
Z212
X e
0
0
Z322 1
|
? ? ? ? ? ? ? ? ? ? ?
|
X111 X211 X311
0 0 0
|
0
?
0 0
X121
X221 ? ? ? ? ? ? ? ? ? ?
X321
|
0 0
Z122 0
0 Z211
0 0
Z312 0
0 Z321
0
|
0
|
0
|
0
|
0
|
0
|
1
|
0
|
0
|
0
|
0
|
0
|
0
|
1
|
0
I
|
0
|
0
|
0
|
0
|
0
|
0
|
1
|
0
|
0
|
0
|
0
|
0
|
0
|
1
|
0
|
1 0 0
1 0 0
x? =
? ? ? ? ? ? ? ? ? ? ?
Jusqu'àmaintenant les covariables sont supposées
continues. Toutefois, cette méthode est encore valable dans le cas o`u
elles sont de type qualitatif. Il suffit de la même manière que
l'on passe de la régression a` l'analyse de variance, de remplacer
chaque colonne de la matrice de covariables par des colonnes indicatrices des
niveaux de la colonne de covariable qualitative considérée
(Denis, 1980).
Dans le cas o`u les covariables sont trop nombreuses,
différentes méthodes de sélection sont
présentées dans (Denis, 1980).
|