UNIVERSITE MONTPELLIER II SCIENCES ET TECHNIQUES DU
LANGUEDOC
THESE pour obtenir le grade
de DOCTEUR DE L'UNIVERSITE MONTPELLIER II
Discipline : Biostatistique Formation Doctorale :
Biostatistique Ecole Doctorale : Information Structures Systèmes
présentée et soutenue
publiquement par Ibnou DIENG le 24 janvier 2007 Titre :
Prediction de l'interaction genotype ×
environnement par linearisation et regression PLS-mixte
JURY
M. Robert SABATIER Directeur de Thèse
M. Eric GOZ'E Codirecteur de Thèse
M. Alain CHARCOSSET Rapporteur
M. Jean-Jacques DAUDIN Rapporteur
M. Gilles DUCHARME Examinateur
Mme Christèle ROBERT-GRANIER Examinateur
Résumé: Ce travail porte sur la
pr'ediction de l'interaction g'enotype × environnement et est appliqu'e au
contexte sah'elien. Après un tour d'horizon des principales m'ethodes
d'analyse de la litt'erature, nous proposons la m'ethode APLAT. Le rendement de
g'enotypes pr'edit a` l'aide de covariables d'environnement par un
modèle de simulation de cultures est d'evelopp'e en s'erie de Taylor a`
l'ordre 1 au voisinage du vecteur de paramètres d'un g'enotype de
r'ef'erence. Nous nous ramenons alors approximativement a` un modèle
lin'eaire o`u la matrice des r'egresseurs est remplac'ee par la matrice des
d'eriv'ees partielles par rapport aux paramètres. Le nombre important de
paramètres vari'etaux g'en'eralement constat'e chez les modèles
de simulation de cultures conduit a` un nombre important de r'egresseurs; d'o`u
une estimation par r'egression Partial Least Squares (PLS).
Par la suite, nous proposons APLAT-mixte, une extension de APLAT. Pour ce
modèle mixte, nous maintenons le rendement des g'enotypes lin'earis'e
dans la partie fixe auquel s'ajoute un effet al'eatoire de l'environnement,
responsable d'interactions G×E dont il faut estimer la variance. Nous
introduisons a` cet effet la technique PLS-Mixte pour estimer les composantes
de variance dans un modèle o`u il y a plus de r'egresseurs que
d'observations. L'algorithme it'eratif propos'e, qui consiste a` imbriquer la
r'egression PLS dans l'algorithme Expectation Maximization
(EM), est fond'e sur les m'ethodes de vraisemblance Maximum
Likelihood (ML) et Restricted Maximum Likelihood
(REML).
Table des matières
1
2
|
Introduction générale
1.1 Problématique
1.2 Présentation des données de l'étude
1.2.1 L'essai pluriannuel
1.2.2 L'essai multilocal
Les méthodes classiques d'analyse des interactions
G×E 2.1 Le modèle d'analyse de variance a` deux
facteurs
2.1.1 Le modèle
2.1.2 Illustration avec les données de l'essai multilocal
. . .
2.2 La méthode de régression conjointe
2.2.1 Le modèle
2.2.2 Illustration avec les données de l'essai multilocal
. . .
2.3 La méthode AMMI
2.3.1 Le modèle
|
4 4
11
12 14
18 22
22
23 26
26
27
28 28
|
2.3.2 Illustration avec les données de l'essai
multilocal . . . . 31
2.4 La régression factorielle 33
2.4.1 Le modèle 33
2.4.2 Illustration avec les données de l'essai multilocal
. . . 40
2.5 Un modèle de simulation de cultures : SarraH 42
2.6 Limites des méthodes classiques d'étude des
interactions G×E 46
3 La méthode APLAT 48
3.1 La régression Partial least squares 48
3.2 La méthode APLAT : linéarisation autour d'un
témoin . . . 52
3.2.1 Le modèle proposé 52
3.2.2 Illustration avec les données de l'essai pluriannuel
. . 58
3.2.3 Illustration avec les données de l'essai multilocal
. . . 64
3.2.4 Conclusion 64
4 La méthode APLAT-mixte 67
4.1 Le modèle mixte 69
4.2 La régression PLS sur un modèle de variance
connue 73
4.3 La méthode PLS-Mixte 74
|