WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Prédiction de l'interaction génotype à— environnement par linéarisation et régression PLS-mixte

( Télécharger le fichier original )
par Ibnou DIENG
Universite Montpellier II - Doctorat 2007
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

Chapitre 1

Introduction générale

1.1 Problématique

Au Sahel, les pr'ecipitations annuelles ont diminu'e de l'ordre de 20 a` 30 % dans la dernière moiti'e du 20e siècle (Baterburry et Warren, 2001) et leur d'eficit y demeure la plus forte contrainte a` l'agriculture (Tucker, 1991).

Dans de telles conditions, les paysans, qui constituent la majorit'e de la population, parviennent difficilement a` g'en'erer des revenus r'eguliers tout en g'erant durablement les ressources naturelles. L'agriculture, qui est pourtant le principal moteur du d'eveloppement 'economique et social du Sahel, ne peut ainsi jouer pleinement son ràole.

Dans ce cadre difficile, le ràole des d'ecideurs ('Etats, ONG, Organismes de coop'eration, Recherche) est de r'epondre a` la demande sociale, principalement »la promotion d'une agriculture productive, diversifi'ee, durable [...]». Ce sont les termes employ'es dans le Cadre strat'egique de s'ecurit'e alimentaire (CSSA), le document de r'ef'erence en matière de s'ecurit'e alimentaire du Comit'e permanent inter-'etats de lutte contre la s'echeresse au Sahel (CILSS).

Ce cadre stratégique qui vise aussi »l'amélioration durable des conditions d'accès des groupes et zones vulnérables a` l'alimentation», a ététraduit en programmes de sécuritéalimentaire pour la plupart des pays sahéliens (CILSS, 2000). Ce document est venu confirmer le mandat déjàattribuéau Centre d'étude régional pour l'amélioration de l'adaptation a` la sécheresse (CERAAS) par le Réseau de recherche sur la résistance a` la sécheresse (R3S) du CILSS.

Le CERAAS est un laboratoire national de recherche a` vocation régionale sous double tutelle. C'est un laboratoire de l'Institut sénégalais de recherches agricoles (ISRA), qui a la mission d'exécuter le programme national de recherche sur l'adaptation des plantes a` la sécheresse. Il est aussi une Base Centre du Conseil ouest et centre africain pour la recherche et le développement agricole (CORAF), chargéde conduire les recherches sur la thématique de l'adaptation des plantes a` la sécheresse et celle de la création variétale.

Le CERAAS conduit des recherches suivant quatre axes principaux :

1. la compréhension de la réponse des plantes;

2. la modélisation du fonctionnement des plantes;

3. l'amélioration de la méthodologie de la sélection

4. l'amélioration des systèmes de culture pour une meilleure adaptation a` la sécheresse.

Au troisième axe, l'objectif est d'identifier et de sélectionner du matériel végétal mieux adaptéa` la sécheresse, stabilisant ainsi le déficit alimentaire dans les pays des régions sèches. Pour atteindre cet objectif, les activités de recherche visent a` fournir des solutions techniques pour réduire l'effet dépressif de la sécheresse sur les productions agricoles. Ces solutions consistent a` proposer des méthodes de sélection, de suivi des cultures et des itinéraires techniques tenant compte du milieu ciblé, qui est soumis a` la contrainte hydrique.

La s'election porte sur des caractères ph'enologiques, physiologiques et mol'eculaires permettant une production am'elior'ee en conditions de d'eficit hydrique par rapport aux cultivars g'en'eralement vulgaris'es. Elle est valid'ee par des essais en plein champ, r'ealis'es dans des conditions qui reflètent la variabilit'e du milieu auquel les vari'et'es sont destin'ees. Ces essais peuvent avoir lieu la même ann'ee, sur plusieurs endroits (essai multilocal) ou sur plusieurs ann'ees, au même endroit (essai pluriannuel) ou sur plusieurs ann'ees, sur plusieurs endroits. Par la suite, nous d'esignerons tous ces types d'essais sous le nom g'en'erique d'essai multienvironnement et emploierons ce terme chaque fois qu'il n'y aura pas d'ambigu·ýt'es et que nous voulons nommer un ensemble d'essais.

Dans cette zone du Sahel a` fort risque climatique, il est souvent constat'e une variabilit'e de l''ecart entre le rendement des g'enotypes lors de ces essais multienvironnements de s'election vari'etale. Cette variabilit'e est connue des s'electionneurs sous le nom d'interaction g'enotype × environnement (G×E) a` laquelle nous nous int'eressons dans ce travail.

Un cas particulier d'interactions 'etant un changement de classement direct des g'enotypes. Si trois g'enotypes A, B et C sont test'es sur plusieurs environnements, nous sommes en pr'esence d'interactions G×E si pour le premier environnement, les g'enotypes se classent A-B-C selon leurs rendements et pour le deuxième environnement, ils se classent par exemple B-A-C. Dans ce cas et même dans le cas plus g'en'eral o`u les diff'erences entre g'enotypes dependent de l'environnement, il sera difficile pour un environnement cible o`u les g'enotypes n'ont pas encore 'et'e test'es, de pr'edire le meilleur g'enotype.

Dune manière g'en'erale, les essais multienvironnements ne peuvent être assez pr'ecis. En effet, en dehors d'une ou de deux vari'et'es t'emoin g'en'eralement reconduites dune ann'ee a` lautre, chaque vari'et'e n'est vue que deux a` cinq ans. Au regard de la forte interaction g'enotype × ann'ee (G×A), ces deux a` cinq ans sont un 'echantillon de taille trop faible. Le s'electionneur doit

souvent extrapoler a` partir de ce nombre d'années faible ou d'un essai multi-local o`u l'interaction génotype x lieu (GxL) ne reproduit qu'imparfaitement l'interaction GxA.

Les interactions GxE gênent donc la sélection variétale et constituent un obstacle aux recommandations éventuellement formulées aux paysans pour l'adoption de cultivars adaptés a` leurs milieux. Une solution est de modéliser ces interactions GxE dans le but de les prédire pour une situation nouvelle en fonction de variables environnementales dont on connaàýt la valeur (ex : nature et profondeur du sol) ou la loi de probabilité(ex : précipitations) (Piepho, Denis et van Eeuwijk, 1998).

Nous proposons alors dans ce travail, une méthode de modélisation des interactions GxE, qui permette de tenir compte de l'impact aléatoire de l'environnement induit principalement au Sahel par une variabilitéclimatique, pour une meilleure prédiction de la réponse des variétés.

Plusieurs méthodes d'analyse des interactions ont étéproposées dans la littérature et sont exposées au chapitre 2. Ces méthodes peuvent être rangées, a` notre sens, en deux catégories : celles qui utilisent les caractéristiques des environnements et celles qui ne les utilisent pas. Pour ces dernières, dont nous pouvons citer la méthode Additive Main effects and Multiplicative Interactions (AMMI) ainsi que la régression conjointe, la critique majeure est qu'elles ne tiennent pas compte justement des environnements cibles pour y prédire le rendement des génotypes. Ce n'est pas adaptédans cette zone du Sahel, car comme nous avions annoncé, les interactions GxE y sont la conséquence principalement de la grande variabilitéclimatique des environnements. Mais ce qui gêne en réalité, c'est la présence de l'interaction GxA qui est imprévisible, au contraire de l'interaction GxL. Talbot (1997) a établi que l'interaction GxAxL est plus importante que l'interaction GxA, ellemême plus importante que l'interaction GxL. C'est certainement le cas au Sahel, o`u la variabilitéclimatique interannuelle est forte. En effet, s'il pouvait

y être possible, pour chaque lieu, de pr'evoir les conditions climatiques d'une ann'ee sur l'autre, il suffirait de mener un essai multilocal sur un ensemble de lieux repr'esentatifs et avec la m'ethode AMMI par exemple, pouvoir pr'edire avec assez de pr'ecision le rendement des cultures. Mais les importantes variations climatiques d'une ann'ee sur l'autre empêchent cette pr'ediction sans passer par la prise en compte des conditions du milieu.

Parmi les m'ethodes qui utilisent les caract'eristiques environnementales, figure la r'egression factorielle, dont une limite est qu'elle suppose une action lin'eaire des environnements sur le rendement. Dans le contexte sah'elien, cette m'ethode utilise le modèle d'analyse de variance a` deux facteurs, g'enotype et environnement, o`u les interactions G×E sont expliqu'ees par des covariables climatiques mesur'ees souvent au pas de temps d'ecadaire voire journalier sur chacun des environnements et des covariables mesur'ees sur chacun des g'enotypes. En g'en'eral, les variables climatiques mesur'ees sur les environnements sont très nombreuses (s'eries temporelles) et la prise en compte de l'ensemble d'entre elles par cette m'ethode est impossible.

Les modèles de simulation de cultures sont aussi utilis'es comme m'ethode de pr'ediction de rendement des cultures tenant compte de l'environnement. Ces modèles ont certes l'avantage d'être plus r'ealistes et considèrent le rendement d'un g'enotype dans un environnement particulier comme une fonction non lin'eaire des paramètres du g'enotype et des caract'eristiques de l'environnement. Ils pr'esentent cependant l'inconv'enient de ne pas être applicables a` tout g'enotype. En effet, les paramètres de tels modèles de simulation de cultures ne sont pour la plupart connus que pour un petit nombre de g'enotypes, car leur 'evaluation demande une exp'erimentation sp'ecifique et des mesures coàuteuses.

La premi`ere méthode proposée : APLAT. Lors d'essais multienviron-
nements, figure g'en'eralement un g'enotype de r'ef'erence dont les paramètres

sont bien connus, dans le but de comparer sa performance aux autres g'enotypes. Tenant compte de l'information souvent disponible pour ce g'enotype de r'ef'erence, nous proposons notre première m'ethode d'estimation qui consiste a` lin'eariser le rendement des g'enotypes pr'edit par un modèle de simulation de cultures autour du vecteur de paramètres de ce g'enotype de r'ef'erence. Le but 'etant d'estimer les paramètres de ces g'enotypes a` l'aide des r'esultats d'essais multienvironnements, sans refaire le travail de »param'etrisation» en station exp'erimentale n'ecessaire a` l'estimation de ceux du t'emoin. Cela per-met de se ramener approximativement a` un modèle lin'eaire o`u la matrice des variables explicatives est remplac'ee par la matrice des d'eriv'ees partielles (sensibilit'es) par rapport aux paramètres.

Cette m'ethode appel'ee Approximation par lin'earisation autour d'un t'emoin (APLAT) est d'ecrite au chapitre 3. Pour estimer ainsi la performance de tout g'enotype i dans un environnement j, nous adjoignons a` la performance de ce g'enotype i pr'edite par un modèle de simulation de cultures pour l'environnement j lin'earis'ee autour du vecteur de paramètres du t'emoin, un biais de ce modèle qui ne d'epend que de l'environnement et une erreur al'eatoire r'esiduelle. Pour que cette m'ethode ait un int'erêt, il faut que les interactions G×E soient bien reproduites par le modèle de simulation de culture, et que la m'ethode d'estimation supporte les abandons de g'enotypes au cours du temps comme cela se pratique habituellement. C'est pourquoi, elle a 'et'e test'ee sur les donn'ees d'un essai pluriannuel men'e sur la station exp'erimentale du CERAAS au S'en'egal o`u tous les g'enotypes n''etaient pas observ'es tous les ans.

Pour la plupart des modèles de simulations de cultures, il existe un nombre important de paramètres pour les g'enotypes. Ces paramètres, g'en'eralement connus pour le g'enotype de r'ef'erence, et que nous cherchons a` r'eestimer pour tout nouveau g'enotype, conduisent a` un nombre important de r'egresseurs

pour notre méthode proposée. Ils ont étéestimés a` l'aide la régression Partial least square (PLS).

La deuxième méthode proposée : APLAT-Mixte. Au chapitre 4, nous étendons la méthode APLAT au cas d'essais a` plusieurs composantes de variance. Pour cette méthode, nous estimons qu'un modèle de simulation de cultures ne permet pas de prendre en compte totalement l'effet aléatoire des interactions G×E, même si nous pouvons concevoir qu'il le permette pour une grande part. Nous rajoutons alors au modèle APLAT un effet résiduel de l'environnement et un effet des interactions G×E aléatoires, dont il faudra estimer les composantes de variance.

Le recours a` un modèle de simulation de culture induit, nous l'avons vu, un nombre important de régresseurs. Comme il s'agit également d'estimer la variance de l'effet de l'environnement et de l'effet des interactions G×E supposés aléatoires, nous nous retrouvons avec un modèle avec un nombre important de régresseurs et des composantes de variance. Nous proposons donc dans ce chapitre, une méthode originale d'estimation des paramètres fixes et des composantes de variance dans un modèle o`u le nombre de régresseurs est important par rapport aux observations. Cette méthode d'estimation, dénommée APLAT-Mixte, se fait par le principe d'une méthode combinée de réduction de dimension et de modèle mixte, que nous avons appeléPLSMixte.

Considérant d'une part les algorithmes itératifs d'estimation des paramètres inconnus dans le cadre du modèle mixte, et d'autre part les techniques de réduction de dimension, nous proposons d'imbriquer la régression PLS dans l'algorithme EM. Puisque nos données d'interaction G×E s'appréhendent a` l'aide d'un modèle o`u les erreurs aléatoires sont corrélées, nous appliquons dans un premier temps cette technique a` des données de NIRS (Near infrared spectroscopy) avec des erreurs indépendantes, o`u nous ne nous occupons que

de la double contrainte de la dimension du modèle et de la pr'esence des composantes de variance. Par la suite, nous nous int'eressons a` r'esoudre le problème suppl'ementaire des erreurs corr'el'ees qui r'esultent des donn'ees de notre probl'ematique d'interaction G×E.

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Les esprits médiocres condamnent d'ordinaire tout ce qui passe leur portée"   François de la Rochefoucauld