Chapitre 1
Introduction générale
1.1 Problématique
Au Sahel, les pr'ecipitations annuelles ont diminu'e de
l'ordre de 20 a` 30 % dans la dernière moiti'e du 20e
siècle (Baterburry et Warren, 2001) et leur d'eficit y demeure la plus
forte contrainte a` l'agriculture (Tucker, 1991).
Dans de telles conditions, les paysans, qui constituent la
majorit'e de la population, parviennent difficilement a` g'en'erer des revenus
r'eguliers tout en g'erant durablement les ressources naturelles.
L'agriculture, qui est pourtant le principal moteur du d'eveloppement
'economique et social du Sahel, ne peut ainsi jouer pleinement son
ràole.
Dans ce cadre difficile, le ràole des d'ecideurs
('Etats, ONG, Organismes de coop'eration, Recherche) est de r'epondre a` la
demande sociale, principalement »la promotion d'une agriculture
productive, diversifi'ee, durable [...]». Ce sont les termes employ'es
dans le Cadre strat'egique de s'ecurit'e alimentaire (CSSA), le document de
r'ef'erence en matière de s'ecurit'e alimentaire du Comit'e permanent
inter-'etats de lutte contre la s'echeresse au Sahel (CILSS).
Ce cadre stratégique qui vise aussi
»l'amélioration durable des conditions d'accès des groupes
et zones vulnérables a` l'alimentation», a ététraduit
en programmes de sécuritéalimentaire pour la plupart des pays
sahéliens (CILSS, 2000). Ce document est venu confirmer le mandat
déjàattribuéau Centre d'étude régional pour
l'amélioration de l'adaptation a` la sécheresse (CERAAS) par le
Réseau de recherche sur la résistance a` la sécheresse
(R3S) du CILSS.
Le CERAAS est un laboratoire national de recherche a` vocation
régionale sous double tutelle. C'est un laboratoire de l'Institut
sénégalais de recherches agricoles (ISRA), qui a la mission
d'exécuter le programme national de recherche sur l'adaptation des
plantes a` la sécheresse. Il est aussi une Base Centre du Conseil ouest
et centre africain pour la recherche et le développement agricole
(CORAF), chargéde conduire les recherches sur la thématique de
l'adaptation des plantes a` la sécheresse et celle de la création
variétale.
Le CERAAS conduit des recherches suivant quatre axes principaux
:
1. la compréhension de la réponse des plantes;
2. la modélisation du fonctionnement des plantes;
3. l'amélioration de la méthodologie de la
sélection
4. l'amélioration des systèmes de culture pour une
meilleure adaptation a` la sécheresse.
Au troisième axe, l'objectif est d'identifier et de
sélectionner du matériel végétal mieux
adaptéa` la sécheresse, stabilisant ainsi le déficit
alimentaire dans les pays des régions sèches. Pour atteindre cet
objectif, les activités de recherche visent a` fournir des solutions
techniques pour réduire l'effet dépressif de la sécheresse
sur les productions agricoles. Ces solutions consistent a` proposer des
méthodes de sélection, de suivi des cultures et des
itinéraires techniques tenant compte du milieu ciblé, qui est
soumis a` la contrainte hydrique.
La s'election porte sur des caractères ph'enologiques,
physiologiques et mol'eculaires permettant une production am'elior'ee en
conditions de d'eficit hydrique par rapport aux cultivars g'en'eralement
vulgaris'es. Elle est valid'ee par des essais en plein champ, r'ealis'es dans
des conditions qui reflètent la variabilit'e du milieu auquel les
vari'et'es sont destin'ees. Ces essais peuvent avoir lieu la même ann'ee,
sur plusieurs endroits (essai multilocal) ou sur plusieurs ann'ees, au
même endroit (essai pluriannuel) ou sur plusieurs ann'ees, sur plusieurs
endroits. Par la suite, nous d'esignerons tous ces types d'essais sous le nom
g'en'erique d'essai multienvironnement et emploierons ce terme chaque fois
qu'il n'y aura pas d'ambigu·ýt'es et que nous voulons nommer un
ensemble d'essais.
Dans cette zone du Sahel a` fort risque climatique, il est
souvent constat'e une variabilit'e de l''ecart entre le rendement des
g'enotypes lors de ces essais multienvironnements de s'election vari'etale.
Cette variabilit'e est connue des s'electionneurs sous le nom d'interaction
g'enotype × environnement (G×E) a`
laquelle nous nous int'eressons dans ce travail.
Un cas particulier d'interactions 'etant un changement de
classement direct des g'enotypes. Si trois g'enotypes A, B et
C sont test'es sur plusieurs environnements, nous sommes en
pr'esence d'interactions G×E si pour le premier
environnement, les g'enotypes se classent A-B-C selon leurs
rendements et pour le deuxième environnement, ils se classent par
exemple B-A-C. Dans ce cas et même dans le cas plus
g'en'eral o`u les diff'erences entre g'enotypes dependent de l'environnement,
il sera difficile pour un environnement cible o`u les g'enotypes n'ont pas
encore 'et'e test'es, de pr'edire le meilleur g'enotype.
Dune manière g'en'erale, les essais multienvironnements
ne peuvent être assez pr'ecis. En effet, en dehors d'une ou de deux
vari'et'es t'emoin g'en'eralement reconduites dune ann'ee a` lautre, chaque
vari'et'e n'est vue que deux a` cinq ans. Au regard de la forte interaction
g'enotype × ann'ee (G×A), ces deux
a` cinq ans sont un 'echantillon de taille trop faible. Le s'electionneur
doit
souvent extrapoler a` partir de ce nombre d'années
faible ou d'un essai multi-local o`u l'interaction génotype x
lieu (GxL) ne reproduit qu'imparfaitement
l'interaction GxA.
Les interactions GxE gênent donc la
sélection variétale et constituent un obstacle aux
recommandations éventuellement formulées aux paysans pour
l'adoption de cultivars adaptés a` leurs milieux. Une solution est de
modéliser ces interactions GxE dans le but de les
prédire pour une situation nouvelle en fonction de variables
environnementales dont on connaàýt la valeur (ex : nature et
profondeur du sol) ou la loi de probabilité(ex : précipitations)
(Piepho, Denis et van Eeuwijk, 1998).
Nous proposons alors dans ce travail, une méthode de
modélisation des interactions GxE, qui permette de
tenir compte de l'impact aléatoire de l'environnement induit
principalement au Sahel par une variabilitéclimatique, pour une
meilleure prédiction de la réponse des variétés.
Plusieurs méthodes d'analyse des interactions ont
étéproposées dans la littérature et sont
exposées au chapitre 2. Ces méthodes peuvent être
rangées, a` notre sens, en deux catégories : celles qui utilisent
les caractéristiques des environnements et celles qui ne les utilisent
pas. Pour ces dernières, dont nous pouvons citer la méthode
Additive Main effects and Multiplicative Interactions (AMMI)
ainsi que la régression conjointe, la critique majeure est qu'elles ne
tiennent pas compte justement des environnements cibles pour y prédire
le rendement des génotypes. Ce n'est pas adaptédans cette zone du
Sahel, car comme nous avions annoncé, les interactions
GxE y sont la conséquence principalement de la grande
variabilitéclimatique des environnements. Mais ce qui gêne en
réalité, c'est la présence de l'interaction
GxA qui est imprévisible, au contraire de l'interaction
GxL. Talbot (1997) a établi que l'interaction
GxAxL est plus importante que l'interaction
GxA, ellemême plus importante que l'interaction
GxL. C'est certainement le cas au Sahel, o`u la
variabilitéclimatique interannuelle est forte. En effet, s'il pouvait
y être possible, pour chaque lieu, de pr'evoir les
conditions climatiques d'une ann'ee sur l'autre, il suffirait de mener un essai
multilocal sur un ensemble de lieux repr'esentatifs et avec la m'ethode AMMI
par exemple, pouvoir pr'edire avec assez de pr'ecision le rendement des
cultures. Mais les importantes variations climatiques d'une ann'ee sur l'autre
empêchent cette pr'ediction sans passer par la prise en compte des
conditions du milieu.
Parmi les m'ethodes qui utilisent les caract'eristiques
environnementales, figure la r'egression factorielle, dont une limite est
qu'elle suppose une action lin'eaire des environnements sur le rendement. Dans
le contexte sah'elien, cette m'ethode utilise le modèle d'analyse de
variance a` deux facteurs, g'enotype et environnement, o`u les interactions
G×E sont expliqu'ees par des covariables climatiques
mesur'ees souvent au pas de temps d'ecadaire voire journalier sur chacun des
environnements et des covariables mesur'ees sur chacun des g'enotypes. En
g'en'eral, les variables climatiques mesur'ees sur les environnements sont
très nombreuses (s'eries temporelles) et la prise en compte de
l'ensemble d'entre elles par cette m'ethode est impossible.
Les modèles de simulation de cultures sont aussi
utilis'es comme m'ethode de pr'ediction de rendement des cultures tenant compte
de l'environnement. Ces modèles ont certes l'avantage d'être plus
r'ealistes et considèrent le rendement d'un g'enotype dans un
environnement particulier comme une fonction non lin'eaire des
paramètres du g'enotype et des caract'eristiques de l'environnement. Ils
pr'esentent cependant l'inconv'enient de ne pas être applicables a` tout
g'enotype. En effet, les paramètres de tels modèles de simulation
de cultures ne sont pour la plupart connus que pour un petit nombre de
g'enotypes, car leur 'evaluation demande une exp'erimentation sp'ecifique et
des mesures coàuteuses.
La premi`ere méthode proposée : APLAT.
Lors d'essais multienviron- nements, figure g'en'eralement un
g'enotype de r'ef'erence dont les paramètres
sont bien connus, dans le but de comparer sa performance aux
autres g'enotypes. Tenant compte de l'information souvent disponible pour ce
g'enotype de r'ef'erence, nous proposons notre première m'ethode
d'estimation qui consiste a` lin'eariser le rendement des g'enotypes pr'edit
par un modèle de simulation de cultures autour du vecteur de
paramètres de ce g'enotype de r'ef'erence. Le but 'etant d'estimer les
paramètres de ces g'enotypes a` l'aide des r'esultats d'essais
multienvironnements, sans refaire le travail de »param'etrisation» en
station exp'erimentale n'ecessaire a` l'estimation de ceux du t'emoin. Cela
per-met de se ramener approximativement a` un modèle lin'eaire o`u la
matrice des variables explicatives est remplac'ee par la matrice des d'eriv'ees
partielles (sensibilit'es) par rapport aux paramètres.
Cette m'ethode appel'ee Approximation par lin'earisation
autour d'un t'emoin (APLAT) est d'ecrite au chapitre 3. Pour estimer ainsi la
performance de tout g'enotype i dans un environnement
j, nous adjoignons a` la performance de ce g'enotype i
pr'edite par un modèle de simulation de cultures pour
l'environnement j lin'earis'ee autour du vecteur de
paramètres du t'emoin, un biais de ce modèle qui ne d'epend que
de l'environnement et une erreur al'eatoire r'esiduelle. Pour que cette
m'ethode ait un int'erêt, il faut que les interactions
G×E soient bien reproduites par le modèle de
simulation de culture, et que la m'ethode d'estimation supporte les abandons de
g'enotypes au cours du temps comme cela se pratique habituellement. C'est
pourquoi, elle a 'et'e test'ee sur les donn'ees d'un essai pluriannuel men'e
sur la station exp'erimentale du CERAAS au S'en'egal o`u tous les g'enotypes
n''etaient pas observ'es tous les ans.
Pour la plupart des modèles de simulations de cultures,
il existe un nombre important de paramètres pour les g'enotypes. Ces
paramètres, g'en'eralement connus pour le g'enotype de r'ef'erence, et
que nous cherchons a` r'eestimer pour tout nouveau g'enotype, conduisent a` un
nombre important de r'egresseurs
pour notre méthode proposée. Ils ont
étéestimés a` l'aide la régression Partial
least square (PLS).
La deuxième méthode proposée :
APLAT-Mixte. Au chapitre 4, nous étendons la méthode
APLAT au cas d'essais a` plusieurs composantes de variance. Pour cette
méthode, nous estimons qu'un modèle de simulation de cultures ne
permet pas de prendre en compte totalement l'effet aléatoire des
interactions G×E, même si nous pouvons concevoir
qu'il le permette pour une grande part. Nous rajoutons alors au modèle
APLAT un effet résiduel de l'environnement et un effet des interactions
G×E aléatoires, dont il faudra estimer les
composantes de variance.
Le recours a` un modèle de simulation de culture
induit, nous l'avons vu, un nombre important de régresseurs. Comme il
s'agit également d'estimer la variance de l'effet de l'environnement et
de l'effet des interactions G×E supposés
aléatoires, nous nous retrouvons avec un modèle avec un nombre
important de régresseurs et des composantes de variance. Nous proposons
donc dans ce chapitre, une méthode originale d'estimation des
paramètres fixes et des composantes de variance dans un modèle
o`u le nombre de régresseurs est important par rapport aux observations.
Cette méthode d'estimation, dénommée APLAT-Mixte, se fait
par le principe d'une méthode combinée de réduction de
dimension et de modèle mixte, que nous avons appeléPLSMixte.
Considérant d'une part les algorithmes itératifs
d'estimation des paramètres inconnus dans le cadre du modèle
mixte, et d'autre part les techniques de réduction de dimension, nous
proposons d'imbriquer la régression PLS dans l'algorithme EM. Puisque
nos données d'interaction G×E
s'appréhendent a` l'aide d'un modèle o`u les erreurs
aléatoires sont corrélées, nous appliquons dans un premier
temps cette technique a` des données de NIRS (Near infrared
spectroscopy) avec des erreurs indépendantes, o`u nous ne nous occupons
que
de la double contrainte de la dimension du modèle et de
la pr'esence des composantes de variance. Par la suite, nous nous int'eressons
a` r'esoudre le problème suppl'ementaire des erreurs corr'el'ees qui
r'esultent des donn'ees de notre probl'ematique d'interaction
G×E.
|