Conclusion générale et
perspectives
La génétique quantitative s'intéresse
à l'étude de la transmission héréditaire des
caractères quantitatifs. Un caractère répond à la
sélection lorsque'il a une variabilité génétique
héritable et qu'il n'est pas contraint par les corrélations
génétiques avec d'autres caractères sous sélection.
De manière classique, des dispositifs expérimentaux oil les
croisements entre individus sont contrôlés sont mis en place et
permettent d'estimer l'héritabilité. Cependant,
l'héritabilité d'un caractère mesuré en laboratoire
ou en serre est différente de l'héritabilité de ce
même caractère mesuré en milieu naturel. Ceci s'explique
par les différences environnementales et l'interaction
génotype-environnement. Actuellement, des programmes de recherche sont
de plus en plus menés avec des dispositifs de sélection
participative en milieu naturel. Hors en milieu naturel, comme les croisements
ne sont pas contrôlés, l'apparentement n'est pas connu ou, au
mieux, il n'est connu que partiellement. La possibilité d'estimer
l'apparentement et l'héritabilité des caractères en milieu
naturel à l'aide des données moléculaires suscite un
intérêt croissant dans différents domaines liés
à l'amélioration génétique des populations.
Ce travail de thèse nous a permis tout d'abord de
généraliser le modèle de la vraisemblance de Milligan pour
l'apparentement. Nous avons montré que le modèle de Milligan
s'insère dans un cadre théorique plus large qui est celui de la
vraisemblance composite. En effet, le modèle de Milligan pour n
individus consiste à écrire le produit des lois jointes des
couples de génotypes et revient à écrire la vraisemblance
composite par paires. Nous avons défini le modèle de la
vraisemblance composite par paires pour l'estimation de l'apparentement.
Cependant, les approches classiques pour l'estimation de l'apparentement
génétique développées jusqu'ici ne permettent pas
de prendre en compte une information exogène comme l'information
spatiale. Or, il serait raisonnable de supposer que plus des individus sont
spatialement proches plus ils sont génétiquement proches. Nous
avons développé un modèle spatial bayésien
hiérarchique pour l'estimation de l'apparentement
génétique entre
des individus sans connaissance du pedigree à l'aide
des données moléculaires. L'avantage de la modélisation
bayésienne hiérarchique est qu'elle permet de scinder un
problème complexe en une série de problèmes plus faciles
à traiter. Nous avons supposé que les individus sont
non-consanguins et que le mode d'IBD suit une loi multinomiale et
proposé de modéliser le mode d'IBD avec un GLM probit ordinal.
L'idée est que deux individus proches spatialement sont aussi proches
génétiquement. La prise en compte de l'information spatiale
permet de modéliser le mode d'IBD en fonction d'une variable latente
gaussienne dont la moyenne dépend de la distance entre les individus.
Plus précisément, l'information spatiale permet de
discrétiser le mode d'identité par descendance.
Nous avons ensuite proposé un modèle
bayésien hiérarchique pour estimer à la fois
l'apparentement et l'héritabilité en milieu naturel à
l'aide des données moléculaires. L'intérêt de ce
modèle est qu'il ne suppose pas, contrairement aux modèles de la
vraisemblance pour l'héritabilité développés
d'abord par Mousseau et al. (1998) et ensuite par Thomas et al. (2000), que la
population a une structure d'apparentement prédéterminée
et connue. Un autre avantage du modèle est qu'il permet de bien prendre
en compte l'effet de la variabilité de l'estimation de l'apparentement
sur celle de l'estimation de l'héritabilité. Ce modèle
garantit en outre que la matrice d'apparentement estimée des couples
d'individus est une matrice symétrique définie positive, ce qui
est attendu comme propriété pour une matrice de
variance-covariance.
Trois algorithmes MCMC pour l'inférence
bayésienne des paramètres du modèle pour l'estimation de
l'apparentement sont proposés. Les deux premiers algorithmes sont de
type Métropolis-Hastings avec des lois de proposition
différentes. Mais comme la difficulté avec un algorithme de
MétropolisHastings réside souvent dans le choix de la loi de
proposition appropriée, le dernier algorithme pour l'estimation de
l'apparentement proposé est un algorithme de Gibbs qui a donc l'avantage
d'être plus facilement mis en oeuvre. Comme pour l'inférence des
paramètres du modèle spatial hiérarchique pour
l'apparentement, la loi a posteriori conditionnelle complète des seuils
n'a pas une forme analytique connue et que les lois a posteriori des autres
paramètres sont connues, nous ne pouvons pas employer un algorithme de
Gibbs pour l'inférence bayésienne. Un algorithme de
Métropolis-Hastings couplé à un algorithme de Gibbs pour
l'inférence des paramètres du modèle spatial
bayésien hiérarchique pour l'apparentement a été
proposé. Une difficulté rencontrée dans l'application du
modèle spatial pour l'estimation de l'apparentement, c'est qu'avec peu
d'observations, il peut arriver qu'aucun couple de génotypes partageant
deux allèles identiques par descendance, donc de mode d'IBD 87, ne soit
simulé. Le nombre de modalités observé est réduit
à 2, donc le modèle est non-identifiable et les seuils
associés sont non-estimables.
67
Pour l'application pratique, le jeu de données dont
nous disposons ne comporte qu'une seule variable phénotypique, le
diamètre des arbres à 1, 30 mètre de hauteur. Le
diamètre des arbres est mesuré sur des individus d'âges
différents et comme il varie évidemment en fonction de
l'âge de l'individu considéré, l'héritabilité
de ce caractère pour des individus mesurés à des
âges différents est difficilement interprétable. C'est
pourquoi nous n'avons pas appliqué le modèle
développé dans ce travail pour estimer à la fois
l'apparentement et l'héritabilité. Nous avons pu obtenir
finalement d'autres données phénotypiques sur le karité et
nous envisageons d'appliquer le modèle spatial pour l'estimation de
l'apparentement et de l'héritabilité en milieu natural et
valoriser ensuite ce travail par une publication. En outre, il nous faudra
effectuer plus de simulations pour pouvoir estimer à la fois
l'apparentement et l'héritabilité et bien mesurer l'apport du
modèle spatial sur l'estimation de ces paramètres. Il serait
aussi intéressant de développer un modèle spatial qui
prendrait en compte la dépendance entre les couples d'individus. Nous
avons considéré dans ce travail que les fréquences
alléliques sont connues. Comme en pratique, elles ne sont souvent pas
connues, nous allons développer un algorithme pour estimer à la
fois les fréquences alléliques, l'apparentement et
l'héritabilité. Nous avons supposé avec le modèle
spatial pour l'estimation de l'apparentement que la population est
composée d'individus non-consanguins. Cependant cette hypothèse
peut se révéler restrictive pour l'application pratique du
modèle. Il serait intéressant d'envisager le développement
d'un modèle spatial pour estimer l'apparentement génétique
d'individus issus d'une population consanguine. Dans ce cas, le modèle
ne serait plus ordinal comme tous les 9 modes d'identité par état
des allèles peuvent être observés. Le modèle
approprié est un modèle multinomial et non un modèle
probit. De plus, nous pourrions considérer que les observations sont les
génotypes d'un triplet et non d'un couple et employer le modèle
de la vraisemblance composite par triplets et non par paires. Cependant ceci
augmenterait considérablement le nombre de paramètres du
modèle.
|