3.2 Algorithmes d'estimation des paramètres
3.2.1 Version bayésienne du modèle de
Milligan
La version bayésienne du modèle de Milligan a
été présentée dans la définition 4 et la
figure 3.1 présente le graphe orienté acyclique du modèle.
Dans la version bayésienne du modèle, les paramètres
d'intérêt sont, les probabilités d'IBD, Ä et le
vecteur latent des modes d'IBD, IBD. D'un point de vue bayésien,
l'objectif est de pouvoir simuler selon la loi a posteriori
ðÄ,IBD|IBS(Ä, IBD|IBS)
Cela est possible en utilisant un algorithme de Gibbs. En effet,
la loi a posteriori du vecteur des probabilités d'identité par
états est
ðÄ|IBD,IBS(Ä|IBD, IBS) ?
ðIBS|IBD(IBS|IBD)ðIBD|Ä(IBD|Ä)ðÄ(Ä)
Comme, la loi du mode d'IBS conditionnellement au mode d'IBD est
indépendante de Ä,
ðÄ|IBD,IBS(Ä|IBD, IBS) ?
ðIBD|Ä(IBD|Ä)ðÄ(Ä)
La loi du mode d'identité par états, IBD est
ðIBD|Ä(IBD|Ä) = 11L
ðIBDl|Ä(IBDl|Ä)
l=1
oil ðIBDl|Ä(IBDl|Ä) est une loi
multinomiale de paramètres Ä1, . . . , Ä9. De plus, nous avons
supposé que la loi a priori de Ä était une loi de Dirichlet.
Comme la loi de Dirichlet est la conjuguée naturelle de la loi
multinomiale (Robert, 1992), la loi a posteriori
ðÄ|IBD(Ä|IBD) est donc une loi de Dirichlet
D(#IBD1 + á, #IBD2 + á, . . . , #IBD9 +
á).
oil #IBDi = ELl=1 1lIBDl=IBDl
idésigne le nombre total de locus sur l'ensemble des
différents loci de type IBDi,i = 1, . . . , 9.
La loi a posteriori de IBD sachant IBS et Ä est une loi
discrète qui est entièrement définie par les
probabilités a posteriori. Pour un locus l,
pli = P(IBDli|Ä,IBS) j
P(IBSlj|IBDli)Äi
= Ei9 1 P(IBSlj|IBDli)Äi ? {1,
pour i = 1, . . . , 9 et donc
ðIBDl|Ä,IBSl(IBDl|Ä,
IBSl) = M(1, pl 1,pl 2,.
. . ,pl9).
Ainsi, la loi a posteriori
ðÄ,IBD|IBS(Ä,IBD|IBS) peut être simulée avec
l'algorithme d'échantillonnage de Gibbs (Algorithme 3)
Algorithme 3 Algorithme de Gibbs pour l'apparentement
générer Ä0 ~ D(1,1,1) à
l'étape t, générer
IBDl,t+1 ~ M(1, Äl,t 1 ,Äl2 ,t ,
. . . , Äl,t
9 ), l = 1, . . . , L
Ät+1 ~ D(#IBDt1 +1 + á, #IBDt+1
2 + á, . . . , #IBDt+1
9 + á)
|