Mémoire présenté en vue de l'obtention du
diplôme d'Ingénieur de Conception de Génie Informatique
Développement d'un modèle
d'évolution de l'architecture
des gènes
PAR: Esaie KUITCHE KAMELA
Sous la direction de AïDA OUANGRAOUA,
Professeur
MEMBRES DU JURY:
Président: CREPIN TIMOLEON KOFANE,
Professeur Rapporteur: THOMAS BOUETOU BOUETOU, Professeur
Examinateur: GEORGES KOUAMOU, Docteur
Date de soutenance : 26 septembre 2016
ii
DÉDICACE
Je dédie ce travail :
-- À ma très chère et tendre maman, Mme
KAMELA née MAFOKAM Maria et à mon papa KAMELA Martin, qui
grâce à leur concours ont toujours su me soutenir au prix de
sacrifices incommensurables.
iii
REMERCIEMENTS
La réalisation de ce mémoire a été
possible grâce au concours de plusieurs personnes à qui je
voudrais témoigner toute ma reconnaissance. Il s'agit notamment :
-- de mes encadreurs, les professeurs Aïda
OUANGRAOUA et Thomas BOUETOU BOUETOU, pour leurs
disponibilité, indications, supports et surtout leurs judicieux
conseils, qui ont contribué à alimenter de manière
soutenue ma réflexion.
-- du professeur Crepin TIMOLEON KOFANE et
docteur Georges Edouard KOUAMOU, pour avoir accepté
de faire partie de notre jury d'évaluation.
-- des enseignants de l'ENSPY en particulier ceux du
Génie Informatique pour m'avoir fourni les outils nécessaires
à la réussite de mes études d'ingénierie.
-- également de mes collègues du laboratoire
CoBIUS : Safa JAMMALI, Jean-David AGUILAR, Sarah BELHAMITI, Nilson
COIMBRA, et Michael LUCE pour nos discussions enrichissantes et
constructives qui ont permis à l'amélioration de la
qualité de mon travail.
-- de tous mes frères et soeur dont Livane
MAMOUBÉ KAMELA, Thierry NGATEU KAMELA, Armand FOTSING KAMELA, Valery
Martial TANKOU KAMELA ainsi qu'à mes parents papa
Martin KA-MELA et maman Maria MAFOKAM.
-- de toute la communauté estudiantine de l'ENSPY, en
particulier ceux de la Promotion 2016 du Génie Informatique dont leur
dynamisme et humour indubitables ont été pour moi une source
continue de courage.
-- de mes amis Floriane MEPOUBONG, Jean BIEMEWOU,
Pascal
DONGMO, Alain TSAYO, vous tous qui ne cessez
de me motiver. -- de la communauté camerounaise du Canada et
spécialement celle de Sher-
brooke pour leur accueil et hospitalité.
-- de tous(tes) ceux et (celles) qui de près ou de
loin, d'une manière comme d'une autre, pensent toujours à moi et
que j'ai oublié de citer.
iv
RÉSUMÉ
Les analyses génomiques récentes ont
révélé la capacité des gènes eucaryotes de
produire plusieurs ARN et protéines. Ce mécanisme joue un
rôle majeur dans la diversification fonctionnelle des gènes [1].
Cependant, les modèles de reconstruction actuelles de la
phylogénie de famille de gènes sont basés sur une seule
protéine de référence par gène, négligeant
ainsi toutes les autres protéines alternatives produites par les
gènes [31]. Ensuite, la réconciliation de l'arbre de gènes
dans l'arbre d'espèces est utilisée pour déduire
l'histoire évolutive des familles de gènes [12].
Le problème de la reconstruction de l'évolution
de l'expression du gène a été introduit dans [2],
où un modèle et un algorithme pour la reconstruction de la
phy-logénie des transcipts, ayant pour entrée l'arbre de
gènes et les structures des gènes. Ici, nous explorons une
approche différente en utilisant la réconciliation. Nous
proposons une extension de la réconciliation afin de reconstruire
à la fois l'arbre des gènes et l'histoire de l'évolution
de toutes les protéines produites par les gènes d'une famille de
gènes, compte tenu de l'arbre d'espèces. Nous proposons un
modèle d'évo-lution des protéines impliquant deux nouveaux
types d'événements évolutif appelé "création
de protéines" et "perte de protéines", en plus des
événements classiques de spéciation, duplication et de
perte de gènes.
Ce mémoire présente également les limites
des méthodes actuelles et propose une méthode heuristique pour la
reconstruction des arbres de gènes et d'arbres de protéines.
Cette méthode est résumée dans un processus à sept
étapes et vise à minimiser le coût de la
réconciliation. Aussi, nous avons implémenté et
appliqué ce modèle pour les familles de gènes de la base
de données Ensembl, montrant que notre modèle permet de
réduire le coût de la réconciliation des arbres de
gènes reconstruits avec des arbres d'espèces, par rapport aux
arbres de gènes Ensembl correspondants.
v
|