|
2.3
2.4
|
2.2.1 Bases de données existantes
2.2.2 Accès aux bases de données
Évolution des séquences biologiques
2.3.1 Recherche de similarités entre séquences
2.3.2 Construction d'arbres phylogénétiques
Conclusion sur la génomique
|
8
9
10 10 10 14
|
3
|
ÉTAT DE L' ART
|
16
|
|
3.1
|
Méthodes de construction d'arbres
phylogénétiques
|
16
|
|
|
3.1.1 Énumération des arbres
|
16
|
|
|
3.1.2 Construction d'arbres à partir des distances entre
feuilles . . .
|
17
|
|
|
3.1.2.1 UPGMA
|
17
|
|
|
3.1.2.2 Neighbour Joining
|
17
|
|
|
3.1.3 Les méthodes de parcimonie
|
20
|
|
|
3.1.4 Méthodes de maximum de vraisemblance
|
20
|
|
3.2
|
Construction des arbres de gènes
|
21
|
|
|
3.2.1 Exemple de construction d'arbres de gènes -
EnsemblCompara
|
21
|
|
|
3.2.2 Limites des arbres de gènes actuels
|
23
|
|
3.3
|
Conclusion sur l'état de l'art
|
23
|
4
|
MÉTHODOLOGIE ET IMPLÉMENTATION
|
25
|
|
4.1
|
Modèle d'évolution des protéines et
problème de réconciliation . . . .
|
25
|
|
|
4.1.1 Idée de base
|
25
|
|
|
4.1.2 Définitions formelles
|
26
|
|
4.2
|
Méthodologie : Processus à sept étapes
|
30
|
|
|
4.2.1 Étape 1 : Définition du jeu de données
|
30
|
|
|
4.2.2 Étape 2 : Alignement multiple de toutes les
séquences codantes
|
32
|
|
|
4.2.3 Étape 3 : Calcul de la matrice de similarité
|
32
|
|
|
4.2.4 Étape 4 : Regroupement avec chevauchement des
séquences
|
|
|
|
codantes
|
32
|
|
|
4.2.4.1 Définition du regroupement
|
33
|
|
|
4.2.4.2 Problème de regroupement dans le cas
présent . . . .
|
33
|
|
|
4.2.4.3 Regroupement avec chevauchement hiérarchique . .
.
|
35
|
|
|
4.2.5 Construction d'un groupe de référence
|
36
|
|
|
4.2.6 Étape 6 : Création des arbres de
protéines pour les groupes . .
|
40
|
|
|
4.2.7 Étape 7 : Construction de l'arbre de
protéines et de l'arbre
|
|
|
|
des gènes
|
41
|
|
4.3
|
Implémentation
|
41
|