4.3 Implémentation
Afin d'implémenter le modèle
précédent, le langage python à
été choisi pour deux raisons. D'une part, c'est un excellent
langage de script et d'autre part, c'est l'un des langages les plus
utilisés en bio-informatique, pour lequel de nombreuses
bibliothèques sont disponibles. Chacune des sept étapes a
été implémentée séparément, mais de
telle sorte que chaque étape rende des résultats sous format
réutilisable pour les étapes suivantes.
Les données ont été
récupérées de la base de données de EnsemblCompara,
version 84 et de NCBI, nous avons utilisé PyCongent, une API Python pour
la récupération de données de la base de données
Ensembl. Nous avons utilisé la bibliothèque numpy pour la
manipulation des structures de données optimisées pour les
tableaux et matrices.
42
|