Dans le cadre de ce projet, nous avons
utiliséplusieurs outils pour la réalisation de ce projet. Nous
avons utiliséDIRAC comme intergiciel afin de soumettre les jobs
de docking
sur la grille de calcul, suivre l'état du job et
récupérer les résultats. L'outil AutoDock,
oùnous avons déployéla version
AutoDock4.2 pour créer et préparer les fichiers
nécessaires
pour le docking. Et l'outil Taverna pour la
création et la visualisation des workflow. Le but d'utiliser Taverna
est d'avoir la possibilitéd'étendre et d'extensier le
workflow en ajoutant d'autres nouvelles fonctionalités, des services et
d'autres processus pour mieux l'adapter aux besoins ultérieurs des
utilisateurs. Les utilisateurs de ce portail peuvent donc profiter des services
du portail, qui servent comme intermédiare entre les utilisateurs finaux
et les services de la grille. Ce portail fournit un moyen pour la gestion des
protéines, des ligands, des paramètres de grille, des projets de
docking, de soumettre des jobs de docking sur la grille de calcul et de
récupérer les résultats.
64
5 Conclusion & perspective
La découverte de nouveaux médicaments
»in-silico» est l'une des stratégies les plus
prometteuses visant à accélérer le processus de
développement de médicaments. Le criblage virtuel
»Virtual Screening», est l'une des premières
étapes du processus de découverte de médicaments, il
repose sur la sélection »in-silico» des meilleurs
médicaments potentiels qui agissent sur une protéine cible
donnée, il peut se faire »in-vitro», mais il est
très onéreux. Le criblage virtuel nécessite une analyse
complexe avec plusieurs étapes telles que la modélisation
moléculaire et le docking. L'un des principaux avantages
conférés par le docking est qu'il permet aux chercheurs de trier
(screen) rapidement les grandes bases de données de
médicaments potentiels qui nécessiteraient autrement un travail
fastidieux et de longue durée dans le laboratoire selon les
méthodes traditionnelles de découverte de médicaments. La
recherche sur les maladies négligées pourrait largement
bénéficier des avantages de déploiement des grilles
informatiques à plusieurs niveaux. Récemment, le
déploiement de docking »in-silico» sur les grilles de
calcul a émergédans la perspective de réduire les
coûts et le temps de conception de médicaments.
Le présent travail poursuit deux objectifs. Le
premier, est de se familiariser avec l'outil AutoDock afin mieux comprendre le
mécanisme de docking moléculaire protéine-ligand, et
l'outil Taverna pour la création et l'exécution des workflows
scientifiques. Le deuxième objectif consiste à développer
un portail web pour soumettre les jobs de docking in-silico à
grande échelle sur la grille de calcul en utilisant l'intergiciel DIRAC
et l'environnement Taverna [26]. Oùl'utilisateur prépare ses
fichiers nécessaires (protéine, ligand, paramètres de la
grille), soumet son job sur la grille via le portail et récupère
le résultat de son job de docking.
L'achèvement de ce projet implique l'utilisation
coordonnée de plusieurs outils informatiques (AutoDock, Taverna, DIRAC).
Un nombre croissant de ces ressources sont mises à disposition sous la
forme de services Web. De sorte que, ces services Web sont orchestrer dans un
workflow et qui sont mises à la disposition des chercheur scientifiques.
Afin de faciliter l'interaction entre l'utilisateur et les ressources de la
grille de calcul, nous avons développéun portail web qui
répond aux besoins des utilisateurs qui ne sont pas forcément des
experts en informatique. Ce portail permet à ces derniers de charger,
modifier, consulter leur molécules de ligands, protéines sur le
portail. Ainsi, de créer leur projet et d'effectuer le docking
»in-silico» afin d'accélérer leur recherche
sans se préoccuper de la complexitédu portail, tout en
déployant les ressources de la grille de calcul pour soumettre les jobs
de docking à travers l'intergiciel »DIRAC». Ainsi,
nous nous sommes servis de l'outil AutoDock pour préparer les fichiers
nécessaires et effectuer le docking. Nous avons crééun
workflow pour le criblage virtuel sur la grille en utilisant l'outil
»Taverna». Nous
avons pu soumettre les jobs de docking de la base de
donnée ZINC (10256 composés), oùnous avons
stockés les résultats sur l'espace de stockage de la grille de
calcul.
65
Au cours de la réalisation de ce projet, nous avons
rencontréplusieurs des difficultés. Tout d'abord, les
difficultés théoriques. Elles se résument sur la
compréhension des mécanismes de docking moléculaire et de
criblage virtuel. Et les difficultés pratiques se situent au niveau
d'installation et l'utilisation des outils (Taverna, AutoDock). Et au niveau
des lignes de commande de DIRAC, qui ne sont pas assez conviviale à
utiliser. Ainsi, lors de l'utilisation de l'outil Taverna qui consomme
beaucoup de RAM, ce qui entraîne un ralentissement des autres processus
en cours d'exécution et les services nécessaires pour la
soumission des jobs du portail vers la grille de calcul.
Nous allons améliorer le portail web au fur et
à mesure en ajoutant d'autres fonctio-nalités et d'autres
services :
· Mise en place du portail web sur le serveur de l'IFI.
· Authentification au moyen d'un certificat client X509
au lieu du nom et du mot de passe de l'utilisateur.
· Visualisation des résultats de docking
protéine-ligand sous forme de graphe.
[1] Jens Kruger, Richard Grunzke, Sonja Herres-Pawlis,
Performance Studies on Distributed Virtual Screening, 2014
[2] Pratap Parida, Brajesh Shankar, in-silico protein
ligand interaction study of typical antipsychotic drugs against dopaminergic D2
receptor, 2013
[3] William Lindstrom, Garrett M. Morris, Christoph Weber,
Ruth Huey, Using Au-toDock4 for virtual screening, 2008
[4] Romano T. Kroemer, Structure-Based Drug Design
: Docking and Scoring, 2007
[5] C.S.R. Prabhu, Grid and Cluster Computing,
New Delhi : Prentice Hall of India, 2008.
[6] Stian Soiland-Reyes, Ian Dunlop, Alan Williams,
Taverna reloaded
[7] Hsin-Yen Chen, Mason Hsiung, Hurng-Chun Lee, Eric Yen,
Simon C. Lin, Ying-Ta Wu, GVSS : A High Throughput
Drug Discovery Service of Avian Flu and Dengue Fever for EGEE and EUAsiaGrid,
2009
[8] Nguyen Bui The, Nguyen Hong Quang, Doan Trung
Tung,On the Performance Enhancement of the WISDOM Production
Environment, 2012
[9] Ankur Dhanik, John SMcMurray, Lydia Kavraki,
AutoDock based incremental docking protocol to improve docking of large
ligands, 2012
[10] Pritpal Singh, Gurinderpal Singh, Grid computing
architecture. 2013
[11] JACQ Nicolas, In silico drug discovery services
in computing grid envir nments against neglected and emerging infectious
diseases. 2006
[12] D. Hull, K. Wolstencroft, R. Stevens, C. A. Goble, M. R.
Pocock, Taverna: a tool for building and running workflows of services,
Nucleic Acids Research , 34 (Web-Server-Issue) :729 732, 2006
[13] Quang Bui The, Doan Trung Tung, Nguyen Hong Quang,
Criblage virtuel sur grille de composés isolés au
Vietnam, 2011
[14] Yasmine Asses, Conception par modélisation
et criblage in silico d'hinibi-teurs du récepteur c-Met,
2011
[15] Grosdidier A.Conception d'un logiciel de docking et
applications dans la recherche de nouvelles molécules actives,
Thèse de doctorat en pharmacie. Grenoble :
UniversitéJoseph Fourier. France. 2007
[16] Sousa S. F., Fernandes P. A., Ramos M. J,
Protein-Ligand Docking: Current Status and Future Challenges,
Proteins. 2006; 65 : 15-26
[17] Koblitz, B.Santos, N.Pose, The AMGA metadata
service, J.Grid Computing6,61-67 (2008)
[18] German-Renaud, C.Loomis, Scheduling for
responsive grids, J.Grid Computing 7,463-478 (2009)
[19] A.Tsaregorodtsev, V.Hamar, M.Sapunov, T.Glatard,
Infrastructure DIRAC pour les Communautés Pluridisciplinaires,
2011
[20] A.Tsaregorodtsev, P. Charpentier, V.Romanovski,
DIRAC - The Distributed MC Production and Analysis for LHCb ,
2010
[21] E. van Herwijnen, J. Closier, M. Frank, C. Gaspar, F.
Loverre, S.Ponce, and M. Gan-delman, Dirac-distributed infrastructure
with remote agent control, Conference for Computing in High-Energy and
Nuclear Physics (CHEP 03), 2003.
[22] Bui The Quang, Nguyen Hong Quang, Emmanuel Medernach,
Vincent Breton , Multi-Level Queue-Based Scheduling for Virtual
Screening Application on Pilot-Agent Platforms on Grid/Cloud to Optimize the
Stretch , 2014
[23] Katherine Wolstencroft, Robert Haines, Donal Fellows,
Alan Williams, The Taverna workflow suite : designing and executing
workflows of Web Services on the desktop, web or in the cloud, 2013
[24] Trung Tung DOAN, Quang Minh DAO, Trong Hieu VU, Hong
Phong PHAM, g-INFO portal: a solution to monitor Influenza A on the
Grid for non-grid users, 2011
[25] Nicolas JACQ, Jean SALZEMANNa, Yannick LEGRE, Matthieu
REICHS-TADT,Demonstration of In Silico Docking at a Large Scale on Grid
Infrastructure , 2006
[26] T. Oinn, M. Addis, J. Ferris, D. Marvin, M. Senger, M.
Greenwood, T. Carver, K. Glover, M. R. Pocock, A.Wipat, P. Li, Taverna
: A tool for the composition and enactment of bioinformatics
workflows, Bioinformatics Journal 20(17) pp 3045-3054, 2004, doi
:10.1093/bioinformatics/bth361.