Abstract
Grid computing is currently developing into a major driving
force for new approaches towards collaborative large scale science. Several
national and international eScience programs have fostered collaboration
between researchers from different scientific domains.
In the biomedical field, more precisely in drug discovery for
infectious diseases. Grid computing has initiated several projects on large
scale in-silico drug screening approaches. The project WISDOM
was amongst the first projects in the public domain that made use of grid
enabled in-silico docking to simulate the interaction of potential
drugs with target proteins. In-silico docking is the first step in the
virtual screening process, which is one of the most promising approaches to
speed-up and to reduce the costs of the development of new drugs.
Although, many applications have been developed to allow
in-silico screening, but a critical barrier of these programs is the
lack of a suitable, easy, simple way to use and to provide concise procedures
for regular users.
The main goal of this work is to develop a user-friendly web
portal to perform virtual screening and to deploy a large number of docking on
grid computing. To achieve this goal, the grid computing was used to accelerate
research and discovery of new drugs in-silico for infectious
diseases.
i
Table des matières
1 Introduction 1
1.1 Problèmatique 1
1.2 Notre contribution 2
1.3 Plan du mémoire 2
2 État de l'art 3
2.1 Conception de médicaments in-silico 3
2.2 Criblage virtuel »Vitual Screening» 4
2.2.1 Introduction 4
2.2.2 Découverte de nouveaux médicaments avec le
criblage virtuel. . . 6
2.2.3 Les différentes stratégies du criblage
virtuel 6
2.2.4 Criblage virtuel à haut débit 7
2.2.5 Conclusion 7
2.3 Docking 9
2.3.1 Introduction 9
2.3.2 Approches du docking 10
2.3.3 Principe du docking 11
2.3.4 Outils de Docking 12
2.3.5 Conclusion 13
2.4 AutoDock 14
2.4.1 Docking avec AutoDock 15
2.4.2 Conclusion 17
2.5 Grille de calcul 18
2.5.1 Introduction 18
2.5.2 Grille de calcul 18
2.5.3 Organisation virtuelle 19
2.5.4 Architecture générale d'une grille de calcul
20
2.5.5 Composants de la grille 21
2.5.6 Fonctionnement de la grille 22
2.5.7 Avantages & Défis de la grille 24
2.5.8 Conclusion 24
2.6 Portail GVSS 26
2.6.1 Introduction 26
2.6.2 La plate-forme GAP 27
2.6.3 Architecture GVSS 28
2.6.4 Conclusion 29
2.7 Plate-formes utilisés 30
2.7.1 WISDOM 30
2.7.2 DIRAC 33
ii
3 Implémentation 37
3.1 Architecture du système proposée 37
3.2 Outils utilisés 38
3.3 Conception du portail 41
3.4 Développement du portail du web 48
3.4.1 Les services web 48
4 Expérimentation &
Résultats 52
4.1 Conclusion 63
5 Conclusion & perspective
64
iii
Table des figures
1
|
Processus de conception de médicaments in-silico
[11]
|
4
|
2
|
Criblage Virtuel in-silico
|
5
|
3
|
Docking protéine-ligand
|
10
|
4
|
Étapes du Docking
|
11
|
5
|
Illustration de docking/scoring [6]
|
12
|
6
|
Comparaison des programmes de docking [16]
|
13
|
7
|
Procédures de docking avec AutoDock
|
15
|
8
|
La grille de calcul
|
19
|
9
|
Couches de la grille de calcul
|
21
|
10
|
Architecture de grille de calcul [10]
|
23
|
11
|
Portail GVSS
|
27
|
12
|
Architecture Service de criblage virtuel GAP (GVSS) [7]
|
29
|
13
|
Architecture WPE [9]
|
31
|
14
|
Intergiciel DIRAC
|
33
|
15
|
Architecture DIRAC [20]
|
35
|
16
|
Architecture du système proposée
|
38
|
17
|
Workflow soumission de job sur la grille avec Taverna
|
39
|
18
|
Diagramme de classe du portail web
|
42
|
19
|
Cas d'utilisation pour le Ligand
|
43
|
20
|
Cas d'utilisation pour la Protéine
|
44
|
21
|
Cas d'utilisation pour les paramètres de grille
|
45
|
22
|
Cas d'utilisation pour le docking
|
46
|
23
|
Cas d'utilisation pour l'administrateur du portail
|
47
|
24
|
Modèle MVC
|
48
|
25
|
Description des services web implémentés
|
49
|
26
|
Workflow des services web du portail
|
51
|
27
|
Interface d'accueil du portail web
|
52
|
28
|
Interface de création d'un nouveau compte
|
53
|
29
|
Interface d'authentification
|
53
|
30
|
Interface de gestion des utilisateurs
|
54
|
31
|
Interface d'ajout d'un nouveau Ligand
|
54
|
32
|
Interface de liste des Ligands disponibles
|
55
|
33
|
Interface de gestion des protéines
|
55
|
34
|
Interface de modification d'une protéine
|
56
|
35
|
Interface d'ajout de fichier de paramètres de la grille
|
56
|
36
|
Interface d'ajout d'un nouveau projet de docking
|
57
|
37
|
Vérification d'ajout du nouveau projet
|
57
|
38
|
Soumission de job de docking
|
58
|
39
|
Téléchargement du résultat de docking
|
58
|
iv
40
|
Fichier log de docking »dlg»
|
59
|
41
|
Soumission du projet de docking ProjectZinc1OKE
|
59
|
42
|
Téléchargement du résultat de docking
|
60
|
43
|
Enregistrement du résultat du job sur la grille de
calcul
|
60
|
44
|
Les fichiers dlg 4 glg du docking
|
60
|
45
|
Les fichiers log de docking et de la grille dlg 4 glg
|
61
|
46
|
Téléchargement du résultat des jobs
|
62
|
47
|
Les fichiers des jobs soumis en parallèle
|
63
|
1
1 Introduction
Par le passé, un grand nombre de médicaments ont
étédécouverts tout simplement grâce à
l'identification de principes actifs extraits de substances naturelles
historiquement utilisées dans la médecine non-conventionnelle, ou
même par hasard, ce qu'on nomme
»sérendipité». Mais plus le nombre de
médicaments connus augmente et plus les probabilités de faire une
telle découverte sont faibles. Par la suite, les avancées dans le
domaine de la synthèse chimique ont conduit à une démarche
de recherche systématique permettant l'élaboration de nouveaux
médicaments de plus grande efficacité. La découverte de
nouveaux médicaments »drug discovery» est un
processus extrêmement long et fastidieux, 12 à 15 ans peuvent
s'écouler entre la découverte de la molécule et la mise
à disposition du médicament auprès des patients. Les
nouvelles méthodes permettant la découverte de nouveaux
médicaments se doivent donc d'innover afin de mettre en évidence
des molécules encore inconnues ayant un certain potentiel
d'activitésur des cibles biologiques connues [Davis et al,2003]. Les
outils mis en place doivent être capables de guider les chimistes
médicinaux dans le choix des molécules à cribler et
à synthétiser.
Les stratégies de criblage virtuel, ou in-silico,
sont donc depuis quelques années employées en tant
qu'alternative ou de façon complémentaire. Ces techniques sont en
général assez faciles à mettre en place, pour un
coût bien moindre que les criblages expérimentaux. De plus,
l'évolution technologique constante de ces dernières
décennies a permis d'accélérer considérablement le
temps de calcul nécessaire à la simulation de systèmes
complexes ou de bases de données de plusieurs milliers de
molécules. Le criblage virtuel est donc aujour-d'hui employédans
de nombreux projets, afin de sélectionner, au sein de vastes librairies
de molécules, un nombre restreint de composés à cribler
expérimentalement.
1.1 Problèmatique
L'axe principal de ce travail se situe dans le domaine de
bio-informatique. Plus précisement dans la recherche et la
découverte de nouveaux médicaments pour les maladies dangereuses
comme: HIV, Ebola, fièvre de dengue,..., par le biais de techniques
informatiques. Le défi se situe au niveau de la conception de nouveaux
médicaments, qui est un processus long et très onéreux, et
au niveau du déployement d'un grand nombre de docking sur la grille de
calcul. Cependant, les outils existants sont en manque de moyen simple pour
fournir des procédures concises pour les utilisateurs réguliers
(biologistes, chimistes, etc) afin d'ar-ranger les ressources pour mener un
amarrage moléculaires massif. Par conséquent, ces derniers
rencontrent plusieurs difficultés et problèmes lors de
l'utilisation de ces applications, ce qui entraîne une grande perte de
temps et d'argent afin d'accélérer la recherche de nouveaux
traitements pour les maladies négligées.
2
1.2 Notre contribution
Notre contribution repose sur le développement d'un
portail web pour le criblage virtuel en utilisant la grille de calcul pour
faciliter la découverte et la recherche de nouveaux médicaments
pour les maladies graves et négligées. Nous proposons une
interface conviviale et facile à utiliser pour les utilisateurs
non-expérimentés (chimistes, biologistes,
médecins....) en informatique et en grille de calcul.
Afin de favoriser l'intéropérabilitéentre le
portail web et les services de grille de calcul, nous proposons une
architecture qui permettra une analyse et un traitement fiable des
requêtes des utilisateurs finaux.
|