Développement d''''un portail web pour le criblage virtuel sur la grille de calcul : Luận văn ThS. Công nghệ thông tin

79 19 0
Développement d''''un portail web pour le criblage virtuel sur la grille de calcul : Luận văn ThS. Công nghệ thông tin

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Institut de la Francophonie pour l’Informatique M´ emoire de fin d’´ etudes pour l’obtention du diplˆ ome de Master II Informatique Option : R´ eseaux et Syst` emes Communicants D´ eveloppement d’un portail web pour le criblage virtuel sur la grille de calcul Promotion 17-RSC R´ edig´ e par : Louacheni Farida Sous l’encadrement de : Dr.Nguyen Hong Quang Dr.Doan Trung Tung Dr.Bui The Quang 20 novembre 2014 Remerciements Ce travail de stage de fin d’´etudes a ´et´e effectu´e au sein du Laboratoire MSI `a l’Institut de la Francophonie pour l’Informatique, sous la direction du Docteur Nguyen Hong Quang, auquel je tiens `a exprimer ma profonde gratitude, et ma vive reconnaissance pour m’avoir confi´e ce sujet J’adresse mes plus vifs remerciements au Dr.Doan Tung Tung et Dr.Quang Bui The de m’avoir encadr´e et prodigu´e maints conseils Je suis tr`es reconnaissante `a tous les enseignants de l’IFI pour la qualit´e de l’enseignement qu’ils nous ont offerts Ma reconnaissance infinie ` a mes tr`es chers parents qui m’ont enseign´e la pers´ev´erance dans mes ´etudes, qui m’ont toujours ´et´e d’un grand secours par leur soutient et leur encouragement, ainsi mes adorables soeurs et mon tr`es cher fr`ere et mon ami Yacine-Malek Enfin, un immense merci ` a mes amis qui m’ont toujours soutenue i R´ esum´ e ` l’heure actuelle, la grille de calcul est en train de devenir une force motrice maA jeure pour de nouvelles approches pour la collaboration de science `a grande ´echelle Plusieurs programmes nationaux et internationaux eScience ont favoris´e la collaboration entre chercheurs de diff´erents domaines scientifiques Dans le domaine biom´edicale, plus pr´ecisement dans la recherche de nouveaux m´edicaments pour les maladies infectieuses La grille de calcul a initi´e plusieurs projets ` a grande ´echelle dans les approches de criblage de m´edicaments in-silico Le projet WISDOM a ´et´e parmi les premiers projets dans le domaine public qui a fait usage de la grille tout en permettant le docking in-silico pour simuler l’interaction de m´edicaments potentiels avec des prot´eines cibles Le docking in-silico est la premi`ere ´etape dans le processus de criblage virtuel, il est consid´er´e comme l’une des approches les plus prometteuses afin acc´el´erer et de r´eduire les coˆ uts de d´eveloppement de nouveaux m´edicaments pour les maladies n´eglig´ees Bien que, de nombreuses applications ont ´et´e d´evelopp´ees pour permettre le criblage virtuel dont le but d’acc´el´erer le processus de recherche des m´edicaments Une barri`ere critique de ces programmes est leur complexit´e en terme d’utilisation et de pr´evoir des proc´edures concises pour les utilisateurs r´eguliers L’objectif de ce travail est de d´evelopper un portail web conviviale pour effectuer le criblage virtuel, et de d´eployer un tr`es grand nombre de docking sur la grille de calcul Pour atteindre ce but, la grille de calcul a ´et´e utilis´e pour acc´el´erer la recherche et la d´ecouverte de nouveaux m´edicaments in-silico et traitements pour les maladies infectieuses ii Abstract Grid computing is currently developing into a major driving force for new approaches towards collaborative large scale science Several national and international eScience programs have fostered collaboration between researchers from different scientific domains In the biomedical field, more precisely in drug discovery for infectious diseases Grid computing has initiated several projects on large scale in-silico drug screening approaches The project WISDOM was amongst the first projects in the public domain that made use of grid enabled in-silico docking to simulate the interaction of potential drugs with target proteins In-silico docking is the first step in the virtual screening process, which is one of the most promising approaches to speed-up and to reduce the costs of the development of new drugs Although, many applications have been developed to allow in-silico screening, but a critical barrier of these programs is the lack of a suitable, easy, simple way to use and to provide concise procedures for regular users The main goal of this work is to develop a user-friendly web portal to perform virtual screening and to deploy a large number of docking on grid computing To achieve this goal, the grid computing was used to accelerate research and discovery of new drugs in-silico for infectious diseases iii Table des mati` eres Introduction 1.1 Probl`ematique 1.2 Notre contribution 1.3 Plan du m´emoire ´ Etat de l’art 2.1 Conception de m´edicaments in-silico 2.2 Criblage virtuel ”Vitual Screening” 2.2.1 Introduction 2.2.2 D´ecouverte de nouveaux m´edicaments avec le criblage 2.2.3 Les diff´erentes strat´egies du criblage virtuel 2.2.4 Criblage virtuel a` haut d´ebit 2.2.5 Conclusion 2.3 Docking 2.3.1 Introduction 2.3.2 Approches du docking 2.3.3 Principe du docking 2.3.4 Outils de Docking 2.3.5 Conclusion 2.4 AutoDock 2.4.1 Docking avec AutoDock 2.4.2 Conclusion 2.5 Grille de calcul 2.5.1 Introduction 2.5.2 Grille de calcul 2.5.3 Organisation virtuelle 2.5.4 Architecture g´en´erale d’une grille de calcul 2.5.5 Composants de la grille 2.5.6 Fonctionnement de la grille 2.5.7 Avantages & D´efis de la grille 2.5.8 Conclusion 2.6 Portail GVSS 2.6.1 Introduction 2.6.2 La plate-forme GAP 2.6.3 Architecture GVSS 2.6.4 Conclusion 2.7 Plate-formes utilis´es 2.7.1 WISDOM 2.7.2 DIRAC i virtuel 1 2 3 4 6 7 9 10 11 12 13 14 15 17 18 18 18 19 20 21 22 24 24 26 26 27 28 29 30 30 33 Impl´ ementation 3.1 Architecture du syst`eme propos´ee 3.2 Outils utilis´es 3.3 Conception du portail 3.4 D´eveloppement du portail du web 3.4.1 Les services web 37 37 38 41 48 48 Exp´ erimentation & R´ esultats 52 4.1 Conclusion 63 Conclusion & perspective 64 ii Table des figures 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 Processus de conception de m´edicaments in-silico [11] Criblage Virtuel in-silico Docking prot´eine-ligand ´ Etapes du Docking Illustration de docking/scoring [6] Comparaison des programmes de docking [16] Proc´edures de docking avec AutoDock La grille de calcul Couches de la grille de calcul Architecture de grille de calcul [10] Portail GVSS Architecture Service de criblage virtuel GAP (GVSS) [7] Architecture WPE [9] Intergiciel DIRAC Architecture DIRAC [20] Architecture du syst`eme propos´ee Workflow soumission de job sur la grille avec Taverna Diagramme de classe du portail web Cas d’utilisation pour le Ligand Cas d’utilisation pour la Prot´eine Cas d’utilisation pour les param`etres de grille Cas d’utilisation pour le docking Cas d’utilisation pour l’administrateur du portail Mod`ele MVC Description des services web impl´ement´es Workflow des services web du portail Interface d’accueil du portail web Interface de cr´eation d’un nouveau compte Interface d’authentification Interface de gestion des utilisateurs Interface d’ajout d’un nouveau Ligand Interface de liste des Ligands disponibles Interface de gestion des prot´eines Interface de modification d’une prot´eine Interface d’ajout de fichier de param`etres de la grille Interface d’ajout d’un nouveau projet de docking V´erification d’ajout du nouveau projet Soumission de job de docking T´el´echargement du r´esultat de docking iii 10 11 12 13 15 19 21 23 27 29 31 33 35 38 39 42 43 44 45 46 47 48 49 51 52 53 53 54 54 55 55 56 56 57 57 58 58 40 41 42 43 44 45 46 47 Fichier log de docking ”dlg” Soumission du projet de docking ProjectZinc1OKE T´el´echargement du r´esultat de docking Enregistrement du r´esultat du job sur la grille de calcul Les fichiers dlg & glg du docking Les fichiers log de docking et de la grille dlg & glg T´el´echargement du r´esultat des jobs Les fichiers des jobs soumis en parall`ele iv 59 59 60 60 60 61 62 63 Introduction Par le pass´e, un grand nombre de m´edicaments ont ´et´e d´ecouverts tout simplement grˆace a` l’identification de principes actifs extraits de substances naturelles historiquement utilis´ees dans la m´edecine non-conventionnelle, ou mˆeme par hasard, ce qu’on nomme ”s´erendipit´e” Mais plus le nombre de m´edicaments connus augmente et plus les probabilit´es de faire une telle d´ecouverte sont faibles Par la suite, les avanc´ees dans le domaine de la synth`ese chimique ont conduit `a une d´emarche de recherche syst´ematique permettant l’´elaboration de nouveaux m´edicaments de plus grande efficacit´e La d´ecouverte de nouveaux m´edicaments ”drug discovery” est un processus extrˆemement long et fastidieux, 12 `a 15 ans peuvent s’´ecouler entre la d´ecouverte de la mol´ecule et la mise a` disposition du m´edicament aupr`es des patients Les nouvelles m´ethodes permettant la d´ecouverte de nouveaux m´edicaments se doivent donc d’innover afin de mettre en ´evidence des mol´ecules encore inconnues ayant un certain potentiel d’activit´e sur des cibles biologiques connues [Davis et al,2003] Les outils mis en place doivent ˆetre capables de guider les chimistes m´edicinaux dans le choix des mol´ecules `a cribler et a` synth´etiser Les strat´egies de criblage virtuel, ou in-silico, sont donc depuis quelques ann´ees employ´ees en tant qu’alternative ou de fa¸con compl´ementaire Ces techniques sont en g´en´eral assez faciles `a mettre en place, pour un coˆ ut bien moindre que les criblages exp´erimentaux De plus, l’´evolution technologique constante de ces derni`eres d´ecennies a permis d’acc´el´erer consid´erablement le temps de calcul n´ecessaire a` la simulation de syst`emes complexes ou de bases de donn´ees de plusieurs milliers de mol´ecules Le criblage virtuel est donc aujourd’hui employ´e dans de nombreux projets, afin de s´electionner, au sein de vastes librairies de mol´ecules, un nombre restreint de compos´es a` cribler exp´erimentalement 1.1 Probl` ematique L’axe principal de ce travail se situe dans le domaine de bio-informatique Plus pr´ecisement dans la recherche et la d´ecouverte de nouveaux m´edicaments pour les maladies dangereuses comme : HIV, Ebola, fi`evre de dengue, , par le biais de techniques informatiques Le d´efi se situe au niveau de la conception de nouveaux m´edicaments, qui est un processus long et tr`es on´ereux, et au niveau du d´eployement d’un grand nombre de docking sur la grille de calcul Cependant, les outils existants sont en manque de moyen simple pour fournir des proc´edures concises pour les utilisateurs r´eguliers (biologistes, chimistes, etc) afin d’arranger les ressources pour mener un amarrage mol´eculaires massif Par cons´equent, ces derniers rencontrent plusieurs difficult´es et probl`emes lors de l’utilisation de ces applications, ce qui entraˆıne une grande perte de temps et d’argent afin d’acc´el´erer la recherche de nouveaux traitements pour les maladies n´eglig´ees 1.2 Notre contribution Notre contribution repose sur le d´eveloppement d’un portail web pour le criblage virtuel en utilisant la grille de calcul pour faciliter la d´ecouverte et la recherche de nouveaux m´edicaments pour les maladies graves et n´eglig´ees Nous proposons une interface conviviale et facile a` utiliser pour les utilisateurs non-exp´eriment´es (chimistes, biologistes, m´edecins ) en informatique et en grille de calcul Afin de favoriser l’int´erop´erabilit´e entre le portail web et les services de grille de calcul, nous proposons une architecture qui permettra une analyse et un traitement fiable des requˆetes des utilisateurs finaux 1.3 Plan du m´ emoire Ce m´emoire sera organis´e en parties pr´esentant respectivement : l’´etat de l’art, impl´ementation & conception, d´emonstration & r´esultats, conclusion & perspectives Dans la premi`ere partie, un ´etat de l’art est pr´esent´e qui passe en revue le criblage virtuel, le docking, suivie de l’outil AutoDock Ensuite nous abordons la technologie de grille de calcul, le portail GVSS et les plate-formes WISDOM qui est d´eploy´ee dans la d´ecouverte de nouveaux m´edicaments et DIRAC La deuxi`eme partie du m´emoire pr´esente l’impl´ementation du portail, qui se focalisera sur l’architecture propos´ee, la conception et l’impl´ementation du portail L’avant derni`ere partie porte sur la d´emonstration du portail muni des r´esultats ` la fin, ce m´emoire ce termine par une conclusion g´en´erale et quelques perspecobtenus A tives Figure 36 – Interface d’ajout d’un nouveau projet de docking En retournant a` la liste des projets qui ont ´et´e cr´e´es, on peut v´erifier que le projet a ´et´e ajout´e avec succ`es Figure 37 – V´erification d’ajout du nouveau projet Apr`es avoir cr´eer un projet et choisir les fichiers n´ecessaires pour effectuer le docking L’utilisateur n’a qu’appuyer sur le bouton ”submit” pour soumettre son job sur la grille Le bouton va r´ecup´erer les fichiers `a partir du portail, puis, il fait appel a` Taverna client qui r´ecup`ere le workflow contenant les services web Apr`es, il soumet le job sur la grille de calcul Nous allons pr´esenter les r´esultats que nous avons obtenus lors de soumission des jobs de docking sur la grille, et la r´ecup´eration des r´esultats a` partir de la grille `a travers de ce portail web Nous nous sommes servis de la base de donn´ee ZINC ( http: // zinc docking org) , qui est une base de donn´ee de compos´es disponibles pour le criblage virtuel (1OKE pour la prot´eine, et ZINC pour le ligand), o` u le fichier de ligand comprend 10256 composants Les fichiers de param`etres pour la grille grid parameter et pour le docking dock parameter (dpf & gpf) ont d´ej`a ´et´e pr´epar´e L’´etape de docking mol´eculaire est r´ealis´ee grˆace au sousprogramme AutoDock, qui recherche toute les solutions d’amarrage en fonction des param`etres du fichier ”dpf” que l’utilisateur a` d´ej`a pr´eparer Apr`es l’ach`evement du docking, les r´esultats ont ´et´e g´en´er´es dans un fihier log avec l’extension (glg & dlg) Le fichier ”glg” contient les affinit´es calculer entre les diff´erentes types d’atomes de la prot´eine et le ligand Et le fichier ”dlg”, qui fournit les coordonn´ees atomiques des 10 meilleurs positions du ligand dans le site de la prot´eine, leur ´energie d’interaction ainsi que les diff´erentes valeurs de l’´ecart quadratique moyen (Root Mean Square Deviation ou le ”RMSD”) 57 La figure ci-apr`es montre la soumission de job de docking, tout en s´electionnant le projet ”projectZinc137” Dans ce projet nous avons choisi : le fichier de param`etre de docking ZINC13735135 01 1OKE.dpf , le ligand ZINC13735135 01.pdbqt, la prot´eine 1OKE.pdbqt et le fichier de param`etre de la grille map.txt Figure 38 – Soumission de job de docking Apr`es avoir soumettre le job avec le bouton submit, le r´esultat consiste en fichier zip, o` u nous l’avons sp´ecifier dans le script jdl Le fichier est stok´es sur l’espace de stockage de la grille de calcul, puis nous le r´ecup´erons depuis le SE de la grille via la commande DIRAC ”dirac-dms-get-file” Ce dernier contient le fichier de docking ”dlg” La capture ci-apr`es montre le r´esultat du job stocker sur notre espace de stockage de la grille, comme c’est illustr´e dans la capture ci-dessous Le r´esultat est compress´e et stock´e sur l’´el´ement de stockage de la grille de calcul, puis, le r´esultat est r´ecup´er´e a` partir de la grille de calcul `a l’aide de la commande DIRAC, pour que l’utilisateur puisse le t´el´echarger La figure ci-apr`es montre le t´el´echargement du r´esultat du job de docking soumis Le fichier contient les fichiers log de docking et de grille (”dlg” & ”glg”) Figure 39 – T´el´echargement du r´esultat de docking 58 Apr`es avoir t´el´echarger le fichier ”zip”, nous avons v´erifi´e si l’op´eration du docking a ´et´e effctu´e avec succ`es, en ouvrant le fichier log de docking La capture ci-dessous illustre le r´esultat du docking Comme montre la figure suivante le docking a ´et´e achev´e avec succ`es Figure 40 – Fichier log de docking ”dlg” Nous avons aussi test´e ce portail pour soumettre un autre job de docking du projet : ProjectZinc1OKE, qui comprend les fichiers de param`etres suivants : fichier de param`etres de docking (dpf ) ”ZINC4166-0875 01 1OKE.dpf”, fichier ligand ”ZINC41660875 01 1OKE.pdbqt”, fichier prot´eine ”1OKE.pdbqt” Figure 41 – Soumission du projet de docking ProjectZinc1OKE 59 L’utilisateur peut r´ecup´erer son r´eultat du job d`es que l’op´eration du docking s’ach`evera Le r´esultat est illustr´e ci-apr`es Figure 42 – T´el´echargement du r´esultat de docking On peut voir que le r´esultat du docking est bien enregistr´e dans l’espace de stockage de la grille de calcul, o` u nous avons compress´e les fichiers r´esultant du docking Figure 43 – Enregistrement du r´esultat du job sur la grille de calcul Comme nous avons d´ej`a mentionn´e, le r´esultat du docking consiste en deux fichiers ”dlg (docking log file) & glg (grid log file)”, mais le fichier le plus important est le fichier ”dlg” Figure 44 – Les fichiers dlg & glg du docking 60 La capture ci-apr`es montre que le docking s’est effectu´e avec succ`es Figure 45 – Les fichiers log de docking et de la grille dlg & glg Rappelons que le but essentiel de l’utilisation de la grille de calcul, est la possibilit´e de soumettre plusieurs jobs en parall`ele L’utilisateur peut soumettre plusieurs jobs de docking sur la grille de calcul via l’intergiciel DIRAC Pour cela, il suffit de pr´eparer les fichiers n´ecessaires pour r´ealiser cette op´eration Nous avons pr´epar´e les fichiers de param`etres de docking ”dpf” que nous voulons utiliser afin d’effectuer le docking Pour soumettre des jobs en parall`ele `a l’aide de l’intergiciel DIRAC, nous avons utilis´e un workflow Ce workflow va g´en´erer les 61 fichiers ”jdl” essentiels, puis il les soumets sur la la grille de calcul pour que le Worker Node puisse ex´ecuter ces jobs Les r´esultats des jobs sont compress´e dans un fichier zip, ensuite stock´e sur l’espace de stockage de la grille Apr`es que l’op´eration du docking s’est termin´e, on peut r´ecup´erer les r´esultat du docking a` partir du portail Afin de montrer la proc´edure de docking avec plusieurs fichiers, nous avons pr´eparer le fichiers de docking ”ZINC4.txt”, qui comporte les fichiers ci-dessous : > ZINC41584388 01 1OKE.dpf > ZINC41584391 01 1OKE.dpf > ZINC41584955 01 1OKE.dpf > ZINC41584955 02 1OKE.dpf > ZINC41584983 03 1OKE.dpf Apr`es avoir soumettre le job, le r´esultat consiste en un fichier compress´e que nous l’avons r´ecup´erer depuis l’espace de stockage de la grille d`es que le docking s’est achev´e La capture ci-apr`es pr´esente le r´esultat de soumission de plusieurs jobs de docking soumis en parall`ele Figure 46 – T´el´echargement du r´esultat des jobs On acc´edant a` notre espace de stockage de grille de calcul, on remarque que le r´esultat du job est bien stock´e La capture ci-dessous montre le fichiers de param`etre de docking (ZINC4.txt) et le r´eusltat (ZINC4.zip) 62 Ce fichier comprend les r´esultats de tous les jobs soumet sur la grille de calcul, et chaque fichier contient les deux fichiers log dlg (docking log file) & glg (grid log file) Figure 47 – Les fichiers des jobs soumis en parall`ele Mais parfois dˆ u a` une mauvaise connexion et `a la non convivialit´e des commandes DIRAC, nous ne pouvons pas r´ecup´erer les r´esultats depuis la grille Et lors de r´ecup´eration des r´esultats jobs depuis la grille, on s’est rendu compte que quelques r´esultats ne sont pas bonnes Et cela s’explique par le fait que les donn´ees soit de la mol´ecule du prot´eine ou celle des ligands contient des informations erron´e et incompatibles 4.1 Conclusion Dans le cadre de ce projet, nous avons utilis´e plusieurs outils pour la r´ealisation de ce projet Nous avons utilis´e DIRAC comme intergiciel afin de soumettre les jobs de docking sur la grille de calcul, suivre l’´etat du job et r´ecup´erer les r´esultats L’outil AutoDock , o` u nous avons d´eploy´e la version AutoDock4.2 pour cr´eer et pr´eparer les fichiers n´ecessaires pour le docking Et l’outil Taverna pour la cr´eation et la visualisation des workflow Le but d’utiliser Taverna est d’avoir la possibilit´e d’´etendre et d’extensier le workflow en ajoutant d’autres nouvelles fonctionalit´es, des services et d’autres processus pour mieux l’adapter aux besoins ult´erieurs des utilisateurs Les utilisateurs de ce portail peuvent donc profiter des services du portail, qui servent comme interm´ediare entre les utilisateurs finaux et les services de la grille Ce portail fournit un moyen pour la gestion des prot´eines, des ligands, des param`etres de grille, des projets de docking, de soumettre des jobs de docking sur la grille de calcul et de r´ecup´erer les r´esultats 63 Conclusion & perspective La d´ecouverte de nouveaux m´edicaments ”in-silico” est l’une des strat´egies les plus prometteuses visant a` acc´el´erer le processus de d´eveloppement de m´edicaments Le criblage virtuel ”Virtual Screening”, est l’une des premi`eres ´etapes du processus de d´ecouverte de m´edicaments, il repose sur la s´election ”in-silico” des meilleurs m´edicaments potentiels qui agissent sur une prot´eine cible donn´ee, il peut se faire ”in-vitro”, mais il est tr`es on´ereux Le criblage virtuel n´ecessite une analyse complexe avec plusieurs ´etapes telles que la mod´elisation mol´eculaire et le docking L’un des principaux avantages conf´er´es par le docking est qu’il permet aux chercheurs de trier (screen) rapidement les grandes bases de donn´ees de m´edicaments potentiels qui n´ecessiteraient autrement un travail fastidieux et de longue dur´ee dans le laboratoire selon les m´ethodes traditionnelles de d´ecouverte de m´edicaments La recherche sur les maladies n´eglig´ees pourrait largement b´en´eficier des avantages de d´eploiement des grilles informatiques a` plusieurs niveaux R´ecemment, le d´eploiement de docking ”in-silico” sur les grilles de calcul a ´emerg´e dans la perspective de r´eduire les coˆ uts et le temps de conception de m´edicaments Le pr´esent travail poursuit deux objectifs Le premier, est de se familiariser avec l’outil AutoDock afin mieux comprendre le m´ecanisme de docking mol´eculaire prot´eine-ligand, et l’outil Taverna pour la cr´eation et l’ex´ecution des workflows scientifiques Le deuxi`eme objectif consiste `a d´evelopper un portail web pour soumettre les jobs de docking in-silico a` grande ´echelle sur la grille de calcul en utilisant l’intergiciel DIRAC et l’environnement Taverna [26] O` u l’utilisateur pr´epare ses fichiers n´ecessaires (prot´eine, ligand, param`etres de la grille), soumet son job sur la grille via le portail et r´ecup`ere le r´esultat de son job de docking L’ach`evement de ce projet implique l’utilisation coordonn´ee de plusieurs outils informatiques (AutoDock, Taverna, DIRAC) Un nombre croissant de ces ressources sont mises a` disposition sous la forme de services Web De sorte que, ces services Web sont orchestrer dans un workflow et qui sont mises a` la disposition des chercheur scientifiques Afin de faciliter l’interaction entre l’utilisateur et les ressources de la grille de calcul, nous avons d´evelopp´e un portail web qui r´epond aux besoins des utilisateurs qui ne sont pas forc´ement des experts en informatique Ce portail permet `a ces derniers de charger, modifier, consulter leur mol´ecules de ligands, prot´eines sur le portail Ainsi, de cr´eer leur projet et d’effectuer le docking ”in-silico” afin d’acc´el´erer leur recherche sans se pr´eoccuper de la complexit´e du portail, tout en d´eployant les ressources de la grille de calcul pour soumettre les jobs de docking `a travers l’intergiciel ”DIRAC” Ainsi, nous nous sommes servis de l’outil AutoDock pour pr´eparer les fichiers n´ecessaires et effectuer le docking Nous avons cr´e´e un workflow pour le criblage virtuel sur la grille en utilisant l’outil ”Taverna” Nous avons pu soumettre les jobs de docking de la base de donn´ee ZINC (10256 compos´es), o` u nous avons stock´es les r´esultats sur l’espace de stockage de la grille de calcul 64 Au cours de la r´ealisation de ce projet, nous avons rencontr´e plusieurs des difficult´es Tout d’abord, les difficult´es th´eoriques Elles se r´esument sur la compr´ehension des m´ecanismes de docking mol´eculaire et de criblage virtuel Et les difficult´es pratiques se situent au niveau d’installation et l’utilisation des outils (Taverna, AutoDock) Et au niveau des lignes de commande de DIRAC, qui ne sont pas assez conviviale a` utiliser Ainsi, lors de l’utilisation de l’outil Taverna qui consomme beaucoup de RAM, ce qui entraˆıne un ralentissement des autres processus en cours d’ex´ecution et les services n´ecessaires pour la soumission des jobs du portail vers la grille de calcul Nous allons am´eliorer le portail web au fur et a` mesure en ajoutant d’autres fonctionalit´es et d’autres services : • Mise en place du portail web sur le serveur de l’IFI • Authentification au moyen d’un certificat client X509 au lieu du nom et du mot de passe de l’utilisateur • Visualisation des r´esultats de docking prot´eine-ligand sous forme de graphe 65 R´ ef´ erences [1] Jens Kruger, Richard Grunzke, Sonja Herres-Pawlis, Performance Studies on Distributed Virtual Screening, 2014 [2] Pratap Parida, Brajesh Shankar, in-silico protein ligand interaction study of typical antipsychotic drugs against dopaminergic D2 receptor, 2013 [3] William Lindstrom, Garrett M Morris, Christoph Weber, Ruth Huey, Using AutoDock4 for virtual screening, 2008 [4] Romano T Kroemer, Structure-Based Drug Design : Docking and Scoring, 2007 [5] C.S.R Prabhu, Grid and Cluster Computing, New Delhi : Prentice Hall of India, 2008 [6] Stian Soiland-Reyes, Ian Dunlop, Alan Williams, Taverna reloaded [7] Hsin-Yen Chen, Mason Hsiung, Hurng-Chun Lee, Eric Yen, Simon C Lin, Ying-Ta Wu, GVSS : A High Throughput Drug Discovery Service of Avian Flu and Dengue Fever for EGEE and EUAsiaGrid, 2009 [8] Nguyen Bui The, Nguyen Hong Quang, Doan Trung Tung,On the Performance Enhancement of the WISDOM Production Environment, 2012 [9] Ankur Dhanik, John SMcMurray, Lydia Kavraki, AutoDock based incremental docking protocol to improve docking of large ligands, 2012 [10] Pritpal Singh, Gurinderpal Singh, Grid computing architecture 2013 [11] JACQ Nicolas, In silico drug discovery services in computing grid envir nments against neglected and emerging infectious diseases 2006 [12] D Hull, K Wolstencroft, R Stevens, C A Goble, M R Pocock, Taverna : a tool for building and running workflows of services, Nucleic Acids Research , 34 (Web-Server-Issue) :729 732, 2006 [13] Quang Bui The, Doan Trung Tung, Nguyen Hong Quang, Criblage virtuel sur grille de compos´ es isol´ es au Vietnam, 2011 [14] Yasmine Asses, Conception par mod´ elisation et criblage in silico d’hinibiteurs du r´ ecepteur c-Met, 2011 [15] Grosdidier A.Conception d’un logiciel de docking et applications dans la recherche de nouvelles mol´ ecules actives, Th`ese de doctorat en pharmacie Grenoble : Universit´e Joseph Fourier France 2007 [16] Sousa S F., Fernandes P A., Ramos M J, Protein-Ligand Docking : Current Status and Future Challenges, Proteins 2006 ; 65 : 15-26 [17] Koblitz, B.Santos, N.Pose, The AMGA metadata service, J.Grid Computing6,6167 (2008) [18] German-Renaud, C.Loomis, Scheduling for responsive grids, J.Grid Computing 7,463-478 (2009) [19] A.Tsaregorodtsev, V.Hamar, M.Sapunov, T.Glatard, Infrastructure DIRAC pour les Communaut´ es Pluridisciplinaires, 2011 [20] A.Tsaregorodtsev, P Charpentier, V.Romanovski, DIRAC - The Distributed MC Production and Analysis for LHCb , 2010 [21] E van Herwijnen, J Closier, M Frank, C Gaspar, F Loverre, S.Ponce, and M Gandelman, Dirac-distributed infrastructure with remote agent control, Conference for Computing in High-Energy and Nuclear Physics (CHEP 03), 2003 [22] Bui The Quang, Nguyen Hong Quang, Emmanuel Medernach, Vincent Breton , Multi-Level Queue-Based Scheduling for Virtual Screening Application on Pilot-Agent Platforms on Grid/Cloud to Optimize the Stretch , 2014 [23] Katherine Wolstencroft, Robert Haines, Donal Fellows, Alan Williams, The Taverna workflow suite : designing and executing workflows of Web Services on the desktop, web or in the cloud, 2013 [24] Trung Tung DOAN, Quang Minh DAO, Trong Hieu VU, Hong Phong PHAM, gINFO portal : a solution to monitor Influenza A on the Grid for non-grid users, 2011 [25] Nicolas JACQ, Jean SALZEMANNa, Yannick LEGRE, Matthieu REICHSTADT,Demonstration of In Silico Docking at a Large Scale on Grid Infrastructure , 2006 [26] T Oinn, M Addis, J Ferris, D Marvin, M Senger, M Greenwood, T Carver, K Glover, M R Pocock, A.Wipat, P Li, Taverna : A tool for the composition and enactment of bioinformatics workflows, Bioinformatics Journal 20(17) pp 3045-3054, 2004, doi :10.1093/bioinformatics/bth361 Annexe • Installation du client DIRAC : Avant d’installer DIRAC, l’utilisateur doit respecter les conditions suivantes : – Doit ˆetre un membre d’une organisation virtuelle par exemple : euasia, biomed, Nous nous sommes enregistr´e aupr`es de la VO Biomed via le site : https: // cclcgvomsli01 in2p3 fr: 8443/ voms/ biomed/ user/ home action – Poss`ede un certificat X.509 reconnu par EGEE, afin de pouvoir utiliser les ressource de la grille EGEE > wget -np -O dirac-install https://github.com/DIRACGrid/DIRAC/ raw/integration/Core/scripts/dirac-install.py no-check-certificate > chmod +x dirac-install > dirac-install -r v6r11p3 > /dirac-install > source bashrc > dirac-proxy-init -x > dirac-configure -V vo.formation.idgrilles.fr -S Dirac-Production -C dips://ccdirac01.in2p3.fr:9135/Configuration /Server I • Script pour pr´eparer les fichiers de grille et de docking ”gpf et dpf” #!/bin/sh WORK DIR=‘pwd‘ MGTOOLS="/usr/local/MGLTools-1.5.6/MGLToolsPckgs/AutoDockTools/ Utilities24" PYTHON="/usr/local/MGLTools-1.5.6/bin/pythonsh" while getopts "l:r:" opt; case $opt in l) LIG FILE=$OPTARG LIG BASE NAME=$(basename $LIG FILE) LIG EXT=${LIG FILE##*.} [ -f "${OPTARG}" ] && if [ "$LIG EXT" = "pdbqt" ]; then echo "Ligand file name " "$LIG FILE" else echo "Check the ligand file and extension" fi ;; r) PROT FILE=${ OPTARG} PROT BASE NAME=$(basename "$PROT FILE") PROT EXT=${PROT BASE NAME##*.} echo "Extension = $PROT EXT" [ -f "$PROT FILE" ] && if [ "$PROT EXT" = "pdbqt" ]; then echo "Protein file name " "$PROT FILE" else echo "Check the protein file and extension" fi ;; *) echo "Require argument!!" exit ;; esac done shift $((OPTIND-1)) ulimit -s unlimited cd $WORK DIR $PYTHON prepare gpf4.py -l $LIG FILE -r $PROT FILE -o ResGrid.gpf $PYTHON prepare dpf4.py -l $LIG FILE -r $PROT FILE -o ResDock.dpf II • Liste des jobs de docking soumis a` travers le portail sur la grille de calcul et leur ´etats III • R´esultats des jobs de docking stock´es sur l’espace de stockage de la grille de calcul IV

Ngày đăng: 23/09/2020, 20:59

Mục lục

  • Introduction

    • Problèmatique

    • Notre contribution

    • Plan du mémoire

    • État de l'art

      • Conception de médicaments in-silico

      • Criblage virtuel "Vitual Screening"

        • Introduction

        • Découverte de nouveaux médicaments avec le criblage virtuel

        • Les différentes stratégies du criblage virtuel

        • Criblage virtuel à haut débit

        • Conclusion

        • Docking

          • Introduction

          • Approches du docking

          • Principe du docking

          • Outils de Docking

          • Conclusion

          • AutoDock

            • Docking avec AutoDock

            • Conclusion

            • Grille de calcul

              • Introduction

              • Grille de calcul

              • Organisation virtuelle

              • Architecture générale d'une grille de calcul

Tài liệu cùng người dùng

Tài liệu liên quan