1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Développement dun portail web pour le criblage virtuel sur la grille de calcul luận văn ths công nghệ thông tin

79 26 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 79
Dung lượng 2,11 MB

Nội dung

Institut de la Francophonie pour l’Informatique Memoire de n d’etudes pour l’obtention du dipl^ome de Master II Informatique Option : Reseaux et Systemes Communicants Developpement d’un portail web pour le criblage virtuel sur la grille de calcul Promotion 17-RSC Redig par : Louacheni Farida Sous l’encadrement de : Dr.Nguyen Hong Quang Dr.Doan Trung Tung Dr.Bui The Quang 20 novembre 2014 Remerciements Ce travail de stage de n d’etudes a et e ectu au sein du Laboratoire MSI a l’Institut de la Francophonie pour l’Informatique, sous la direction du Docteur Nguyen Hong Quang, auquel je tiens a exprimer ma profonde gratitude, et ma vive reconnaissance pour m’avoir e ce sujet J’adresse mes plus vifs remerciements au Dr.Doan Tung Tung et Dr.Quang Bui The de m’avoir encadr et prodigue maints conseils Je suis tres reconnaissante a tous les enseignants de l’IFI pour la qualite de l’enseignement qu’ils nous ont o erts Ma reconnaissance in nie a mes tres chers parents qui m’ont enseign la persever-ance dans mes etudes, qui m’ont toujours et d’un grand secours par leur soutient et leur encouragement, ainsi mes adorables soeurs et mon tres cher frere et mon ami Yacine-Malek En n, un immense merci a mes amis qui m’ont toujours soutenue i Resum A l’heure actuelle, la grille de calcul est en train de devenir une force motrice ma-jeure pour de nouvelles approches pour la collaboration de science a grande echelle Plusieurs programmes nationaux et internationaux eScience ont favorise la collabo-ration entre chercheurs de di erents domaines scienti ques Dans le domaine biomedicale, plus precisement dans la recherche de nouveaux medicaments pour les maladies infectieuses La grille de calcul a initie plusieurs projets a grande echelle dans les approches de criblage de medicaments in-silico Le projet WISDOM a et parmi les premiers projets dans le domaine public qui a fait usage de la grille tout en permettant le docking in-silico pour simuler l’in-teraction de medicaments potentiels avec des proteines cibles Le docking in-silico est la premiere etape dans le processus de criblage virtuel, il est consider comme l’une des approches les plus prometteuses a n accelerer et de reduire les co^uts de developpement de nouveaux medicaments pour les maladies negligees Bien que, de nombreuses applications ont et developpees pour permettre le criblage virtuel dont le but d’accelerer le processus de recherche des medicaments Une barriere critique de ces programmes est leur complexit en terme d’utilisation et de prevoir des procedures concises pour les utilisateurs reguliers L’objectif de ce travail est de developper un portail web conviviale pour e ectuer le criblage virtuel, et de deployer un tres grand nombre de docking sur la grille de calcul Pour atteindre ce but, la grille de calcul a et utilise pour accelerer la recherche et la decouverte de nouveaux medicaments in-silico et traitements pour les maladies infectieuses ii Abstract Grid computing is currently developing into a major driving force for new approaches towards collaborative large scale science Several national and interna-tional eScience programs have fostered collaboration between researchers from dif-ferent scienti c domains In the biomedical eld, more precisely in drug discovery for infectious diseases Grid computing has initiated several projects on large scale in-silico drug screening approaches The project WISDOM was amongst the rst projects in the public do-main that made use of grid enabled in-silico docking to simulate the interaction of potential drugs with target proteins In-silico docking is the rst step in the virtual screening process, which is one of the most promising approaches to speed-up and to reduce the costs of the development of new drugs Although, many applications have been developed to allow in-silico screening, but a critical barrier of these programs is the lack of a suitable, easy, simple way to use and to provide concise procedures for regular users The main goal of this work is to develop a user-friendly web portal to perform virtual screening and to deploy a large number of docking on grid computing To achieve this goal, the grid computing was used to accelerate research and discovery of new drugs in-silico for infectious diseases iii Table des matieres Introduction 1.1 1.2 1.3 Problematique Notre contribution Plan du memoire Etat de l’art 2.1 2.2 Conception de medicaments in-silico Criblage virtuel "Vitual Screening" 2.2.1 2.2.2 2.2.3 2.2.4 2.2.5 Docking 2.3.1 2.3.2 2.3.3 2.3.4 2.3.5 AutoDock 2.4.1 2.4.2 Grille de calcul 2.5.1 2.5.2 2.5.3 2.5.4 2.5.5 2.5.6 2.5.7 2.5.8 Portail GVSS 2.6.1 2.6.2 2.6.3 2.6.4 Plate-formes utilises 2.7.1 2.7.2 2.3 2.4 2.5 2.6 2.7 i Implementation 3.1 3.2 3.3 3.4 Architecture du systeme proposee Outils utilises Conception du portail Developpement du portail du web 3.4.1 Les services web Experimentation & Resultats 4.1 Conclusion & perspective ii Conclusion Table des gures Processus de conception de medicaments in-silico [11] Criblage Virtuel in-silico Docking proteine-ligand 10 11 12 13 14 15 16 17 18 19 20 25 26 27 28 29 30 Etapes du Docking Illustration de docking/scoring [6] Comparaison des programmes de docking [16] Procedures de docking avec AutoDock La grille de calcul 19 Couches de la grille de calcul 21 Architecture de grille de calcul [10] 23 Portail GVSS 27 Architecture Service de criblage virtuel GAP (GVSS) [7] 29 Architecture WPE [9] 31 Intergiciel DIRAC 33 Architecture DIRAC [20] 35 Architecture du systeme proposee 38 Work ow soumission de job sur la grille avec Taverna 39 Diagramme de classe du portail web 42 Cas d’utilisation pour le Ligand 43 Cas d’utilisation pour la Proteine 44 21 Cas d’utilisation pour les parametres de grille 22 Cas d’utilisation pour le docking 23 Cas d’utilisation pour l’administrateur du portail 24 Modele MVC Description des services web implementes 49 Work ow des services web du portail 51 Interface d’accueil du portail web 52 Interface de creation d’un nouveau compte 53 Interface d’authenti cation 53 Interface de gestion des utilisateurs 54 31 Interface d’ajout d’un nouveau Ligand 32 Interface de liste des Ligands disponibles 33 Interface de gestion des proteines 34 Interface de modi cation d’une proteine 35 Interface d’ajout de chier de parametres de la grille 36 Interface d’ajout d’un nouveau projet de docking 37 Veri cation d’ajout du nouveau projet 38 Soumission de job de docking 39 Telechargement du resultat de docking iii 40 Fichier log de docking "dlg" 42 43 44 45 41 Soumission du projet de docking ProjectZinc1OKE Telechargement du resultat de docking 60 Enregistrement du resultat du job sur la grille de calcul 60 Les chiers dlg & glg du docking 60 Les chiers log de docking et de la grille dlg & glg 61 46 Telechargement du resultat des jobs 47 Les chiers des jobs soumis en parallele iv Introduction Par le passe, un grand nombre de medicaments ont et decouverts tout simplement gr^ace a l’identi cation de principes actifs extraits de substances naturelles historiquement utilisees dans la medecine non-conventionnelle, ou m^eme par hasard, ce qu’on nomme "serendipite" Mais plus le nombre de medicaments connus augmente et plus les probabilites de faire une telle decouverte sont faibles Par la suite, les avancees dans le domaine de la synthese chimique ont conduit a une demarche de recherche systematique permet-tant l’elaboration de nouveaux medicaments de plus grande e cacit La decouverte de nouveaux medicaments "drug discovery" est un processus extr^emement long et fastidieux, 12 a 15 ans peuvent s’ecouler entre la decouverte de la molecule et la mise a disposition du medicament aupres des patients Les nouvelles methodes permettant la decouverte de nouveaux medicaments se doivent donc d’innover a n de mettre en evidence des molecules encore inconnues ayant un certain potentiel d’activite sur des cibles biologiques connues [Davis et al,2003] Les outils mis en place doivent ^etre capables de guider les chimistes medicinaux dans le choix des molecules a cribler et a synthetiser Les strategies de criblage virtuel, ou in-silico, sont donc depuis quelques annees employees en tant qu’alternative ou de facon complementaire Ces techniques sont en general assez faciles a mettre en place, pour un co^ut bien moindre que les criblages experimentaux De plus, l’evolution technologique constante de ces dernieres decennies a permis d’accelerer considerablement le temps de calcul necessaire a la simulation de systemes complexes ou de bases de donnees de plusieurs milliers de molecules Le criblage virtuel est donc aujourd’hui employ dans de nombreux projets, a n de selectionner, au sein de vastes librairies de molecules, un nombre restreint de composes a cribler experimentalement 1.1 Problematique L’axe principal de ce travail se situe dans le domaine de bio-informatique Plus precisement dans la recherche et la decouverte de nouveaux medicaments pour les maladies dangereuses comme : HIV, Ebola, evre de dengue, , par le biais de techniques informatiques Le de se situe au niveau de la conception de nouveaux medicaments, qui est un processus long et tres onereux, et au niveau du deployement d’un grand nombre de docking sur la grille de calcul Cependant, les outils existants sont en manque de moyen simple pour fournir des procedures concises pour les utilisateurs reguliers (biologistes, chimistes, etc) a n d’ar-ranger les ressources pour mener un amarrage moleculaires massif Par consequent, ces derniers rencontrent plusieurs di cultes et problemes lors de l’utilisation de ces applica-tions, ce qui entra^ne une grande perte de temps et d’argent a n d’accelerer la recherche de nouveaux traitements pour les maladies negligees 1.2 Notre contribution Notre contribution repose sur le developpement d’un portail web pour le criblage vir-tuel en utilisant la grille de calcul pour faciliter la decouverte et la recherche de nou-veaux medicaments pour les maladies graves et negligees Nous proposons une interface conviviale et facile a utiliser pour les utilisateurs non-experimentes (chimistes, biologistes, medecins ) en informatique et en grille de calcul A n de favoriser l’interoperabilit entre le portail web et les services de grille de calcul, nous proposons une architecture qui permettra une analyse et un traitement able des requ^etes des utilisateurs naux 1.3 Plan du memoire Ce memoire sera organise en parties presentant respectivement : l’etat de l’art, implementation & conception, demonstration & resultats, conclusion & perspectives Dans la premiere partie, un etat de l’art est present qui passe en revue le criblage virtuel, le docking, suivie de l’outil AutoDock Ensuite nous abordons la technologie de grille de calcul, le portail GVSS et les plate-formes WISDOM qui est deployee dans la decouverte de nouveaux medicaments et DIRAC La deuxieme partie du memoire presente l’implementation du portail, qui se focalisera sur l’architecture proposee, la conception et l’implementation du portail L’avant derniere partie porte sur la demonstration du portail muni des resultats obtenus A la n, ce memoire ce termine par une conclusion generale et quelques perspec-tives Figure 36 { Interface d’ajout d’un nouveau projet de docking En retournant a la liste des projets qui ont et cre es, on peut veri er que le projet a et ajoute avec succes Figure 37 { Veri cation d’ajout du nouveau projet Apres avoir creer un projet et choisir les chiers necessaires pour e ectuer le docking L’utilisateur n’a qu’appuyer sur le bouton "submit" pour soumettre son job sur la grille Le bouton va recuperer les chiers a partir du portail, puis, il fait appel a Ta-verna client qui recupere le work ow contenant les services web Apres, il soumet le job sur la grille de calcul Nous allons presenter les resultats que nous avons obtenus lors de soumission des jobs de docking sur la grille, et la recuperation des resultats a partir de la grille a travers de ce portail web Nous nous sommes servis de la base de donnee ZINC ( http: // zinc docking org) , qui est une base de donnee de composes disponibles pour le criblage virtuel (1OKE pour la proteine, et ZINC pour le ligand), ou le chier de ligand comprend 10256 composants Les chiers de parametres pour la grille grid parameter et pour le docking dock parameter(dpf & gpf) ont deja et prepar L’etape de docking moleculaire est realisee gr^ace au sous-programme AutoDock, qui recherche toute les solutions d’amarrage en fonction des parametres du chier "dpf" que l’utilisateur a deja preparer Apres l’achevement du docking, les resultats ont et generes dans un hier log avec l’extension (glg & dlg) Le chier "glg" contient les a nites calculer entre les di erentes types d’atomes de la proteine et le ligand Et le chier "dlg", qui fournit les coordonnees atomiques des 10 meilleurs positions du ligand dans le site de la proteine, leur energie d’in-teraction ainsi que les di erentes valeurs de l’ecart quadratique moyen (Root Mean Square Deviation ou le "RMSD") 57 La gure ci-apres montre la soumission de job de docking, tout en selectionnant le projet "projectZinc137" Dans ce projet nous avons choisi : le chier de parametre de docking ZINC13735135 01 1OKE.dpf , le ligand ZINC13735135 01.pdbqt, la proteine 1OKE.pdbqt et le chier de parametre de la grille map.txt Figure 38 { Soumission de job de docking Apres avoir soumettre le job avec le bouton submit, le resultat consiste en chier zip, ou nous l’avons speci er dans le script jdl Le chier est stokes sur l’espace de stockage de la grille de calcul, puis nous le recuperons depuis le SE de la grille via la commande DIRAC "dirac-dms-get- le" Ce dernier contient le chier de docking "dlg" La capture ci-apres montre le resultat du job stocker sur notre espace de stockage de la grille, comme c’est illustre dans la capture ci-dessous Le resultat est compress et stocke sur l’element de stockage de la grille de calcul, puis, le resultat est recuper a partir de la grille de calcul a l’aide de la commande DIRAC, pour que l’utilisateur puisse le telecharger La gure ci-apres montre le telechargement du resultat du job de docking soumis Le chier contient les chiers log de docking et de grille ("dlg" & "glg") Figure 39 { Telechargement du resultat de docking 58 Apres avoir telecharger le chier "zip", nous avons veri si l’operation du docking a et e ctu avec succes, en ouvrant le chier log de docking La capture cidessous illustre le resultat du docking Comme montre la gure suivante le docking a et achev avec succes Figure 40 { Fichier log de docking "dlg" Nous avons aussi test ce portail pour soumettre un autre job de docking du projet : ProjectZinc1OKE, qui comprend les chiers de parametres suivants : - chier de parametres de docking (dpf) "ZINC4166-0875 01 1OKE.dpf", chier li-gand "ZINC41660875 01 1OKE.pdbqt", chier proteine "1OKE.pdbqt" Figure 41 { Soumission du projet de docking ProjectZinc1OKE 59 L’utilisateur peut recuperer son reultat du job des que l’operation du docking s’achevera Le resultat est illustre ci-apres Figure 42 { Telechargement du resultat de docking On peut voir que le resultat du docking est bien enregistr dans l’espace de stockage de la grille de calcul, ou nous avons compress les chiers resultant du docking Figure 43 { Enregistrement du resultat du job sur la grille de calcul Comme nous avons deja mentionne, le resultat du docking consiste en deux chiers "dlg (docking log le) & glg (grid log le)", mais le chier le plus important est le chier "dlg" Figure 44 { Les chiers dlg & glg du docking 60 La capture ci-apres montre que le docking s’est e ectu avec succes Figure 45 { Les chiers log de docking et de la grille dlg & glg Rappelons que le but essentiel de l’utilisation de la grille de calcul, est la possibilite de soumettre plusieurs jobs en parallele L’utilisateur peut soumettre plusieurs jobs de docking sur la grille de calcul via l’intergiciel DIRAC Pour cela, il su t de preparer les chiers necessaires pour realiser cette operation Nous avons prepar les chiers de parametres de docking "dpf" que nous voulons utiliser a n d’e ectuer le docking Pour soumettre des jobs en parallele a l’aide de l’intergiciel DIRAC, nous avons utilise un work ow Ce work ow va generer les 61 chiers "jdl" essentiels, puis il les soumets sur la la grille de calcul pour que le Worker Node puisse executer ces jobs Les resultats des jobs sont compress dans un chier zip, ensuite stocke sur l’espace de stockage de la grille Apres que l’operation du docking s’est termine, on peut recuperer les resultat du docking a partir du portail A n de montrer la procedure de docking avec plusieurs chiers, nous avons preparer le chiers de docking "ZINC4.txt", qui comporte les chiers ci-dessous : > ZINC41584388 01 1OKE.dpf > ZINC41584391 01 1OKE.dpf > ZINC41584955 01 1OKE.dpf > ZINC41584955 02 1OKE.dpf > ZINC41584983 03 1OKE.dpf Apres avoir soumettre le job, le resultat consiste en un chier compress que nous l’avons recuperer depuis l’espace de stockage de la grille des que le docking s’est achev La capture ci-apres presente le resultat de soumission de plusieurs jobs de docking soumis en parallele Figure 46 { Telechargement du resultat des jobs On accedant a notre espace de stockage de grille de calcul, on remarque que le resultat du job est bien stocke La capture ci-dessous montre le chiers de parametre de docking (ZINC4.txt) et le reusltat (ZINC4.zip) 62 Ce chier comprend les resultats de tous les jobs soumet sur la grille de calcul, et chaque chier contient les deux chiers log dlg (docking log le) & glg (grid log le) Figure 47 { Les chiers des jobs soumis en parallele Mais parfois d^u a une mauvaise connexion et a la non convivialite des commandes DIRAC, nous ne pouvons pas recuperer les resultats depuis la grille Et lors de recuperation des resultats jobs depuis la grille, on s’est rendu compte que quelques resultats ne sont pas bonnes Et cela s’explique par le fait que les donnees soit de la molecule du proteine ou celle des ligands contient des informations erron et incompatibles 4.1 Conclusion Dans le cadre de ce projet, nous avons utilise plusieurs outils pour la realisation de ce projet Nous avons utilise DIRAC comme intergiciel a n de soumettre les jobs de docking sur la grille de calcul, suivre l’etat du job et recuperer les resultats L’outil AutoDock, ou nous avons deploy la version AutoDock4.2 pour creer et preparer les chiers necessaires pour le docking Et l’outil Taverna pour la creation et la visualisation des work ow Le but d’utiliser Taverna est d’avoir la possibilite d’etendre et d’extensier le work ow en ajoutant d’autres nouvelles fonctionalites, des services et d’autres processus pour mieux l’adapter aux besoins ulterieurs des utilisateurs Les utilisateurs de ce portail peuvent donc pro ter des services du portail, qui servent comme intermediare entre les utilisateurs naux et les services de la grille Ce portail fournit un moyen pour la gestion des proteines, des ligands, des parametres de grille, des projets de docking, de soumettre des jobs de docking sur la grille de calcul et de recuperer les resultats 63 Conclusion & perspective La decouverte de nouveaux medicaments "in-silico" est l’une des strategies les plus prometteuses visant a accelerer le processus de developpement de medicaments Le criblage virtuel "Virtual Screening", est l’une des premieres etapes du processus de decouverte de medicaments, il repose sur la selection "in-silico" des meilleurs medicaments potentiels qui agissent sur une proteine cible donnee, il peut se faire "in-vitro", mais il est tres onereux Le criblage virtuel necessite une analyse complexe avec plusieurs etapes telles que la modelisation moleculaire et le docking L’un des principaux avantages conferes par le docking est qu’il permet aux chercheurs de trier (screen) rapidement les grandes bases de donnees de medicaments potentiels qui necessiteraient autrement un travail fastidieux et de longue duree dans le laboratoire selon les methodes traditionnelles de decouverte de medicaments La recherche sur les maladies negligees pourrait largement bene cier des avantages de deploiement des grilles informatiques a plusieurs niveaux Recemment, le deploiement de docking "in-silico" sur les grilles de calcul a emerg dans la perspective de reduire les co^uts et le temps de conception de medicaments Le present travail poursuit deux objectifs Le premier, est de se familiariser avec l’outil AutoDock a n mieux comprendre le mecanisme de docking moleculaire proteine-ligand, et l’outil Taverna pour la creation et l’execution des work ows scienti ques Le deuxieme objectif consiste a developper un portail web pour soumettre les jobs de docking in-silico a grande echelle sur la grille de calcul en utilisant l’intergiciel DIRAC et l’environnement Taverna [26] Ou l’utilisateur prepare ses chiers necessaires (proteine, ligand, parametres de la grille), soumet son job sur la grille via le portail et recupere le resultat de son job de docking L’achevement de ce projet implique l’utilisation coordonnee de plusieurs outils informa-tiques (AutoDock, Taverna, DIRAC) Un nombre croissant de ces ressources sont mises a disposition sous la forme de services Web De sorte que, ces services Web sont orches-trer dans un work ow et qui sont mises a la disposition des chercheur scienti ques A n de faciliter l’interaction entre l’utilisateur et les ressources de la grille de calcul, nous avons developp un portail web qui repond aux besoins des utilisateurs qui ne sont pas forcement des experts en informatique Ce portail permet a ces derniers de charger, modi-er, consulter leur molecules de ligands, proteines sur le portail Ainsi, de creer leur projet et d’e ectuer le docking "insilico" a n d’accelerer leur recherche sans se preoccuper de la complexit du portail, tout en deployant les ressources de la grille de calcul pour soumettre les jobs de docking a travers l’intergiciel "DIRAC" Ainsi, nous nous sommes servis de l’outil AutoDock pour preparer les chiers necessaires et e ectuer le docking Nous avons cre un work ow pour le criblage virtuel sur la grille en utilisant l’outil "Taverna" Nous avons pu soumettre les jobs de docking de la base de donnee ZINC (10256 composes), ou nous avons stockes les resultats sur l’espace de stockage de la grille de calcul 64 Au cours de la realisation de ce projet, nous avons rencontr plusieurs des di - cultes Tout d’abord, les di cultes theoriques Elles se resument sur la comprehension des mecanismes de docking moleculaire et de criblage virtuel Et les di cultes pratiques se situent au niveau d’installation et l’utilisation des outils (Taverna, AutoDock) Et au niveau des lignes de commande de DIRAC, qui ne sont pas assez conviviale a utiliser Ainsi, lors de l’utilisation de l’outil Taverna qui consomme beaucoup de RAM, ce qui entra^ne un ralentissement des autres processus en cours d’execution et les services necessaires pour la soumission des jobs du portail vers la grille de calcul Nous allons ameliorer le portail web au fur et a mesure en ajoutant d’autres fonctio-nalites et d’autres services : • Mise en place du portail web sur le serveur de l’IFI • Authenti cation au moyen d’un certi cat client X509 au lieu du nom et du mot de passe de l’utilisateur • Visualisation des resultats de docking proteine-ligand sous forme de graphe 65 References [1] Jens Kruger, Richard Grunzke, Sonja Herres-Pawlis, Performance Studies on Dis-tributed Virtual Screening, 2014 [2] Pratap Parida, Brajesh Shankar, in-silico protein ligand interaction study of typical antipsychotic drugs against dopaminergic D2 receptor, 2013 [3] William Lindstrom, Garrett M Morris, Christoph Weber, Ruth Huey, Using Au- toDock4 for virtual screening, 2008 [4] Romano T Kroemer, Structure-Based Drug Design : Docking and Scoring, 2007 [5] C.S.R Prabhu, Grid and Cluster Computing, New Delhi : Prentice Hall of India, 2008 [6] Stian Soiland-Reyes, Ian Dunlop, Alan Williams, Taverna reloaded [7] Hsin-Yen Chen, Mason Hsiung, Hurng-Chun Lee, Eric Yen, Simon C Lin, Ying- Ta Wu, GVSS : A High Throughput Drug Discovery Service of Avian Flu and Dengue Fever for EGEE and EUAsiaGrid, 2009 [8] Nguyen Bui The, Nguyen Hong Quang, Doan Trung Tung,On the Performance Enhancement of the WISDOM Production Environment, 2012 [9] Ankur Dhanik, John SMcMurray, Lydia Kavraki, AutoDock based incremental docking protocol to improve docking of large ligands, 2012 [10] Pritpal Singh, Gurinderpal Singh, Grid computing architecture 2013 [11] JACQ Nicolas, In silico drug discovery services in computing grid envir nments against neglected and emerging infectious diseases 2006 [12] D Hull, K Wolstencroft, R Stevens, C A Goble, M R Pocock, Taverna : a tool for building and running work ows of services, Nucleic Acids Research , 34 (Web-Server-Issue) :729 732, 2006 [13] Quang Bui The, Doan Trung Tung, Nguyen Hong Quang, Criblage virtuel sur grille de composes isoles au Vietnam, 2011 [14] Yasmine Asses, Conception par modelisation et criblage in silico d’hinibi-teurs du recepteur c-Met, 2011 [15] Grosdidier A.Conception d’un logiciel de docking et applications dans la recherche de nouvelles molecules actives, These de doctorat en pharmacie Grenoble : Universit Joseph Fourier France 2007 [16] Sousa S F., Fernandes P A., Ramos M J, Protein-Ligand Docking : Current Status and Future Challenges, Proteins 2006 ; 65 : 15-26 [17] Koblitz, B.Santos, N.Pose, The AMGA metadata service, J.Grid Computing6,61- 67 (2008) [18] German-Renaud, C.Loomis, Scheduling for responsive grids, J.Grid Computing 7,463-478 (2009) [19] A.Tsaregorodtsev, V.Hamar, M.Sapunov, T.Glatard, Infrastructure DIRAC pour les Communautes Pluridisciplinaires, 2011 [20] A.Tsaregorodtsev, P Charpentier, V.Romanovski, DIRAC - The Distributed MC Production and Analysis for LHCb , 2010 [21] E van Herwijnen, J Closier, M Frank, C Gaspar, F Loverre, S.Ponce, and M Gan-delman, Dirac-distributed infrastructure with remote agent control, Conference for Computing in High-Energy and Nuclear Physics (CHEP 03), 2003 [22] Bui The Quang, Nguyen Hong Quang, Emmanuel Medernach, Vincent Breton , Multi-Level Queue-Based Scheduling for Virtual Screening Application on PilotAgent Platforms on Grid/Cloud to Optimize the Stretch , 2014 [23] Katherine Wolstencroft, Robert Haines, Donal Fellows, Alan Williams, The Taverna work ow suite : designing and executing work ows of Web Services on the desktop, web or in the cloud, 2013 [24] Trung Tung DOAN, Quang Minh DAO, Trong Hieu VU, Hong Phong PHAM, g- INFO portal : a solution to monitor In uenza A on the Grid for non-grid users, 2011 [25] Nicolas JACQ, Jean SALZEMANNa, Yannick LEGRE, Matthieu REICHS- TADT,Demonstration of In Silico Docking at a Large Scale on Grid In-frastructure , 2006 [26] T Oinn, M Addis, J Ferris, D Marvin, M Senger, M Greenwood, T Carver, K Glover, M R Pocock, A.Wipat, P Li, Taverna : A tool for the composition and enactment of bioinformatics work ows, Bioinformatics Journal 20(17) pp 30453054, 2004, doi :10.1093/bioinformatics/bth361 Annexe • Installation du client DIRAC : Avant d’installer DIRAC, l’utilisateur doit respecter les conditions suivantes : { Doit ^etre un membre d’une organisation virtuelle par exemple : euasia, biomed, Nous nous sommes enregistr aupres de la VO Biomed via le site : https: // cclcgvomsli01 in2p3 fr: 8443/ voms/ biomed/ user/ home action { Possede un certi cat X.509 reconnu par EGEE, a n de pouvoir utiliser les ressource de la grille EGEE > wget -np -O dirac-install https://github.com/DIRACGrid/DIRAC/ raw/integration/Core/scripts/dirac-install.py no-check-certificate > chmod +x dirac-install > dirac-install -r v6r11p3 > /dirac-install > source bashrc > dirac-proxy-init -x > dirac-configure -V vo.formation.idgrilles.fr -S Dirac-Production -C dips://ccdirac01.in2p3.fr:9135/Configuration /Server I • Script pour preparer les chiers de grille et de docking "gpf et dpf" #!/bin/sh WORK DIR=‘pwd‘ MGTOOLS="/usr/local/MGLTools-1.5.6/MGLToolsPckgs/AutoDockTools/ Utilities24" PYTHON="/usr/local/MGLTools-1.5.6/bin/pythonsh" while getopts "l:r:" opt; case $opt in l) LIG FILE=$OPTARG LIG BASE NAME=$(basename $LIG FILE) LIG EXT=$fLIG FILE##*.g [ -f "$fOPTARGg" ] && if [ "$LIG EXT" = "pdbqt" ]; then echo "Ligand file name " "$LIG FILE" else echo "Check the ligand file and extension" fi ;; r) PROT FILE=$fOPTARGg PROT BASE NAME=$(basename "$PROT FILE") PROT EXT=$fPROT BASE NAME##*.g echo "Extension = $PROT EXT" [ -f "$PROT FILE" ] && if [ "$PROT EXT" = "pdbqt" ]; then echo "Protein file name " "$PROT FILE" else echo "Check the protein file and extension" fi ;; *) echo "Require argument!!" exit ;; esac done shift $((OPTIND-1)) ulimit -s unlimited cd $WORK DIR $PYTHON prepare gpf4.py -l $LIG FILE -r $PROT FILE -o ResGrid.gpf $PYTHON prepare dpf4.py -l $LIG FILE -r $PROT FILE -o ResDock.dpf II • Liste des jobs de docking soumis a travers le portail sur la grille de calcul et leur etats III • Resultats des jobs de docking stockes sur l’espace de stockage de la grille de calcul IV ... entre le portail et les ressources de la grille pour la soumission des jobs de docking sur la grille de calcul, et la recuperation des resultats a partir de l’espace de stockage de la grille Et... ectuer le criblage virtuel, et de deployer un tres grand nombre de docking sur la grille de calcul Pour atteindre ce but, la grille de calcul a et utilise pour accelerer la recherche et la decouverte... combines Les composants de l’infrastructure de la grille de calcul sont : • Le portail de la grille Un portail de grille fournit l’interface pour le service demandeur (comme les sec-teurs prive,

Ngày đăng: 11/11/2020, 21:38

w