ĐẠI HỌC QUỐC GIA HÀ NỘI VN U KHOA Y DƢỢC rm ac y, LÝ THỊ DUYÊN dP TỔNG QUAN NGHIÊN CỨU ĐA DƢỢC LÝ an MẠNG TRONG TÌM KIẾM ĐÍCH PHÂN TỬ Me dic ine LIÊN QUAN ĐẾN UNG THƢ Sc ho ol of KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC NGÀNH DƢỢC HỌC QH.2013.Y Ngƣời hƣớng dẫn: TS LÊ THỊ THU HƢỜNG PGS.TS LÊ ĐỨC HẬU Co p yri gh t© Khóa: HÀ NỘI - 2018 LỜI CẢM ƠN VN U Trƣớc hết xin gửi lời cảm ơn tới ngƣời giúp đỡ trình thực khóa luận an dP rm ac y, Tôi xin gửi lời cảm ơn sâu sắc đến TS Lê Thị Thu Hƣờng - Giảng viên Bộ môn Dƣợc liệu Dƣợc học cổ truyền, khoa Y Dƣợc, Đại học Quốc Gia Hà Nội; PGS.TS Lê Đức Hậu - Giảng viên Bộ mơn Kỹ thuật máy tính mạng, khoa Công Nghệ Thông Tin, Đại học Thủy Lợi trực tiếp hƣớng dẫn, tận tình giúp đỡ, hƣớng dẫn tơi từ ngày đầu làm khóa luận, tạo điều kiện thuận lợi để tơi nghiên cứu hồn thành khóa luận Tơi xin gửi lời cảm ơn tới thầy cô khác khoa Y Dƣợc, Đại học Quốc Gia Hà Nội ln giúp đỡ tơi q trình học tập, giúp tơi có kiến thức q giá để chuẩn bị sẵn sàng cho việc hồn thành khóa luận Me dic ine Tôi xin chân thành cám ơn TS Phạm Thế Hải - Giảng viên mơn Hóa Dƣợc, Đại học Dƣợc Hà Nội giúp đỡ nhiều trình tìm kiếm, thu thập tài liệu, tận trình trao đổi nhiều vấn đề có liên quan đến khóa luận ho ol of Cuối cùng, tơi xin đƣợc tri ân gia đình bạn bè ln đồng hành bên tơi lúc khó khăn, bận rộn, ln nguồn động lực để làm việc phấn đấu vƣơn lên Hà Nội, tháng 05 năm 2018 Sinh viên Co p yri gh t© Sc Xin chân thành cảm ơn! Lý Thị Duyên KÝ HIỆU VÀ CHỮ VIẾT TẮT Cục quản lý thực phẩm dƣợc phẩm Hoa Kỳ CSDL Cơ sở liệu DEG Gen biểu khác thƣờng, differentially expression gene DNA Deoxyribonucleic acid RNA Ribonucleic acid mRNA Ribonucleic acid thông tin MS Phƣơng pháp khổi phổ GO Gene Ontology NP Đa dƣợc lý mạng, Network Pharmacology PPI Tƣơng tác protein, Protein-Protein Interaction PPIN Mạng tƣơng tác protein, Protein-Protein Interaction Network Hub Nút có bậc cao mạng DPIN Mạng tƣơng tác thuốc – protein DDIN Mạng tƣơng tác thuốc – thuốc EGFR Thụ thể yếu tố tăng trƣởng biểu bì ho ol of Me dic ine an dP rm ac y, VN U FDA Ung thƣ vú ba âm tính Sc TNBC t© HDAC Co p yri gh FGFR1 Histon deacetylase Thụ thể yếu tố tăng trƣởng nguyên bào loại DANH MỤC CÁC BẢNG Bảng 1: Các sở liệu PPI 21 VN U Bảng 2: Đặc điểm liệu microarray đƣợc sử dụng ung thƣ tuyến tụy 46 ac y, Bảng 3: Năm chức làm giàu hàng đầu GO đƣờng KEGG cho tổng DEG 46 Co p yri gh t© Sc ho ol of Me dic ine an dP rm Bảng 4: Hai mƣơi DEG hàng đầu PPIN 50 DANH MỤC HÌNH VẼ, ĐỒ THỊ Hình 1.1: Quá trình nghiên cứu phát triển thuốc VN U Hình 1.2: Các dạng đồ thị Graph ac y, Hình 1.3: Ví dụ hai cách biểu diễn đồ thị theo ma trận kề theo danh sách kề rm Hình 1.4: Các dạng mạng (a) mạng vơ hƣớng, (b) mạng có định hƣớng, (c) mạng có gắn trọng số dP Hình 1.5: Mạng tƣơng tác thuốc hóa trị với đích protein tyrosine kinase 10 an Hình 1.6: Mạng tƣơng tác protein-protein interleukin-10 12 Hình 1.7: Minh họa chiến lƣợc can thiệp hiệu nghiên cứu thuốc 13 ine Hình 1.8: Mạng tƣơng tác thuốc-thuốc 15 Me dic Hình 2.1: Logo phần mềm Cytoscape - cơng cụ phân tích xây dựng hình ảnh trực quan cho PPIN 19 Hình 2.2: Logo Phần mềm Gephi 20 of Hình 2.3: Phần mềm lập trình igraph NetworkX 20 ol Hình 2.4: Các sở liệu tƣơng tác protein 21 Sc ho Hình 2.5: Hệ thống lai đơi nấm men giúp phát tƣơng tác cặp protein 25 t© Hình 2.6: Q trình phân tích phức hợp protein phƣơng pháp khối phổ 26 gh Hình 2.7: Các cách phân tích topo 27 yri Hình 2.8: Nút trung tâm đại diện mạng 28 Co p Hình 2.9: Ví dụ cách tính closeness centrality nút graph 29 Hình 2.10: Ví dụ betweenness centrality 30 Hình 2.11: Một số khải niệm phân tích cụm 31 Hình 2.12: Phân tích làm giàu giải sử dụng GO Reactome mạng 34 Hình 3.1: Các ứng dụng đa dƣợc lý mạng 37 Hình 3.2: Ứng dụng đa dƣợc lý mạng tìm kiếm thuốc 38 VN U Hình 3.3: Mạng PPIN ung thƣ vú 40 ac y, Hình 3.4: Giá trị hệ số phân cụm mạng ung thƣ vú xóa 10 gen có giá trị hub, betweenness closenness 41 rm Hình 3.5: Giá trị đƣờng ngắn mạng ung thƣ vú xóa 10 gen có giá trị hub, betweenness closenness 41 Hình 3.6: Các giá trị đột biến có ý nghĩa thống kê gen có betweenness centraility cao 42 dP Hình 3.7: Mạng lƣới liên hệ chế cho DEG 48 an Hình 3.8: Mạng PPI cho DEG 49 Co p yri gh t© Sc ho ol of Me dic ine Hình 3.9: Mạng đồng biểu gen cho DEG 52 MỤC LỤC VN U LỜI CẢM ƠN KÝ HIỆU, CHỮ VIẾT TẮT ac y, DANH MỤC CÁC BẢNG DANH MỤC HÌNH VẼ, ĐỒ THỊ rm ĐẶT VẤN ĐỀ CHƢƠNG I: TỔNG QUAN ĐA DƢỢC LÝ MẠNG dP 1.1 Đa dƣợc lý mạng nghiên cứu phát triển thuốc an 1.2 Sơ lƣợc lý` thuyết Graph 1.3 Biểu diễn đa dƣợc lý mạng đồ thị Graph ine 1.3.1 Mạng tƣơng tác thuốc với đích phân tử (DPIN) dic 1.3.2 Mạng tƣơng tác protein – protein (PPIN) 11 Me 1.3.3 Mạng tƣơng tác thuốc-thuốc (DDIN) 14 of 1.4 Đa dƣợc lý mạng tìm kiếm đích tác dụng thuốc chống ung thƣ 16 ho ol CHƢƠNG II: QUY TRÌNH XÂY DỰNG MẠNG TƢƠNG TÁC PROTEIN-PROTEIN (PPIN) 19 Sc 2.1 Các công cụ phân tích 19 2.1.1 Cytoscape 19 t© 2.1.2 Gephi 20 gh 2.1.3 Các phần mềm lập trình 20 yri 2.2 Nguồn liệu 21 Co p 2.2.1 Các sở liệu tƣơng tác protein (PPI) 21 2.2.2 Các phƣơng pháp thực nghiệm 24 2.3 Phân tích topo PPIN 27 2.3.1 Phân tích trung tâm 27 2.3.2 Phân tích cụm (Clustering analysis) 31 2.3.3 Phân tích làm giàu giải (Annotation enrichment analysis) 33 VN U 2.4 Các bƣớc xây dựng mạng tƣơng tác PPIN 34 ac y, CHƢƠNG III: PHÂN TÍCH MỘT SỐ VÍ DỤ VỀ ỨNG DỤNG CỦA ĐA DƢỢC LÝ MẠNG TRONG NGHIÊN CỨU ĐÍCH PHÂN TỬ LIÊN QUAN ĐẾN UNG THƢ 36 rm 3.1 Ung thƣ đích phân tử 36 3.2 Ứng dụng nghiên cứu đa dƣợc lý mạng tìm kiếm đích phân tử liên quan đến ung thƣ 37 an dP 3.3 Phân tích số ví dụ ứng dụng đa dƣợc lý mạng nghiên cứu đích phân tử liên quan đến ung thƣ 38 3.3.1 Ví dụ Xác định gen đích ung thƣ vú mạng tƣơng tác PPIN 38 dic ine 3.3.2 Ví dụ 2: Xác định gen đích điều trị chế ung thƣ tuyến tụy phân tích tổng hợp 43 Me CHƢƠNG IV: KẾT LUẬN VÀ KIẾN NGHỊ 54 4.1 Kết luận 54 of 4.2 Kiến nghị 54 Co p yri gh t© Sc ho ol TÀI LIỆU THAM KHẢO ĐẶT VẤN ĐỀ rm ac y, VN U Ung thƣ bệnh nguy hiểm gây tử vong hàng đầu giới Ƣớc tính năm có khoảng 14,1 triệu ngƣời mắc 8,2 triệu ngƣời chết ung thƣ Ở Việt Nam, năm có khoảng 124.000 ca mắc ung thƣ với tỷ lệ tử vong chiếm gần 75% Trong năm gần đây, khoa học có bƣớc tiến đáng kể phòng ngừa điều trị ung thƣ [15] Tuy nhiên, ung thƣ thách thức lớn y học đại Do đó, nghiên cứu thuốc điều trị ung thƣ hiệu an toàn đƣợc xem hƣớng cấp bách yri gh t© Sc ho ol of Me dic ine an dP Hiện nay, việc sử dụng phân tử nhỏ có khả tác động đích phân tử protein hay gene liên quan đến ung thƣ liệu pháp hoá trị phổ biến Các thuốc chủ yếu tác động lên đích phân tử protein đóng vai trò quan trọng q trình sinh sản, biệt hóa, chết theo chu trình tế bào ung thƣ Tuy nhiên, thuốc gặp phải vấn đề lớn tỷ lệ kháng thuốc cao đích phân tử dễ bị đột biến Bên cạnh chúng tác động lên protein khác tế bào bình thƣờng (tính khơng chọn lọc), gây nhiều tác dụng không mong muốn, ảnh hƣởng tới thể trạng chất lƣợng sống bệnh nhân nhƣ làm giảm hiệu lâm sàng thuốc Nhƣ vậy, nghiên cứu phát triển thuốc điều trị ung thƣ gặp phải hai vấn đề Thứ nhất, với việc phát ngày nhiều yếu tố bệnh sinh ảnh hƣởng đến tình trạng bệnh, liệu pháp điều trị dựa mục tiêu phân tử tỏ hiệu Thứ hai, cần phải hệ thống hóa tƣơng tác phức tạp chúng trình sinh học thể Từ đó, xác định đƣợc đích phân tử quan trọng q trình bệnh sinh, nhƣ dự đốn đƣợc tác dụng khơng mong muốn thuốc Co p Để giải vấn đề nêu trên, cách tiếp cận đa dƣợc lý mạng (network pharmacology, NP) cơng cụ hữu ích giúp tìm kiếm đích phân tử mới, nhƣ tìm hiểu sâu chế tác dụng thuốc Mạng NP thƣờng có cấu trúc dạng graph, protein đóng vai trò nút mối tƣơng quan chúng cạnh nối nút Một ví dụ dic ine an dP rm ac y, VN U mạng tƣơng tác protein – protein (Protein-Protein Interaction Network, PPIN) Tƣơng tác protein (interactome) đƣợc hiểu q trình hố sinh học nhƣ tổng hợp cấu trúc, truyền tín hiệu (signal transduction), vận chuyển (transport) hay phosphoryl hoá… Một nút kết nối với nhiều nút khác (nút có bậc cao >2), protein nhƣ gọi hub Các nút không liên kết gọi non-hub Trong NP, tầm quan trọng protein đƣợc xác định thông qua mức độ thay đổi cấu trúc NP bỏ nút mạng Do đó, protein hub thƣờng đƣợc xem quan trọng bảo tồn cấu trúc tổng thể mạng NP nhƣ hoạt động tế bào Chúng đƣợc xem đích phân tử tiềm tìm kiếm thuốc kháng ung thƣ Ngoài ra, dựa tính tƣơng đồng cấu trúc hợp chất hóa học tƣơng tác chúng với protein liên quan đến phản ứng có hại thuốc, dự đốn đƣợc tác dụng khơng mong muốn hợp chất Việc xây dựng mạng NP khơng q phức tạp ngày nhiều thông tin tinh thể nhiễu xạ tia X đích nhƣ thơng tin liên quan đến gene (genome) hay protein (proteome) đƣợc tìm thấy ho ol of Me Xuất phát từ vấn đề nêu trên, để có nhìn tổng thể cách tiếp cận đa dƣợc lý mạng xác định đích điều trị ung thƣ , chúng tơi thực đề tài tổng quan: “Tổng quan nghiên cứu đa dƣợc lý mạng tìm kiếm đích phân tử liên quan đến ung thƣ” với hai mục tiêu sau: Co p yri gh t© Sc Trình bày quy trình chung để xây dựng mạng tƣơng tác proteinprotein, mạng tƣơng tác thuốc-đích (protein) thuốc-thuốc Phân tích số ví dụ ứng dụng nghiên cứu đa dƣợc lý mạng xác định đích phân tử liên quan đến ung thƣ Biological General Repository for Interaction Dataset) Mạng PPI để xác định DEG đƣợc sàng lọc quy mơ tồn gen, hai nút cuối có DEG VN U Phân tích mạng đồng biểu gen (gen coexpression network) dic ine an dP rm ac y, Để xác định thêm gen quan trọng ung thƣ tuyến tụy, DEG có biểu quan trọng đƣợc đánh dấu GO KEGG, sử dụng chƣơng trình trực tuyến GCBI (Gene-Cloud of Biotechnology Information: đám mây gen công nghệ thông tin sinh học) Tiếp theo, DEG giao GO KEGG đƣợc sử dụng để xây dựng mạng đồng biểu gen, ánh xạ DEG đến sở liệu lớn mạng biết sàng lọc tƣơng tác gen-gen quan trọng cách sử dụng chƣơng trình trực tuyến Gene-Cloud of Biotechnology Information Sự tƣơng quan gen mạng đƣợc xác định trọng số GO tƣơng ứng với biểu sinh học (phenotype) Để xây dựng mạng đồng biểu hiện, ma trận tƣơng quan đƣợc xây dựng hệ số tƣơng quan Speaman Rank tính toán theo cặp cho tất cặp vectơ biểu thức phân tích mơ đun phƣơng pháp Louvain, với giá trị p