TỔNG QUAN ĐA DƯỢC LÝ MẠNG
Đa dƣợc lý mạng trong nghiên cứu phát triển thuốc
Quá trình nghiên cứu và phát triển thuốc là một quá trình tốn kém cả về thời gian và tiền bạc Trung bình để ra đời một thuốc mới tiêu tốn 1 tỷ đô la
Mỹ, kéo dài từ 10 đến 15 năm bao gồm nhiều giai đoạn khác nhau [43] Hình
1 mô tả các giai đoạn chung của quá trình nghiên cứu và phát triển thuốc
Hình 1.1: Quá trình nghiên cứu phát triển thuốc
Việc nghiên cứu thuốc mới bắt đầu bằng cách tìm hiểu cơ chế bệnh sinh để nhận biết các “mục tiêu phân tử” hay đích phân tử [36] Đích thường là một cấu trúc đại phân tử (protein), VD nhƣ enzyme, kênh xuyên màng
Trong giai đoạn này, đích phân tử đƣợc chọn phải chính xác, tức là nó có ảnh hưởng lớn đối với quá trình bệnh sinh
Bước tiếp theo là sàng lọc tìm kiếm hoạt chất tiềm năng có thể ức chế hoặc tăng hoạt động của đích phân tử Hàng loạt các chất trong tự nhiên (chiết xuất từ cây cỏ, động vật ) và nhân tạo (tổng hợp hóa học) đƣợc tiến hành thử nghiệm trong phòng nghiên cứu trên các mô hình bệnh tật khác nhau, bao gồm cả thiết kế thuốc trên máy tính [8] Mục đích chính là nhằm tìm ra các hoạt chất có tác dụng tốt nhất, liều lƣợng thấp nhất và an toàn nhất Thống kê
Copyright © School of Medicine and Pharmacy, VNU chỉ ra rằng cứ mỗi 10.000 hợp chất đƣợc nghiên cứu sàng lọc thì chỉ có duy nhất 1 chất may mắn trở thành ứng viên thuốc tiềm năng (Hình 1.1)
Các hoạt chất tiềm năng sẽ đƣợc tiến hành thử nghiệm tiền lâm sàng trên các mô hình động vật (chuột, chó…) nhằm xác định khả năng điều trị cũng nhƣ độ an toàn của hoạt chất trên cơ thể sống, đặc biệt là cơ thể có hệ thống giống con người [13] Ứng viên thành thuốc tiềm năng (có tác dụng tốt trên động vật) sẽ đƣợc tiến hành thử nghiệm lâm sàng (pha I, II và III) [39] Pha I thực hiện trên người tình nguyện khỏe mạnh và giai đoạn II-III trên người bệnh với số lượng người tham gia tăng dần (khoảng 50 người cho pha I đến khoảng vài ngàn người cho pha III), nhằm đánh giá hiệu quả, liều lượng cũng như độ an toàn của thuốc Đăng ký thuốc và đưa ra thị trường: sau khi có đầy đủ các dữ liệu khoa học, thuốc đƣợc đăng ký với cơ quan pháp lý, đƣợc bảo hộ độc quyền trong khoảng 10-15 năm, được sản xuất và bán ra thị trường [37]
Trong vòng 60 năm qua, công nghệ khoa học đã và đang phát triển một cách chóng mặt Tuy nhiên, trong lĩnh vực dƣợc học, số lƣợng thuốc mới ra đời ngày càng giảm đi Cụ thể, từ năm 1950 tới 2008, có 1222 hoạt chất mới
(1103 phân tử hóa học và 119 hoạt chất sinh học) đƣợc FDA (Food and Drug
Administration, Cục quản lý thực phẩm và dƣợc phẩm Hoa Kỳ) chấp thuận, tức chỉ trung bình 21 thuốc mới đƣợc ra đời hàng năm [30] Con số này thật đáng lo ngại khi trên thế giới có hàng trăm loại bệnh tật, và nguy hiểm hơn khi những loại bệnh không có thuốc trị ngày càng gia tăng Gần đây, việc xuất hiện chủng siêu vi khuẩn Escherichia coli kháng colistin, một loại kháng sinh dự phòng chỉ dành cho vi khuẩn đã kháng những kháng sinh khác, dấy lên một tình trạng báo động trong giới y học [26]
Như vậy, nghiên cứu và phát triển thuốc trước đây chủ yếu dựa trên kinh nghiệm với cách tiếp cận “thử và lỗi” (trial and error), dẫn đến chi phí tăng cao và xác suất thành công thấp Có rất nhiều lý do cản trở thành công của quá trình này, ví dụ nhƣ đích tác dụng không đúng, không tìm thấy hoặc
Copyright © School of Medicine and Pharmacy, VNU tìm thấy hoạt chất không đủ tốt để trở thành thuốc hay các vấn đề liên quan đến độc tính
Trong hơn ba thập kỷ qua, sàng lọc hay thiết kế hợp chất có hoạt tính chọn lọc trên một đích phân tử với mong muốn giảm thiểu tác dụng không mong muốn là hướng đi chủ đạo trong nghiên cứu và phát triển thuốc mới
[14] Tuy nhiên, kỷ nguyên hậu genomic đã mở ra một bức tranh vô cùng phức tạp về cơ chế tác dụng của thuốc [25] Công trình của Yildirim và cộng sự năm 2007 đã chứng minh một cách thuyết phục rằng không chỉ nhiều thuốc có thể gắn với cùng một đích mà trên thực tế một thuốc có thể tác dụng trên nhiều đích [47] Cơ chế tác dụng đa đích là rất phổ biến trên thuốc kháng ung thƣ, thuốc điều trị bệnh lý thần kinh, kháng sinh và kháng viêm Năm
2014, David Cook và cộng sự, khi tổng kết các số liệu của các dự án nghiên cứu và phát triển thuốc phân tử nhỏ đƣợc thực hiện bởi tập đoàn Dƣợc phẩm Astra Zeneca trong khoảng thời gian 5 năm (2005-2010) đã chỉ ra rằng xác định đúng đích phân tử là yếu tố then chốt đầu tiên (1-Right target), quyết định thành công của quá trình nghiên cứu và phát triển thuốc mới [9] Nghiên cứu của Yildirim cũng nhƣ nhiều tác giả sau này về sinh học phân tử và tin sinh học cho thấy đa dƣợc lý mạng (pharmacological network, PN) là một công cụ hữu ích giúp sàng lọc đích mới cũng nhƣ tìm hiểu sâu cơ chế tác dụng của thuốc [38, 47]
Cách tiếp cận đa dƣợc lý mạng giúp xác định các đích phân tử dựa trên tổng hợp các tương tác có thể xảy ra giữa các protein tham gia quá trình bệnh sinh (tương tác protein-protein, mạng lưới các tương tác này gọi là mạng tương tác protein, Protein-protein interaction network, PPIN), các tương tác có thể có giữa thuốc với các protein trong cơ thể (tương tác thuốc-protein) và sự tương đồng giữa các cấu trúc hóa học của các thuốc và hợp chất nghiên cứu (tương quan thuốc-thuốc) Cách tiếp cận này giúp người nghiên cứu có một cái nhìn tổng quát về cơ chế bệnh sinh, từ đó xây dựng một chiến lƣợc nghiên cứu và phát triển thuốc hiệu quả nhất Các mối liên hệ nêu trên thường rất phức tạp và chồng chéo, do đó để nghiên cứu đa dƣợc lý mạng đòi hỏi dữ liệu không lồ về công nghệ sinh học, sinh học phân tử và công nghệ thông tin
Các công cụ tính toán, chủ yếu là dùng tin sinh học (bioinformatics) đƣợc ứng dụng nhiều trong khâu xử lý thông tin và xác định đích phân tử
Copyright © School of Medicine and Pharmacy, VNU
Sơ lƣợc lý` thuyết Graph
Về mặt hình học, đa dƣợc lý mạng chính là một dạng đồ thị Graph biểu diễn cho các tương tác giữa giữa các protein hay thuốc Trong toán học, Graph đƣợc định nghĩa là một đồ thị rời rạc bao gồm các đỉnh và các cạnh nối các đỉnh này Đồ thị này kí hiệu là G(V,E), gồm hai thành phần:
1 Tập hợp V, bao gồm các đối tƣợng, đƣợc gọi là tập hợp các đỉnh (vertex hay node) của đồ thị
2 Tập hợp E là tập hợp các cạnh (edge) của đồ thị
Gọi n và m lần lƣợt là số đỉnh và số cạnh của đồ thị, trong đó m E n
Số lượng các cạnh nối với 1 đỉnh gọi là bậc của đỉnh, thường ký hiệu là d(a) Các đỉnh trong graph không nhất thiết có bậc nhƣ nhau Hình 1.2 biểu diễn một số đồ thị graph có 5 đỉnh là a, b, c, d và e
Hình 1.2: Các dạng đồ thị Graph
Trong hình 1.2 (1), cạnh (aa) đƣợc gọi là cạnh lặp (loop) và hai cạnh giữa cặp đỉnh (b,d) đƣợc gọi là hai cạnh song song (parallel edges) Một đồ thị đƣợc gọi là một đơn đồ thị (simple graph) nếu nó không có cạnh lặp và cạnh song song (hình 1.2-(2)) Nếu một đồ thị không phải là đơn đồ thị thì chúng ta sẽ gọi nó là đa đồ thị (multigraph) Đồ thị G(V,E) có thể là vô hướng (hình 1.2 (1) và 1.2 (2)) hoặc có hướng (hình 1.2 (3)) (các thuật ngữ khác xem thêm tại [44]) Đồ thị Graph cũng đƣợc biểu diễn bằng một ma trận kề (adjacency matrix) A có kích thước n×n trong đó:
Copyright © School of Medicine and Pharmacy, VNU
Có thể thấy kích thước của cách biểu diễn này là O(n 2 ) bất kể số lượng cạnh là nhiều hay ít Số lƣợng cạnh m của một đồ thị Graph có thể lên tới O(n 2 ) cạnh (ta gọi là đồ thị dầy) Tuy nhiên, nhiều đồ thị (đặc biệt các đồ thị thực tế nhƣ mạng PN) có số lƣợng cạnh m=O(n) (ta gọi là đồ thị thƣa), cách biểu diễn này khá tốn kém dung lƣợng bộ nhớ Để tiết kiệm bộ nhớ, đồ thị Graph cũng có thể đƣợc biểu diễn bằng danh sách kề (adjacency list) Theo đó, với mỗi đỉnh a∈ V, ta lưu trữ một danh sách các đỉnh kề với nó Nhƣ vậy, đỉnh a cần một danh sách có d(a) phần tử Do đó tổng số phần tử của các danh sách là:
V a d(a) 2m Ở đây mỗi cạnh đƣợc đếm hai lần trong tổng bậc của hai đỉnh kề với nó Cách biểu diễn này phù hợp với cả đồ thị thƣa Mặc dù tiết kiệm bộ nhớ, cách biểu diễn này không phù hợp với một số thao tác của đồ thị
Ví dụ về hai cách biểu diễn đồ thị cho trong hình dưới đây:
Hình 1.3: Ví dụ về hai cách biểu diễn đồ thị theo ma trận kề và theo danh sách kề
Biểu diễn đa dƣợc lý mạng bằng đồ thị Graph
Đa dƣợc lý mạng là hệ thống tích hợp của các mạng nhỏ chứa thông tin về tương tác giữa thuốc với đích phân tử (Drug-Protein Interaction Network, DPIN), giữa các đích phân tử (Protein-Protein Interaction Network, PPIN) và giữa các thuốc (Drug-Drug Interaction Network, DDIN) với nhau Mạng là
Copyright © School of Medicine and Pharmacy, VNU một đồ thị được biểu diễn dưới dạng Graph, gồm các nút và các cạnh nối các nút với nhau biểu diễn cho các tương tác giữa các nút [29]
Các cạnh gồm có cạnh vô hướng, cạnh có hướng và cạnh có gắn trọng số
Các cạnh vô hướng (Undirected edges): Kiểu này thường gặp trong các mạng lưới tương tác protein–protein (PPIN) Mối quan hệ giữa các nút là sự kết nối đơn giản, không có một hướng đi xác định [22]
Các cạnh được định hướng (Directed edges): Kiểu này được tìm thấy, ví dụ như là, trong mạng lưới trao đổi chất hoặc chuyển hóa gene Có một hướng đi rõ ràng của các tín hiệu được quy ước sẵn và mạng lưới có thể được tổ chức theo kiểu cấp bậc [22]
Các cạnh có gắn trọng số (Weighted edges): Các cạnh dù có hướng hay không thì cũng có thể mang giá trị trọng số liên quan tới chúng Điều này đƣợc sử dụng để phác họa các ví dụ nhƣ khả năng xảy ra một tương tác, khả năng một gene làm thay đổi mức độ biểu hiện của một gene khác hay thậm chí là sự liên quan giữa các trình tự chuỗi giống nhau trên hai gene Các cạnh cũng có thể đƣợc định lƣợng bởi các giá trị trung tâm của chúng hoặc một vài tham số mạng lưới khác [22]
Dựa vào các cạnh ta có thể chia mạng thành ba dạng chính: mạng vô hướng, mạng có hướng và mạng có gắn trọng số [7] Hình 1.4 mô tả các dạng của mạng:
Hình 1.4: Các dạng của mạng (a) mạng vô hướng, (b) mạng có định hướng, (c) mạng có gắn trọng số
Copyright © School of Medicine and Pharmacy, VNU
1.3.1 Mạng tương tác giữa thuốc với đích phân tử (DPIN)
Mạng DPIN là một sơ đồ được biểu thị dưới dạng đồ thị Graph, gồm các nút là thuốc hoặc protein và các cạnh là các tương tác qua lại giữa chúng
Tương tác protein-thuốc là sự tương tác vật lý giữa phân tử thuốc và protein làm thay đổi cấu dạng hay hoạt tính của protein, từ đó tạo ra tác dụng dƣợc lý của thuốc [46]
Nếu thuốc tác động lên một thụ thể hoặc đƣợc chuyển hóa bởi một enzyme thì nó phải gắn với với protein hoặc enzyme thông qua các loại liên kết vật lý nhƣ cộng hóa trị (covalence), tĩnh điện (electrostatics), Van der Vaals và liên kết hydro Liên kết cộng hóa trị là loại liên kết bền vững hơn các loại liên kết khác Liên kết ion, hay liên kết điện tích, là một liên kết hóa học có bản chất là lực hút tĩnh điện giữa hai ion mang điện tích trái dấu
Tương tác này thường xuất hiện khi trong protein có một đồng yếu tố (cofactor) là ion kim loại Ngoài ra còn một tương tác yếu giữa các nguyên tử là lực tương tác Van der Vaals, là một loại lực phân tử, sinh ra bởi sự phân cực của các phân tử thành các lƣỡng cực điện mà nguyên nhân sâu xa là do sự thăng giáng trong phân bố điện tích giữa các điện tử Tương tác Van der Vaals giữa thuốc với protein thường thông qua tác động giữa 2 nhân thơm (pi- pi), 1 nhân thơm với mạch thẳng (pi-alkyl) hay giữa 2 mạch thẳng với nhau (alkyl-alkyl) Do bản chất của protein là chuỗi các acid amin nên thuốc cũng có thể tương tác với protein thông qua cầu nối hydro, ví dụ nhóm cho acid yếu (D-H) với chất nhận còn cặp electron tự do nhƣ Oxy và Ni tơ [20]
Trong hình 1.5 là một ví dụ về mạng tương tác giữa các thuốc hoá trị với protein liên quan đến ung thƣ Thuốc đa đích đƣợc biểu thị bằng hình lục giác màu cam và tất cả các đích đƣợc biểu diễn bằng hình elip màu xanh lam biểu thị sự tương tác của 20 loại thuốc cùng 17 đích của chúng Phân tích mạng, bậc (degree) được dùng để đánh giá sự tương tác giữa các thuốc và đích (protein) Bậc của một nút (thuốc hoặc đích) là số cạnh (tương tác từ các nút khác) liên kết với nút này Nhƣ trong hình 1.5, bậc tối đa của các thuốc đa đích là 5, và tối thiểu là 2 Đặc biệt, các thuốc đa đích Sorafenib, Suniitinib và Pazopanib tương ứng có bậc là 5, 3 và 3, có ảnh hưởng lớn đến cấu trúc mạng Thuốc có bậc cao nhất là Sorafenib, phản ánh tính đa dạng của nó
Copyright © School of Medicine and Pharmacy, VNU trong chỉ định điều trị bệnh (ung thƣ biểu mô tế bào gan, ung thƣ biểu mô tế bào thận và ung thƣ biểu mô tuyến giáp) Bậc tối đa của các đích là 8 và tối thiểu là 1 Đặc biệt, các đột biến VEGFR2 (Vascular endothelial growth factor receptor 2, thụ thể yếu tố tăng trưởng của tế bào nội mạch), c-Kit (đột biến tyrosine-protein kinase hay CD-117 thường gặp trong ung thư mô đệm dạ dày), PDGFR-b (yếu tố tăng trưởng có nguồn gốc từ tiểu cầu) và EGFR (Epidermal Growth Factor Receptor, thụ thể yếu tố tăng trưởng biểu bì) được xem là các mục tiêu của thuốc tác dụng đa đích Các đích có bậc cao (> 5) là VEGFR2 và c-Kit VEGF (Vascular endothelial growth factor , yếu tố tăng trưởng tế bào nội mạch) và VEGFR2 là các thụ thể hiện được khai thác rất nhiều trong ung thư biểu mô thận (RCC, renal cell carcinoma) Tương tự
VEGFR2, biểu hiện của c-Kit có liên quan chặt chẽ với quá trình phát sinh và phát triển của ung thƣ biểu mô thận di căn Có thể nói, phát triển thuốc nhắm các đích VEGFR2 và c-Kit là hướng đi phổ biến nhất hiện nay của các thuốc kháng ung thƣ có tác dụng đa đích [23]
Hình 1.5: Mạng tương tác giữa thuốc hóa trị với các đích protein tyrosine kinase
Copyright © School of Medicine and Pharmacy, VNU
Theo hình 1.5 thì thuốc là các nút hình lục giác màu da cam, và đích được biểu diễn bằng hình elip màu xanh Tương tác thuốc-đích được biểu diễn bằng các cạnh có hình dạng mũi tên là kích hoạt và “T” là ức chế
1.3.2 Mạng tương tác protein – protein (PPIN)
Thông qua đa dƣợc lý mạng, chúng ta có thể xác định các đích phân tử dựa trên tổng hợp các tương tác có thể xảy ra giữa các protein tham gia quá trình bệnh sinh (PPIN) Protein và các tương tác của chúng là trung tâm của hầu hết các quá trình sinh học cơ bản Thông thường, protein ít khi hoạt động độc lập mà chúng thực hiện chức năng thông qua sự tương tác với các đơn vị phân tử sinh học khác trong tế bào Tương tác protein điều chỉnh một loạt các quá trình sinh học, bao gồm kích hoạt / ức chế phiên mã; miễn dịch, nội tiết, và tín hiệu dược lý cũng như tương tác giữa các tế bào Do đó, việc nghiên cứu các tương tác protein-protein (protein-protein interactions, PPIs) là cần thiết để hiểu đƣợc cơ chế phân tử của các quá trình sinh học [49] PPIN là mạng tương tác giữa các protein, thường có cấu trúc dạng graph, trong đó các protein đóng vai trò là các nút và mối tương quan giữa chúng là các cạnh nối giữa các nút Tương quan giữa các protein (interactome) ở đây được hiểu là các quá trình hoá sinh học nhƣ tổng hợp cấu trúc, truyền tín hiệu (signal transduction), vận chuyển (transport) hay phosphoryl hoá… [45]
Đa dƣợc lý mạng trong tìm kiếm đích tác dụng của thuốc chống ung thƣ
Nghiên cứu hoạt tính của thuốc thường dựa trên nguyên tắc chìa khóa và ổ khóa, trong đó thuốc giống nhƣ một chìa khóa có chọn lọc phù hợp với một đích cụ thể của nó Trong hai thập kỷ vừa qua, quan điểm thiết kế phối tử có chọn lọc để tránh các tác dụng không mong muốn đã trở thành mô hình nổi bật trong thiết kế và phát triển thuốc mới Tuy nhiên, sự phát triển vƣợt bậc của sinh học hậu genomic (post-genomic biology) đã tiết lộ một bức tranh vô cùng phức tạp về hoạt động của thuốc trong cơ thể con người Theo đó, nếu xem mỗi thuốc là một chìa khoá và mỗi đích là một ổ khoá thì không chỉ có nhiều chìa khóa cùng mở đƣợc một ổ khóa, mà phổ biến hơn lại chính là một chìa khóa có thể mở đƣợc rất nhiều ổ khóa [14] Cơ chế tác dụng đa đích là rất phổ biến trên thuốc kháng ung thƣ, thuốc điều trị bệnh lý thần kinh, kháng sinh và kháng viêm
Về mặt cấu trúc, đa dƣợc lý mạng là một sơ đồ dạng graph tích hợp thông tin tương tác của mạng DPIN, PPIN và DDIN, trong đó thuốc hoặc protein đóng vai trò các nút và mối tương quan giữa chúng là các cạnh nối giữa các nút Tương quan giữa các protein (interactome) ở đây được hiểu là các quá trình hoá sinh học nhƣ tổng hợp cấu trúc, truyền tín hiệu (signal transduction), vận chuyển (transport) hay phosphoryl hoá… Một nút có thể kết nối với nhiều nút khác (nút có bậc cao >2), protein nhƣ thế gọi là một hub
Các nút không liên kết gọi là non-hub Trong PPIN, tầm quan trọng của một protein đƣợc xác định thông qua mức độ thay đổi trong cấu trúc PPIN khi bỏ đi một nút trong mạng Do đó, các protein hub thường được xem là quan trọng hơn trong bảo tồn cấu trúc tổng thể của mạng PPI cũng nhƣ hoạt động của tế bào
Trong tế bào khối u, các đích phân tử liên quan đến ung thư thường có cấu trúc hỗn tạp (promiscuous structure), dẫn đến việc dễ dàng tương tác với các protein khác Nhiều nghiên cứu đã chỉ ra rằng trong tế bào ác tính số
Copyright © School of Medicine and Pharmacy, VNU lượng tương tác giữa các protein có thể tăng lên Năm 2010, Sun và Zhao khi nghiên cứu tương tác của 342 đích ung thư thấy rằng 240 trong số đó (chiếm hơn 70%) là trung tâm của mạng PPIN liên quan đến các bệnh ung thư thường gặp, đồng thời trung bình mỗi protein có thể tương tác với ít nhất
4 protein khác Do đó PPIN cho phép phát hiện đích ung thƣ cũng nhƣ biomarker mới [41]
Trong những năm gần đây, một số nghiên cứu đã đƣợc công bố liên quan đến xây dựng mạng PPIN phục vụ cho nghiên cứu thuốc kháng ung thƣ mới Trong đó tiêu biểu là nghiên cứu của Kar và cộng sự với phân tích cấu trúc các protein ung thƣ trong mạng ciSPIN (mạng giao diện cấu trúc các protein ung thƣ) Các tác giả nhận thấy các protein ung thƣ có thể tiếp xúc với khoảng 56% protein lân cận trong ciSPIN nhờ tính đa diện của chúng (gọi là nút đa diện, multi-interface hubs) và các nút này chiếm tỷ trọng rất lớn (tới hơn 76%) trong mạng Đặc biệt, nghiên cứu cũng đi sâu vào một số tiểu mạng (sub-network) liên quan đến hoạt hóa các con đường tín hiệu-dịch chuyển (signal-transduction) và hoạt động xúc tác của một protein kinase (ERBB3:
Erb-B2 Receptor Tyrosine Kinase 3) và giải thích cơ chế ức chế con đường truyền tín hiệu Erb của pertuzumab (Perjeta TM ), một thuốc hiện dùng trong điều trị ung thư vú HER2 dương tính [1]
Một nghiên cứu quan trọng khác là của Joshi và cộng sự về xây dựng và phân tích mạng PPIN của 11 histon deacetylase (HDAC) trong tế bào T (lymphocyte T) của người Đây là nhóm các enzym xúc tác cho quá trình deacetyl hoá nhóm ε-N acetyl lysine amino acid ở phần đuôi của histon và hiện đƣợc xác định là mục tiêu phân tử quan trọng cho nghiên cứu phát triển thuốc điều trị ung thƣ Lần đầu tiên các tác giả công bố và kiểm chứng hơn
200 tương tác mới giữa các histone deacetylase và các protein khác tham gia các quá trình ubiquitination (cơ chế đánh dấu để phân giải các protein ung thƣ), điều hòa nhiễm sắc, biểu hiện gene, chế biến RNA thông tin (mRNA splicing) và điều hòa chu kỳ tế bào Nghiên cứu cũng chỉ ra rằng các histone deacetylase đều có liên hệ với nhau, trong đó histone deacetylase 1, histone deacetylase 2 và histone deacetylase 11 là ba enzyme có bậc cao nhất trong PPIN của 11 isoform, qua đó mở rộng hiểu biết về cơ chế tác dụng của các
Copyright © School of Medicine and Pharmacy, VNU hợp chất ức chế histon deacetylase cũng nhƣ là cơ sở cho việc xác định các đích mới hay thiết kế thuốc hợp lý điều trị ung thư theo hướng ức chế enzyme histone deacetylase [24]
Việc xây dựng mạng PPIN hiện nay đã không còn quá phức tạp do ngày càng nhiều thông tin về tinh thể nhiễu xạ tia X của các đích mới cũng nhƣ thông tin liên quan đến gene (genome) hay protein (proteome) đƣợc tìm thấy Nhiều cơ sở dữ liệu (CSDL) về đích tác dụng có thể đƣợc sử dụng trong xây dựng mạng PPIN nhƣ BindingDB, ChEMBL hay canSAR Một số khác tích hợp thêm thông tin liên quan đến tương tác thuốc-đích phân tử phục vụ xây dựng mạng tương tác đích phân tử (drug-target network) như Drugbank, Therapeutic Target Database, SuperTarget hay Mandator Một số cơ sở dữ liệu còn cung cấp thêm thông tin liên quan đến tương tác thuốc-đích phân tử gây phản ứng có hại của thuốc (drug-off-target interaction) nhƣ SIDER, Chem2Bio2RDF, STITCH hay PROMISCUOUS… Tương tác giữa các protein cũng có thể đƣợc khai thác từ cơ sở dữ liệu GEO (Gene Expression
Omnibus), MIPS, BIND hay PRIDE Các con đường chuyển hóa có thể tìm thấy từ KEGG hay BIGG [21]
Nhƣ vậy, mạng PPIN là một công cụ rất hữu ích trong xác định đích ung thƣ hiệu quả, nhận biết cơ chế cũng nhƣ sàng lọc hợp chất mới kháng ung thư Cách tiếp cận này giúp người nghiên cứu có một cái nhìn tổng quát về cơ chế bệnh sinh, từ đó xây dựng một chiến lƣợc nghiên cứu và phát triển thuốc hiệu quả nhất Với sự phát triển của ngành công nghệ sinh học, sinh học phân tử và công nghệ thông tin, việc nghiên cứu PPIN là hoàn toàn khả thi và sẽ ngày càng được ứng dụng nhiều hơn trong tương lai
Mạng PPIN có vai trò then chốt trong xác định đích kháng ung thƣ hiện nay Do đó, trong các phần tiếp theo, chúng tôi sẽ trình bày cụ thể cách xây dựng một mạng PPIN và ứng dụng của nó trong tìm kiếm đích điều trị ung thƣ mới
Copyright © School of Medicine and Pharmacy, VNU
QUY TRÌNH XÂY DỰNG MẠNG TƯƠNG TÁC PROTEIN-PROTEIN (PPIN)
Các công cụ phân tích
Hình 2.1: Logo phần mềm Cytoscape - công cụ phân tích và xây dựng hình ảnh trực quan cho PPIN
Cytoscape (http://www.cytoscape.org/) là phần mềm nguồn mở dựa trên Java, là một công cụ hữu ích để mô ta các mạng tương tác phân tử và tích hợp chúng với bất kỳ loại dữ liệu nào Cytoscape là công cụ có thể phân tích trong nhiều lĩnh vực khác nhau Đối với phân tích mạng PPI có các ứng dụng cụ thể cho tìm kiếm, (ví dụ MCODE, clusterMaker2, JActiveModules) hoặc để thực hiện phân tích làm giàu tập hợp gen (Gene Set Enrichment Analysis, BiNGO, ClueGO, EnrichmentMap) Ngoài những tính năng cơ bản nhƣ tích hợp dữ liệu, phân tích, và mô tả, cytoscape còn có sẵn các ứng dụng dưới dạng mẫu nhƣ phân tích các profile mạng và phân tử, các link liên kết với các dữ liệu khác Cơ sở dữ liệu bệnh-đích-thuốc này ghi lại các liên kết đã đƣợc biết giữa các bệnh Người dùng có thể tìm kiếm cơ sở dữ liệu bằng cách sử dụng các chuỗi tên bệnh, đích hoặc thuốc; cấu trúc hóa học và cấu trúc con; hoặc trình tự protein, và sau đó có đƣợc một mạng tổng thể trực tuyến về các
Copyright © School of Medicine and Pharmacy, VNU tương tác đã được lưu trữ Trong mạng tổng thể có được, mỗi nút là một bệnh, đích, hoặc thuốc, và mỗi cạnh là một liên kết giữa chúng [28]
Gephi (https://gephi.org/) là công cụ xây dựng mạng PPIN không lập trình Gephi có khả năng liên kết hàng trăm nghìn nút và hàng triệu cạnh, mặc dù quá trình vẽ và xử lý mạng đòi hỏi máy tính có cấu hình mạnh Gephi là mã nguồn mở, đa nền tảng, và có một loạt các thuật toán liên quan đến mạng nâng cao (thường không được tìm thấy ở bất kỳ phần mềm nào khác) dưới dạng các plug-in Một bất lợi là thiếu khả năng xử lý thông tin sinh học cụ thể Nó là một công cụ mạng chung, và đƣợc sử dụng để liệt kê, thống kê và trực quan hóa Hình 2.2 là hình ảnh về Gephi :
Hình 2.2: Logo Phần mềm Gephi
2.1.3 Các phần mềm lập trình
Các phương pháp lập trình cho phân tích mạng quy mô lớn gồm các gói (package) nhƣ igraph (http://igraph.org/ ) (cho R, Python và C) hoặc NetworkX (http://networkx.github.io/ ) (cho Python) Chúng có thể đƣợc thực hiện dễ dàng như một phần của con đường phân tích tin sinh học lớn hơn Hình 2.3 là các phần mềm lập trình igraph và NetworkX:
Hình 2.3: Phần mềm lập trình igraph và NetworkX
Copyright © School of Medicine and Pharmacy, VNU
Nguồn dữ liệu
Có thể thu được các dữ liệu từ: Các phương pháp thực nghiệm, các CSDL PPI sơ khai, từ các siêu dữ liệu hoặc từ các dữ liệu dự đoán
2.2.1 Các cơ sở dữ liệu tương tác protein (PPI)
Hình 2.4 và bảng 1 mô tả một số cơ sở dữ liệu có thể khai thác:
Hình 2.4: Các cơ sở dữ liệu về tương tác protein
Bảng 1: Các cơ sở dữ liệu về PPI
Cơ sở dữ liệu URL Mô tả
STRING https://string-db.org/ STRING là cơ sở dữ liệu sinh học và là nguồn dữ liệu web về các tương tác protein-protein đã đƣợc biết và đƣợc dự đoán Cơ sở dữ liệu STRING chứa thông tin từ nhiều nguồn, bao gồm dữ liệu thử nghiệm, phương pháp dự đoán tính toán và bộ thu thập dữ liệu công cộng Có thể truy cập
Copyright © School of Medicine and Pharmacy, VNU miễn phí và đƣợc cập nhật thường xuyên Phiên bản mới nhất 10.0 chứa thông tin về khoảng 9,6 triệu protein từ hơn
2000 sinh vật STRING đƣợc phát triển bởi các cơ sở giáo dục gồm CPR, EMBL, KU, SIB, TUD và UZH [27]
UniHi http://www.unihi.org/ Người dùng có thể nhập các gen hoặc protein đã đƣợc xác định từ các sinh vật khác nhau để có được các tương tác vật lý và quy định trong tương tác Kết quả đƣợc hiển thị bằng công cụ trực quan hóa UniHI cung cấp nhiều tùy chọn để lọc tương tác (ví dụ: dựa trên nguồn tương tác hoặc số lƣợng bằng chứng) Các đích thuốc trong mạng đƣợc truy xuất có thể dễ dàng đƣợc đánh dấu và phân tích Dữ liệu biểu thị từ cơ sở dữ liệu UniHI hoặc đƣợc người dùng tải lên có thể được sử dụng để lấy được mạng lưới mô, quá trình hoặc bệnh Các công cụ để kiểm tra sự liên quan chức năng của các mạng phân tử cũng được cung cấp cho người dùng [19]
InAct https://www.ebi.ac.uk/inta ct/
IntAct là một cơ sở dữ liệu và bộ công cụ để lập mô hình, lưu trữ và phân tích dữ liệu tương tác
Copyright © School of Medicine and Pharmacy, VNU phân tử Ngoài dữ liệu PPI, nó cũng bao gồm thông tin về DNA, RNA và tương tác phân tử nhỏ
BioGRIP https://thebiogrid.org/ BioGRIP là kho lưu trữ chung cho CSDL tương tác BioGRIP là một nguồn cơ sở dữ liệu về các tương tác vật lý và các tương tác generic đƣợc hợp nhất và liên tục cập nhật Nó bao gồm hơn 55.000 tương tác thiết yếu của nấm men, trở thành cơ sở dữ liệu lớn nhất về nấm men và hơn 130.000 tương tác thiết yếu của
ChEMBL http://www.ebi.ac.uk/che mbl
Là CSDL sinh học với hơn 1 triệu hợp chất druglike có hoạt tính sinh học Dự đoán tương tác thuốc-đích Thể hiện mối quan hệ giữa cấu trúc và hoạt tính canSAR http://cansar.icr.ac.uk/ Một kho lưu trữ dữ liệu sinh học ung thƣ bao gồm biểu hiện gen, tương tác protein-protein và sàng lọc RNAi cùng với dữ liệu sàng lọc hóa chất và dƣợc lý học
STITCH http://stitch.embl.de/ CSDL tương tác hóa chất-protein về các mối tương quan đã biết hoặc đã đƣợc dự đoán của chúng bằng cách kết hợp thƣ viện, các dữ liệu thử nghiệm hoặc là các CSDL khác Tiêu chuẩn để dự đoán các tương tác protein- protein bằng in silico
Copyright © School of Medicine and Pharmacy, VNU
Thường cần phải tích hợp nhiều nguồn dữ liệu PPI vì không có cơ sở dữ liệu nào có đầy đủ tất cả các PPI có sẵn Điều này tạo ra một số thách thức vì các cơ sở dữ liệu khác nhau sử dụng các định danh khác nhau và chứa các loại dữ liệu khác nhau Để tránh rườm rà và mâu thuẫn, điều quan trọng là phải hiểu sự khác biệt giữa các cơ sở dữ liệu khác nhau về:
1 Loại dữ liệu và siêu dữ liệu chúng bao gồm Ví dụ: một số cơ sở dữ liệu sẽ chỉ cung cấp cho bạn dữ liệu có nguồn gốc thực nghiệm và các cơ sở dữ liệu khác cũng sẽ bao gồm các dự đoán Tương tự, mức độ chi tiết đƣợc đƣa ra về thiết lập thử nghiệm thay đổi giữa các cơ sở dữ liệu
2 Các định danh đƣợc cơ sở dữ liệu sử dụng Cơ sở dữ liệu khác nhau đƣa ra các lựa chọn khác nhau về vấn đề này, vì vậy đôi khi bạn có thể phải ánh xạ các loại định danh khác nhau để tích hợp dữ liệu
2.2.2 Các phương pháp thực nghiệm
Có thể thực hiện các thử nghiệm và các phương pháp tính toán để có được dữ liệu về các tương tác protein – protein Các phương pháp thử nghiệm như: phương pháp lai đôi nấm men (Y2H-yeast two hybrid), phương pháp khối phổ (MS- mass spectromety), phương pháp protein microarray Các phương pháp toán học để dự đoán các tương tác protein-protein như phương pháp tiếp cận ở quy mô bộ gen (genome-scale approaches), phương pháp tiếp cận ở quy mô trình tự gen (sequence-scale approaches), phương pháp tiếp cận dựa trên cấu trúc (structure-based approaches), phương pháp learning-based (learning-based approaches) [34] Sau đây, chúng tôi sẽ nêu một số phương pháp phát hiện tương tác protein điển hình nhất
Hệ thống lai đôi nấm men Y2H: Một trong những phương pháp phổ biến nhất để phát hiện tương tác giữa các cặp protein là hệ thống lai đôi nấm men Sự tương tác của hai protein kích hoạt phiên mã gen reporter (gen chỉ thị), và phản ứng màu xảy ra Phản ứng này có thể giúp theo dõi sự tương tác giữa hai protein, tương tác giữa protein "con mồi" (prey) và protein "mồi"
(bait) [6] Hình 2.5 mô tả quy trình phát hiện tương tác protein-protein bằng phương pháp Y2H
Copyright © School of Medicine and Pharmacy, VNU
Hình 2.5: Hệ thống lai đôi nấm men giúp phát hiện tương tác giữa các cặp protein
Hình 2.5 miêu tả quá trình hệ thống lai đôi nấm men phát hiện tương tác protein-protein Trong Hình 2.5 (a), sự kết hợp của protein "mồi" và phần gắn kết với DNA, nhân tố điều hòa phiên mã, đã không bật đƣợc gen reporter; không xảy ra sự thay đổi màu sắc; sự tương tác không thể được theo dõi Hình 2.5 (b), tương tự, sự kết hợp của protein "mồi" và vùng kích hoạt của chất kích hoạt phiên mã cũng không đủ để bật gen reporter Trong hình 2.5 (c), khi
"bait" và "prey" liên kết , làm cho phần gắn kết với DNA và vùng kích hoạt đủ gần để bật gen reporter Kết quả là quá trình phiên mã xảy ra và thay đổi màu sắc có thể đƣợc quan sát đƣợc [49]
Phương pháp khối phổ MS (mass spectromety): dùng để phân tích thành phần của một phức hợp protein Phân tích khối phổ đƣợc tiến hành theo ba bước: gắn mồi, liên kết và sàng lọc phức, phân tích các protein gắn kết
[11] Hình 2.6 mô tả quá trình phân tích phức hợp protein bằng phương pháp khối phổ
Copyright © School of Medicine and Pharmacy, VNU
Hình 2.6: Quá trình phân tích phức hợp protein bằng phương pháp khối phổ
Theo như hình 2.6: bước (1), một "tag ái lực" (affinity tag) được gắn vào một protein đích ("mồi") Nhƣ minh họa trong hình 2.6 (2), protein mồi đƣợc kết tủa hàng loạt, cùng với bất kỳ protein nào bám vào protein mồi, vào một "cột ái lực” Trong hình 2.6 (3), các phức hợp protein đã đƣợc lọc và phân tích bằng cách điện di một chiều SDS-PAGE (Điện di trên gel polyacrylamide với natri docecyl sulfate, Sodium dodecyl sulfate polyacrylamide gel electrophoresis), do đó các protein đƣợc phân tách theo khối lượng Bước (4) đòi hỏi phải tách các dải protein dựa vào kích thước protein; ở bước (5), các dải protein được tách với trypsin Trong các bước (6-9), các thành phần protein đƣợc phát hiện bởi MS và phân tích tin sinh học [49]
Phương pháp dựa trên cấu trúc (structure-based approaches):
Phân tích topo của PPIN
Phân tích tính năng topo của một mạng là một cách hữu ích để xác định các thành phần tham gia và cấu trúc con có ý nghĩa sinh học Có nhiều chiến lƣợc khác nhau để phân tích topo (hình 2.7) Sau đây là các chiến lƣợc phân tích trung tâm và cụm topo
Hình 2.7: Các cách phân tích topo
2.3.1 Phân tích trung tâm Độ trung tâm (Centrality) đƣa ra một đánh về tầm quan trọng của một nút hoặc cạnh đối với kết nối hoặc luồng thông tin của mạng (Hình 2.8) Nó là một tham số hữu ích trong các mạng tín hiệu và nó thường được sử dụng khi tìm các đích thuốc Phân tích trung tâm trong PPIN thường nhằm mục
Copyright © School of Medicine and Pharmacy, VNU đích trả lời câu hỏi sau đây: Protein nào là quan trọng nhất và tại sao? Cạnh trung tâm (Edge centrality) cũng có thể đƣợc phân tích, nhƣng điều này ít phổ biến hơn [10]
Hình 2.8: Nút trung tâm đại diện trong một mạng
Theo hình 2.8, các nút lớn hơn, màu đỏ sậm có giá trị trọng tâm cao hơn Định nghĩa „trung tâm” thay đổi theo hoàn cảnh hoặc mục đích của phân tích Trung tâm có thể đƣợc đo bằng các tham số và tiêu chuẩn khác nhau nhƣ: a Bậc của nút
Bậc của các nút có thể đƣợc sử dụng nhƣ một ƣớc tính sơ bộ về trung tâm Các nút có bậc cao (hub) là chìa khóa trong việc duy trì một số đặc điểm của các mạng không có quy mô (scale-free network) nhƣ độ mạnh của chúng và hiệu ứng mạng con (small-world effect) Tuy nhiên, đây là một biện pháp cục bộ vì nó không tính đến phần còn lại của mạng và nó phụ thuộc rất lớn vào kích thước của mạng [10] b Các phép đo trung tâm toàn mạng ( Global centrality measures )
Các phép đo trung tâm toàn mạng tính đến toàn bộ mạng lưới Chúng là các phép đo cung cấp một giá trị chuẩn hóa độc lập với kích thước mạng
Phép đo toàn mạng có nhiều loại khác nhau, mỗi phép đo đƣa ra một định nghĩa hơi khác nhau về tính trung tâm Hai trong số các phép đo trung tâm toàn mạng đƣợc sử dụng rộng rãi nhất là độ trung tâm dựa trên sự gần gũi (closeness centralities) và độ trung tâm ở giữa (betweenness centralities) [10]
Copyright © School of Medicine and Pharmacy, VNU
Closeness centralities Độ trung tâm dựa trên sự gần gũi (Closeness centrality) chỉ ra một nút trong mạng có thể truy cập nhanh tới nhiều nút khác trong mạng
Nó thường được biểu diễn bằng nghịch đảo của tổng các khoảng cách topo trong đồ thị
Trong đó: i # j, d(i,j) là độ dài quãng đường ngắn nhất giữa nút i và nút j trong mạng, N là số nút Tổng này còn đƣợc gọi là độ xa (farness) của các nút Đôi khi closeness centrality cũng đƣợc hiểu đơn giản là nghịch đảo độ xa
Trong ví dụ ở hình 2.9, bạn có thể thấy ma trận khoảng cách cho biểu đồ ở bên trái và các phép tính closeness centrality ở bên phải Nút B là nút trung tâm nhất theo các tham số này
Hình 2.9: Ví dụ về cách tính closeness centrality của nút trong một graph
Betweenness centralities Độ trung tâm ở giữa (Betweenness centralities) chỉ ra vị trí nút trong mạng và khả năng kết nối các thành phần hoặc nhóm trong mạng Các nút có betweenness centrality cao nhất là các nút quan trọng vì chúng nằm trên đường truyền tin và có thể kiểm soát luồng truyền tin Các nút này có thể đại diện cho các protein quan trọng trong các đường truyền tín hiệu và có thể là các đích trong tìm kiếm thuốc Bằng cách kết hợp dữ liệu này với phân tích giao thoa, chúng ta có thể mô phỏng các tấn công (attack) nhắm đích trên các mạng tương tác protein-protein và dự đoán protein nào là các ứng cử viên thuốc tốt hơn [18]
Copyright © School of Medicine and Pharmacy, VNU
Betweenness centrality được định nghĩa là số đường đi ngắn nhất trong graph đi qua nút chia cho tổng số đường đi ngắn nhất Betweenness centrality của một nút N đƣợc tính các cặp của các nút (v1, v2) và đếm số lƣợng các đường đi ngắn nhất liên kết hai nút đó, mà đi qua nút N Tiếp theo giá trị có liên quan đến tổng số đường dẫn ngắn nhất liên kết v1 và v2 [18]
Trong đó g ik là tổng số đường đi ngắn nhất từ j tới k, g jk (n i ) là tổng số đường đi ngắn nhất từ j tới k đi qua nút i
Hình 2.10: Ví dụ về betweenness centrality
Trong hình 2.10 là một ví đƣa ra một ví dụ trực quan về betweenness centrality, một trong hai nút B hoặc nút C có thể đƣợc loại bỏ và vẫn sẽ có các đường dẫn dẫn đến nút E Tuy nhiên, nút D khá là trung tâm, vì bất kỳ con đường cũng phải đi qua nó để dẫn đến nút E c Các phép đo trung tâm khác:
Các phép đo phức tạp hơn có thể được xác định tùy thuộc vào phương pháp cụ thể được sử dụng để tính toán Ví dụ, các trung tâm thường được tính toán bằng cách sử dụng “bước đi ngẫu nhiên” (random walk) trong đó các nút ngẫu nhiên đƣợc chọn làm điểm bắt đầu và “thời gian” hoặc “tốc độ” cần thiết để tiếp cận các nút khác trong mạng đƣợc tính toán Điều này có thể đƣợc kết hợp với trọng số đƣợc gán cho các nút hoặc cạnh trong graph để tính trung tâm Đây là phương pháp sử dụng thuật toán Google PageRank để gán trọng số cho mỗi webpage
Copyright © School of Medicine and Pharmacy, VNU
2.3.2 Phân tích cụm (Clustering analysis)
Tìm kiếm các cụm trong mạng là một chiến lƣợc tốt để giảm độ phức tạp của mạng và đƣa ra các mô-đun chức năng (ví dụ: các phức hợp protein) phản ánh tính sinh học của mạng Có một số thuật ngữ thường được sử dụng khi nói về phân tích cụm (Hình 2.11):
Hình 2.11: Một số khải niệm trong phân tích cụm
Cụm (community/cluster): Một cách tổng quát, thuật ngữ "catch-all" có thể đƣợc định nghĩa là nhóm các nút đƣợc kết nói với nhau nhiều hơn so với phần còn lại của mạng Định nghĩa chính xác cho một cụm sẽ phụ thuộc vào phương pháp hoặc thuật toán được sử dụng để xác định nó Khi nói về các PPIN, cụm phân thành hai loại: mô đun chức năng và phức hợp protein [32]
Các bước cơ bản xây dựng mạng tương tác PPIN
(seed proteins), là phân tử chính được quan tâm, và là xương sống của toàn mạng lưới PPIN
Giả thuyết cuối cùng được tìm ra trong quá trình phân tích mạng lưới sẽ liên quan trực tiếp đến protein gốc này
Bước 2: Thu thập tương tác protein-protein
Có thể thu thập tương tác từ các dữ liệu có sẵn như trong bảng 1 hoặc tiến hành các thực nghiệm để thu được các tương tác protein
Bước 3: Xây dựng cấu trúc mạng PPIN
Copyright © School of Medicine and Pharmacy, VNU
Sử dụng phần mềm để xây dựng cấu trúc PPIN nhƣ cytoscape, igraph, Gephi, Network X
Bước 4: phân tích cấu trúc mạng lưới với mục đích chính để tìm ra các nút hub (đây có thể là các đích tiềm năng)
Phân tích theo 2 phương pháp: phân tích trung tâm và phân tích cụm
Mục đích của phân tích trung tâm là xác định các nút quan trọng nhất trong mạng, sử dụng các cách khác nhau để tính toán trọng tâm Trong đó các thông số cần quan tâm và phân tích đó là bậc của nút, độ trung tâm ở giữa (betweenness centrality) và độ trung tâm dựa trên sự gần gũi (closeness centrality) để xác định các nút hub Bậc của các nút là số cạnh nối của nút đó, các nút có bậc càng cao thì thường là những nút có nhiều tương tác và quan trọng của mạng lưới, khi ta tác động vào nút đó sẽ ảnh hưởng lớn tới toàn mạng tương tác
Còn mục đích của phân tích cụm là để tìm các thành phần có liên kết chặt chẽ có thể đại diện cho các phức hợp protein và hệ thống
Bước 5: Đưa ra giả thuyết về dữ liệu ban đầu sau khi xây dựng và phân tích mạng lưới: tức là chỉ ra các nút hub, các thông tin về chức năng, vai trò của các nút hub trong mạng
Copyright © School of Medicine and Pharmacy, VNU
PHÂN TÍCH MỘT SỐ VÍ DỤ VỀ ỨNG DỤNG CỦA ĐA DƢỢC LÝ MẠNG TRONG NGHIÊN CỨU ĐÍCH PHÂN TỬ LIÊN QUAN ĐẾN UNG THƢ
Ung thƣ và đích phân tử
Ung thƣ là bệnh lý ác tính của tế bào, khi bị kích thích bởi các tác nhân sinh ung thƣ, tế bào tăng sinh một cách vô hạn, vô tổ chức không tuân theo các cơ chế kiểm soát về phát triển của cơ thể
Hiện nay, việc sử dụng các phân tử nhỏ có khả năng tác động các đích phân tử là các protein hay gene liên quan đến ung thƣ là một trong những liệu pháp hoá trị phổ biến nhất Đích phân tử là một tổ chức tế bào hoặc phân tử liên quan đến quá trình bệnh sinh là nơi mà thuốc sẽ tác dụng vào để biến đổi quá trình bệnh sinh Đích có thể là thụ thể, enzyme, acid nucleic hay các protein khác nhau Đích phân tử có tính đặc hiệu và chọn lọc cao Các thuốc này chủ yếu tác động lên một đích phân tử là protein đóng vai trò quan trọng trong quá trình sinh sản, biệt hóa, và chết theo chu trình của tế bào ung thƣ
Tuy nhiên, các thuốc này gặp phải một vấn đề lớn là tỷ lệ kháng thuốc cao do các đích phân tử dễ bị đột biến Bên cạnh đó chúng cũng có thể tác động lên những protein khác của tế bào bình thường (tính không chọn lọc), do đó gây ra nhiều tác dụng không mong muốn, ảnh hưởng tới thể trạng và chất lượng sống của bệnh nhân cũng nhƣ làm giảm hiệu quả lâm sàng của thuốc Nhƣ vậy, nghiên cứu và phát triển các thuốc điều trị ung thƣ đang gặp phải hai vấn đề chính Thứ nhất, với việc phát hiện ngày càng nhiều yếu tố bệnh sinh ảnh hưởng đến tình trạng bệnh, những liệu pháp điều trị dựa trên một mục tiêu phân tử duy nhất tỏ ra kém hiệu quả Thứ hai, cần phải hệ thống hóa các tương tác phức tạp của chúng trong các quá trình sinh học của cơ thể Từ đó, chúng ta sẽ xác định đƣợc các đích phân tử quan trọng trong quá trình bệnh sinh, cũng nhƣ dự đoán đƣợc các tác dụng không mong muốn của thuốc Để giải quyết các vấn đề nêu trên, cách tiếp cận đa dƣợc lý mạng là một công cụ hữu ích giúp tìm kiếm đích phân tử mới, cũng nhƣ tìm hiểu sâu cơ chế tác dụng của thuốc trong điều trị ung thƣ bằng cách tác dụng lên đa đích
Copyright © School of Medicine and Pharmacy, VNU
Ứng dụng của nghiên cứu đa dƣợc lý mạng trong tìm kiếm đích phân tử liên quan đến ung thƣ
tử liên quan đến ung thƣ
Mục đích của các phương pháp đa dược lý mạng là phát hiện ra các đích tác dụng chƣa biết của các thuốc hiện nay (còn đƣợc gọi là thuốc tái nghiên cứu-drug reposition) Phương pháp này cần có sự tích hợp các dữ liệu từ các lĩnh vực khác nhau bao gồm mô hình tính toán, hóa học tổng hợp, các nghiên cứu in vitro/in vivo trong dƣợc lý và nghiên cứu lâm sàng
Mặc dù không đƣợc thiết kế có chủ đích, nhiều loại thuốc đƣợc biết đến với các tác động đa mục tiêu Một ví dụ là aspirin, thường được sử dụng như một thuốc giảm đau để giảm đau nhẹ hoặc nhƣ là thuốc hạ sốt để giảm sốt; cũng hoạt động nhƣ một loại thuốc chống viêm để điều trị bệnh viêm khớp dạng thấp, viêm màng ngoài tim, và bệnh Kawasaki Ngoài ra, nó còn đƣợc sử dụng trong phòng ngừa các cơn thiếu máu cục bộ thoáng qua, đột quỵ, đau tim, sảy thai, và thậm chí là ung thƣ Một ví dụ khác là Sildenafil (Viagra), một chất ức chế phosphodiesterase Ban đầu, nó đƣợc phát triển cho cao huyết áp và bệnh thiếu máu cục bộ Tuy nhiên, hiện nay nó đƣợc sử dụng nhiều để điều trị rối loạn cương dương [35] Hình 3.1 và 3.2 là các ứng dụng của đa dƣợc lý mạng:
Hình 3.1: Các ứng dụng của đa dƣợc lý mạng
Xác định đích phân tử mới
Sàng lọc và tìm kiếm thuốc
Cá thể hóa điều Hiệu lực trên trị đích/ngoài đích Tiên lƣợng và tỷ lệ sống của bệnh nhân
Copyright © School of Medicine and Pharmacy, VNU
Hình 3.2: Ứng dụng của đa dƣợc lý mạng trong tìm kiếm thuốc mới
Phân tích một số ví dụ về ứng dụng của đa dƣợc lý mạng trong nghiên cứu đích phân tử liên quan đến ung thƣ
Đa dƣợc lý mạng đã đƣợc ứng dụng nhiều trong tìm kiếm đích phân tử trong các bệnh phức tạp, đặc biệt là ung thƣ Để đƣa tới cái nhìn thực tế hơn, chúng tôi xin phân tích một số ví dụ về ứng dụng của nghiên cứu đa dƣợc lý mạng trong tìm kiếm đích phân tử liên quan đến ung thƣ tiêu biểu mới công bố
3.3.1 Ví dụ 1 Xác định gen đích ung thư vú bằng mạng tương tác PPIN
Nghiên cứu cứu đƣợc công bố bởi nhóm tác giả Bafna, Divya Isaac và Arnold Emerson, đăng trên tạp chí International Journal of Cancer Research, tập 13, số 2, năm 2017 [5]
Ung thư vú thường bắt đầu từ các tuyến sản xuất sữa hoặc các ống dẫn, các đoạn dẫn sữa từ các thùy đến núm vú Đa đƣợc lý mạng đã đƣợc ứng dụng để tìm đích phân tử trong nghiên cứu điều trị ung thư hướng đích
Mạng lưới tương tác protein-protein được xây dựng, sử dụng Network Analyzer để phân tích mạng Các gen gây ra ung thƣ vú đƣợc lấy từ CSDL KEGG đƣợc sử dụng để xây dựng mạng con ung thƣ vú (breast cancer subnetwork) Mạng đƣợc phân tích dựa trên các giá trị hệ số phân cụm (C-
Copyright © School of Medicine and Pharmacy, VNU clustering coefficient) và giá trị độ dài đường đi ngắn nhất (L-shortest path leght) Để xác định độ mạnh của mạng, phân tích xóa (deletion annalysis) đƣợc thực hiện cho mạng con 10 gen đầu có giá trị cao nhất của trung tâm (hub), độ trung tâm ở giữa (betweenness centrality) và độ trung tâm dựa trên sự gần gũi (closeness centralityt) đƣợc sử dụng trong phân tích xóa
Betweenness centrality đƣợc chọn làm tham số chính Số đột biến của các gen liên quan đƣợc lấy từ dbSNP và các gen bị đột biến nhiều đƣợc xác định bằng cách sử dụng giá trị điểm z (z-score) Mục đích của nghiên cứu này là phân tích các gen gây ung thư vú bằng cách sử dụng mạng tương tác protein- protein và xác định các gen đích tiềm năng chịu trách nhiệm cho sự tiến triển của bệnh
Các tương tác được lấy từ BioGRID Cytoscape (3.4.0) được sử dụng để xây dựng mạng tương tác protein Các gen tham gia vào con đường gây ung thƣ vú đƣợc lấy từ KEGG disease Có 130 gen liên quan đến cơ chế ung thƣ vú Sử dụng CSDL dbSNP để xác định các gen liên quan đến cơ chế ung thƣ vú Các đột biến gen đƣợc chuẩn hóa với chiều dài gen bằng cách chia số đột biến gen với chiều dài tương ứng của nó
Các gen đột biến có ý nghĩa thống kê (p ≤ 0,05) đƣợc đánh giá bằng cách sử dụng các giá trị z-score của số đột biến gen
Trong đó X là số đột biến chuẩn hóa cho gen, μ là mức trung bình của điểm chuẩn và σ là độ lệch chuẩn tương ứng
Mạng tương tác có chứa 19634 nút và 270970 cạnh như trong hình 3.3
Các nút được biểu thị bằng màu xanh dương trong khi các cạnh có màu xám
Số lƣợng gen thu đƣợc là 130 và sau đó sử dụng cytoscape (3.4.0) để xây
Copyright © School of Medicine and Pharmacy, VNU dựng mạng con của các protein ung thƣ vú nhƣ trong hình 3.3b Mạng con ung thƣ vú chứa 130 nút và 1538 cạnh
Hình 3.3: Mạng PPIN của ung thƣ vú
(a) Mạng PPIN, (b) Mạng con PPIN của ung thƣ vú
Các thông số mạng cơ bản đƣợc tính bằng Network Analyzer Trong mạng con độ dài đường đi ngắn nhất (L) là 2,85 và hệ số phân cụm (C) 0,286
Trong phân tích xóa, 10 giá trị cao nhất của các hub, betweenness centrality và closeness centrality đƣợc tính Khi xóa các gen có số lƣợng các hub cao nhất, chiều dài đường đi ngắn nhất là 4,177 và hệ số phân cụm là 0,188 Từ kết quả trên, giá trị của L đƣợc tìm thấy tăng lên trong khi giá trị của C bị giảm Do đó, kết quả cho thấy rằng các hub đóng một vai trò quan trọng trong sự bền vững của mạng Các gen có 10 giá trị closeness centrality cao nhất bị xóa và các thông số là 3,547 cho L và 0,251 đối với C Các giá trị này không bị lệch nhiều so với các thông số mạng con của ung thƣ vú nhƣng giá trị L lại tăng lên
Sau đó, xóa đi các gen có 10 giá trị betweennes centrality cao nhất thì L là 3.195 và C là 0.187 So với phân tích mạng con ung thƣ vú thì giá trị C là thấp hơn trong khi giá trị L lại cao hơn
Sau đó, betweenness centrality là thông số đƣợc chọn để so sánh các gen là hệ số phân cụm thấp hơn (hình 3.4) và đường đi ngắn nhất cao hơn
Copyright © School of Medicine and Pharmacy, VNU
(hình 3.5) tương ứng khi các gen có 10 betweenness centrality cao nhất bị xóa so với các gen có 10 closeness centrality cao nhất bị xóa
Hình 3.4: Giá trị hệ số phân cụm của mạng con ung thƣ vú khi xóa 10 gen có giá trị hub, betweenness và closenness
Hình 3.5: Giá trị đường đi ngắn nhất của mạng con ung thư vú khi xóa
10 gen có giá trị hub, betweenness và closenness
Các SNPs cho tất cả các gen liên quan đến mạng con ung thƣ vú đã đƣợc thu thập và chuẩn hóa dựa trên chiều dài gen Các gen trung tâm có ý nghĩa thống kê đƣợc xác định bằng cách sử dụng hàm z-score đại diện cho 10 gen đầu có giá trị betweenness centrality cao nhất và giá trị z-score tương ứng của chúng đƣợc biểu diễn trong hình 3.6 Trong số 10 gen, hai gen có điểm z dương các giá trị được chọn và ID của gen trong NCBI của chúng được tìm thấy là 4851 (họ NOTCH của các protein) và 1956 (họ EGFR)
Copyright © School of Medicine and Pharmacy, VNU
Hình 3.6: Các giá trị đột biến có ý nghĩa thống kê của gen có betweenness centraility cao nhất BÀN LUẬN
Mạng lưới tương tác protein-protein của các protein ung thư vú được xây dựng từ cơ sở dữ liệu KEGG pathway Xóa nút hoặc xóa gen trong một mạng có thể giúp hiểu đƣợc sự bền vững của mạng Khi 10 gen trung tâm lớn nhất bị loại bỏ, chiều dài đường đi ngắn nhất tăng cũng như hệ số phân cụm giảm Phân tích xóa cho thấy rằng các gen có liên quan rất lớn đến cơ chế ung thƣ khi loại bỏ các gen trung tâm
Nghiên cứu kết luận rằng nhóm protein NOTCH-1 và protein EGFR là đích hiệu quả nhất để phát triển thuốc phá hủy mạng con tương tác protein- protein trong ung thƣ vú Những gen này có giá trị betweenness centrality cao Betweenness centrality biểu thị tính trung tâm của protein trong mạng
Nó đã được chứng minh rằng các đỉnh kết nối cao trong các mạng tương tác protein thường có chức năng quan trọng và việc xóa các đỉnh đó có liên quan đến khả năng gây chết Hai gen này có giá trị hệ số phân cụm tương đối thấp và chiều dài đường đi ngắn nhất cao trong phân tích xóa của chúng Để có thêm độ chính xác của các protein đƣợc nhắm đích từ các protein có 10 betweenness centrality cao nhất, các giá trị đột biến có ý nghĩa dương tính đƣợc tính đến Phân tích mạng cũng có thể đƣợc sử dụng để suy ra các chức
Copyright © School of Medicine and Pharmacy, VNU năng mới, để định lƣợng tầm quan trọng vị trí của protein trong một con đường bệnh sinh Đích NOTCH có thể có giá trị điều trị trong ung thƣ vú Một đánh giá gần đây cho thấy rằng các con đường NOTCH truyền tin đóng một vai trò quan trọng trong phát triển và tiến triển của ung thƣ vú Các thụ thể EGFR đã được nghiên cứu rộng rãi trong ung thư vú Các yếu tố tăng trưởng như EGFR, c-kit hoặc đột biến p53 và một số cơ chế tăng sinh nhƣ kinase protein (MAPK) và các thành phần protein kinase của ERK là yếu tố quyết định hóa trị liệu trong TNBC (triple-negative breast cancer: ung thƣ vú bộ ba âm tính)
Ung thƣ vú bộ ba âm tính gắn liền với biểu hiện EGFR
3.3.2 Ví dụ 2: Xác định các gen đích điều trị mới và cơ chế trong ung thư tuyến tụy bằng phân tích tổng hợp
Nghiên cứu đƣợc công bố bởi nhóm tác giả Mohammad Saberi Anvar, Zarrin Minuchehr, Mohsen Shahlaei, Samira Kheitan, đăng trên tạp chí
Biochemistry and biophysics Reports, tập 13, năm 2018 [3]
Ung thƣ tuyến tụy là nguyên nhân thứ 4 gây tử vong do ung thƣ trên thế giới Mặc dù đã đạt đƣợc những tiến bộ đáng kể, việc chẩn đoán và quản lý ung thƣ tuyến tụy vẫn còn nhiều thách thức Gần đây, những nghiên cứu sử dụng microarray để xác định các gen hoặc gen có khả năng liên quan đến ung thƣ tuyến tụy bằng cách sử dụng microarray để phân tích các gen có biểu hiện khác thường (DEG-differentially expressed gene) để xác định các đích điều trị tiềm năng cho ung thƣ tuyến tụy
XÂY DỰNG MẠNG TƯƠNG TÁC
Thu thập dữ liệu microarray :
Bộ dữ liệu về microarry đƣợc lấy từ CSDL GEO (Gene Expression
Omnibus) của NCBI (National Center for Biotechnology Information) Các dữ liệu được chọn theo quy tắc: các mẫu phải là mô ung thư tuyến tụy người; kích thước mẫu phải lớn hơn 5 mẫu; bệnh nhân không được điều trị đặc biệt, bao gồm xạ trị và hóa trị; và loại nghiên cứu của tập dữ liệu là nghiên cứu biểu hiện
Copyright © School of Medicine and Pharmacy, VNU
Phân tích các gen biểu hiện khác thường (DEG-Differentially expressed genes):