1. Trang chủ
  2. » Luận Văn - Báo Cáo

trần ngân hà tổng quan về mối liên quan cấu trúc protein phối tử và ứng dụng trí tuệ nhân tạo ai trong nghiên cứu cấu trúc protein phối tử

59 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Tổng quan về mối liên quan cấu trúc protein – phối tử và ứng dụng trí tuệ nhân tạo (AI) trong nghiên cứu cấu trúc protein – phối tử
Tác giả Trần Ngân Hà
Người hướng dẫn PGS. TS. Nguyễn Thị Lập, ThS. Dương Thị Hồng Nhung
Trường học Trường Đại học Dược Hà Nội
Chuyên ngành Dược Sĩ
Thể loại Khóa luận tốt nghiệp
Năm xuất bản 2024
Thành phố Hà Nội
Định dạng
Số trang 59
Dung lượng 3,69 MB

Cấu trúc

  • 1. MỐI LIÊN QUAN CẤU TRÚC GIỮA PROTEIN-PHỐI TỬ (10)
    • 1.1. Protein, phối tử và một số yếu tố liên quan (10)
      • 1.1.1 Protein (10)
      • 1.1.2. Phối tử (10)
      • 1.1.3. Cơ chế của tương tác protein-phối tử (11)
      • 1.1.4. Nhiệt động lực học của tương tác protein-phối tử (12)
    • 1.2 Tương tác Protein - phối tử (14)
      • 1.2.1. Vị trí liên kết (14)
      • 1.2.2. Hướng liên kết (15)
      • 1.2.3. Ái lực liên kết (16)
  • 2. ỨNG DỤNG TRÍ TUỆ NHÂN TẠO (AI) TRONG NGHIÊN CỨU CẤU TRÚC (18)
    • 2.1. Hạn chế của các phương pháp truyền thống trong việc dự đoán cấu trúc protein- phối tử (18)
    • 2.2. Dự đoán vị trí liên kết (19)
      • 2.2.1. Dự đoán cấu trúc 3D của protein (20)
      • 2.2.2. Các công cụ AI chuyên biệt để dự đoán vị trí liên kết (22)
    • 2.3. Dự đoán hướng liên kết (24)
    • 2.4. Dự đoán ái lực liên kết (28)
    • 2.5. Tích hợp AI để nâng cao hiệu quả của Mô phỏng động lực học phân tử (31)
      • 2.5.1. Về Mô phỏng động lực học phân tử (31)
      • 2.5.2. Tích hợp AI và Mô phỏng động lực học phân tử (34)
  • 3. BÀN LUẬN (38)
    • 3.1 Tương tác Phối tử-Protein (38)
    • 3.2. Các ứng dụng của AI (39)
      • 3.2.1. Trong dự đoán vị trí liên kết (39)
      • 3.2.2. Trong dự đoán hướng liên kết (40)
      • 3.2.3. Trong dự đoán ái lực liên kết (41)
      • 3.2.4. Tích hợp AI với các Mô phỏng động lực học phân tử (42)
    • 3.3. Tác động của AI lên khám phá thuốc và những hạn chế của chúng (43)
      • 3.3.1. Tác động của các công cụ AI lên khám phá thuốc (43)
      • 3.3.2. Hạn chế của các công cụ AI (44)

Nội dung

Phối tử là một phân tử, ion, hoặc nhóm có khả năng liên kết với một vị trí cụ thể trên protein hoặc ion kim loại thông qua các tương tác hóa học như liên kết ion, liên kết cộng hóa trị,

MỐI LIÊN QUAN CẤU TRÚC GIỮA PROTEIN-PHỐI TỬ

Protein, phối tử và một số yếu tố liên quan

Protein là thành phần gồm một hoặc nhiều chuỗi polypeptide và đóng vai trò quan trọng trong các hoạt động sinh học của sinh vật Chúng tham gia vào nhiều chức năng như sao chép DNA, vận chuyển các phân tử, xúc tác các phản ứng trao đổi chất và hỗ trợ cấu trúc tế bào Protein được phân loại dựa trên mức độ tổ chức cấu trúc, bao gồm bậc một, bậc hai, bậc ba và thậm chí bậc bốn đối với một số protein Cấu trúc bậc một được xác định bởi trình tự các axit amin cấu tạo nên protein.

Quá trình gấp protein diễn ra trong một ngăn tế bào gọi là lưới nội chất Quá trình này rất quan trọng vì protein cần phải được gấp đúng cách thành các hình dạng ba chiều cụ thể để hoạt động hiệu quả [19] Quá trình gấp protein là một quá trình tinh vi bị ảnh hưởng bởi nhiều yếu tố bên ngoài như các trường điện và từ, nhiệt độ, pH, hóa chất, hạn chế không gian và mật độ phân tử, tất cả đều ảnh hưởng đến khả năng gấp của protein vào các cấu hình chức năng của chúng [27] Các điều kiện cực đoan như nhiệt độ quá cao hoặc quá thấp có thể làm mất ổn định protein, khiến chúng bị tháo gỡ hoặc biến tính [97] Tương tự, mức pH bất thường, lực cơ học và các chất làm biến tính hóa học có thể dẫn đến sự biến tính protein Trong trạng thái này, protein mất đi cấu trúc bậc hai và bậc ba và chuyển sang cấu hình dạng cuộn ngẫu nhiên Mặc dù biến tính thường không thể đảo ngược, nhưng một số protein có thể gấp lại và lấy lại chức năng dưới các điều kiện thích hợp

Protein liên kết với các phân tử khác (phối tử) để thực hiện chức năng của chúng Phối tử có thể bao gồm các phân tử hữu cơ, vô cơ, axit nucleic, ion kim loại hoặc các protein khác Phối tử đóng vai trò quan trọng trong truyền tín hiệu tế bào, phản ứng enzyme và điều hòa sinh học Trong bối cảnh y tế, phối tử ức chế và vô hiệu hóa được đặc biệt quan tâm.

1.1.3 Cơ chế của tương tác protein-phối tử

Hình 1: Sơ đồ giải thích các cách kết hợp của phối tử và protein

Hình 1: Sơ đồ giải thích các cách kết hợp của phối tử và protein (a) Mô hình chìa khoá - ổ khoá (lock-and-key model) (b) Mô hình khớp cảm ứng (induced-fit model)

(c) Mô hình lựa chọn cấu hình (conformational selection) [121]

Cơ chế của liên kết giữa phối tử và protein có thể được mô tả thông qua 3 mô hình chính: “chìa khoá-ổ khoá” , “khớp cảm ứng”, và “lựa chọn cấu hình” Mô hình chìa khoá-ổ khoá (Hình 1a) cho rằng cả phối tử và protein đều cứng ngắc và liên kết giữa chúng phải chính xác và vừa khít như chìa khoá và ổ khoá [32] Tuy nhiên, rất nhiều bằng chứng cho thấy các phối tử liên kết với protein ngay cả khi hình dạng ban đầu của chúng không vừa vặn, tạo ra mô hình khớp cảm ứng (Hình 1b) Mô hình này cho rằng vị trí liên kết của protein với phối tử là linh hoạt, và chúng có thể tự điều chỉnh hình dạng ở vị trí liên kết sao cho tạo ra được hình dạng phù hợp để liên kết với phối tử [66]

Trong khi đó, mô hình lựa chọn cấu hình (Hình 1c) giới thiệu một góc nhìn linh động hơn Mô hình này lập luận rằng protein không tồn tại dưới dạng một cấu trúc đơn lẻ, cứng nhắc mà là một tập hợp của các cấu hình với các tỷ lệ khác nhau ở thời điểm cân bằng do chịu ảnh hưởng bởi bối cảnh năng lượng tự do (free energy landscape) [14, 87,

36, 47] Do đó, phối tử có thể liên kết có chọn lọc với cấu hình phù hợp nhất, làm dịch chuyển trạng thái cân bằng về phía hình dạng này Mô hình lựa chọn cấu hình xem xét tính linh hoạt và bản chất động của protein, vốn không tĩnh mà dao động giữa các trạng thái khác nhau [94]

Thú vị là trong khuôn khổ của bối cảnh năng lượng tự do, mô hình chìa khoá-ổ khoá có thể coi là một trường hợp đặc biệt của mô hình lựa chọn cấu hình [9, 76], do những protein cứng nhắc thường có một bối cảnh năng lượng tự do mượt mà, dẫn đến chỉ có một cấu hình duy nhất có mức năng lượng cực tiểu Ngược lại, các protein linh hoạt có nhiều điểm cực tiểu, mỗi điểm hỗ trợ cho một cấu hình khác nhau và phối tử sẽ lựa chọn điểm cực tiểu phù hợp nhất trong số các điểm cực tiểu này để liên kết Ngoài ra, mô hình khớp cảm ứng là một bước quan trọng trong quá trình lựa chọn cấu hình, do chúng có thể đẩy nhanh quá trình dịch chuyển trạng thái cân bằng nhờ thay đổi hình dạng ở vị trí liên kết, giúp tối ưu hoá quá trình lựa chọn cấu hình của phối tử [125, 93] Nussinov và cộng sự đã nêu bật sự khác biệt chính giữa những mô hình này, đó là đối tượng được lựa chọn Trong khi ở mô hình lựa chọn cấu hình và khớp cảm ứng, đối tượng được lựa chọn là cấu hình phù hợp trong vô vàn cấu hình của một protein, thì ở mô hình chìa khoá-ổ khoá, đối tượng được lựa chọn là các protein khác nhau trong một tế bào [94]

1.1.4 Nhiệt động lực học của tương tác protein-phối tử

Cần phải có hiểu biết về cơ chế lý hoá của tương tác protein-phối tử để hiểu sâu hơn về nhận dạng phân tử giữa protein và phối tử của nó, bắt đầu từ động học liên kết, các khái niệm về năng lượng tự do Gibbs (∆G) và mối quan hệ của chúng với quá trình liên kết giữa phối tử và protein

- Động học liên kết protein-phối tử Động học liên kết protein-phối tử giải thích cơ chế tạo nên sự tương tác giữa protein và phối tử, đặc biệt nhấn mạnh vào tốc độ hai phân tử này gắn với nhau Trong dung dịch, khi một phân tử protein P có ái lực liên kết với một phân tử phối tử L, mối quan hệ phụ thuộc thời gian của chúng có thể được biểu diễn dưới dạng phương trình (1):

𝑘 !## 𝑃𝐿 (1) trong đó PL biểu thị phức hợp phối tử-protein, kon và koff lần lượt biểu thị hằng số tốc độ động học tương ứng cho phản ứng thuận và phản ứng nghịch (phản ứng phân ly) Khi ở trạng thái cân bằng, phương trình (2) được biểu diễn là: kon[P][L] = koff[PL] (2)

Từ đó, hằng số liên kết Kb được định nghĩa là (phương trình 3):

+ $ (3) trong đó Kd được định nghĩa là hằng số phân ly Do đó, tốc độ liên kết nhanh kết hợp với tốc độ phân ly dần dần sẽ tạo ra hằng số liên kết/phân ly cao/thấp, cho thấy ái lực liên kết mạnh [28]

- Năng lượng tự do Gibbs (∆G)

Hệ dung môi-phối tử protein là một hệ nhiệt động bao gồm chất tan (gồm protein và phối tử) và dung môi (gồm nước và ion đệm) Hệ này đặc trưng bởi các tương tác phức tạp và sự thay đổi năng lượng của các thành phần trong nó, dựa trên nguyên lý nhiệt động học Động lực quyết định sự liên kết giữa protein và phối tử là kết quả tổng hợp của nhiều tương tác và trao đổi năng lượng khác nhau giữa protein, phối tử, nước và các ion đệm Đơn vị đo quan trọng của động lực học này là năng lượng tự do Gibbs (∆G), một năng lượng tiềm ẩn cho biết công tối đa mà một hệ thống có thể thực hiện dưới các điều kiện nhiệt độ và áp suất không đổi (đẳng nhiệt, đẳng áp) [40, 39]

Trong liên kết protein-phối tử, quá trình này chỉ diễn ra tự phát nếu sự thay đổi năng lượng tự do Gibbs (ΔG) là âm, biểu thị trạng thái cân bằng đang diễn ra ở áp suất và nhiệt độ không đổi Độ lớn của ΔG âm này tương quan trực tiếp với tính ổn định của phức hợp phối tử protein và cho thấy ái lực liên kết của phối tử với thụ thể của nó Quan trọng hơn, ΔG chỉ được quyết định bởi trạng thái ban đầu và cuối cùng của hệ thống, không phụ thuộc vào trung gian giữa các trạng thái này ΔG được tính dựa vào các thành phần của nó là enthaphy (ΔH) và entropy (ΔS) thông qua phương trình cơ bản (4) là:

∆G = ∆H - T∆S (4) trong đó ∆H và ∆S lần lượt là sự thay đổi enthapy và entropy của hệ khi liên kết phối tử và T là nhiệt độ tính bằng Kelvin

Enthalpy là thước đo tổng năng lượng của một hệ thống nhiệt động học, tức là tổng năng lượng nội tại của chất tan và dung môi và lượng năng lượng cần thiết để tạo không gian cho hệ (được tính bằng tích của thể tích và áp suất) Đối với một quá trình liên kết,

Tương tác Protein - phối tử

Vị trí liên kết (binding site) là một vị trí cụ thể trên bề mặt protein nơi các phân tử phối tử có thể gắn kết thông qua các tương tác hóa học Đây là nơi diễn ra các tương tác giữa protein và phối tử, đóng vai trò quan trọng trong việc điều hòa hoạt động sinh học của protein [44] Các vị trí liên kết, còn được gọi là các túi liên kết, thường là các vết lõm trên bề mặt protein Một số vị trí liên kết phối tử được tìm thấy trong các túi lớn, sâu trên bề mặt protein [113, 128], trong khi một số khác có thể tồn tại ở các khe nông, lộ ra ngoài [38, 67] Hầu hết các thuốc phân tử nhỏ phát huy tác dụng trong cơ thể thông qua mô hình khóa-chìa cổ điển, trong đó các thuốc hoạt động như các chất nền và liên kết với các túi để ức chế hoặc kích hoạt các chức năng protein cụ thể Việc xác định các protein chính có chức năng sinh hóa có liên quan rõ ràng đến bệnh là rất quan trọng Các protein như vậy trở thành mục tiêu cho phát triển thuốc [51] Để làm rõ hơn khái niệm về vị trí liên kết phối tử, chúng ta xem xét một ví dụ về neuraminidase, một protein của virus cúm đã được nghiên cứu rộng rãi do tiềm năng của nó như một mục tiêu thuốc Neuraminidase thường được coi là một mục tiêu thuốc tốt do khả năng phá vỡ chu kỳ sống của virus Đáng tiếc là virus cúm rất giỏi tạo ra các biến thể kháng thuốc, dẫn đến nhu cầu phát triển liên tục các loại thuốc mới Một trong những loại thuốc được phát triển là peramivir, còn được biết đến với tên gọi BCX-1812

Về cấu trúc, peramivir ức chế neuraminidase (Hình 2a) bằng cách hình thành nhiều tương tác tĩnh điện bao gồm cầu muối và liên kết hydro [112] Khi quan sát đơn vị protein, có thể tìm thấy 11 liên kết hydro giữ peramivir tại chỗ, làm tăng đáng kể ái lực liên kết của hợp chất thông qua các tác động enthalpy lên hệ (Hình 2b và c) [15, 114,

Hình 2: Vị trí liên kết giữa protein và phối tử được minh họa thông qua tương tác giữa neuraminidase và peramivir

Hình 2: Vị trí liên kết giữa protein và phối tử được minh họa thông qua tương tác giữa neuraminidase và peramivir [23] (a) Đơn phân tử neuraminidase với peramivir được hiển thị bằng màu đỏ (b) Hình ảnh của toàn bộ đơn phân tử với peramivir với các cặp liên kết hydro được gán nhãn và hiển thị bằng màu nguyên tử chuẩn Oxy được tô màu đỏ, và nitơ được tô màu xanh lam (c) Hình ảnh tập trung vào các liên kết hydro giữa neuraminidase và peramivir, mã PDB 1L7F

Hướng liên kết (binding pose) là sự định hướng và vị trí cụ thể của phối tử khi nó liên kết với vị trí liên kết trên protein Nó mô tả chi tiết cách các nguyên tử của phối tử và protein tương tác với nhau trong không gian ba chiều (3D) [23] Đây là một khía cạnh quan trọng trong nghiên cứu tương tác giữa protein và phối tử, ảnh hưởng trực tiếp đến hiệu quả và độ đặc hiệu của tương tác sinh học

Hình 3 minh họa hướng liên kết protein-phối tử với ví dụ về virus sử dụng dynamin để xâm nhập tế bào chủ Theo đó, các chất tương tự pyrimidine được gắn vào vùng tương đồng Pleckstrin của dynamin, cho thấy hướng liên kết có thể thay đổi dựa trên cấu trúc phối tử Sự phức tạp này đặt ra thách thức trong việc dự đoán chính xác hướng liên kết, góp phần vào sự phát triển các loại thuốc nhắm mục tiêu dynamin.

Hình 3: Dự đoán in silico của hai chất ức chế tương tự nhau được docking vào vị trí liên kết-2 của miền PH của dynamin-1 ở người

Các chất ức chế tương tự được dự đoán bằng in silico liên kết tại vị trí liên kết-2 của vùng tương đồng Pleckstrin của dynamin-1 ở người Mặc dù cả hai chất ức chế đều có các lực tương tác liên phân tử tương tự, chẳng hạn như liên kết hydro, nhưng hướng của chúng có một số khác biệt nhỏ.

1.2.3 Ái lực liên kết Để các phối tử có thể thực hiện chức năng của chúng, chúng cần phải tương thích với các vị trí liên kết mục tiêu trong không gian, nhằm tránh xung đột không gian nguyên tử Đồng thời, chúng nên liên kết chặt chẽ với các vị trí liên kết thông qua các tương tác mạnh mẽ để ngăn chặn sự ảnh hưởng của chuyển động nhiệt, tức là chúng cần có ái lực cao Mức độ hấp dẫn giữa một thụ thể (ví dụ, protein) và đối tác liên kết của nó (ví dụ, thuốc hoặc chất ức chế) được đo bằng ái lực liên kết [23] Ái lực liên kết cho thấy độ mạnh của tương tác giữa protein và phối tử, được biểu thị qua hằng số phân ly (Kd) hoặc năng lượng liên kết tự do (∆G) Kd càng nhỏ thì ái lực càng lớn, trong khi đó ∆G càng âm thì liên kết càng mạnh [28]

Hoạt tính nội tại của một loại thuốc đề cập đến khả năng của nó trong việc tạo ra các hiệu ứng dược lý sau khi liên kết với thụ thể của nó Các loại thuốc có thể được chia thành hai loại: chất chủ vận (agonists) và chất đối kháng (antagonists) [63, 83, 45] Chất chủ vận là các loại thuốc có ái lực liên kết và hoạt tính nội tại, chúng liên kết với các thụ thể và kích thích chúng để tạo ra các hiệu ứng Dựa vào hoạt tính nội tại của chúng, chất chủ vận có thể được chia thành chất chủ vận toàn phần (complete agonists) và chất chủ vận một phần (partial agonists) Chất chủ vận toàn phần có ái lực liên kết mạnh và hoạt tính nội tại mạnh, chẳng hạn như morphine Chất chủ vận một phần có ái lực liên kết mạnh nhưng hoạt tính nội tại yếu, chẳng hạn như pentazosin Chất đối kháng liên kết với các thụ thể với ái lực liên kết mạnh nhưng không có hoạt tính nội tại Bản thân chúng không có hiệu ứng, nhưng tạo ra hiệu ứng đối kháng đối với các chất chủ vận bằng cách chiếm các vị trí liên kết của chúng, chẳng hạn như naloxone và propranolol

Cả chất chủ vận và chất đối kháng đều phải có khả năng liên kết chặt chẽ với các protein mục tiêu, nghĩa là chúng phải có ái lực liên kết cao Do đó, bước đầu tiên trong quá trình phát hiện thuốc là xác định các phối tử nhỏ có ái lực liên kết cao với protein mục tiêu, sau đó có thể được sàng lọc và tối ưu hóa để xác định các hợp chất dẫn đầu [37, 64, 41]

Ngoài ái lực liên kết cao, các phối tử ứng viên phải liên kết với protein mục tiêu với độ đặc hiệu cao, có nghĩa là chúng chỉ nên nhắm đến một hoặc rất ít protein để tránh tấn công các protein chức năng bình thường, có thể gây ra tác dụng phụ của thuốc [31, 89, 92] Để đạt được điều này, cần phải tính toán ái lực liên kết của hàng ngàn phối tử với một protein mục tiêu và một số phân tử ứng viên có ái lực liên kết với nhiều protein khi sàng lọc thuốc Quá trình này đòi hỏi một khối lượng công việc tính toán đáng kể.

ỨNG DỤNG TRÍ TUỆ NHÂN TẠO (AI) TRONG NGHIÊN CỨU CẤU TRÚC

Hạn chế của các phương pháp truyền thống trong việc dự đoán cấu trúc protein- phối tử

2.1 Hạn chế của các phương pháp truyền thống trong việc dự đoán cấu trúc protein - phối tử

Dự đoán tương tác giữa protein và phối tử đóng một vai trò quan trọng trong thiết kế thuốc, giúp xác định và tối ưu hóa các phối tử có thể liên kết hiệu quả với các mục tiêu thuốc Do đó, nhiều phương pháp đã được áp dụng để giải quyết nhu cầu này Các phương pháp truyền thống nhất là các phương pháp thực nghiệm, nổi bật nhất là tinh thể học tia X (X-ray crystallography), phổ cộng hưởng từ hạt nhân (NMR spectroscopy), kính hiển vi điện tử lạnh (cryo-electron microscopy - Cryo-EM), cộng hưởng plasmon bề mặt (surface plasmon resonance - SPR) và đo nhiệt lượng chuẩn độ đẳng nhiệt (isothermal titration calorimetry - ITC) Tinh thể học tia X cung cấp hình ảnh tĩnh độ phân giải cao của các phức hợp protein-phối tử nhưng đòi hỏi các tinh thể chất lượng cao, điều này khó khăn đối với nhiều protein [138] Phổ NMR cung cấp thông tin động về protein trong dung dịch, đi sâu vào sự liên kết phối tử và những thay đổi cấu hình, nhưng bị giới hạn đối với các protein nhỏ [131] Cryo-EM cho phép quan sát các phức hợp protein lớn và protein màng mà không cần kết tinh, tuy nhiên đòi hỏi thiết bị và chuyên môn phức tạp [104] SPR và ITC rất hữu ích trong việc nghiên cứu động học và nhiệt động học của sự liên kết, nhưng có những hạn chế liên quan đến chuẩn bị mẫu và yêu cầu lượng lớn protein và phối tử [101, 49] Các phương pháp truyền thống này gặp phải nhiều hạn chế đáng kể, làm nổi bật nhu cầu về các phương pháp mới Những thách thức chính bao gồm tính chất tốn kém của các kỹ thuật này, khó khăn trong việc nghiên cứu một số loại protein (chẳng hạn như các phức hợp lớn hoặc protein màng), và khả năng hạn chế trong việc nắm bắt đầy đủ động học của tương tác protein-phối tử Hơn nữa, các phương pháp này thường yêu cầu chuyên môn đáng kể để thực hiện và giải thích, và thông lượng của chúng không đủ cho các nghiên cứu quy mô lớn

Mô hình hóa phân tử có vai trò nhất định trong lĩnh vực nghiên cứu dược lý, tuy nhiên vẫn còn những hạn chế Đối với ghép phân tử, mặc dù có khả năng dự đoán vị trí liên kết tối ưu của phối tử, nhưng vẫn gặp phải độ chính xác thấp trong dự đoán ái lực liên kết do các hàm tính điểm không hoàn toàn chính xác Mặt khác, mô phỏng động lực học phân tử đòi hỏi nguồn tính toán lớn và thời gian chạy dài để mô phỏng chính xác chuyển động theo thời gian, đồng thời phụ thuộc nhiều vào độ chính xác của các trường lực được sử dụng để mô hình hóa tương tác Những yếu tố này có thể không phản ánh đúng bản chất của quá trình sinh hóa trong môi trường tế bào.

Những hạn chế này làm nổi bật nhu cầu về các phương pháp trí tuệ nhân tạo (AI), vốn có tiềm năng phân tích các tập dữ liệu lớn một cách hiệu quả để nhận diện các mô hình phức tạp và dự đoán tương tác với độ chính xác cao Các phương pháp dựa trên AI có thể tích hợp nhiều loại dữ liệu khác nhau và cung cấp những hiểu biết toàn diện về sự liên kết phối tử và tăng tốc quá trình khám phá thuốc Bằng cách khắc phục những hạn chế của các phương pháp truyền thống, AI có tiềm năng thúc đẩy đáng kể sự hiểu biết của chúng ta về các tương tác protein-phối tử và ứng dụng của chúng trong nghiên cứu y sinh.

Dự đoán vị trí liên kết

Dự đoán chính xác vị trí liên kết protein-phối tử từ cấu trúc protein 3D đóng vai trò quan trọng trong thiết kế thuốc dựa trên cấu trúc Bằng cách dự đoán chính xác này, các nhà nghiên cứu có thể xác định được các tương tác giữa thuốc và protein mục tiêu, từ đó tối ưu hóa thiết kế thuốc để tăng cường tính hiệu quả và giảm tác dụng phụ Ngoài ra, việc dự đoán vị trí liên kết còn hỗ trợ trong việc hiểu rõ chức năng của protein, giúp nghiên cứu cơ chế hoạt động của các quá trình sinh học phức tạp.

Trong hai thập kỷ qua, nhiều phương pháp khác nhau để dự đoán vị trí liên kết đã được thiết lập, dựa trên (i) mẫu có sẵn, (ii) hàm năng lượng, (iii) hình học và (iv) AI

(i) Phương pháp dựa trên mẫu: Sử dụng các mẫu protein đã biết để dự đoán vị trí liên kết trên protein đầu vào, dựa trên giả định rằng các protein có cấu trúc tương tự có thể có chức năng tương tự Các phương pháp này thường không hiệu quả khi không có mẫu tốt [22]

(ii) Phương pháp dựa trên hàm năng lượng: Tìm các vùng có năng lượng thuận lợi trên bề mặt protein chứa các túi liên kết phối tử Protein được bao bọc trong một cấu trúc lưới và năng lượng tương tác tại mỗi điểm lưới được tính toán Các điểm tương tác sau đó được cụm lại để dự đoán vị trí các túi liên kết Tuy nhiên, phương pháp này có thể không phù hợp với lượng lớn dữ liệu và không tổng quát hóa tốt đến dữ liệu mới [23]

(iii) Phương pháp dựa trên hình học: Phân tích hình học của bề mặt phân tử để tìm các khoang bề mặt trên protein mục tiêu, có độ chính xác phụ thuộc lớn vào độ phân giải của lưới và hướng của protein trong hệ thống lưới [132, 80]

(iv) AI: Học từ dữ liệu hiện có và tổng quát hóa đến dữ liệu mới không tương tự với dữ liệu huấn luyện Học máy, đặc biệt là các phương pháp học sâu, có thể trực tiếp học một hàm tham số hóa từ một lượng lớn dữ liệu tích hợp nhiều nguồn thông tin, dẫn đến độ chính xác cao hơn trong việc dự đoán tương tác protein-phối tử Sự sẵn có ngày càng tăng của các cấu trúc protein có độ phân giải cao trong các cơ sở dữ liệu khác nhau đã mở ra các khả năng mới cho các ứng dụng của AI

Với những thế mạnh trên, AI đang là một công cụ đầy hứa hẹn giúp tăng tốc quá trình xác định vị trí liên kết giữa protein và phối tử Phần tiếp theo sẽ phân tích ứng dụng của

AI trong lĩnh vực này

2.2.1 Dự đoán cấu trúc 3D của protein

Mỗi acid amin có ảnh hưởng riêng biệt đến cấu trúc và chức năng của protein Ngay cả khi khoảng cách đo lường giữa hai acid amin trong một chuỗi protein là dài, khoảng cách không gian giữa chúng có thể ngắn do sự gấp nếp của protein [75, 53, 17] Kết quả là, các acid amin trong chuỗi mà xa về mặt tuần tự nhưng gần về mặt không gian cũng có thể có ảnh hưởng đáng kể đến vị trí của các acid amin liên kết Do đó, hiểu rõ cấu trúc 3D của protein là điều kiện tiên quyết quan trọng để mô hình hóa chính xác cách một phối tử gắn kết với protein

Cấu trúc của protein xác định hình dạng và môi trường hóa học của vị trí liên kết, điều này ảnh hưởng trực tiếp đến ái lực và độ đặc hiệu của các phối tử tiềm năng Dự đoán cấu trúc chính xác cung cấp những hiểu biết về các thay đổi cấu hình mà protein có thể trải qua khi gắn kết phối tử, điều này rất cần thiết để hiểu cơ chế tương tác và thiết kế các loại thuốc hiệu quả [137] Nếu chúng ta biết cấu trúc của một protein nhưng không biết vị trí liên kết của nó, chúng ta có thể tìm các vị trí liên kết trên protein đó bằng cách so sánh nó với khoảng 190.000 cấu trúc đã biết trong cơ sở dữ liệu PDB; các điểm tương đồng tìm thấy giữa cấu trúc đang nghiên cứu và những cấu trúc trong cơ sở dữ liệu thường trùng với các vị trí liên kết trên các protein đó, và nếu chức năng của các protein tương tự trong cơ sở dữ liệu đã biết, sự so sánh này cũng cho phép chúng ta dự đoán chức năng của các protein đang nghiên cứu [65]

Mặc dù vậy, dự đoán cấu trúc protein vẫn là một trong những nhiệm vụ thách thức nhất do sự phức tạp và biến đổi của các cấu trúc protein, chủ yếu xuất phát từ "vấn đề gấp protein" Vấn đề này trở nên phức tạp bởi số lượng lớn các cấu hình có thể có của một protein do bị ảnh hưởng bởi các tương tác vật lý-hóa học Ngoài ra, môi trường sinh học cũng có thể ảnh hưởng đến quá trình gấp và ổn định của protein Yêu cầu tính toán được để mô phỏng quá trình gấp protein một cách chính xác là rất lớn, thường vượt quá khả năng của các thuật toán truyền thống.

AI mở ra một hướng đi mới cho dự đoán cấu trúc protein Các mô hình AI trong quá trình gấp cuộn protein chủ yếu tập trung vào việc dự đoán cấu trúc protein từ chuỗi acid amin Các mô hình này học từ các cấu trúc protein đã biết (thu được từ các cơ sở dữ liệu như PDB) để dự đoán cấu trúc bậc ba của các protein mới Các kỹ thuật như học sâu (deep learning) đã chứng minh đặc biệt khéo léo trong việc mô hình hóa mối quan hệ không gian giữa các acid amin và các tính chất vật lý và hóa học quyết định các mẫu gấp cuộn, mở đường cho những tiến bộ trong dự đoán cấu trúc protein [1]

Các công cụ trí tuệ nhân tạo (AI) như Alphafold đã đánh dấu những tiến bộ đáng kể trong dự đoán cấu trúc protein trong lĩnh vực tin sinh học đang phát triển mạnh mẽ, mang lại tiềm năng biến đổi cho nghiên cứu khoa học và ứng dụng y tế AlphaFold có thể được coi là một trong những đột phá lớn khi dự đoán cấu trúc bậc ba của hầu hết các protein một cách khá chính xác bằng cách tích hợp các đặc điểm protein 1D, 2D và 3D [23] Alphafold2, phiên bản mới của Alphafold, được phát triển bởi DeepMind, sử dụng một kiến trúc học sâu (deep learning architecture) được gọi là transformer để dự đoán cấu trúc 3D của protein từ các chuỗi acid amin của chúng Mô hình này kết hợp những hiểu biết về vật lý và sinh học vào một hệ thống dự đoán khoảng cách và góc giữa các acid amin trong chuỗi protein, tạo ra một mô hình có độ chính xác cao về cấu trúc 3D của protein [56] Độ chính xác của Alphafold2 đã được chứng minh trong Cuộc Đánh Giá Quan Trọng

Về Dự Đoán Cấu Trúc Protein (Critical Assessment of Protein Structure Prediction - CASP) năm 2020, Alphafold2 đã đạt được độ chính xác chưa từng có, với điểm số Global Distance Test (GDT) trung bình >90/100 điểm, gần với độ chính xác của các cấu trúc được xác định thông qua các phương pháp thực nghiệm như tinh thể học tia X [56] Ngoài ra, độ chính xác của Alphafold2 so với các phương pháp thực nghiệm cũng được xác minh trong nhiều nghiên cứu, nổi bật là thí nghiệm của Fowler và Williamson, cho thấy Alphafold2 thường chính xác hơn các bộ dữ liệu NMR trong nhiều trường hợp [33]

AlphaFold2 đóng vai trò quan trọng trong việc dự đoán vị trí liên kết protein thông qua sự kết hợp với các phương pháp khác Khi kết hợp với Mô phỏng động lực học phân tử, AlphaFold2 xác định chính xác vị trí liên kết giữa PPM1D phosphatase và chất ức chế tương ứng Tương tự, sự hợp tác giữa AlphaFold2 và DynamicBind, một công cụ AI khác, đã giúp phát hiện vị trí liên kết tiềm ẩn giữa SETD2 và EZM0414.

AlphaFold2 không trực tiếp dự đoán vị trí liên kết, nhưng các dự đoán cấu trúc chính xác cao của nó hỗ trợ đáng kể trong quá trình này Bằng cách tạo ra các mô hình cấu trúc protein chính xác cao, AlphaFold2 cung cấp thông tin cấu trúc chi tiết quan trọng cho việc xác định các vị trí liên kết tiềm năng [7] Các nhà nghiên cứu có thể xem xét các cấu trúc được dự đoán để phân tích các đặc điểm bề mặt, chẳng hạn như các hốc và rãnh, là những vị trí điển hình cho sự liên kết của phối tử Thông qua mô hình đồng dạng, các dự đoán của AlphaFold2 có thể được so sánh với các cấu trúc protein đã biết có các vị trí liên kết đã được ghi nhận [11] Các cấu trúc tương tự thường có các vị trí liên kết tương tự, cho phép chuyển giao các giải thích về vị trí liên kết từ các protein đã biết sang các protein được dự đoán [65] Việc tích hợp AlphaFold2 với các công cụ khác còn nâng cao tính hữu ích của nó [11] Các cấu trúc chính xác được dự đoán bởi AlphaFold2 có thể làm điểm khởi đầu cho các nghiên cứu docking phân tử, nơi mà các mô phỏng docking dự đoán cách các phân tử nhỏ có thể liên kết với bề mặt protein, giúp xác định các vị trí liên kết Hơn nữa, các cấu trúc được dự đoán này có thể được sử dụng làm đầu vào cho các mô hình học máy được đào tạo cụ thể để xác định các vị trí liên kết, vì các mô hình này có thể phân tích các đặc điểm cấu trúc để dự đoán các vùng liên kết tiềm năng

Dự đoán hướng liên kết

Dự đoán hướng liên kết rất quan trọng trong việc hiểu cách một phối tử tương tác với protein mục tiêu của nó Hướng liên kết mô tả hướng và cấu dạng của phối tử trong vị trí liên kết của protein Dự đoán chính xác hướng liên kết là cần thiết cho thiết kế thuốc hợp lý, vì nó ảnh hưởng đến ái lực liên kết và do đó, ảnh hưởng đến hiệu quả của các hợp chất điều trị tiềm năng

Công cụ để dự đoán hướng liên kết phổ biến hiện nay là docking phân tử Trong mô hình docking phân tử, nhiều hướng liên kết được tạo ra bằng cách tính toán và sau đó được đánh giá bằng cách sử dụng một hàm tính điểm [4] Tuy nhiên, các phương pháp docking truyền thống thường gặp khó khăn về độ chính xác và hiệu quả, đặc biệt là khi dự đoán các hướng liên kết và ái lực cho các hợp chất mới Để giải quyết vấn đề này, các phương pháp mới đã được phát triển, mỗi phương pháp có các đặc điểm độc đáo để giải quyết vấn đề theo các cách khác nhau (Bảng 2)

Bảng 2: Đặc điểm của một số phương pháp học máy dựa trên docking

Công cụ Phương pháp Chức năng Điểm mạnh Đặc điểm độc đáo

Hàm đánh giá học sâu dựa trên mạng nơ-ron tích chập (CNN) Đánh giá lại các hướng được tạo bởi các phương pháp truyền thống

Nâng cao độ chính xác của việc đánh giá hướng

Tích hợp học sâu với các phương pháp docking truyền thống

Phương pháp dựa trên hồi quy

Dự đoán cấu hình phối tử- protein Đẩy nhanh quá trình docking

Dự đoán nhanh phù hợp cho sàng lọc thông lượng cao (high- throughput screening)

Phương pháp dựa trên hồi quy

Dự đoán cấu hình phối tử- protein Đẩy nhanh quá trình docking đáng kể

Nhấn mạnh vào tốc độ và độ chính xác cho các nghiên cứu quy mô lớn

Nâng cao độ chính xác của docking mù

Cải thiện đáng kể độ chính xác của docking

Xuất sắc cho các trường hợp có các vị trí liên kết chưa được biết

Nghiên cứu này phân tích DiffDock [20], một công cụ AI tiên tiến sử dụng các embeddings từ Mô hình quy mô tiến hóa (Evolutionary Scale Modeling - ESM) để nâng cao đáng kể các mô phỏng docking, như một ví dụ trong lĩnh vực dự đoán các hướng liên kết

DiffDock là một mô hình AI dự đoán docking nhằm dự đoán vị trí của phối tử so với protein (xác định túi liên kết), hướng của nó trong túi và các góc xoắn mô tả cấu hình của nó Mô hình này khác biệt với các phương pháp docking dựa trên lưới truyền thống (grid-based docking methods) bằng cách xử lý quá trình docking một cách linh động, tương tự như cách tạo chuỗi trong xử lý ngôn ngữ tự nhiên [20] DiffDock sử dụng một loại mô hình sinh tạo (generative model) dự đoán hướng liên kết của phối tử so với protein theo cách mô phỏng quá trình docking tự nhiên trong thực tế [20]

DiffDock được xây dựng trên kiến trúc transformer, tích hợp một số đổi mới chính [20]:

(a) Phương pháp dựa trên khuếch tán (Diffusion-based approach): Lấy cảm hứng từ những tiến bộ trong các mạng đối kháng sinh tạo (generative adversarial networks) và các mô hình khuếch tán (diffusion models), DiffDock mô phỏng chuyển động ngẫu nhiên của phối tử hướng tới vị trí liên kết của nó, tinh chỉnh hướng của nó một cách lặp lại để giảm thiểu năng lượng tự do liên kết

(b) Mạng lưới transformer (Transformer networks): Cốt lõi của DiffDock là một mạng lưới transformer xử lý thông tin không gian và hóa học của cả phối tử và protein, cho phép mô hình dự đoán các tương tác và cấu hình liên kết với độ chính xác cao

Một thành phần quan trọng trong thành công của DiffDock là sự tích hợp của các embeddings ESM Các embedding ESM là sản phẩm của Mô hình quy mô tiến hóa (ESM), một mô hình embedding protein Các mô hình embedding protein là công cụ tính toán được thiết kế để chuyển đổi các chuỗi protein thành các biểu diễn số, hay embedding, nhằm nắm bắt các đặc điểm cơ bản của protein ESM tận dụng các kỹ thuật tiên tiến như học sâu (deep learning) và xử lý ngôn ngữ tự nhiên (natural language processing) để diễn giải các mẫu phức tạp trong các chuỗi acid amin Bằng cách chuyển đổi các chuỗi protein thành các vector đa chiều, các mô hình embedding cho phép so sánh, phân cụm và chú thích chức năng của protein dựa trên embedding của chúng [131]

Bằng cách tích hợp các embeddings ESM, DiffDock có thể tiếp cận kiến thức về động học và tính linh hoạt của protein, cho phép mô hình hóa chính xác hơn môi trường của vị trí hoạt động, dẫn đến các dự đoán xem xét toàn bộ phạm vi các chuyển động và thay đổi cấu hình của protein Hơn nữa, việc sử dụng embeddings ESM có thể nâng cao hiệu quả của DiffDock bằng cách cung cấp một bản đồ chi tiết về các vị trí liên kết tiềm năng trên bề mặt protein, giảm bớt gánh nặng tính toán của việc quét toàn bộ bề mặt protein một cách mù quáng, tập trung nỗ lực vào các khu vực có triển vọng nhất cho liên kết

Hình 5: Quy trình làm việc của Diffdock

Hình 5: Quy trình làm việc của Diffdock [20]

Quy trình làm việc của DiffDock (Hình 5) bắt đầu bằng việc lấy cấu trúc riêng biệt của phối tử và protein làm đầu vào, sau đó các hướng ban đầu được lấy mẫu ngẫu nhiên được khử nhiễu thông qua một quá trình khuếch tán ngược gồm dịch chuyển, quay và xoắn Cuối cùng, các hướng được lấy mẫu sẽ được xếp hạng bởi mô hình độ tin cậy để tạo ra một dự đoán cuối cùng và điểm số độ tin cậy

Bảng 3: Một số ứng dụng của DiffDock trong dự đoán tương tác phối tử-protein

Phối tử Protein Vai trò của DiffDock Tham khảo

Dự đoán cách PFAs gắn với protein trong máu người [3]

Mip - một yếu tố độc lực của L pneumophila Đề xuất các vị trí gắn của FK506, một chất ức chế tiềm năng của Mip homodimer và giải thích cơ chế

Giải thích cơ chế liên kết của TAK-659 và JNJ-7706621 với Tribolium castaneum PINK1

ACSS2, một enzyme kích thích sự phát triển của khối u

Chọn ra 3 phức hợp phối tử- protein tốt nhất từ các chất ức chế tiềm năng của ACSS2 để khám phá sâu hơn

Dựa trên những nghiên cứu được trình bày trong Bảng 3, công cụ DiffDock đóng vai trò quan trọng trong khám phá thuốc bằng cách dự đoán tương tác protein-phối tử Trong nghiên cứu về PINK1, một kinase liên quan đến bệnh Parkinson, DiffDock đã giúp xác định cơ chế liên kết của các phối tử Sau đó, DiffDock được sử dụng để khám phá thêm và tối ưu hóa các ứng cử viên thuốc, chẳng hạn như giải thích cơ chế liên kết giữa TAK-659/JNJ-7706621 và TcPINK1 Nhờ khả năng tạo ra các mô hình cấu trúc có năng lượng thấp, DiffDock tiết kiệm được thời gian và chi phí trong quá trình khám phá thuốc Những ví dụ này minh họa cho tiềm năng rộng lớn của DiffDock trong lĩnh vực này.

So với các phương pháp docking truyền thống, DiffDock đại diện cho một sự tiến bộ đáng kể DiffDock có thể tạo ra các tương tác động, cho phép mô phỏng thực tế hơn về cách phối tử và protein tương tác trong các hệ thống sinh học Hơn nữa, bằng cách tận dụng các embeddings giàu ngữ cảnh từ ESM, DiffDock đạt được độ chính xác cao hơn trong dự đoán hướng và ước tính ái lực liên kết, điều này rất quan trọng để xác định các hợp chất trị liệu tiềm năng Kiến trúc dựa trên transformer của DiffDock vốn dĩ có khả năng mở rộng, có khả năng xử lý các tập dữ liệu lớn và các hệ thống phân tử phức tạp, điều này rất quan trọng cho sàng lọc thông lượng cao (high-throughput screening) trong khám phá thuốc.

Dự đoán ái lực liên kết

Dự đoán chính xác ái lực liên kết của phức hợp protein-phối tử giúp thiết kế thuốc hiệu quả hơn Các phương pháp AI cho phép dự đoán ái lực liên kết của các phân tử nhỏ với các mục tiêu sinh học nhanh chóng và ít tốn kém so với các phương pháp thực nghiệm hoặc tính điểm tính toán Điều này hỗ trợ xác định các tương tác protein-phối tử trong giai đoạn đầu khám phá thuốc, giúp đẩy nhanh quá trình phát triển thuốc.

Các phương pháp truyền thống thường hạn chế khả năng tổng quát hóa đối với các cấu trúc phân tử mới Các phương pháp tiên tiến khắc phục những thách thức này bằng cách học trên dữ liệu lớn Tùy thuộc vào đặc điểm của từng phương pháp, kết quả nghiên cứu sẽ có sự khác biệt.

Nghiên cứu này phân tích AI-Bind, một công cụ mới do nhóm nghiên cứu của Chatterjee [16] giới thiệu, kết hợp các chiến lược lấy mẫu dựa trên mạng (network-based sampling) với các mô hình nhúng tiền huấn luyện không giám sát (unsupervised pre- training embedding models) để cải thiện dự đoán liên kết cho các protein và phối tử mới, như một ví dụ nổi bật

AI-Bind tận dụng một khung phức tạp tích hợp nhiều chiến lược tính toán Đầu tiên, nó sử dụng lấy mẫu dựa trên mạng để chọn dữ liệu huấn luyện đa dạng, bao gồm cả các cặp protein-phối tử tích cực và tiêu cực Thứ hai, nó sử dụng các kỹ thuật học không giám sát để tiền huấn luyện các mô hình trên các thư viện hóa học mở rộng, do đó mở rộng sự tiếp xúc của mô hình với nhiều cấu trúc phân tử khác nhau Phương pháp này nhằm giảm thiểu sự thiên vị đối với các protein và phối tử được nghiên cứu nhiều, đây là một hạn chế đáng kể trong các mô hình dự đoán truyền thống

Kết quả Để xác thực AI-Bind, các nhà phát triển đã thực hiện các so sánh nghiêm ngặt với các mô hình dự đoán hiện có thông qua các mô phỏng docking in-silico và phân tích dữ liệu thực nghiệm Kết quả đã cho thấy hiệu suất vượt trội của AI-Bind, đặc biệt là khả năng tổng quát hóa cho các phân tử mới Các chỉ số hiệu suất chính, chẳng hạn như AUROC và AUPRC, chỉ ra sự cải thiện rõ rệt so với các mô hình truyền thống, cho thấy hiệu quả của AI-Bind trong việc dự đoán chính xác và đáng tin cậy các tương tác protein-phối tử

(a) AUROC (Diện tích dưới đường cong đặc tính hoạt động của người nhận): Chỉ số này cung cấp một thước đo tổng hợp về hiệu suất trên tất cả các ngưỡng phân loại có thể AUROC phản ánh xác suất rằng một mô hình sẽ xếp hạng một trường hợp tích cực ngẫu nhiên (một tương tác liên kết thực sự) cao hơn một trường hợp tiêu cực ngẫu nhiên (một tương tác không liên kết) AI-Bind đã cho thấy sự cải thiện AUROC, liên tục đạt điểm cao hơn các mô hình truyền thống Ví dụ, trong các tình huống liên quan đến protein và phối tử mới, AI-Bind đạt được AUROC 0.75 ± 0.032, so với các mô hình truyền thống có điểm chuẩn dao động từ 0.50 đến 0.60 Sự tăng từ các điểm truyền thống này chỉ ra sự cải thiện đáng kể trong khả năng phân biệt giữa các cặp liên kết và không liên kết của mô hình

(b) AUPRC (Diện tích dưới đường cong Precision-Recall): Với bản chất thường bị lệch của các tập dữ liệu sinh học, nơi các ví dụ tích cực (tương tác thực) ít phổ biến hơn nhiều so với các ví dụ tiêu cực, AUPRC trở thành một thước đo quan trọng Nó đánh giá sự cân bằng giữa precision (độ chính xác) và recall (khả năng thu hồi) - sự đánh đổi giữa việc nắm bắt càng nhiều tích cực càng tốt (recall) và duy trì độ chính xác cao trong số những dự đoán là tích cực (precision) Điểm số AUPRC của AI-Bind là 0.718 ± 0.029 vượt trội so với các mô hình truyền thống, thường cho thấy các giá trị AUPRC xung quanh 0.40 đến 0.50 trong các tình huống thử nghiệm tương tự Điểm số AUPRC cao hơn chỉ ra rằng AI-Bind không chỉ có khả năng phát hiện các tương tác thực mà còn duy trì độ chính xác cao ngay cả khi nó dự đoán nhiều tương tác hơn, xác nhận ít sai lệch tích cực và tiêu cực hơn

(c) Ý nghĩa thống kê: Các cải thiện trong AUROC và AUPRC không chỉ vượt trội về số mà còn có ý nghĩa thống kê, cho thấy sự khác biệt trong hiệu suất mô hình không phải do sự biến đổi ngẫu nhiên mà là do các phương pháp đổi mới được AI-Bind áp dụng Các kiểm tra thống kê, bao gồm kiểm tra Kruskal–Wallis H-test được sử dụng trong một số so sánh, ủng hộ khẳng định rằng các cải thiện hiệu suất của AI-Bind là mạnh mẽ và đáng tin cậy

AI-Bind đã dự đoán các tương tác giữa protein COVID-19 và thuốc hoặc hợp chất tự nhiên Loại trừ protein và phối tử trong cơ sở dữ liệu, AI-Bind chấm điểm và xếp hạng tương tác Trong số 50 liên kết tiềm năng nhất, hai loại thuốc được FDA khuyến nghị là Anidulafungin và Cyclosporine đã được xác định Cả hai thuốc này đều cho thấy hoạt tính kháng virus ở nồng độ thấp Ngoài ra, AI-Bind xác định ba hợp chất tự nhiên có tiềm năng chống COVID-19, hai trong số đó đã được báo cáo là hiệu quả.

Những kết quả này cho thấy độ chính xác của AI-Bind trong việc dự đoán các tương tác giữa các phối tử (các loại thuốc có sẵn) và protein (các mục tiêu thuốc), điều rất quan trọng cho việc khám phá thuốc Hơn nữa, kết quả của nghiên cứu này gợi ý một ứng dụng mới của AI trong khám phá thuốc: tích hợp AI-Bind với dữ liệu thời gian thực từ các thử nghiệm lâm sàng để cải thiện độ chính xác dự đoán một cách linh động Ngoài ra, khám phá ứng dụng của AI-Bind trong y học cá nhân hóa, nơi các hồ sơ di truyền cá nhân có thể cung cấp thông tin cho việc lựa chọn các phân tử thuốc hiệu quả nhất, có thể cách mạng hóa các quy trình điều trị.

Tích hợp AI để nâng cao hiệu quả của Mô phỏng động lực học phân tử

2.5.1 Về Mô phỏng động lực học phân tử

Khởi xướng lần đầu vào cuối những năm 1970 [127, 82], đến nay, mô phỏng động lực học phân tử đã có những bước phát triển mạnh Nó đã tiến xa từ việc mô phỏng các nguyên tử đơn lẻ đến việc giải quyết các hệ sinh học Những hệ này bao gồm protein và toàn bộ môi trường xung quanh protein, protein được nhúng trong màng và các phức hợp đại phân tử lớn như nucleosom [105, 111] hoặc ribosom [12, 120] Sự tiến bộ đáng kể này chủ yếu nhờ vào việc sử dụng tính toán hiệu năng cao (high-performance computing) và thuật toán động lực học phân tử cơ bản Do đó, động lực học phân tử có thể được coi là một công cụ tính toán quan trọng để hiểu nguyên tắc và tính chất vật lý quyết định cấu trúc của các phân tử sinh học, sự thay đổi động học của hệ, và chức năng của các đại phân tử sinh học [52] Ngoài ra, các kỹ thuật động lực học phân tử còn có giá trị trong việc phát hiện các vị trí liên kết ẩn, các vị trí liên kết dị lập thể (allosteric), các hướng liên kết phối tử và ước tính chính xác ái lực liên kết Các kỹ thuật này dựa vào dữ liệu toàn diện về cấu trúc, dao động, thay đổi cấu hình, động lực học và nhiệt động học của các phân tử sinh học và các phức hợp của chúng [50, 59] Hiểu được những chuyển động phức tạp này của phân tử sinh học chắc chắn rất quan trọng trong việc khám phá thuốc

Mô phỏng động lực học phân tử có nhiều ứng dụng quan trọng trong nghiên cứu tương tác protein-phối tử Dữ liệu từ mô phỏng động lực học phân tử có thể được sử dụng cho các mục đích khác nhau trong nghiên cứu cơ bản, khám phá thuốc và thiết kế thuốc Một số dữ liệu phổ biến được thu thập từ các mô phỏng động lực học phân tử bao gồm trung bình của độ lệch gốc bình phương (Root Mean Square Deviation - RMSD), trung bình của độ dao động gốc bình phương (Root Mean Square Fluctuation - RMSF), bán kính quay (Rg) và quan trọng nhất là tính được năng lượng liên kết tự do [48] Tính toán năng lượng liên kết tự do, dựa trên các nguyên lý của nhiệt động học thống kê, cung cấp các phương pháp chính xác hơn để dự đoán ái lực liên kết so với các phương pháp thường được sử dụng trong nghiên cứu docking [28] Năng lượng tự do là một hàm trạng thái, điều này có nghĩa là sự khác biệt năng lượng tự do liên quan đến một sự kiện nhất định, chẳng hạn như một loại thuốc liên kết với thụ thể của nó, chỉ được xác định bởi năng lượng trước và sau sự kiện Mặc dù quãng đường từ điểm bắt đầu đến điểm kết thúc có thể ảnh hưởng đến tốc độ mà các thụ thể và phối tử tương tác, nhưng nó không ảnh hưởng đến lượng năng lượng tự do Do đó, năng lượng tự do chỉ được xác định bởi năng lượng bắt đầu trong dung dịch và năng lượng cuối cùng sau sự kiện liên kết [29]

Tính toán năng lượng liên kết tự do thường dựa vào các mô phỏng tính toán chuyên sâu (computational simulations), chẳng hạn như động lực học phân tử của protein và phối tử Do đó, chúng đòi hỏi tài nguyên tính toán lớn hơn nhiều lần so với các hàm tính điểm truyền thống Do yêu cầu tính toán chuyên sâu, kết quả của các tính toán năng lượng liên kết tự do thường đáng tin cậy và gần như định lượng [28] Vì vậy, mặc dù là một mục tiêu đầy tham vọng, việc dự đoán chính xác năng lượng liên kết tự do liên kết bằng các kỹ thuật tính toán sẽ cách mạng hóa các ứng dụng của nó trong nghiên cứu cơ bản cũng như thiết kế và khám phá thuốc

Có nhiều kỹ thuật khác nhau để tính toán năng lượng liên kết tự do Một số phương pháp lấy dữ liệu từ mô phỏng động lực học phân tử, đặc biệt là Cơ học phân tử/Diện tích bề mặt (Molecular Mechanics/Surface Area - MM/SA) và Tích hợp năng lượng tuyến tính (Linear Energy Integration - LIE), có thể tính được năng lượng liên kết tự do tương đối chính xác trong khi tạo ra kết quả nhanh chóng Tuy nhiên, để nâng cao tính lặp lại và độ tin cậy của các năng lượng phức hợp protein-phối tử, việc sử dụng các quy trình kết hợp Hamiltonian là ưu tiên, trong đó Tích hợp nhiệt động lực học (Thermodynamic Integration - TI) và Nhiễu loạn năng lượng tự do (Free Energy Perturbation - FEP) là các phương pháp được sử dụng phổ biến nhất Tuy nhiên, cần lưu ý rằng các kỹ thuật này tốn nhiều thời gian [48]

Ví dụ, Nhiễu loạn năng lượng tự do alchemical là một phương pháp phổ biến để tính toán năng lượng liên kết tự do Tính toán năng lượng liên kết tự do alchemical sử dụng các trạng thái trung gian phi vật lý (“alchemical”) để ước tính năng lượng liên kết tự do của các quá trình vật lý khác nhau [28] Do con đường phi vật lý được sử dụng cho tính toán năng lượng liên kết tự do, nhóm phương pháp lấy mẫu nâng cao này đôi khi được gọi là biến đổi alchemical, mặc dù trong thiết kế thuốc chúng chủ yếu được biết đến như là phương pháp Nhiễu loạn năng lượng tự do (Free-Energy Perturbation – FEP) [55] Trong liên kết protein - phối tử, phối tử được biến đổi alchemical thành một chất hóa học khác hoặc một phân tử “giả" không tương tác thông qua các giai đoạn trung gian phi vật lý Phép tính alchemical đơn giản sử dụng các chu kỳ nhiệt động học để tính toán sự thay đổi năng lượng tự do khi phối tử A được chuyển thành phối tử B tự do trong dung dịch (∆Gfree (A→B)) và tại vị trí liên kết phối tử (∆Gbound(AàB)) (hình 6) [28]

Sự chênh lệch của hai năng lượng này bằng với năng lượng liên kết tự do giữa hai phối tử (pt 5):

∆Gbound(A→B) – ∆Gfree (A→B) = ∆Gbind (B) – ∆Gbind(A) = ∆∆Gbind (5)

Về lý thuyết, nếu phối tử A được biến đổi thành các hạt giả không tương tác thì có thể dễ dàng tính toán năng lượng liên kết tự do tuyệt đối của phối tử (absolute binding free energy) Tuy nhiên, điều này gặp nhiều khó khăn do càng về trạng thái cuối của quá trình biến đổi thì hệ càng không ổn định Do vậy, để khắc phục vấn đề trên, trong nhiều ứng dụng thực tế một biến đổi alchemical đơn lẻ thường được chia thành nhiều bước trung gian giúp dễ dàng kiểm soát và tính toán

Hình 6: Chu kỳ nhiệt động học sử dụng để tính toán sự thay đổi năng lượng liên kết tự do tương đối (ΔΔG) trong phương pháp Nhiễu loạn năng lượng tự do

Chu kỳ nhiệt động học tính toán năng lượng liên kết tương đối (ΔΔG) bằng phương pháp nhiễu loạn năng lượng tự do Phương pháp này xác định sự thay đổi ái lực liên kết do các đột biến axit amin hoặc sửa đổi phối tử gây ra Nhiễu loạn năng lượng tự do được ứng dụng rộng rãi trong nghiên cứu mục tiêu thuốc, đặc biệt là trong đại dịch SARS-CoV-2, nơi nó giúp khám phá ra phương pháp điều trị mới.

10, 35, 72] Gần đây, trong lĩnh vực khám phá thuốc, Nhiễu loạn năng lượng tự do đã được áp dụng để nghiên cứu các chất tiềm năng để điều trị bệnh bạch cầu tủy [133] và các chất làm tác nhân chống ung thư nhắm mục tiêu trong liệu pháp miễn dịch ung thư [102] và các mục tiêu khác

2.5.2 Tích hợp AI và Mô phỏng động lực học phân tử

Trong những năm gần đây, sự tích hợp của mô phỏng động lực học phân tử và AI đã trở thành một chủ đề quan tâm trong khám phá thuốc, đặc biệt là các tương tác phối tử- protein Trong khi các mô phỏng động lực học phân tử cung cấp cái nhìn chi tiết, ở cấp độ nguyên tử về hành vi động của các phân tử theo thời gian, nắm bắt các thay đổi cấu hình và các tính chất nhiệt động học cần thiết để hiểu các quá trình liên kết, AI đóng vai trò bằng cách nâng cao hiệu quả và độ chính xác của các mô phỏng động lực học phân tử, giải quyết vấn đề chi phí tính toán cao và thời gian, đặc biệt đối với các hệ thống lớn hoặc thang thời gian dài

Thuật toán học máy có thể dự đoán bề mặt năng lượng tiềm năng, tối ưu hóa trường lực và xác định các tương tác quan trọng, giúp tăng tốc quá trình mô phỏng và giảm nhu cầu tính toán Ví dụ, AI có thể dự đoán các cấu trúc liên kết ổn định và bối cảnh năng lượng tự do, định hướng các mô phỏng động lực phân tử vào các khu vực có liên quan nhất của không gian cấu hình Ngoài ra, AI giải quyết vấn đề thiếu cấu trúc mục tiêu chính xác, cung cấp dữ liệu lớn hơn để mô phỏng động lực phân tử khám phá các mục tiêu thuốc hiếm Ví dụ, năng lượng tự do liên kết được tính toán bằng cấu trúc dự đoán bởi AlphaFold2, cho kết quả chính xác.

Hơn nữa, AI có thể hỗ trợ trong phân tích sau mô phỏng bằng cách nhận diện các mẫu và trích xuất những hiểu biết có ý nghĩa từ lượng dữ liệu lớn được tạo ra bởi các mô phỏng động lực học phân tử Các kỹ thuật như học sâu có thể được sử dụng để phân sửa đổi để cải thiện đặc điểm liên kết [91] Sự kết hợp giữa các mô phỏng động lực học phân tử và AI tạo ra một khung mạnh mẽ không chỉ nâng cao sự hiểu biết của chúng ta về các cơ chế phân tử mà còn tăng tốc quá trình khám phá thuốc Cách tiếp cận tích hợp này cho phép sàng lọc nhanh chóng các ứng cử viên thuốc tiềm năng, tối ưu hóa các đặc điểm liên kết và làm sáng tỏ các quá trình sinh học phức tạp ở cấp độ phân tử

Ví dụ về tích hợp AI vào Mô phỏng động lực học phân tử là nghiên cứu của Khalak và cộng sự (2022) [60], tìm hiểu chất ức chế phosphodiesterase 2 (PDE2) Nghiên cứu này kết hợp phương pháp học động và tính toán năng lượng liên kết tự do Alchemical để tìm kiếm không gian hóa học của chất ức chế PDE2.

Về phương pháp, quy trình này được bắt đầu bằng cách tập hợp bộ sưu tập lớn các chất ức chế PDE2 mà ái lực liên kết của chúng được ước tính bằng mô phỏng động lực học phân tử, và khởi tạo quy trình bằng cách chọn ngẫu nhiên có trọng số một lô hợp chất cho lần lặp đầu tiên để đảm bảo tính đa dạng phối tử Ái lực liên kết của các phối tử đã chọn được đánh giá theo quy trình tính toán năng lượng tự do Alchemical Các phối tử này cùng với ước tính ái lực thu được tạo thành một tập huấn luyện cho các mô hình học máy, từ đó dự đoán ái lực liên kết cho tất cả các phối tử còn lại trong thư viện hóa học Trong lần lặp tiếp theo, một tập hợp hợp chất khác được chọn và các bước tương tự của chu trình được lặp lại Bằng cách này, tập huấn luyện tiếp tục tăng lên, do đó cải thiện độ chính xác của các dự đoán AI Hầu hết các hợp chất có ái lực liên kết cao nhất được xác định sau một số lần lặp nhỏ của chu trình Trong quá trình này, chỉ một phần nhỏ của thư viện hóa học được đánh giá rõ ràng bằng phương pháp động học phân tử tốn kém về mặt tính toán, trong khi ái lực đối với các phối tử còn lại được dự đoán bằng mô hình AI [60]

Hình 7: Sơ đồ học tập tích cực [60]

Hình 7 cho biết thông tin về sơ đồ học tập tích cực Các mô hình được huấn luyện để tái tạo năng lượng tự do thu được thông qua thực nghiệm hoặc tính toán bằng mô phỏng động lực học phân tử Ở mỗi lần lặp, một lô phối tử được chọn để thêm vào tập huấn luyện dựa trên năng lượng tự do được dự đoán theo các mô hình của lần lặp trước Huấn luyện lặp lại của các mô hình với một tập dữ liệu huấn luyện ngày càng tăng cải thiện độ chính xác của dự đoán: hầu hết các chất liên kết hàng đầu được xác định bằng cách thăm dò chỉ một phần nhỏ của toàn bộ thư viện hóa học

BÀN LUẬN

Tương tác Phối tử-Protein

Cấu trúc của protein và phối tử có mối quan hệ phức tạp và đóng vai trò quan trọng trong các quá trình sinh học cũng như trong thiết kế và phát triển thuốc Protein là các đại phân tử sinh học phức tạp với các cấu trúc ba chiều đặc trưng quyết định chức năng sinh học của chúng Những đặc điểm cấu trúc này tạo ra các vùng chức năng đặc biệt trên protein, bao gồm các vị trí liên kết và các hốc liên kết Phối tử là những phân tử nhỏ có thể liên kết với các vị trí liên kết này trên protein, ảnh hưởng đến hoạt động và chức năng của protein Cấu trúc của phối tử, bao gồm hình dạng không gian và các nhóm chức năng hóa học của chúng, quyết định ái lực liên kết của chúng với các vị trí liên kết của protein

Về vị trí liên kết: Vị trí liên kết là khu vực cụ thể trên protein nơi phối tử gắn kết Các đặc điểm cấu trúc của protein, như các túi, rãnh và hốc, rất quan trọng trong việc xác định các vị trí liên kết này Các đặc điểm cấu trúc này thường bao gồm các acid amin đặc biệt tương tác với phối tử qua nhiều loại liên kết, bao gồm liên kết hydrogen, tương tác ion, và liên kết kỵ nước Sự sắp xếp ba chiều của các acid amin này tạo ra một môi trường thuận lợi cho sự gắn kết của phối tử Việc xác định và đặc trưng hóa các vị trí liên kết thông qua phân tích cấu trúc là rất cần thiết để hiểu các điểm tương tác ban đầu giữa protein và phối tử

Hướng liên kết: Hướng liên kết đề cập đến hướng và cấu dạng của phối tử khi nó gắn kết với vị trí liên kết của protein Sự phù hợp cấu trúc giữa phối tử và vị trí liên kết quyết định hướng liên kết Điều này không chỉ liên quan đến sự phù hợp của phối tử với tư thê liên kết mà còn liên quan đến sự sắp xếp tối ưu của các nhóm chức năng trên phối tử để tối đa hóa các tương tác thuận lợi và giảm thiểu va chạm không gian Sự linh động của cả protein và phối tử đóng vai trò quan trọng trong việc xác định hướng liên kết Protein và phối tử có thể có nhiều cấu trúc liên kết khác nhau, và hướng liên kết ổn định nhất thường là cấu dạng cân bằng các thay đổi cấu trúc để đạt được sự phù hợp và năng lượng tương tác tốt nhất Ái lực liên kết: Ái lực liên kết đo lường sức mạnh của tương tác giữa protein và phối tử Nó bị ảnh hưởng bởi số lượng và tính chất của các tương tác trong vị trí liên kết và hướng liên kết Sự gắn kết với ái lực cao thường liên quan đến nhiều tương tác mạnh, như liên kết hydrogen, lực van der Waals và tương tác kỵ nước Sự phù hợp về cấu trúc giữa phối tử và vị trí liên kết, cùng với hướng liên kết tối ưu, là yếu tố then chốt để đạt được ái lực liên kết cao Những thay đổi trong cấu trúc protein hoặc phối tử có thể ảnh hưởng lớn đến ái lực liên kết, nhấn mạnh tầm quan trọng của thông tin chính xác về cấu trúc trong thiết kế phối tử có ái lực cao

Hiểu được mối quan hệ giữa cấu trúc protein và phối tử là nền tảng cho thiết kế thuốc hiệu quả và chính xác Dựa trên thông tin cấu trúc của protein và phối tử, các nhà khoa học có thể thiết kế phối tử liên kết mạnh mẽ và đặc hiệu với protein mục tiêu, tối ưu hóa các đặc tính dược lý như khả dụng sinh học và độc tính Việc nắm vững và tận dụng mối quan hệ cấu trúc-chức năng này không chỉ tăng hiệu quả can thiệp điều trị mà còn giảm rủi ro và chi phí phát triển thuốc, đóng góp đáng kể vào sự tiến bộ trong lĩnh vực y học và sinh học.

Các ứng dụng của AI

3.2.1 Trong dự đoán vị trí liên kết

(a) Ứng dụng AI dự đoán cấu trúc protein

Một trong những bước đột phá lớn nhất trong lĩnh vực này là sự phát triển của các mô hình AI như AlphaFold của DeepMind AlphaFold2 mang lại nhiều ưu điểm vượt trội so với các phương pháp truyền thống và phương pháp tính toán AlphaFold2 đạt độ chính xác gần bằng các phương pháp thực nghiệm như tinh thể học tia X, minh chứng qua cuộc thi CASP, nhưng không yêu cầu về điều kiện thí nghiệm, thiết bị đắt tiền và thời gian như các phương pháp này Ngoài ra, AlphaFold2 có thể dự đoán chính xác cấu trúc của nhiều protein mà các phương pháp thực nghiệm gặp khó khăn, đặc biệt là các protein không thể kết tinh được hoặc có cấu trúc linh hoạt

Tuy nhiên, AlphaFold2 cũng có một số nhược điểm Một trong số đó là hạn chế trong việc dự đoán động học protein, khi chỉ dự đoán cấu trúc tĩnh và không tính đến các biến đổi động học trong quá trình hoạt động sinh học Trong khi đó, các phương pháp như phổ NMR có thể cung cấp thông tin về động học protein AlphaFold2 cũng phụ thuộc vào chất lượng và số lượng dữ liệu huấn luyện, thiếu dữ liệu hoặc dữ liệu không đồng nhất có thể ảnh hưởng đến độ chính xác của dự đoán Các phương pháp thực nghiệm không phụ thuộc vào dữ liệu huấn luyện mà dựa vào điều kiện thực nghiệm Mặc dù có độ chính xác cao, đôi khi các dự đoán của AlphaFold2 có thể khó giải thích về mặt cơ chế sinh học, trong khi các phương pháp thực nghiệm cung cấp thông tin chi tiết hơn thông qua quan sát trực tiếp

Tóm lại, AlphaFold2 mang lại nhiều ưu điểm vượt trội so với các phương pháp truyền thống và tính toán, bao gồm độ chính xác cao, tốc độ nhanh, chi phí thấp và khả năng tiếp cận rộng rãi Tuy nhiên, sự kết hợp giữa AlphaFold2 và các phương pháp truyền thống có thể mang lại những kết quả tốt nhất trong nghiên cứu cấu trúc protein

(b) Các công cụ AI chuyên dùng để dự đoán vị trí liên kết

Dự đoán các vị trí liên kết, các vùng trên protein mà các phối tử gắn vào, là một khía cạnh quan trọng của việc hiểu các tương tác phối tử-protein Các vị trí liên kết rất quan trọng cho chức năng sinh học của protein và là mục tiêu chính cho việc phát triển thuốc

AI đã tiến bộ đáng kể trong việc dự đoán các vị trí này, cung cấp các công cụ nâng cao độ chính xác và hiệu quả của nhiệm vụ quan trọng này trong sinh học phân tử và khám phá thuốc

Khả năng của AI trong việc dự đoán các vị trí liên kết liên quan đến việc phân tích các tập dữ liệu lớn về cấu trúc protein để xác định các đặc điểm và mẫu chung liên quan đến liên kết phối tử Quá trình này có thể xác định các vùng trên bề mặt protein có khả năng tương tác với các phối tử tiềm năng AI có thể dự đoán chính xác các vị trí liên kết trên các protein mới được phát hiện hoặc ít được đặc trưng, cung cấp những hiểu biết có giá trị để hướng dẫn xác nhận bằng thực nghiệm và nghiên cứu sâu hơn Các thuật toán AI có thể xem xét các chi tiết phức tạp của bề mặt protein, xác định các hốc, rãnh và khoang nơi các phối tử có khả năng liên kết nhất Thông tin cấu trúc chi tiết này giúp các nhà nghiên cứu hiểu được cơ chế phân tử của chức năng protein và tương tác

3.2.2 Trong dự đoán hướng liên kết

Việc áp dụng AI trong dự đoán hướng liên kết đã cách mạng hóa lĩnh vực khám phá thuốc và sinh học phân tử Dự đoán hướng liên kết, liên quan đến việc xác định hướng và cấu hình của phối tử khi nó liên kết với vị trí liên kết của protein, là điều cốt yếu để hiểu các tương tác phân tử và khám phá các loại thuốc hiệu quả AI mang lại nhiều lợi thế và tiến bộ cho nhiệm vụ khó khăn này

Các phương pháp truyền thống để dự đoán hướng liên kết, chẳng hạn như docking và thời gian Trong khi đó, AI sử dụng các thuật toán tối ưu hóa và các kỹ thuật học máy để giảm thiểu số lượng phép tính cần thiết AI, đặc biệt là các mô hình học sâu, đã cải thiện đáng kể độ chính xác và hiệu quả của các dự đoán này Các mô hình như Diffdock có thể dự đoán hướng liên kết chính xác hơn các phương pháp truyền thống, tạo ra các dự đoán hướng liên kết nhanh chóng và đáng tin cậy

Dự đoán hướng liên kết chính xác giúp hình dung cách một phối tử khớp vào vị trí liên kết của protein, làm rõ các điểm tương tác chính như liên kết hydro, tương tác kỵ nước và liên kết ion Thông tin cấu trúc này là điều cần thiết để hiểu cơ chế phân tử đằng sau chức năng protein và hiệu quả của phối tử, cung cấp nền tảng cho thiết kế thuốc hợp lý Một trong những ứng dụng chính của AI trong việc dự đoán hướng liên kết là trong sàng lọc ảo, một quy trình liên quan đến việc mô phỏng tính toán cách các phối tử gắn kết với một mục tiêu protein Các phương pháp thực nghiệm truyền thống để sàng lọc các ứng viên thuốc tiềm năng thường đòi hỏi nhiều công sức và tốn kém Các mô hình

AI có thể nhanh chóng dự đoán hướng liên kết cho các thư viện hợp chất lớn, cho phép các nhà nghiên cứu nhanh chóng xác định các hợp chất có sự phù hợp tốt nhất và khả năng hiệu quả cao nhất Điều này tăng tốc quá trình phát hiện thuốc bằng cách tập trung các nỗ lực thực nghiệm vào những ứng viên triển vọng nhất

3.2.3 Trong dự đoán ái lực liên kết Ái lực liên kết, đo lường sức mạnh của tương tác giữa một protein và phối tử của nó, là một thông số quan trọng trong nghiên cứu tương tác protein-phối tử Việc dự đoán chính xác ái lực liên kết là cần thiết để hiểu các quá trình sinh học và phát triển các loại thuốc hiệu quả Trong khi các phương pháp truyền thống gặp khó khăn do tốn nhiều thời gian và tài nguyên, dự đoán dựa trên AI cung cấp một giải pháp thay thế mạnh mẽ, mang lại khả năng ước tính ái lực liên kết nhanh hơn và có thể tiết kiệm chi phí hơn

Một trong những đóng góp đáng kể nhất của AI trong việc dự đoán ái lực liên kết là khả năng nhanh chóng sàng lọc các thư viện hợp chất khổng lồ Các phương pháp truyền thống, chẳng hạn như sàng lọc thông lượng cao, tốn nhiều thời gian và chi phí Các mô hình AI có thể phân tích các tập dữ liệu rộng lớn về các tương tác protein-phối tử đã biết để dự đoán ái lực liên kết của các hợp chất mới một cách hiệu quả Khả năng này cho phép các nhà nghiên cứu ưu tiên các hợp chất có ái lực dự đoán cao nhất để tiến hành thẩm định thực nghiệm, tăng tốc quá trình xác định các ứng viên thuốc tiềm năng

Ngoài ra, các dự đoán dựa trên AI về ái lực liên kết đóng vai trò quan trọng trong việc tối ưu hóa các hợp chất dẫn đầu Bằng cách hiểu các tương tác phân tử đóng góp vào ái lực liên kết, các nhà nghiên cứu có thể thực hiện các sửa đổi cụ thể nhằm tăng cường tương tác giữa phối tử và protein Các mô hình AI có thể cung cấp các thông tin chi tiết về những thay đổi hóa học có khả năng tăng cường ái lực liên kết, hướng dẫn thiết kế hợp lý các loại thuốc mạnh hơn và chọn lọc hơn Quá trình lặp đi lặp lại của dự đoán, sửa đổi và thẩm định này cải thiện đáng kể hiệu quả của quy trình phát triển thuốc

Hơn nữa, các mô hình AI có thể phân tích các mẫu phức tạp trong các tương tác protein-phối tử, cung cấp những hiểu biết chi tiết về cơ chế liên kết Bằng cách dự đoán ái lực liên kết, AI giúp các nhà nghiên cứu hiểu cách các phối tử khác nhau tương tác với cùng một protein và cách các tương tác này ảnh hưởng đến hoạt động sinh học Kiến thức này rất quan trọng để làm sáng tỏ vai trò chức năng của protein trong các con đường sinh học và xác định các mục tiêu điều trị tiềm năng Việc dự đoán chính xác ái lực liên kết cũng giúp giảm thiểu các tác động ngoài mục tiêu, đó là những tương tác không mong muốn với các protein không mục tiêu có thể dẫn đến tác dụng phụ Các mô hình

AI có thể dự đoán ái lực liên kết của một phối tử với nhiều protein, xác định các tương tác ngoài mục tiêu tiềm năng từ sớm trong quá trình phát triển thuốc Khả năng này cho phép các nhà nghiên cứu thiết kế các hợp chất liên kết chọn lọc với mục tiêu mong muốn, cải thiện hồ sơ an toàn của thuốc

3.2.4 Tích hợp AI với các Mô phỏng động lực học phân tử

Tác động của AI lên khám phá thuốc và những hạn chế của chúng

3.3.1 Tác động của các công cụ AI lên khám phá thuốc

Các công cụ AI đã cách mạng hóa việc khám phá thuốc bằng cách dự đoán chính xác các tương tác phối tử-protein, đẩy nhanh đáng kể việc xác định các ứng cử viên thuốc tiềm năng Hơn nữa, nó trợ giúp khám phá không gian hoá học và xác định những hợp chất có tiềm năng cao nhất trong các thử nghiệm tiền lâm sàng, giảm sự phụ thuộc vào các phương pháp thực nghiệm rộng rãi và giảm chi phí Ngoài ra, độ chính xác được cải thiện làm giảm khả năng thất bại tốn kém trong các giai đoạn sau của phát triển thuốc, do đó tối ưu hóa việc phân bổ tài nguyên trong nghiên cứu dược phẩm Hơn nữa, khả năng tổng quát hóa đối với các protein và phối tử mới có thể mở đường cho những đột phá trong các phương pháp điều trị cho các bệnh hiện đang có ít lựa chọn trị liệu

3.3.2 Hạn chế của các công cụ AI

Nhìn chung, việc sử dụng các công cụ AI để dự đoán tương tác phối tử-protein đã tiến bộ đáng kể trong việc khám phá thuốc Các mô hình AI có thể xác định các tương tác mới mà các phương pháp truyền thống có thể bỏ lỡ, cải thiện cơ hội phát hiện các liệu pháp hiệu quả Một trong những điểm mạnh của AI trong dự đoán hướng liên kết là khả năng học từ các tập dữ liệu rộng lớn Bằng cách được huấn luyện trên hàng ngàn tương tác phối tử-protein đã biết, các mô hình AI có thể xác định các đặc điểm và tương tác mà các phương pháp truyền thống có thể bỏ sót Khả năng tận dụng các tập dữ liệu lớn này cho phép AI tổng quát hóa trên các loại protein và phối tử khác nhau, cải thiện sức mạnh dự đoán của nó và làm cho nó có thể áp dụng cho nhiều mục tiêu sinh học

Tuy nhiên, ứng dụng công cụ AI vào nghiên cứu tương tác protein-phối tử vẫn vấp phải một vài hạn chế Đặc tính “hộp đen” của những công cụ này khiến cho quá trình tính toán của chúng không được minh bạch, khó phiên giải và làm giảm độ tin tưởng vào kết quả Một trở ngại quan trọng khác là khả năng truy cập dữ liệu phù hợp [124] Các phương pháp dựa trên AI thường yêu cầu một lượng lớn dữ liệu để huấn luyện [122] Thường thì, khả năng truy cập dữ liệu có thể bị hạn chế hoặc dữ liệu có chất lượng kém hoặc không nhất quán, dẫn đến các kết quả tiềm năng không chính xác và không đáng tin cậy [42] Sự chính xác của các dự đoán đưa ra bởi AI phụ thuộc và chất lượng và độ đa dạng của cơ sở dữ liệu, điều này có thể dẫn đến sai số Các chiến thuật và phương pháp khác nhau có thể được sử dụng để vượt qua các thách thức gặp phải bởi AI Một chiến lược hiệu quả là sử dụng tăng cường dữ liệu [70], bao gồm việc tạo dữ liệu nhân tạo để nâng cao các tập dữ liệu hiện có Bằng cách tăng số lượng và sự đa dạng của dữ liệu sẵn có để huấn luyện các thuật toán học máy, độ chính xác và độ tin cậy của kết quả có thể được cải thiện [119] Một chiến lược thay thế liên quan đến việc sử dụng các kỹ thuật AI giải thích được (explainable AI (XAI) techniques) [88], nhằm cung cấp các giải thích dễ hiểu và minh bạch cho các dự báo được tạo ra bởi các thuật toán học máy Bằng cách giải quyết các vấn đề liên quan đến thiên vị và công bằng trong các hệ thống dựa trên AI [62], điều này có thể nâng cao sự hiểu biết của chúng ta về các cơ chế và giả định cơ bản đằng sau các dự đoán [5]

Tương tự như các mô phỏng động lực học phân tử, các phương pháp dựa trên AI hiện tại không phải là một lựa chọn thay thế khả thi cho các quy trình thực nghiệm truyền thống, và chúng không thể thay thế kiến thức và sự thành thạo của các nhà nghiên cứu có Các nhà nghiên cứu vẫn phải xác minh và làm rõ các kết quả Hơn nữa, việc tích hợp trí tuệ nhân tạo vào các kỹ thuật thực nghiệm truyền thống có thể tối ưu hóa hơn nữa quá trình phát triển thuốc [98] Bằng cách kết hợp khả năng dự đoán của trí tuệ nhân tạo với kiến thức và sự thành thạo của các nhà nghiên cứu [54], có thể nâng cao hiệu quả của quá trình khám phá thuốc và đẩy nhanh sự phát triển của các loại thuốc mới [126]

KẾT LUẬN VÀ ĐỀ XUẤT Kết luận

Qua thời gian nghiên cứu đề tài, tôi đã đạt được những kết quả theo mục tiêu nghiên cứu đề tài đã đề ra như sau:

1 Đã phân tích về mối liên quan giữa cấu trúc và tương tác protein-phối tử, bao gồm vị trí liên kết, hướng liên kết, ái lực liên kết và các yếu tố ảnh hưởng

2 Đã phân tích được các ứng dụng của AI trong dự đoán cấu trúc protein-phối tử hiện nay:

- Về dự đoán cấu trúc protein-phối tử: AI có khả năng dự đoán vị trí liên kết, hướng liên kết, ái lực liên kết nhanh chóng và ít tốn kém hơn các phương pháp truyền thống

Sử dụng AI có thể giúp phát hiện ra các vấn đề khó tạo ra được trên thực nghiệm;

- AI có thể được dùng để kết hợp với các phương pháp khác để nâng cao chất lượng của dự đoán, ví dụ như mô phỏng động lực học phân tử;

- AI giúp tăng tốc quá trình khám phá thuốc, giúp sàng lọc nhanh và tối ưu hoá các hợp chất tiềm năng, từ đó tiết kiệm tài nguyên và chi phí tuy nhiên còn gặp phải một vài hạn chế, tiêu biểu như chất lượng của tập dữ liệu, làm ảnh hưởng đến độ chính xác của dự đoán, do vậy, cần kết hợp AI với dữ liệu từ thực nghiệm để đạt kết quả tối ưu Đề xuất

1 Tiếp tục cải thiện các thuật toán của các mô hình để cải thiện hiệu quả và rút ngắn thời gian chờ để đưa ra các dự đoán AI trong tương tác protein-phối tử

2 Cần tạo ra một cơ sở dữ liệu tổng hợp bao gồm dữ liệu từ nhiều cơ sở dữ liệu riêng lẻ để giải quyết vấn đề chất lượng của tập dữ liệu, từ đó làm tăng độ chính xác của các dự đoán đưa ra bởi AI Ngoài ra, tích hợp AI với dữ liệu thời gian thực từ các thử nghiệm lâm sàng có thể cải thiện độ chính xác của dự đoán một cách linh động.

1 AlQuraishi M., (2019), "End-to-End Differentiable Learning of Protein Structure",

2 Askr H., Elgeldawi E., Aboul Ella H et al., (2023), "Deep learning in drug discovery: an integrative review and future challenges.", Artificial intelligence review, 56(7), pp 5975–6037

3 B Fortela D L., Mikolajczyk A P., Carnes M R et al., (2024), "Predicting Molecular Docking of Per- and Polyfluoroalkyl Substances to Blood Protein Using Generative Artificial Intelligence Algorithm Diffdock", BioTechniques, 76(1), pp 14–26

4 Barakat K H., Mane J Y., Tuszynski J A., (2011), "Virtual Screening”, In

Handbook of Research on Computational and Systems Biology, pp 28–60

5 Barredo Arrieta A., Díaz-Rodríguez N., Del Ser J et al., (2020), "Explainable Artificial Intelligence (XAI): Concepts, taxonomies, opportunities and challenges toward responsible AI", Information Fusion, 58, pp 82–115

6 Bechelli S., Delhommelle J., (2024), "AI’s role in pharmaceuticals: Assisting drug design from protein interactions to drug development", Artificial Intelligence Chemistry, 2(1), pp 100038

7 Bertoline L M F., Lima A N., Krieger J E., Teixeira S K., (2023), "Before and after AlphaFold2: An overview of protein structure prediction", Frontiers in Bioinformatics, 3, pp 1120370

8 Beuming T., Martín H., Díaz-Rovira A M et al., (2022), "Are Deep Learning Structural Models Sufficiently Accurate for Free-Energy Calculations? Application of FEP+ to AlphaFold2-Predicted Structures", Journal of Chemical

9 Boehr D D., Nussinov R., Wright P E., (2009), "The role of dynamic conformational ensembles in biomolecular recognition", Nature Chemical Biology, 5(11), pp 789–796

10 Bonatto V., Shamim A., Rocho F dos R et al., (2021), "Predicting the Relative Binding Affinity for Reversible Covalent Inhibitors by Free Energy Perturbation Calculations", Journal of Chemical Information and Modeling, 61(9), pp 4733–

11 Borkakoti N., Thornton J M., (2023), "AlphaFold2 protein structure prediction: Implications for drug discovery", Current Opinion in Structural Biology, 78, pp

12 Brandman R., Brandman Y., Pande V S., (2012), "A-Site Residues Move Independently from P-Site Residues in all-Atom Molecular Dynamics Simulations of the 70S Bacterial Ribosome", PLoS ONE, 7(1), pp e29377

13 Bronowska A K., (2011), "Thermodynamics of ligand-protein interactions: implications for molecular design", In Thermodynamics-Interaction Studies- Solids, Liquids and Gases IntechOpen

14 Bryngelson J D., Onuchic J N., Socci N D., Wolynes P G., (1995), "Funnels, pathways, and the energy landscape of protein folding: A synthesis", Proteins: Structure, Function, and Bioinformatics, 21(3), pp 167–195

15 Campbell S J., Gold N D., Jackson R M., Westhead D R., (2003), "Ligand binding: functional site location, similarity and docking", Current opinion in structural biology, 13(3), pp 389–395

16 Chatterjee A., Walters R., Shafi Z., et al., (2023), "Improving the generalizability of protein-ligand binding predictions with AI-Bind", Nature Communications, 14(1), pp 1989

17 Chauhan J S., Mishra N K., Raghava G P S., (2009), "Identification of ATP binding residues of a protein from its primary sequence", BMC bioinformatics, 10, pp 1–9

18 Chen K., Mizianty M J., Kurgan L., (2011), "ATPsite: sequence-based prediction of ATP-binding residues", In Proteome Science, 9, pp 1–8

19 Clark P L., & Ugrinov K G., (2009), "Chapter 24 Measuring Cotranslational Folding of Nascent Polypeptide Chains on Ribosomes", Methods in enzymology,

20 Corso G., Stọrk H., Jing B., et al., (2022), "DiffDock: Diffusion Steps, Twists, and Turns for Molecular Docking", arXiv preprint

21 Dara S., Dhamercherla S., Jadav S S., Babu C M., Ahsan M J., (2022), "Machine Learning in Drug Discovery: A Review.", Artificial intelligence review, 55(3), pp 1947–1999

22 Dey F., Cliff Zhang Q., Petrey D., Honig B., (2013), "Toward a “structural BLAST”: Using structural relationships to infer function", Protein Science, 22(4), pp 359–366

23 Dhakal A., McKay C., Tanner J J., Cheng J., (2022), "Artificial intelligence in the prediction of protein-ligand interactions: recent advances and future directions.",

24 Dill K A., & MacCallum J L., (2012), "The Protein-Folding Problem, 50 Years On", Science, 338(6110), pp 1042–1046

25 DiMasi J A., Feldman L., Seckler A., Wilson A., (2010), "Trends in risks associated with new drug development: success rates for investigational drugs",

26 DiMasi J A., Grabowski H G., Hansen R W., (2016), "Innovation in the pharmaceutical industry: new estimates of R&D costs", Journal of health economics, 47, pp 20–33

27 Dobson C M., (2003), "Protein folding and misfolding", Nature, 426(6968), pp

28 Du X., Li Y., Xia Y.-L et al., (2016), "Insights into Protein–Ligand Interactions: Mechanisms, Models, and Methods", International Journal of Molecular Sciences,

29 Durrant J D., & McCammon J A., (2011), "Molecular dynamics simulations and drug discovery", BMC Biology, 9(1), pp 71

30 Esquea E M., Ciraku L., Young R G., et al., (2024), "Selective and brain- penetrant ACSS2 inhibitors target breast cancer brain metastatic cells", Frontiers in Pharmacology, 15

31 Ferguson F M., Gray N S., (2018), "Kinase inhibitors: the road ahead", Nature reviews Drug discovery, 17(5), pp 353–377

32 Fischer E., (1894), "Einfluss der Configuration auf die Wirkung der Enzyme",

Berichte der deutschen chemischen Gesellschaft, 27(3), pp 2985–2993

33 Fowler N J., Williamson M P., (2022), "The accuracy of protein structures in solution determined by AlphaFold and NMR", Structure, 30(7), pp 925- 933.e2

34 Fratev F., (2022), "R346K Mutation in the Mu Variant of SARS-CoV-2 Alters the Interactions with Monoclonal Antibodies from Class 2: A Free Energy Perturbation Study", Journal of Chemical Information and Modeling, 62(3), pp

35 Fratev F., (2021), "N501Y and K417N Mutations in the Spike Protein of SARS- CoV-2 Alter the Interactions with Both hACE2 and Human-Derived Antibody: A Free Energy of Perturbation Retrospective Study", Journal of Chemical Information and Modeling, 61(12), pp 6079–6084

36 Frauenfelder H., Sligar S G., Wolynes P G., (1991), "The energy landscapes and motions of proteins.", Science (New York, N.Y.), 254(5038), pp 1598–603

37 Gallicchio E., Lapelosa M., Levy R M., (2010), "Binding energy distribution analysis method (BEDAM) for estimation of Protein− Ligand binding affinities",

Journal of Chemical Theory and Computation, 6(9), pp 2961–2977

38 Ghersi D., Sanchez R., (2009), "EasyMIFS and SiteHound: a toolkit for the identification of ligand-binding sites in protein structures", Bioinformatics, 25(23), pp 3185–3186

39 Gibbs H H., (1873), "Izaak Walton", Notes and Queries, s4-XII(307), pp 382–

40 Gilson M K., Zhou H.-X., (2007), "Calculation of Protein-Ligand Binding Affinities", Annual Review of Biophysics and Biomolecular Structure, 36(1), pp 21–42

41 Gilson M K., Zhou H.-X., (2007), "Calculation of protein-ligand binding affinities", Annu Rev Biophys Biomol Struct., 36, pp 21–42

42 Gómez-Bombarelli R., Wei J N., Duvenaud D et al., (2018), "Automatic Chemical Design Using a Data-Driven Continuous Representation of Molecules",

43 Grebner C., Matter H., Kofink D et al., (2021), "Application of Deep Neural Network Models in Drug Discovery Programs", ChemMedChem, 16(24), pp

44 Guo Z., Li B., Cheng L.-T., Zhou S et al., (2015), "Identification of protein-ligand binding sites by the level-set variational implicit-solvent approach.", Journal of chemical theory and computation, 11(2), pp 753–65

45 Hansen S B., Sulzenbacher G., Huxford T., Marchot P., Taylor P., & Bourne Y., (2005), "Structures of Aplysia AChBP complexes with nicotinic agonists and antagonists reveal distinctive binding interfaces and conformations", The EMBO journal, 24(20), pp 3635–3646

46 Hendlich M., Rippmann F., Barnickel G., (1997), "LIGSITE: automatic and efficient detection of potential small molecule-binding sites in proteins", Journal of Molecular Graphics and Modelling, 15(6), pp 359–363

47 Henzler-Wildman K., Kern D., (2007), "Dynamic personalities of proteins",

48 Hernández-Rodríguez M., C Rosales-Hernández M., E Mendieta-Wejebe J., Martínez-Archundia M., & Correa Basurto J., (2016), "Current Tools and Methods in Molecular Dynamics (MD) Simulations for Drug Design", Current Medicinal

49 Hevener K E., Pesavento R., Ren J et al., (2018), "Hit-to-Lead: Hit Validation and Assessment", Methods in enzymology, 610, pp 265–309

50 Hollingsworth S A., Dror R O., (2018), "Molecular Dynamics Simulation for All", Neuron, 99(6), pp 1129–1143

51 Hopkins A L., Groom C R., (2002), "The druggable genome", Nature reviews Drug discovery, 1(9), pp 727–730

52 Hospital A., Goủi J R., Orozco M., Gelpớ J L., (2015), "Molecular dynamics simulations: Advances and applications", Molecules (Basel, Switzerland), 27(7), pp 2105

53 Hu X., Dong Q., Yang J., Zhang Y., (2016), "Recognizing metal and acid radical ion-binding sites by integrating ab initio modeling with template-based transferals", Bioinformatics, 32(21), pp 3260–3269

54 Jarrahi M H., (2018), "Artificial intelligence and the future of work: Human-AI symbiosis in organizational decision making", Business Horizons, 61(4), pp 577–

55 Jorgensen W L., Thomas L L., (2008), "Perspective on Free-Energy Perturbation Calculations for Chemical Equilibria", Journal of Chemical Theory and Computation, 4(6), pp 869–876

56 Jumper J., Evans R., Pritzel A et al., (2021), "Highly accurate protein structure prediction with AlphaFold", Nature, 596(7873), pp 583–589

57 Kang K M., Lee I., Nam H., Kim Y.-C., (2022), "AI-based prediction of new binding site and virtual screening for the discovery of novel P2X3 receptor antagonists", European Journal of Medicinal Chemistry, 240, pp 114556

58 Karplus M., & Kuriyan J., (2005), "Molecular dynamics and protein function",

Proceedings of the National Academy of Sciences, 102(19), pp 6679–6685

59 Kaul T., Eswaran M., Ahmad S., et al., (2020), "Probing the effect of a plus 1bp frameshift mutation in protein-DNA interface of domestication gene, NAMB1, in wheat", Journal of Biomolecular Structure and Dynamics, 38(12), pp 3633–3647

60 Khalak Y., Tresadern G., Hahn D F., de Groot B L., Gapsys V., (2022),

"Chemical Space Exploration with Active Learning and Alchemical Free Energies", Journal of Chemical Theory and Computation, 18(10), pp 6259–6270

61 Kitchen D B., Decornez H., Furr J R., Bajorath J., (2004), "Docking and scoring in virtual screening for drug discovery: methods and applications", Nature Reviews

62 Kleinberg J., (2018), "Inherent Trade-Offs in Algorithmic Fairness", In Abstracts of the 2018 ACM International Conference on Measurement and Modeling of Computer Systems (pp 40–40) New York, NY, USA: ACM

63 Kloog Y., Sokolovsky M., (1977), "Muscarinic acetylcholine receptors interactions: competition binding studies with agonists and antagonists", Brain Research, 134(1), pp 167–172

64 Kodadek T., (2008), "Molecular cloaking devices", Nature, 453(7197), pp 861–

65 Konc J., Hodošček M., Ogrizek M., et al., (2013), "Structure-based function prediction of uncharacterized protein using binding sites comparison", PLoS computational biology, 9(11), pp e1003341

66 Koshland D E., (1958), "Application of a Theory of Enzyme Specificity to Protein Synthesis", Proceedings of the National Academy of Sciences, 44(2), pp 98–104

67 Krivák R., Hoksza D., (2015), "Improving protein-ligand binding site prediction accuracy by classification of inner pocket points using local features", Journal of cheminformatics, 7, pp 1–13

68 Laskowski R A., (1995), "SURFNET: a program for visualizing molecular surfaces, cavities, and intermolecular interactions", Journal of molecular graphics,

"Protein clefts in molecular recognition and function.", Protein science: a publication of the Protein Society, 5(12), pp 2438

70 Lata K., Dave M., K.N N., (2019), "Data Augmentation Using Generative Adversarial Network", SSRN Electronic Journal

71 Levitt D G., Banaszak L J., (1992), "POCKET: a computer graphies method for identifying and displaying protein cavities and their surrounding amino acids",

Journal of molecular graphics, 10(4), pp 229–234

72 Li Z., Li X., Huang Y.-Y., et al (2020), "Identify potent SARS-CoV-2 main protease inhibitors via accelerated free energy perturbation-based virtual screening of existing drugs", Proceedings of the National Academy of Sciences, 117(44), pp 27381–27387

73 Liang L., Liu H., Xing G., et al., (2022), "Accurate calculation of absolute free energy of binding for SHP2 allosteric inhibitors using free energy perturbation",

Physical Chemistry Chemical Physics, 24(17), pp 9904–9920

74 Limongelli V., (2020), "Ligand binding free energy and kinetics calculation in 2020", WIREs Computational Molecular Science, 10(4)

75 Lin C.-T., Lin K.-L., Yang C.-H., et al., (2005), "Protein metal binding residue prediction based on neural networks", International journal of neural systems, 15(01n02), pp 71–84

76 Liu S.-Q., Ji X.-L., Tao Y., et al., (2012), "Protein Folding, Binding and Energy Landscape: A Synthesis", In Protein Engineering InTech

77 Lu W., Wu Q., Zhang J., Rao J., Li C., & Zheng S., (2022), "TANKBind: Trigonometry-Aware Neural NetworKs for Drug-Protein Binding Structure Prediction", bioRxiv, pp 2022.06.06.495043

78 Lu W., Zhang J., Huang W., et al., (2024), "DynamicBind: predicting ligand- specific protein-ligand complex structure with a deep equivariant generative model", Nature Communications, 15(1), pp 1071

79 Ma B., Shatsky M., Wolfson H J., Nussinov R., (2002), "Multiple diverse ligands binding at a single protein site: a matter of pre‐existing populations", Protein science, 11(2), pp 184–197

80 Macari G., Toti D., Polticelli F., (2019), "Computational methods and tools for binding site recognition between proteins and small molecules: from classical geometrical approaches to modern machine learning strategies", Journal of computer-aided molecular design, 33(10), pp 887–903

81 Mak K.-K., Pichika M R., (2019), "Artificial intelligence in drug development: present status and future prospects", Drug Discovery Today, 24(3), pp 773–780

82 McCammon J A., Gelin B R., Karplus M., (1977), "Dynamics of folded proteins",

83 McDonnell J M., Fushman D., Milliman C L., et al., (1999), "Solution structure of the proapoptotic molecule BID: a structural basis for apoptotic agonists and antagonists", Cell, 96(5), pp 625–634

84 McNutt A T., Francoeur P., Aggarwal R., et al (2021), "GNINA 1.0: molecular docking with deep learning", Journal of Cheminformatics, 13(1), pp 43

85 Meller A., De Oliveira S., Davtyan A et al., (2023), "Discovery of a cryptic pocket in the AI-predicted structure of PPM1D phosphatase explains the binding site and potency of its allosteric inhibitors", Frontiers in Molecular Biosciences, 10

86 Meller A., Ward M., Borowsky J., et al., (2023), "Predicting locations of cryptic pockets from single protein structures using the PocketMiner graph neural network", Nature Communications, 14(1), pp 1177

87 Miller D W., Dill K A., (1997), "Ligand binding to proteins: the binding landscape model", Protein science, 6(10), pp 2166–2179

88 Minh D., Wang H X., Li Y F., Nguyen T N., (2022), "Explainable artificial intelligence: a comprehensive review", Artificial Intelligence Review, 55(5), pp

89 Miyazaki I., Odintsov I., Ishida K., et al (2023), "Vepafestinib is a pharmacologically advanced RET-selective inhibitor with high CNS penetration and inhibitory activity against RET solvent front mutations", Nature Cancer, 4(9), pp 1345–1361

90 Mohs R C., Greig N H., (2017), "Drug discovery and development: Role of basic biological research", Alzheimer’s & Dementia: Translational Research & Clinical

91 Muegge I., Hu Y., (2023), "Recent Advances in Alchemical Binding Free Energy Calculations for Drug Discovery", ACS Medicinal Chemistry Letters, 14(3), pp

92 Müller S., Chaikuad A., Gray N S., Knapp S., (2015), "The ins and outs of selective kinase inhibitor development", Nature chemical biology, 11(11), pp

93 Nussinov R., Ma B., Tsai C.-J., (2014), "Multiple conformational selection and induced fit events take place in allosteric propagation.", Biophysical chemistry,

94 Nussinov R., Tsai C.-J., (2013), "Allostery in Disease and in Drug Discovery",

95 Odell L R., Abdel-Hamid M K., Hill T A., et al (2017), "Pyrimidine-based inhibitors of dynamin I GTPase activity: competitive inhibition at the Pleckstrin homology domain", Journal of Medicinal Chemistry, 60(1), pp 349–361

96 Onuchic J N., Wolynes P G., (2004), "Theory of protein folding", Current Opinion in Structural Biology, 14(1), pp 70–75

97 Pastore A., Martin S R., Politou A et al., (2007), "Unbiased cold denaturation: low- and high-temperature unfolding of yeast frataxin under physiological conditions.", Journal of the American Chemical Society, 129(17), pp 5374–5

98 Paul D., Sanap G., Shenoy S., Kalyane D et al., (2021), "Artificial intelligence in drug discovery and development", Drug Discovery Today, 26(1), pp 80–93

99 Paulsen J L., Yu H S., Sindhikara D et al., (2020), "Evaluation of Free Energy Calculations for the Prioritization of Macrocycle Synthesis", Journal of Chemical

100 Pavlova A., Bassit L., Cox B D et al., (2022), "The Mechanism of Action of Hepatitis B Virus Capsid Assembly Modulators Can Be Predicted from Binding to Early Assembly Intermediates", Journal of Medicinal Chemistry, 65(6), pp

101 Peng S., McMahon J M., Schatz G C et al., (2010), "Reversing the size- dependence of surface plasmon resonances", Proceedings of the National Academy of Sciences, 107(33), pp 14530–14534

Ngày đăng: 23/08/2024, 00:40

HÌNH ẢNH LIÊN QUAN

Hình 1: Sơ đồ giải thích các cách kết hợp của phối tử và protein - trần ngân hà tổng quan về mối liên quan cấu trúc protein phối tử và ứng dụng trí tuệ nhân tạo ai trong nghiên cứu cấu trúc protein phối tử
Hình 1 Sơ đồ giải thích các cách kết hợp của phối tử và protein (Trang 11)
Hình 2: Vị trí liên kết giữa protein và phối tử được minh họa thông qua tương tác giữa neuraminidase và peramivir - trần ngân hà tổng quan về mối liên quan cấu trúc protein phối tử và ứng dụng trí tuệ nhân tạo ai trong nghiên cứu cấu trúc protein phối tử
Hình 2 Vị trí liên kết giữa protein và phối tử được minh họa thông qua tương tác giữa neuraminidase và peramivir (Trang 15)
Hình 3: Dự đoán in silico của hai chất ức chế tương tự nhau được docking vào vị trí liên kết-2 của miền PH của dynamin-1 ở người - trần ngân hà tổng quan về mối liên quan cấu trúc protein phối tử và ứng dụng trí tuệ nhân tạo ai trong nghiên cứu cấu trúc protein phối tử
Hình 3 Dự đoán in silico của hai chất ức chế tương tự nhau được docking vào vị trí liên kết-2 của miền PH của dynamin-1 ở người (Trang 16)
Bảng 1: Cập nhật một số ứng dụng của AI trong việc dự đoán vị trí liên kết - trần ngân hà tổng quan về mối liên quan cấu trúc protein phối tử và ứng dụng trí tuệ nhân tạo ai trong nghiên cứu cấu trúc protein phối tử
Bảng 1 Cập nhật một số ứng dụng của AI trong việc dự đoán vị trí liên kết (Trang 23)
Hình 4: Dự đoán vị trí liên kết ẩn của SETD2 - trần ngân hà tổng quan về mối liên quan cấu trúc protein phối tử và ứng dụng trí tuệ nhân tạo ai trong nghiên cứu cấu trúc protein phối tử
Hình 4 Dự đoán vị trí liên kết ẩn của SETD2 (Trang 24)
Hình 5: Quy trình làm việc của Diffdock - trần ngân hà tổng quan về mối liên quan cấu trúc protein phối tử và ứng dụng trí tuệ nhân tạo ai trong nghiên cứu cấu trúc protein phối tử
Hình 5 Quy trình làm việc của Diffdock (Trang 27)
Bảng 3: Một số ứng dụng của DiffDock trong dự đoán tương tác phối tử-protein - trần ngân hà tổng quan về mối liên quan cấu trúc protein phối tử và ứng dụng trí tuệ nhân tạo ai trong nghiên cứu cấu trúc protein phối tử
Bảng 3 Một số ứng dụng của DiffDock trong dự đoán tương tác phối tử-protein (Trang 27)
Hình 6: Chu kỳ nhiệt động học sử dụng để tính toán sự thay đổi năng lượng liên kết tự do tương đối (ΔΔG) trong phương pháp Nhiễu loạn năng lượng tự do - trần ngân hà tổng quan về mối liên quan cấu trúc protein phối tử và ứng dụng trí tuệ nhân tạo ai trong nghiên cứu cấu trúc protein phối tử
Hình 6 Chu kỳ nhiệt động học sử dụng để tính toán sự thay đổi năng lượng liên kết tự do tương đối (ΔΔG) trong phương pháp Nhiễu loạn năng lượng tự do (Trang 33)
Hình 7: Sơ đồ học tập tích cực [60] - trần ngân hà tổng quan về mối liên quan cấu trúc protein phối tử và ứng dụng trí tuệ nhân tạo ai trong nghiên cứu cấu trúc protein phối tử
Hình 7 Sơ đồ học tập tích cực [60] (Trang 36)
Hình 8: Các phối tử có liên kết mạnh nhất được tìm thấy, năng lượng liên kết tự do của  chúng và hướng liên kết của chúng trong mẫu được lấy từ động lực học phân tử [60] - trần ngân hà tổng quan về mối liên quan cấu trúc protein phối tử và ứng dụng trí tuệ nhân tạo ai trong nghiên cứu cấu trúc protein phối tử
Hình 8 Các phối tử có liên kết mạnh nhất được tìm thấy, năng lượng liên kết tự do của chúng và hướng liên kết của chúng trong mẫu được lấy từ động lực học phân tử [60] (Trang 37)

TÀI LIỆU CÙNG NGƯỜI DÙNG

  • Đang cập nhật ...

TÀI LIỆU LIÊN QUAN