NHIỆM VỤ VÀ NỘI DUNG: - Thu thập cấu trúc các hợp chất trong các loài của họ thực vật Dâu tằm trên thế giới, cấu trúc một số thụ thể có liên quan đến virus SARS-CoV-2.. TÓM TẮT LUẬN VĂN
Trang 1TRƯỜNG ĐẠI HỌC BÁCH KHOA
NGUYỄN THÀNH ĐẠT
NGHIÊN CỨU KHẢ NĂNG ĐIỀU TRỊ COVID-19 CỦA CÁC HỢP CHẤT TIỀM NĂNG TỪ HỌ THỰC VẬT DÂU TẰM BẰNG PHƯƠNG PHÁP MÔ PHỎNG MÁY TÍNH
Chuyên ngành: Công nghệ sinh học Mã số: 8420201
LUẬN VĂN THẠC SĨ
TP HỒ CHÍ MINH, tháng 6 năm 2024
Trang 2Công trình này được hoàn thành tại: Trường Đại học Bách Khoa – ĐHQG-HCM
Cán bộ hướng dẫn khoa học: PGS TS Lê Thị Thủy Tiên
TS Nguyễn Quốc Thái
CHỦ TỊCH HỘI ĐỒNG TRƯỞNG KHOA KỸ THUẬT HÓA HỌC
Trang 3BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA
CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập - Tự do - Hạnh phúc NHIỆM VỤ LUẬN VĂN THẠC SĨ
I TÊN ĐỀ TÀI: Nghiên cứu khả năng điều trị bệnh Covid-19 của các hợp chất tiềm
năng từ họ thực vật dâu tằm bằng phương pháp mô phỏng máy tính (Study on the
therapeutic possibilities against COVID-19 of compounds from Moraceae family
based on computer simulation)
II NHIỆM VỤ VÀ NỘI DUNG:
- Thu thập cấu trúc các hợp chất trong các loài của họ thực vật Dâu tằm trên thế
giới, cấu trúc một số thụ thể có liên quan đến virus SARS-CoV-2 - Xác định mức độ tương tác giữa từng hợp chất với các thụ thể - Xác định tính khả thi để sử dụng làm dược phẩm của một số hợp chất - Xác định cơ chế tương tác của một số hợp chất với các thụ thể
- Mô phỏng hệ hợp chất-thụ thể trong môi trường nước, trên hợp chất tiềm năng nhất
III NGÀY GIAO NHIỆM VỤ: 04/09/2023IV NGÀY HOÀN THÀNH NHIỆM VỤ:V CÁN BỘ HƯỚNG DẪN: PGS TS Lê Thị Thủy Tiên – TS Nguyễn Quốc Thái
PGS TS Lê Thị Thủy Tiên TS Nguyễn Quốc Thái
TRƯỞNG KHOA KỸ THUẬT HÓA HỌC
(Họ tên và chữ ký)
Trang 4LỜI CẢM ƠN
Để có thể hoàn thành luận văn Thạc sĩ này, ngoài nỗ lực của bản thân, em xin được gửi lời cảm ơn chân thành đến Quý Thầy/Cô, Quý Anh/Chị/Em đồng nghiệp, bạn bè và gia đình
Đầu tiên, em xin gửi lời cảm ơn sâu sắc đến Phó Giáo sư, Tiến sĩ Lê Thị Thủy Tiên, Trưởng bộ môn Công nghệ Sinh học, Khoa Kỹ thuật Hóa học, Trường Đại học Bách Khoa, Đại học Quốc Gia Hồ Chí Minh Cô rất quan tâm, sâu sát và những lời động viên của Cô đã cho em động lực hoàn thành từng câu, từng chữ trong luận văn này
Em xin gửi lời cảm ơn sâu sắc đến Tiến sĩ Nguyễn Quốc Thái, Khoa Sư phạm Khoa học Tự nhiên – Trường Sư phạm, Trường Đại học Đồng Tháp Tuy Thầy-trò chỉ có thể trao đổi trực tuyến nhưng đã hỗ trợ em những góc nhìn kinh nghiệm, chuyên sâu, đúng đắn, trực tiếp liên quan đến phương pháp của luận văn
Em xin gửi lời cảm ơn đến các Quý Thầy/Cô, Quý Anh/Chị từ các Khoa, Phòng, Ban của Trường Đại học Bách Khoa, Đại học Quốc Gia Hồ Chí Minh đã đồng hành, hỗ trợ em về kiến thức, kinh nghiệm, hướng dẫn các thủ tục hành chính, hỗ trợ giải quyết sự vụ trong suốt quãng thời gian học tập tại Trường
Em xin gửi lời cảm ơn đến Phó Giáo sư, Tiến sĩ Lê Thị Kim Oanh và các Anh/Chị Em đồng nghiệp đang công tác tại Phòng Phát triển nghiên cứu khoa học, Trường Đại học Văn Lang đã hỗ trợ em về mặt tinh thần trong quãng thời gian thực hiện nhiệm vụ
Em cảm ơn chị Phạm Thị Ngọc Thanh đã luôn lắng nghe những cập nhật về cuộc sống của em Mình cảm ơn bạn Nguyễn Thế Thảo Nguyên với những lời động viên ở giai đoạn cuối của nhiệm vụ Mình cảm ơn hai bạn Đinh Nguyên Hảo và Đinh Nguyên Hương đã hỗ trợ thực hiện các hình ảnh minh họa Mình cảm ơn bạn Phạm Thị Mai Linh đã chia sẻ những khó khăn khi thực hiện nhiệm vụ Mình cảm ơn bạn Nguyễn Lữ Nguyệt Hằng và bạn Nguyễn Võ Minh Trung đã chia sẻ những kinh nghiệm hành chính khi thực hiện nhiệm vụ
Con xin gửi lời cảm ơn đến gia đình, người thân đã luôn hỗ trợ, động viên con trong lúc tưởng chừng nhiệm vụ không thể tiếp tục
Cuối cùng, em xin chúc sức khỏe, trí lực đến Quý Thầy/Cô, Quý Anh/Chị/Em, bạn bè và gia đình Rất mong trong tương lai sẽ tiếp tục được đồng hành, học tập, làm việc cùng Quý Thầy/Cô, Quý Anh/Chị/Em và các bạn
Trân trọng cảm ơn
Trang 5TÓM TẮT LUẬN VĂN
Đề tài “Nghiên cứu khả năng điều trị COVID-19 của các hợp chất tiềm năng từ họ thực vật Dâu tằm bằng phương pháp mô phỏng máy tính” đã được thực hiện nhằm khảo sát các hợp chất đã được ghi nhận có trong họ thực vật Dâu tằm trên thế giới và khả năng điều trị bệnh COVID-19 thông qua đánh giá tác động của các hợp chất đến một số thụ thể có liên quan đến virus SARS-CoV-2 gây bệnh này, bằng các phương pháp mô phỏng máy tính
Kết quả cho thấy, trong các chất có mức độ tương tác cao với các thụ thể có liên quan thông qua kỹ thuật docking, có khả năng được ứng dụng làm dược phẩm thông qua đánh giá cấu trúc chất; Albanol B (CID 480819) là hợp chất có khả năng tương tác tốt với phần lớn các thụ thể có liên quan đến bệnh, có khả năng ứng dụng làm dược phẩm cao nhất
Kết quả đánh giá ban đầu về tính khả thi trong thực tế bằng phương pháp mô phỏng động lực học phân tử với các thụ thể, khả năng tương tác và tác động lên cấu trúc của thụ thể của Albanol B là cao nhất đối với hai thụ thể không có chức năng cấu trúc là nsp3 và nsp5
Trang 6ABSTRACT
The work “Study on the therapeutic possibilities against COVID-19 of
compounds from Moraceae family based on computer simulation” was carried out to gather the recorded compounds exist in plants from Moraceae family in the biosphere
and evaluate its potential to treat COVID-19 via analysing moleclar interactions with various related receptors by computational simulation methods
According to the results, by calculating the intensity of interaction by molecular docking and predicting the possibility of using as a medicine in the future by structural analysis, the compound Albanol B is among the highest score of interaction with a wide range of receptors and is the most effortless one to conduct further research to output a medicine
By molecular dynamic simulations, Albanol B (CID 480819) showed the highest possibility to interact and causing conformational change to the two non-structural proteins, nsp3 and nsp5 This conclusion posed a lead for further analysis and research
Trang 7LỜI CAM ĐOAN
Tôi, học viên Nguyễn Thành Đạt, mã số học viên 2170486, thuộc bộ môn Công nghệ Sinh học, khoa Kỹ thuật hóa học, Trường Đại học Bách Khoa, Đại học Quốc Gia thành phố Hồ Chí Minh, cam đoan toàn bộ kết quả của đề tài này được thực hiện trung thực Không có câu văn, hình ảnh nào là sản phẩm của đạo văn và/hoặc từ các ứng dụng trí tuệ nhân tạo Tất cả các công cụ sử dụng trong nhiệm vụ tuân thủ Luật Sở hữu trí tuệ Việt Nam hiện hành Tôi cam đoan không có xung đột lợi ích với cá nhân, tổ chức về nội dung, kết quả của nhiệm vụ
Học viên cao học
Nguyễn Thành Đạt
Trang 81.1.2 Các cơ quan trong cơ thể bị tác động bởi virus SARS-CoV-2 4
1.1.3 Quá trình phát sinh bệnh COVID-19 5
1.2 Tổng quan về virus SARS-CoV-2 5
1.2.1 Khái quát về cấu trúc của virus SARS-CoV-2 và chức năng của các protein 5
1.2.2 Những protein trên virus SARS-CoV-2: các thụ thể không cấu trúc 7
1.2.3 Những protein trên virus SARS-CoV-2: các thụ thể cấu trúc 13
1.2.4 Những protein trên virus SARS-CoV-2: các thụ thể phụ 15
1.3 Những thụ thể mục tiêu trên tế bào người 16
1.3.1 ACE2 16
1.3.2 TMPRSS2 17
1.4 Cơ chế xâm nhập và chu kì sinh trưởng của virus SARS-CoV-2 17
1.4.1 Cơ chế xâm nhập 17
1.4.2 Chu kì sinh trưởng của virus SARS-CoV-2 19
1.5 Các biến chủng của virus SARS-CoV-2 21
1.6.3 Dự đoán tính khả thi khi sử dụng làm thuốc 29
1.7 Tiềm năng của thực vật trong điều trị COVID-19 31
Trang 91.7.1 Các nhóm chất có hoạt tính từ thực vật 31
1.7.2 Các nghiên cứu in silico sử dụng thực vật trong điều trị COVID-19 33
1.7.3 Các nghiên cứu in vitro sử dụng thực vật trong điều trị COVID-19 34
1.7.4 Các nghiên cứu trên người sử dụng thực vật trong điều trị COVID-19 35
1.7.5 Khái quát họ thực vật Dâu tằm 38
CHƯƠNG 2 VẬT LIỆU – PHƯƠNG PHÁP 41
2.3.3 Quy trình đánh giá tính khả thi khi sử dụng làm thuốc 49
2.3.4 Quy trình thực hiện mô phỏng động lực học phân tử 50
CHƯƠNG 3 KẾT QUẢ - THẢO LUẬN 54
3.1 Kết quả 54
3.1.1 Kết quả docking 54
3.1.2 Kết quả tính khả thi để phát triển thuốc 58
3.1.3 Kết quả pharmacophore 60
3.1.4 Kết quả và đánh giá kết quả SMD 64
3.1.5 Kết quả mô phỏng động lực học phân tử 67
4.2 Kiến nghị hướng nghiên cứu tiếp theo 88
TÀI LIỆU THAM KHẢO 89
PHỤ LỤC 112
Trang 10DANH MỤC BẢNG
Bảng 1.1 Một số hợp chất tiêu biểu trong các bộ phận của một số loài thực vật
thuộc chi Dâu tằm 40
Bảng 2.1 Các phương pháp dự đoán tính giống thuốc và các thông số giới hạn
tương ứng dựa trên cấu trúc của hợp chất 43
Bảng 2.2 Danh sách các thụ thể mục tiêu 49 Bảng 3.1 10 hợp chất có kết quả docking xuất hiện trong nhiều thụ thể nhất,
thuộc nhóm 1% kết quả tốt nhất của các thụ thể 55
Bảng 3.2 Kết quả hệ số tương quan kết quả docking giữa 07 thụ thể,
Trang 11Lộc, Lâm Đồng, ngày 9/5/2009 A Tiêu bản, B Tinh thể calcium nhiều trong mô mềm, C Hoa D Vỏ thân có nốt sần 39
Hình 2.1 Sơ đồ quy trình chung 47 Hình 2.2 Sơ đồ quy trình thực hiện MD và một số dòng lệnh có liên quan 53 Hình 3.1 Biểu đồ phân bố kết quả docking của 2064 hợp chất với 07 thụ thể
(giá trị càng thấp biểu hiện mức độ tương tác càng cao) 54
Hình 3.2 Vị trí liên kết của CID 480819 với 07 thụ thể A nsp5_6LU7, B nucleocapsid_6M3M, C nsp12_nsp7_nsp8_6M71, D nsp9_6W4B, E nsp10_nsp16_6W4H, F nsp3_6WOJ, G TMPRSS2_7MEQ 57 Hình 3.3 Cấu trúc của 02 hợp chất A CID 480819 và B CID 102384791 59 Hình 3.4 Đồ thị lực kéo theo thời gian nhận được bằng phương pháp SMD
với 20 quỹ đạo cho hệ CID 480819 và 07 thụ thể 65
Hình 3.5 Sự tương quan giữa năng lượng liên kết (phương pháp docking)
và lực kéo cực đại (phương pháp SMD) 66
Hình 3.6 Biểu đồ kết quả RMSD của thụ thể nsp5_6LU7 (hồng)
và thụ thể trong hệ thụ thể-ligand nsp5_6LU7_ligand (xanh), trong môi trường nước, trong 50 ns 67
Hình 3.7 Biểu đồ kết quả Rg của thụ thể nsp5_6LU7 (hồng) và thụ thể trong hệ thụ thể-ligand nsp5_6LU7_ligand (xanh), trong môi trường nước, trong 50 ns 67
Trang 12Hình 3.8 Biểu đồ kết quả SASA của thụ thể nsp5_6LU7 (hồng) và thụ thể trong hệ
thụ thể-ligand nsp5_6LU7_ligand (xanh), trong môi trường nước, trong 50 ns 68
Hình 3.9 Biểu đồ số lượng liên kết hydro giữa thụ thể nsp5_6LU7 và ligand, trong
môi trường nước, trong 50 ns 68
Hình 3.10 Biểu đồ RMSD của riêng ligand trong mô phỏng hệ thụ thể
nsp5_6LU7_ligand, trong môi trường nước, trong 50 ns 69
Hình 3.11 Biểu đồ thế năng Coulomb (xanh) và thế năng Lennard-Jones (hồng)
của hệ thụ thể-ligand nsp5_6LU7_ligand, trong môi trường nước, trong 50 ns 69
Hình 3.12 Biểu đồ kết quả RMSD của thụ thể TMPRSS2_7MEQ (hồng)
và thụ thể trong hệ thụ thể-ligand TMPRSS2_7MEQ_ligand (xanh), trong môi trường nước, trong 50 ns 70
Hình 3.13 Biểu đồ kết quả Rg của thụ thể TMPRSS2_7MEQ (hồng) và thụ thể trong hệ thụ thể-ligand TMPRSS2_7MEQ_ligand (xanh), trong môi trường nước, trong 50 ns 71
Hình 3.14 Biểu đồ kết quả SASA của thụ thể TMPRSS2_7MEQ (hồng)
và thụ thể trong hệ thụ thể-ligand TMPRSS2_7MEQ_ligand (xanh), trong môi trường nước, trong 50 ns 71
Hình 3.15 Biểu đồ số lượng liên kết hydro giữa thụ thể TMPRSS2_7MEQ
và ligand, trong môi trường nước, trong 50 ns 72
Hình 3.16 Biểu đồ RMSD của riêng ligand trong hệ thụ thể
TMPRSS2_7MEQ_ligand, trong môi trường nước, trong 50 ns 73
Hình 3.17 Biểu đồ thế năng Coulomb (xanh) và thế năng Lennard-Jones (hồng)
của hệ thụ thể-ligand TMPRSS2_7MEQ_ligand, trong môi trường nước, trong 50 ns 73
Hình 3.18 Biểu đồ kết quả RMSD của thụ thể nps3_6WOJ (hồng)
và thụ thể trong hệ thụ thể-ligand nps3_6WOJ_ligand (xanh), trong môi trường nước, trong 50 ns 74
Hình 3.19 Biểu đồ kết quả Rg của thụ thể nps3_6WOJ (hồng) và thụ thể trong hệ thụ thể-ligand nps3_6WOJ_ligand (xanh), trong môi trường nước, trong 50 ns 74
Trang 13Hình 3.20 Biểu đồ kết quả SASA của thụ thể nps3_6WOJ (hồng)
và thụ thể trong hệ thụ thể-ligand nps3_6WOJ_ligand (xanh), trong môi trường nước, trong 50 ns 75
Hình 3.21 Biểu đồ số lượng liên kết hydro giữa thụ thể nps3_6WOJ và ligand,
trong môi trường nước, trong 50 ns 75
Hình 3.22 Biểu đồ RMSD của ligand trong mô phỏng hệ thụ thể
nps3_6WOJ_ligand, trong môi trường nước, trong 50 ns 76
Hình 3.23 Biểu đồ thế năng Coulomb (xanh) và thế năng Lennard-Jones (hồng)
của hệ thụ thể-ligand nps3_6WOJ_ligand, trong môi trường nước, trong 50 ns 76
Hình 3.24 Biểu đồ kết quả RMSD của thụ thể nsp9_6W4B (hồng)
và thụ thể trong hệ thụ thể-ligand nsp9_6W4B_ligand (xanh), trong môi trường nước, trong 50 ns 77
Hình 3.25 Biểu đồ kết quả Rg của thụ thể nsp9_6W4B (hồng) và thụ thể trong hệ thụ thể-ligand nsp9_6W4B_ligand (xanh), trong môi trường nước, trong 50 ns 77
Hình 3.26 Biểu đồ kết quả SASA của thụ thể nsp9_6W4B (hồng)
và thụ thể trong hệ thụ thể-ligand nsp9_6W4B_ligand (xanh), trong môi trường nước, trong 50 ns 78
Hình 3.27 Biểu đồ số lượng liên kết hydro giữa thụ thể nsp9_6W4B và ligand,
trong môi trường nước, trong 50 ns 78
Hình 3.28 Biểu đồ RMSD của riêng ligand trong mô phỏng hệ thụ thể
nsp9_6W4B_ligand, trong môi trường nước, trong 50 ns 79
Hình 3.29 Biểu đồ thế năng Coulomb (xanh) và thế năng Lennard-Jones (hồng)
của hệ thụ thể-ligand nsp9_6W4B_ligand, trong môi trường nước, trong 50 ns 79
Hình 3.30 Biểu đồ kết quả RMSD của thụ thể nucleocapsid_6M3M (hồng)
và thụ thể trong hệ thụ thể-ligand nucleocapsid_6M3M_ligand (xanh), trong môi trường nước, trong 50 ns 80
Hình 3.31 Biểu đồ kết quả Rg của thụ thể nucleocapsid_6M3M (hồng) và thụ thể trong hệ thụ thể-ligand nucleocapsid_6M3M_ligand (xanh), trong môi trường nước, trong 50 ns 81
Trang 14Hình 3.32 Biểu đồ kết quả SASA của thụ thể nucleocapsid_6M3M (hồng) và thụ
thể trong hệ thụ thể-ligand nucleocapsid_6M3M_ligand (xanh), trong môi trường nước, trong 50 ns 81
Hình 3.33 Biểu đồ số lượng liên kết hydro giữa thụ thể nucleocapsid_6M3M và
ligand, trong môi trường nước, trong 50 ns 82
Hình 3.34 Biểu đồ RMSD của ligand trong mô phỏng hệ thụ thể
nucleocapsid_6M3M_ligand, trong môi trường nước, trong 50 ns 82
Hình 3.35 Biểu đồ thế năng Coulomb (xanh) và thế năng Lennard-Jones (hồng)
của hệ thụ thể-ligand nucleocapsid_6M3M_ligand, trong môi trường nước, trong 50 ns 83
Trang 15chủng mới của virus corona
Ngân hàng dữ liệu protein (hoặc dạng file cấu trúc protein từ cơ sở dữ liệu này)
polymerase
Phức hợp RNA polymerase phụ thuộc RNA
polymerase chain reaction
Phản ứng chuỗi polymerase phiên mã ngược
CoV-2
SARS-Severe acute respiratory syndrome coronavirus 2
Virus corona gây hội chứng hô hấp cấp tính nặng 2
Trang 16MỞ ĐẦU
1 Lý do chọn đề tài
Trong bốn năm trở lại đây, sự xuất hiện của bệnh COVID-19 gây ra bởi virus SARS-CoV-2 đã, đang và sẽ có những ảnh hưởng nghiêm trọng đến sức khỏe, an ninh, kinh tế, xã hội của tất cả các quốc gia trên thế giới và Việt Nam cũng không nằm ngoài tác động đó Khoảng nửa sau năm 2021, nước ta chứng kiến dịch bệnh hoành hành, nhất là tại các tỉnh phía Nam, gây thiệt hại không nhỏ về nhân mạng và ảnh hưởng sâu sắc đến an sinh xã hội Các quy định về giãn cách xã hội, cùng sự xuất hiện nhanh kỉ lục của các loại vắc-xin đã góp phần đẩy lùi dịch bệnh, đưa nước ta trở về trạng thái bình thường Tuy nhiên, do bản chất là virus nên SARS-CoV-2 có khả năng đột biến rất nhanh Do đó, các nhóm nghiên cứu vẫn đang phát triển những cách tiếp cận sâu sát hơn, tập trung vào những vị trí cốt yếu mà virus ít biến đổi theo thời gian, đem lại những giải pháp chữa trị, phòng ngừa bền vững
Một trong những giải pháp tiềm năng là sử dụng các chất có hoạt tính có nguồn gốc từ các loài thảo dược tự nhiên Nghị quyết số 36-NQ/TW ngày 30 tháng 01 năm 2023 của Bộ Chính trị, về phát triển và ứng dụng công nghệ sinh học phục vụ phát triển bền vững đất nước trong tình hình mới, có đề cập đến nhiệm vụ “sản xuất nguyên liệu và các loại thuốc sinh học, thực phẩm chức năng có nguồn gốc từ thảo dược” Đây là sự chỉ đạo rõ ràng, cao nhất về định hướng phát triển, ứng dụng các hợp chất có hoạt tính vào đời sống Tuy nhiên, để kết luận tính khả thi của các hợp chất này sẽ kéo dài nhiều năm Để hỗ trợ quá trình nghiên cứu nhằm đưa ra kết luận về một hợp chất có thể được sử dụng làm dược phẩm hay không, cần có những cách phương pháp mới nhằm rút ngắn thời gian nghiên cứu Một trong các cách tiếp cận đang có ưu thế là mô phỏng, sử dụng sức mạnh tính toán của máy tính để đưa ra những nhận định lý thuyết ban đầu về mức độ, cơ chế tương tác, tính an toàn; làm nền tảng cho các nghiên cứu trực tiếp trên sinh vật sống sau này
2 Mục tiêu nghiên cứu
Mục tiêu lý thuyết: Đánh giá được khả năng tác động của các hợp chất có hoạt tính và trả lời tính khả thi về mặt hóa lý khi sử dụng các chất đó trong việc ngăn chặn
Trang 17sự xâm nhập, hoạt động, sinh trưởng của virus SARS-CoV-2 trong điều kiện mô phỏng, cô lập
Mục tiêu ứng dụng: Thông qua những kết quả định tính, định lượng từ các phương pháp tính toán và mô phỏng, luận văn sẽ đưa ra gợi ý về tính an toàn, tính khả thi trong việc sử dụng các hợp chất từ họ một họ thực vật phổ biến trong hỗ trợ điều trị bệnh nhân mắc COVID-19 Qua đó, mở đường cho các nghiên cứu thực nghiệm trên tế bào và các sinh vật sống
4 Đối tượng và phạm vi nghiên cứu
Các cấu trúc các hợp chất có hoạt tính trong họ thực vật Dâu tằm; cấu trúc các thụ thể protein của virus SARS-CoV-2 và một cấu trúc thụ thể tế bào người có liên quan Phạm vi không gian của nghiên cứu là trên hai hệ thống máy tính được thiết lập để đáp ứng các yêu cầu về khả năng thực thi các tác vụ tính toán dựa trên các công cụ được sử dụng
5 Ý nghĩa khoa học của đề tài nghiên cứu
Trình bày chi tiết cách tiếp cận phù hợp cho các nghiên cứu sử dụng phương pháp mô phỏng Trình bày được những ưu điểm, thách thức khi sử dụng phương pháp này; so sánh với các phương pháp thực nghiệm hiện nay Sử dụng hiệu quả sức mạnh máy tính, phương pháp mô phỏng phù hợp với tiêu chuẩn; ứng dụng phần mềm, kỹ thuật hiện đại để xử lý và phân tích kết quả mô phỏng Khối lượng tính toán lớn, cho kết quả nhanh, chính xác và tin cậy ở mức độ nhất định
6 Giá trị thực tiễn của đề tài nghiên cứu
Đánh giá được khả năng, cơ chế tác động của các chất có hoạt tính và trả lời tính khả thi khi sử dụng các chất đó trong việc ngăn chặn sự sinh trưởng của virus SARS-CoV-2 trong điều kiện mô phỏng tính toán, hệ cô lập Qua đó, đưa ra những gợi ý trong việc sử dụng các chất này trong hỗ trợ điều trị bệnh nhân mắc COVID-19 Đánh giá về khả năng tương tác giữa các chất có hoạt tính, tiềm năng từ họ thực vật Dâu tằm trên thế giới, với một số thụ thể của virus SARS-CoV-2 và một thụ thể của người có liên quan đến bệnh COVID-19
Trang 18Tuy những tiến bộ trong sản xuất vắc-xin đã làm giảm đáng kể số ca nhiễm và tử vong [8] nhưng mối nguy về những đợt bùng phát xuất hiện từ những biến chủng mới vẫn còn hiện hữu, tiêu biểu là sự xuất hiện của biến chủng Omicron với cấu trúc một thụ thể bề mặt có mức độ khác biệt cao so với các chủng trước đây, do bản chất virus có tốc độ đột biến cao hơn các loại mầm bệnh khác [9]
Trang 191.1.2 Các cơ quan trong cơ thể bị tác động bởi virus SARS-CoV-2
Sau khi xâm nhập thông qua đường hô hấp, các loại Coronavirus, như virus
SARS-CoV (còn gọi là SARS-CoV-1, virus gây dịch SARS đầu những năm 2000), sẽ tấn công vào các tế bào biểu mô phế nang, biểu mô mạch máu và các đại thực bào ở phế nang [10], thông qua quá trình bám vào thụ thể angiotensin-converting enzyme 2 (ACE2) trên bề mặt của các tế bào tại đây Những vị trí này có thể là nơi khởi đầu quá trình xâm nhập và sau đó là phân chia của virus vì có mức độ biểu hiện thụ thể ACE2 cao, hơn cả trên phổi [11] Ngoài ra, có thể xem sự tác động của virus lên cơ thể không chỉ dựa trên duy nhất một thụ thể mà là một sự tổng hòa của nhiều yếu tố khác, mang những đặc điểm đặc trưng sau:
Đầu tiên, ngoài ACE2, sự xâm nhập vào tế bào của virus còn phụ thuộc vào sự xuất hiện của thụ thể transmembrane protease serine 2 (TMPRSS2) vì có những trường hợp virus xâm nhập vào tế bào gần như không biểu hiện ACE2 trên bề mặt, miễn là TMPRSSS2 có xuất hiện trên bề mặt tế bào [12] Thứ hai, sự biểu hiện phiên mã mRNA của các gene của tế bào vật chủ có liên hệ đến chu kì sinh trưởng SARS-CoV-2 (như hệ endosomal sorting complex, liên hệ đến quá trình xuất bào của virus), cao hơn ở quần thể người có tế bào biểu mô phế nang loại II, vốn có nhiều ACE2 ở bề mặt tế bào hơn các loại tế bào hô hấp khác [13] Điều này cho thấy tế bào biểu mô phế nang loại II có thể là mục tiêu chính của virus vì lượng ACE2 trên bề mặt của nó Cuối cùng, khác với SARS-CoV-1, SARS-CoV-2 có một cơ chế đặc trưng là sự chỉnh sửa một phần thụ thể bám bằng enzyme furin, để quá trình xâm nhập không phụ thuộc hoàn toàn vào các thụ thể đã nêu của tế bào vật chủ, tăng tỉ lệ xâm nhập vào các loại tế bào khác Furin có nhiều trong tế bào biểu mô phế quản [14]
Một điểm khác biệt nữa so với SARS-CoV-1 là SARS-CoV-2 có khả năng làm lây nhiễm đường hô hấp trên hiệu quả hơn, như tại vòm mũi họng và hầu họng Các mô tại các khu vực này có biểu hiện ACE2, mà SARS-CoV-2 có khả năng bám vào mạnh hơn [15] Việc dễ dàng xác nhận sự hiện diện của virus ở khu vực này trên các mẫu chất nhầy của bệnh nhân trong giai đoạn tiền triệu chứng phần nào giải thích cho sự lây lan mạnh hơn của SARS-CoV-2 so với SARS-CoV-1 [16]
Trang 201.1.3 Quá trình phát sinh bệnh COVID-19
Cảm cúm thông thường do Coronavirus gây ra chỉ dẫn đến những triệu chứng
nhẹ ở khu vực đường hô hấp trên và tiêu chảy Nhưng với SARS-CoV-2 sẽ dẫn đến các triệu chứng giống cúm ở thể nặng, có thể dẫn đến hội chứng suy hô hấp cấp tiến triển (ARDS), viêm phổi, suy thận và tử vong [17] Một số triệu chứng tiêu biểu trong giai đoạn mới nhiễm bao gồm sốt, ho và khó thở [18] Thời gian ủ bệnh của COVID-19 chỉ trong khoảng 5 đến 6 ngày so với 02 đến 11 ngày của bệnh SARS [19] Bên cạnh những tác động tức thời lên hệ hô hấp và hệ tiêu hóa, COVID-19 còn có những tác động lâu dài như có thể gây viêm cơ tim [20] Ngoài ra, những ca bệnh nặng không chỉ giới hạn ở nhóm bệnh nhân lớn tuổi mà mở rộng tới tất cả các nhóm tuổi [21], dù trên thực tế những ca tử vong, ca nặng vẫn phổ biến hơn ở nhóm lớn tuổi
Một báo cáo tại Hà Nội cho thấy trong năm 2021 ghi nhận 409 ca tử vong vì bệnh COVID-19, với tỉ lệ nam/nữ gần tương đương (1/1,08) 92% số ca tử vong là người trên 60 tuổi 77% số ca tử vong là chưa tiêm vắc-xin 81% số ca tử vong có ít nhất một bệnh nền mà phổ biến nhất là cao huyết áp và béo phì [22] Thống kê này phần nào cho thấy độ tuổi, bệnh nền là yếu tố quan trọng ảnh hưởng đến mức độ nặng của bệnh
Có một số sự khác biệt về phản ứng của cơ thể giữa các ca bệnh nặng và nhẹ Cụ thể, số lượng đại thực bào và bạch cầu trung tính trong dịch rửa nội soi phế quản phế nang của bệnh nhân nặng nhiều hơn đáng kể so với bệnh nhân nhẹ Cùng với đó là sự xuất hiện nhiều hơn của các cytokine gây viêm và biểu hiện mạnh hơn của các chemokine trong các đại thực bào, ở bệnh nhân thể nặng [23] Điều này giải thích cho hiện tượng “cơn bão cytokine” trên các bệnh nhân COVID-19 thể nặng [24]
1.2 Tổng quan về virus SARS-CoV-2
1.2.1 Khái quát về cấu trúc của virus SARS-CoV-2 và chức năng của các protein
SARS-CoV-2 thuộc bộ Coronavidae, chi Coronavirus Bộ này gồm các virus
có kích thước lớn, có vỏ, với hệ gen là sợi đơn được bọc trong các protein nucleocapsid; có protein gai có chiều dài từ 16 đến 21 nm tính từ bề mặt virus; mRNA được phiên mã không liên tục cho tỉ lệ tái tổ hợp cao [25] Hệ gen của SARS-CoV-2
Trang 21có mức tương đồng 79,6% với hệ gen của SARS-CoV-1 và khoảng 50% với CoV [26] Hệ gen của SARS-CoV-2 có kích thước khoảng 30 kilobase, chứa 14 khung đọc-mở (open reading frame, ORF) và mã hóa cho 29 protein Khoảng hai phần ba đoạn đầu của hệ gen SARS-CoV-2, bao gồm ORF1a và ORF1b, mã hóa cho 16 protein không có chức năng cấu trúc virus (non-structural protein, nsp) [27]
MERS-Phần còn lại của hệ gen mã hóa cho bốn loại protein có chức năng cấu trúc gồm protein gai (spike, S), protein vỏ (envelope, E), protein màng (membrane, M) và protein nucleocapsid (N) và chín protein phụ (accessory protein) Hệ gen của virus SARS-CoV-2 được bảo vệ bởi capsid xoắn được cấu tạo từ các protein N, và được bao ngoài bởi các protein E Protein E và protein M đóng vai trò trong quá trình hình thành cấu trúc virus [28] Protein S có vai trò chính trong kích hoạt việc xâm nhập tế bào của virus, thông qua tương tác với thụ thể ACE2 trên bề mặt tế bào vật chủ Ngoài ra protein S còn bị chỉnh sửa bởi các tác nhân khác bao gồm các protein furin, TMPRSS2 hoặc các cathepsin [1]
Sau khi đi vào tế bào vật chủ, ORF1a và ORF1b được dịch mã thành hai polyprotein: pp1a và pp1b Hai polyprotein này được cắt bởi hai protease là papain-like protease (protease giống papain, còn có tên khác là: PLpro, nsp3) và 3C-like cysteine protease (cysteine protease giống 3C, còn có tên khác là: 3CLpro, Mpro, nsp5) để hình thành 16 nsp Các nsp này sẽ lắp ghép hình thành bộ máy nhân đôi và phiên mã (replication and transcription complex, RTC) Tại đây, các thành phần replicase sẽ tái sắp xếp lại màng lưới nội chất thành các túi màng đôi (double-membrane vesicle, DMV) thực hiện chức năng nhân đôi hệ gen và hệ hạ gen (subgenome) của virus [29] Hệ hạ gen sẽ được dịch mã thành các protein cấu trúc, protein phụ để lắp ghép thành vỏ của virus [30]
Trang 22Hình 1.1 Hệ gene liên hệ đến cấu trúc của SARS-CoV-2 [31]
16 nsp có những vai trò riêng trong quá trình hình thành và hoạt động của virus Nsp1 có vai trò trong quá trình phân chia RNA của virus Nsp2 được cho là có tác động đến các tín hiệu sống của tế bào chủ Nsp3 cắt các protein đã được dịch mã thành các nsp khác Nsp4 chứa transmembrane domain 2 có thể làm biến đổi cấu trúc của thành màng lưới nội chất Nsp5 cắt hai polyprotein thành các nsp khác Nsp6 đóng vai trò là protein xuyên màng Nsp7 và nsp8 có vai trò trong việc hỗ trợ hoạt động của nsp12 và khung-mồi RNA (template-primer RNA) Nsp9 là protein bám vào ssRNA nhưng vai trò chưa được làm rõ Nsp10 liên quan đến quá trình cap methylation của mRNA của virus Nsp11 có vai trò chưa rõ ràng Nsp12 chứa phức hợp RNA-polymerase phụ thuộc RNA (RNA-dependent RNA polymerase, RdRp) là yếu tố quan trọng trong nhân đôi và dịch mã Nsp13 tương tác với ATP và các vùng tương tác với kẽm (zinc-binding domains) và có vai trò trong phiên mã và nhân đôi RNA Nsp14 là exoribonuclease có vai trò quan trọng trong việc kiểm tra-chỉnh sửa (proofread) trong quá trình hình thành RNA của virus Nsp15 có hoạt tính giống như endoribonuclease và chịu ảnh hưởng bởi nồng độ Mn2+ Nsp16 là ribose 2’-O-methyltransferase có chức năng ngăn chặn sự cắt mRNA (mRNA splicing) của virus trong quá trình lây nhiễm [28]
1.2.2 Những protein trên virus SARS-CoV-2: các thụ thể không cấu trúc
Hai khung đọc mở ORF1a và ORF1b của virus SARS-CoV-2 mang thông tin di truyền của hai polyprotein: pp1a và pp1b Hai polyprotein này là kết quả của quá trình phiên mã chỉ lệch một nucleotide (−1 ribosomal frameshift: hiện tượng hai protein khác nhau được mã hóa từ cùng một đoạn RNA do khác biệt tại vị trí bắt đầu
Trang 23dịch mã) giữa ORF1a và ORF1b [32] Sau đó, hai polyprotein sẽ được cắt ra thành 16 nsp, là các enzyme thực hiện các chức năng liên quan đến điều hòa quá trình phân chia và phiên mã của cả hệ gen Một số enzyme đóng vai trò thiết yếu như PLpro
(nsp3), Mpro (nsp5), RNA-dependent RNA polymerase (RdRp hay nsp12) và ATPase (nsp13) Ngoài ra, có những enzyme ít được đề cập nhưng có những đặc tính đặc
trưng của Coronavirus như primase (nsp8), exoribonuclease (ExoN homolog của
nsp14), nidoviral RNA uridylate-specific endoribonuclease (NendoU homolog của nsp15) và ribose 2′-O-methyltransferase (2′-O-MTase của nsp16)
1.2.2.1 Nsp1
Nsp1 đóng vai trò ngăn chặn sự biểu hiện của tế bào vật chủ thông qua ribosome Quan sát phức hợp nsp1 và tiểu phần nhỏ của ribosome (40S) của người cho thấy: nsp1 bám và cản trở quá trình dịch mã của tế bào vật chủ thông qua việc vùng đầu C (C-terminal domain) của nsp1 di chuyển vào các kênh dẫn mRNA và cản trở mRNA tương tác với 40S [33] Điều này cho thấy nsp1 có khả năng bám đặc trưng với ribosome 40S của tế bào vật chủ, ngăn cản mRNA vào bào quan này và tăng tốc quá trình phân giải của mRNA Điều này dẫn đến sự suy giảm quá trình tổng hợp protein của tế bào vật chủ, gần như ngăn cản toàn bộ phản ứng miễn dịch tự nhiên và tăng khả năng sống sót của virus [34] Có thể thấy, nsp1 là một thụ thể tiềm năng trong quá trình nghiên cứu giải pháp khống chế virus vì vai trò của nó trong suốt chu kì sinh trưởng của virus
1.2.2.2 Nsp2
Trong các loại nsp của Coronavirus, nsp2 có cấu trúc đa dạng nhưng vai trò thì
chưa rõ ràng Nsp2 của SARS-CoV-2 không có vai trò thiết yếu trong quá trình phân chia của virus Tuy nhiên, nếu thực hiện xóa vùng gen mã hóa cho nsp2 sẽ làm yếu đi quá trình tổng hợp RNA và sự phát triển của virus SARS-CoV-1 [35] Nghiên cứu gần đây cho thấy nsp2 có thể vai trò trong các hoạt động vận chuyển túi vesicle và cân bằng canxi nội môi [36] Tính đến tháng 4/2024, vẫn chưa có các công bố về cấu trúc hoàn chỉnh của nsp2, nên protein nsp2 không phải là đối tượng nghiên cứu, phân tích của luận văn
Trang 241.2.2.3 Nsp3
Nsp3 là protein lớn của SARS-CoV-2 và có nhiều vai trò trong quá trình hoạt động của virus [37] Một vài chức năng của nsp3 bao gồm: hình thành các túi màng đôi (double-membrane vesicle), thực hiện các hoạt động chỉnh sửa/cắt polyprotein, giúp virus lẩn tránh hệ miễn dịch và gần đây được phát hiện thên chức năng là khung bám của protein và có thể là cả RNA Chức năng này, cùng với việc cắt polyprotein để giải phóng nsp1 và nsp2 góp phần bắt đầu quá trình lắp ghép bộ máy nhân đôi và phiên mã trong tế bào vật chủ [38] Cấu trúc của nsp3 có thể chia làm ba phần bao gồm vùng đầu N (N-terminal, kích thước khoảng 157 kDa chia làm 10 vùng riêng biệt), vùng xuyên màng (khoảng 20 kDa chia làm 03 vùng) và vùng đầu C (C-terminal, khoảng 41 kDa chia làm 02 vùng) Phần lớn các vùng đầu N có cấu trúc đã được xác định, còn vùng đầu C và vùng xuyên màng có cấu trúc và chức năng chưa rõ ràng [39]
Gần đây, qua phân tích các cấu trúc của PLpro với hai tác nhân ức chế đã làm sáng tỏ phần nào cơ chế ức chế protein này Sự ức chế vùng PLpro của nsp3 dẫn đến bất hoạt tác động gây bệnh lên tế bào của virus, duy trì chuỗi các phản ứng chống virus của interferon và làm giảm sự nhân đôi virus [40] Mặc dù có mức độ đa dạng về gen cao trong suốt quá trình tiến hóa của virus, nsp3 nhất là PLpro, vẫn là một thụ thể mục tiêu tiềm năng
1.2.2.4 Nsp4
Trong số các nsp, chỉ có nsp3, nsp4 và nsp6 có các vùng xuyên màng tế bào [41] có tham gia vào quá trình tương tác giữa phức hợp nhân đôi và màng tế bào vật chủ và có vai trò là “mỏ neo” hoặc khung phức hợp nhân đôi Nsp4 có vai trò quan trọng trong quá trình nhân đôi và hình thành mạng reticulovesicular, đóng vai trò kết hợp màng tế bào và các túi màng đôi có kích thước khoảng 500 amino acid [42] Các nghiên cứu cho thấy sự bắt cặp các màng đến từ quá trình đồng biểu hiện (coexpression) của nsp3 và nsp4, có vai trò thiết yếu trong quá trình nhân đôi của virus SARS-CoV-1 [43] Do đó, nsp4 có vai trò điều hòa quá trình tương tác của vùng phức hợp nhân đôi và màng tế bào
Trang 251.2.2.5 Nsp5
Nsp5 (Mpro, 3CLpro) là một enzyme cysteine protease có độ bảo tồn cao trong
Coronavirus Tuy có nhiều vai trò nhưng chức năng cắt trên ORF1a và ORF1b tại 11
điểm để tạo ra 12 nsp của nsp5 đóng vai trò đặc biệt quan trọng trong sự phát triển và nhân đôi của virus [43] Do cũng là nsp nên nsp5 cũng phải được cắt ra trước khi có thể hoạt động Quá trình tự cắt (autocleavage) xảy ra được do sự có mặt của cơ chất thúc đẩy quá trì dimer hóa [44] Cấu trúc của nsp5 có độ bảo tồn rất cao giữa tất cả
các loài Coronavirus cùng với độ chuyên của chất nền (subtrate specificity) khác hẳn
với tất cả các protease trong người [45], khiến nsp5 trở thành mục tiêu quan trọng
trong quá trình nghiên cứu điều trị COVID-19 nói riêng và các bệnh do Coronavirus
gây ra nói chung Do có vai trò điều hòa sự hình thành các nsp nên nếu làm bất hoạt nsp5 thì virus sẽ không thể phân chia ở các bước tiếp theo
Hình 1.2 Cơ chế phân chia của SARS-CoV-2 trong tế bào vật chủ, nhấn mạnh vai
trò của Mpro trong chu kì sinh trưởng của virus Chất ức chế tác động, ngăn không cho
Mpro hoạt động là một phương án ngăn chặn sự lây lan virus [46]
Trang 261.2.2.6 Nsp6
Nsp6 là protein có các vùng xuyên màng tế bào Nó nằm ở khu vực màng lưới nội chất và hình thành autophagosome [47] Sự biểu hiện quá mức nsp6 ảnh hưởng đến quá trình vận chuyển trong màng tế bào, dẫn đến sự tích tụ các túi màng đơn quanh các phức hợp microtubule [48] Chưa có bằng chứng trực tiếp, rõ ràng cho thấy quá trình tự thực (autophagy) và đột biến liên quan đến nsp6, có vai trò trong quá trình virus nhân đôi và thoát khỏi miễn dịch tế bào Nsp6 có thể dẫn đến những thay đổi trong giai đoạn phòng thủ của tế bào vật chủ như khiến cho các bộ máy lysosome bị tự hủy
1.2.2.7 Nsp9
Nsp9 là protein bám vào các đoạn RNA sợi đơn có cấu trúc dimer không đối xứng [49] Ở mỗi monomer của nsp9, bảy beta-strands và một alpha-helix được sắp xếp thành một vùng beta-barrel có cấu trúc dạng nón kết hợp với một alpha-helix ở vị trí đầu C Điều này cho nsp9 một vùng hoạt động có cấu trúc toàn thể, không đứt khúc, thuận tiện cho tương tác bám, củng cố cho giả thuyết nsp9 có vai trò bám vào các nucleic acid [50] Nsp9 có thể bám vào các nidovirus RdRp-associated nucleotidyltransferase (NiRAN) của nsp12, cho phép vị trí vùng đầu N có thể được đưa vào trung tâm hoạt động của nsp12 NiRAN gây ức chế hoạt tính của nsp12 NiRAN [51]
1.2.2.8 Nsp15
Cấu trúc của nsp15 mới được thu nhận gần đây cho thấy đây là vùng bảo tồn của
Coronavirus Mỗi protein có vị trí vùng đầu C thuộc hệ enzyme EndoU mà vùng hoạt
động là một hexamer [52] Các loại enzyme này được tìm thấy ở tất cả sinh vật và có một số chức năng liên quan đến xử lý cấu trúc RNA Các nghiên cứu cho thấy hoạt tính của NendoU nsp15 có liên quan đến việc protein này gây nhiễu hoạt động của hệ miễn dịch tự nhiên vì nsp15 có thể phân giải các RNA của virus để ẩn chúng khỏi hệ miễn dịch [53] Do đó, nsp15 có thể đóng vai trò thiết yếu trong quá trình sinh trưởng của virus
Trang 271.2.2.9 Nsp7, nsp8 và nsp12: bộ máy nhân đôi RNA
Cấu trúc của phức hợp RNA polymerase phụ thuộc RNA (RNA-dependent RNA polymerase, RdRp) của SARS-CoV-2 bao gồm nsp12 và hai cofactor là nsp7-nsp8 [54] Nsp8 được cho là có vai trò như một primase và nsp7 có thể đóng vai trò ổn định nsp8 [55] 08 nsp7 và 08 nsp8 hình thành một khối 16-mer có dạng hình trụ rỗng Sự chuyển đổi giữa cấu trúc 16-mer và phức hợp nsp12-nsp7-nsp8 cung cấp những gợi ý về cách thức hoạt động của bộ máy nhân đôi và phiên mã của SARS-CoV-2 [56] Nsp12 cấu tạo từ ba thành phần chính: một vùng NiRAN, một vùng bề mặt trung gian (interface) và một vùng RdRp [54] Nsp12 xúc tác sự nhân đôi RNA của virus với sự hỗ trợ của nsp7-nsp8 và là thụ thể mục tiêu của một số loại thuốc ức chế virus như remdesevir, vốn đang có nhiều bằng chứng cho thấy sự hiệu quả trong điều trị COVID-19 thông qua ngăn chặn sự sinh sôi của SARS-CoV-2 [57]
1.2.2.10 Nsp13
Nsp13 của SARS-CoV-2 có cấu trúc tương tự và mức độ tương đồng cao với nsp13 trên SARS-CoV-1 (99%) Nsp13 có các hoạt tính của helicase và ATPase [58] Hoạt tính helicase của nsp13 tăng gấp đôi khi có sự hiện diện của nsp12 [59] Hoạt tính helicase của nsp13 đến từ cấu trúc bao gồm năm vùng được sắp xếp theo hình chóp tam giác Cấu trúc phức hợp nsp13 và nsp7, ns8 cùng nsp12 cho thấy nsp13 tương tác với nsp8 và nsp12 và ảnh hưởng đến sự sắp xếp của helicase [62] Cấu trúc của phức hợp nhân đôi và phiên mã bao gồm nsp7-nsp82-nsp12-nsp132-RNA và nsp9 cho thấy trạng thái trung gian của phức hợp nhân đôi và phiên mã hướng đến tổng hợp RNA [51] Nsp13 là thụ thể mục tiêu quan trọng vì vai trò thiết yếu của nó trong xúc tác quá trình tháo xoắn các đoạn duplex oligonucleotides thành các sợi đơn
1.2.2.11 Nsp10, nsp14 và nsp16
Nsp10 có cấu trúc bao gồm các beta-sheet song song ngược chiều (anti-parallel), một vùng helix và hai motif zinc-finger [60] Nsp10 tương tác với cả nsp14 và nsp16 như một cofactor để lần lượt kích hoạt hai enzyme 3′–5′ exoribonuclease và 2′-O-methyltransferase [61] Vì nsp10 có vai trò quan trọng trong điều khiển hoạt động của replicase cũng như khả năng tác động đến hoạt động của nsp14, nsp16 và có thể trên một số protein khác, nên nsp10 là một thụ thể mục tiêu đáng chú ý
Trang 28Nsp14 có vai trò làm giảm tình trạng bắt cặp bổ sung sai (mismatch) nucleotide thông qua vùng exoribonuclease (ExoN) của nó Nsp14 có cấu trúc gồm ba motif zinc-finger, đây là yếu tố thiết yếu cho hoạt tính ExoN và khả năng tương tác với nsp10 [62] Nsp10 tác động lên vùng ExoN của nsp14 để ổn định cấu trúc của nó và hình thành khả năng đọc và sửa nucleotide
Hoạt tính của nsp16 được kích hoạt bởi nsp10 thông qua việc ổn định cấu trúc của vùng S-adenosyl-L-methionine (SAM)-binding và kéo dài vùng bám RNA-cơ chất [63] Quá trình trên tạo điều kiện cho hoạt động nhân đôi hệ gen và giúp nó lẩn tránh quá trình miễn dịch tự nhiên
1.2.3 Những protein trên virus SARS-CoV-2: các thụ thể cấu trúc
1.2.3.1 Thụ thể S
Thụ thể S (spike, protein gai) điều hòa quá trình bám của virus vào các thụ thể trên bề mặt tế bào vật chủ và sau đó là giai đoạn dung hợp (fusion) giữa màng tế bào và màng virus để virus xâm nhập vào trong tế bào vật chủ Thụ thể S của SARS-CoV-2 được cấu tạo từ hai tiểu đơn vị: S1 và S2
Trước khi dung hợp, cấu trúc của tiểu đơn vị S1 có bốn vùng là N-terminal (NTD), receptor binding domain (RBD) và hai vùng C-terminal (CTD1 và CTD2) S1 quấn xung quanh tiểu đơn vị S2, lúc này đang bó lại theo dạng xoắn ốc với vùng heptad repeat 1 (HR1) đang uốn về hướng màng virus (như hình kí tự "Ω”) Ba RBD
của S1 hình thành một khối hình vương miện (đây là lý do của tên gọi Coronavirus,
“corona” nghĩa là giống hình vương miện) có hai trạng thái cấu trúc đặc trưng: “mở” cho phép tương tác với thụ thể của tế bào vật chủ, còn “đóng” sẽ ngăn chặn sự tương tác này Khi dung hợp, S1 sẽ tách khỏi S2, trong khi S2 sẽ trải qua những thay đổi lớn về cấu trúc để trở thành trimer dạng kéo dài
NTD được hình thành từ bốn cấu trúc beta-sheet xếp chồng lên nhau Vai trò của NTD trong quá trình xâm nhập của virus chưa được nghiên cứu RBD có hai vùng phụ (subdomain): một nhân gồm năm sợi beta-sheet xếp song song nhưng ngược chiều và một extended loop được gọi là receptor binding motif (RBM), quấn quanh một cạnh của cấu trúc nhân và sẽ tiếp xúc trực tiếp với thụ thể ACE2 khi dung hợp
Trang 29[64] Ở dạng “đóng” trước dung hợp, một RBD sẽ tựa vào CTD1 và NTD làm chặn một phần RBM, khiến cho thụ thể ACE2 của tế bào không thể tiếp cận Khi RBD chuyển sang dạng “mở”, CTD1 và NTD cũng sẽ di chuyển để lộ hoàn toàn RBM cho thụ thể ACE2 tương tác
Các C-terminal đa phần có cấu trúc beta RBD nằm ở vị trí chèn vào giữa hai đoạn beta song song ngược chiều của CTD1, và CTD1 thì chèn vào giữa hai đoạn beta song song ngược chiều của CTD2 Một vùng của tiểu đơn vị S2 gọi là fusion peptide proximal region (FPPR), kẹp và giữ ổn định vị trí của RBD, qua đó ổn định S1 CTD2 có cấu trúc bao gồm hai beta-sheet xếp chồng lên nhau, mỗi sheet có bốn sợi Sợi thứ năm trong một sheet có nhiệm vụ kết nối NTD và RBD Trong sheet còn lại, có một loop chứa vùng mà furin sẽ cắt S1/S2 CTD2 còn chứa một cấu trúc gọi là 630 loop có vai trò quan trọng trong việc giữ ổn định thụ thể S
Trước dung hợp, tiểu đơn vị S2 có cấu tạo chính gồm ba đoạn bó lại theo thành xoắn ốc trung tâm Phần xoắn ốc và một phần HR1 hình thành một khối có chín bó dạng helix, đóng góp vào sự ổn định của thụ thể S Phần còn lại của HR1 kết nối xoắn ốc trung tâm với heptad repeat 2 (HR2) bao quanh phần chân của xoắn ốc trung tâm, bảo vệ các fusion peptide tại đây Khi dung hợp, HR1 và xoắn ốc trung tâm hình thành cấu trúc ba đoạn dài khoảng 180 Å HR1 trải qua thay đổi lớn về cấu trúc cho phép nó đẩy fusion peptide vào bên trong màng tế bào vật chủ
1.2.3.2 Thụ thể M
Thụ thể M là glycoprotein và là thụ thể cấu trúc phổ biến nhất của 2 và định hình cấu tạo vỏ của virus [65] Thụ thể M tương tác với các protein cấu trúc khác của virus và có vai trò trung tâm trong sắp xếp cấu trúc của virus vì nó trực tiếp cấu tạo vỏ và cung cấp bộ khung (matrix) mà nucleocapsid (thụ thể N) bám vào [66] Thụ thể M có thể được nhận diện bởi phản ứng miễn dịch tế bào và thể dịch như là một kháng nguyên [66]
SARS-CoV-1.2.3.3 Thụ thể E
Thụ thể E có kích thước nhỏ nhất trong các thụ thể cấu trúc Nó là chuỗi polypeptide ngắn (76-109 amino acid) với duy nhất một cấu trúc vùng transmembrane
Trang 30dạng alpha-helix, để hình thành các kênh dẫn ion [68] Thụ thể E xuất hiện chủ yếu ở bộ máy Golgi và biểu hiện nhiều trong tế bào vật chủ trong chu kì nhân đôi Vì vai trò quan trọng của thụ thể E trong quá trình phát sinh bệnh nên một số loại vắc-xin sống giảm độc lực (live attenuated vaccine) đã được phát triển dựa trên nguyên lý xóa thụ thể E [69]
1.2.3.4 Thụ thể N
Thụ thể N của SARS-CoV-2 bao gồm ba vùng có cấu trúc: vùng bám RNA, vùng đầu N và vùng đầu C [70] N là thụ thể cấu trúc duy nhất có chức năng bám vào RNA của virus để hình thành nucleocapsid, qua đó hình thành phức hợp ribonucleoprotein, vốn đóng vai trò thiết yếu để giữ ổn định cấu trúc của RNA cho nhân đôi và phiên mã Thụ thể N còn làm ảnh hưởng đến chu kỳ tế bào, tạo ra môi trường tối ưu cho phép chính nó bám vào các RNA của virus, thúc đẩy quá trình nhân đôi, phiên mã, dịch mã các protein của virus dưới sự hỗ trợ của nsp3 [71] Ngoài ra, cấu trúc của thụ thể N ổn định, độ bảo tồn cao, ít bị đột biến trong quá trình lây nhiễm
1.2.4 Những protein trên virus SARS-CoV-2: các thụ thể phụ
Hệ gen của SARS-CoV-2 mã hóa cho chín thụ thể phụ (3a, 3b, 6, 7a, 7b, 8, 9b, 9c và 10), đóng vai trò nhất định trong tương tác của virus với tế bào vật chủ thông qua hỗ trợ quá trình lẩn tránh hệ miễn dịch và tăng cường độc lực virus
1.2.4.1 ORF3a và ORF3b
Cấu trúc của ORF3a có ba vùng transmembrane để hình thành các kênh vận chuyển cation ở dạng dimer hoặc 4-mer [72] Tuy là thụ thể phụ nhưng ORF3a có thể có một số vai trò quan trọng ORF3a ở màng plasma có thể tương tác với thụ thể S để làm tăng khả năng nhập bào của virus, ORF3a còn có thể tác động vào quá trình phân chia hệ gen trên các túi màng đôi và cuối cùng là thúc đẩy quá trình xuất bào của các virus mới [73] Cấu trúc của ORF3b hiện vẫn chưa được thu nhận
1.2.4.2 ORF6, ORF7a, ORF7b và ORF8
ORF6 có thể ảnh hưởng đến quá trình vận chuyển nhân-chất tế bào (nucleocytoplasmic trafficking) thông qua tác động đến hệ RAE1-NUP98, làm ảnh hưởng đến quá trình xuất mRNA từ nhân [74] Sự tăng biểu hiện của ORF7a hoặc
Trang 31ORF7b trên tế bào phổi tạo môi trường thích hợp cho SARS-CoV-2 phát triển thông qua ngăn chặn phản ứng của interferon loại I, làm tăng sự sản sinh cytokine [75] ORF8 có mức độ đột biến rất cao và được cho là có ảnh hưởng đến phản ứng miễn dịch của cơ thể, thông qua việc ngăn chặn phức hợp phù hợp tổ chức chính loại I (major histocompatibility complex, class I) nhận diện antigen của virus [76]
1.2.4.3 ORF9b, ORF9c và ORF10
ORF9b có thể tương tác thụ thể hấp thụ TOM70 trên bề mặt của ti thể, ngăn chặn phản ứng của interferon loại I, dẫn đến sự tự thực bào (autophagy) [77] Cũng gây ra hiện tượng tự thực bào thông qua tác động lên ti thể, ORF10 ngăn chặn tín hiệu phản ứng của interferon thông qua việc bám vào thụ thể tín hiệu kháng virus của ti thể (mitochondrial antiviral signalling protein, MAVS) [78] ORF9c ảnh hưởng đến quá trình kháng virus tại tế bào biểu mô phổi thông qua ngăn chặn tín hiệu interferon và làm tăng tín hiệu của interleukin 6, dẫn đến tăng cytokine [79]
1.3 Những thụ thể mục tiêu trên tế bào người
1.3.1 ACE2
Angiotensin-converting enzyme 2 (ACE2) là enzyme carboxypeptidase có 805 amino acid, thực hiện phản ứng cắt bỏ một amino acid ở đầu C của cơ chất Cấu trúc của ACE2 gồm một vùng metallopeptidase chứa motif bám với kẽm ở trung tâm hoạt động và một đầu C chứa vùng transmembrane ACE2 có vai trò chủ đạo trong hệ thống renin-angiotensin-aldosterone với vai trò chuyển hóa angiotensin I thành angiotensin-(1-9) và angiotensin-II thành angiotensin-(1-7) [80]
Như đã đề cập, tương tác giữa RBD của thụ thể S và ACE2 là tác nhân chính cho phép hệ gen của virus xâm nhập vào tế bào vật chủ Trong đó, 20 amino acid của ACE2 và 17 amino acid của RBD hình thành một mạng ưa nước (hydrophilic network) Đã có bốn amino acid của RBD trên SARS-CoV-2 được xác nhận bị đột biến trong các chủng có nguy cơ cao [81] Điều này có thể làm tăng lực bám cũng như tăng khả năng kháng kháng thể của virus
Trang 321.3.2 TMPRSS2
Protein transmembrane protease, serine 2 (TMPRSS2) có kích thước được được xác nhận bằng thực nghiệm là 395 amino acid [82] TMPRSS2 bám trên bề mặt của màng tế bào và được tìm thấy chủ yếu ở tế bào của tuyến tiền liệt Ngoài ra, protein này còn được tìm thấy ở gan, thận, tuyến tụy và phổi Trong đó, biểu hiện của TMPRSS2 trên phổi của nam nhiều hơn nữ Đó có thể là một phần nguyên do tỉ lệ mắc và tình trạng bệnh của bệnh nhân nam thường nặng hơn [83] TMPRSS2 (và cả ACE2) được điều hòa bởi các hormone nội tiết tố nam, nên điều trị bằng liệu pháp hormone, thông qua việc làm giảm nồng độ hormone nội tiết tố nam, dẫn đến làm giảm biểu hiện của ACE2 và TMPRSS2 là một hướng giải pháp đang được nghiên cứu [84] Việc sử dụng liệu pháp hormone estrogen cho kết quả khả quan khi làm giảm tải lượng virus và biểu hiện của TMPRSS2 [85]
Vai trò xúc tác sinh lý và cơ chất đặc trưng của TMPRSS2 chưa được làm rõ
nhưng ảnh hưởng của nó trong quá trình lây nhiễm một số loại Coronavirus đã được
xác định Lượng virus SARS-CoV-1 xâm nhập vào tế bào tăng 2,6 lần khi tế bào có biểu hiện TMPRSS2 [86] Định lượng RNA của SARS-CoV-1 trong tế bào có biểu hiện TMPRSS2 nhiều hơn chín lần so với tế bào không biểu hiện protein này [87] Gần đây, đã có nghiên cứu chỉ ra rằng quá trình xâm nhập của virus SARS-CoV-2 vào tế bào, phụ thuộc vào TMPRSS2 hơn virus SARS-CoV-1 Điều này chủ yếu là do sự xuất hiện đặc trưng của vùng chia tách bằng furin [88]
1.4 Cơ chế xâm nhập và chu kì sinh trưởng của virus SARS-CoV-2
1.4.1 Cơ chế xâm nhập
Các protein của virus có vai trò trong quá trình xâm nhập cần phải có cấu trúc ba chiều ổn định nhưng vẫn phải duy trì tính linh động khi thực hiện quá trình chuyển hóa cấu trúc (conformational change) để vượt qua yêu cầu về năng lượng giữa màng tế bào vật chủ và màng virus Do đó, protein S trong giai đoạn này trải qua trạng thái nửa bền (metastable), cho phép các thay đổi về cấu trúc xảy ra ở mức năng lượng thấp Protein S ở giai đoạn này thay đổi cấu trúc thông qua hai bước chia tách
Trang 33(cleavage) Đầu tiên là ở ranh giới giữa hai tiểu đơn vị S1/S2 bằng furin Sau đó là ở vùng S2’ bên trong S2 bằng protease của tế bào vật chủ
Quá trình chia tách hai tiểu đơn vị S1/S2 là điều kiện tiên quyết để xảy ra sự chia tách tại vùng S2’ [89] và cả hai quá trình chia tách này phải xảy ra để bắt đầu quá trình dung hợp màng tế bào/virus Sự chia tách này xảy ra tại vùng ranh giới S1/S2, có các amino acid mang tính bazơ (Arg-Arg-Ala-Arg) và được thực hiện bằng furin hoặc các enzyme convertase giống furin tại bộ máy Golgi của tế bào vật chủ, hình thành hai tiểu đơn vị S1, S2 vẫn liên kết với nhau [90] S1 sẽ đóng vai trò bám vào thụ thể ACE2 của tế bào vật chủ mới, còn S2 sẽ cố định thụ thể S vào màng virus và điều khiển quá trình dung hợp màng tế bào/virus Thụ thể E và M đóng vai trò lắp ráp các phần của virus
Khi virus bám vào thụ thể ACE2, tạo ra hệ virus-ACE2, sẽ dẫn đến sự chuyển hóa cấu trúc tại S1, làm lộ ra vùng S2’ bên trong S2 Vùng S2’ cũng phải bị chia tách bằng một protease Nếu tế bào vật chủ không biểu hiện đủ TMPRSS2 trên bề mặt hoặc hệ virus-ACE2 không tiếp cận được TMPRSS2, thì hệ sẽ nhập bào thông qua cơ chế điều khiển bằng clathrin vào endosome, tại đó S2’ sẽ bị chia tách bằng các cathepsin Còn nếu hệ virus-ACE2 tương tác được với TMPRSS2 thì S2’ sẽ bị chia tách ngay tại bề mặt tế bào vật chủ
Trang 34Hình 1.3 Minh họa hai cơ chế xâm nhập của SARS-CoV-2 vào tế bào vật chủ [91]
Trong cả hai cơ chế, S2’ sau khi bị chia tách sẽ làm lộ ra các fusion peptide (FP), heptad repeat 1 của tiểu đơn vị S2 sẽ trải qua sự thay đổi lớn về cấu trúc, đẩy fusion peptide về hướng bề mặt tế bào vật chủ, bắt đầu quá trình dung hợp màng tế bào/virus Sau đó, heptad repeat 2 sẽ tái gập lại theo chiều dài của HR1 (có thể hình dung: HR1 “cắm” vào màng tế bào vật chủ, HR2 uốn cong, “cắm” vào màng virus HR2 duỗi ra theo chiều dài HR1), mang màng tế bào và màng virus lại gần nhau, hình thành lỗ trên hai màng, cho phép vật chất của virus đi vào trong tế bào Quá trình này có thể xảy ra ở màng tế bào hoặc trong endosome
1.4.2 Chu kì sinh trưởng của virus SARS-CoV-2
Sau khi xâm nhập vào tế bào vật chủ, SARS-CoV-2 thực hiện quá trình phân chia như sau Đầu tiên, như đã đề cập, SARS-CoV-2 xâm nhập sau khi tương tác với ACE2 và trải qua hai lần chia tách bởi furin và một protease Lúc này nguyên liệu di truyền của virus là RNA mới xâm nhập vào tế bào chất ORF1a và ORF1b được dịch
RNA của virus
Trang 35mã thông qua bộ máy ribosome của tế bào vật chủ Hai polyprotein của virus được tạo ra bị cắt thành các nsp Các nsp này ghép lại với nhau tạo thành các bộ máy nhân đôi và phiên mã (RTC) Các mRNA sau chỉnh sửa (capping) chính là khuôn của dịch mã để tạo protein cấu thành virus mới Các phần trên được lắp ghép, cấu thành bằng mạng lưới nội chất và thể Golgi của tế bào vật chủ Sau cùng, virus xuất bào ra ngoài Quá trình nhân đôi và phiên mã được điều khiển bởi hoạt động của nhiều tiểu đơn vị [92] mà quan trọng nhất là phức hợp polymerase (RdRP) với thành phần chính là nsp12 và hai cofactor nsp7 và nsp8 Hệ bao gồm RdRP và duplex RNA, hình thành trong quá trình nhân đôi RNA, gọi là RTC trung tâm RTC cần đảm bảo sự kéo dãn duplex RNA không làm tách khuôn RNA khỏi RNA để hệ gen được tổng hợp nhanh chóng trong tế bào vật chủ [93] RTC còn phải đảm bảo tính hiệu quả và tính chính xác của quá trình nhân đôi Tính hiệu quả được đảm bảo bằng một RTC kéo dài (extended RTC, E-RTC) trong khi tính chính xác được duy trì thông qua cơ chế proofread được thực hiện bằng nsp14 E-RTC bao gồm RTC trung tâm, và hai helicase nsp13 Trong đó một nsp13 có vai trò biến đổi cấu trúc bậc hai của RNA khuôn thành dạng sợi đơn và thực hiện hoạt tính của RNA 5′-triphosphatase [94] Quá trình chỉnh sửa mRNA (capping) có vai trò quan trọng trong phiên mã, bảo vệ mRNA thoát khỏi hệ miễn dịch của tế bào vật chủ [95]
Hình 1.4 Chu kì sinh trưởng của virus SARS-CoV-2 [96]
Trang 36Một nhiệm vụ quan trọng của RTC là cơ chế proofreading Phần lớn virus RNA có mức lỗi trong quá trình nhân đôi vào khoảng từ 10-3 đến 10-5, tương đương với một đột biến trên 10 kb của mỗi chu kì phân chia [95] SARS-CoV-2 có cơ chế đặc thù làm giảm tỉ lệ sai sót, thông qua sử dụng nsp14 là một exonuclease có khả năng proofreading Proofreading bao gồm cơ chế quay lui (backtracking) của các chuỗi RNA khuôn-sản phẩm bị bắt cặp bổ sung sai Cấu trúc hệ RTC trung tâm-nsp13-RNA gợi ý rằng nsp13 cũng tham gia vào cơ chế quay lui [97]
1.5 Các biến chủng của virus SARS-CoV-2
Trong quá trình lây nhiễm, SARS-CoV-2 với bản chất là virus có sự đột biến nhanh từ hệ gen dẫn đến sự thay đổi về mặt cấu trúc Điều này có thể dẫn đến sự giảm hiệu quả của các phương pháp điều trị Do đó, việc lưu ý sự thay đổi về mặt cấu trúc thụ thể là quan trọng Nắm được vấn đề này, tổ chức Y tế Thế giới đã xây dựng hệ thống phân loại các biến chủng của SARS-CoV2-2 theo các biến chủng đáng lo ngại và các biến chủng cần chú ý Luận văn trình bày tóm lược về các biến chủng đáng lo ngại tính đến tháng 4/2024
1.5.1 Biến chủng Alpha
Biến chủng Alpha được tìm thấy vào tháng 12/2020 từ các bệnh nhân ở Anh Biến chủng này có 23 điểm đột biến so với chủng SARS-CoV-2 gốc, 08 trong số đó nằm ở protein S bao gồm N501Y (asparagine ở vị trí thứ 501 đột biến thành tyrosine), A570D, P681H, S092A, D1118H, T7161I, S982A, xóa amino acid thứ 69, 70 và 144 Trong đó, đột biến N501Y làm tăng khả năng thâm nhập của virus vào tế bào [98] Trong khi các đột biến còn lại được cho là làm tăng khả năng lây nhiễm của virus SARS-CoV-2 [28]
1.5.2 Biến chủng Beta
Biến chủng Beta được tìm thấy vào tháng 10/2020 từ các bệnh nhân ở Nam Phi Trong số 18 đột biến được phát hiện thì 09 đột biến xảy ra trên protein S, bao gồm D80A, D215G, R2461, K417N, E484K, A701V, L18F, D614G, và L18F Trong đó K417N, E484K và N501Y được phát hiện tại vị trí của các receptor binding domain
Trang 37(RBD) của tiểu đơn vị S1, qua đó làm tăng khả năng xâm nhập tế bào của virus CoV-2 [99]
SARS-1.5.3 Biến chủng Gamma
Biến chủng Gamma được tìm thấy vào tháng 12/2020 từ các bệnh nhân ở Brazil 17 đột biến được phát hiện, trong đó ba đột biến E484K, K417T và N501Y được cho là làm tăng làm tăng khả năng xâm nhập tế bào của virus và tăng khả năng lây nhiễm từ 1,7 đến 2,4 lần so với chủng trước [100]
1.5.4 Biến chủng Delta
Biến chủng Gamma được tìm thấy vào tháng 12/2020 từ các bệnh nhân ở Ấn Độ Biến chủng này có khả năng lây nhiễm cao gấp đôi so với các biến chủng trước và là nguyên do của làn sóng lây nhiễm thứ hai ở nhiều quốc gia Trong số các đột biến được phát hiện, có ít nhất 08 đột biến được tìm thấy trên protein S của biến chủng này bao gồm T19R, L452R, T478K, D614G, P681R, D960N, và xóa amino acid thứ 157 và 158 [101]
1.5.5 Biến chủng Omicron
Biến chủng Omicron được tìm thấy vào tháng 11/2021 từ các bệnh nhân ở Nam Phi Biến chủng này có ít nhất 60 đột biến khiến đây là biến chủng có số lượng đột biến cao nhất được ghi nhận Trong đó có 06 sự thay thế ở ORF1a bao gồm K856R, L2084I, A2710T, T3255I, P3395H, và I3758V; và 02 sự xóa tổng cộng 04 amino acid ở các vị trí 2083 và từ 3674 đến 3676 Hai sự thay thế ở ORF1b là P314L and I1566V Một sự thay thế là P10S và xóa ba amino acid từ 27 đến 29 của ORF9b Tại các protein cấu trúc có một sự thay thế ở protein vỏ, ba ở protein màng, ba sự thay thế và ba amino acid bị xóa ở protein nucleocapsid Có đến 30 sự thay thế, ba vị trí xóa và một amino acid được thêm vào protein gai [102]
Có thể thấy sự biến đổi của virus SARS-CoV-2 xảy ra nhanh chóng theo thời gian và được các nhà khoa học lưu ý ở các đột biến xảy ra ở protein gai tương tác trực tiếp với các thụ thể trên màng tế bào của người Có ba giả thiết chính về nguyên nhân dẫn đến sự đột biến nhanh và hình thành nhiều chủng trong thời gian ngắn như vậy bao gồm: sự lan truyền âm thầm của virus trong quần thể người không có sự giám
Trang 38sát hệ gen chặt chẽ (không bị phát hiện, cách ly kịp thời), sự lan truyền giữa các loài sinh vật khác nhau trong quần thể động vật và lây lại về người (thường xảy ra tại các vùng nông nghiệp), virus đột biến từ những người bệnh bị suy giảm miễn dịch từ trước (quá trình điều trị bệnh cho họ vô tình làm virus mạnh hơn vì đã thích ứng với các phương pháp điều trị) [103] Do sự đột biến nhanh khiến cấu trúc của các thụ thể mục tiêu không thể được thu thập ngay nên các biến chủng đáng lưu tâm, như Omicron không phải là mục tiêu của luận văn
1.6 Các kỹ thuật có liên quan
1.6.1 Docking
1.6.1.1 Khái quát về docking
Docking là phương pháp mô phỏng sự tương tác ở cấp độ phân tử giữa thụ thể (thường là protein) và ligand (thường là 01 phân tử hợp chất hoặc protein), qua đó dự đoán được mức độ và cách thức tương tác của hai thành tố trên [104] Về lý thuyết, có thể giải thích sự tương tác giữa ligand và protein tương đồng với mối quan hệ cơ chất-enzyme, nhưng điểm khác là mục đích của docking là ligand làm thay đổi lâu dài cấu trúc, qua đó làm tăng hoặc giảm hoặc bất hoạt hoạt động của protein Có hai thuyết chính liên quan đến mối quan hệ cơ chất-enzyme Trước hết là thuyết “chìa khóa-ổ khóa” của Fisher cho rằng trung tâm hoạt động của enzyme, tức là vị trí trên protein tương tác với ligand, có cấu trúc không gian cố định Gần đây hơn là thuyết “induced-fit” của Koshland cho rằng trung tâm hoạt động linh hoạt Lúc này, cơ chất tác động làm thay đổi cấu trúc không gian của trung tâm hoạt động [105]
Hai thuyết về cơ chất-enzyme mở đường cho các phương pháp docking hiện nay Một là rigid docking, khi cả ligand và protein được xem như các thành tố tĩnh, không có sự thay đổi nào về vị trí cũng như cấu trúc của cả hai Đây là phương pháp docking đầu tiên và gần như đã lỗi thời Hai là flexible-rigid docking, dựa trên nền tảng của Fisher, khi thành tố protein được mặc định là tĩnh và cố định thì thành phần ligand được linh động, nhất là linh động của liên kết xoay/xoắn được, và tự do di chuyển trong khuôn khổ Đây là phương pháp docking phổ biến nhất hiện nay Cuối cùng là flexible docking, dựa trên nền tảng của Koshland, khi cả ligand và protein
Trang 39(tối thiểu là các amino acid tại trung tâm hoạt động) đều được linh động Đây là phương pháp docking cho kết quả chính xác nhất vì mô phỏng gần đúng thực tế nhất, nhưng cũng yêu cầu năng lực tính toán cao nhất [106]
Dù sử dụng phương pháp nào, mục tiêu của docking cũng nhằm xác định hình dáng của ligand và vị trí bám của nó trong trung tâm hoạt động Bên cạnh đó, kết quả định lượng là năng lượng cực tiểu toàn cục (global energy minimum) của hệ ligand-thụ thể, thường có giá trị âm, đơn vị kcal/mol, cũng là mục tiêu chính của docking
1.6.1.2 Giới hạn của docking
Giới hạn đầu tiên của docking là sự phức tạp của giai đoạn chuẩn bị cấu trúc ba chiều của protein và ligand Trong khi cấu trúc của ligand tương đối đơn giản và có thể thu nhận thông qua các cơ sở dữ liệu, thực nghiệm thì cấu trúc của protein phức tạp hơn Thông thường cấu trúc của protein, nhất là những cấu trúc mới được nộp và sau quá trình bình duyệt, sẽ được công khai trên các cơ sở dữ liệu Các cấu trúc này có chất lượng cao nhưng quá trình thu nhận kết quả cấu trúc đó cần được xem xét, nhất là độ phân giải khi thực hiện quan sát và yếu tố môi trường như nhiệt độ có thể mang đến những kết quả cấu trúc khác nhau [107]
Giới hạn thứ hai của docking là bản chất của rigid docking, phương pháp docking phổ biến nhất, sẽ cố định thành phần protein Nhưng trên thực tế, các nguyên tử không đứng yên Có trường hợp, bản chất sự di chuyển của ligand khi đi vào khu vực hoạt động của protein đã làm thay đổi cấu trúc của khu vực này (thuyết của Koshland) Giải pháp cho vấn đề này là sử dụng flexible docking, nhưng phương pháp này cần rất nhiều năng lực xử lý máy tính Giới hạn thứ ba, docking không thể trả lời ligand là chất ức chế (inhibitor) hay chất kích hoạt (agonist) hoạt động của protein Docking chỉ trả lời được định lượng mức độ tương tác giữa ligand và protein nhưng không thể trả lời được hệ quả hoạt động của protein mà ligand đang tác động lên Điều này chỉ có thể được làm rõ thông qua các kết quả thực nghiệm, như sử dụng bộ xét nghiệm sinh học (bioassay)
Cuối cùng, tính chính xác của docking so với thực tế là vấn đề quan trọng nhất Trên thực tế, có rất ít chất sau khi đã vượt qua giai đoạn phân tích docking, tiếp tục
Trang 40thành công ở giai đoạn lâm sàng sau đó Điều này đến từ nhiều nguyên do như: cấu trúc protein khi thu thập từ các cơ sở dữ liệu thường là hệ protein-ligand có sẵn và việc xóa ligand đó có thể gây những ảnh hưởng không lường trước trong quá trình tính toán, sự sai khác về pH và các yếu tố môi trường trong điều kiện mô phỏng so với thực tế [108], việc vận chuyển ligand đến đúng vị trí protein là rất khó khăn trong thực tế [109] Có trường hợp, một hợp chất có kết quả docking cao nhưng khi thực hiện mô phỏng động lực học phân tử, lại ngay lập tức di chuyển ra khỏi vùng trung tâm hoạt động của protein [108]
Tuy có nhiều tranh luận về tính chính xác trong nghiên cứu nhưng không thể phủ nhận docking đã, đang và vẫn sẽ là một kỹ thuật bước đầu trong quá trình khai phá, tìm kiếm, đánh giá dược liệu mới Một giải pháp để đánh giá kết quả docking là thực hiện kỹ thuật mô phỏng động lực học phân tử
1.6.2 Mô phỏng động lực học phân tử
1.6.2.1 Khái quát về mô phỏng động lực học phân tử
Nền tảng lý thuyết của MD dựa trên các lý thuyết vật lý ở cấp độ nguyên tử Nếu có thông tin về vị trí của tất cả nguyên tử trong một hệ sinh học (như protein trong nước), ta có thể tính toán được các lực tác động lên từng nguyên tử từ các nguyên tử còn lại có trong hệ Việc tính toàn này dựa trên các định luật chuyển động của Newton để dự đoán vị trí của từng nguyên tử theo thời gian Sau mỗi một bước thời gian (time step), vị trí mới và vận tốc của từng nguyên tử sẽ được cập nhật dựa trên các lực định sẵn Kết quả thu được sẽ là một chuỗi chuyển động trong không gian ba chiều, mô phỏng chuyển động của hệ sinh học theo thời gian [110]
Quá trình mô phỏng này có nhiều lợi ích Một là, thông qua kết quả mô phỏng, ta thu được kết quả vị trí và chuyển động của từng nguyên tử trong hệ theo thời gian, điều gần như không thể thực hiện được bằng thực nghiệm Hai là, các điều kiện trong quá trình mô phỏng được kiểm soát nghiêm ngặt: tình trạng ban đầu của protein và các amino acid cấu thành nên protein, ligand sẽ tương tác với protein, môi trường như nhiệt độ, mức tĩnh điện… đều được kiểm soát và điều chỉnh được