sàng lọc in silico các hợp chất tự nhiên tiềm năng được phân lập tại bộ môn dược liệu đại học y dược tp hồ chí minh ức chế trên protein e1 của hpv 18 human papilloma virus

99 0 0
Tài liệu đã được kiểm tra trùng lặp
sàng lọc in silico các hợp chất tự nhiên tiềm năng được phân lập tại bộ môn dược liệu đại học y dược tp hồ chí minh ức chế trên protein e1 của hpv 18 human papilloma virus

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Hồ Chí Minh.Các bước nghiên cứu in silico của đề tài bao gồm: i sàng lọc hợp chất tiềm năngbằng phương pháp gắn kết phân tử PDB: 1R9W; ii khảo sát độ ổn định của cácphức hợp bằng mô ph

Trang 1

BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ Y TẾ

ĐẠI HỌC Y DƯỢC THÀNH PHỐ HỒ CHÍ MINH

ĐÀO THỊ HỒNG LOAN

SÀNG LỌC IN SILICO CÁC HỢP CHẤT TỰ NHIÊN TIỀM

NĂNG ĐƯỢC PHÂN LẬP TẠI BỘ MÔN DƯỢC LIỆU – ĐẠIHỌC Y DƯỢC TP HỒ CHÍ MINH ỨC CHẾ TRÊN PROTEIN

E1 CỦA HPV 18 (HUMAN PAPILLOMA VIRUS)

LUẬN VĂN THẠC SĨ DƯỢC HỌC

THÀNH PHỐ HỒ CHÍ MINH - NĂM 2023

Trang 2

BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ Y TẾ

ĐẠI HỌC Y DƯỢC THÀNH PHỐ HỒ CHÍ MINH

ĐÀO THỊ HỒNG LOAN

SÀNG LỌC IN SILICO CÁC HỢP CHẤT TỰ NHIÊN TIỀM

NĂNG ĐƯỢC PHÂN LẬP TẠI BỘ MÔN DƯỢC LIỆU – ĐẠIHỌC Y DƯỢC TP HỒ CHÍ MINH ỨC CHẾ TRÊN PROTEIN

E1 CỦA HPV 18 (HUMAN PAPILLOMA VIRUS)

NGÀNH: CÔNG NGHỆ DƯỢC PHẨM VÀ BÀO CHẾ THUỐCMÃ SỐ: 8720202

LUẬN VĂN THẠC SĨ DƯỢC HỌC

NGƯỜI HƯỚNG DẪN KHOA HỌCPGS TS NGUYỄN THỤY VIỆT PHƯƠNG

THÀNH PHỐ HỒ CHÍ MINH - NĂM 2023

Trang 3

LỜI CAM ĐOAN

Tôi xin cam đoan luận văn này là công trình nghiên cứu của tôi Những phần sử dụngtài liệu tham khảo trong luận văn đã được nêu rõ trong phần tài liệu tham khảo Cáckết quả nghiên cứu được trình bày trong luận văn là trung thực, khách quan.

Tác giả luận văn

Đào Thị Hồng Loan

Trang 4

TÓM TẮT

SÀNG LỌC IN SILICO CÁC HỢP CHẤT TỰ NHIÊN TIỀM NĂNG ĐƯỢC PHÂN

LẬP TẠI BỘ MÔN DƯỢC LIỆU – ĐẠI HỌC Y DƯỢC TP HỒ CHÍ MINH ỨCCHẾ TRÊN PROTEIN E1 CỦA HPV 18 (HUMAN PAPILLOMA VIRUS)

Đào Thị Hồng Loan

Giảng viên hướng dẫn: PGS TS Nguyễn Thụy Việt Phương

Mở đầu: Ung thư cổ tử cung là một trong những bệnh ung thư phổ biến hàng đầu ở

phụ nữ với hơn 95% ca mắc bệnh do Human Papillomavirus (HPV), trong đó 90%tổng số ca do HPV 16 và 18 gây ra Hiện nay, các loại vắc xin lại kém hiệu quả ởnhững người đã tiếp xúc với một hay nhiều chủng HPV trước đó cũng như tỷ lệ tiêmchủng thấp Vì thế, việc tìm ra thuốc điều trị HPV vẫn là vấn đề cấp thiết Do đó mụctiêu của nghiên cứu là tìm kiếm các hợp chất tự nhiên tiềm năng được phân lập tại Bộmôn Dược liệu – Đại học Y Dược TP Hồ Chí Minh ức chế protein E1 của HPV 18

thông qua sử dụng phương pháp in silico.

Đối tượng - Phương pháp nghiên cứu: Đối tượng của nghiên cứu là 286 hợp chất

tự nhiên được phân lập tại bộ môn Dược liệu – Đại học Y Dược TP Hồ Chí Minh.Các bước nghiên cứu in silico của đề tài bao gồm: (i) sàng lọc hợp chất tiềm năngbằng phương pháp gắn kết phân tử (PDB: 1R9W); (ii) khảo sát độ ổn định của cácphức hợp bằng mô phỏng động lực học phân tử; (iii) tính năng lượng gắn kết bằng 3phương pháp: MM/PBSA, MM/GBSA và LIE; (iv) đánh giá trình tự acid amin trongkhoang gắn của protein E1 HPV 18 với các tuýp HPV khác.

Kết quả: Kết quả sàng lọc qua gắn kết phân tử thu được 5 hợp chất tự nhiên tiềm

năng gồm: E157, E176, E186, E221, E254 Áp dụng mô phỏng động lực học phân tửtrong thời gian 100 ns cho thấy E176 và E221 đạt các thông số đánh giá về độ ổn địnhvà tính năng lượng gắn cho 5 phức hợp tiềm năng theo 3 phương pháp Kết quả chothấy 2 hợp chất tiềm năng trong việc ức chế protein E1 HPV 18 được xác định làE186 (năng lượng gắn = -15,21 kJ.mol-1)và E221 (năng lượng gắn = 60,73 kJ.mol-1).Đánh giá trình tự acid amin cho thấy có sự bảo tồn cao giữa các acid amin trong

Trang 5

khoang gắn kết ADN của HPV 18 so với các tuýp HPV khác Từ kết quả phân tíchphát sinh loài, có sự tách biệt đáng kể về nguồn gốc phát sinh giữa 2 loại HPV nguycơ thấp và nguy cơ cao.

Kết luận: E186 (Hispidulin-7-O-rutinosid) và E221 (Limonin) là 2 hợp chất tiềm

năng trong việc ức chế protein E1 HPV18 Ngoài ra, dựa trên kết quả căn chỉnh trìnhtự và phân tích phát sinh gợi ý rằng có thể phát triển các hợp chất ức chế protein E1có tác dụng trên nhiều tuýp HPV khác nhau, đặc biệt là các tuýp HPV nguy cơ cao.

Từ khóa: Human Papillomavirus (HPV), protein E1 của HPV, sàng lọc in silico,

năng lượng gắn kết tự do.

Trang 6

IN SILICO SCREENING OF POTENTIAL NATURAL COMPOUNDS ISOLATED

FROM THE DEPARTMENT OF PHARMACOGNOSY - UNIVERSITY OFMEDICINE AND PHARMACY AT HO CHI MINH CITY INHIBITING HPV 18 E1

PROTEIN (HUMAN PAPILLOMA VIRUS)

Dao Thi Hong Loan

Supervisor: Assoc Prof Dr Nguyen Thuy Viet Phuong

Introduction: Cervical cancer is one of the leading common cancers in women, with

over 95% of cases attributed to Human Papillomavirus (HPV), of which HPV 16 and18 are responsible for 90% of all cases Currently, available vaccines are less effectivein individuals who have been previously exposed to one or more HPV strains, as wellas having low vaccination rates Therefore, finding a treatment for HPV remains anurgent issue Thus, the research objective was to identify potential natural compoundsisolated from the Department of Pharmacognosy, University of Medicine andPharmacy at Ho Chi Minh City as the inhibitors of E1 protein of HPV 18 through

using in silico methods.

Subjects and research methods: The study subjects comprised 286 natural

compounds isolated from the Department of Pharmacognosy, University of Medicine

and Pharmacy at Ho Chi Minh City The in silico screening process of this study

included: (i) screening potential compounds using molecular docking (PDB: 1R9W);(ii) investigating the stability of the complexes through molecular dynamicssimulations; (iii) calculating the binding energy using three methods: MM/PBSA,MM/GBSA, and LIE; (iv) evaluating the amino acid sequence in the binding pocketof the HPV 18 E1 protein with other HPV types.

Results: The results of molecular docking screening yielded 5 potential natural

compounds, namely E157, E176, E186, E221, and E254 Molecular dynamicssimulations conducted over a period of 100 ns showed that E176 and E221 exhibitedfavorable stability and binding energy characteristics among the 5 potential

Trang 7

complexes using all three methods The outcomes indicated that E186 (∆Gbind = 15,21 kJ.mol-1) and E221 (∆Gbind = 60,73 kJ.mol-1) were identified as the two potentialcompounds for inhibiting the E1 protein of HPV 18 Sequence analysis of amino acidsrevealed a high conservation within the DNA binding pocket of HPV 18 comparedto other HPV types The analysis of phylogenetic tree results demonstrated asignificant differentiation in the origin between the two types of low-risk and high-risk HPV.

-Conclusion: E186 (Hispidulin-7-O-rutinoside) and E221 (Limonin) are two potential

compounds that can inhibit the E1 protein of HPV 18 Furthermore, based onsequence alignment and phylogenetic analysis, it is suggested that the developmentof E1 protein inhibitors targeting multiple HPV types, particularly high-risk types, ispossible.

Keywords: Human Papillomavirus (HPV), HPV E1 protein, in silico screening,

binding free energy.

Trang 8

LỜI CẢM ƠN

Trước tiên, em xin gửi lời cảm ơn chân thành đến PGS TS Nguyễn Thụy ViệtPhương đã tận tình hướng dẫn, dành thời gian chỉ dẫn và góp ý chỉnh sửa giúp emhoàn thiện luận văn Cảm ơn cô vì những bài học bổ ích mà cô đã chỉ dạy cho emtrong suốt quá trình thực hiện đề tài.

Em xin cảm ơn thầy GS.TS Thái Khắc Minh và thầy GS.TS Phạm Văn Tấtđã dành thời gian đọc, phản biện giúp em hoàn chỉnh luận văn cùng với các thầy côtrong hội đồng đã đóng góp ý kiến cho đề tài luận văn của em được hoàn thiện hơn.

Em xin tri ân Thầy, Cô khoa Dược tham gia công tác giảng dạy chương trìnhCao học đã dành nhiều tâm huyết truyền đạt kiến thức, kinh nghiệm cho các học viên.Bên cạnh đó em cũng gửi lời cám ơn đến em Lê Nguyễn Như Quỳnh đã luônđồng hành, hỗ trợ và giúp đỡ em trong suốt quá trình thực hiện đề tài.

Cuối cùng, em xin kính chúc Quý thầy cô luôn tràn đầy sức khỏe và gặp đượcnhiều thành công trong cuộc sống.

Trang 9

1.1.2 Cấu tạo của HPV 3

1.1.3 Protein E1 của virus HPV 6

1.2.Tiềm năng phát triển thuốc ức chế virus HPV từ dược liệu 8

1.2.1 Nghiên cứu thuốc ức chế trên virus HPV 8

1.2.2 Nghiên cứu thuốc ức chế trên E1 HPV 18 9

1.4.Tình hình nghiên cứu trong và ngoài nước 20

1.4.1 Tình hình nghiên cứu trên thế giới 20

1.4.2 Tình hình nghiên cứu trong nước 21

CHƯƠNG II: PHƯƠNG PHÁP NGHIÊN CỨU 22

2.1.Đối tượng nghiên cứu 22

Trang 10

2.1.1 Mục tiêu tác động 22

2.1.2 Cơ sở dữ liệu 22

2.1.3 Phần mềm nghiên cứu 23

2.2.Phương pháp nghiên cứu 24

2.2.1 Quy trình nghiên cứu 24

2.2.2 Căn chỉnh nhiều trình tự và phân tích phát sinh loài 24

2.2.3 Gắn kết phân tử 25

2.2.4 Mô phỏng động lực học phân tử 26

2.2.5 Tính toán năng lượng gắn kết 27

CHƯƠNG III: KẾT QUẢ 29

3.1.Căn chỉnh nhiều trình tự và phân tích phát sinh loài 29

3.1.1 Đánh giá trình tự acid amin bằng phương pháp MSA 29

3.1.2 Phân tích phát sinh loài 30

3.2.Sàng lọc các hợp chất tự nhiên có tiềm năng ức chế protein E1 bằngphương pháp gắn kết phân tử 30

3.2.1 Các cấu trúc flavonoid monoglycosid 37

3.2.2 Các cấu trúc flavonoid diglycosid 42

3.2.3 Các cấu trúc flavonoid triglycosid 43

3.2.4 Các cấu trúc flavonoid chỉ có phần aglycon 45

3.2.5 Các hợp chất khác 46

3.2.6 Các thuốc được sử dụng trong điều trị HPV 47

3.2.7 Phân tích khả năng làm thuốc và ADMET của 5 hợp chất tiềm năng 48

3.3.Khảo sát độ ổn định của các phức hợp tiềm năng thông qua mô phỏngđộng lực học phân tử 50

Trang 11

3.3.1 Độ ổn định của phức hợp protein-ligand trong quá trình mô phỏng động

lực học phân tử 51

3.3.2 Độ dao động của acid amin trong quá trình mô phỏng động lực học 52

3.3.3 Diện tích bề mặt có thể tiếp cận dung môi 53

3.3.4 Bán kính quay 54

3.3.5 Tần suất liên kết hydro giữa protein và ligand 54

3.4.Tính toán và đánh giá năng lượng gắn kết bằng 3 phương pháp:MM/PBSA và MM/GBSA, LIE 55

3.4.1 Phương pháp MM/PBSA 55

3.4.2 Phương pháp MM/GBSA 56

3.4.3 Phương pháp LIE 57

CHƯƠNG IV: BÀN LUẬN 59

4.1.Căn chỉnh nhiều trình tự và phân tích phát sinh loài 59

4.2.Sàng lọc các hợp chất tự nhiên có tiềm năng ức chế protein E1 bằngphương pháp gắn kết phân tử 60

4.3.Khảo sát độ ổn định của các phức hợp tiềm năng thông qua mô phỏngđộng lực học phân tử 65

4.4.Tính toán và đánh giá năng lượng gắn kết tự do bằng 3 phương pháp:MM/PBSA và MM/GBSA, LIE 67

KẾT LUẬN VÀ KIẾN NGHỊ 72

Trang 12

DANH MỤC CHỮ VIẾT TẮT

Chữ viết tắt Tiếng Anh Tiếng ViệtATP Adenosine triphosphate

BFE Binding free energy Năng lượng gắn kết tự do

DBD DNA Binding Domain Miền liên kết ADN

DNA Deoxyribonucleic acid Deoxyribonucleic acid

EGCG Epigallocatechin gallate

HPV Human Papilloma Virus Virus human papilloma

HR HPV High-risk HPV Loại HPV có nguy cơ cao

IARC International Agency forResearch on Cancer

Cơ quan Nghiên cứu Ung thưQuốc tế

LIE Linear Interaction Energy Năng lượng tương tác tuyến tính

LR Low-risk HPV Loại HPV có nguy cơ thấp

MDs Molecular dynamics simulation Động lực học phân tử

MSA Multiple sequence alignment Căn chỉnh nhiều trình tự

ORF Open reading frame Khung đọc mở

PV Papillomavirus Virus papilloma

QSAR Quantitative Structure-ActivityRelationship

Mối liên quan định lượng giữacấu trúc-tác dụng

Rg Radius of Gyration Bán kính quay

RMSD Root Mean Square Deviation Căn bậc hai của độ lệch bìnhphương trung bình

Trang 13

Chữ viết tắt Tiếng Anh Tiếng Việt

RMSF Root Mean Square Fluctuation Căn bậc hai của độ dao độngbình phương trung bình

RPA Replication protein A Protein sao chép A

SASA Solvent accessible surface area Diện tích bề mặt tiếp cậndung môi

TLTK Tài liệu tham khảo

TM-score Template modelling Mô hình mẫu

Topo I Topoisomerase I

URR Upstram Regulatory Region Vùng điều hòa ngược dòng

Trang 14

DANH MỤC CÁC HÌNH

Hình 1.1 Cấu trúc và chức năng các gen trên HPV18 4

Hình 1.2 Cấu trúc protein E1 của HPV34 6

Hình 1.3 Các hợp chất dược liệu ức chế HPV 9

Hình 1.4 Các hợp chất dược liệu ức chế trên protein E1 HPV 10

Hình 1.5 Cách tiếp cận của phương pháp điểm cuối (end-point method)61 17

Hình 2.6 Hình minh họa cấu trúc của vùng gắn kết ADN của protein E1 HPV18 từngân hàng dữ liệu Protein (PDB ID: 1R9W) 22

Hình 2.7 Các giai đoạn thực hiện trong nghiên cứu 24

Hình 3.8 Căn chỉnh nhiều trình tự (MSA) các acid amin trong khoang gắn kết ADNcủa 28 tuýp HPV 29

Hình 3.9 Phân tích phát sinh loài cho protein E1 của 28 tuýp HPV Nét màu đỏ lànhóm các tuýp HPV nguy cơ cao và màu vàng là nhóm các tuýp HPV nguy cơ thấp 30

Hình 3.10 Trình tự acid amin trong vùng gắn với ADN của E1 HPV 18 31

Hình 3.11 (A) Mô hình dự đoán cấu trúc của protein E1 được bổ sung thêm 7 acidamin vào loop gắn kết với ADN (cam) (B) Biểu đồ Ramachandran của mô hình 32

Hình 3.12 Giá trị độ che phủ và độ nhận dạng cho trình tự từ MSA 33

Hình 3.13 Kết quả 5 cấu trúc được xác định từ ColabFold v1.5.289 35

Hình 3.14 Khoang gắn của protein E1 HPV 18 (PDB ID: 1R9W) 35

Hình 3.15 Các vị trí gắn và số lượng các phân tử đường gắn trên khung flavonoidaglycon Mũi tên đỏ chỉ những vị trí gắn của nhóm thế đường 37

Hình 3.16 Vị trí nhóm thế đường của một số flavonoid monoglycosid và điểm sốgắn kết vào E1 HPV 18 (PDB ID: 1R9W) 38

Trang 15

Hình 3.17 Phương thức gắn và cấu trúc của một số hợp chất flavonoid monoglycosid

(A: E019, B: E164, C: E060, D: E052) trong khoang gắn của protein E1 HPV 18(PDB ID: 1R9W) Vùng màu vàng là vị trí của khoang gắn 39

Hình 3.18 Cấu trúc, vị trí trong khoang và tương tác 2D của 2 hợp chất có nhóm thế

đường ở vị trí C8 (A) và vị trí C3 (B) Với nét xanh lá là liên kết hydro, nét hồng làliên kết kỵ nước, nét đỏ là liên kết cho/nhận không thuận lợi (unfavorable donor-donor/acept) Vùng màu vàng là vị trí của khoang gắn 40

Hình 3.19 Tương tác 2D và điểm số gắn kết của các cấu trúc flavon monoglycosid

với khoang gắn của protein E1 HPV 18 (PBD ID: 1R9W) Với nét xanh lá là liên kếthydro, nét hồng và cam là liên kết kỵ nước, nét đỏ là liên kết cho/nhận không thuậnlợi (unfavorable donor-donor/aceptor-aceptor) 41

Hình 3.20 Vị trí nhóm thế đường của một số flavonoid diglycosid và điểm số gắn

kết vào E1 HPV 18 (PDB ID: 1R9W) 42

Hình 3.21 Cấu trúc và tương tác (A: 2D, B: 3D) của hợp chất E186 trong khoang

gắn kết của E1 HPV 18 (PDB ID: 1R9W) Với nét xanh lá là liên kết hydro, nét hồngvà vàng là liên kết kỵ nước 43

Hình 3.22 Cấu trúc của hợp chất E157 (A) và E176 (B) 44Hình 3.23 Cấu trúc flavonoid triglycosid (A: E157 màu xanh, B: E176 màu hồng)

và tương tác 3D tương ứng trong khoang gắn kết của E1 HPV 18 (PDB ID: 1R9W).Với nét xanh lá là liên kết hydro, nét hồng và vàng là liên kết kỵ nước 44

Hình 3.24 Cấu trúc 2D và điểm số docking tương ứng của các hợp chất flavonoid

dạng aglycon 45

Hình 3.25 Phương thức gắn của hợp chất E081 và một số cấu trúc của flavonoid

aglycon với ái lực gắn kết trong khoang gắn của protein E1 của HPV 18 (PDB ID:1R9W) Vùng màu vàng là vị trí của 2 acid amin quan trọng Lys237 và Thr238 46

Trang 16

Hình 3.26 Cấu trúc của E221 (A), E254 (B) và tương tác của 2 hợp chất này trong

khoang gắn kết với protein E1 HPV 18 (PDB ID: 1R9W) Với nét xanh lá là liên kếthydro, nét hồng là liên kết kỵ nước 47

Hình 3.27 Cấu trúc, vị trí trong khoang và tương tác thuốc Podofilox (A) và

Imiquimod (B) Với nét xanh lá là liên kết hydro, nét hồng là liên kết kỵ nước, nétnét hồng và cam là liên kết kỵ nước Vùng màu vàng là vị trí của khoang gắn 48

Hình 3.28 Các hợp chất được lựa chọn nghiên cứu mô phỏng động lực học phân tử

50

Hình 3.29 Giá trị RMSD của backbone của protein E1 (PDB ID: 1R9W) và dạng

phức hợp với các chất trong quá trình mô phỏng động lực học 100 ns 51

Hình 3.30 Giá trị RMSF của protein E1 HPV 18 (PDB ID: 1R9W) dạng apo-protein

và dạng phức hợp trong quá trình mô phỏng động lực học phân tử 100 ns 52

Hình 3.31 Tổng diện tích bề mặt có thể tiếp cận dung môi (SASA) của protein E1

HPV 18 (PDB ID: 1R9W) 53

Hình 3.32 Bán kính quay (Rg) của protein E1 HPV 18 (PDB ID: 1R9W) trong quá

trình mô phỏng động lực học 100 ns 54

Hình 4.33 Cấu trúc tổng quát cho chất tiềm năng ức chế protein E1 của HPV 18

thuộc khung flavonoid 63

Hình 4.34 Cấu trúc và số lượng nhóm thế của hợp chất E186 và E221 Với nét xanh

lá là nhóm alcol (-OH), nét cam là nhóm carboxyl (-COO), nét vàng là dị vòng furanvà nét đỏ là vòng epoxy 70

Trang 17

DANH MỤC CÁC BẢNG

Bảng 1.1 Chức năng của các gen E trong cấu trúc của HPV 5Bảng 1.2 Các tương tác của E1 với một số protein của tế bào chủ 7Bảng 1.3 Giá trị của tham số ∆βi và wi dựa trên cấu trúc hóa học của hợp chất63 19

Bảng 2.4 Danh sách phần mềm sử dụng 23Bảng 3.5 Đánh giá chất lượng mô hình tương đồng được xây dựng 32Bảng 3.6 Giá trị pLDDT và TM-score của 5 mô hình dự đoán bằng Alpha Fold 33Bảng 3.7 Số lượng hợp chất theo khung cấu trúc thuộc nhóm 1 có ái lực gắn kết tốt

(<-7,0 kcal.mol-1) trên protein E1 HPV 18 (PDB ID: 1R9W) 36

Bảng 3.8 Kết quả đánh giá khả năng làm thuốc của 5 hợp chất tiềm năng 48Bảng 3.9 Các giá trị ADMET dự đoán của 5 hợp chất tiềm năng 49Bảng 3.10 Tần suất hiện diện liên kết hydro giữa các acid amin giữa protein E1 của

HPV 18 (PDB ID: 1R9W) với E157, E221 và E254 55

Bảng 3.11 Năng lượng gắn kết tự do theo phương pháp MM/PBSA của E157, E176,

E186, E221 và E254 với protein E1 của HPV 18 (PDB ID: 1R9W) từ dữ liệu môphỏng động lực học 100 ns (đơn vị: kcal.mol-1) 56

Bảng 3.12 Năng lượng gắn kết tự do theo phương pháp MM/GBSA của E157, E176,

E186, E221 và E254 với protein E1 của HPV 18 (PDB ID: 1R9W) từ dữ liệu môphỏng động lực học 100 ns (đơn vị: kcal.mol-1) 57

Bảng 3.13 Năng lượng gắn kết tự do theo phương pháp LIE của E186 và E221 với

protein E1 HPV 18 (PDB ID: 1R9W) từ dữ liệu mô phỏng động lực học 100 ns (đơnvị: kJ.mol-1) 58

Bảng 4.14 Tóm tắt giá trị năng lượng gắn kết tự do trung bình của 5 hợp chất với

protein E1 của HPV 18 (PDB ID: 1R9W) bằng 2 phương pháp MM/PBSA vàMM/GBSA (đơn vị: kcal.mol-1) 69

Trang 18

MỞ ĐẦU

Ung thư cổ tử cung là bệnh xảy ra ở cổ tử cung của phụ nữ Trong số khoảng 342.000ca tử vong do ung thư cổ tử cung ước tính vào năm 2020, khoảng 90% trong số nàyxảy ra ở các nước có thu nhập thấp và trung bình1 Tại Việt Nam, ung thư cổ tử cunglà bệnh ung thư phổ biến thứ 6 ở phụ nữ, với 4177 trường hợp mắc mới (ước tínhkhoảng 100.000 phụ nữ thì có 7,1 người mắc bệnh) và 2420 trường hợp tử vong vàonăm 20182 Phần lớn ung thư cổ tử cung (hơn 95%) là do Human Papillomavirus(HPV)3 Các phân nhóm nguy cơ cao của papillomavirus ở người gây ra hầu hết cáctrường hợp ung thư cổ tử cung3 Trong đó các tuýp HPV 16 và 18 đã gây ra khoảng90% tổng số ca mắc bệnh4 HPV 18 chiếm 10-12% tất cả các loại ung thư cổ tử cungvà là loại chủ yếu trong ung thư biểu mô tuyến và ung thư biểu mô thần kinh tế bàonhỏ của cổ tử cung5 Ung thư biểu mô tuyến rất khó phát hiện bằng phết tế bàoPapanicolaou (Pap), do đó ung thư do HPV18 thường liên quan đến bệnh tiến triểnnhanh và tử vong5.

Hiện nay, trên thị trường đã có các loại vắc xin ngăn ngừa nhiễm 9 chủng HPV baogồm: 6, 11, 16, 18, 31, 33 , 45, 52 và 586 Tại Việt Nam, vắc xin phòng nhiễm HPVđã được sử dụng từ những năm 20067, thế nhưng thực trạng tỷ lệ tiêm vắc xin phòngHPV ở Việt Nam còn thấp, ở mức 12% trong năm 2020-2028 Bên cạnh đó, các loạivắc xin này lại không có tác dụng phòng ngừa đối với các chủng còn lại của virusHPV nên sẽ không ngăn ngừa tất cả các trường hợp ung thư cổ tử cung9 Đồng thời,vắc xin sẽ có tác dụng phòng ngừa kém hiệu quả ở những người đã tiếp xúc với mộthay nhiều chủng HPV trước đó9 Vì thế, việc tìm ra thuốc điều trị bệnh ung thư cổ tửcung vẫn là vấn đề cấp thiết.

Bên cạnh việc tìm kiếm các hợp chất ức chế oncoprotein E6, E7 của HPV, hoạt độngenzym của protein E1 được xem là mục tiêu hấp dẫn10 để khám phá thuốc khángvirus, đặc biệt để điều trị các tổn thương liên quan đến HPV Protein E1 nhận diện vịtrí sao chép của trình tự ori và biến tính ADN tại vị trí này11 Với số bản sao chép 50bản trên một tế bào, protein E1 HPV cần thiết cho cả giai đoạn bắt đầu nhân lên vàduy trì bộ gen của virus12 Protein E1 không chỉ tác động đến các gen liên quan đến

Trang 19

chu trình tế bào mà còn giảm hoạt động của các gen đáp ứng miễn dịch như IFNβ1,IFNλ1, ISG13.

Trên thế giới đã có những nghiên cứu in silico, in vitro và in vivo liên quan đến việc

tìm kiếm hợp chất tự nhiên trong điều trị bệnh ung thư cổ tử cung Chẳng hạn nhưcurcumin làm giảm sự biểu hiện của protein E6 và E7 của HPV 16, HPV 18 dẫn đếnbiến đổi kiểu hình và ngừng tăng trưởng của các tế bào ung thư14, withaferin A ứcchế tốt E6, E7 của HPV 16 và HPV 18 với năng lượng tối thiểu15, jaceosidin và EGCGgiúp khôi phục hoạt động của protein ức chế khối u pRb trong bệnh u nguyên bàovõng mạc16, các hợp chất stigmasterol từ Berberis aristata và stereoemodin từ Rheumemodi đã được báo cáo có khả năng ức chế tốt protein E1 của HPV17 Tại Việt Nam,các nghiên cứu chỉ liên quan đến việc tầm soát ung thư cổ tử cung, chưa có nghiêncứu thuốc nào liên quan đến điều trị ung thư cổ tử cung, đặc biệt là việc tìm kiếm hợpchất tự nhiên tác động trên protein E1.

Với mục đích tận dụng các hợp chất được chiết xuất và phân lập từ bộ môn Dược liệunhằm tìm kiếm các hợp chất tự nhiên tiềm năng trong điều trị ung thư cổ tử cung dovirus HPV, đề tài được tiến hành với các mục tiêu như sau:

Mục tiêu tổng quát: Sàng lọc in silico các hợp chất tự nhiên tiềm năng được phân

lập tại Bộ môn Dược liệu – Đại học Y Dược TP Hồ Chí Minh ức chế protein E1 củaHPV 18.

Mục tiêu nghiên cứu:

1 Đánh giá trình tự acid amin trong khoang gắn của protein E1 HPV 18 với cáctuýp HPV khác.

2 Khảo sát độ ổn định của các phức hợp tiềm năng thông qua mô phỏng độnglực học phân tử (molecular dynamics simulation).

3 Tính toán và đánh giá năng lượng gắn kết của các chất tiềm năng trên E1 củaHPV 18 bằng 3 phương pháp: MM/PBSA, MM/GBSA và LIE.

4 Sàng lọc các hợp chất tự nhiên có tiềm năng ức chế HPV 18 bằng phương phápgắn kết phân tử (molecular docking).

Trang 20

CHƯƠNG I: TỔNG QUAN

1.1 Human Papillomavirus

Ung thư cổ tử cung là bệnh xảy ra ở cổ tử cung của người phụ nữ Phần lớn ung thưcổ tử cung (hơn 95%) là do Human Papillomavirus (HPV)18 Cho đến nay, ung thưcổ tử cung là căn bệnh phổ biến nhất liên quan đến virus HPV Mặc dù hầu hết cáctrường hợp nhiễm HPV do các tổn thương tiền ung thư đều có khả năng tự hồi phục,nhưng đối với tất cả phụ nữ, nhiễm HPV có nguy cơ trở thành bệnh mãn tính và cáctổn thương tiền ung thư tiến triển thành ung thư cổ tử cung xâm lấn18.

- Loại HPV nguy cơ cao (High-risk HPV hay HR HPV): gồm 12 loại HPV nguycơ cao, gây bệnh ung thư là: HPV 16, 18, 31, 33, 35, 39, 45, 51, 52, 56, 58 và59 (nhóm 1) và 8 loại HPV có thể gây ra bệnh ung thư là: HPV 26, 53, 66, 67,68, 70, 73 và 82 (nhóm 2A và 2B) được phân loại bởi Cơ quan Nghiên cứuUng thư Quốc tế (IARC) Trong số các loại nguy cơ cao, HPV 16 là kiểu genđược phát hiện thường xuyên nhất với 60,5% các trường hợp ung thư cổ tửcung, tiếp theo là HPV 18 (32,3%)19.

1.1.2 Cấu tạo của HPV

HPV là một loại virus nhỏ, không có vỏ bao, vật liệu di truyền là chuỗi ADN kép vớibộ gen khoảng 8 kb, thuộc họ Papillomaviridae20 Bộ gen của HPV bao gồm ba vùngriêng biệt: Vùng sớm (Early - E) bao gồm 7 gen (E1, E2, E4, E5A, E5B, E6 và E7),vùng muộn (Late - L) bao gồm L1, L2 và vùng điều hòa ngược dòng (Upstream

Trang 21

Regulatory Region – URR)20 Cấu trúc và chức năng của từng gen của HPV được

trình bày trong Hình 1.1

Chức năng cụ thể của các gen E được trình bày trong Bảng 1.1

Trong nghiên cứu và phát triển thuốc là các phân tử nhỏ để điều trị ung thư cổ tửcung, các oncoprotein E6, E7 của HPV là đích tác động được nghiên cứu nhiều nhất21.Bên cạnh đó, protein E1 cũng là đích tác động đang được quan tâm nhằm phát triểncác thuốc với mục đích ức chế sự sao chép ADN của virus trong tế bào chủ Đồngthời, với đặc tính bảo tồn cao của E1 giữa các loại HPV, việc phát triển thuốc ức chếtrên E1 được kỳ vọng sẽ có tác động hiệu quả trên nhiều loại HPV khác nhau Do đó,ức chế protein E1 được chọn làm mục tiêu nghiên cứu của đề tài.

Hình 1.1 Cấu trúc và chức năng các gen trên HPV18

Trang 22

Bảng 1.1 Chức năng của các gen E trong cấu trúc của HPV

Gen Đặc điểm Số acidamin

Vai trò

E1 Bảo tồn cao giữa các loại HPVkhác nhau và là protein HPVduy nhất có hoạt tính enzyme10.

600-650 Tham gia vào quá trình saochép ADN của virus12

E2 Tham gia tạo phức hợp với E1có ái lực cao với ADN của tếbào chủ22

350-500 E2 tương tác với E1 giúp choE1 dễ dàng gắn liền vào điểmkhởi động sao chép, tăngcường sao chép22

E4 E4 nằm ở vị trí trung tâm tronggen E2, tạo sản phẩm chínhtrong quá trình phiên mã23

Chưagiải mã

Vùng bảo tồn LLXLL tại vị tríacid amin 12-16 trên proteinE4 đóng vai trò then chốt trongviệc sừng hóa tế bào24

E5 Protein nhỏ, liên kết màng vàrất kỵ nước25

108 Tăng cường chức năng của E6,E7 và đã được chứng minh làgóp phần vào sự tiến triển củakhối u trên cơ thể người26

E6 Chứa hai mô-típ Cys-X-X-Cysgắn kẽm điều hòa và là mộttrong các protein gây ung thưchính của HPV27

151 Sự kích thích do E6 gây nên sựsuy giảm các chức năng sinhhọc của p53; do đó thúc đẩychu kỳ tế bào, cuối cùng dẫnđến tăng sự phát triển của tếbào khối u28

E7 Chứa 2 vùng gen bảo tồn29 98 Gây ung thư, hỗ trợ E6 tácđộng lên sự bất tử tế bào chủ29.

Trang 23

1.1.3 Protein E1 của virus HPVCấu tạo và chức năng

Trong vùng gen sớm từ E1 đến E7 của HPV có chứa khung đọc mở (Open readingframe – ORF) cần thiết cho sự nhân lên của virus và điều hòa phiên mã30 E1 là proteincó ORF lớn nhất và được bảo tồn cao nhất trong số các gen thuộc họ Papillomavirus(PV)10 Điều này phản ánh vai trò quan trọng của gen E1 trong quá trình sao chép bộgen của virus Nhìn chung, protein có thể được chia thành ba phân đoạn chức năng

chính được thể hiện trong Hình 1.2 Trong đó gồm: vùng điều hòa ở đầu Ncần thiết

cho sự sao chép in vivo31, miền liên kết trung tâm hay còn được gọi là miền liên kếtADN (DBD) nhận biết các vị trí cụ thể của trình tự khởi đầu sao chép (ori)11 và vùngenzym ở đầu C có hoạt tính như enzyme tháo xoắn ADN helicase/ATPase32 VùngDBD và vùng helicase ở đầu C đóng vai trò sao chép ADN phụ thuộc ori trong thí

nghiệm in vitro và là vùng quan trọng thúc đẩy quá trình sao chép của virus33.

Hình 1.2 Cấu trúc protein E1 của HPV34

Cơ chế gây bệnh

Sự sao chép ADN của virus: Đối với HR HPV nhóm 1, protein E1 có thể trực tiếpkhởi động sự sao chép ADN mà không cần có sự hỗ trợ định hướng của protein E235.

Ngược lại, đối với các loại PV khác, sự nhận dạng ori in vivo của E1 cần có E2 - loại

protein virus duy nhất cần thiết để bắt đầu sao chép ADN36.

Sự tương tác của E1 với các protein tham gia điều hòa/sao chép ADN của tế bào chủ:các loại virus gây khối u có vật liệu di truyền là ADN, bao gồm cả PV chỉ mã hóamột số protein và do đó phải phụ thuộc nhiều vào vật chủ nhằm đảm bảo các chức

Trang 24

ngoại lệ và đã được báo cáo là tương tác với một số protein của tế bào được thể hiện

trong Bảng 1.2

Bảng 1.2 Các tương tác của E1 với một số protein của tế bào chủ.

Tên protein Chức năng trong tếbào chủ của protein

Chức năng của tương tácprotein E1

Phức hợp ADNpolymerase α-primase

Sao chép ADN Đóng vai trò trực tiếp trongquá trình tổng hợp ADNcủa virus

Protein sao chépA (RPA)

Protein liên kết ADNsợi đơn

Đóng vai trò trực tiếp trongquá trình tổng hợp ADNcủa virus

Topoisomerase I(Topo I)

Tháo xoắn ADN Tăng hoạt động của

Topoisomerase I và liên kếtE1 với ori

Histone H1 Thành phần củanhiễm sắc thể

E1 có thể thay thế histoneH1 khỏi ADN, điều này cóthể làm giảm tác dụng kìmhãm của H1 đối với sự saochép ADN của virus

Trang 25

tế bào được ly giải để phát hiện hoạt động của luciferase bằng cách sử dụng thửnghiệm Pierce Firefly Luciferase Glow với Pierce Firefly Signal Enhancer (ThermoScientific) như mô tả của nhà sản xuất42 Sự phát quang được đọc trên đầu đọc vi tấmGemini EM (phát xạ 542 nm) bằng phần mềm Softmax Pro 3.2.143 Độc tính tế bàođược ước tính bằng cách sử dụng xét nghiệm XTT43, bắt chước xét nghiệm khángvirus nhưng không có vius Giá trị CC50 và IC50 được tính toán bằng cách sử dụngphân tích liều - đáp ứng - ức chế trên phần mềm GraphPad Prism v5.0c Từ đó, cácchỉ số điều trị (TI = CC50/IC50) được tính toán43.

1.2 Tiềm năng phát triển thuốc ức chế virus HPV từ dược liệu1.2.1 Nghiên cứu thuốc ức chế trên virus HPV

Trong thời gian gần đây, dược liệu và các chất chuyển hóa có hoạt tính sinh học đãtrở thành một trong những trọng tâm chính được quan tâm nhằm tìm kiếm các loạithuốc hiệu quả với giá cả phải chăng để đáp ứng những nhu cầu thiết yếu Các dượcliệu này được kỳ vọng có thể cản trở sự nhân lên của virus mà không ảnh hưởng đếnchức năng sinh lý của vật chủ hoặc hạn chế các tác dụng phụ44 Các nghiên cứu đãbáo cáo tác dụng ức chế của chất chiết xuất từ cây thuốc đối với sự nhân lên của mộtsố loại virus cụ thể như virus herpes, virus sốt xuất huyết, virus viêm gan C, virusSars-Cov-2, …45 Đối với virus HPV, nhiều dược liệu đã được báo cáo có tiềm năngức chế các oncoprotein của virus này Các hợp chất tự nhiên như curcumin, withaferin

A, apigetrin, theaflavin, hesperidin, epigallocatechin gallat đã được chứng minh có

khả năng ức chế protein E6, E7 của HPV14,20 (Hình 1.3).

Trang 26

Bên cạnh việc tìm kiếm các hợp chất ức chế oncoprotein E6, E7 của HPV, ức chếenzym của protein E1 cũng được xem là mục tiêu hấp dẫn để khám phá thuốc khángHPV, đặc biệt để điều trị các tổn thương liên quan đến HPV Tuy nhiên, hai loại chấtức chế E1 đã biết là: biphenylsulfonacetic acid và benzodiazepin được báo cáo là có

hoạt động tốt trong các thử nghiệm in vitro lại không có hiệu quả trong các thí nghiệm

nuôi cấy tế bào10 (Hình 1.4) Trong nghiên cứu gần đây, các hợp chất stigmasterol từ

Berberis aristata và stereoemodin từ Rheum emodi đã được báo cáo có khả năng ứcchế tốt protein E1 của HPV trong các thí nghiệm in silico17 Tính tới thời điểm hiệntại thực hiện đề tài, các công bố nghiên cứu trên hợp chất tự nhiên có tác dụng ức chế

Trang 27

protein E1 còn khá ít Điều này cho thấy việc tìm kiếm các hợp chất tự nhiên trên E1của HPV là một hướng mới trong việc thiết kế thuốc kháng virus này.

Hình 1.4 Các hợp chất dược liệu ức chế trên protein E1 HPV

1.3 Sàng lọc in silico

Trong những nằm gần đây, nghiên cứu in silico đã được áp dụng rộng rãi nhằm giảm

bớt thời gian cũng như chi phí và định hướng cho việc phát triển thuốc Nghiên cứu

in silico là phương pháp nghiên cứu dưới sự hỗ trợ của máy tính bao gồm các kỹ thuật

như xây dựng mô hình pharmacophore, mối liên quan giữa cấu trúc - tác dụng (QSARhay quantitative structure - activity relationship), mô hình tương đồng (homologymodelling), học máy (machine learning), gắn kết phân tử (molecular docking), độnglực học phân tử (molecular dynamics simulation),…Tùy theo thiết kế và mục đíchnghiên cứu, các phương pháp phù hợp sẽ được lựa chọn.

1.3.1 Căn chỉnh nhiều trình tự và phân tích phát sinh loài

Khái niệm

Căn chỉnh nhiều trình tự (multiple sequence alignment - MSA) là một công cụ dựđoán cấu trúc và chức năng của protein, suy luận phát sinh loài và các nhiệm vụ phổbiến khác trong phân tích trình tự64 MSA sắp xếp các chuỗi protein thành một mảnghình chữ nhật với mục đích căn chỉnh thứ tự sao cho các acid amin tương đồng, khônglà đồng phân quang học hoặc có chung một vai trò sẽ được xếp trên cùng một cột64.Phân tích phát sinh loài (phylogenetic analysis) là sơ đồ phân nhánh được lập để thểhiện lịch sử tiến hóa hoặc mối quan hệ giữa các loài, sinh vật khác nhau hoặc các đặcđiểm của sinh vật như gen, protein, cơ quan, … được phát triển từ một tổ tiên chung65.

Trang 28

Vai trò

Căn chỉnh nhiều trình tự và phân tích phát sinh loài đóng vai trò quan trọng trong dựđoán hoạt tính và tương tác của các phân tử thuốc Nhờ việc so sánh các trình tự genhoặc protein có liên quan, nghiên cứu có thể dự đoán các vùng quan trọng cho hoạttính của những đại phân tử như protein Những thông tin này rất hữu ích trong việcthiết kế các phân tử thuốc có khả năng tương tác mạnh với mục tiêu mong muốn64.

Quá trình thực hiện

Quá trình căn chỉnh nhiều trình tự và phân tích phát sinh loài gồm có ba giai đoạnchính: thu thập trình tự, lựa chọn phương pháp căn chỉnh và trực quan hóa kết quả66.- Thu thập trình tự: Tập hợp các trình tự có sự liên hệ về họ hàng hoặc có cùngnguồn gốc tiến hóa hoặc tương tự chức năng được thu thập từ ngân hàngUniProt (https://www.uniprot.org), NCBI (https://www.ncbi.nlm.nih.gov).Các trình tự sau đó được lưu lại trong cùng 1 tệp *.txt.

- Lựa chọn phần mềm: Dựa trên 3 tiêu chí bao gồm độ chính xác sinh học, thờigian thực hiện và tài nguyên máy tính Các phần mềm thường sử dụng baogồm: ClustalW, Clustal Omega, MUSCLE,…

- Trực quan hóa kết quả: Kết quả có thể được thể hiện ở dạng đồ thị đặc trưngbiểu diễn các đặc trưng quan trọng trên căn chỉnh, heatmap thể hiện mức độtương tự giữa các cặp trình tự trong căn chỉnh hoặc sơ đồ cây thể hiện mốiquan hệ tiến hóa giữa các trình tự.

1.3.2 Gắn kết phân tử

Khái niệm

Gắn kết phân tử (molecular docking) là phương pháp mô phỏng quá trình gắn kết củaphân tử này vào phân tử khác, hay nói cách khác dùng để tìm kiếm phối tử phù hợpvới các vị trí liên kết của protein nhằm đạt được cấu trúc tối ưu hóa cho cả protein vàphối tử, sao cho năng lượng gắn kết của phức hợp là nhỏ nhất46 Phương pháp này cóthể dự đoán ái lực liên kết giữa phối tử, protein và cấu trúc của phức hợp protein-phốitử, đây là thông tin hữu ích để tối ưu hóa hợp chất Việc gắn kết phân tử đã được áp

Trang 29

dụng trong hơn ba thập kỷ và một số lượng lớn các loại thuốc mới đã được phát hiệnvà phát triển tương ứng dựa trên phương pháp này47.

Có ba kiểu gắn kết thường gặp là gắn cố định (rigid docking), gắn bán linh động(semi-flexible docking) và gắn linh động tối đa (full flexible docking) Trong đó, kiểugắn bán linh động (protein tĩnh, ligand động) là phổ biến nhất48.

- Gắn cố định: dựa trên mô hình chìa khóa - ổ khóa được Fisher đề xuất vàonăm 198449, cả protein và phối tử đều được coi là cấu trúc cứng, nghĩa là cấutrúc không gian không thay đổi trong quá trình gắn kết phân tử giữa phối tửvà protein, chỉ có vị trí không gian và tư thế của hai phân tử thay đổi50 Phươngpháp này thích hợp để khảo sát hệ thống gắn kết có cấu trúc tương đối lớn,chẳng hạn như phức hợp protein-protein và protein–acid nucleic.

- Gắn bán linh động: cấu trúc của protein cố định trong khi cấu trúc của phối tửđược phép thay đổi trong một phạm vi nhất định Phương pháp này đã đượcsử dụng rộng rãi trong mô phỏng gắn kết giữa các phân tử nhỏ và các đại phântử sinh học (protein, enzym và acid nucleic) vì khả năng tính toán và dự đoáncủa mô hình51.

- Gắn linh động tối đa: cấu trúc của phối tử và protein được phép thay đổi mộtcách linh động Bởi vì phương pháp này có độ chính xác cao và gần với việcgắn kết thực tế nhất nên thường được sử dụng để nghiên cứu một cách chínhxác sự nhận diện giữa hai phân tử52.

Quá trình thực hiện gắn kết phân tử:

Để thực hiện gắn kết phân tử cần có các thành phần sau:

- Cấu trúc ba chiều (3D) của protein: được xác định bằng phương pháp nhiễuxạ tia X hoặc NMR hay bằng thực nghiệm và được lưu trữ trên các cơ sở dữliệu như Protein Data Bank (http://www.rcsb.org/pdb), ReLiBase(http://relibase.ccdc.cam.ac.uk), Binding MOAD(http://www.bindingmoad.org), Trong trường hợp cấu trúc protein chưa

Trang 30

được xác định, có thể xây dựng cấu trúc bằng mô hình tương đồng (homologymodelling) dựa trên các trình tự hay các protein đã biết.

- Cấu trúc của phối tử: có thể được tải từ các cơ sở dữ liệu có sẵn nhưChemSpider, PubChem, … hoặc được xây dựng từ phần mềm Chemdraw,Ghemical hay PRODRG khi chưa có sẵn cấu trúc 3D.

- Vị trí gắn của phối tử trên protein: Vị trí gắn trên protein thông thường đã đượcnghiên cứu, tham khảo từ những protein đã biết cùng họ với protein khảo sáthay từ cấu trúc đồng kết tinh Khi thông tin về vị trí gắn bị thiếu, có hai cáchtiếp cận thường được sử dụng: tìm các vị trí liên kết có khả năng nhất được dựđoán theo thuật toán dự đoán53 hoặc thực hiện phương pháp “docking mù”54.

Đánh giá gắn kết phân tử

Khả năng gắn kết của phức hợp protein-ligand được đánh giá bằng điểm số dockinghoặc năng lượng gắn kết (kcal.mol-1 hoặc kJ.mol-1) Năng lượng gắn kết càng thấp,tức là điểm số docking càng thấp và ái lực gắn kết càng mạnh.

1.3.3 Mô phỏng động lực học phân tử

Khái niệm

Mô phỏng động lực học phân tử (molecular dynamics simulation – MDs) là việc sửdụng các kỹ thuật và thuật toán máy tính để khảo sát độ bền, độ chuyển động của cácthành phần (nguyên tử, phân tử, hạt,…) khi đưa vào hệ, dưới ảnh hưởng của nhiệt độ,áp suất và dung môi dựa trên nguyên lý của định luật II Newton55.

Quá trình thực hiện mô phỏng động lực học phân tử

Quá trình mô phỏng động lực học phân tử gồm có bốn giai đoạn chính: chuẩn bị cấutrúc ban đầu, tối thiểu hóa năng lượng, cân bằng hệ thống và mô phỏng động lực họcphân tử56.

- Bước 1: Chuẩn bị cấu trúc ban đầu bao gồm thông số vị trí, tọa độ ban đầu của

các nguyên tử trong hệ khi được đặt trong một từ trường thích hợp Một số từtrường dùng trong MDs: CHARMM36, CHARMM27, AMBER, GROMOS,

Trang 31

OPLS-AA/L, … Sau đó, tạo hộp mô phỏng động lực học phân tử gồm haithông số là kích thước và hình dạng Hai mô hình dung môi phổ biến là bêntrong (implicit) hoặc bên ngoài (explicit), nhằm solvat hóa protein và bắtchước môi trường sinh lý trong cơ thể Một số mô hình dung môi: TIP3P,TIP4P, TIP5P, SPC, SPC/E, … Một lượng ion cụ thể được thêm vào để trunghòa điện tích của hệ thống, thường là ion Na+ hoặc Cl-56.

- Bước 2: Thực hiện tối thiểu hóa năng lượng dựa trên thuật toán gradient

descent nhằm tìm ra cực tiểu của hàm số năng lượng56.

- Bước 3: Cân bằng hệ thống trong các điều kiện “isothermal-isobaric” NVT

(số hạt N, thể tích V và nhiệt độ T) và NPT (số hạt N, áp suất P và nhiệt độ T).Bể nhiệt (Berendsen, Velocity rescaling, Langevin, Andersen, …), được sửdụng để duy trì nhiệt độ và bể áp Parrinello-Rahman duy trì áp suất Thuậttoán Particle Mesh Ewald dùng mô phỏng tương tác tĩnh điện học và thuậttoán Velvet được dùng để tìm các nguyên tử xung quanh và biến thiên hệ theothời gian56.

- Bước 4: Mô phỏng động lực học phân tử theo thời gian đã được thiết lập Kết

thúc quá trình mô phỏng động lực học dữ liệu kết quả sẽ được trích xuất vàphân tích kết quả để đánh giá sự chuyển động và độ bền của hệ thống56.

Đánh giá mô phỏng động lực học phân tử

Đánh giá kết quả MDs qua các đại lượng: RMSD (root‐mean‐square deviation),RMSF (root-mean-square fluctuation), tần suất của liên kết hydro, bán kính quay,diện tích bề mặt tiếp xúc với dung môi hay tính năng lượng gắn kết, …

- RMSD (root‐mean‐square deviation): căn bậc hai của độ lệch bình phươngtrung bình của protein hoặc phối tử so với vị trí ban đầu, dùng để đánh giá độổn định của phức hợp Giá trị RMSD được tính theo công thức57:

𝑅𝑀𝑆𝐷(𝑡1, 𝑡2) = [1

𝑁∑‖𝑟𝑖(𝑡1) − 𝑟𝑖(𝑡2)‖2𝑁

12

Trang 32

Với 𝑟𝑖(𝑡1) là vị trí của nguyên tử i tại thời điểm t1, 𝑟𝑖(𝑡2) là vị trí của nguyêntử i tại thời điểm t2 = 0, 𝑁 là tổng số nguyên tử trong hệ.

Thông thường, giá trị RMSD được tính trên mạch chính (backbone) củaprotein, bao gồm những nguyên tử N, Cα của protein Cấu trúc được xem ổnđịnh và có ý nghĩa khi RMSD < 2,0 Å57.

- RMSF (root - mean - square fluctuation): Là căn bậc hai độ dao động trungbình bình phương để khảo sát dao động của các acid amin của protein so vớigiá trị trung bình, thể hiện độ linh động của mỗi acid amin.

Với 𝑟𝑖(𝑡𝑗) là vị trí của nguyên tử i tại thời điểm 𝑡𝑗, riref là vị trí của i đối chiếu.Từ kết quả của RMSF của Cα ta có thể thấy được vùng nào của protein là ổnđịnh hoặc không Thông thường các vùng có cấu trúc xoắn α hoặc β sẽ cóRMSF thấp do có mạng lưới liên kết hydro ổn định57.

- Tần suất của liên kết hydro (hydrogen bond occupancy): xem xét protein cóđược ổn định bởi các liên kết hydro giữa acid amin với phối tử hay không, daođộng bao nhiêu trong mô phỏng58.

- Bán kính quay (radius of gyration - Rg) đo độ nén của protein Nếu một proteingiữ vững cấu trúc trong quá trình mô phỏng động lực học thì giá trị Rg tươngđối ổn định57 Nếu một protein mở ra (không ổn định), Rg không tăng hoặc cóxu hướng giảm:

𝑅𝑔 = (∑ |𝑟𝑖 𝑖|2𝑚𝑖∑ 𝑚𝑖 𝑖 )

Với 𝑟𝑖 là vị trí của nguyên tử 𝑖, 𝑚𝑖 là khối lượng nguyên tử 𝑖.

Diện tích bề mặt tiếp xúc với dung môi (solvent accessible surface area SASA) cho biết diện tích bề mặt của một phân tử sinh học có thể tiếp xúc vớidung môi, xác định độ hòa tan của protein trong nước, cách protein tương tácvới các phân tử khác và cách nó tạo thành một dạng hoạt động ổn định Nếu

Trang 33

-cấu trúc protein gấp ổn định thì diện tích bề mặt nhỏ, SASA ổn định Nếuprotein không ổn định, không còn cấu trúc gấp làm diện tích bề mặt lớn, giátrị SASA sẽ tăng57.

1.3.4 Năng lượng gắn kết tự do

Khái niệm

Trong nhiệt động lực học, năng lượng tự do (free energy) biểu diễn năng lượng dùngđể thực hiện công của một hệ và được dùng để xác định hướng diễn biến của quátrình nhiệt động cũng như xác suất hệ sẽ duy trì ở trạng thái ổn định59 Vì năng lượngtự do quyết định tất cả các quá trình của phân tử bao gồm khả năng gấp cuộn protein,liên kết phân tử, phản ứng học, nên việc xác định chính xác năng lượng tự do làmột trong những nhiệm vụ quan trọng khi nghiên cứu về các phân tử sinh học59.Trong lĩnh vực thiết kế thuốc hợp lý, khái niệm năng lượng gắn kết tự do (bindingfree energy-BFE) được sử dụng để mô tả độ mạnh của liên kết giữa protein và phântử thuốc Trong đó, mục tiêu của việc thiết kế thuốc dựa trên đích tác động (structure-based) là tìm ra các hợp chất tiềm năng (lead compound) có khả năng gắn kết tốt vớiprotein đích So với các phương pháp thử nghiệm, việc áp dụng máy tính để dự đoánnăng lượng gắn của các phức hợp protein và ligand có thể thực hiện bằng phươngpháp docking để tiết kiệm đáng kể về thời gian và chi phí thực hiện59.

Các phương pháp tính năng lượng gắn kết

Có hai cách tiếp cận để dự đoán BFE bằng phương pháp điểm cuối bao gồm tương

đối và tuyệt đối (Hình 1.5) Đây là những phương pháp điểm cuối (end-point method)

thường được sử dụng để dự đoán năng lượng gắn kết và đánh giá độ mạnh yếu củaliên kết giữa protein và ligand79 Phương pháp này dự đoán BFE dựa trên trạng tháicuối (end stage) để xác định sự chênh lệch về năng lượng giữa phức hợp protein-ligand sau khi gắn kết với protein và ligand ở dạng tự do79 Điều này khắc phục đượcnhược điểm về độ chính xác của dự đoán ái lực gắn kết bằng phương pháp gắn kếtphân tử60.

Trang 34

Hình 1.5 Cách tiếp cận của phương pháp điểm cuối (end-point method)61Các phương pháp tiếp cận tương đối gồm có MM/PBSA và MM/GBS79 Cả haiphương pháp này dự đoán năng lượng gắn bằng cách tính trung bình của các khunghình (hay hình ảnh chụp) thu được từ các mô phỏng động học phân tử tại các thờiđiểm khác nhau61 Các khung hình này có thể được thu thập từ ba quỹ đạo khác nhau:phức hợp protein-ligand, ligand và protein, hoặc chỉ một quỹ đạo giữa phức hợpprotein-ligand61, được trích xuất từ các mô phỏng MDs trong dung môi (Hình 1.5).

Khi chỉ sử dụng một quỹ đạo mô phỏng, phương pháp này bỏ qua đóng góp nănglượng từ hình dạng của protein và ligand giữa trạng thái tự do và sau khi gắn kết61.Do đó, dự đoán dựa trên một quỹ đạo mô phỏng chỉ phù hợp khi protein và ligandkhông thay đổi nhiều về hình dạng trước và sau khi gắn kết, và được áp dụng để tiếtkiệm chi phí tính toán61.

Trong khi đó, phương pháp tính toán BFE tuyệt đối như LIE lại dự đoán năng lượnggắn dựa trên 2 mô phỏng khác nhau60 (Hình 1.5) Mô phỏng thứ nhất bao gồm chỉ

ligand trong dung môi, còn mô phỏng thứ hai bao gồm phức hợp protein-ligand trongdung môi Sau đó, ligand và phức hợp protein-ligand sau khi được trích xuất từ 2 mô

phỏng này được sử dụng để tính toán năng lượng van der Waals và năng lượng tĩnh

điện trung bình của sự tương tác giữa ligand và dung môi, cũng như giữa phức hợpvà dung môi61 Phương pháp LIE tính toán giá trị BFE dựa trên sự chênh lệch năng

Trang 35

lượng van der Waals và năng lượng tĩnh điện giữa trạng thái liên kết (phức hợp) và

trạng thái không liên kết (ligand) trong dung môi61.

Việc lựa chọn phương pháp tính toán BFE dựa trên cách tiếp cận tương đối hay tuyệtđối phụ thuộc vào nhiều yếu tố bao gồm: tài nguyên máy tính, thời gian tiến hành vàđộ tin cậy của giá trị dự đoán.

1.3.4.1 MM/PBSA và MM/GBSA

Năng lượng gắn kết tự do (binding free energy) của phức hợp protein – ligand đượctính toán bằng nguyên lý cơ học phân tử diện tích bề mặt Poisson – Boltzmann(MM/PBSA) hoặc tính toán bằng nguyên lý cơ học phân tử diện tích bề mặt sinh tổngquát (MM/GBSA).

∆𝐺𝑏𝑖𝑛𝑑𝑖𝑛𝑔 = 𝐺𝑐𝑜𝑚𝑝𝑙𝑒𝑥− (𝐺𝑝𝑟𝑜𝑡𝑒𝑖𝑛 + 𝐺𝑙𝑖𝑔𝑎𝑛𝑑) (1)∆𝐺𝑏𝑖𝑛𝑑𝑖𝑛𝑔 = 𝐸𝑀𝑀 + ∆𝐺𝑠𝑜𝑙𝑣 − 𝑇∆𝑆 (2)

∆𝐸𝑀𝑀 = ∆𝐸𝑒𝑙𝑒𝑐 + ∆𝐸𝑣𝑑𝑤 (3)∆𝐺𝑠𝑜𝑙𝑣 = ∆𝐺𝑃𝐵/𝐺𝐵 + ∆𝐺𝑆𝐴 (4)

Trong đó, 𝐺𝑐𝑜𝑚𝑝𝑙𝑒𝑥, 𝐺𝑝𝑟𝑜𝑡𝑒𝑖𝑛, 𝐺𝑙𝑖𝑔𝑎𝑛𝑑 lần lượt là năng lượng của phức hợp, protein và

ligand và có thể được tính bằng tổng năng lượng van der Waals (∆𝐸𝑣𝑑𝑤), năng lượng

của tương tác tĩnh điện (∆𝐸𝑒𝑙𝑒𝑐 ), năng lượng solvat hoá phân cực (∆𝐺𝑃𝐵/𝐺𝐵 ) và nănglượng solvat hóa không phân cực (∆𝐺𝑆𝐴 ) Sự khác biệt giữa phương pháp MM/PBSAvà MM/GBSA nằm ở các cách tính ∆𝐺𝑃𝐵/𝐺𝐵 khác nhau Trong mô hình MM/PBSA,thuật ngữ này được tính bằng cách giải phương trình Poisson – Boltzmann và tốn thờigian tính toán Trong khi trong mô hình MM/GBSA, nó được ước lượng gần đúnghơn dựa trên mô hình diện tích bề mặt sinh tổng quát và do đó được suy ra bằng cáchsử dụng cách tiếp cận nhanh hơn59.

Ưu - nhược điểm

Việc áp dụng tính toán BFE bằng phương pháp này được đánh giá là có độ chính xác

Trang 36

mô phỏng động lực học60 Đồng thời, phương pháp này có thể tiết kiệm thời gian vàchi phí tính toán khi các đặc điểm tương tác của dung môi được lấy giá trị trung bìnhthay vì tính trên tất cả phân tử dung môi60 Vì vậy, độ chính xác của phương pháp cóthể được gia tăng khi sử dụng càng nhiều khung hình Tuy nhiên, nhược điểm củaphương pháp chính là sự kém hiệu quả khi tính toán các BFE của những hợp chất cóái lực tương tự nhau và tính toán năng lượng tuyệt đối của phức hợp protein-ligand60.

1.3.4.2 LIE

LIE (linear interaction energy) là phương pháp tính toán năng lượng gắn kết tự do(BFE) bằng hàm tính điểm bán thực nghiệm và được xây dựng dựa trên liên quannăng lượng tự do tuyến tính Năng lượng của phức hợp (bound) và ligand (free) trongdung môi được trích xuất từ kết quả mô phỏng động lực phân tử62.

ΔGbind =  (Eljbound - Eljfree) +  (Eqqbound - Eqqfree) (5)

Trong đó: Eljbound, Eljfree lần lượt là năng lượng tương tác van der Waals trung bình

của phức hợp protein-ligand trong dung môi và ligand với trong dung môi Eqqbound,Eqqfree lần lượt là năng lượng tương tác tĩnh điện trung bình của ligand-protein và

ligand-dung môi Giá trị  được xác định từ thực nghiệm là 0.181, giá trị  thay đổitùy theo cấu trúc hóa học của ligand và công thức sau63:

 = o +∑ wi i∆βi∑ wi i (6)

Trong đó: o có giá trị là 0,43; ∆βivà wi được xác định dựa vào giá trị Bảng 1.3.

Bảng 1.3 Giá trị của tham số ∆βi và wi dựa trên cấu trúc hóa học của hợp chất63

Tham số Giá trị Cấu tạo hóa học của hợp chất

∆βi -0,06 Nhóm alcol

∆βi -0,04 Nhóm amin bậc 1, 2∆βi -0,02 Nhóm amid bậc 1∆βi -0,03 Nhóm acid carboxylic∆βi +0,02 Anion

Trang 37

Tham số Giá trị Cấu tạo hóa học của hợp chất

∆βi +0,09 Cation

wi 1,0 Nếu cấu trúc không tích điệnwi 11,0 Nếu cấu trúc tích điện

Ưu - nhược điểm

Việc áp dụng phương pháp dự đoán BFE bằng LIE có thể cho kết quả BFE có độchính xác cao khi BFE được xác định bằng đường tuyến tính với các hệ số ,  đượcxây dựng từ thực nghiệm62 Vì vậy, LIE có thể dự đoán năng lượng gắn tuyệt đối giữacác ligand khác nhau trên cùng một protein62 Tuy nhiên, giữa các receptor/proteinkhác nhau thì các thông số ,  là khác nhau, do đó cần xác định lại hai tham số này.Vì vậy, để khắc phục hạn chế khi chưa có dữ liệu thực nghiệm, ,  được dự đoán vàtinh chỉnh dựa trên cấu trúc hóa học của ligand63.

1.4 Tình hình nghiên cứu trong và ngoài nước1.4.1 Tình hình nghiên cứu trên thế giới

Cho đến nay, đã có nhiều nghiên cứu xác định các hợp chất tự nhiên có tiềm năng ức

chế HPV thông qua sàng lọc in silico Trong đó kỹ thuật được sử dụng nhiều nhất là

gắn kết phân tử (phương pháp docking) đã xác định nhiều cấu trúc có khả năng gắntốt với các protein của HPV bao gồm: ginkgetin20, hợp chất 6-gingerol67, withaferinA15, withnolide D20, theaflavin20, hesperidin20, quercetin-3-glucoside20 là chất ức chếmạnh với protein E6, E7 trong việc điều trị ung thư cổ tử cung.

Nghiên cứu sâu hơn hướng đến việc kết hợp nhiều kỹ thuật in silico Phương pháp

kết hợp kỹ thuật gắn kết phân tử và mô phỏng động lực học phân tử đã xác định cácchất tiềm năng gồm: hợp chất ASK468, một dẫn xuất valganciclovir68, hợp chất tiềmnăng dựa trên 2 khung cấu trúc đã biết là 2-aminobenzothiazole69 và chromonemoiety69, stigmasterol từ Berberis aristata17, stereoemodin từ Rheum emodi17, n-hexadecanoic acid70 và các chất tương tự70 ức chế tốt protein E6, E7 của HPV.

Stigmasterol từ Berberis aristata17 và stereoemodin từ Rheum emodi17 được nghiên

Trang 38

cứu xác định là chất ức chế E1 trong điều trị ung thư cổ tử bằng phương pháp kết hợp

kỹ thuật gắn kết phân tử và mô phỏng động lực học phân tử Để khảo sát khả nănggắn kết đủ để thực hiện các hoạt tính sinh học của hợp chất tiềm năng trên proteinđích của HPV, các nghiên cứu sâu hơn sử dụng phương pháp tính toán năng lượnggắn kết bằng phương pháp MM/GBSA đã xác định 3 thuốc tiềm năng trên thị trườngcho tác động ức chế E1 HPV 18 gồm Cinalukast, Lobeglitazone và Efatutazone84,bên cạnh các hợp chất tiềm năng khác như Cidofovir, Jaceosidin, ZINC111606147,ZINC362643639, ZINC9609654517,71.

1.4.2 Tình hình nghiên cứu trong nước

Tại Việt Nam, đã có các nghiên cứu liên quan đến việc tầm soát ung thư cổ tử cungvà tình hình nhiễm bệnh của các phụ nữ trên các tỉnh thành từ đó chỉ ra được nhữngcá thể có nguy cơ mắc bệnh ung thư hoặc đang ở giai đoạn tiền ung thư cổ tử cung,cho thấy tình hình nhiễm HPV trong cộng đồng từ đó vận động người dân thực hiệncông tác phòng chống một cách có hiệu quả Tuy nhiên, hiện nay chưa có nghiên cứunào nhằm tìm kiếm các hợp chất có tác dụng liên quan đến điều trị HPV, đặc biệt làcác hợp chất tác động trên protein E1.

Trang 39

CHƯƠNG II: PHƯƠNG PHÁP NGHIÊN CỨU

2.1 Đối tượng nghiên cứu

Đối tượng bao gồm mục tiêu tác động protein E1 của HPV và chất ức chế tiềm năng.

- Được kết tinh ở dạng tự do, không gắn với ligand (apo-protein).

Hình 2.6 Hình minh họa cấu trúc của vùng gắn kết ADN của protein E1 HPV18 từ

ngân hàng dữ liệu Protein (PDB ID: 1R9W)

2.1.2 Cơ sở dữ liệu

Cơ sở dữ liệu cho quá trình sàng lọc gồm 286 hợp chất tự nhiên (HCTN) được phânlập và chiết xuất từ dược liệu Các hợp chất này được thu thập từ các khóa luận củabộ môn Dược Liệu - Khoa Dược - Đại Học Y Dược TP.HCM từ năm 2005 đến năm2020 Hai thuốc sử dụng trong điều trị HPV là Podofilox và Imiquimod được tải vềtừ cơ sở dữ liệu PubChem Cấu trúc 2D của các HCTN được chuẩn bị bằng phần

Trang 40

mềm ChemSketch 2022.1.2 dưới dạng tập tin *.sdf, sau đó được chuyển sang cấu trúc3D dưới dạng tập tin *.pdb và *.pdbqt bằng phần mềm Discovery Studio Visualiser2021 và Autodock Tools 1.5.6 để làm dữ liệu cho quá trình xác định các cấu trúc tiềm

năng (Phụ lục 1).

2.1.3 Phần mềm nghiên cứu

Các phần mềm được sử dụng trong nghiên cứu được liệt kê trong Bảng 2.4

Bảng 2.4 Danh sách phần mềm sử dụng

Phần mềm Mục đích Bản quyền TLTKChemSketch

Vẽ cấu trúc 2D của ligand Mở 72

Discovery StudioVisualiser 2021

Autodock Tools1.5.6

Chuẩn bị protein, ligand và thôngsố gắn kết

Autodock Vina1.1.2

Gromacs 2022.5 Mô phỏng động lực học phân tử Mở 76

CHARMM36 Thiết lập các trường lực cho độnglực học phân tử

gmx lie Tính BFE bằng phương pháp LIE Mở 76

gmx_MMPBSA Tính BFE bằng phương phápMM/PBSA và phương phápMM/GBSA

Clustal Omega So sánh trình tự acid amin trongkhoang gắn của E1 HPV 18 vớicác tuýp HPV còn lại và đánh giákết quả thu được từ MSA dựa trêncây phát sinh loài

Ngày đăng: 03/06/2024, 15:22