cũng cho thấy hiệu quả trong việcgiảm tích lũy lipid tại mô và cơ quan.2PPARs là một họ thụ thể nhân gồm 3 loại: PPARα, PPARδ, PPARγ.3 Với tiềm nănghoạt hóa đơn, kép và đa thụ thể, PPA
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ Y TẾ
ĐẠI HỌC Y DƯỢC THÀNH PHỐ HỒ CHÍ MINH
NGUYỄN ĐỨC XUÂN THỤY SĨ
NGHIÊN CỨU IN SILICO HỢP CHẤT TỰ NHIÊN CÓ KHẢ
NĂNG HOẠT HÓA THỤ THỂ PPARδ HƯỚNG ĐIỀU TRỊ
RỐI LOẠN LIPID MÁU
LUẬN VĂN THẠC SĨ DƯỢC HỌC
THÀNH PHỐ HỒ CHÍ MINH, NĂM 2023
Trang 2BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ Y TẾ
ĐẠI HỌC Y DƯỢC THÀNH PHỐ HỒ CHÍ MINH
NGUYỄN ĐỨC XUÂN THỤY SĨ
NGHIÊN CỨU IN SILICO HỢP CHẤT TỰ NHIÊN CÓ KHẢ
NĂNG HOẠT HÓA THỤ THỂ PPARδ HƯỚNG
ĐIỀU TRỊ RỐI LOẠN LIPID MÁU
NGÀNH: CÔNG NGHỆ DƯỢC PHẨM VÀ BÀO CHẾ THUỐC
MÃ SỐ: 8720202 LUẬN VĂN THẠC SĨ DƯỢC HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS TS NGUYỄN THỤY VIỆT PHƯƠNG
THÀNH PHỐ HỒ CHÍ MINH, NĂM 2023
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan luận văn này là công trình nghiên cứu của tôi Những phần
sử dụng tài liệu tham khảo trong luận văn đã được nêu rõ trong phần tài liệu thamkhảo Các kết quả nghiên cứu được trình bày trong luận văn là trung thực, khách quan
Tác giả luận văn
Nguyễn Đức Xuân Thụy Sĩ
Trang 4Luận văn tốt nghiệp Thạc sĩ Dược học – Khóa: 2021 - 2023
NGHIÊN CỨU IN SILICO HỢP CHẤT TỰ NHIÊN CÓ KHẢ NĂNG HOẠT
HÓA THỤ THỂ PPARδ HƯỚNG ĐIỀU TRỊ RỐI LOẠN LIPID MÁU
Mở đầu và đặt vấn đề
PPARδ (Peroxisome proliferator activated receptor), một trong ba thụ thểthuộc họ PPARs Chất chủ vận PPARδ cho tác động ngăn cản quá trình tổng hợp lipid
ở mô, từ đó hiệu quả trong điều trị rối loạn lipid huyết Mục tiêu của nghiên cứu là
nghiên cứu mô hình dự đoán in silico khả năng hoạt hóa thụ thể PPARδ của hợp chất
tự nhiên hướng mục tiêu điều trị rối loạn lipid huyết
Đối tượng và phương pháp nghiên cứu
Mục tiêu PPARδ (PDB: 3GZ9), protein so sánh PPARα (PDB:5HYK), PPARγ(PDB:3NOA) và chất chủ vận trên PPARδ thu thập từ các bài báo khoa học và cơ sở
dữ liệu ChemBL Cơ sở dữ liệu sàng lọc gồm 286 hợp chất tự nhiên được chiết xuất
tại khoa Dược Đại học Y Dược Thành phố Hồ Chí Minh Mô hình sàng lọc in silico
gồm (pharmacophore, mô hình phân loại), mô hình QSAR, gắn kết phân tử và môphỏng động lực học phân tử được kết hợp nhằm tối ưu hóa quá trình tiềm kiếm hợpchất tự nhiên
Kết quả và bàn luận
Mô hình pharmacophore L-01 dựa trên phối tử với năm điểm: một điểm vòngthơm, hai điểm kị nước và hai điểm nhận hydro, điểm nhận liên kết hydro với độ nhạy(Se = 0,91), độ đặc hiệu (Sp = 0,97), độ chính xác (Acc = 0,97) Mô hìnhpharmacophore dựa trên cấu trúc S-01 xây dựng dựa trên phức hợp PPARδ(PDB:3GZ9) (Se= 0,90, Sp = 0,96, Acc = 0,96, GH =0,5, EF =13,71) Mô hình M-01(với R2 toàn tập = 0,9890, MSE = 0,098) là mô hình dự đoán hoạt tính được xây dựngdựa trên thông số mô tả được xác định thông qua mô hình hồi quy tuyến tính 21 hợpchất tự nhiên từ cơ sở dữ liệu thỏa đồng thời mô hình kép pharmacophore với hoạttính dự đoán (EC50) từ 0,07 - 585,52 µM thông qua mô hình mạng thần kinh Hai hợpchất C225 và C270 cho thấy gắn kết vào khoang PPARδ ở mức khá đến tốt (điểm sốgắn kết -6,42 kcal.mol-1 và -7,42 kcal.mol-1) và tiếp tục được chứng minh giúp ổnđịnh cấu trúc protein thông qua mô phỏng động lực học
Kết luận
Các hợp chất C225, C270 có tiềm năng trở thành chất chủ vận PPARδ thông
qua các đánh giá ở giai đoạn in silico Các thử nghiệm in vivo cần được tiến hành.
Trang 5Final essay for the degree of MA In Pharm – Academic year: 2021 – 2023
IN SILICO DRUG DISCOVERY OF NATURAL COMPOUNDS AS
POTENTIAL PPARδ AGONISTS IN TREATMENT OF DYSLEMINA
Introduction
PPARδ (Peroxisome Proliferator Activated Receptor), one of three receptors
in the PPARs PPARδ agonists inhibit lipid synthesis in tissues, thereby being
effective in treating dyslipidemia The goal of the study is to study multuple in silico
models for the ability to activate PPARδ receptors of natural compounds targetingthe treatment of dyslipidemia
Materials and methods
PPARδ target protein with PDB: 3GZ9, comparative protein PPARα and PPARγ withPDB:5HYK, and PDB:3NOA, respectively PPARδ agonists collected from some scientificarticles and ChemBL database The in-house library has comprised 286 natural compoundsextracted at the Faculty of Pharmacy, Ho Chi Minh City University of Medicine and
Pharmacy In silico screening models including (pharmacophore, classification model),
QSAR model, molecular docking and molecular dynamics simulation are combined tooptimize the screening process
Result and discussion
L-01 ligand-based model with five points: one aromatic ring point, two hydrophobic pointsand two hydrogen acceptor points, hydrogen bond acceptor point The validation processshows this model sensitivity (Se = 0,91), specificity (Sp = 0,97), accuracy (Acc = 0,97) Thestructure-based model was constructed by interaction analysis of ligand (PDB:3GZ9) (Se =0,90, Sp = 0,96, Acc = 0,96, GH = 0,5, EF =13,71) Model M-01 (with overall R2 = 0.9890,MSE = 0.098) is an activity prediction model built based on descriptive parametersdetermined through a linear regression model 21 natural compounds from the databasesimultaneously satisfied the dual pharmacophore model with predicted activity (EC50) from0.07 - 585.52 µM through neural network model The two compounds C225 and C270showed fair to good binding to the PPAR"δ" cavity (binding scores -6.42 kcal.mol-1 and -7.42 kcal.mol-1) and continued to be demonstrated to help stabilize protein structuresthrough dynamic simulation
Conclusion
In silico study showed that C225 and C270 are potential agonists on PPARδ It is necessary
to have more in vivo tests to prove their activation.
Trang 6MỤC LỤC
MỤC LỤC ii
DANH MỤC CÁC CHỮ VIẾT TẮT v
DANH MỤC CÁC BẢNG vi
DANH MỤC CÁC HÌNH viii
MỞ ĐẦU 1
CHƯƠNG 1 TỔNG QUAN 3
1.1 Rối loạn lipid huyết và PPARs 3
1.1.1 Rối loạn lipid huyết 3
1.1.2 PPARs 9
1.2 Các nhóm chất tự nhiên có tiềm năng hoạt hóa PPARs 10
1.3 Nghiên cứu in silico 12
1.3.1 Mô hình phân loại 12
1.3.2 Mô hình 3D-pharmacophore 14
1.3.3 Mối liên quan định lượng giữa cấu trúc và tác dụng 16
1.3.4 Mạng thần kinh nhân tạo 18
1.3.5 Phương pháp gắn kết phân tử 18
1.3.6 Phương pháp mô phỏng động lực học phân tử 20
1.4 Tình hình nghiên cứu trong và ngoài nước 26
CHƯƠNG 2 ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU 30
2.1 Đối tượng nghiên cứu 30
2.1.1 Mục tiêu tác động 30
2.1.2 Cơ sở dữ liệu các hợp chất tự nhiên 31
2.1.3 Phần mềm và công cụ sử dụng 31
2.2 Quy trình thực hiện nghiên cứu 33
2.3 Xây dựng mô hình Phân loại và 3D-pharmacophore 34
2.3.1 Xây dựng mô hình phân loại 34
2.3.2 Mô hình 3D-pharmacophore dựa vào phối tử 36
2.3.3 Mô hình 3D-pharmacophore dựa vào cấu trúc mục tiêu 39
Trang 72.4 Xây dựng mô hình QSAR 40
2.4.1 Chuẩn bị cơ sở dữ liệu 40
2.4.2 Lựa chọn thông số mô tả 41
2.4.3 Loại chất gây nhiễu 42
2.4.4 Xây dựng mô hình 2D-QSAR 42
2.4.5 Đánh giá mô hình dự đoán 2D-QSAR 45
2.5 Sàng lọc ảo các hợp chất tự nhiên 46
2.5.1 Nghiên cứu gắn kết phân tử 46
2.5.2 Chuẩn bị protein 46
2.5.3 Chuẩn bị cấu trúc ligand 47
2.5.4 Redocking 47
2.5.5 Docking 48
2.5.6 Đánh giá kết quả 48
2.6 Nghiên cứu mô phỏng động lực học phân tử 48
2.6.1 Giai đoạn chuẩn bị 49
2.6.2 Giai đoạn tiến hành 49
2.6.3 Đánh giá kết quả 50
CHƯƠNG 3: KẾT QUẢ 52
3.1 Xây dựng mô hình phân loại và mô hình pharmacophore cho nhóm chất chủ vận chọn lọc PPARδ 52
3.1.1 Mô hình phân loại 52
3.1.2 Mô hình pharmacophore 55
3.1.3 Lựa chọn mô hình 57
3.2 Xây dựng mô hình QSAR dự đoán hoạt tính chủ vận trên PPARδ 58
3.2.1 Dựa trên hồi quy tuyến tính 58
3.2.2 Dựa trên mạng thần kinh nhân tạo (Malab2022Ra) 63
3.2.3 Lựa chọn mô hình 65
3.3 Sàng lọc HCTN thỏa mô hình pharmacophore và QSAR đã xây dựng 65
3.3.1 Sàng lọc qua mô hình pharmacophore 66
Trang 83.3.2 Sàng lọc dự đoán hoạt tính thông qua mô hình QSAR 66
3.4 Chọn lựa chất tiềm năng cho hoạt tính chủ vận trên thụ thể PPARδ thông qua gắn kết phân tử và động lực học phân tử 68
3.4.1 Gắn kết phân tử 68
3.4.2 Mô phỏng động lực học phân tử (MDs) 76
CHƯƠNG 4 BÀN LUẬN 81
4.1 Xây dựng mô hình phân loại và mô hình pharmacophore cho nhóm chất chủ vận chọn lọc PPARδ 81
4.1.1 Mô hình phân loại 81
4.1.2 Mô hình pharmacophore 81
4.2 Xây dựng mô hình qsar dự đoán hoạt tính chủ vận trên PPARδ 84
4.2.1 Xây dựng mô hình QSAR dựa trên hồi quy tuyến tính 84
4.2.2 Xây dựng mô hình QSAR dựa trên mạng thần kinh nhân tạo 85
4.2.3 Lựa chọn mô hình QSAR 86
4.3 Sàng lọc HCTN thỏa mô hình pharmacophore và QSAR xây dựng được 87
4.4 Chọn lựa chất tiềm năng cho hoạt tính chủ vận trên thụ thể PPARδ thông qua gắn kết phân tử và động lực học phân tử 88
4.4.1 Gắn kết phân tử 88
4.4.2 Mô phỏng động lực học phân tử 89
KẾT LUẬN VÀ KIẾN NGHỊ 88
DANH MỤC CÔNG TRÌNH ĐÃ CÔNG BỐ CỦA TÁC GIẢ 93
TÀI LIỆU THAM KHẢO 94 PHỤ LỤC PL-01
Trang 9DANH MỤC CÁC CHỮ VIẾT TẮT
Từ viết tắt Tiếng Anh Tiếng Việt
ANN Artifical Neural Network Mạng thần kinh nhân tạo
BIC Bayesian information criterion
EC 50 Half-maximal effective
concentration Nồng độ hiệu quả tối đa một nửa
HDL-C High density lipoprotein
Cholesterol Cholesterol lipoprotein tỷ trọng cao
LDL-C Low density lipoprotein
Cholesterol Cholesterol lipoprotein tỷ trọng thấp
MDs Molecular dynamic simulation Mô phỏng động lực học phân tử
MetS Metabolic syndrome Hội chứng chuyển hóa
PCA Principal Components Analysis Phân tích thành phần chính
PDB Protein Data Bank Ngân hàng dữ liệu cấu trúc protein
PLS Partial Least Squares Bình phương tối thiểu từng phần
PP Posterior probability Xác suất hậu nghiệm
PPARs Peroxisome Proliferator Activated
RMSD Root-Mean-Square Deviation Căn bậc hai độ lệch bình phương
trung bình
RMSE Root-Mean-Square Error Sai số bình phương trung bình
RMSF Root-Mean-Square Fluctuation Căn bậc hai độ dao động bình
Trang 10DANH MỤC CÁC BẢNG
Bảng 1.1 Các thành phần lipid máu và lipoprotein của cơ thể1 3
Bảng 1.2 Các thuốc và cơ chế tác động trong điều trị RLLPM1 6
Bảng 1.3 Một số hoạt chất tự nhiên cho hoạt tính chủ vận trên PPARs16,20,21 11
Bảng 1.4 Tóm tắt về phương pháp xây dựng pharmacophore dựa trên cấu trúc 14
Bảng 1.5 Bảng so sánh các phương pháp docking 19
Bảng 1.6 Mô hình dung môi thường dùng trong mô phỏng động lực học phân tử44 22
Bảng 1.7 Mô hình dung môi thường dùng trong mô phỏng động lực học phân tử44 23
Bảng 1.8 Một vài chất chủ vận chọn lọc trên PPARδ đang được nghiên cứu 28
Bảng 2.1 Các phần mềm được sử dụng trong nghiên cứu 32
Bảng 2.2 Thứ tự lọc thông số mô tả 41
Bảng 2.3 Tọa độ grid box vị trí khoang gắn kết của các đích tác động 47
Bảng 3.1 Ý nghĩa của 12 thông số mô tả 52
Bảng 3.2 Các mô hình phân loại được xây dựng 53
Bảng 3.3 Kết quả đánh giá 5 mô hình tối ưu nhất theo phương pháp BMA 54
Bảng 3.4 Kết quả đánh giá mô hình pharmacophore dựa trên ligand cho chất chủ vận trên PPARδ 56
Bảng 3.5 Các TSMT được loại bỏ thông qua MS-Excel 59
Bảng 3.6 TSMT được áp dụng trong xây dựng mô hình dự đoán hoạt tính 2D-QSAR 59
Bảng 3.7 Tương quan giữa 8 TSMT được lựa chọn và mối tương quan của chúng với giá trị hoạt tính sinh học (pEC50) với các giá trị của hệ số tương quan Pearson 60 Bảng 3.8 Mô hình QSAR lần lượt được xây dựng dựa trên PLS và PCR và thông số đánh giá 63
Trang 11Bảng 3.9 24 chất chủ vận PPARδ cùng 8 TSMT được ứng dụng trong xây dựng mô
hình mạng thần kinh dự đoán hoạt tính (EC50) 63
Bảng 3.10 Đánh giá sơ bộ quá trình luyện mạng của 10 mô hình 64 Bảng 3.11 Kết quả dự đoán thông qua mô hình M-01 66 Bảng 3.12 So sánh khả năng hình thành những tương tác quan trọng giữa ligand ban
đầu và ligand sau redocking trên ba cấu trúc đích tác động PPARs bằng MOE 72
Bảng 3.13 So sánh khả năng hình thành những tương tác quan trọng giữa ligand ban
đầu và ligand sau redocking trên ba cấu trúc đích tác động PPARs bằng AutoDockVina 73
Bảng 3.14 Ái lực gắn kết, tương tác quan trọng của 2 hợp chất tiềm năng trên đích
tác động PPARδ 74
Bảng 3.15 Điểm số docking, tương tác quan trọng của C225, C270 so sánh đối trên
PPARα và PPARγ 75
Bảng 3.16 Tần suất liên kết hydro giữa HCTN C225, C270 và ligand đồng kết tinh
BDBM29868 và các acid amin trong khoang gắn kết PPARδ (PDB: 3GZ9) trong thờigian mô phỏng 100 ns 80
Trang 12DANH MỤC CÁC HÌNH
Hình 1.1 Sơ đồ vận chuyển lipid và chuyển động tuần hoàn của một số apo - protein.
4
Hình 1.2 Cấu trúc một số chất chủ vận trên PPARs trong điều trị RLLPM 8
Hình 1.3 Cấu trúc PPARδ và khoang gắn kết (A) cấu trúc 13 vòng xoắn (H1 đến H12) và 4 β-sheet (S1 đến S4) (B) 9
Hình 1.4 Cấu trúc của PPARδ và các acid amin quan trọng khoang gắn kết 10
Hình 1.5 Mối liên hệ giữa logit(p) và p (0 < p <1) 13
Hình 1.6 Cấu tạo và cách hoạt động của perceptron 18
Hình 1.7 Các giai đoạn quan trọng trong gắn kết phân tử 20
Hình 1.8 Các giai đoạn mô phỏng động lực học phân tử 23
Hình 2.1 Cấu trúc đích tác động PPARs 30
Hình 2.2 Quy trình thực hiện nghiên cứu 33
Hình 2.3 Quy trình xây dựng mô hình phân loại chất có hoạt tính chủ vận trên PPARδ 34
Hình 2.4 Quy trình xây dựng mô hình 3D-pharmacophore dựa trên phối tử 37
Hình 2.5 Cấu trúc đại diện các chất trong tập xây dựng 37
Hình 2.6 Quy trình xây dựng mô hình 3D-pharmacophore dựa vào cấu trúc 39
Hình 2.7 Quy trình nghiên cứu mô hình dự đoán hoạt tính 40
Hình 2.8 Cấu trúc cơ sở mạng thần kinh nhân tạo và giao diện luyện mạng 43
Hình 2.9 Quá trình luyện mạng 44
Hình 2.10 Quy trình gắn kết phân tử 46
Hình 3.1 Các đặc tính của 5 mô hình phân loại được lựa chọn bởi BMA (Với: màu đỏ: biến tương quan thuận; màu xanh: biến tương quan nghịch) 55
Hình 3.2 Các mô hình pharmacophore dựa trên ligand cho chất chủ vận chọn lọc trên PPARδ với 5 điểm gồm 1 vòng thơm (vòng tròn màu cam Aro|PIR), 2 nhóm kỵ nước (vòng tròn màu xanh lá cây Hyd), 2 nhóm nhận hydro (màu xanh dương Acc2) 56
Trang 13Hình 3.3 Mô hình pharmacophore dựa trên cấu trúc cho chất chủ vận PPAR δ gồm
2 điểm cho hoặc nhận liên kết hydro (vòng tròn màu xanh dương), 1 nhóm kỵ nước(vòng tròn màu xanh lá cây Hyd), 1 vòng thơm (màu xanh dương Aro) 57
Hình 3.4 (A)-Sự gióng hàng ligand lên mô hình pharmacophore dựa trên ligand
58
Hình 3.5 Biểu đồ minh họa khả năng dự đoán tốt hoạt tính của mô hình 2D-QSAR
xây dựng được với hệ số tương quan cao là R2 = 0,862017 62
Hình 3.6 Thông số đánh giá quá trình luyện mạng mô hình M-01 65 Hình 3.7 21 HCTN thỏa mô hình sàng lọc kép pharmacophore 67 Hình 3.8 Minh họa ligand đồng kết tinh trước và sau redocking bằng phần mềm
Autodock Vina và MOE 2015.10 trên thụ thể PPARδ 69
Hình 3.9 Minh họa ligand đồng kết tinh và sau redocking bằng phần mềm Autodock Vina và MOE trên thụ thể PPARα 70 Hình 3.10 Minh họa ligand đồng kết tinh và sau redocking bằng phần mềm
Autodock Vina và MOE trên thụ thể PPARγ 71
Hình 3.11 Vị trí trong khoang gắn PPARδ (PDB:3GZ9) của hai chất C225 và C270
74
Hình 3.12 Các hợp chất được lựa chọn cho nghiên cứu mô phỏng động lực học phân
tử 75
Hình 3.13 Giá trị RMSD của protein dạng apoprotein, dạng phức hợp với C225,
C270 và ligand BDBM29868 trong quá trình mô phỏng động lực học 100 ns 76
Hình 3.14 Giá trị RMSF của PPARδ dạng phức hợp với C225, C270 và ligand
BDBM29868 trong quá trình mô phỏng động lực học 100 ns 77
Hình 3.15 Tổng diện tích bề mặt có thể tiếp cận dung môi (SASA) của protein dạng apo - protein, dạng phức hợp với C225, C270, ligand BDBM29868 trong quá trình
mô phỏng động lực học 100 ns 78
Hình 3.16 Bán kính quay (Rg) của protein dạng apo-protein, dạng phức hợp với C225, C270 và ligand BDBM29868 trong quá trình mô phỏng động lực học 100 ns.
78
Trang 14MỞ ĐẦU
Rối loạn lipid huyết (RLLPM) là một trong các nhóm tình trạng bệnh lý liên quanđến rối loạn chuyển hóa (đặc trưng bởi tăng huyết áp, đường huyết cao, béo phì vàRLLPM).1 RLLPM đồng thời là nguyên nhân chính dẫn đến tiến triển của xơ vữa độngmạch.1 Do đó, điều trị RLLPM được xem là can thiệp then chốt trong phòng chống cácbệnh tim mạch.1 Các nhóm thuốc đã và đang điều trị RLLPM, có thể kể đến thuốc có tácđộng ức chế enzym HMG-CoA reductase như Statin (Atorvastatin, Rosuvastatin,Simvastatin,…), thuốc tác động giảm sản xuất VLDL-C (cholesterol lipoprotein tỷ trọngrất thấp) và apoB tại gan như Niacin, thuốc có tác động tăng cường đào thải LDL-C(cholesterol lipoprotein tỷ trọng thấp) khỏi máu như nhóm ức chế PCSK9 (Alirocumab,Evolocumab, ) Bên cạnh đó, các chất có khả năng hoạt hóa họ thụ thể PPARs(Peroxisome Proliferator-Activated Receptors) như Fibrat (Fenofibrat, Ciprofibrat, ) vàThiazolidindiones (Rosiglitazone, Pioglitazone, ) cũng cho thấy hiệu quả trong việcgiảm tích lũy lipid tại mô và cơ quan.2
PPARs là một họ thụ thể nhân gồm 3 loại: PPARα, PPARδ, PPARγ.3 Với tiềm nănghoạt hóa đơn, kép và đa thụ thể, PPARs là đích tác động tiềm năng trong việc nghiêncứu khám phá thuốc mới nhằm điều trị RLLPM.3 Chất chủ vận đơn trên thụ thể PPARαđiển hình như nhóm Fibrat ứng dụng trong kiểm soát tình trạng tăng triglycerid.4 Tuynhiên, các thuốc này được ghi nhận là gây ra một số tác dụng phụ như giảm tiểu cầutrong máu, tăng nguy cơ hình thành huyết khối ở phổi, xơ gan, viêm gan, sỏi mật,…5
Chủ vận đơn trên PPARγ như nhóm Thiazolidindiones gây tác dụng phụ trên tim mạch.6
Để khắc phục tình trạng này, các nghiên cứu thuốc mới dựa trên tác động PPARs cóthể kể đến như cơ chế tác động đa thụ thể, hay tác động chọn lọc Tác động đa thụ thểnhư tác động kép (dual-agonist) trên PPARα/δ với thuốc Elanfibranor, tác động đồngthời (pan-agonists) trên PPARα/δ/γ với Lanifibranor, Benzafibrat đã giảm tác dụngkhông mong muốn và cải thiện hiệu quả điều trị.2 PPARδ thu hút sự quan tâm nghiên
Trang 15cứu trên thế giới bởi hai lí do sau Thứ nhất, PPARs có đặc tính bảo tồn cao tuy nhiênkích thước khoang gắn của PPARδ có kích thước nhỏ hơn với đặc tính cho phép gắn kết
đa dạng các loại ligand với ái lực tốt.7 Thứ hai, tác động gắn kết chọn lọc trên thụ thểPPARδ cho tiềm năng giảm thiểu tác dụng phụ với ứng viên GW5015168 (được chứngminh mang lại các hiệu quả tích cực việc giảm nồng độ Tryglycerid).8 Tuy nhiên, thuốcvới hoạt tính chủ vận chọn lọc trên thụ thể PPARδ vẫn chưa được cấp phép lưu hành trênthị trường
Bên cạnh các thuốc được tổng hợp hay bán tổng hợp, nhiều nhóm chất tự nhiên đượcchứng minh có tiềm năng gắn kết tốt và cho tác động chủ vận trên PPARs Xây dựng môhình sàng lọc nguồn tài nguyên này định hướng mục tiêu phát triển thuốc là yêu cầu cấpthiết Trong bối cảnh đó, có thể kể đến mô hình sàng lọc ảo giúp xác định nhóm cấu trúcisoflavon cho tác động chủ vận tốt trên cả ba thụ thể PPARα, PPARγ và PPARδ,2 phươngpháp gắn kết phân tử chứng minh các dẫn chất stilben hoặc stibenenoid chủ vận toànphần trên PPARα và PPARγ,9 phương pháp kết hợp gắn kết phân tử và mô phỏng độnglực học phân tử chứng minh hoạt tính chủ vận trên PPARγ của curcumin.10 Từ đó, nhằmứng dụng những tiến bộ trên trong việc sàng lọc các chất tiềm năng gắn kết tốt trên thụthể PPARs từ nguồn hợp chất tự nhiên, đề tài thực hiện các mục tiêu sau:
Mục tiêu tổng quát: “Nghiên cứu in silico hợp chất tự nhiên có khả năng hoạt hóa họ
thụ thể PPARδ hướng điều trị rối loạn lipid huyết”
Mục tiêu cụ thể
1 Xây dựng mô hình phân loại và pharmacophore cho chất hoạt tính chủ vận trên thụthể PPARδ
2 Xây dựng mô hình QSAR nhằm dự đoán hoạt tính chủ vận trên PPARδ
3 Sàng lọc chất tự nhiên từ cơ sở dữ liệu các chất được phân lập tại Bộ môn Dược liệu– Đại học Y Dược Thành phố Hồ Chí Minh thỏa các mô hình được xây dựng
4 Chọn lựa chất tiềm năng cho hoạt tính chủ vận trên thụ thể PPARδ thông qua gắn kếtphân tử và động lực học phân tử
Trang 16CHƯƠNG 1 TỔNG QUAN1.1 RỐI LOẠN LIPID HUYẾT VÀ PPARδ
1.1.1 Rối loạn lipid huyết
1.1.1.1 Định nghĩa
Định nghĩa: RLLPM khi có sự tăng bất thường cholesterol và/hoặc triglycerid trongmáu, và/hoặc sự giảm HDL-C Khi cholesterol toàn phần, LDL-C, TG, hoặc Lp(a) >bách phân vị thứ 90 hoặc HDL-C, hoặc apo A-1 < bách phân vị thứ 10 của toàn dân số
Thành phần lipid máu và lipoprotein của cơ thể được trình bày ở Bảng 1.1.1
Bảng 1.1 Các thành phần lipid máu và lipoprotein của cơ thể1
Trang 17Hình 1.1 Sơ đồ vận chuyển lipid và chuyển động tuần hoàn của một số apo - protein.
(A) Sau bữa ăn, cholesterol và chất béo trung tính được hấp thu vào trong ruột vàvận chuyển thông qua các chylomicron Sau đó các chylomicron này đi vào trong tuầnhoàn đưa đến các mô ngoại vi như mô mỡ, cơ (B) Ở trạng thái nhịn ăn, chylomicronthường không xuất hiện Thay vào đó, gan có thể tổng hợp cholesterol và triglycerid vàgói chúng lại với nhau dưới dạng VLDL-C, sau đó được tiết vào tuần hoàn đến các môngoại vi VLDL-C chuyển thành LDL-C, chất mang cholesterol chủ yếu trong huyếttương Trong khi VLDL-C và LDL-C mang cholesterol và chất béo trung tính từ gan rangoại vi, thì HDL-C phục vụ mục đích ngược lại (A) Đột biến trong thụ thể LDL-C cóthể gây tăng cholesterol máu mang tính chất gia đình và khiếm khuyết ApoB100 mangtính chất gia đình (B) Đột biến gen APOCII, mã hóa cho apoprotein CII, protein cầnthiết cho quá trình phân huỷ LDL-C, làm giảm khả năng phân hủy LDL-C, dẫn đến tăngcholesterol máu
Hai nguyên nhân chủ yếu gây nên tình trạng RLLPM:11
- Nguyên phát: do đột biến các gen mã hóa trên các apo - protein hay LDL-receptor.11
Trang 18- Thứ phát: hậu quả của các bệnh mãn tính như đái tháo đường, suy thận mạn, thiểunăng tuyến giáp, bệnh gan, hoặc do sử dụng kéo dài các thuốc có ảnh hưởng đếnchuyển hóa lipid như thuốc chẹn beta, ngừa thai.11
1.1.1.4 Điều trị
RLLPM được điều trị bằng cách thay đổi lối sống (tức là chế độ ăn uống, giảm cân
và tập thể dục) Chiến lược điều trị dùng thuốc thường được kết hợp với điều trị khôngdùng thuốc trong điều trị RLLPM nhằm giảm LDL-C, giảm triglycerid, tăng HDL-C,phòng biến cố bệnh xơ vữa tim mạch.2 Các nhóm thuốc điều trị kể trên gồm: Statin,Fibrat, Niacin, Resin (Nhựa gắn với acid mật), Omega-3, Ezetimib, nhóm ức PCSK9
được trình bày ở Bảng 1.2
- Statin là tác nhân hiệu quả nhất có sẵn để giảm LDL và cholesterol toàn phần Tất
cả hoạt động bằng cách ức chế cạnh tranh HMG-CoA reductase, enzyme xúc tácbước giới hạn tốc độ trong sinh tổng hợp cholesterol Statin cũng làm giảm thay đổitriglycerid, cũng như tăng HDL
Trang 19- Fibrat và niacin được sử dụng để giảm triglycerid và tăng HDL-cholesterol Chất cótác động ức chế axit mật (BAS) là các loại nhựa liên kết với axit mật bằng cách traođổi chúng thành anion, do đó làm gián đoạn quá trình tái chế ruột bình thường Chất
ức chế protein chuyển triglyceride thành microsome (PCSK9) có thể được sử dụng
để giảm mức cholesterol LDL ở bệnh nhân tăng cholesterol máu gia đình đồng hợp
tử, vì nó làm giảm sản xuất apo B
Bảng 1.2 Các thuốc và cơ chế tác động trong điều trị RLLPM1
Atorvastatin, Simvastatin,Lovastatin, Pravastatin,…
Gemfibrozil, Bezafibrat,Ronifibrat, Clofibrat
bàn chải, gián đoạn chu trìnhtái hấp thu cholesterol ở gan-ruột
Nhóm chất chủ vận đơn (single agonist)
- Thiazolidinedion (Glitazon, Pioglitazon, Rosiglitazon,…): làm tăng nhạy cảm của
cơ và tổ chức mỡ với insulin bằng cách hoạt hoá PPARs, vì vậy làm tăng thu nạpglucose từ máu Thuốc làm tăng nhạy cảm của insulin ở cơ vân, mô mỡ đồng thời
Trang 20ngăn cản quá trình sản xuất glucose từ gan Ngoài ra, nhóm này còn có hiệu quảtrong ngăn ngừa đột quỵ hoặc một cơn thiếu máu cục bộ thoáng qua, ổn định cácmảng xơ vữa động mạch.5
- Fibrat (Fenofibrat, Clofibrat, Gemfibrozil,…): đặc tính hoạt hóa PPARα, hiệu quảgiảm TG tới 50% và tăng HDL-C lên đến 20%, giảm tỷ lệ mắc bệnh tim mạch.4
Nhóm chất chủ vận kép (dual agonists) và chủ vận đồng thời (pan agonists)
- Elafibranor cho tác động chủ vận trên cả PPARα/δ nhưng ưu thế trên thụ thể α.2
- Saroglitazar có hoạt tính chủ vận ưu thế trên thụ thể α và chủ vận trung bình trên thụthể γ, đang được chấp thuận lưu hành tại Ấn Độ trong điều trị rối loạn lipid.9
Từ các hoạt chất được sử dụng làm thuốc đã và đang lưu hành trên thị trường, chothấy đặc tính nhóm cấu trúc cho hiệu quả hoạt hoá đơn, kép hoặc đồng thời cả ba thụ thểα/ δ /γ đều cho tác dụng điều trị RLLPM Xu hướng thiết kế hoạt chất cho đặc tính chủvận đơn, kép hay đồng thời nhằm phục vụ mục đích trên đang trở thành mục tiêu trongkhám phá phát triển nhóm thuốc điều trị RLLPM Mặc dù việc tác động chủ vận kép hayđồng thời cả ba thụ thể, cho hiệu quả tốt trong điều trị RLLPM, tuy nhiên một số nghiêncứu cho thấy việc tác động chủ vận đồng thời hay trên các đích tác động PPARα vàPPARγ có thể gây nên các tác dụng phụ trên các loại thuốc đang lưu hành Gần đây, chủvận trên thụ thể PPARδ cho thấy ưu điểm trên cả hai phương diện hiệu quả chủ vận trênđích tác động δ thuộc PPARs và đáp ứng yêu cầu hạn chế tác động bất lợi trên nhóm đốitượng sử dụng, và thu hút nhiều sự đầu tư nghiên cứu tìm kiếm chất chủ vận chọn lọcđơn trên đích này
Cấu trúc hóa học của một số chất có tác động chủ vận trên PPARs cho tác dụng điều
trị RLLPM được trình bày ở Hình 1.2.
Trang 2125-Hình 1.2 Cấu trúc một số chất chủ vận trên PPARs trong điều trị RLLPM (A): Chủ vận đơn trên PPARα; (B): Chủ vận kép; (C): Chủ vận đồng thời.
Trang 221.1.2 PPARδ
1.1.2.1 Cấu tạo
Phân họ PPARs bao gồm ba thụ thể (isotype): PPARα (NR1C1), PPARβ/δ (NR1C2)
và PPARγ (NR1C3), được mã hóa bởi các gen riêng biệt, tuy nhiên ghi nhận nhiều điểmtương đồng trong cấu trúc.10
PPARδ có cấu trúc chung của họ PPARs bao gồm 13 vòng xoắn và các nhánh β Cấutrúc thứ cấp gồm ba lớp bánh sandwich xoắn α không song song, được đánh số H1-H12,
vòng xoắn H2’ và β-sheet (S1-S4) (Hình 1.3) Ba vòng xoắn mở rộng (H3, H7 và
H10/H11) tạo thành hai lớp bên ngoài, (H4, H5, H8 và H9) tạo thành lớp trung tâm củabánh sandwich Khoang gắn kết lớn (~ 1400 Å3)3 có hình chữ Y với ba nhánh có thể liên
kết nhiều phối tử có chức năng khác nhau (Hình 1.3).3
Hình 1.3 Cấu trúc PPARδ và khoang gắn kết (A) cấu trúc 13 vòng xoắn (H1 đến H12)
và 4 β-sheet (S1 đến S4) (B)
- Nhánh I hay gọi là nhánh Y1, mở rộng về phía AF-2 trên xoắn H12 và nhánh II, nằm
giữa chuỗi xoắn H3 và β-sheet (Hình 1.4) Mỗi nhánh có chiều dài khoảng 12 Å.
Trang 23Nhánh Y1 về cơ bản là khoang PPAR duy nhất phân cực Bốn acid amin phân cựctrong nhánh Y1 của PPAR được bảo tồn qua các loại thụ thể PPARs, với Thr289(H3), His323 (H5), His449 (H11) và Tyr473 (H12) của PPARδ (tương ứng làSer280, Tyr314, His440 và Tyr464 của PPARα và Ser289, His323, His449 vàTyr473 của PPARγ) Những acid amin này là một phần của mạng lưới liên kết hydroquan trọng liên quan đến đặc tính vận của các thụ thể PPARs.
- Nhánh II và III hay gọi là nhánh Y2 và Y3 chủ yếu kỵ nước, phù hợp tính chất kỵnước của các phối tử tự nhiên.13 Ba mươi bốn acid amin được xác định tạo thànhkhoang liên kết.14
Hình 1.4 Cấu trúc của PPARδ và các acid amin quan trọng khoang gắn kết (A): Khoang gắn kết chữ Y với 3 nhánh I (Arm I), II (Arm II), III (Arm III) của thụ thể
PPARs; 15 (B): Tên các acid amin tạo thành khoang gắn kết của PPARs3
Vai trò
1.2 CÁC NHÓM CHẤT TỰ NHIÊN CÓ TIỀM NĂNG HOẠT HÓA PPARS
Hiện nay, càng nhiều hợp chất tự nhiên được chứng minh có khả năng gắn kết vàhoạt hoá họ thụ thể PPARs, từ đó, cung cấp nguồn nguyên liệu tham chiếu và định hướngphát triển thuốc điều trị RLLPM16, điển hình có thể kể đến Flavonoid và Terpenoid
Trang 24Nhóm Flavonoid được cho rằng có vai trò quan trọng trong điều hòa nội môi của cơthể, có mối liên hệ chặc chẽ với PPARs như Wogonin (chủ vận trên PPARα cho hiệuquả giảm lipid máu trên chuột),17 Rutin (chủ vận trên PPARγ giảm tình trạng đề khánginsulin trên mô hình chuột thí nghiệm),18 Eryodictyol (chủ vận đồng thời trên hai thụ thể
α và γ thuộc họ PPARs, giúp cải thiện sự oxy hóa chất béo trong gan chuột béo phì)19,…Nhóm Terpenoid điển hình như các cấu trúc Isoprenol (Geraniol, Farnesol,Geranylgeraniol được chứng minh có tiềm năng kích hoạt PPARγ) Trong đó, Farnesol
và Geranylgeraniol cho tác dụng kích hoạt kép PPARα/γ Khung cấu trúc diterpenalcohol (Phytol), với acid Phytanic cho tác động chủ vận PPARα/γ, cải thiện quá trìnhchuyển hóa lipid ở nhiều dòng tế bào.20 Auraterpen, một thành phần được chiết xuất từ
họ cam, quýt có hoạt tính chủ vận kép PPARα/γ bên cạnh các tác động kháng viêm vàngăn chặn ung thư.21 Các nhóm hoạt chất tự nhiên tiềm năng chủ vận trên PPARs được
trình bày ở Bảng 1.3.
Bảng 1.3 Một số hoạt chất tự nhiên cho hoạt tính chủ vận trên PPARs16,20,21
PPARα Wogonin, Silybin, Puerarin, Salidroside, Resveratrol,
Lentinan, Total Flavonoid C-sides (AME), Biochanin A,Seed oil of RosaRoxburghii Tratt, Betanin, Ursolic acid,Chicory seed extract,…
PPARβ/δ Magnesium lithospermate B, Phillyrin,…
PPARγ 18:0 Lyso PC, Scutellarin, Micheliolide, Daidzein,
Genstein, Chrysin, Honokiol, Evodiamine, Rutin,Luteolin, Leptin, Epigallocatechin gallate, Geraniol,Farnesol, Geranylgeraniol,…
PPARα và PPARβ/δ Ombuine, γ-mangostin,…
PPARα và PPARγ Naringenin, Naringin, Hesperidin, Formonotein,
Genistein, Auraterpen, Farnesol và Geranylgeraniol,Dehydroabietic acid, Macelignan, 5,7-Dihydroxy-6-geranylflavanone, Camel milk, Osthole, Eryodictyol,…
Trang 251.3 NGHIÊN CỨU IN SILICO
1.3.1 Xây dựng mô hình phân loại bằng phương pháp BMA
1.3.1.1 Phương pháp Bayes
Cơ sở của phương pháp Bayes là suy luận Bayes do Thomas Bayes đề xuất vào năm
1763 Suy luận Bayes dựa vào định lý Bayes, gọi H là giả thuyết và D là dữ kiện thực tế,định lý Bayes phát biểu rằng xác suất H với điều kiện D xảy ra (ký hiệu P(H|D)) là:
P(H|D)=P(D|H).P(H)
P(D)Trong đó
P(H) : Xác suất giả thuyết trước khi làm thí nghiệm
P(D|H) : Xác suất dữ liệu xảy ra với điều kiện giả thuyết H là đúng
P(D) : Phân bố của dữ liệu, có thể coi là hằng số
Công thức Bayes còn có tên là công thức xác suất hậu nghiệm, cho biết xác suất xuấthiện các biến cố Ai của nhóm đầy đủ khi biến có A đã xuất hiện
Ngày nay, phương pháp Bayes được ứng dụng trong hầu hết tất cả các lĩnh vực khoahọc; kể cả trong công nghệ thông tin, tiên lượng kinh tế, phân tích các mối liên hệ xãhội Phương pháp Bayes giải quyết được nhiều vấn đề nghiên cứu và cung cấp các câutrả lời cho một số vấn đề trong nghiên cứu lâm sàng mà trước đây còn tranh cãi
1.3.1.2 Mô hình hồi quy logistic
Trong phân tích hồi quy logistic, biến phụ thuộc là biến mang tính chất đo lường nhịphân như có hoặc không, mắc bệnh hoặc không mắc bệnh, chết hoặc sống, xảy ra hoặckhông xảy ra ; các biến độc lập có thể liên tục hay không liên tục Do hoạt tính chủ vậnPPARs có thể được xem là biến nhị phân (hoặc là có hoạt tính, hoặc là không có hoạt
Trang 26tính) nên có thể ứng dụng mô hình hồi quy logistic để xây dựng mô hình phân loại chủvận trên PPAR𝛿
Gọi x là tần số một biến cố ghi nhận từ n đối tượng, chúng ta có thể tính xác suất củabiến cố đó là:
p=xnTrong đó p có thể được coi là một chỉ số đo lường nguy cơ của một biến cố Mộtcách thể hiện nguy cơ khác là odds, có thể tạm dịch là khả năng Khả năng của một biến
cố được định nghĩa đơn giản bằng tỉ số xác suất biến cố xảy ra trên xác suất biến cốkhông xảy ra:
odds= p
1-pHàm logit của odds được định nghĩa như sau:
logit(p)=log( p
1-p)Mối liên hệ giữa p và logit(p) là một mối liên hệ liên tục và được biểu diễn như trên
Hình 1.5.
Hình 1.5 Mối liên hệ giữa logit(p) và p (0 < p <1)
Trang 271.3.2.2 Phương pháp xây dựng pharmacophore
Tuỳ vào tính sẵn có của dữ liệu, có thể chia thành 2 loại mô hình pharmacophore:
- Dựa trên cấu trúc (structure-based pharmacophore - SBP)
- Dựa trên phối tử (ligand-based pharmacophore - LBP)
Phương pháp xây dựng pharmacophore dựa trên cấu trúc
Một số đặc điểm của SBP được tóm tắt tại Bảng 1.4.
Bảng 1.4 Tóm tắt về phương pháp xây dựng pharmacophore dựa trên cấu trúc
− Dựa trên trường lực tương tác phân tử.22
Phần mềm: MOE,23 Discovery Studio,…24
Ưu điểm:
− Ít thiên vị với những kiểu hình hóa học của các nhómchất có hoạt tính đã biết.22
Trang 28− Mô tả được cách gắn của ligand – receptor Từ đótạo tiền đề để tối ưu hóa cấu trúc phối tử sau này.22
− Cung cấp đầy đủ thông tin về khoang gắn.22
Nhược điểm: yêu cầu thông tin về đích tác động.22
Phương pháp xây dựng pharmacophore dựa trên phối tử
Mô hình pharmacophore được xây dựng dựa vào những chất đã biết trước có tác độngsinh học trên đích tác động mong muốn (giá trị sinh học này thường là giá trị EC50 hay
IC50).25 Mô hình pharmacophore được xây dựng dựa trên sự tương đồng các điểm sinhhọc (kỵ nước, nhận hydro, cho hydro, benzen…), độ chồng phủ của tập hợp các chất xâydựng trong không gian ba chiều
Về cơ bản, pharmacophore cố gắng tạo ra các giá trị hợp lý tương đối của sự chồngphủ các hợp chất khác nhau, trình bày dưới dạng hình học liên kết giả định của chúng
Công cụ Pharmacophore Elucidation trong MOE 2015.10 nhằm tạo ra tất cả các truy
vấn có một sự chồng phủ tốt ở hầu hết tất cả các phân tử hợp chất có hoạt tính
Để xây dựng mô hình, công cụ Pharmacophore Elucidation yêu cầu dữ liệu đầu vàocần một tập hợp N phân tử hoạt tính có cấu trúc đa dạng; với C cấu dạng cho mỗi chất.Xây dựng cấu dạng là một công đoạn quan trọng và đòi hỏi tính chính xác cao.26
1.3.2.3 Đánh giá mô hình pharmacophore
Mô hình pharmacophore sau khi xây dựng theo phương pháp dựa trên cấu trúc hoặcdựa trên phối tử sẽ được đánh giá khả năng sàng lọc qua tệp kiểm tra chứa các chất cóhoạt tính (tập có hoạt tính) và các chất không có hoạt tính (tập không hoạt tính và decoy)bằng 5 tiêu chí đề cập bên dưới Tùy vào kết quả, mô hình sau khi xây dựng có thể dùng
để sàng lọc trực tiếp hoặc cải thiện nếu khả năng phân loại trên 2 tập kiểm tra kém.27
− Độ nhạy (Se) là đại lượng đo tỷ lệ phần trăm các chất có hoạt tính thực sự được lựa
chọn trong quá trình sàng lọc Giá trị của độ nhạy từ 0 đến 1.25 Độ nhạy được tínhtheo công thức (1)
Trang 29− Độ đặc hiệu (Sp) là đại lượng đo tỷ lệ các chất không có hoạt tính thực sự được loại
bỏ bởi mô hình sàng lọc Giá trị của độ đặc hiệu nằm trong khoảng từ 0 đến 1.25 Độđặc hiệu được tính theo công thức (2)
− Độ đúng (Acc) là tỷ lệ phần trăm các chất được phân loại chính xác bằng mô hình.25
Độ đúng được tính theo công thức (3)
− Điểm số Güner-Henry (điểm số GH) là điểm số đánh giá tổng thể khả năng sàng
lọc của mô hình.27 Điểm số GH nằm trong khoảng 0 đến 1.27 Trong đó, với giá trị của
GH từ 0 đến 0,16, mô hình được xem là một mô hình sàng lọc kém.27 Với giá trị của
GH trong khoảng 0,16 đến 0,5, mô hình được xem là một mô hình sàng lọc khá.27
Với giá trị của GH trong khoảng 0,5 trở lên, mô hình được xem là một mô hình sànglọc tốt.27 Điểm số GH được tính theo công thức (4)
− Tỷ lệ làm giàu (EF) là đại lượng biểu thị khả năng cải thiện tỷ lệ chất có hoạt tính
trong kết quả sàng lọc so với dữ liệu ban đầu.22 Tỷ lệ làm giàu có giá trị từ 0 đến vôcực Trong đó, giá trị của tỷ lệ làm giàu càng lớn thì biểu thị mô hình có khả năngsàng lọc càng tốt Tỷ lệ làm giàu được tính theo công thức (5)
SeA
1.3.3 Mối liên quan định lượng giữa cấu trúc và tác dụng
Nếu như mô hình pharmacophore chỉ mang tính chất định tính trong ứng dụng sànglọc các chất lên đích tác động hướng đến, thì mô hình QSAR lại là một mô hình có thểđịnh lượng được giá trị hoạt tính của một chất lên đích tác động
Trang 301.3.3.1 Định nghĩa
Mô hình QSAR (Quantitative Structure - Activity Relationship) là một mô hìnhnghiên cứu mối liên quan định lượng giữa cấu trúc và tác động sinh học của một chấtthông qua các thông tin về cấu trúc hóa học 2D hay 3D của chất đó.28
1.3.3.2 Đặc điểm và phân loại
Các thông tin về cấu trúc hóa học được tính toán và thể hiện dưới dạng các thông số
mô tả phân tử Các thông số mô tả này đại diện cho tính chất vật lý, các đặc trưng trongcấu trúc hóa học có ảnh hưởng đến tác động sinh học của 1 chất và được biểu diễn dướidạng một giá trị cụ thể.29
QSAR cho phép dự đoán các hoạt tính sinh học (ví dụ như IC50) của một hợp chấttrước khi cân nhắc có cần thiết tổng hợp nó hay không Các mô hình QSAR được nghiêncứu hiện nay bao gồm 2D-QSAR, 3D-QSAR, 4D-QSAR, HQSAR,…trong đó phổ biếnnhất là mô hình 2D-QSAR và 3D-QSAR.30
Mô hình 2D-QSAR: dựa trên sự tính toán các thông số mô tả phân tử của công thứchóa học trong không gian hai chiều
Mô hình 3D-QSAR: dựa trên sự tính toán các đặc tính quan trọng như kích thước,hình dạng, đặc điểm điện tử của phân tử được biểu diễn trong không gian ba chiều
So với mô hình 2D-QSAR, phương pháp xây dựng mô hình 3D-QSAR là phươngpháp hiện đại hơn, thể hiện được đầy đủ thông tin về cấu trúc, nhưng kỹ thuật này kháphức tạp, đòi hỏi nhiều thời gian do đó khó có tính ứng dụng cao nếu đầu vào là một cơ
sở dữ liệu lớn Mặt khác, 2D-QSAR tuy được xây dựng từ một phương pháp truyềnthống nhưng vì sử dụng các thuật toán đơn giản hơn, có tính ứng dụng cao với cơ sở dữliệu lớn và cho kết quả với độ lặp lại cao nên 2D-QSAR vẫn được sử dụng rộng rãi chođến hiện nay.31
Trang 311.3.4 Mạng thần kinh nhân tạo
Máy học đáp ứng yêu cầu sàng lọc thông lượng cao các dữ liệu nghiên cứu nói chung
và hoá học tổ hợp nói riêng, đã trở thành một trong những công cụ chủ lực trong nghiêncứu và khám phá thuốc mới.32
Tương tự mạng thần kinh sinh học, mạng thần kinh nhân tạo cũng được tạo nên bởinhiều nơ ron đơn lẻ, được gọi là perceptron Cấu trúc của một perceptron được minh họa
ở Hình 1.6.
Hình 1.6 Cấu tạo và cách hoạt động của perceptron
Trong đó: x1, x2,…xn là tín hiệu đầu vào w1, w2,…wn là các trọng số của các tín hiệuđầu vào tương ứng b là giá trị độ lệch (bias) khác 0 a là kết quả của phép cộng b vớihàm tổng tích của các giá trị tín hiệu đầu vào với trọng số tương ứng và trong đó a được
sử dụng để tính toán hàm kích hoạt ft(a) Kết quả tính toán của hàm ft(a) sẽ được với sosánh với một ngưỡng để xác định xem perceptron có được kích hoạt hay không.33
1.3.5 Phương pháp gắn kết phân tử
1.3.5.1 Khái niệm
Gắn kết phân tử (molecular docking) là phương pháp được sử dụng để mô hình hóatương tác giữa một phân tử nhỏ (ligand) với một cấu trúc đại phân tử (protein hayenzym), từ đó cho phép tìm hiểu được tương tác của phân tử trong vị trí gắn kết cũng
Trang 32như làm rõ hơn các cơ chế sinh học liên quan.34 Dựa vào tính linh động của 2 đối tượngkhảo sát, có thể chia thành 3 loại docking: docking tĩnh (rigid docking), docking bán linhđộng (semi – flexible docking), docking linh động (flexible docking) Trong đó, dockingbán linh động và docking linh động được sử dụng phổ biến hơn Những đặc điểm của 2
phương pháp này được thể hiện ở Bảng 1.5.
Bảng 1.5 Bảng so sánh các phương pháp docking Phương
pháp
Đặc điểm
So sánh phương pháp Receptor Ligand
Ưu điểm: cho ra nhiều cấu dạng gắn kết với
ligand có kính thước nhỏ đến trung bình.34
Nhược điểm: chưa xét đến sự linh động của
Linhđộng
Ưu điểm: độ chính xác cao nhất.37
Nhược điểm: tốn thời gian, đòi hỏi nhiều tài
nguyên máy,37 còn hạn chế khi docking nhữngphân tử lớn
Phần mềm: MOE,23 Glide.38
1.3.5.2 Yếu tố liên quan đến quá trình gắn kết phân tử
Quá trình gắn kết gồm 2 bước chính: (i) tìm kiếm cấu dạng phù hợp của ligand trongkhoang gắn và (ii) chấm điểm các phức hợp tạo thành Có 3 yếu tố đánh giá phức hợpgắn kết: (1) ligand có khả năng gắn thành công với khoang gắn kết của đích tác động,(2) ái lực gắn kết (kcal.mol-1) và (3) tương tác tạo được giữa ligand và acid amin quantrọng (key residues) trong khoang gắn
Quá trình gắn kết phân tử giữa receptor và ligand được thể hiện qua Hình 1.7
Trang 33Hình 1.7 Các giai đoạn quan trọng trong gắn kết phân tử
1.3.6 Phương pháp mô phỏng động lực học phân tử
Cấu trúc protein là cơ sở quan trọng để thiết kế thuốc dựa trên cấu trúc Tuy nhiên,những cấu trúc 3D được dùng trong thiết kế thuốc (được tải về từ các cơ sở dữ liệu) chỉtồn tại ở một dạng cố định.39 Trong khi về bản chất protein là một mục tiêu linh động,trải qua những biến đổi về hình dạng để thực hiện chức năng, động lực học phân tử củacấu trúc protein có thể dẫn đến sự khác biệt quan trọng giữa các kết quả trong nghiên
cứu in silico và thực nghiệm.39
Trang 34Các phương trình chuyển động dựa vào định luật II Newton (công thức 6) được tínhtoán để mô phỏng sự thay đổi vị trí theo thời gian của nguyên tử trong hệ thống mô hìnhhóa sinh học:
MDs thường ứng dụng trong nghiên cứu khám phá thuốc như:
- Đánh giá sự ổn định, tìm kiếm các cấu dạng dựa trên sự chuyển động theo thời gian.42
- Những cấu trúc hệ thống thu được từ thực nghiệm như: chụp tinh thể nhiễu xạ tia X(X-ray crystallography), kính hiển vi điện tử nghiệm lạnh (cryogenic electronmicroscopy), phổ cộng hưởng từ hạt nhân (nuclear magnetic resonance spectroscopy-NMR) có thể ứng dụng phương pháp này nhằm kiểm tra và tinh chỉnh 42
- Khảo sát ảnh hưởng của các yếu tố (gắn kết phối tử, đột biến hoặc thay đổi trạng tháiproton hóa của acid amin, trường lực, môi trường) đến sự chuyển động của hệthống.42
- Quan sát các quá trình chuyển động theo thời gian như: sự vận chuyển qua màng, sựgấp nếp cấu trúc protein,…42
Một số yếu tố quan trọng khi mô phỏng động lực học phân tử
Trường lực mô phỏng
Trường lực (force field) với bản chất là các dạng tính toán cơ lượng tử bao gồm tậphợp các phương trình và các tham số được sử dụng để tính toán thế năng và lực tác độnglên các nguyên tử trong hệ thống.43 Độ ổn định của quá trình MDs phụ thuộc vào tínhchất chính xác các thông số được thiết lập bởi trường lực.44
Trang 35Có 3 loại trường lực phổ biến được sử dụng trong MDs gồm45:
- Toàn bộ nguyên tử (all atoms): mỗi nguyên tử trong hệ thống được xử lý và cungcấp các thông số về tương tác, điện tích riêng biệt với nhau Một số trường lực thườngdùng như: AMBER, CHARMM, OPLS-AA
- Kết hợp nguyên tử (united atom): các nguyên tử hydro không phân cực được kếthợp với carbon, làm giảm số lượng nguyên tử trong hệ thống và rút ngắn thời gian tínhtoán nhưng cũng ảnh hưởng đến độ chính xác Một số trường lực thường dùng như:GROMOS, OPLS-UA.44
- Hạt thô (coarse-grained): giảm yêu cầu tính toán cho mô phỏng bằng cách nhómcác nguyên tử thành “siêu nguyên tử” (super atom) – đại diện cho từ 2 đến 5 nguyên tửtrong hệ thống Trường lực phổ biến là MARTINI
Mô hình dung môi
Mô hình dung môi được thêm vào hệ thống để mô phỏng cấu trúc đại phân tử mộtcách thực tế hơn.45 Bảng 1.6 trình bày các mô hình dung môi thường sử dụng trong
MDs
Bảng 1.6 Mô hình dung môi thường dùng trong mô phỏng động lực học phân tử45
Mô hình bên ngoài (explicit model)
Mô hình bên trong (implicit model) Đặc điểm Thường được dùng kết hợp với trường
lực toàn bộ nguyên tử, các phân tửnước riêng biệt được đưa trực tiếp vào
hệ thốngMột số mô hình thường dùng như:
SPC, TIP3P, TIP4P, TIP5P
Các phân tử dung môi được đưa vàomôi trường đồng nhất và liên tục,không đại diện rõ ràng các phân tửriêng rẽ
Mô hình Generalized Born (GB)thường được sử dụng
Ưu điểm Mô phỏng chính xác, thực tế hơn Giảm thời gian mô phỏng và tài
Trang 36Hiện nay, nhiều phần mềm đã được thiết kế sẵn cho MDs như: GROMACS,
AMBER, NAMD, CHARMM, Desmond,… (Bảng 1.7) cùng với phần mềm phân tích
và trực quan hóa kết quả như VMD, Chimera, Pymol, Avogadro,…
Bảng 1.7 Mô hình dung môi thường dùng trong mô phỏng động lực học phân tử45
CLI: giao diện dòng lệnh; GUI: giao diện đồ họa
Những phần mềm này được tích hợp nhiều trường lực mô phỏng và có khả năngthực hiện các chức năng tính toán tương tự nhau.50 Sự khác biệt giữa các phần mềm chủyếu đến từ mức độ hiệu quả khi phối hợp với phần cứng và các tính năng hỗ trợ kèmtheo, ví dụ như: phương pháp lấy mẫu nâng cao, lược đồ kiểm soát nhiệt độ và áp suất,
hỗ trợ cho mô phỏng hạt thô.50
Quá trình thực hiện:
Quá trình MDs trong việc đánh giá sự ổn định của cấu dạng theo thời gian được mô
tả ở Hình 1.8 gồm: (1) giai đoạn chuẩn bị, (2) mô phỏng và (3) phân tích.51
Hình 1.8 Các giai đoạn mô phỏng động lực học phân tử
Trang 37Giai đoạn chuẩn bị
Thông số vị trí, tọa độ ban đầu của các nguyên tử trong hệ khi được đặt trong một
từ trường thích hợp (như CHARMM36, AMBER, OPLS-AA/L,…) Sau đó, tạo hộp môphỏng động lực học phân tử với hai thông số là kích thước và hình dạng (có thể là hìnhcầu, lập phương, đa diện,…)
Nhằm solvat hóa protein và bắt chước môi trường sinh lý trong cơ thể, hệ được thêm
mô hình dung môi Hai mô hình dung môi phổ biến là bên trong (implicit) hoặc bênngoài (explicit) Các mô hình dung môi thường dùng là TIP3, TIP4P, TIP5P, SPC,SPC/E,… Hệ thống sau đó được trung hòa điện tích bằng một lượng ion (thường là ion
Na+ hoặc Cl-).52
Giai đoạn mô phỏng
Để đưa cấu hình bắt đầu gần với trạng thái cân bằng, tiến hành tối thiểu hóa nănglượng của hệ bằng thuật toán Gradient descent để tìm cực tiểu của hàm số năng lượng.52
Cân bằng hệ thống: Để tránh biến dạng không cần thiết của protein, hệ thống đượccân bằng trong các điều kiện NVT (số hạt N, thể tích V và nhiệt độ T) và NPT (số hạt
N, áp suất P và nhiệt độ T) Duy trì nhiệt độ bằng bể nhiệt (Berendsen, Velocity rescaling,Langevin, Andersen,…),53 và duy trì áp suất bằng bể áp Parrinello-Rahman Tương táctĩnh điện học được mô phỏng bằng thuật toán Particle Mesh Ewald và thuật toán Velvetđược dùng để tìm các nguyên tử xung quanh và biến thiên hệ theo thời gian.52
Giai đoạn phân tích kết quả
Sau khi quá trình mô phỏng hoàn tất, kết quả của quá trình này thường được đánhgiá dựa trên các đại lượng trình bày sau:
- RMSD (Root-Mean-Square Deviation): căn bậc hai độ lệch bình phương trung
bình của protein hoặc ligand so với vị trí ban đầu RMSD được sử dụng để đánh giá độ
ổn định của cấu trúc hệ thống trong thời gian mô phỏng (công thức7) Giá trị này thường
Trang 38được tính toán thông qua độ lệch giữa các khung cấu trúc (backbone) của protein Cấutrúc được xem ổn định và có ý nghĩa khi RMSD < 2,0 Å42:
1 2 2 N
- RMSF (Root-Mean-Square Fluctuation): căn bậc hai độ dao động bình phương
trung bình của các acid amin của protein RMSF dùng để đánh giá sự linh động của acidamin của protein so với giá trị trung bình (công thức 8).54 Giá trị RMSF của acid amincàng thấp, chứng tỏ acid amin đó hình thành được những tương tác với phối tử và ổnđịnh hơn.55 Thông số này được đánh giá cho carbon vị trí α của từng acid amin trongphân tử protein
Với ri(tj) là vị trí của nguyên tử i tại thời điểm tj, riref là vị trí của nguyên tử i đối chiếu
- Tần suất của liên kết hydro (Hydrogen bond occupancy): cho phép ghi nhận
những liên kết hydro được hình thành giữa acid amin của protein và ligand trong quá
trình mô phỏng động lực học Đánh giá sự ổn định protein bởi các liên kết hydro giữa
các acid amin với ligand dựa trên hai tiêu chí: (1) khoảng cách giữa nguyên tử cho(Donor) và nhận (Acceptor) proton ≤ 3,5 Å và (2) góc tối đa giữa 2 nguyên tử này (gócD–H…A > 120°).56
- Bán kính quay (Radius of Gyration - Rg): Rg đo độ nén của protein Một protein
giữ vững cấu trúc trong quá trình mô phỏng thì giá trị Rg tương đối ổn định.44 Ngượclại, protein mở ra (không bền), giá trị R sẽ thay đổi liên tục (công thức 9)57:
Trang 392 2
i i i
g
i i
Với ri là vị trí của nguyên tử i; mi là khối lượng nguyên tử i
- Diện tích bề mặt tiếp xúc với dung môi (Solvent-accessible surface area - SASA): SASA cho biết diện tích bề mặt của một phân tử sinh học có thể tiếp xúc với dung môi.58
Cấu trúc của protein gấp ổn định thì diện tích bề mặt nhỏ (SASA ổn định) Ngược lại,cấu trúc của protein không ổn định sẽ có diện tích bề mặt lớn (SASA không ổn định).58
1.4 TÌNH HÌNH NGHIÊN CỨU TRONG VÀ NGOÀI NƯỚC
Trên thế giới, nghiên cứu SAR (Structure -Activity relationship hay mối liên quangiữa cấu trúc và tác dụng) thu hút nhiều sự quan tâm của nhiều viện trường trong giaiđoạn năm 1999 đến 2019.59 Nhìn chung, các nghiên cứu này hướng đến việc cải thiệnkhả năng chủ vận chọn lọc trên PPARδ thông qua việc thay đổi nhóm thế và bán tổnghợp dựa trên các chất chủ vận trên PPARδ sẵn có Thông tin từ các nghiên cứu này chothấy:
- Nhóm phenylacetic acid tăng tác động chủ vận trên PPARδ (165041 (A2),
L-783483 (A4).60 Dẫn chất phenylacetic acid cùng với cấu trúc vòng thiazol ở vị trí
khớp nối góp phần tăng hoạt tính chủ vận chọn lọc GW501516 (A8).61
- Cấu trúc GW501516 được ứng dụng làm cấu trúc khung chính, thực hiện nhiềuphương pháp biến đổi thông qua việc thay đổi cấu trúc chuỗi bên, cấu trúc phần đầu
và khớp nối Tổng hợp cấu trúc thông qua việc thay nhóm thế para-methoxy pyridin
ở vị trí nhóm thế số 4 của vòng pyridin cho hiệu quả cải thiện đặc tính chọn lọc trên
PPARδ thu được A9.62 Hợp chất A9 được sử dụng bán tổng hợp nên hợp chất A23
thông qua việc bổ sung nhóm tetrahydroisoquinolin.63
Trang 40- Cấu trúc khung dạng chữ Y được bán tổng hợp dựa trên cấu trúc khung chính GW243
cho được đặc tính, hợp chất A10 và A11 được bán tổng hợp từ GW2433, tăng khả
năng chọn lọc thông qua cải thiện khả năng linh động vùng khớp nối.64
- Thay thế nhóm thế Flo tại vị trí ortho so với nhóm thế -CF3, GW0742 A7 ghi nhận
không thay đổi về cơ chế tác động, tuy nhiên cải thiện khả năng chủ vận trên thụ thể
PPARδ so với A8.61
- Dẫn chất acid (A16; MBX-8025), tổng hợp dựa trên cấu trúc GW501516 (A8) and L-165041 (A2) cho thấy tác động chủ vận trên PPARδ, trong khi cho tác động ức chế
trên hai thụ thể còn lại.65
- Hệ cấu trúc vòng với nhóm chức acid có khả năng cải thiện đặc tính chọn lọc trên
PPARδ, hợp chất A22 với cấu trúc khung benzisoxazol, ghi nhận hiệu quả chọn lọc
cao trên PPARδ (gấp 2000 lần so với các thụ thể cùng họ).66
- Thông qua nghiên cứu SAR và dựa trên cấu trúc GW501526 và cấu trúc hợp chất
A35, hợp chất A38 được tổng hợp dựa trên việc thay thế nhóm thế thiazol bằng vòng
phenyl Nhóm benzyl tại vị trí carbon alpha kế cận với nhóm sulfur quan trọng đốivới đặc tính chọn lọc.67 Xu hướng nghiên cứu SAR hướng mục tiêu tìm kiếm chất
chủ vận chọn lọc trên PPARδ được trình bày ở Bảng 1.8.