Chalcon là các phântử nhỏ có nhiều hoạt tính sinh học, trong đó có tiềm năng kháng ung thư.MỤC TIÊU: Xây dựng các mô hình 2D-QSAR và docking nhằm ứng dụng 2 môhình này vào sàng lọc để tì
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ Y TẾ
ĐẠI HỌC Y DƯỢC THÀNH PHỐ HỒ CHÍ MINH
PHAN NGUYỄN NHƯ Ý
NGHIÊN CỨU 2D-QSAR TRÊN DÒNG TẾ BÀO MCF7
VÀ MÔ HÌNH DOCKING TRÊN TUBULIN CỦA CÁC DẪN CHẤT CHALCON
LUẬN VĂN THẠC SĨ DƯỢC HỌC
THÀNH PHỐ HỒ CHÍ MINH, NĂM 2023
Trang 2BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ Y TẾ
ĐẠI HỌC Y DƯỢC THÀNH PHỐ HỒ CHÍ MINH
PHAN NGUYỄN NHƯ Ý
NGHIÊN CỨU 2D-QSAR TRÊN DÒNG TẾ BÀO MCF7
VÀ MÔ HÌNH DOCKING TRÊN TUBULIN CỦA CÁC DẪN CHẤT CHALCON
NGÀNH: CÔNG NGHỆ DƯỢC PHẨM VÀ BÀO CHẾ THUỐC
MÃ SỐ: 8720202
LUẬN VĂN THẠC SĨ DƯỢC HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC:
GS.TS TRẦN THÀNH ĐẠO
THÀNH PHỐ HỒ CHÍ MINH, NĂM 2023
Trang 3LỜI CAM ĐOAN
Tôi cam đoan đây là công trình nghiên cứu của tôi Các số liệu, kết quả nêutrong luận văn này là trung thực và chưa từng được ai công bố trong bất kỳcông trình nào khác
Tác giả luận văn
Phan Nguyễn Như Ý
Trang 4NGHIÊN CỨU 2D-QSAR TRÊN DÒNG TẾ BÀO MCF7 VÀ
MÔ HÌNH DOCKING TRÊN TUBULIN CỦA CÁC DẪN
CHẤT CHALCON
Phan Nguyễn Như Ý Giáo viên hướng dẫn: GS TS Trần Thành Đạo ĐẶT VẤN ĐỀ: MCF7 là dòng tế bào ung thư biểu mô tuyến vú ở người và là một
mô hình tiềm năng để nghiên cứu nhiều khía cạnh của sự phát triển của tế bào khối
u Vi ống có cấu tạo từ protein tubulin và sự bất ổn định động học của vi ống là mục tiêu quan trọng trong các nghiên cứu về thuốc điều trị ung thư Chalcon là các phân
tử nhỏ có nhiều hoạt tính sinh học, trong đó có tiềm năng kháng ung thư.
MỤC TIÊU: Xây dựng các mô hình 2D-QSAR và docking nhằm ứng dụng 2 mô
hình này vào sàng lọc để tìm ra các dẫn chất chalcon có khả năng ức chế MCF7 tốt
và đánh giá khả năng gắn kết sâu hơn bằng mô phỏng động lực học phân tử MDs.
PHƯƠNG PHÁP NGHIÊN CỨU: Mô hình 2D-QSAR và docking được xây dựng
dựa trên cấu trúc tubulin (mã PDB: 1SA0) và các chalcon với pIC 50 trên MCF7 được thu thập Nghiên cứu tiến hành sàng lọc trên cơ sở dữ liệu 1269 chalcon gồm 269 chalcon nội bộ và 1000 chalcon tổ hợp được tạo ra từ MOE để tìm ra chalcon tiềm năng nhất 10 chất có pIC 50 và điểm số docking tốt nhất được MDs trên tubulin trong
100 ns.
KẾT QUẢ: 10 dẫn chất chalcon tiềm năng được mô phỏng động lực học trong 100
ns và đánh giá năng lượng gắn kết tự do, thu được C28, E4, E6, E7, E9 có khả năng gắn kết tốt với tubulin, đặc biệt là E4 (-48,22 ± 3,77 kcal/mol).
KẾT LUẬN VÀ KIẾN NGHỊ: Các mô hình in silico đã được xây dựng và sàng lọc
thành công trên tập cơ sở dữ liệu với 1269 chất Nghiên cứu kiến nghị tiến hành tổng
hợp và thử nghiệm hoạt tính in vitro để đánh giá khả năng ức chế MCF7 của các
chalcon tiềm năng trong thực tế, đặc biệt là dẫn chất E4.
Trang 5STUDY OF 2D-QSAR ON MCF7 CELL LINE AND DOCKING MODELING ON TUBULIN OF CHALCONE
DERIVATIVES
Phan Nguyen Nhu Y Supervisor: Prof PhD Tran Thanh Dao INTRODUCTION: MCF7 is human breast carcinoma cell, as well as a model
system to study many aspects of tumor cell growth Microtubes structured from tubulin and its dynamic instability have become one of the most drug targets for cancer treatment Chalcones exhibit various biological activities, one of which is antiproliferative because of tubulin inhibition and the disruption of microtubules, leading that they are anticancer drugs This study is conducted to find potential new chalcones as inhibitors of breast cancer.
OBJECTIVE: 2D-QSAR and docking modelings were set up and used for screening
new small molecules inhibitor of MCF7, followed by evaluating connection between ligands and protein through molecular dynamics simulation MDs.
METHODS: 2D-QSARb and docking modelings were built based on MCF7 (PDB
ID: 1SA0) and chalcones with pIC 50 values collected from those previous scientific researchs These models and Lipinski's Rule of Five were used to screen on two databases of 1269 chalcones to figure out potential chalcone as good MCF7 inhibitors 10 compounds having the highest pIC 50 and docking score were molecular dynamics simulated on tubulin in 100 ns.
RESULT: 10 potential chalcones obtained from 2D-QSAR and molecular docking
were MDs in 100 ns and evaluated the binding free energy, identifying chalcone C28,
E4, E6, E7, E9 as the most potential MCF7 inhibitors, especially E4 with the best
binding affinity (-48,22 ± 3,77 kcal/mol).
CONCLUSION: In silico models have been successfully built and applied to screen
on databases of 1269 substances This study proposes to conduct in vitro experiments
on MCF7 to confirm the actual value of inhibitory activity of E4.
Trang 6MỤC LỤC
DANH MỤC CÁC CHỮ VIẾT TẮT i
DANH MỤC CÁC HÌNH iii
DANH MỤC CÁC BẢNG vi
MỞ ĐẦU 1
CHƯƠNG 1 TỔNG QUAN TÀI LIỆU 3
1.1 Giới thiệu chung về chalcon 3
1.2 Giới thiệu chung về mục tiêu tác động 5
1.3 Phương pháp nghiên cứu mối liên quan định lượng giữa cấu trúc và tác dụng 11
1.4 Phương pháp docking 17
1.5 Mô phỏng động lực học phân tử 20
1.6 Các nghiên cứu liên quan 22
CHƯƠNG 2 ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU 23
2.1 Đối tượng nghiên cứu 23
2.2 Phương pháp nghiên cứu 25
CHƯƠNG 3 KẾT QUẢ NGHIÊN CỨU 37
3.1 Mô hình QSAR 37
3.2 Mô hình docking phân tử 49
3.3 Ứng dụng mô hình sàng lọc ảo đã xây dựng để sàng lọc các chalcon tiềm năng có hoạt tính ức chế MCF7 58
CHƯƠNG 4 BÀN LUẬN 75
4.1 Mô hình QSAR 75
Trang 74.2 Mô hình mô tả phân tử docking 79
4.3 Ứng dụng mô hình sàng lọc ảo đã xây dựng để sàng lọc các chalcon tiềm năng có hoạt tính ức chế MCF7 80
4.4 Nhìn nhận về kết quả đề tài 88
CHƯƠNG 5 KẾT LUẬN VÀ KIẾN NGHỊ 94
5.1 Kết luận 94
5.2 Kiến nghị 94
TÀI LIỆU THAM KHẢO
PHỤ LỤC
Trang 8DANH MỤC CÁC CHỮ VIẾT TẮT
ERM Enhanced replacement
method
Phương pháp thay thế nâng cao
GA Genetic algorithm Thuật toán di truyền
GDP Guanosin diphosphate Nucleotid guanosin diphosphatGTP Guanosin triphosphate Nucleotid guanosin triphosphat
IC50 Inhibitory concentration 50% Nồng độ ức chế 50% hoạt tính
in vitro Thí nghiệm trong ống nghiệm
in silico Thực hiện trên máy tính
MM/GBSA Molecular mechanics
generalized Born surface area
Diện tích bề mặt cơ học phân tửtheo lý thuyết Born tổng quátMM/PBSA Molecular mechanics Poisson
– Boltzmann surface area
Diện tích bề mặt cơ học phân tửtheo lý thuyết của Poisson –Boltzmann
PDB Protein Data Bank Ngân hàng dữ liệu protein
Trang 9PLS Partial least squares Phương pháp bình phương tối
thiểu từng phầnQSAR Quantitative structure –
activity relationship
Mối liên quan định lượng giữacấu trúc và hoạt tính sinh học
RFE Recursive feature elimination Phương pháp oại bỏ đặc trưng
đệ quy
RMSD Root mean square deviation Căn bậc hai độ lệch bình phương
trung bìnhRMSE Root mean square error Căn bậc hai sai số bình phương
trung bìnhRMSF Root mean square fluctuation Căn bậc hai dao động bình
phương trung bìnhROC curve Receiver operating
Trang 10DANH MỤC CÁC HÌNH
Hình 1.1 Công thức chung của các dẫn chất chalcon 3
Hình 1.2 Phản ứng ngưng tụ Claisen–Schmidt 5
Hình 1.3 Cấu trúc và sự bất ổn định động học của vi ống 7
Hình 1.4 Sáu vùng liên kết nhắm mục tiêu vi ống ở tubulin 9
Hình 1.5 Mô hình docking cứng 18
Hình 2.1 Cấu trúc 3D của protein 1SA0 24
Hình 2.2 Vùng gắn kết giữa 2 đơn phân α và β-tubulin với phối tử đồng kết tinh DAMA-colchicin 24
Hình 2.3 Quy trình xây dựng mô hình 2D-QSAR 27
Hình 2.4 Quy trình docking 29
Hình 3.1 Công thức cấu tạo của 7 chất gây nhiễu được loại bỏ 39
Hình 3.2 Độ tương quan giữa giá trị hoạt tính sinh học dự đoán và giá trị hoạt tính sinh học thực nghiệm trên tập xây dựng 39
Hình 3.3 Độ tương quan giữa giá trị hoạt tính sinh học dự đoán và giá trị hoạt tính sinh học thực nghiệm trên tập đánh giá ngoại 40
Hình 3.4 Độ tương quan giữa giá trị hoạt tính sinh học dự đoán và giá trị hoạt tính sinh học thực nghiệm trên cả tập dữ liệu 40
Hình 3.5 Độ tương quan giữa giá trị hoạt tính sinh học dự đoán và giá trị hoạt tính sinh học thực nghiệm trên cả tập xây dựng và tập đánh giá ngoại 41
Hình 3.6 Độ tương quan giữa giá trị hoạt tính sinh học dự đoán và giá trị hoạt tính sinh học thực nghiệm trên cả tập dữ liệu 42
Hình 3.7 Độ tương quan giữa giá trị hoạt tính sinh học dự đoán và giá trị hoạt tính sinh học thực nghiệm trên cả tập xây dựng 43
Hình 3.8 Độ tương quan giữa giá trị hoạt tính sinh học dự đoán và giá trị hoạt tính sinh học thực nghiệm trên cả tập dữ liệu 43
Trang 11Hình 3.9 Tương tác giữa protein và phối tử đồng kết tinh trước (A) và sau (B)
tái gắn kết 49
Hình 3.10 Sự gióng hàng DAMA-colchicin trước và sau tái gắn kết 50
Hình 3.11 Kết quả đánh giá mô hình docking theo đường cong ROC 50
Hình 3.12 Kết quả docking 127 chalcon chọn lọc 51
Hình 3.13 Tỷ lệ các chất gắn kết thành công trên tubulin theo khoảng điểm số docking 51
Hình 3.14 Quy trình sàng lọc các chalcon 58
Hình 3.15 Giá trị RMSD của protein theo thời gian của 10 chalcon 62
Hình 3.16 RMSF của các acid amin trong quá trình MDs 100 ns 63
Hình 3.17 Giá trị RMSD của phối tử theo thời gian của 10 chalcon tiềm năng trong phức hợp với tubulin 64
Hình 3.18 Mật độ và tần suất liên kết hydro của phối tử C28 với tubulin trong thời gian mô phỏng MDs 100 ns 65
Hình 3.19 Mật độ và tần suất liên kết hydro của phối tử C14 với tubulin trong thời gian mô phỏng MDs 100 ns 66
Hình 3.20 Mật độ và tần suất liên kết hydro của phối tử C16 với tubulin trong thời gian mô phỏng MDs 100 ns 67
Hình 3.21 Mật độ và tần suất liên kết hydro của phối tử C4 với tubulin trong thời gian mô phỏng MDs 100 ns 67
Hình 3.22 Mật độ và tần suất liên kết hydro của phối tử C13 với tubulin trong thời gian mô phỏng MDs 100 ns 68
Hình 3.23 Mật độ và tần suất liên kết hydro của phối tử E6 với tubulin trong thời gian mô phỏng MDs 100 ns 69
Hình 3.24 Mật độ và tần suất liên kết hydro của phối tử E9 với tubulin trong thời gian mô phỏng MDs 100 ns 70
Trang 12Hình 3.25 Mật độ và tần suất liên kết hydro của phối tử E10 với tubulin trong
thời gian mô phỏng MDs 100 ns 71
Hình 3.26 Mật độ và tần suất liên kết hydro của phối tử E7 với tubulin trong
thời gian mô phỏng MDs 100 ns 72
Hình 3.27 Số liên kết hydro của phối tử E4 với tubulin trong thời gian mô
phỏng MDs 100 ns 72
Trang 13DANH MỤC CÁC BẢNG
Bảng 1.1 Các phức hợp protein tubulin ở vùng colchicin 9
Bảng 1.2 Các chỉ số và tiêu chí đánh giá khả năng dự đoán ở tập xây dựng 13 Bảng 1.3 Các chỉ số và tiêu chí đánh giá khả năng dự đoán trên tập đánh giá ngoại 16
Bảng 3.1 Bốn thông số mô tả được lựa chọn dựa theo phương pháp 1 37
Bảng 3.2 Độ tương quan giữa các thông số mô tả tính bằng MOE 37
Bảng 3.3 Sáu thông số mô tả được lựa chọn dựa theo phương pháp 2 38
Bảng 3.4 Kết quả đánh giá nội 39
Bảng 3.5 Kết quả đánh giá ngoại 40
Bảng 3.6 Kết quả đánh giá mô hình QSAR 41
Bảng 3.7 Kết quả đánh giá mô hình QSAR 42
Bảng 3.9 Kết quả dự đoán hoạt tính ức chế MCF7 của 3 mô hình 44
Bảng 3.10 Kết quả docking của 20 chalcon chọn lọc có điểm số docking tốt nhất 52
Bảng 3.11 Năm chất tiềm năng được sàng lọc từ tập chalcon nội bộ 59
Bảng 3.12 Năm chất tiềm năng được sàng lọc từ tập chalcon tổ hợp 60
Bảng 3.13 Các thông số đánh giá độ ổn định của protein trong phức hợp với các chất tiềm năng khi MDs 100 ns 61
Bảng 3.14 Giá trị RMSD của các chalcon tiềm năng trong phức hợp 64
Bảng 3.15 Tần suất biểu hiện liên kết kỵ nước của phối tử C28 với tubulin trong thời gian mô phỏng MDs 100 ns 65
Bảng 3.16 Tần suất biểu hiện liên kết kỵ nước của phối tử C14 với tubulin trong thời gian mô phỏng MDs 100 ns 66
Bảng 3.17 Tần suất biểu hiện liên kết kỵ nước của phối tử C16 với tubulin trong thời gian mô phỏng MDs 100 ns 67
Trang 14Bảng 3.18 Tần suất biểu hiện liên kết kỵ nước của phối tử C4 với tubulin trong
thời gian mô phỏng MDs 100 ns 68
Bảng 3.19 Tần suất biểu hiện liên kết hydro của phối tử C13 với tubulin trong
thời gian mô phỏng MDs 100 ns 69
Bảng 3.20 Tần suất biểu hiện liên kết hydro của phối tử E6 với tubulin trong
thời gian mô phỏng MDs 100 ns 70
Bảng 3.21 Tần suất biểu hiện liên kết hydro của phối tử E9 với tubulin trong
thời gian mô phỏng MDs 100 ns 70
Bảng 3.22 Tần suất biểu hiện liên kết hydro của phối tử E10 với tubulin trong
thời gian mô phỏng MDs 100 ns 71
Bảng 3.23 Tần suất biểu hiện liên kết kỵ nước của phối tử E7 với tubulin trong
thời gian mô phỏng MDs 100 ns 72
Bảng 3.24 Tần suất biểu hiện liên kết kỵ nước của phối tử E4 với tubulin trong
thời gian mô phỏng MDs 100 ns 73Bảng 3.25 Kết quả tính toán năng lượng gắn kết tự do của phức hợp trong suốtquá trình MDs 100 ns 73Bảng 4.1 So sánh các mô hình QSAR đã xây dựng với các mô hình khác trênthế giới 90
Trang 15MỞ ĐẦU
Ung thư là chứng bệnh nan y nguy hiểm của thế kỷ 21, với số lượng ngườimắc tăng nhanh, nhất là trong thời gian gần đây Trong đó, ung thư vú là mộttrong những bệnh ác tính được chẩn đoán thường gặp nhất ở phụ nữ Bất chấpnhững thành tựu đạt được trong những thập kỷ qua, ung thư vú vẫn là một vấn
đề sức khỏe cộng đồng lớn
Theo báo cáo của Tổ chức Y tế Thế giới (WHO) đến ngày 26/03/2021, trêntoàn thế giới có 2,3 triệu phụ nữ được chẩn đoán mắc bệnh ung thư vú và685.000 ca tử vong trong năm 2020 khiến nó trở thành loại ung thư phổ biếnnhất thế giới1 Riêng tại Việt Nam, ung thư vú là một trong ba loại ung thư có
tỉ lệ mắc nhiều nhất tại Việt Nam (21.555 ca) và là ung thư hàng đầu ở nữ giới(chiếm 25,8%)2
Hiện nay nhiều nghiên cứu trên toàn thế giới đang được tiến hành để tìm raloại thuốc chống ung thư mới Sự gia tăng liên tục về tỷ lệ mắc ung thư, nhiềutác dụng phụ của các loại thuốc đang sử dụng, cũng như sự phát triển đề khángcủa khối u đối với thuốc buộc phải nghiên cứu liên tục các phân tử mới với cấuhình hiệu quả an toàn hơn Vì vậy, việc sàng lọc và tìm kiếm các hợp chất mới
có hoạt tính kháng ung thư là một việc làm hết sức thiết thực và cấp bách.Chalcon là hợp chất flavonoid, thường được sử dụng cho việc thiết kế, tổnghợp nhiều hợp chất Các báo cáo nghiên cứu cho thấy các dẫn xuất chalcon thểhiện được nhiều hoạt tính sinh học bao gồm: kháng viêm (Phrutıvorapongkul
và cộng sự, 2003)3, kháng oxy hóa (Christov và cộng sự, 2006)4, kháng khuẩn(Liaras và cộng sự, 2011)5, và đặc biệt là kháng ung thư (Ullah và cộng sự,2007)6 Chính vì những hoạt tính sinh học đa dạng mà các dẫn xuất chalconluôn thu hút được sự quan tâm của nhiều nhà hóa học cả trong và ngoài nước.Theo nhiều công trình khoa học đã công bố, nhiều dẫn xuất chalcon đã chotác dụng ức chế sự tăng sinh, sự hình thành mạch và gây ra quá trình chết theo
Trang 16chu trình của tế bào ung thư vú MCF7 như dẫn xuất chứa vòng pyrazol (Magda
F Mohamed và cộng sự, 2014)7, dẫn xuất nitro và trifluoromethyl (FatimahHashim và cộng sự, 2018)8, dẫn xuất napthalen (Guangcheng Wang và cộng
sự, 2020)9 Với những tiềm năng của chalcon trong điều trị ung thư vú, việcnghiên cứu tìm thêm nhiều dẫn chất chalcon mới có tác dụng sinh học tốt là hếtsức cần thiết
Vi ống là thành phần quan trọng của tế bào nhân chuẩn và đóng vai trò quantrọng trong các chức năng của tế bào như duy trì hình thái tế bào, truyền tínhiệu, vận chuyển các bào quan, sự vận động của tế bào và nguyên phân Vì vậy
vi ống đã trở thành một trong những mục tiêu thuốc quan trọng nhất trong điềutrị ung thư Các tác nhân nhắm mục tiêu vi ống có thể phá vỡ động lực học vàcấu trúc của vi ống, làm xáo trộn thêm sự hình thành trục phân bào, ngăn chặnchu kỳ tế bào ở kỳ giữa/kỳ sau của quá trình nguyên phân và gây ra cái chếttheo chương trình của tế bào10
Từ các cơ sở trên, nghiên cứu “Nghiên cứu 2D-QSAR trên dòng tế bào
MCF7 và mô hình docking trên tubulin của các dẫn chất chalcon” được
thực hiện với mục tiêu tìm ra các dẫn chất chalcon có khả năng ức chế MCF7
để điều trị ung thư vú
Để đạt được mục tiêu đã đề ra, nghiên cứu đề ra ba mục tiêu cụ thể sau:
1 Xây dựng mô hình 2D-QSAR nhằm xác lập mối liên quan giữa cácthông số lý hóa đặc trưng và tác dụng kháng ung thư của các dẫn chất chalcon
2 Xây dựng mô hình mô tả phân tử docking nhằm đánh giá khả năng gắnkết của các dẫn chất chalcon trên tubulin
3 Ứng dụng 2 mô hình và mô phỏng động lực học phân tử nhằm sàng lọctìm ra dẫn chất chalcon tiềm năng
Trang 17CHƯƠNG 1 TỔNG QUAN TÀI LIỆU
1.1 Giới thiệu chung về chalcon
1.1.1 Cấu trúc chung
Chalcon là hợp chất flavonoid có chứa vòng, cấu trúc hóa học là diphenyl-2-propen-1-on tồn tại ở 2 cấu dạng là E hoặc Z, có hai vòng thơm(vòng A và B) được nối với nhau bằng mạch hở ba carbon không no hệ liênhợp α, β-carbonyl
1,3-Chalcon có hai đồng phân hóa học là đồng phân E và Z trong đó đồng phân
E bền vững về mặt nhiệt động học hơn nên cấu hình E chiếm đa số trong các
cấu hình chalcon được tìm thấy11
1.1.2 Các dẫn chất chalcon
Hình 1.1 Công thức chung của các dẫn chất chalcon
Các nhóm thế R, R’ trên vòng A, B có thể là CH3, OH, OCH3, isophenyl,…với các chalcon có nguồn gốc thiên nhiên hay NO2, các halogen,… trên cácchalcon tổng hợp
Các chalcon có nguồn gốc tự nhiên thường là các monomer và đa dạng vềcấu trúc Một số chalcon có khả năng chống ung thư được phân lập từ thiênnhiên như isoliquiritigenin, butein và isobavachalcon11
Isoliquiritigenin (2’,4’,4-trihydroxychalcon) được biết là có tiềm năng điềutrị chống lại các bệnh ung thư khác nhau, bao gồm ung thư vú, ung thư ruột kết,ung thư đường tiêu hóa, ung thư phổi, ung thư buồng trứng, bệnh bạch cầu và
Trang 18khối u ác tính12.
IsoliquiritigeninIsobavachalcon được tìm thấy trong các cây thuộc họ đậu Fabaceae và họDâu tằm Moraceae Isobavachalcon hoạt động chống lại nhiều loại ung thưbằng cách nhắm mục tiêu vào con đường tín hiệu kinase điều hòa tín hiệu ngoạibào giúp chống tăng sinh khối u Ngoài ra, isobavachalcon còn ức chế thụ thểestrogen alpha (ERα) và giảm biểu hiện kháng nguyên CD44, dẫn đến giảm đềkháng paclitaxel trong ung thư vú ER+13
Isobavachalcon
1.1.3 Các phương pháp tổng hợp chalcon
Các hợp chất chalcon tồn tại ở 2 dạng trans và cis, và đồng phân trans ổn
định hơn về mặt nhiệt động lực học, vì vậy nó là cấu hình chủ yếu giữa cácchalcon14 Các phương pháp được sử dụng trong quá trình tổng hợp khung
chalcon (1,3-diphenyl-2-propen-1-on) gồm phản ứng ngưng tụ Claisen–Schmidt, phản ứng Heck, phản ứng cộng, phản ứng Sonogashira, phản ứngSuzuki–Miyaura, phản ứng qua trung gian chất xúc tác acid rắn, 15,16 Trong
số tất cả các phương pháp, phương pháp ngưng tụ Claisen–Schmidt là phươngpháp phổ biến nhất, thường được áp dụng để tổng hợp chalcon
Phản ứng Claisen–Schmidt được tiến hành tương đối đơn giản khi cho dẫnchất acetophenon và benzaldehyd tác dụng với nhau ở nhiệt độ phòng hoặc gianhiêt đến 50oC với xúc tác là dung dịch hydroxyd kiềm hoặc natri ethoxyd(C2H5ONa) có nồng độ trong khoảng 10–60% Sản phẩm tạo thành có chứa liên
Trang 19kết đôi carbon-carbon không phụ thuốc vào độ phức tạp của cấu trúc của cácphân tử tham gia ngưng tụ.
Hình 1.2 Phản ứng ngưng tụ Claisen–Schmidt
1.1.4 Tác dụng sinh học
Chalcon có cấu trúc flavonoid và có mặt ở khắp nơi trong nhiều sản phẩm tựnhiên Chalcon có cấu trúc nhỏ và là chất nhận Michael, khiến chúng có khảnăng liên kết hoặc phản ứng với các phân tử sinh học khác nhau giúp chúng cótác dụng sinh học rất đa dạng Các dẫn chất chalcon có tác dụng chống ung thư,chống viêm, chống đái tháo đường, chất chống oxy hóa, kháng khuẩn, khángnấm và chống sốt rét11
1.1.5 Ứng dụng trong lâm sàng
Các dẫn chất chalcon đã chứng minh được tiềm năng sinh học rất lớn Một
số ví dụ về các dẫn chất chalcon hiện đang được thử nghiệm trên lâm sàng làthuốc lợi tiểu Metochalcon và thuốc chống loét và bảo vệ niêm mạc nhầySofalcon17
1.2 Giới thiệu chung về mục tiêu tác động
1.2.1 Tế bào MCF7
MCF7 là tế bào ung thư biểu mô tuyến vú ở người, được phân lập vào năm
1970 từ một phụ nữ da trắng 69 tuổi Trước MCF7, các nhà nghiên cứu ung thưkhông thể có được dòng tế bào động vật có vú có khả năng sống lâu hơn một
Trang 20vài tháng MCF7 và hai dòng tế bào ung thư vú khác là T-47D và
MDA-MB-231, chiếm hơn hai phần ba tất cả các nghiên cứu báo cáo tóm tắt về các dòng
tế bào ung thư Các tế bào MCF7 bắt nguồn từ tràn dịch màng phổi, là dòng tếbào kém xâm lấn, được coi là có khả năng di căn thấp18,19
1.2.2 Tubulin
1.2.2.1 Vi ống
Vi ống là những cấu trúc hình trụ dài rỗng giữa, không phân nhánh, đườngkính trung bình 25 nm, chiều dài thay đổi tuỳ tình trạng tế bào và có thể lên đếnvài µm Vi ống có thể ở dạng tự do trong tế bào, vi ống thần kinh axon hay tạothành cấu trúc ổn định như trung tử, lông, roi Vi ống có vai trò tạo thành thoi
và sao phân bào kéo các nhiễm sắc thể về hai cực, vận tải nội bào, duy trì hìnhdạng của tế bào, tham gia hình thành, vận chuyển các bóng nhập bào, xuất bào,duy trì tính ổn định của màng sinh chất, tạo tính phân cực cho tế bào20
1.2.2.2 Tubulin và sự trùng hợp vi ống
Vi ống có cấu tạo từ protein tubulin Mỗi phân tử protein tubulin là một dị
nhị tụ (heterodimer) gồm hai đơn phân (monomer) là α-tubulin và β-tubulin
(kích thước 4 x 5 x 8nm, trọng lượng 100.000 – 120.000 đơn vị C) trùng phânthành nguyên sợi mảnh α và β-tubulin có chung 40% chuỗi acid amin, tồn tại
ở nhiều dạng isotype, trải qua một loạt các biến đổi sau dịch mã21 Mỗi đơnphân tubulin gắn với một phân tử guanosin triphosphat (GTP) giàu năng lượng.Trong α-tubulin (vị trí N), GTP không thể loại bỏ mà không làm biến tínhheterodimer, nhưng có thể trao đổi dễ dàng với GTP tự do trong β-tubulin (vịtrí E) Ngoài ra, cấu trúc của α và β-tubulin về cơ bản giống hệt nhau: một lõigồm hai phiến gấp β bao quanh bởi xoắn α Một đơn phân có thể chia thành bamiền chức năng: đầu amino là vùng liên kết với nucleotid, miền trung gian lànơi gắn Taxol, đầu carboxy có thể liên kết với các protein vận chuyển
Sự trùng hợp tubulin xảy ra trong pha G2, khi các nhiễm sắc thể co xoắn
Trang 21chặt chuẩn bị cho nguyên phân, 13 protein tubulin sẽ xếp lại với nhau thànhvòng xoắn tạo nên thành vi ống dày 5 nm Sự trùng hợp có tính thuận nghịch
và xảy ra với sự có mặt của ion Mg2+ và GTP22 Sau khi hình thành, các vi ống
này không bền Chúng tồn tại trong trạng thái cân bằng, với các dimer
GTP liên tục thêm vào đầu (+) của vi ống và thủy phân ở đầu (-) thành GDP Sự cân bằng và kiểm soát chiều dài của các vi ống có vai trò quan trọngđối với các chức năng của chúng23
tubulin-Hình 1.3 Cấu trúc và sự bất ổn định động học của vi ống10
1.2.2.3 Vai trò trong kháng ung thư
Ung thư là tình trạng mất cân bằng giữa sự phân chia tế bào và sự chết tếbào, dẫn đến tăng sinh tế bào không kiểm soát Sự gia tăng này là một mục tiêuhấp dẫn và nhiều tiềm năng cho thiết kế thuốc kháng ung thư Sự phát triển củacác phương pháp quan sát tế bào sống đã giúp làm rõ vai trò quyết định của các
vi ống trong quá trình phân bào Trong quá trình phân bào, thoi vô sắc nối vớicác nhiễm sắc thể có cấu tạo từ các vi ống Khi có mặt các chất ngăn cản sựtrùng hợp protein tubulin, thoi vô sắc không thể hình thành dẫn đến rối loạn
Trang 22phân chia nhiễm sắc thể: các nhiễm sắc thể bị mắc kẹt ở hai đầu trục chính, quátrình phân bào bị dừng lại ở kỳ giữa và gây ra sự chết tế bào theo chu trình Tếbào ung thư tương đối nhạy cảm với các loại thuốc này hơn so với các tế bàobình thường là do sự phân chia tế bào nhanh và liên tục20 Vì vậy, vi ống đã trởthành một trong những mục tiêu thuốc quan trọng nhất trong điều trị ung thư.
1.2.3 Các chất kháng ung thư tác dụng trên tubulin
Nhiều dẫn chất tác động trên tubulin làm rối loạn cân bằng động của quátrình trùng hợp tubulin–vi ống dẫn đến ức chế sự hình thành thoi phân bào, tếbào dừng lại ở kỳ giữa, hình thành nhân đa bội ức chế sự phân bào của các tếbào ung thư
Các chất này có thể được chia thành hai nhóm chính:
Nhóm ức chế sự trùng hợp vi ống ở nồng độ cao, là tác nhân làm mất ổnđịnh vi ống gồm các vinca (vinblastin, vincristin), cryptophyin, halichondrin,estramustin, colchicin và combretastatin A-4
Nhóm kích thích sự trùng hợp, là tác nhân làm ổn định vi ống gồm cáctaxan (paclitaxel, docetaxel), epothilon, discodermolid, eleutherobin,sarcodictyin, laulimalid, rhazinalam và polyisoprenylbenzophenon24
1.2.4 Các vùng gắn kết trên tubulin
Có 6 vùng gắn kết trên tubulin đã được tìm thấy, trong đó chỉ có 1 vùng trênα-tubulin là pironetin, còn lại 5 vùng trên β-tubulin Vị trí liên kết colchicinhiện nay đạt được nhiều sự quan tâm khi một lượng lớn phân tử nhỏ liên kếtvới colchicin được báo cáo với sự đa dạng cấu trúc và độ phức tạp phân tử củacác chất ức chế gắn kết ở vùng colchicin nhỏ hơn so với các chất gắn kết vớivùng taxan và vinca Thêm vào đó, việc xem xét vùng colchicin như tác nhângây rối loạn mạch máu mà không phải là các tác nhân gây độc tế bào có thể làmgiảm các độc tính thứ cấp cũng như sự đề kháng đa thuốc như taxan và vincaalkaloid
Trang 23Hình 1.4 Sáu vùng liên kết nhắm mục tiêu vi ống ở tubulin (α-tubulin màu
be và β-tubulin màu xanh lam)10.Tra cứu trên ngân hàng dữ liệu protein có 9 cấu trúc tubulin, mỗi cấu trúc
có sự khác nhau cơ bản về phối tử có sẵn trong phức hợp và độ phân giải Cáccấu trúc protein này được trình bày ở Bảng 1.1
Bảng 1.1 Các phức hợp protein tubulin ở vùng colchicin
GDP, GTP, Mg,CN2, HOS
GDP, GTP, Mg ,LOC, TZT
Trang 24E70, GDP, GTP,Mg
N16, GDP, GTP,Mg
T13, GDP, GTP,Mg
Trang 25chi tiết sẽ được nhìn thấy khi tính toán bản đồ mật độ electron Phức hợp phângiải tốt có giá trị độ phân giải càng thấp sẽ có chất lượng cao hơn Dựa vào cấutrúc của các dẫn chất cần gắn kết với độ phân giải của phức hợp protein tiếnhành chọn ra phức hợp phù hợp để docking Phức hợp 4O2B có độ phân giảithấp nhất tuy nhiên nghiên cứu lựa chọn xây dựng mô hình docking dựa trênphức hợp có mã PDB là 1SA0.
1.3 Phương pháp nghiên cứu mối liên quan định lượng giữa cấu trúc và tác dụng
1.3.1 2D-QSAR
QSAR (Quantitative structure-activity relationship) là nghiên cứu mối liên
quan định lượng giữa cấu trúc và tác dụng sinh học, xác lập mối tương quangiữa các thông số đặc trưng cho cấu tạo, các tính chất lý hóa và tác dụng sinhhọc giữa các thông số đặc trưng cho cấu tạo, các tính chất lí hóa và tác dụngsinh học của một dãy chất Mối tương quan này được thiết lập dưới dạng:
- Hồi quy (Regression): kết quả được biểu thị dưới dạng phương trình hồi
quy tuyến tính hoặc phi tuyến của các thông số mô tả với một hằng số
- Nhị phân (Binary): giả định kết quả thử nghiệm là giá trị nhị phân 1 hoặc 0
đại diện cho có/không, ước tính khả năng một phân tử cho kết quả là 125.Các tập chất được lựa chọn là các dẫn chất chalcon có hoạt tính đã được thửnghiệm thực nghiệm nên nghiên cứu này xây dựng mô hình QSAR dựa trên sựthiết lập dưới dạng hồi quy
Hiện nay, để xây dựng mô hình QSAR có 2 phương pháp chủ yếu là: phươngpháp phân tích cổ điển (2D-QSAR) và phân tích QSAR ba chiều (3D-QSAR).Nghiên cứu này được thực hiện nhằm mục tiêu xây dựng mô hình 2D-QSAR.Thông số mô tả 2D được phát triển bằng các nguyên tử và thông tin liên kếtphân tử, các thông số hóa lý như tương tác kỵ nước, tính khúc xạ, sự cho nhậnhydro, các hiệu ứng điện tử (hiệu ứng trường F, hiệu ứng cộng hưởng R hay
Trang 26hằng số Hammett) thường được sử dụng.
Một số đại lượng hoạt tính sinh học thường được dùng như: IC50: nồng độ
ức chế 50% hoạt tính; EC50: nồng độ 50% tác dụng tối đa; Ki: hằng số ức chế Các đại lượng này cần được chuyển đổi dưới dạng logarit thập phân nhưlog(1/IC50), log(1/EC50), log(1/Ki) để có được các thông số thích hợp chonghiên cứu QSAR
Nghiên cứu này sử dụng giá trị log(1/IC50) hay pIC50 của các dẫn chấtchalcon được thử nghiệm trên dòng tế bào MCF7 đã được công bố trong cácnghiên cứu tổng hợp trên thế giới
1.3.2 Phương pháp lựa chọn thông số mô tả
Cấu trúc hóa học có thể được mã hóa bởi một loạt các thông số mô tả nhưngchỉ nên lựa chọn một vài thông số phù hợp để xây dựng mô hình vì:
Lượng thông số mô tả đầu vào quá nhiều so với lượng phân tử khiến sốbậc tự do hiệu dụng lớn, mô hình càng dễ biến đổi, độ tin cậy giảm
Càng nhiều thông số mô tả thì độ lệch càng nhỏ nhưng phương sai cànglớn, làm giảm độ chính xác của mô hình
Xây dựng mô hình đơn giản hơn, diễn giải trở nên dễ dàng hơn
Tiết kiệm thời gian hơn so với phân tích hàng trăm thông số mô tả25
1.3.3 Phương pháp xây dựng mô hình QSAR
Mục đích của việc xây dựng mô hình QSAR là xác định các thông số tối ưu
để dự đoán hoạt tính sinh học trên một đích tác dụng cụ thể Nghiên cứu này sửdụng phương pháp bình phương tối thiểu từng phần và phương pháp rừng ngẫunhiên để xây dựng mô hình QSAR và so sánh mô hình tạo ra từ 2 phương pháp
1.3.3.1 Phương pháp bình phương tối thiểu từng phần
Phương pháp bình phương tối thiểu từng phần (PLS – Partial least squares)
được sử dụng nhằm mục đích xây dựng được phương trình hồi quy giữa pIC50
và các thông số mô tả Phương pháp PLS là một trong những phương pháp cổ
Trang 27điển được sử dụng và xây dựng thành công nhiều mô hình QSAR có khả năng
dự đoán tốt PLS có thể xử lý dữ liệu hiệu quả khi mà số lượng thông số mô tảnhỏ hơn hoặc lớn hơn số lượng dẫn chất
1.3.3.2 Phương pháp rừng ngẫu nhiên
Mặc dù phương pháp PLS đã thành công xây dựng nhiều mô hình QSAR cókhả năng dự đoán tốt, tuy nhiên, việc sử dụng phương pháp này vẫn còn nhiềuhạn chế Một trong những lý do bắt nguồn từ việc PLS không thực sự phù hợp
để xử lý nhiều cơ chế hoạt động và quá trình xây dựng mô hình cần lặp lại nhiềulần để phân chia tập dữ liệu và chọn lựa các thông số mô tả phù hợp để dự đoán
Không như PLS, Rừng ngẫu nhiên (RF - Random Forest) là một phương pháp
phân loại và hồi quy mới để dự đoán hoạt tính sinh học định lượng và phân loạidựa trên các thông số mô tả cấu trúc phân tử của các chất RF có khả năng đề
xuất các thông số mô tả quan trọng với việc xây dựng mô hình QSAR cũng như
đưa ra sự dự đoán về tính chính xác về khả năng dự đoán của mô hình đượcxây dựng26
1.3.4 Phương pháp đánh giá
1.3.4.1 Đánh giá nội
Đánh giá nội được thực hiện để đánh giá sự phân chia tập dữ liệu và cácthông số được lựa chọn có khả năng phù hợp với cấu trúc của các dẫn chất đượclựa chọn và có khả năng dự đoán tốt hay không
Một mô hình được xem là hiệu quả khi đáp ứng được cái tiêu chí được trìnhbày trong Bảng 1.2
Bảng 1.2 Các chỉ số và tiêu chí đánh giá khả năng dự đoán ở tập xây dựng
Trang 28Sự tương quan giữa giá trị pIC50 dự đoán và giá trị pIC50 thựcnghiệm đượcbiểu diễn bằng hệ số tương quan R2 có giá trị nằm trong khoảng [0;1] Mô hìnhđược xem là có khả năng dự đoán tốt khi R2 ≥ 0,526.
Căn bậc hai của sai số bình phương trung bình (root mean square error
-RMSE) được sử dụng để đánh giá chất lượng dự đoán của mô hình Mô hìnhchấp nhận khi RMSE ≤ 0,5, giá trị RMSE cảng nhỏ càng tốt Giá trị RMSE >0,5 phản ánh khả năng dự đoán kém chính xác của mô hình, thậm chí khi hệ sốtương quan R2 ≥ 0,7
Giá trị RMSE được tính theo công thức:
(chưa khớp) Ngược lại khi giá trị lỗi trên tập xây dựng thấp nhưng tập đánh
giá ngoại lại cao, mô hình bị overfitting (quá khớp) Overfitting sẽ dẫn đến dự
đoán nhầm nhiễu, chất lượng mô hình không còn tốt nữa Dữ liệu kiểm tra ngoạiđược giả sử là không biết trước và không dùng để xây dựng mô hình Vì vậy,
để biết được chất lượng của mô hình với dữ liệu chưa biết trước, một tập đánh
giá (validation set) được trích ra từ tập xây dựng Nếu lấy quá nhiều dữ liệu
trong tập xây dựng để đánh giá, phần còn lại sẽ không đủ để xây dựng mô hình.Ngược lại, khi tập đánh giá quá nhỏ có thể xảy ra overfitting
Để giải quyết vấn đề này, thực hiện đánh giá chéo (cross-validation) Đánh
giá chéo là một cải tiến của phương pháp trên, với lượng dữ liệu trong tập đánhgiá nhỏ nhưng chất lượng mô hình được đánh giá trên nhiều tập đánh giá khác
nhau Một cách thường được sử dụng là kỹ thuật đánh giá chéo k lần (k-fold
Trang 29cross validation) Chia tập xây dựng ra k tập con không giao nhau, kích thước
gần bằng nhau Tại mỗi lần kiểm thử, một trong số k tập con được lấy ra làmtập đánh giá Mô hình sẽ được xây dựng dựa vào hợp của (k–1) tập con còn lại
Mô hình cuối được xác định dựa trên trung bình cộng các giá trị lỗi trên tập xâydựng và tập đánh giá Thường chọn k nhỏ nhất là 5 và lớn nhất là số lượng phần
tử trong tập xây dựng, tức mỗi tập con có đúng một phần tử, gọi là out (LOO – bỏ một ra) – một trong những kỹ thuật đánh giá nội phổ biến nhất Thông số đại diện do đánh giá này là Q 2 Mô hình chấp nhận được khi Q 2 ≥0,526
leave-one-𝑄2 = 1 −∑ (𝑦𝑜𝑏𝑠 − 𝑦𝑝𝑟𝑒𝑑)
2 𝑛
𝑖=1
∑𝑛 (𝑦𝑜𝑏𝑠 − 𝑦̅𝑝𝑟𝑒𝑑)2 𝑖=1
Trong đó: y pred là giá trị pIC50 dự đoán từ mô hình, y obs là giá trị pIC50 thựcnghiệm, 𝑦̅𝑝𝑟𝑒𝑑 là giá trị pIC50 dự đoán trung bình trên tập xây dựng
Ngoài ra, khi xây dựng mô hình, sẽ có một vài chất có độ lệch chuẩn cao sovới giá trị trung bình của toàn tập dữ liệu và được xem là những chất có giá trịbất thường Thông số được dùng cho đánh giá này là Z-SCORE Một chất cóZ-SCORE lớn (≥ 2,0) có khả năng cao nằm ngoài đường thẳng hồi quy và đượcgọi là các chất nhiễu và được loại bỏ để xây dựng mô hình dự đoán trên tập xâydựng tốt hơn28
Z − SCORE = ∑ |𝑦𝑜𝑏𝑠 − 𝑦𝑝𝑟𝑒𝑑|
𝑛 𝑖=1RMSE
Trong đó: y obs là giá trị pIC50 thực nghiệm, y pred là giá trị pIC50 dự đoán từ môhình
1.3.5 Đánh giá ngoại
Đánh giá ngoại xem xét khả năng dự đoán thực của mô hình Nhiều nghiêncứu đã chỉ ra rằng các duy nhất để đánh giá khả năng dự đoán của mô hìnhQSAR xây dựng từ tập xây dựng là đánh giá khả năng dự đoán hoạt tính sinh
Trang 30học của các chất thuộc tập đánh giá ngoại (các chất không thuộc tập xây dựng).
Để đánh giá khả năng dự đoán của mô hình, Roy và Paul đã đề xuất chỉ số 𝑟𝑚2
và được tính toán dựa trên phương trình29:
𝑟𝑚2 = 𝑟2(1 − √𝑟2− 𝑟𝑜2)Trong đó: 𝑟𝑜2 là hệ số tương quan giữa giá trị thực nghiệm và giá trị dự đoánkhi hệ số chắn bằng 0
𝑟𝑚2 được xây dựng với trục y là các giá trị thực nghiệm và trục x là các giá trị
dự đoán Một thông số ngược lại 𝑟′𝑚2 có trục y là các giá trị dự đoán và trục x
là các giá trị thực nghiệm Hai thông số này khác nhau trừ khi dự đoán hoànhảo, điều này gần như không thể xảy ra Vì vậy, giá trị khác biệt giữa hai thông
số này cũng dùng để đánh giá khả năng dự đoán của mô hình:
∆𝑟𝑚2 = |𝑟𝑚2 − 𝑟′𝑚2 |Theo Roy, mô hình chấp nhận được khi 𝑟̅̅̅ ≥ 0,5 và ∆𝑟𝑚2 𝑚2 ≤ 0,230
Ngoài ra, Golbraikh và Trospha cũng đề xuất các chỉ số khác để đánh giánhư độ dốc k và k’ của phương trình hồi quy giữa giá trị thực nghiệm và giá trị
dự đoán và ngược lại k và k’ nằm trong khoảng [0,85; 1,15] thì mô hình QSAR
đã xây dựng được xem là có khả năng dự đoán tốt31
Bảng 1.3 Các chỉ số và tiêu chí đánh giá khả năng dự đoán trên tập đánh
Trang 311.4 Phương pháp docking
Docking là phương pháp đưa cấu trúc của một chất (ở dạng 3D) vào trungtâm tương tác với mục tiêu phân tử (thụ thể, enzym hay các protein, DNA) vàtính toán các giá trị tương tác để đánh giá khả năng tương tác của chất đó vớimục tiêu phân tử Mục đích của docking là xác định một cấu dạng tối ưu nhấtcho phối tử (phân tử hay ion liên kết trực tiếp với trung tâm hoạt động được gọi
là phối tử) và dự đoán chính xác hoạt động của phối tử để năng lượng tự do củaphức hợp mục tiêu phân tử - phối tử là nhỏ nhất
Docking có vai trò dự đoán ái lực và hoạt tính của các dược chất đối vớiprotein, dự đoán tâm hoạt động và vị trí, cấu dạng thuận lợi của phối tử thamgia phản ứng từ đó dự đoán khả năng hoạt hóa hoặc ức chế một protein
1.4.1 Mô hình tương tác giữa mục tiêu và phối tử
Mô hình này thường được xây dựng bởi những tương tác đặc biệt như: liênkết hydrogen, liên kết ion, liên kết kỵ nước Mỗi nhóm tương tác được biểudiễn bởi loại tương tác và hình dạng tương tác (trung tâm + bề mặt)
Điểm số docking hay mức năng lượng tự do dùng để đánh giá mức nănglượng tự do trong phức hợp giữa phối tử và protein mục tiêu Mức năng lượng
tự do càng thấp thì khả năng liên kết giữa phối tử và receptor càng cao, liên kếttạo thành sẽ càng bền vững Vậy nên mức docking score (điểm số docking)
càng thấp cũng cho thấy hoạt tính in silico càng cao thể hiện ở độ bền liên kết
phối tử và thụ thể32
1.4.2 Thuật toán docking
Docking tìm ra các tương tác giữa phân tử hợp chất và điểm tác động theo 3hướng khác nhau:
– Docking cứng: xem hợp chất và protein đều là những phân tử cứng
(phương pháp này bỏ qua tính quan trọng của sự linh động)
– Docking bán linh động: xem hợp chất là phân tử linh động (phương pháp
Trang 32này được sử dụng phổ biến).
– Docking linh động hoàn toàn: xem cả hợp chất và protein đều linh động,
tuy nhiên phương pháp này tính toán rất phức tạp, đòi hỏi phải so sánh với cácphương pháp khác33
1.4.2.1 Docking cứng
Phối tử được xem là một cấu trúc cứng nhắc trong các docking Chỉ quantâm đến độ tự do của sự tịnh tiến và quay của phối tử Phiên bản đầu tiên củathuật toán DOCK xem docking ở thể cứng nhắc và được thiết kế để xác địnhcác phân tử với một mức độ cao của hình dạng bổ sung cho vị trí gắn protein
Hình 1.5 Mô hình docking cứng: Các phần của phối tử sắp xếp vào vị tríphù hợp trong các quả cầu xếp chồng lên nhau ở vùng tác động31
Giai đoạn đầu tiên của phương pháp DOCK liên quan đến việc xây dựng mộthình ảnh giả định các vị trí liên kết chứa một loạt các hình cầu chồng chéo cóbán kính khác nhau, xuất phát từ bề mặt phân tử của protein
Phối tử được sử dụng làm trung tâm mặt cầu sao cho khoảng cách giữa cácnguyên tử tương đương với khoảng cách giữa các trung tâm hình cầu tươngứng Cấu tạo phối tử sau đó được định hướng vào các vùng liên kết Sau khikiểm tra để đảm bảo rằng không có sự tương tác về không gian không thể chấp
Trang 33nhận, tiếp theo là chấm điểm Kiểu tương tác mới được hình thành bằng cáchthay đổi các kiểu sắp xếp nguyên tử của phối tử vào các trung tâm hình cầu.Quy trình liên tục cho đến khi tất cả các tương tác được xem xét31.
1.4.2.2 Docking bán linh động
Phương pháp này đặt các phối tử trong khu vực mục tiêu tác động, sau đóđịnh hướng các phối tử này sao cho các nhóm chức có thể tạo thành liên kếtcủa mục tiêu tác động Có 2 thuật toán được áp dụng trong docking đó là thuật
toán xây dựng lớn dần (Incremental construction algorithm) và thuật toán xác định vị trí đặt mảnh cơ sở (Base placement algorithm).
Với việc sử dụng thuật toán xây dựng lớn dần, chương trình docking sẽ phânphối tử thành từng mảnh cứng, docking các mảnh cứng vào túi gắn kết củaprotein, và dần dần lắp ráp lại với nhau để thu được phối tử Chương trình sẽthực hiện tính toán cách gắn kết để thu được cấu dạng bền nhất
Với việc sử dụng thuật toán xác định vị trí đặt mảnh cơ sở, dựa vào phép tam
giác phân (triangle matching) để tìm vị trí đặt mảnh cơ sở vào khoang bằng
cách gắn các bộ ba điểm trên phối tử với ba điểm riêng biệt trong khoang gắn
kết, khi các trung tâm và bề mặt bổ sung nhau được phủ lên nhau thì sự gắn kết
được tạo thành Sau mỗi bước lặp, một cấu dạng bền nhất hay có mức nănglượng thấp nhất sẽ được lựa chọn và ghi lại và chương trình docking sẽ tiếnhành tổng hợp và đưa ra những cấu dạng cũng như vị trí gắn kết bền nhất32
1.4.3 Đánh giá mô hình docking
Hiện nay có khá nhiều phần mềm về docking được sử dụng và sẽ có sự saikhác giữa điểm số docking giữa các phần mềm do sự khác nhau về thuật toán.Vậy nên để đánh giá độ tin cậy của một mô hình docking trong một phần mềm,người ta thường đánh giá độ sai lệch khi tái gắn kết với phối tử đồng kết tinhbằng phần mềm và khả năng phân loại các chất có hoạt tính hoặc không có hoạt
tính dựa trên đường cong ROC (Receiver Operating Characteristics curve)34
Trang 341.4.4 Đánh giá kết quả docking
Kết quả docking phân tử thường được đánh giá dựa trên điểm số dockinghay ái lực gắn kết giữa phối tử và mục tiêu tác động Ái lực gắn kết càng âm,khả năng gắn kết càng mạnh Tuy nhiên, đánh giá dựa trên điểm số docking làkhông đủ Điều quan trọng trong thiết kế thuốc là các phối tử cần phải gắn kếtvới protein thông qua sự tương tác với các acid amin quan trọng quyết địnhhoạt tính sinh học của protein, vì vậy cần phải quân tâm đến tương tác giữaprotein và phối tử
1.5 Mô phỏng động lực học phân tử
1.5.1 Khái niệm mô phỏng động lực học phân tử
Mô phỏng động lực học phân tử (MDs - Moleculalr dynamics simulation) là
sự mô phỏng sự tương tác của các nguyên tử hay phân tử dựa trên các định luậtvật lý cổ điển trên mô hình máy tính, giúp giải thích được bản chất vi mô củamối quan hệ giữa cấu trúc đến phân tử, trong khoảng thời gian mô phỏng gầnvới thời gian sinh học35 Ứng dụng cơ bản của MDs là đánh giá tính linh độngcủa các vùng khác nhau của phân tử sinh học Trong lĩnh vực khám phá thuốc,MDs đặc biệt có giá trị trong việc tối ưu hóa các chất khởi nguồn, thiết kế thuốcnhắm vào các enzym tín hiệu (signaling receptor) và có thể hữu ích trong việcsàng lọc ảo36 Hiện nay, có nhiều phần mềm hỗ trợ phổ biến gồm GROMACS,NAMD, AMBER, CHARMM, Desmond, OpenMM GROMACS là mộttrong những phần mềm mã nguồn mở và miễn phí được sử dụng rộng rãi đểMDs cho các cấu trúc sinh học, công cụ tính toán, chuẩn bị và phân tích Ngoài
ra, GROMACS có thể xuất kết quả mô phỏng ở các định dạng tệp phổ biến đọcđược nguyên bản hoặc thông qua một phần mềm khác như VMD
1.5.2 Đánh giá MDs
Một số thông số quan trọng có thể được sử dụng để đánh giá độ ổn định củaprotein và phối tử trong phức hợp trong suốt quá trình mô phỏng là RMSD,
Trang 35RMSF, SASA và Rg.
Công thức và ý nghĩa của các tham số được thể hiện như sau:
- Căn bậc hai độ lệch bình phương trung bình (RMSD – Root mean square deviation): được dùng để đánh giá độ ổn định của phối tử và protein trong điều
kiện mô phỏng thông qua việc so sánh mức độ biến đổi vị trí giữa protein hoặcphối tử) tại từng thời điểm trong quá trình MDs so với thời điểm ban đầu (0ns), thường dựa trên sự dao động của carbon xương sống (backbone) củaprotein và các phân tử nặng của phối tử Cấu trúc được xem là ổn định và có ýnghĩa khi biên độ dao động của giá trị RMSD của protein và của phối tử trongphức hợp < 2,0 Å
- Căn bậc hai dao động bình phương trung bình (RMSF - Root mean square fluctuation): được dùng để đánh giá sự linh động của acid amin trong protein.
Khác biệt chính giữa RMSD và RMSF là RMSF cho giá trị trung bình của sựdao động của từng acid amin trong tổng thời gian mô phỏng Giá trị RMSFcàng cao thể hiện sự linh động và ngược lại, khi giá trị RMSF thấp cho thấyphối tử dao động ổn định so với vị trí trung bình trong thời gian mô phỏng37.Acid amin có giá trị RMSF > 2,0 Å được xem là linh động38
- Bán kính quay (Rg – Radius of gyration): thể hiện mức độ nén của protein.
Quá trình duỗi xoắn do sự kém ổn định của protein trong quá trình MDs sẽđược ghi nhận bởi sự thay đổi của bán kinh quay39
- Diện tích bề mặt tiếp cận dung môi (SASA – Solvent accessible surface
duỗi xoắn, các cấu trúc bên trong của protein được mở ra và tiếp xúc với dungmôi của môi trường, giá trị SASA tăng
- Tần suất tạo liên kết hydro: được đánh giá dựa trên sự tạo thành liên kếthydro giữa phối tử và protein trong suốt quá trình mô phỏng
- Năng lượng gắn kết tự do (binding free energy), ký hiệu là ∆Ggắn kết được
Trang 36sử dụng để đánh giá độ bền của liên kết Trong đó, MM/GBSA (Molecular mechanics generalized born surface area) và MM/PBSA (Molecular mechanics Poisson – Boltzmann surface area) là những phương pháp phổ biến
để ước tính năng lượng tự do của liên kết giữa các phân tử nhỏ (phối tử) vớicác đại phân tử sinh học (protein) Các phương pháp này chỉ có tính trung gian
về độ chính xác do dựa trên kết quả mô phỏng động lực học phân tử phức hợpprotein và phối tử41
1.6 Các nghiên cứu liên quan
- Wan M Khairul và các cộng sự thiết kế, tổng hợp và thử nghiệm hoạt tínhmột số dẫn chất chalcon nhằm khảo sát ảnh hưởng giữa mật độ electron trong
hệ liên hợp π và các hoạt động sinh học bằng cách thế alkoxy bằng các nhómthế hút điện tử khác nhau, cụ thể là nitro, cyano và trifluoromethyl42
- Silvia Marquina và cộng sự đã thiết kế, tổng hợp và thiết lập QSAR củadẫn chất 2’-hydroxy-4’-alkoxy chalcon có nhóm thế ở vị trí số 3, cho thấychúng có gây ra độc tính chọn lọc trên dòng tế bào PC-3, cũng như làm tănghoạt hóa caspase-3 và các nhóm thế hút điện tử trên vòng A làm giảm hoạt tínhchống ung thư của dẫn chất43
- Luis Bustos và cộng sự nghiên cứu khả năng gây độc tế bào của các dẫnchất chalcon tổng hợp và tiến hành docking và thử hoạt tính, kết quả là có 2dẫn chất chalcon ức chế MCF7 tốt hơn so với thuốc đối chiếu là doxorubicin
và sự có mặt nhóm hydroxyl ở vòng B là cần thiết cho để độc tính tế bào vàmethoxy ở vòng A giúp tăng tương tác kỵ nước giữa nhóm prenyl với acid aminLeu67 và Thr5644
Trang 37CHƯƠNG 2 ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU
2.1 Đối tượng nghiên cứu
2.1.1 Cơ sở dữ liệu
Cấu trúc hóa học và hoạt tính kháng ung thư của các dẫn chất chalcon đượctổng kết từ các tài liệu tham khảo Tổng cộng 127 dẫn chất chalcon với giá trị
IC50 được xác định bằng phương pháp khảo sát hoạt tính độc tế bào trên dòng
tế bào ung thư vú MCF7
– 12 dẫn chất có khung cấu trúc benzimidazol chalcon từ nghiên cứu công
bố năm 2019 của Hsieh (Khoa Hóa học, trường Đại Học Thanh Hoa, TrungQuốc) và cộng sự45
– 53 dẫn chất có khung cấu trúc methoxy chalcon, 1-methylpiperidin-4-ylchalcon, 1-ethylpiperidin, 1-methylpiperazin và 4-91-piperidinyl) piperidin từnghiên cứu công bố năm 2009 của Xiaoling Liu và Mei-Lin Go (Khoa Dược,Đại học Quốc gia Singapore)46
– 11 dẫn chất có khung cấu trúc 2,4,5-trimethoxy chalcon (vòng B) từ nghiêncứu công bố năm 2013 của Suvarna Shenvi (Hiệp hội nghiên cứu khoa họcVittal Mallya, Ấn Độ) và cộng sự47
– 11 dẫn chất có khung cấu trúc phenylpropiophenon từ nghiên cứu công bốnăm 2013 của Branka (Đại học Belgrade, Serbia) và cộng sự48
– 18 dẫn chất 2,3,4,4’-chalcon từ nghiên cứu công bố năm 2018 của SuvithaSya (Đại học Putra Malaysia, Malaysia) và cộng sự49
– 22 dẫn chất 2’-hydroxyl-4’,6’-dimethoxy chalcon từ nghiên cứu công bốnăm 2018 của Addila Abu (Đại học Pahang, Malaysia) và cộng sự50
2.1.2 Mục tiêu tác động
Cấu trúc phức hợp tubulin và phối tử đồng kết tinh DAMA-colchicin deacetyl-N-(2-mercaptoacetyl)-colchicin) có mã PDB là 1SA0 được tải về dướidạng *.pdb từ Protein Data Bank (rcsb.org) như Hình 2.1
Trang 38(N-Vùng gắn kết colchicin nằm giữa 2 chuỗi A và B và hơi lệch hơn về phíachuỗi B Các chuỗi C, D và E sẽ được loại bỏ để dễ dàng quan sát hơn.
Hình 2.1 Cấu trúc 3D của protein 1SA0 (độ phân giải 3,58 Å)
Hình 2.2 Vùng gắn kết giữa 2 đơn phân α và β-tubulin với phối tử đồng
kết tinh DAMA-colchicin29.(A) Chuỗi α-tubulin màu xanh cyan ở bên phải, chuỗi β-tubulin cómàu xanhđậm ở bên trái DAMA-colchicin đã được thể hiện ở dạng que, trong đó màuxanh lục, xám, xanh lam, đỏ và vàng tương ứng là các nguyên tử carbon,
Trang 39hydro, nitơ, oxy và lưu huỳnh (B) Cấu trúc của DAMA-colchicin.
2.2 Phương pháp nghiên cứu
2.2.1 Các phần mềm sử dụng
ChemDraw 19.0 của PerkinElmoer: thiết kế cấu trúc 2D của phân tử
MOE 2015.10 của Chemical Computing Group: chuẩn bị cơ sở dữ liệu,trích xuất các thông số mô tả, xây dựng mô hình QSAR, tối thiểu hóa nănglượng, xem tương tác giữa phối tử và protein
Microsoft Excel 2010 của Microsoft: xử lý bảng tính, lọc thô các thông số,
vẽ biểu đồ
Open Babel GUI 2.4.1: chuyển đổi định dạng dữ liệu
Rapidminer 9.6 của Rapidminer Studio: lọc các thông số mô tả, chuẩn hóa
dữ liệu từ 0 đến 1,0, loại bỏ các thông số có độ tương quan lớn hơn 0,9
Weka Explorer của Weka 3.8.4: chọn các thông số tốt nhất
Autodock Vina 1.2.3 và Autodock tool 1.5.7: chuẩn bị protein và khoang
Trang 40gắn kết, docking các phối tử với mục tiêu tác động.
DUD-E decoy: xây dựng tập chất không hoạt tính để đánh giá tính phânloại của mô hình docking
Discovery Studio 2021: xem tương tác 2D giữa phối tử và protein
PLIP: xem liên kết hydro và liên kết kỵ nước giữa phối tử và protein
GROMACS 2022.4: mô phỏng động lực học phân tử, trích xuất khunghình và phân tích kết quả
VMD 1.9.4: xác định tần suất liên kết hydro và số liên kết hydro tạo thànhtheo thời gian
gmx_MMPBSA 1.6.3: tính toán năng lượng gắn kết tự do theo mô hìnhMM/GBSA và năng lượng đóng góp của từng vị trí acid amin
2.2.2 Phương pháp xây dựng mô hình QSAR
Quy trình xây dựng mô hình QSAR gồm 6 bước, được tóm tắt theo Hình 2.3.
2.2.2.1 Chuẩn bị cơ sở dữ liệu
Thu thập và chọn lọc cơ sở dữ liệu được 127 chất đã đánh giá hoạt tính khángung thư bằng phương pháp khảo sát hoạt tính độc tế bào trên dòng tế bào ungthư vú MCF7 Các giá trị IC50 được chuyển thành pIC50 = -logIC50 Lập bảnghoạt tính sinh học trên Excel và vẽ cấu trúc 2D của 127 chất bằng ChemDrawtheo chuẩn ACS 1996
2.2.2.2 Tính các thông số mô tả
Nhập dữ liệu vào phần mềm MOE Tiến hành tối thiểu hóa năng lượng nhờcông cụ Energy Minimize trong MOE Lưu dữ liệu dưới dạng *.mdb gồm côngthức hoá học 3D, tên mã hóa của chất và chỉ số pIC50
Tính toán thông số mô tả phân tử bằng công cụ Calculate Descriptors trongMOE 2015.10 tính được 206 thông số mô tả phân tử 2D
2.2.2.3 Phân chia tập hợp
Tập dữ liệu được phân chia ngẫu nhiên để đảm bảo khách quan: Phân chia