MỞ ĐẦU Đề kháng đa thuốc (multidrug resistance - MDR) được nhìn nhận là một trong những vấn đề chính thách thức việc điều trị thành công bệnh ung thư cũng như bệnh nhiễm trùng ở người trong nhiều thập kỷ qua. Các tế bào khối u và các chủng vi khuẩn tự bảo vệ mình khỏi sự tấn công của các thuốc hóa trị bằng nhiều cơ chế khác nhau, trong đó sự đề kháng qua trung gian bơm ngược đóng một vai trò rất quan trọng [121], [122], [141]. Bằng cách bài xuất nhiều loại hợp chất đa dạng về cấu trúc ra khỏi tế bào, các protein màng làm cho sự tích lũy nội bào của thuốc giảm xuống thấp dưới nồng độ có tác dụng và vì vậy giúp cho các tác nhân gây bệnh giảm sự nhạy cảm với thuốc [8], [107]. Trong số các protein thuộc hệ thống bơm ngược của cả tế bào có nhân điển hình và tế bào chưa có nhân điển hình, P-glycoprotein ở động vật có vú và NorA ở vi khuẩn là hai protein được nghiên cứu nhiều nhất, liên quan đến vai trò của chúng trong việc chuyên chở thuốc ra ngoài tế bào [107]. P-glycoprotein của người (P-gp/ABCB1/MDR1) và NorA của Staphylococcus aureus tiếp tục là hai mục tiêu thuốc được chọn của đề tài nghiên cứu này bởi vì tầm quan trọng to lớn của chúng về mặt lâm sàng. Với P-gp, bơm ngược này vừa là protein không mục tiêu (antitarget/nontarget) ảnh hưởng đến dược động học và độc tính (ADMET) của nhiều thuốc khác nhau [2], vừa là protein mục tiêu bởi vì sự biểu lộ quá mức của nó đóng góp cho sự đề kháng của ung thư với hóa trị [186]. Trong khi đó, NorA được biết là đóng vai trò chính trong sự phát triển đề kháng của vi khuẩn với các kháng sinh fluoroquinolon [33]. Mặc dù có cấu trúc khác nhau, các bơm ngược của động vật có vú và vi khuẩn lại có sự tương đồng chất nền đủ lớn, với nhiều nghiên cứu đã báo cáo các chất ức chế cả P-gp và NorA như verapamil [120], reserpin [162], piperin [82], capsaicin [79], osthol, curcumin [77], … Qua nhiều thập kỷ nghiên cứu, ba thế hệ các chất ức chế phân tử nhỏ (small molecule inhibitor - SMI) của P-gp được khám phá và phát triển [136], nhưng vẫn chưa có thuốc nào sẵn có cho mục đích chẹn P-gp trên lâm sàng. Những lý do giải thích hợp lý được đưa ra, bao gồm tính tan kém, tính đặc hiệu kém, tác dụng phụ, độc tính và tương tác dược động [19], [160], [176]. Mặt khác, cũng chưa có chất ức chế bơm NorA nào được đưa vào thử nghiệm trên người [67]. Trong số các phương pháp hợp lý được đề nghị để ức chế P-gp, các thành phần từ tự nhiên nhận được nhiều sự quan tâm bởi vì tính an toàn, không gây độc [173]. Cho ví dụ, CBT-1 là một alkaloid thực vật loại bisbenzylisoquinolin được công ty CBA Pharma Inc. phát triển như một chất ức chế P-gp dùng đường uống và các kết quả lâm sàng ban đầu đầy hứa hẹn của chất này khi phối hợp với doxorubicin [126] và paclitaxel [81], [125] đã khuyến khích các nỗ lực nghiên cứu tiếp theo để tìm kiếm các chất ức chế bơm ngược mới, an toàn và hiệu quả. Cùng với alkaloid, khung flavonoid cũng được xem xét cho hoạt tính ức chế P-gp ở khối u của người [11], [52], [136], [173] và NorA ở vi khuẩn S. aureus [67], [215]. Các nghiên cứu trên nhóm cấu trúc này đã thu được các dẫn xuất chalcon có tiềm lực ức chế hai loại bơm ngược [69], [139] và góp phần định hướng cho đề tài thực hiện sàng lọc, thử nghiệm hoạt tính sinh học trên tập dữ liệu gần 100 chalcon nội bộ đã được thiết kế và tổng hợp trước đó với sự đa dạng về các nhóm thế. Các phương pháp thiết kế thuốc với sự trợ giúp của máy tính (computer-aided drug design - CADD) được xem là một lựa chọn khả thi với chi phí thấp, bao gồm thiết kế dựa vào cấu trúc (structure-based) và dựa vào phối tử (ligand-based), giúp dự đoán và làm sáng tỏ các tương tác phối tử - protein trong giai đoạn sớm của quá trình khám phá thuốc [112], [137]. Trọng tâm của đề tài là xây dựng các mô hình phân loại và dự đoán máy tính giúp giải quyết các vấn đề được nhìn nhận từ các nghiên cứu in silico đã được công bố trước đó (tham khảo Mục 4.1.1 và Mục 4.1.2), bao gồm những nghi vấn về khả năng ngoại suy (do được phát triển từ các tập dữ liệu tương đối nhỏ, không đảm bảo tính đa dạng, đồng nhất) và những hạn chế của các mô hình học máy đơn lẻ được báo cáo trong các nghiên cứu này. Ngoài các điều kiện đánh giá thông kê chặt chẽ, khả năng ứng dụng của các công cụ máy tính thu được còn được kiểm chứng bằng các thử nghiệm in vitro trên chủng vi khuẩn chuẩn biểu lộ quá mức bơm ngược cũng như trên các chủng đề kháng phân lập từ lâm sàng. Đồng thời qua đó, các ứng viên ức chế bơm ngược tiềm năng được khám phá.
BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ Y TẾ ĐẠI HỌC Y DƯỢC THÀ NH PHỐ HỒ CHÍ MINH NGÔ TRIỀU DỦ XÂY DỰNG MƠ HÌNH PHÂN LOẠI VÀ DỰ ĐOÁN CÁC CHẤT ỨC CHẾ BƠM NGƯỢC P-GLYCOPROTEIN, NORA VÀ ỨNG DỤNG TRONG VIỆC SÀNG LỌC CÁC CHALCON CÓ KHẢ NĂNG ỨC CHẾ BƠM NORA CỦA STAPHYLOCOCCUS AUREUS ĐA ĐỀ KHÁNG THUỐC LUẬN ÁN TIẾN SĨ DƯỢC HỌC TP HỒ CHÍ MINH, NĂM 2019 MỤC LỤC Trang Danh mục chữ viết tắt, thuật ngữ i Danh mục bảng ii Danh mục hình, đồ thị iv MỞ ĐẦU CHƯƠNG TỔNG QUAN 1.1 Tổng quan bơm ngược nghiên cứu 1.2 Các chất ức chế bơm ngược đề kháng đa thuốc 1.3 Đề kháng kháng sinh 12 1.4 Các nghiên cứu trước có liên quan 14 1.5 Các thuật toán học máy Clementine 12.0 14 1.6 Các cơng cụ máy tính khác 15 1.7 Thử nghiệm tác dụng ức chế bơm ngược chủng vi khuẩn đề kháng 18 CHƯƠNG ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU 22 2.1 Đối tượng nghiên cứu 22 2.2 Phương pháp nghiên cứu in silico 26 2.3 Phương pháp nghiên cứu in vitro 37 CHƯƠNG KẾT QUẢ 46 3.1 Các mơ hình máy tính dựa phối tử 46 3.2 Các mơ hình máy tính dựa cấu trúc (mơ hình tương đồng P-gp) 70 3.3 Sàng lọc in silico P-gp 73 3.4 Sàng lọc in silico thử nghiệm in vitro đánh giá tác dụng ức chế bơm ngược NorA S aureus số chalcon nội 88 CHƯƠNG BÀN LUẬN 99 4.1 Các mơ hình máy tính dựa phối tử 99 4.2 Mơ hình tương đồng P-gp 110 4.3 Sàng lọc in silico 111 4.4 Thử nghiệm in vitro 112 KẾT LUẬN VÀ KIẾN NGHỊ 115 DANH MỤC CÁC CƠNG TRÌNH ĐÃ CƠNG BỐ CĨ LIÊN QUAN TÀI LIỆU THAM KHẢO PHỤ LỤC i DANH MỤC CÁC CHỮ VIẾT TẮT, THUẬT NGỮ Chữ viết tắt ABC ADMET Ci EPI GA-PLS Chữ viết đầy đủ ATP Binding Cassette Absorption, Distribution, Metabolism, Excretion and Toxicity Ciprofloxacin Efflux Pump Inhibitor Efflux Pump Inhibition Genetic Algorithm-Partial Least Square in silico MDR MFS MIC MRSA Multidrug Resistance Major Facilitator Superfamily Minimum Inhibitory Concentration Methicillin-Resistant Staphylococcus aureus NorA QZ59-RRR RF Phenyl-arginin-betanaphthylamid P-glycoprotein Quantitative Structure-Activity Relationship Cyclic-tris-(R)-valineselenazol Reversal Fold RMSD Root Mean Square Deviation SAR SMI S aureus 2D 3D Structure-Activity Relationship Small Molecule Inhibitor Staphylococcus aureus Two-Dimension Three-Dimension PaβN P-gp QSAR Nghĩa tiếng Việt/Định nghĩa Họ protein chuyên chở phụ thuộc ATP Hấp thu, phân bố, chuyển hóa, thải trừ độc tính Chất ức chế bơm ngược Sự ức chế bơm ngược Bình phương tối thiểu-thuật tốn di truyền Thực máy tính thơng qua mơ máy tính Đề kháng đa thuốc Liên họ trợ giúp Nồng độ ức chế tối thiểu Staphylococcus aureus đề kháng methicillin Bơm ngược MFS Staphylococcus aureus Mối quan hệ định lượng cấu trúc - tác dụng Số lần đảo ngược Căn bậc hai độ lệch bình phương trung bình Mối quan hệ cấu trúc - tác dụng Chất ức chế phân tử nhỏ Hai chiều Ba chiều ii DANH MỤC CÁC BẢNG Trang Bảng 3.1 Kết dự đoán tập huấn luyện tập đánh giá nội với phân chia đa dạng 48 Bảng 3.2 Kết dự đoán tập huấn luyện tập đánh giá nội với phân chia ngẫu nhiên 49 Bảng 3.3 Kết đánh giá chéo 10 lần y ngẫu nhiên tập huấn luyện đa dạng 52 Bảng 3.4 Kết dự đoán tập đánh giá ngoại mơ hình tạo từ tập huấn luyện đa dạng 53 Bảng 3.5 Sáu mô hình đơn lẻ tạo với giá trị R2 chúng tập huấn luyện tập đánh giá nội, theo hai kiểu phân chia liệu đa dạng ngẫu nhiên 55 Bảng 3.6 Kết đánh giá nội mô hình dự đốn tạo từ tập huấn luyện đa dạng 57 Bảng 3.7 Kết đánh giá mơ hình dự đốn tập đánh giá nội 57 Bảng 3.8 Kết đánh giá truyền thống mơ hình dự đốn tập đánh giá ngoại 58 Bảng 3.9 Kết đánh giá mơ hình dự đoán tập đánh giá ngoại, sử dụng điều kiện dựa MAE áp dụng cho 95 % liệu 59 Bảng 3.10 Các giá trị thống kê trình chia tỷ lệ, sử dụng kỹ thuật đo lường đa hướng (MDS ALSCAL) 62 Bảng 3.11 Giá trị phương sai hướng, dấu vân tay lớp hoạt tính trình giảm hướng, sử dụng kỹ thuật phân tích tương hợp (CA) 62 iii Bảng 3.12 Ba giả thuyết pharmacophore tốt cho chất ức chế P-gp mạnh chất ức chế chọn lọc NorA với giá trị thống kê chúng 65 Bảng 3.13 Bốn mơ hình tương đồng tốt P-gp dự đốn I-TASSER với thơng tin đĩa thơng số ước tính 70 Bảng 3.14 Tóm tắt kết sàng lọc in silico 95 chalcon nội 75 Bảng 3.15 Tóm tắt kết sàng lọc in silico 47 chất từ Ngân hàng Thuốc với giá trị pIC50 P-gp dự đốn mơ hình kết hợp ≥ 80 Bảng 3.16 Kết dự đốn hoạt tính ức chế NorA mơ hình D docking vào mơ hình tương đồng protein chalcon “hit” 90 Bảng 3.17 Giá trị MIC (μg/mL) ciprofloxacin chủng S aureus SA-1199 SA-1199B vắng mặt có mặt chalcon nghiên cứu 92 Bảng 3.18 Giá trị MIC (μg/mL) ciprofloxacin chủng S aureus lâm sàng vắng mặt có mặt chất ức chế bơm PaβN 93 Bảng 3.19 Giá trị MIC (μg/mL) ciprofloxacin (Ci) chủng S aureus lâm sàng vắng mặt có mặt chalcon nghiên cứu 98 Bảng 4.1 Tóm tắt mơ hình phân loại chất ức chế chất không ức chế P-gp công bố nghiên cứu trước nghiên cứu 99 Bảng 4.2 Tóm tắt mơ hình QSAR hai chiều dự đốn hoạt tính ức chế P-gp (biến liên tục) công bố nghiên cứu trước nghiên cứu 104 iv DANH MỤC CÁC HÌNH, ĐỒ THỊ Trang Hình 1.1 Cấu trúc P-gp chuột: (A) mặt trước (B) mặt sau Các domain xuyên màng domain gắn kết nucleotid đánh dấu từ TM 1-12 NBD 1-2 Nửa N tận nửa C tận tô màu vàng xanh Các TM 4-5 TM 10-11 tạo thành giao diện xoắn vào giúp ổn định hình thể hưởng vào Các ngang đại diện cho vị trí xấp xỉ lớp lipid kép “Nguồn: Aller S G., Yu J., Ward A., et al., 2009” [4] Hình 1.2 Giản đồ cấu trúc họ protein bơm ngược đề kháng đa thuốc MFS tạo phần mềm UCSF Chimera 1.10 từ lactose permease E coli (LacY) “Nguồn: Schindler B D., Kaatz G W., 2016” [161] Hình 2.1 Quy trình nghiên cứu đề tài 22 Hình 2.2 Bố trí thử nghiệm in vitro xác định MIC ciprofloxacin (Ci) chủng S aureus SA-1199 SA-1199B vắng mặt có mặt chất thử nghiệm X nồng độ khác (A, B μg/mL), qua đánh giá khả ức chế bơm ngược NorA SA chất thử nghiệm Trong hàng ngang đĩa, tất giếng chứa kháng sinh (trừ giếng số 11) cho lượng loại vi khuẩn giếng kiểm sốt C (chứa vi khuẩn khơng có kháng sinh) 43 Hình 2.3 Bố trí thử nghiệm in vitro xác định MIC ciprofloxacin (Ci) chủng S aureus phân lập từ lâm sàng vắng mặt có mặt chất ức chế bơm biết PaβN nồng độ C = 20 μg/mL, qua chọn lọc chủng SA lâm sàng có biểu lộ mức bơm ngược Trong hàng ngang đĩa, tất giếng chứa kháng sinh (trừ giếng số 11) cho lượng loại vi khuẩn giếng kiểm soát C (chứa vi khuẩn khơng có kháng sinh) 44 v Hình 2.4 Bố trí thử nghiệm in vitro xác định MIC ciprofloxacin (Ci) chủng S aureus phân lập từ lâm sàng có biểu lộ mức bơm ngược, vắng mặt có mặt chất thử nghiệm X1, X2, …, Xn nồng độ C = 20 μg/mL, qua đánh giá khả ức chế bơm ngược SA lâm sàng chất thử nghiệm Trong hàng ngang đĩa, tất giếng chứa kháng sinh (trừ giếng số 11) cho lượng loại vi khuẩn giếng kiểm sốt C (chứa vi khuẩn khơng có kháng sinh) 45 Hình 3.1 Đồ thị phân tán mơ hình kết hợp tập liệu: (A) Trên tập huấn luyện tập đánh giá nội; (B) Trên tập đánh giá ngoại 60 Hình 3.2 Bản đồ nhận thức đo lường đa hướng (MDS) lớp hoạt tính thơng số mơ tả P: Chất ức chế P-gp; A: Chất ức chế NorA; D: Chất ức chế P-gp NorA; N: Chất không ức chế P-gp NorA; dia: diameter; BP2: BCUT_PEOE_2; GP2: GCUT_PEOE_2; bJ: balabanJ; QVF: Q_VSA_FNEG; A2m: ATSC2m; A4m: ATSC4m; A1s: ATSC1s; AA6v: AATSC6v; AA4s: AATSC4s; M4s: MATS4s; SpM: SpMAD_DzZ; ASP3: ASP-3; AVP6: AVP-6; nHCs: nHCsatu; minHCs: minHCsatu; EBPnsd: ETA_BetaP_ns_d; MDEO22: MDEO-22 63 Hình 3.3 Bản đồ nhận thức phân tích tương hợp (CA) lớp hoạt tính dấu vân tay P: Chất ức chế P-gp; A: Chất ức chế NorA; D: Chất ức chế P-gp NorA; N: Chất không ức chế P-gp NorA; MFP128: MACCSFP128; MFP144: MACCSFP144; PFP2: PubchemFP2 64 Hình 3.4 Mơ hình pharmacophore chất ức chế P-gp mạnh (F1, F2, F3: Nhóm kỵ nước; F4: Nhóm nhận liên kết hydro; V: Giới hạn thể tích): (A) Các khoảng cách góc; (B) Với diện chất có hoạt tính (aripiprazol, ebastin, tariquidar elacridar) 67 vi Hình 3.5 Mơ hình pharmacophore chất ức chế NorA khơng ức chế P-gp (F1, F2: Yếu tố vòng thơm/vòng Pi; F3: Nhóm kỵ nước; F4: Nhóm cho liên kết hydro; V: Giới hạn thể tích): (A) Các khoảng cách góc; (B) Với diện chất có hoạt tính (20, 21, 30) 69 Hình 3.6 Đồ thị Ramachandran mơ hình tương đồng P-gp tốt nhất, vùng ưa thích (the most favoured regions), vùng cho phép thêm (the additional allowed regions), vùng cho phép rộng rãi (the generously allowed regions) vùng không cho phép (the disallowed regions) ký hiệu [A,B,L]; [a,b,l,p]; [~a,~b,~l,~p] [XX] Khu vực màu đậm tượng trưng cho kết hợp phi-psi ưa thích 72 Hình 3.7 Mơ hình tương đồng tốt P-gp với vị trí gắn kết phối tử QZ59-RRR (cyclic-tris-(R)-valineselenazol) dự đốn I-TASSER 72 Hình 3.8 Đồ thị phân tán tập liệu liên quan cho mục đích sàng lọc in silico chất ức chế chất không ức chế P-gp, dựa 02 thành phần 74 Hình 3.9 Đồ thị phân tán tập liệu liên quan cho mục đích dự đốn in silico hoạt tính ức chế P-gp, dựa 02 thành phần 79 Hình 3.10 Năm chalcon thỏa pharmacophore chất ức chế P-gp mạnh (F1, F2, F3: Nhóm kỵ nước; F4: Nhóm nhận liên kết hydro; V: Giới hạn thể tích): F58 (tím); F59 (cam); F89 (vàng); F90 (đỏ); F91 (xanh dương) 83 Hình 3.11 Bốn chalcon thỏa pharmacophore chất ức chế NorA mà không ức chế Pgp (F1, F2: Yếu tố vòng thơm/vòng Pi; F3: Nhóm kỵ nước; F4: Nhóm cho liên kết hydro; V: Giới hạn thể tích): F88 (xanh lá); F89 (vàng); F90 (đỏ); F91 (xanh dương) 84 Hình 3.12 Hình ảnh docking vào mơ hình tương đồng P-gp ba chalcon ba hợp chất Ngân hàng Thuốc có điểm số docking tốt nhất, với ba chất ức chế P-gp biết reserpin, tariquidar elacridar 87 vii Hình 3.13 Mơ hình tương đồng tốt NorA với 02 vị trí gắn kết phối tử dự đoán: (A) Khoang trung tâm; (B) Walker B 89 Hình 3.14 Hình ảnh docking vào mơ hình tương đồng NorA bốn chalcon “hit”: (A) Vào khoang trung tâm; (B) Vào Walker B 91 Mơ hình hồi quy logistic Phương trình cho “0” + 0,00000000000000000000 Phương trình cho “1” 115,7*AATSC7c - 5,207*ETA_Shape_X + 6,81*JGI6 + 32,75*JGI7 4,006*MACCSFP30 + 1,62*MATS1s - 6,913*PEOE_VSA_FPPOS 16,33*PubchemFP122 - 17,24*PubchemFP534 - 4,213*PubchemFP741 2,503*PubchemFP749 - 18,07*PubchemFP772 + 0,9461*SpMax3_Bhv + 5,928*SpMin2_Bhe + 2,32*SpMin5_Bhi + 1,423*SpMin8_Bhe + 18,64*SubFP157 - 2,177*SubFP41 - 17,88*SubFP48 - 19,4*SubFP62 - 2,539*SubFP84 + 2,614*VE1_D - 19,3*n8HeteroRing - 1,337*nF8HeteroRing - 17,69 Mơ hình CHAID Mơ hình C&R Tree Mơ hình mạng Bayesian Mơ hình QUEST Mơ hình mặt nghiêng định STT Phân đoạn Tất phân đoạn bao gồm phần lại SpMin2_Bhe, SpMin5_Bhi SpMin2_Bhe > 1,89 SpMin5_Bhi > 1,41 SpMin5_Bhi ≤ 1,48 PEOE_VSA_FPPOS, SpMax3_Bhv PEOE_VSA_FPPOS > 0,02 PEOE_VSA_FPPOS ≤ 0,03 SpMax3_Bhv > 3,7 SpMin5_Bhi SpMin5_Bhi > 1,41 SpMin5_Bhi ≤ 1,48 SpMax3_Bhv SpMax3_Bhv > 3,78 SpMin2_Bhe, AATSC7c SpMin2_Bhe > 1,85 AATSC7c > AATSC7c ≤ Phần lại Điểm Độ phủ (n) 1690 Tần số 952 Xác suất 56,33 % 59 59 100 % 57 56 98,25 % 99 84 84,85 % 86 71 82,56 % 61 56 91,80 % 1328 626 47,14 % PHỤ LỤC Tập hợp 34 thuộc tính đóng vai trò biến độc lập mơ hình dự đốn hoạt tính ức chế P-gp Mã thuộc tính Loại diameter GCUT_PEOE_3 a_nCl Thơng số PEOE_RPC+ mơ tả PEOE_VSA_FHYD MOE 2D PEOE_VSA_FPNEG PEOE_VSA_FPPOS AATSC6p MATS8e MATS8s GATS2c VE2_DzZ VE1_Dzi VE1_Dzs VE2_Dzs SpMax2_Bhm SpMin6_Bhm SpMin7_Bhm SpMax2_Bhv SpMin7_Bhv SpMin2_Bhe SpMin3_Bhe SpMax2_Bhi SpMax3_Bhi minHBint6 minHother maxaaCH LipoaffinityIndex IC4 Thông số mô tả PaDEL 2D Mô tả Độ lệch tâm đỉnh lớn biểu đồ PEOE tích điện GCUT (3/3) Số nguyên tử clor Điện tích phần dương tương đối Diện tích bề mặt vdw kỵ nước, theo phần Diện tích bề mặt vdw âm, có cực, theo phần Diện tích bề mặt vdw dương, có cực, theo phần Tự tương quan Broto-Moreau trung tâm trung bình - lag 6/được trọng số hóa khả phân cực Tự tương quan Moran - lag 8/được trọng số hóa điện âm Sanderson Tự tương quan Moran - lag 8/được trọng số hóa trạng thái I Tự tương quan Geary - lag 2/được trọng số hóa điện tích Tổng hệ số trung bình vector eigen sau từ ma trận Barysz/được trọng số hóa số nguyên tử Tổng hệ số vector eigen sau từ ma trận Barysz/được trọng số hóa khả ion hóa Tổng hệ số vector eigen sau từ ma trận Barysz/được trọng số hóa trạng thái I Tổng hệ số trung bình vector eigen sau từ ma trận Barysz/được trọng số hóa trạng thái I Giá trị eigen tuyệt đối lớn ma trận biến đổi Burden - n 2/được trọng số hóa số khối tương đối Giá trị eigen tuyệt đối nhỏ ma trận biến đổi Burden - n 6/được trọng số hóa số khối tương đối Giá trị eigen tuyệt đối nhỏ ma trận biến đổi Burden - n 7/được trọng số hóa số khối tương đối Giá trị eigen tuyệt đối lớn ma trận biến đổi Burden - n 2/được trọng số hóa thể tích van der Waals tương đối Giá trị eigen tuyệt đối nhỏ ma trận biến đổi Burden - n 7/được trọng số hóa thể tích van der Waals tương đối Giá trị eigen tuyệt đối nhỏ ma trận biến đổi Burden - n 2/được trọng số hóa điện âm Sanderson tương đối Giá trị eigen tuyệt đối nhỏ ma trận biến đổi Burden - n 3/được trọng số hóa điện âm Sanderson tương đối Giá trị eigen tuyệt đối lớn ma trận biến đổi Burden - n 2/được trọng số hóa khả ion hóa tương đối Giá trị eigen tuyệt đối lớn ma trận biến đổi Burden - n 3/được trọng số hóa khả ion hóa tương đối Các thơng số mơ tả trạng thái E tối thiểu độ mạnh cho liên kết hydro tiềm độ dài đường Trạng thái E loại nguyên tử H tối thiểu: H aaCH, dCH2 dsCH Trạng thái E loại nguyên tử tối đa: :CH: Chỉ số lực thân dầu Chỉ số nội dung thông tin (đối xứng lân cận thứ tự 4) Mã thuộc tính nAtomLAC MLFER_BH n5HeteroRing GGI9 VE1_D Loại Thông số mô tả PaDEL 2D Mô tả Số nguyên tử chuỗi béo dài Tính kiềm liên kết hydro hòa tan tổng thể tổng cộng Số vòng chứa dị tố (N, O, P, S, halogen) Chỉ số tích điện topo thứ tự Tổng hệ số vector eigen sau từ ma trận khoảng cách topo PHỤ LỤC Các mơ hình dự đốn tạo từ tập huấn luyện đa dạng (Mơ hình mạng nơron SVM: Tham khảo thơng số Mục 2.2.4) Mơ hình CHAID Mơ hình C&R Tree Mơ hình hồi quy pIC50 = 0,06205*diameter + 0,4806*GCUT_PEOE_3 + 0,1267*a_nCl + 1,69*PEOE_RPC+ + 8,605*PEOE_VSA_FHYD + 8,454*PEOE_VSA_FPPOS + 1,108*AATSC6p + 0,5715*MATS8e + 0,1708*MATS8s + 0,8089*GATS2c + 21,67*VE2_DzZ - 1,046*VE1_Dzi - 1,139*VE1_Dzs + 28,5*VE2_Dzs + 1,91*SpMax2_Bhm + 0,9249*SpMin6_Bhm + 1,739*SpMin7_Bhm 0,4505*SpMax2_Bhv - 1,427*SpMin7_Bhv + 0,7218*SpMin2_Bhe 0,01277*SpMin3_Bhe - 0,622*SpMax2_Bhi + 2,18*SpMax3_Bhi 0,1878*minHBint6 - 0,8197*minHother + 0,08064*maxaaCH 0,113*LipoaffinityIndex + 0,3266*IC4 + 0,1595*nAtomLAC 0,1851*MLFER_BH - 0,284*n5HeteroRing + 2,085*GGI9 + 0,1197*VE1_D 20,78 PHỤ LỤC Tập hợp 21 thuộc tính đóng vai trò biến đồ nhận thức Mã thuộc tính Loại diameter (dia) BCUT_PEOE_2 (BP2) Thơng số GCUT_PEOE_2 mô tả (GP2) MOE 2D balabanJ (bJ) Q_VSA_FNEG (QVF) ATSC2m (A2m) ATSC4m (A4m) ATSC1s (A1s) AATSC6v (AA6v) AATSC4s (AA4s) MATS4s (M4s) SpMAD_DzZ (SpM) Thông số mô tả PaDEL 2D ASP-3 (ASP3) AVP-6 (AVP6) nHCsatu (nHCs) minHCsatu (minHCs) ETA_BetaP_ns_d (EBPnsd) MDEO-22 (MDEO22) Mô tả Độ lệch tâm đỉnh lớn biểu đồ PEOE tích điện BCUT (2/3) PEOE tích điện GCUT (2/3) Khả kết nối tổng khoảng cách trung bình Balaban Diện tích bề mặt vdw âm, theo phần Tự tương quan Broto-Moreau trung tâm - lag 2/được trọng số hóa số khối Tự tương quan Broto-Moreau trung tâm - lag 4/được trọng số hóa số khối Tự tương quan Broto-Moreau trung tâm - lag 1/được trọng số hóa trạng thái I Tự tương quan Broto-Moreau trung tâm trung bình - lag 6/được trọng số hóa thể tích van der Waals Tự tương quan Broto-Moreau trung tâm trung bình - lag 4/được trọng số hóa trạng thái I Tự tương quan Moran - lag 4/được trọng số hóa trạng thái I Độ lệch phổ tuyệt đối trung bình từ ma trận Barysz/được trọng số hóa số nguyên tử Đường dẫn đơn giản trung bình, thứ tự Đường dẫn hóa trị trung bình, thứ tự Tính trạng thái E loại ngun tử H: H C sp3 gắn với C chưa bão hòa Trạng thái E loại nguyên tử H tối thiểu: H C sp3 gắn với C chưa bão hòa Đo electron đơn lẻ vào cộng hưởng liên quan đến kích thước phân tử Ngưỡng khoảng cách phân tử tất nguyên tử oxy thứ yếu ACH2AAACH2A* (các nhóm CH2 phân cách liên kết) Anot%A%Anot%A* (các nguyên tử phân cách (!:):(!:)) MACCSFP128 (MFP128) MACCSFP144 (MFP144) Chuỗi MACCS PubchemFP2 (PFP2) Dấu vân tay >= 16 H Pubchem *A: Bất kỳ ký hiệu nguyên tố bảng tuần hoàn hợp lệ PHỤ LỤC Giá trị trung bình 18 thơng số mơ tả tính cho lớp hoạt tính xây dựng đồ MDS diameter BCUT_PEOE_2 GCUT_PEOE_2 balabanJ Q_VSA_FNEG ATSC2m ATSC4m ATSC1s AATSC6v AATSC4s MATS4s SpMAD_DzZ ASP-3 AVP-6 nHCsatu minHCsatu ETA_BetaP_ns_d MDEO-22 P 0,21 0,48 0,44 0,51 0,49 0,57 0,58 0,65 0,27 0,52 0,57 0,18 0,41 0,39 0,37 0,38 0,34 0,18 A 0,38 0,78 0,68 0,35 0,77 0,51 0,51 0,54 0,32 0,39 0,38 0,29 0,52 0,50 0,00 0,00 0,20 0,00 D 0,50 0,51 0,48 0,32 0,45 0,38 0,39 0,81 0,47 0,37 0,35 0,56 0,58 0,59 0,21 0,40 0,36 0,14 N 0,35 0,77 0,71 0,39 0,68 0,30 0,54 0,59 0,51 0,37 0,40 0,28 0,57 0,39 0,00 0,00 0,23 0,00 PHỤ LỤC Tần số dấu vân tay tính cho lớp hoạt tính xây dựng đồ CA MACCSFP128 MACCSFP144 PubchemFP2 P 16 13 A 1 D 16 17 19 N PHỤ LỤC Các thông số đặc trưng 02 chalcon “lead” F88 F90 Các thông số đặc trưng F88 Tên IUPAC: (E)-3-(2-Chlorophenyl)-1-(10H-phenothiazin-2-yl)prop-2-en-1-on Hiệu suất: 57 % Nhiệt độ nóng chảy: 202 - 203 oC EIMS m/z: 386,0331 [M + Na]+ UV (λmax nm, MeOH): 204, 248, 309, 449 IR (KBr) cm-1: 3354, 1654, 1590, 754 H-NMR (DMSO) δ ppm: 8,79 (s, 1H, NH); 8,16 (d, J3”- 4” = 7,5 Hz, 1H, H3”); 8,00 (d, J3-2 = 15,5 Hz, 1H, H3); 7,84 (d, J2-3 = 15,5 Hz, 1H, H2); 7,64 (d, J3’-4’ = Hz, 1H, H3’); 7,57 (d, J6”-5” = 7,5 Hz, 1H, H6”); 7,46 (m, 2H, H4”, H5”); 7,30 (s, 1H, H1’); 7,09 (d, J4’-3’ = Hz, 1H, H4’); 7,01 (m, 1H, H8’); 6,92 (d, J6’-7’ = 7,5 Hz, 1H, H6’); 6,66 (m, 1H, H7’); 6,66 (d, J9’-8’ = Hz, 1H, H9’) 13 C-NMR (DMSO) δ ppm: 187,7 (C1=O); 142,1 (C3); 141,0 (C13’); 138,2 (C11’); 136,5 (C2’); 134,2 (C2”); 132,2 (C1”); 131,9 (C3”); 130 (C4”); 128,4 (C8’); 127,9 (C6”); 127,6 (C5’); 126,2 (C5”); 126,1 (C4’); 124,5 (C7’); 124,4 (C2); 122,7 (C3’); 115,1 (C12’); 114,5 (C14’); 112,8 (C9’) Các thông số đặc trưng F90 Tên IUPAC: (E)-3-(2,4-Dimethoxyphenyl)-1-(10H-phenothiazin-2-yl)prop-2-en-1on Hiệu suất: 49 % Nhiệt độ nóng chảy: 178 - 179 oC EIMS m/z: 388,1154 [M - H]- UV (λmax nm, MeOH): 204, 248, 304, 365 IR (KBr) cm-1: 3310, 1643, 1570, 1272, 1150 H-NMR (DMSO) δ ppm: 8,76 (s, 1H, NH); 7,95 (d, J3-2 = 15,5 Hz, 1H, H3); 7,86 (d, J6”-5” = 8,5 Hz, 1H, H6”); 7,61 (d, J2-3 = 15,5 Hz, 1H, H2); 7,52 (dd, J3’-4’ = Hz, J3’-1’ = 1,5 Hz, 1H, H3’); 7,28 (d, J1’-3’ = 1,5 Hz, 1H, H1’); 7,06 (d, J4’-3’ = Hz, 1H, H4’); 7,01 (m, 1H, H8’); 6,92 (d, J6’-7’ = Hz, 1H, H6’); 6,80 (m, 1H, H7’); 6,64 (m, 3H, H9’, H3”, H5”); 3,90 (s, 3H, 2”-OMe); 3,84 (s, 3H, 4’-OMe) 13 C-NMR (DMSO) δ ppm: 187,9 (C1=O); 163,1 (C4”); 160 (C2”); 142,1 (C13’); 141,2 (C11’); 138,6 (C3); 137,3 (C2’); 130,1 (C6”); 127,9 (C8’); 126,2 (C6’); 126,1 (C4’); 123,0 (C7’); 122,1 (C2); 122,0 (C3’); 118,9 (C1”); 115,9 (C1’); 115,2 (C12’); 114,5 (C14’); 112,9 (C9’); 106,3 (C5”); 98,3 (C3”); 55,8 (2’-MeO); 55,5 (4’-CH3O) ... án, tồn chất ức chế chung P-gp NorA gợi ý cho đề tài thực đánh giá tác dụng ức chế bơm ngược chủng vi khuẩn đề kháng để thay Nguyên tắc thử nghiệm sử dụng nghiên cứu chất có khả ức chế bơm ngược, ... hình máy tính dựa phối tử, bao gồm: • Các mơ hình học máy đơn lẻ kết hợp giúp phân loại tốt chất ức chế, chất không ức chế P-gp; dự đốn tốt hoạt tính ức chế bơm ngược (IC50) • Các đồ nhận thức... ngoại 60 Hình 3.2 Bản đồ nhận thức đo lường đa hướng (MDS) lớp hoạt tính thơng số mô tả P: Chất ức chế P-gp; A: Chất ức chế NorA; D: Chất ức chế P-gp NorA; N: Chất không ức chế P-gp NorA; dia: