_ - I » BÀI NGHIÊN cứu ’ ^ Xây dựng mô hình toán học nhằm phát hợp chất ức chế tyrosinase từ cấu trúc phân tử Lê Thị Thu Hường', Phạm Thê' HảP, Bùi Thanh Tùng', Nguyễn Thanh Hải' ' Khoa Y Dược, Đại học Quốc Gia Hà Nội; ^ Trường Đại học Dược Hà Nội SUMMARY In this study, QSAR models are successfully developed and validated for the identification of potential TIs from molecular structures A database of 701 TIs and 728 non-Tls and 2D TOMOCOMD-CARDD molecular descriptors are used The Cluster Analysis and the Linear Discriminant Analysis are employed to obtain models OECD principles are used to validate the QSAR models The global accuracy of individual models in the training set and test set are superior than 85.2% 83.1 % respectively Taking into account the OECD principles, model quality has been demonstrated, suggesting the suitability of applied methodology The models developed in particular ƠS well as current research methods in general could be used for saving time and money in early screening phase to identify new leơd-like compounds amenable for developing ơntidepỊgmentant product Từ khóa: hợp chất ức chế tyrsosinase, mô hình QSAR, nguyên tốc OECD Đặt vấn đề Màu da người định nhiểu yếu tố khác nhau, yếu tố sản xuất phân bố da sắc tố melanin Melanin sản xuất tế bào melanocyte lớp biểu bì, tác dụng enzym tyrosinase Vi thế, hợp chất ức chế tyrosinase (UT) sử dụng làm thuốc điều trị bệnh tăng sắc tố da nám da, sạm da, tàn nhang, đồi mồi, đốm nâu sản phẩm mỹ phẩm làm trắng da Việc tìm kiếm hợp chất UT thu hút mối quan tâm ngành công nghiệp dược mỹ phẩm Để tiết kiệm thời gian công sức, việc phát triển nghiên cứu vể mối quan hệ định lượng cấu trúc hoạt tính hợp chất {Quantitive Structure Actitity Relationship - QSAR) có nhiểu ưu Các mô hình QSAR sử dụng công cụ để dự đoán hoạt tính chất dựa vào thông tin cấu trúc phân tử Ngoài ra, chúng sử dụng để xác định đặc điểm cấu trúc quan trọng cho hoạt tính Trong nghiên cứu này, dựa mối quan hệ cấu trúc hoạt tính UT, mô hình toán học QSAR xây dựng nhằm sàng lọc phát hợp chất UT tiểm Nguyên liệu phương pháp nghiên cứu Nguyên liệu C sở liệu (CSDL) gồm: Tập A [701 phân tử chứng minh tác dụng ức chế tyrosinase Nghỉên cứu dưỢữlhông tin t h u õ c ! Số 1/2015 (active)] tập B [728 thuốc với tác dụng dược lý khác chưa chứng minh khả ức chế tyrosinase (inactive)] Các hợp chất ƯT lựa chọn từ 153 báo khoa học đăng tạp chí quốc tế Các báo tìm kiếm theo nhà xuất bản, theo Pubmed sở liệu Scopus Quá trình tìm kiếm sử dụng từ khóa "tyrosinase inhibitor(s)" (hợp chất ƯT) Kết công bố từ năm 1974 đến có chứa cụm từ "tyrosinase inhibitor'’trong tên (title), từ khóa {keywords) tóm tắt {abstract) Các công bố báo đăng tạp chí quốc tế, hay kỷ yếu hội nghị khoa học Các hợp chất inactive thu thập từ sách Negwer Handbook [1] Phương pháp nghiên cửu Phương pháp xây dựng mô hình QSAR Mô hình QSAR mô hình biểu diễn mối liên hệ định lượng cấu trúc tác dụng sinh học chất Để xây dựng mô hình cấu trúc tác dụng sinh học đểu phải định lượng hóa Mô hình QSAR có dạng: Y-a,{x,) + a(x)+ +a„'(xJ Trong đó, Y biến đáp ứng (mang giá trị: +1 hợp chất có tác dụng ức chê' tyrosinase -1 hợp chất tác dụng ức chế tyrosinase); X,,XJ,X tham số phân tử đặc trưng cho cấu trúc; a,, a số thể trọng số tham số phân tửx tác dụng sinh học Tính toán tham số phân tử đặc trưng cho cấu trúc (tham số cấu trúc): Tham số cấu trúc số thu từ trình toán học logic chuyển đổi thông tin mã hóa cấu trúc hóa học [2] Trong nghiên cứu này, tham số tính toán sử dụng phẩn mểm TOMOCOMD-CARDD [3] Các tham số tính toán dựa cấu trúc 2D phân tử Các nguyên tử, đặc trưng tính chất nguyên tử [khối lượng nguyên tử (M), độ phân cực (P), thể tích Van der Waals (V), độ âm điện Mulliken (K)] Các số bậc hai [qk{y), qkL(v), qkH(\/), qkLH (1^)] [4], tuyến tính [fk(v), fkL(v), fkH(v), fkiH M] [5] song tuyến tính [bk{vn,zm), bkL(vn,zm), bkH{vn,zm), bkLH(vn,zm)] [6] tính toán Thiết kế tập huấn luyện tập kiểm trơ: CSDL ban đẩu phân chia thành tập huấn luyện (để xây dựng mô hình) tập kiểm tra (để đánh giá khả ngoại suy mô hình) kỹ thuật phân tích cụm chương trình STATISTICA 9.0 Phương pháp chia tập A tập B thành 15 cụm Từ cụm trên, lấy 75% hợp chất để xây dựng tập huấn luyện 25% hợp chất để xây dựng tập kiểm tra Phát triển mô hình QSAR- Kỹ thuật phân tích khác biệt tuyến tính (viết tắt theo tiếng Anh: LDA) chương trình STATISTICA 9.0 [7] sử dụng để xây dựng mô hình chọn nhóm phân tử có tác dụng ức chế enzym tyrosinase Các tham số mô tả phân tử lựa chọn theo phương pháp "tập hợp tốt nhất" (best subset) Các mô hình lựa chọn theo nguyên lý parsimony ‘‘Occam's Razor" (đơn giản tốt) dựa vào thông số thống kê là: độ xác hay tỉ lệ phần trăm chẩn đoán xác (Accuracy, Q), độ nhạy (Sentivity, Sè), độ đặc hiệu {Specificity, Sp) tỉ lệ dương tính giả (False Positive Rate, Trong đó, Độ nhạy= số dương tính thật/(số dương tính thật + số âm tính giả) Độ đặc hiệu = số âm tính thật / (số âm tính thật + số dương tính giả) Các hợp chất phân loại theo kết xác suất hậu nghiệm (posteriorprobability).ĩror\g trường hợp này, hiệu xác suất hậu nghiệm tính toán theo phương trình: AP% = [P (có hoạt tính) - p (không hoạt tính)] X 100 Trong đó: p (có hoạt tính) xác suất mà mô hình phân loại hợp chất có hoạt tính ức chế tyrosinse, p (không hoạt tính) xác suất mà mô hình phân loại hợp chất hoạt tính Như vậy, hợp chất AP% >0, dự đoán có hoạt tính AP% ... chí3 (miên cấu trúc xác định) Miền cấu trúc khoảng không gian cấu trúc bao gổm mô hình Chỉ dự đoán hợp chất có cấu trúc nằm miền cấu trúc đáng tin cậy Còn dự đoán cấu trúc nằm miển cấu trúc trình... kế hợp chất nhằm cải thiện khả ức chế (hoạt tính sinh học) Kết luận Trong nghiên cứu này, mô hình toán học xây dựng thành công để biểu diễn mối quan hệ định lượng cấu trúc tác dụng ức chế tyrosinase. .. [7] sử dụng để xây dựng mô hình chọn nhóm phân tử có tác dụng ức chế enzym tyrosinase Các tham số mô tả phân tử lựa chọn theo phương pháp "tập hợp tốt nhất" (best subset) Các mô hình lựa chọn