Sàng lọc ảo đề cập đến một loạt các kỹ thuật in silico các kỹ thuật được thự hiện với sự trợ giúp của máy tính được sử dụng để sàng lọc các CSDL hợp chấtlớn nhằm lựa chọn một số lượng nh
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI
KHOA Y DƯỢC
NGUYỄN THỊ HƯƠNG GIANG
SÀNG LỌC ẢO HỢP CHẤT ỨC CHẾ ENZYM TYROSINASE TỪ HỢP CHẤT
THIÊN NHIÊN VIỆT NAM
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC NGÀNH DƯỢC HỌC
Hà Nội – 2017
Trang 2ĐẠI HỌC QUỐC GIA HÀ NỘI
KHOA Y DƯỢC
NGUYỄN THỊ HƯƠNG GIANG
SÀNG LỌC ẢO HỢP CHẤT ỨC CHẾ ENZYM TYROSINASE TỪ HỢP CHẤT
THIÊN NHIÊN VIỆT NAM
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC NGÀNH DƯỢC HỌC
Người hướng dẫn: TS Lê Thị Thu Hường
TS Phạm Thế Hải
Hà Nội – 2017
Trang 3Lời cảm ơn
Tôi xin gửi lời cảm ơn sâu sắc tới TS Lê Thị Thu Hường - Giảng viên Bộ
môn Dược liệu và Dược học cổ truyền, Khoa Y Dược, Đại học Quốc Gia Hà Nội,
TS Phạm Thế Hải - Giảng viên Bộ môn Hóa dược, Trường đại học Dược Hà Nội
đã trực tiếp hướng dẫn, tận tình giúp đỡ và tạo điều kiện thuận lợi để tôi có thểnghiên cứu và hoàn thành khóa luận này
Tôi xin chân thành cảm ơn ThS Ninh Bảo Yến đã giúp đỡ tôi rất nhiều
trong quá trình thực hiện khóa luận, cũng như xin gửi lời cảm ơn đến tất cả quý thầy
cô tại Đại học Quốc Gia Hà Nội đã dạy dỗ, trang bị kiến thức cho tôi trong suốt 5năm theo học tại trường
Tôi cũng xin cảm ơn gia đình, bạn bè đã luôn theo sát động viên, quan tâm
và tạo điều kiện giúp tôi có thể hoàn thành khóa luận này
Xin chân thành cảm ơn!
Hà Nội, tháng 06 năm 2017
Sinh viên
Nguyễn Thị Hương Giang
Trang 4Hợp chấtHistidinHydroquinonL-3,4-dihydroxyphenylalaninPhenylalanin
Polyphenol Oxidase
Quantitative Structure-Activity Relationships
Trung tâm hoạt độngTham số phân tửValin
Trang 5Danh mục các bảng Bảng 1 : Các phân nhóm chính trong CSDL 14
Bảng 2 : Ái lực liên kết với đích của 21 hợp chất được dự đoán là có khả năng ức
chế tyrosinase 22
Trang 6Danh mục hình vẽ, đồ thị
Hình 1 : Quá trình oxy hóa phenol thông qua enzym tyrosinase 7
Hình 2 : Các dạng oxi hóa của enzym tyrosinase 7
Hình 3 : Trung tâm hoạt động của enzym tyrosinase tương tác với Tropolon 8
Hình 4 : Sơ đồ biểu diễn con đường sinh tổng hợp melanin 9
Hình 5 : Mô phỏng hệ thống sàng lọc ảo hợp chất ức chế enzym tyrosinase 16
Hình 6 : Giá trị T c của các chất trong CSDL tương ứng với 12 chất mẫu 19
Hình 7: Khoảng phân bố của giá trị T c max 19
Hình 8: Phân bố giá trị T c max theo từng chất mẫu 20
Hình 9 : Cấu trúc VNPD_ID929 được vẽ lại bằng TOMOCOMD-CARDD 20
Hình 10 : Phân bố các nhóm chất 21
Hình 11: Phân bố năng lượng liên kết với trung tâm hoạt động của enzym 21
Hình 12: Mô phỏng cấu dạng của phức hợp trung tâm hoạt động enzym với VNPD_ID929 27
Hình 13: Mô phỏng cấu dạng của phức hợp trung tâm hoạt động enzym với VNPD_ID722 28
Hình 14: Mô phỏng cấu dạng của phức hợp trung tâm hoạt động enzym với VNPD_ID889 28
Hình 15: Mô phỏng cấu dạng của phức hợp trung tâm hoạt động enzym với VNPD_ID723 29
Hình 16: Mô phỏng cấu dạng của phức hợp trung tâm hoạt động enzym với VNPD_ID1157 30
Trang 7MỤC LỤC
Lời cảm ơn
Bảng ký hiệu, chữ viết tắt
Danh mục các bảng
Danh mục hình vẽ, đồ thị
MỞ ĐẦU 1
Chương 1 - TỔNG QUAN 2
1.1 Tổng quan về sàng lọc ảo 2
1.1.1 Khái niệm 2
1.1.2 Quy trình sàng lọc ảo 2
1.1.3 Các kỹ thuật sàng lọc ảo 2
1.2 Tổng quan về enzym tyrosinase 6
1.2.1 Khái niệm enzym tyrosinase 6
1.2.2 Trung tâm hoạt động của enzym tyrosinase 7
1.2.3 Vai trò của tyrosinase 8
1.2.4 Các chất ức chế tyrosinase 9
1.3 Tổng quan về hợp chất thiên nhiên Việt Nam 12
1.3.1 Khái niệm hợp chất thiên nhiên 12
1.3.2 Vai trò của hợp chất thiên nhiên trong nghiên cứu và phát triển thuốc .12
1.3.3 Tiềm năng của hơp chất thiên nhiên Việt Nam 13
Chương 2 - NGUYÊN VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU 14
2.1 Đối tượng, nguyên vật liệu và thiết bị nghiên cứu 14
2.1.1 Đối tượng nghiên cứu 14
2.1.2 Nguyên liệu 14
2.1.3 Thiết bị 15
2.2 Phương pháp nghiên cứu 15
2.2.1 Tìm kiếm đồng dạng 16
2.2.2 Mô hình QSAR 17
2.2.3 Docking 17
2.2.4 Xử lý số liệu 18
Chương 3 - KẾT QUẢ VÀ BÀN LUẬN 19
3.1 Kết quả tìm kiếm đồng dạng 19
3.2 Kết quả mô hình QSAR 20
Trang 83.3 Kết quả Docking 21
3.4 Bàn luận 23
3.4.1 Về phương pháp sàng lọc ảo 23
3.4.2 Về kết quả sàng lọc ảo 26
KẾT LUẬN VÀ KIẾN NGHỊ 31
Tài liệu tham khảo
Phụ lục
Trang 9MỞ ĐẦU
Hiện nay, khi xã hội ngày càng phát triển thì vấn đề về thẩm mỹ, làm đẹp củacon người càng được chú ý hơn đặc biệt là vấn đề chăm sóc da Màu da của conngười được quyết định bởi nhiều yếu tố, trong đó, quan trọng nhất là sự sản xuất vàphân bố của sắc tố melanin bởi tế bào biểu bì tạo sắc tố [68] Khi tế bào biểu bì tạosắc tố hoạt động mạnh hơn sẽ sản sinh ra nhiều melanin và phân tán mạnh hơn, gây
ra hiện tượng nám da, sạm da, tàn nhang… và ung thư da [22] Melanin được hìnhthành trong hạt sắc tố melanosom bởi hoạt động của enzym tyrosinase [63] Vì vậy,hiện nay nhiều sản phẩm làm sáng da, chống nám sử dụng hoạt chất là các chất ứcchế tyrosinase Tuy nhiên, các chất có hoạt tính ức chế tyrosinase đang được sửdụng hiện nay như Hydroquinon (HQ), Acid Kojic và Arbutin lại có nhiều vấn đềliên quan đến độ an toàn và hiệu quả [17, 81] Do vậy mà việc tìm kiếm các hợpchất mới ức chế tyrosinase có độ an toàn và hiệu quả cao hơn đặc biệt là từ các hợpchất có nguồn gốc thiên nhiên là một việc làm hết sức thiết thực và cấp bách
Phát hiện và tối ưu hóa chất dẫn đường là một khâu quan trọng trong quá trìnhnghiên cứu và phát triển thuốc hiện đại Lâu nay, các nghiên cứu này chủ yếu dựa vào
phương pháp thực nghiệm “thử và lỗi” với nhược điểm là tốn thời gian, tiền bạc và cho hiệu quả thấp Các phương pháp trợ giúp bởi máy tính (in silico) đã giúp ích nhiều cho
việc phát hiện các hợp chất mới có hoạt tính sinh học ngay cả trước khi chúng đượctổng hợp hay phân lập thông qua quá trình sàng lọc ảo Sàng lọc ảo không những bổsung cho các sàng lọc thật mà còn giúp định hướng quá trình tổng hợp/phân lập cácchất Sàng lọc ảo tương đối rẻ, nhanh, cho phép làm việc với số lượng lớn lên tới hàngtriệu hợp chất, điều không thể làm được trong các mô hình thực nghiệm
Bên cạnh đó, Việt Nam có nguồn dược liệu phong phú với hàng nghìn hợpchất đã được phân lập và tổng hợp các thông tin liên quan lại thành một cơ sở dữliệu (CSDL) cung cấp các thông tin đầu vào hữu ích cho việc sàng lọc ảo Cho đếnthời điểm hiện tại, chưa có bài báo nào công bố về một quy trình sàng lọc ảo để tìmkiếm các chất ức chế tyrosinase từ CSDL này Do đó, việc sàng lọc CSDL các hợpchất phân lập từ dược liệu sẽ đóng góp nhiều cho quá trình nghiên cứu và phát triểnthuốc làm trắng da, chống nám tại Việt Nam
Trên cơ sở đó, đề tài “Sàng lọc ảo hợp chất ức chế enzym Tyrosinase từ
hợp chất thiên nhiên Việt Nam” được thực hiện với mục tiêu: Phát hiện được các
hợp chất có khả năng ức chế tyrosinase mạnh thông qua sàng lọc ảo các hợp chấtphân lập từ thảo dược Việt Nam
Trang 10Chương 1 - TỔNG QUAN 1.1 Tổng quan về sàng lọc ảo
1.1.1 Khái niệm
Các khái niệm về sàng lọc ảo (virtual screening) xuất hiện vào những năm 60
của thế kỷ XX với các mô hình của Hansch [28] Thế nhưng, chỉ từ năm 1990 thìlĩnh vực này mới có nhiều bước tiến và từ đó đến nay, ngày càng phát triển mạnh
mẽ [41] Sàng lọc ảo đề cập đến một loạt các kỹ thuật in silico (các kỹ thuật được
thự hiện với sự trợ giúp của máy tính) được sử dụng để sàng lọc các CSDL hợp chấtlớn nhằm lựa chọn một số lượng nhỏ hơn cho thử nghiệm sinh học Mô hình sànglọc ảo không những bổ sung cho các mô hình thực nghiệm mà còn giúp định hướngquá trình tổng hợp/phân lập các chất Ngoài ra sau khi được xây dựng, việc sử dụngcác mô hình này tương đối rẻ (tiết kiệm nguyên liệu thử), nhanh và cho phép làmviệc với số lượng lớn lên tới hàng triệu hợp chất, một điều không thể làm đượctrong các mô hình thực nghiệm
1.1.2 Quy trình sàng lọc ảo
Quá trình sàng lọc ảo gồm 5 bước như sau: 1) Lựa chọn đối tượng sàng lọc2) Lựa chọn kỹ thuật 3) Sắp xếp các kỹ thuật theo thứ tự phù hợp 4) Sàng lọc 5)Phân tích kết quả
1.1.3 Các kỹ thuật sàng lọc ảo
Các kỹ thuật sàng lọc ảo hiện nay được phân vào 2 nhóm chính là sàng lọc
ảo dựa trên phối tử (Ligand-based Virtual Screening) và sàng lọc ảo dựa trên cấu trúc (Structure-based Virtual Screening) Sàng lọc ảo dựa trên phối tử được thực
hiện trong trường hợp không có cấu trúc 3D của protein, chỉ có cấu trúc của phối tử.Các kỹ thuật có thể sử dụng lúc này là kỹ thuật xây dựng phần cấu trúc mang hoạt
tính (pharmacophore), kỹ thuật tìm kiếm đồng dạng (similarity searching), QSAR.
Trong trường hợp có cả cấu trúc 3D của protein và cấu trúc của phối tử, kỹ thuật
sàng lọc ảo dựa vào cấu trúc sẽ được áp dụng, sử dụng kỹ thuật docking [47].
Hệ thống sàng lọc ảo được trợ giúp bởi máy tính gồm nhiều phễu lọc khácnhau, mỗi phễu lọc sử dụng một kỹ thuật sàng lọc khác nhau, được sắp xếp tuần tựhợp lý dựa vào thời gian mà máy tính cần cho mỗi thuật toán và sự phức tạp củathông tin đầu vào Nghiên cứu sử dụng kết hợp 3 phễu lọc: Tìm kiếm đồng dạng,
Mô hình QSAR và Kỹ thuật docking.
Trang 111.1.3.1 Tổng quan về tìm kiếm đồng dạng
a Khái quát về tìm kiếm đồng dạng
Kỹ thuật tìm kiếm đồng dạng (similarity searching) là kỹ thuật tìm kiếm các hợp chất có cấu trúc tương tự với hợp chất mẫu (reference) trên cơ sở dữ liệu về cấu
trúc của các hợp chất Kỹ thuật được thực hiện dựa trên nguyên lý tính chất giốngnhau, như vậy những phân tử có cấu trúc giống nhau được hy vọng có tính chấthoặc hoạt tính sinh học giống nhau [40] Kỹ thuật tìm kiếm đồng dạng được đưavào sử dụng rộng rãi kể từ thập niên 80, và được chứng minh là rất hữu ích tronglĩnh vực dược phẩm Hiện nay, phương pháp tìm kiếm đồng dạng đã được xây dựngbởi nhiều nhóm nghiên cứu trên thế giới Sàng lọc ảo sử dụng kỹ thuật tìm kiếmđồng dạng có thể tiến hành một cách nhanh chóng, do đó, kỹ thuật này được sửdụng nhiều để sàng lọc các cơ sở dữ liệu lớn [70]
Hai yếu tố quan trọng tham gia vào quá trình tìm kiếm đồng dạng là các tham
số phân tử đặc trưng cho các chất và thông số sử dụng để thiết lập mối liên hệ sosánh giữa cặp phân tử (hệ số tương đồng) Sau khi so sánh có thể sắp xếp các hợpchất trong CSDL theo thứ tự giảm dần về hệ số tương đồng so với các hợp chấtmẫu Khi có được danh sách sắp xếp này, người nghiên cứu sử dụng một ngưỡng
(cut-off) để lựa chọn tập hợp các hợp chất nằm trên cùng danh sách [30].
Tham số phân tử là giá trị đại diện cho mô tả phân tử Các mô tả phân tửthường được định nghĩa dựa vào chiều của chúng Mô tả phân tử 1 chiều là các đặctính như khối lượng phân tử, số lượng liên kết, đếm các mảnh cấu trúc Mô tả phân
tử 2 chiều là mô tả biểu diễn các cấu trúc theo kích thước, độ phân nhánh và hìnhdạng tổng thể, trong khi 3 chiều sử dụng các thông tin tử cấu trúc không gian 3chiều của phân tử Mô tả phân tử được sử dụng thường xuyên nhất là mô tả phân tử2D, là mô tả nhị phân, mã hóa sự có mặt hoặc không của các mảnh cấu trúc [80]
Có nhiều hệ số được xây dựng để biểu diễn sự giống nhau giữa một cặp cấu
trúc, chẳng hạn như hệ số Tanimoto/Jaccard, hệ số Cosine/ Ochiai, hệ số Dice, hệ
số Fossum, hệ số Simpson, hệ số Pearson/Stile, khoảng cách Euclide, khoảng cách
Hamming, khoảng cách Soergel, khoảng cách Manhattan Hệ số Tanimoto được sử
dụng rộng rãi nhất cho các dữ liệu nhị phân Nhiều nghiên cứu đã chỉ ra rằng, hệ sốnày cho kết quả tốt hơn so với nhiều hệ số khác [79]
Trang 12b Quy trình tìm kiếm đồng dạng
Quá trình tìm kiếm đồng dạng gồm các bước chính sau: 1) Tính toán tham sốphân tử đặc trưng cho hợp chất, 2) Tính toán hệ số tương đồng, 3) Sắp xếp các chấttheo chiều giảm dần hệ số tương đồng, 4) Chọn ngưỡng
1.1.3.2 Tổng quan về các mô hình QSAR
a Khái quát về mô hình QSAR
Mô hình QSAR (Quantitative Structure-Activity Relationships) là mô hình
biểu thị mối liên hệ định lượng giữa cấu trúc và hoạt tính của các hợp chất Mô hìnhQSAR được xây dựng dựa trên giả thuyết cấu trúc của một phân tử phải chứa nhữngđặc điểm cấu trúc chịu trách nhiệm cho tính chất hóa học, vật lý, sinh học Mô hìnhQSAR cho phép dự đoán tính chất của một phân tử mới dựa trên các hợp chất tương
tự có các tính chất đã được kiểm chứng
Mô hình QSAR được biểu diễn dưới dạng một phương trình toán học
(Phương trình 1) Để có thể xây dựng được các mô hình này thì cả cấu trúc và hoạt tính đều phải được định lượng hóa Các cấu trúc được định lượng thông qua các
tham số phân tử (biến x) Các tham số phân tử là kết quả của một quá trình toán học
chuyển đổi các thông tin trong cấu trúc phân tử thành một số đặc trưng cho cấu trúcphân tử ấy Hoạt tính được sử dụng có thể là hoạt tính hoá học hay hoạt tính sinh
học (biến Y) được đánh giá bằng các phương pháp nghiên cứu thực nghiệm Một số
đại lượng hoạt tính sinh học thường được dùng như: IC50 nồng độ ức chế 50% hoạt
tính; MIC (Minimum Inhibitory Concentration): nồng độ ức chế tối thiểu; MBC (Minimum Bactericidal Concentration): nồng độ diệt khuẩn tối thiểu; EC50
(Effective Concentration): nồng độ 50% tác dụng tối đa; KI: Hằng số ức chế
Phương trình 1: = 1 ( 1) + 2 ( 2) + ⋯ + ( )
Trong đó:
Y: Biến đáp ứng (mang giá trị biểu thị tác dụng sinh học)
x 1 , x 2 ,…x n: Các tham số đặc trưng cho cấu trúc
f 1 , f 2 ,…f n : Các thuật toán thể hiện trọng số của tham số phân tử x, được tính toán bằng các phần mềm phân tích thống kê sử dụng kỹ thuật xác suất thống kê hay trí
tuệ nhân tạo
4
Trang 13b Quy trình xây dựng mô hình QSAR
Các bước để xây dựng mô hình QSAR [76] gồm: 1) Xây dựng cơ sở dữ liệu;
2) Tính toán tham số mô tả phân tử đặc trưng cho cấu trúc; 3) Xây dựng mô hìnhQSAR: Sử dụng các phương pháp xác suất thống kê và các kỹ thuật của trí tuệ nhântạo để xây dựng mối liên hệ giữa các tham số phân tử và các giá trị đại lượng biểudiễn hoạt tính; 4) Đánh giá mô hình; 5) Giải thích các kết quả và sử dụng mô hìnhtrong quá trình sàng lọc ảo
c Hệ thống phân loại kếp hợp các mô hình QSAR
Dieterich đã nghiên cứu kết luận là một hệ thống phân loại phối hợp thường
tốt hơn việc sử dụng các mô hình đơn [18] Sự thành công của các hệ thống phân
loại kết hợp (Multiple classifier system) phụ thuộc vào hai yếu tố là sự đa dạng của
các mô hình đơn để kết hợp và cách kết hợp các đầu ra [54]
Có nhiều cách để tạo nên sự đa dạng của các mô hình đơn Trong các nghiêncứu của mình, Kuncheva trình bày 4 cấp để tạo nên sự đa dạng của các mô hình đơn
[54]. Cấp độ 1 là thay đổi tập huấn luyện (training set) Cấp độ 2 là thay đổi tập hợp của các biến độc lập (independent variables) Các biến độc lập dùng để xây dựng các
mô hình QSAR là các tham số phân tử khác nhau đặc trưng cho cấu trúc Cấp độ 3, sửdụng các kỹ thuật khác nhau để xây dựng các mô hình đơn Cấp độ cuối cùng là cáchkết hợp các mô hình đơn Kuncheva và Whitaker đã tổng kết 10 cách để định lượng sự
đa dạng giữa các mô hình đơn sử dụng các hệ số đa dạng Có rất nhiều cách kết hợp các
đầu ra như: Biểu quyết đa số phiếu [8], Biểu quyết với trọng số [54], Bagging (Boostrap AGGregatING) [8], Boosting [7], Stacking [8] Mỗi cách kết hợp
đầu ra sẽ cho kết quả với độ chính xác khác nhau
1.1.1.4 Tổng quan về kỹ thuật docking
a Khái quát về docking
Docking là phương pháp đưa cấu trúc của một chất (dạng cấu trúc không
gian 3 chiều) vào một trung tâm tương tác của mục tiêu phân tử (đích tác dụng của
thuốc) và tính toán các giá trị tương tác để đánh giá khả năng tương tác của chất đó
với mục tiêu phân tử Mục đích của docking là xác định một cấu dạng tối ưu nhất
cho phối tử (phân tử hay anion liên kết trực tiếp với trung tâm hoạt động được gọi làphối tử) và dự đoán chính xác hoạt động của phối tử để năng lượng tự do của phứchợp mục tiêu phân tử - phối tử là nhỏ nhất [51]
Trang 14Khi cơ chất gắn lên một phân tử protein, hai điểm cần chú ý là sự phù hợp vềhình dạng, kích thước và năng lượng tương tác giữa nó với protein Sự phù hợp về hìnhdạng tương tự như cơ chế chìa khoá - ổ khoá nhưng trong thực tế, cả cơ chất và proteinđều có thể thay đổi cấu hình, đặc biệt protein là phân tử lớn và có cấu trúc mềm dẻo.Quá trình này trong thực tế phức tạp hơn Ngoài yêu cầu phù hợp về hình dạng, kíchthước, giữa cơ chất và enzym còn có những tương tác khác như van der Waals, tươngtác tĩnh điện, trong nhiều trường hợp còn có tương tác hoá học Nhưng do proteinthường có kích thước lớn và mềm dẻo, rất khó khảo sát hết tất cả khả năng có thể nên
trong docking, phân tử protein thường được đưa vào dưới dạng cấu trúc cứng (rigid),
cơ chất chuyển động tương đối so với protein và thay đổi cấu hình Một số phần mềm
docking cũng cho phép thay đổi cấu hình trên một số amino acid Hiện nay, có rất nhiều phần mềm được sử dụng để docking: AutoDock [3], ICM-Docking [35], MOE
(Molecular Operating Environment) [59], SwissDock [73]
Có 2 cách tiếp cận trong phương pháp docking: docking cơ học và docking tự động [64] Docking cơ học trong trường hợp đã biết các nhóm liên kết của phối tử
và vị trí liên kết của mục tiêu Sử dụng một số chương trình cho phép phối tửchuyển động trong vị trí liến kết và cố gắng lắp ghép chúng lại với nhau một cách
phù hợp nhất ở trạng thái cứng Docking tự động được tiến hành nhờ sử dụng các phần mềm tự động docking Các chương trình này sẽ tự động quyết định việc làm thế nào để dock phối tử vào vị trí liên kết.
Một chương trình docking gồm 2 phần chính: thuật toán tìm kiếm cấu dạng,
quay và dịch chuyển của phân tử trong vùng gắn và thuật toán để đánh giá sự phù
hợp của phối tử và receptor hoặc ái lực gắn giữa chúng Docking yêu cầu thông tin
3D của phân tử và hình dáng 3D của protein đích Để tìm cấu hình phù hợp nhất cầnliên hệ không gian cấu hình với các giá trị số đánh giá được khả năng gắn kết của cơchất lên protein và sau đó áp dụng thuật toán tìm kiếm
b Quy trình docking
Quy trình docking gồm 4 bước cơ bản: 1) Chuẩn bị protein; 2) Chuẩn bị cấu tử; 3) Mô phỏng docking; 4) Giải thích kết quả.
1.2 Tổng quan về enzym tyrosinase
1.2.1 Khái niệm enzym tyrosinase
Tyrosinase (EC 1.14.18.1) hay còn gọi là enzym polyphenol oxidase (PPO),
là một enzym monooxygenase có chứa đồng tham gia vào hai phản ứng riêng biệt
Trang 15của quá trình chuyển hóa melanin; một là hydroxyl hóa monophenol thành
diphenol, hai là oxi hóa diphenol thành quinon (Hình 1) [9, 48]; sau đó,
O-quinon tham gia một loạt các phản ứng để tạo thành melanin
Hình 1: Quá trình oxy hóa phenol thông qua enzym tyrosinase
Enzym này được phân bố rộng rãi trong nấm, động vật và thực vật, nó đóngvai trò quan trọng trong quá trình hình thành sắc tố Enzym tyrosinase có thể tồn tại
ở 3 dạng là: oxy, deoxy, met-tyrosinase được biểu diễn qua sơ đồ trong Hình 2 [10,
45, 49] Cả dạng met-tyrosinase và dạng oxy-tyrosinase đều có hoạt tính diphenolase, trong khi chỉ có dạng oxy-tyrosinase là có hoạt tính monophenolase Dạng deoxy-tyrosinase là dạng yếu, không ổn định; phản ứng với oxy để tạo thành dạng oxy-tyrosinase.
Hình 2: Các dạng oxi hóa của enzym
tyrosinase 1.2.2 Trung tâm hoạt động của enzym tyrosinase
Việc phân tích về trung tâm hoạt động là cần thiết cho quá trình xác định hợpchất ức chế enzym tyrosinae Cấu trúc tinh thể tia X của enzym được tải về từ ngânhàng dữ liệu protein (ID: 2Y9X) Trung tâm hoạt động gồm có túi enzym và 2 nguyên
tử đồng nằm ở đáy túi, đóng vai trò quan trọng trong cơ chế xúc tác của enzym Mỗi
Trang 16nguyên tử đồng tạo liên kết phối trí với 3 phân tử histamin Miệng túi được hìnhthành từ các chuỗi acid amin như Val283, Phel264, His244, Val248, Asn260…
(Hình 3) [36].
Hình 3: Trung tâm hoạt động của enzym tyrosinase tương tác với Tropolon
Như vậy, để một cấu tử thể hiện được vai trò ức chế enzym tyrosinase, nócần phải chui được vào túi enzym của trung tâm hoạt động và khóa được ion Cu2+ ởđáy túi enzym [83]
1.2.3 Vai trò của tyrosinase
Sắc tố là một trong những đặc điểm kiểu hình rõ ràng nhất trong thế giới tựnhiên Trong các tế bào động vật hoặc thực vật, một sắc tố được định nghĩa là bất kỳchất tạo màu do chúng phản xạ và hấp thụ một số sóng ánh sáng đặc hiệu [57].Trong các sắc tố sinh học đó, melanin (theo tiếng Hy Lạp có nghĩa là đen) đượcphân bố rộng rãi nhất và được tìm thấy trong suốt quá trình phát sinh loài, từ các visinh vật cho đến động vật, có cả con người [66] Ở người, melanin được tìm thấychủ yếu trong da, tóc, võng mạc [25] Melanin được tiết ra bởi tế bào sắc tố phân bố
ở lớp đáy của biểu bì Vai trò của melanin là bảo vệ da khỏi tác hại của tia tử ngoại,đặc biệt là tia cực tím B bằng cách hấp thụ và tán xạ ánh sáng mặt trời và loại bỏcác gốc oxy hóa tự do Các rối loạn khác nhau ở da là kết quả của sự tích tụ quámức sắc tố ở biểu bì Tăng sắc tố có thể do tăng tế bào tạo sắc tố hoặc do tăng hoạtđộng của các enzym hình thành sắc tố
Các tế bào biểu bì tạo sắc tố của động vật có vú có thể sản xuất hai loại melanin
là eumelanin và pheomelanin Eumelanin có màu từ nâu đến đen, không tan trong hầuhết các dung môi, liên kết chặt chẽ với protein thông qua các liên kết đồng hóa trị.Pheomelanin có màu từ vàng đến đỏ, có bộ khung được tạo bởi các tiểu đơn vị là cácbenzothiazin và cũng liên kết chặt chẽ với protein thông qua các liên kết đồng
Trang 17hóa trị Tỷ lệ về số lượng và mật độ của hai melanin này sẽ quyết định màu sắc của
da, mắt và tóc [78]
Con đường hình thành sắc tố melanin được tóm tắt trong Hình 4 [49, 65].
Bước đầu tiên và cũng là bước bắt buộc trong quá trình hình thành sắc tố là sự oxyhóa tyrosin thành dopaquinon Đây là bước giới hạn tốc độ trong quá trình sinh tổnghợp tyrosin do chuỗi phản ứng còn lại có thể tự diễn ra tại một giá trị pH sinh lýnhất định Dopaquinon sinh ra được chuyển thành leukodopachrom, sau đó chuyểnthành dopachrom Cuối cùng eumelanin được hình thành thông qua một loạt cácphản ứng oxy hóa từ các sản phẩm chuyển hóa của dopachrom là 5,6-dihydroxyindol (DHI) và acid 5,6-dihydroxyindol-2-cacboxylic (DHICA) Trongtrường hợp có sự có mặt của cystein hoặc glutathion, dopaquinon sẽ được chuyểnhóa thành cysteyldopa hoặc glutathionyldopa Cysteinyldopa hoặc glutathionyldopatiếp tục trải qua một loạt các phản ứng để tạo thành pheomelanin [12, 49]
Như vậy, tyrosinase tham gia vào phản ứng đầu của quá trình hình thành sắc
tố da melanin Chính vì thế mà các chất ức chế tyrosinase đã và đang được sử dụngrất rộng trong điều trị các bệnh tăng sắc tố và trong mỹ phẩm như một yếu tố làmtrắng da
Hình 4: Sơ đồ biểu diễn con đường sinh tổng hợp melanin
1.2.4 Các chất ức chế tyrosinase
Trang 18Tyrosinase đóng một vai trò quan trọng trong quá trình tổng hợp melanin, do
đó ức chế enzym này làm giảm hình thành sắc tố da [56] Vì thế việc tìm kiếm cácchất ức chế tyrosinase ngày càng trở nên quan trọng trong các sản phẩm thuốc và
mỹ phẩm sử dụng để ngăn ngừa và điều trị rối loạn sắc tố
1.2.4.1 Các chất ức chế tyrosinase có nguồn gốc thiên nhiên
Polyphenol thực vật là nhóm các hợp chất có nhiều nhóm chức phenol, tiêubiểu là flavonoid Hơn 4000 flavonoid phân bố trong lá, hạt, vỏ cây và hoa đã đượcxác định Ở thực vật các hợp chất này bảo vệ thực vật bằng cách chống lại tia cựctím và tác nhân gây bệnh [27] Một số flavonoid như kaempferol, quercetin vàmorin thể hiện tác dụng ức chế tyrosinase, trong khi những chất khác, ví dụ catechin
và rhamnetin, đóng vai trò là các cơ chất của tyrosinase Một số nghiên cứu chothấy rằng flavonoid có chứa nhóm α-keto có tác dụng ức chế tyrosinase mạnh [5]
Nhiều aldehyd và các hợp chất khác cũng được phân lập và xác định là có tácdụng ức chế enzym tyrosinase như cinnamaldehyd, (2E) -alkenal, 2-hydroxy-4-methoxybenzaldehyd, anisaldehyd, cuminaldehyd và acid cumic [52] Hoạt động ứcchế tyrosinase của anisaldehyd và cuminaldehyd mạnh hơn khoảng 2,5 và 16 lần sovới benzaldehyd Một số alkanal có tác dụng ức chế tyrosinase có thể là do sự tươngtác kỵ nước của chúng với các enzym, làm ảnh hưởng đến cấu trúc bậc 3 của enzym
[15]. (2E) - alkenal ức chế quá trình oxy hóa L-3,4-dihydroxyphenylalanin DOPA) của tyrosinase là chất ức chế không cạnh tranh, và phần alkyl kỵ nước cóliên quan đến hoạt động ức chế của chúng [15]
(L-Bên cạnh những thực vật bậc cao thì trong nấm cũng có một số hợp chất cótác dụng ức chế enzym tyrosinase Acid dicacboxylic bão hòa được tạo thành bởiquá trình peroxy hóa lipid và este hóa acid béo bằng nấm men, vi nấm
Pityrosporum ovale Acid dicacboxylic này có tác dụng gây độc nhất định trên các
tế bào biểu bì tạo sắc tố của khối u ác tính ở da, mặc dù bình thường tế bào biểu bì
tạo sắc tố không bị ảnh hưởng [69] Acid kojic, 5-hydroxy-2- pyron, một chất chuyển hóa của nấm được sản xuất bởi nhiều loài thuộc chi
(hydroxymethyl)-γ-Aspergillus và Penicillium Acid kojic ức chế sự hình thành sắc tố từ phản ứng oxy
hóa L-DOPA, norepinephrin và dopamin dưới sự xúc tác của tyrosinase Điều này
có nghĩa rằng acid kojic có thể giảm chuyển hóa O-quinon thành O-diphenol ngăncản tạo thành các sắc tố [43]
1.2.4.2 Các chất ức chế tyrosinase có nguồn gốc tổng hợp
Trang 19Một lượng đáng kể các hợp chất có nguồn gốc tổng hợp như hydroxylamin,các hợp chất chứa thiol, acid cacboxylic thơm, dẫn xuất của acid cinnamic,trihydroxy chalconas, peptid, acid alkylbenzoic [31], N-hydroxy-N’-phenyl ure vàN-hydroxy-N’-phenyl thioure [16] có tác dụng ức chế enzym tyrosinase.
Tropolon (2-hydroxy-2,4,6-cycloheptatrien-1-on) là một trong những chất ứcchế tyrosinase mạnh nhất Nó có cấu trúc tương tự như các cơ chất O-diphenolic củatyrosinase [42]
Resorcinol được gắn nhóm thế ở vị trí 4 là các chất ức chế tyrosinase yếu.Trong các hợp chất này, tác dụng ức chế mạnh nhất đạt được khi thay thế nhóm kỵnước vào vị trí thứ 4, chẳng hạn như 4-hexyl resorcinol và 4-dodecyl resorcinol 4-hexyl resorcinol là các chất ức chế tyrosinase hiệu quả nhất sử dụng trong các ngànhcông nghiệp thực phẩm vì nó hòa tan trong nước, ổn định, không độc hại, khônggây đột biến và không gây ung thư, và chất này cũng đã được công nhận là an toàntrong việc kiểm soát sự sẫm màu của lát táo cũng như khoai tây và bơ khi để ngoàikhông khí lâu [21]
1.2.4.3 Các thuốc được phát hiện có tác dụng ức chế tyrosinase
Captopril, (S)-1-(3-mercapto-2-metyl-1-oxopropyl)-L-prolin, ức chế hoạtđộng monophenolase và diphenolase của tyrosinase [20] Captopril được biết đến làchất tạo chelat với đồng [38] Do đó, có thể cho rằng captopril chủ yếu có tác dụng
ức chế là do tạo chelat với ion đồng ở vị trí hoạt động của tyrosinase
Một số thuốc khác cũng có tác dụng ức chế hoạt động của tyrosinase, nhưpenicillamin, được sử dụng trong điều trị bệnh Wilson [55], và methimazol là thuốckháng tuyến giáp Methimazol (1-methyl-2-mercaptoimidazol) ức chế cả hoạt độngmonophenolase và diphenolase của tyrosinase nấm Methimazol ức chế hoạt độngtyrosinase của nấm bằng hai cách: liên hợp với O-quinon, do đó ức chế rõ sự hìnhthành sắc tố, và tạo chelat với đồng tại vị trí hoạt động của tyrosinase [1]
1.2.4.4 Một số chất ức chế đã được sử dụng
HQ làm giảm 90% hoạt tính của tyrosinase [77], là một hóa chất phổ biến cótrong mỹ phẩm và sản phẩm làm sáng da không cần đơn Nó được coi là một trong các
chất ức chế hiệu quả nhất quá trình sản xuất melanin ở cả in vitro và in vivo HQ ảnh
hưởng nghiêm trọng đến sức khỏe đặc biệt là sắc tố của mắt, và trong một số ít trườnghợp HQ gây tổn thương giác mạc vĩnh viễn Hiện tượng này đã được quan sát thấy ởcác công nhân sản xuất HQ HQ đã bị Cục quản lý Dược phẩm Hoa Kỳ cấm
Trang 20sử dụng trong các chế phẩm mỹ phẩm ở Châu Âu vì không an toàn khi sử dụngtrong thời gian dài [17].
Arbutin, một hợp chất chuyển hóa thứ cấp của cây dâu gấu (tên khoa học là
Arctostaphylos uva-ursi), được sử dụng rộng rãi với hiệu quả làm sáng da Arbutin
tự nhiên tương đối an toàn tuy nhiên lại có độ ổn định thấp và dễ dàng chuyển hóathành HQ Vì thế, vào năm 2008, Hiệp hội Mỹ phẩm Châu Âu đã cấm sử dụng cácđồng dạng của beta-arbutin [81]
1.3 Tổng quan về hợp chất thiên nhiên Việt Nam
1.3.1 Khái niệm hợp chất thiên nhiên
Hợp chất thiên nhiên ( natural products) là các chất hóa học có nguồn gốc từ
thiên nhiên hoặc được chiết xuất từ các mô của động vật, thực vật trên cạn; sinh vậtbiển; vi khuẩn lên men; vi sinh vật [37] Hầu hết các hợp chất thiên nhiên có hoạttính sinh học là các chất chuyển hóa thứ cấp có cấu trúc rất phức tạp
1.3.2 Vai trò của hợp chất thiên nhiên trong nghiên cứu và phát triển thuốc
Thực vật được cấu thành bởi một hệ thống lớn và đa dạng các chất hóa học,chúng có thể cung cấp những hợp chất với cấu trúc có độ phức tạp cao mà không thểtổng hợp được trong các phòng thí nghiệm Những phân tử nhỏ này cung cấp nguồnhoặc là tiền chất cho phần lớn các hoạt chất được FDA chấp thuận và hiện đang là mộttrong những nguồn cảm hứng chính cho việc nghiên cứu và phát hiện thuốc mới
Có nhiều chất dẫn đường có nguồn gốc từ thực vật [62] (ví dụ morphin,cocain, digitalis, quinin, tubocurarin, nicotin, muscarin…) Một số đóng vai trò trựctiếp là những loại thuốc hữu ích (ví dụ morphin và quinin), và một số khác là cơ sởcho tổng hợp các hoạt chất làm thuốc (ví dụ như thuốc gây mê cục bộ phát triển từcocain) Gần đây trong lâm sàng, một số loại thuốc mới đã được phân lập từ thựcvật bao gồm thuốc chống ung thư paclitaxel (Taxol) từ cây thủy tùng, và thuốcchống sốt rét artemisinin từ câu thanh hao hoa vàng
Nhiều thực vật bậc cao chứa các chất chuyển hóa mới có tính kháng khuẩn vàkháng virus [26] Ở những nước phát triển, các ca lâm sàng có dử dụng hóa trị liệuthường dùng các thuốc đã được sản xuất bằng hóa tổng hợp in vitro; nhưng taxol vàvincristin là ngoại lệ [46], chúng là các chất chuyển hóa có cấu trúc phức tạp, rất khótổng hợp trong ống nghiệm Nhiều loại thuốc tổng hợp và bán tổng hợp gây ra các phảnứng phụ nghiêm trọng, nhất là các thuốc dùng điều trị cho bệnh nhân ung thư với cáctác dụng phụ biểu hiện trên da một cách rất nghiêm trọng Các chất chuyển
Trang 21hóa được phát hiện trong một số loài thực vật có thể tránh tác dụng phụ của thuốctổng hợp vì chúng đã từng tích tụ trong các tế bào sống [29].
Một trong những hợp chất tinh khiết được phân lập đầu tiên trong lịch sử y học
là morphin vào khoảng năm 1804 bởi Friedrich Serturner từ thuốc phiện Vào thời điểm
đó, thuốc phiện được gọi là thuốc gây nghiện, mặc dù nó đã được sử dụng nhiều trongđiều trị giảm đau vào thời Trung cổ Tiếp sau đó, thuốc kháng sốt rét, quinin đã đượcPelletier và Caventou phân lập từ cây vỏ cây cinchona vào năm 1820 Loại vỏ cây này
đã được sử dụng để điều trị sốt rét từ những năm 1600 và cũng là một phần của y học
cổ truyền Nam Mỹ để điều trị bệnh sốt Sự gia tăng tính kháng thuốc đối với quinin vàdẫn chất của nó dẫn đến nhu cầu về thuốc sốt rét thay thế, đó là artemisinin được phânlập từ cây thanh hao hoa vàng Ngoài ra còn có thuốc giảm đau aspirin là este của acidsalicylic được tách chiết từ vỏ cây liễu, lá của cây này được người Ai Cập cổ đại sửdụng với tác dụng giảm đau và chống viêm
1.3.3 Tiềm năng của hơp chất thiên nhiên Việt Nam
Theo kết quả thống kê của Viện Dược liệu, tính đến năm 2017 đã ghi nhậnđược 5.117 loài thực vật và nấm lớn, 52 loài tảo biển, 408 loài động vật và 75 loàikhoáng vật có công dụng làm thuốc Trong số đó, có khoảng 70 loài có tiềm năngkhai thác với tổng trữ lượng khoảng 18.000 tấn/năm như diếp cá (5.000 tấn), cẩutích (1.500 tấn), lạc tiên (1.500 tấn), rau đắng đất (1.500 tấn)…Đặc biệt, Việt Nam
sở hữu nhiều loài dược liệu quý, hiếm, đặc hữu như: Sâm Ngọc Linh, Ba kích, Châuthụ, Ngân đằng… Kết quả này cho thấy nguồn dược liệu ở nước ta rất phong phú.Con số này còn có thể sẽ tăng thêm, nếu đi sâu điều tra cụ thể hơn một số nhómđộng – thực vật tiềm năng, mà trong đó số loài Tảo, Rêu, Nấm và Côn trùng làmthuốc mới được thống kê còn quá ít
Chiến lược quốc gia phát triển ngành dược đến năm 2020 đã đặt mục tiêuphấn đấu sản xuất được 20% nhu cầu nguyên liệu cho sản xuất thuốc trong nước;thuốc sản xuất trong nước chiếm 80% tổng giá trị thuốc tiêu thụ trong năm, trong đóthuốc từ dược liệu chiếm 30%
Trang 22Chương 2 - NGUYÊN VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU 2.1 Đối tượng, nguyên vật liệu và thiết bị nghiên cứu
2.1.1 Đối tượng nghiên cứu
Nghiên cứu được thực hiện trên cơ sở dữ liệu cấu trúc các hợp chất có nguồngốc từ thảo dược Việt Nam Thông tin của 1376 hợp chất được phân lập từ 311 loàithực vật và nấm thuộc 114 họ thực vật tại Việt Nam đã được xác định cấu trúc trong
418 nghiên cứu trong nước (được công bố trên các tạp chí Dược liệu, Dược học,Hóa học và Khoa học công nghệ) và quốc tế được tập hợp lại thành một CSDL.CSDL Có các thông tin về hợp chất (tên, biểu diễn cấu trúc dưới dạng SMILE,InChI và InChiKey), tên nguồn dược liệu (tên thông thường, tên khoa học), địa chỉthu hái, thời gian thu hái, bộ phận sử dụng, tác dụng dân gian, tác dụng dược lýđược chứng minh và tài liệu tham khảo Mỗi hợp chất trong CSDL được gán một sốđăng ký VNPD_ID từ VNPD_ID1 tới VNPD_ID1376 Ngoài ra, mỗi cấu trúc cònđược phân loại, tính toán các thông số lý hóa như khối lượng phân tử, AlogP, XlogP,
số liên kết cho hydro, số liên kết nhận hydro
CSDL Có các hợp chất được được phân loại vào các nhóm khác nhau, chủ
yếu là lipid, phenylpropanoid và benzoid, được nêu cụ thể trong Bảng 1.
- Mô hình QSAR phân loại (Classify) và QSAR hoạt tính (Potency) đã được công
bố trong nghiên cứu trước đây [34]
Trang 23- Cấu trúc tinh thể tia X của enzym tyrosinase (ID: 2Y9X) phân lập từ A.bisporus
với chất ức chế Tropolon được tải về từ ngân hàng Protein Data Bank(http://www.rcsb.org/)
2.2 Phương pháp nghiên cứu
Nghiên cứu sử dụng phương pháp sàng lọc các hợp chất ức chế tyrosinase sửdụng mô hình sàng lọc ảo Hệ thống sàng lọc được định hướng phát triển theo các
bước giống Hình 5 Hệ thống này có nhiều phễu lọc cho phép sàng lọc được những
cơ sở dữ liệu lớn (hàng nghìn hợp chất) nhằm thu được một tập hợp nhỏ các hợpchất có tiềm năng ức chế enzym tyrosinase
Trang 24Hình 5: Mô phỏng hệ thống sàng lọc ảo hợp chất ức chế enzym tyrosinase
2.2.1 Tìm kiếm đồng dạng
Phễu lọc tìm kiếm tương đồng được sử dụng nhằm sàng lọc được các hợpchất có độ tương đồng cao (trên 75%) với các hợp chất mẫu, cung cấp một số lượngnhỏ các chất có chất lượng cao cho phễu lọc tiếp theo
Tham số phân tử MACCS [67] (là 1 mô tả phân tử sử dụng 166 bit để mã hóathông tin về nguyên tử, loại nguyên tử, vòng và các liên kết trong phân tử) được tính
toán bằng phần mềm CDK DescUI-1.4.6 trên tập hợp chất trong CSDL và tập hợp
mẫu Tập hợp chất mẫu trong nghiên cứu này là tập hợp các chất ức chế mạnhtyrosinase đã biết trước cấu trúc [33] (chi tiết cấu trúc hóa học của các hợp chất mẫu
được nêu trong Phụ lục 1) Sau đó, hệ số Tanimoto được tính toán bằng ngôn ngữ R
(là ngôn ngữ dành cho tính toán và đồ họa thống kê) [39], dựa theo Công thức (2).
Mỗi hợp chất của CSDL sẽ có 12 hệ số tương đồng ứng với 12 chất mẫu (từ Ref1tới Ref12) Nghiên cứu sử dụng quy tắc MAX để kết hợp các giá trị định lượng về
sự tương đồng cấu trúc theo: T c max = Maximum (T c1 , T c2, …T c12) Sau đó, từng hợp
chất trong CSDL được sắp xếp theo giá trị T c max giảm dần Các hợp chất được giữ
lại cho quá trình sàng lọc tiếp theo khi có giá trị T c từ 0.75 trở lên
Công thức (2):
Trong đó:
Trang 25T c : Hệ số Tanimoto
Na: Số lượng các đặc tính xuất hiện trong cấu trúc A
Nb: Số lượng các đặc tính xuất hiện trong cấu trúc B
Nc: Số lượng các đặc tính xuất hiện trong cả 2 cấu trúc A và B
2.2.2 Mô hình QSAR
Các hợp chất được xác định là có cấu trúc tương đồng với các hợp chất ứcchế tyrosinase mạnh (kết quả sàng lọc sử dụng phễu lọc tìm kiếm độ tương đồng),
sẽ được đánh giá khả năng ức chế sử dụng mô hình QSAR Đầu tiên, nghiên cứu sử
dụng mô hình QSAR phân loại (Classify) nhằm phân loại hợp chất thành có tiềm
năng ức chế hay không có tiềm năng ức chế Sau đó, các hợp chất được phân loại là
có tiềm năng ức chế, sẽ được sàng lọc qua mô hình QSAR hoạt tính (Potency) để
đánh giá khả năng ức chế tyrosinase mạnh hay yếu
Các hợp chất thu được từ phễu lọc tìm kiếm đồng dạng sẽ được tính toán cáctham số phân tử đặc trưng biểu thị mối quan hệ giữa đặc tính, cấu trúc và hoạt tínhsinh học sử dụng phần mềm TOMOCOMD-CARDD Danh sách các tham số phân
tử và ý nghĩa các tham số phân tử này được liệt kê trong Phụ lục 2 Tập kiểm tra
(testing set) được chuẩn bị từ danh sách kết quả các tham số phân tử vừa tính được
sử dụng phần mềm WEKA 3.6 Tập huấn luyện (training set) cho mô hình QSAR
phân loại gồm 1072 hợp chất, trong đó có 526 hợp chất có hoạt tính và 546 hợp chấtkhông có hoạt tính ức chế tyrosinase Tập huấn luyện cho QSAR hoạt tính gồm 257chất có hoạt tính mạnh và 141 chất có hoạt tính trung bình-yếu [34]
Nghiên cứu sử dụng mô hình QSAR là mô hình hợp kết hợp giữa các môhình đơn có độ chính xác cao được xây dựng từ việc áp dụng các thuật toán thống
kê và mô hình học máy khác nhau Sau đó, sử dụng thêm trình huấn luyện stacking
để kết hợp đầu ra của các mô hình đơn nhằm đạt kết quả tốt nhất 2 mô hình QSARphân loại và QSAR hoạt tính được sử dụng đều là các mô hình được nhóm nghiêncứu của TS Lê Thị Thu Hường đánh giá là tốt nhất [34], có độ tin cậy cao, 95,43%
và 93,72% tương ứng
2.2.3 Docking
Cuối cùng, các hợp chất được dự đoán là có khả năng ức chế tyrosianse mạnh sẽ
được dock với enzym tyrosinase (ID: 2Y9X) nhằm xác định năng lượng liên kết
Trang 26và tương tác với trung tâm hoạt động Quá trình dock được thực hiện theo 3 bước
như sau:
Bước 1: Chuẩn bị cấu trúc enzym và cơ chất dưới dạng file moe
Cấu trúc tyrosinase từ file 2Y9X được loại bỏ phối tử (trong nghiên cứu này
là Tropolon), các phân tử nước, các phân tử nền, giữ lại chuỗi A (dùng phần mềm
UCSF Chimera 1.11.2), tinh chỉnh trung tâm hoạt động (dùng phần mềm MOE 2009.10) và được ghi lại dưới dạng file moe Cấu trúc của phối tử (các hợp chất
trong CSDL đã được dự đoán là có hoạt tính ức chế tyrosinase mạnh) được chuyển
từ dạng 2D sang 3D (sử dụng phần mềm ChemBioDraw Ultra 12.0) và tối ưu hóa
sơ bộ dùng MOE 2009.10, sau đó ghi lại dưới dạng file moe.
Bước 2: Docking
Sau khi lựa chọn trường lực (ForceField) và loại năng lượng cần tính toán (
G), enzym và phối tử được dock với nhau tự động Thuật toán tìm kiếm được sử
dụng là kết hợp thuật giải di truyền với tối ưu hóa cục bộ Các thông số sử dụngmặc định của phần mềm
Bước 3: Xử lý kết quả
Kết quả được đưa ra là một danh sách các cấu dạng liên kết của enzym vàphối tử được sắp xếp theo thứ tự năng lượng liên kết tăng dần Cấu dạng có tươngtác với trung tâm hoạt động của enzym đồng thời có năng lượng liên kết nhỏ nhất sẽđược ưu tiên lựa chọn
2.2.4 Xử lý số liệu
Số liệu được xử lý bằng phương pháp thống kê, lọc sử dụng phần mềm
Microsoft Office Excel 2013.
Trang 27Chương 3 - KẾT QUẢ VÀ BÀN LUẬN 3.1 Kết quả tìm kiếm đồng dạng
Kết quả sau khi tính toán hệ số tương đồng Tanimoto được lưu lại và xử lý
bằng Microsoft Office Excel 2013 (Hình 6) Trong đó, các giá trị in đậm là các giá
trị lớn nhất của hệ số Tanimoto được lựa chọn để sắp xếp độ tương đồng theo chiều
giảm dần
Hình 6: Giá trị T c của các chất trong CSDL tương ứng với 12 chất mẫu
Giá trị T c max của các hợp chất trong CSDL được phân bố như Hình 7 75%
hợp chất có giá trị T c max nằm trong khoảng từ 0,5-0,75 Dưới 15% hợp chất có T c max
được lọc bằng Excel và sắp xếp theo thứ tự giảm dần độ tương đồng Sự phân bố T cmax
của các chất thu được lúc này được biểu diễn trong Hình 8 Gần 50% số hợp chất trong
CSDL có độ tương đồng với hợp chất mẫu Ref8 trong khi không có hợp chất nào trongCSDL tương đồng với Ref6 Sau khi loại đi các hợp chất có hệ số tương đồng dưới 0,75thì 174 hợp chất còn lại, chủ yếu tương đồng với Ref8 (116/174 hợp
Trang 28chất) và Ref9 (38/174 hợp chất) Không có hợp chất nào trong CSDL có độ tươngđồng trên 0,75 với Ref2, Ref3, Ref4, Ref6, Ref7, Ref11 và Ref12.
0
Ref1
Hình 8: Phân bố giá trị T c max theo từng chất mẫu
Như vậy, 1376 hợp chất trong CSDL qua phễu lọc tìm kiếm tương đồng thuđược 174 hợp chất (12,64% tổng số chất) có độ tương đồng từ 0,75 được sắp xếptheo thứ tự giảm dần độ tương đồng
3.2 Kết quả mô hình QSAR
174 hợp chất thu được sau phễu lọc tìm kiếm đồng dạng sẽ được vẽ lại bằngphần mềm TOMOCOMD-CARDD và được lưu lại dưới dạng file *.net Ví dụ về
cấu trúc VNPD_ID929 được biểu diễn lại bằng TOMOCOMD-CARD như Hình 9.
Trang 29Hình 9: Cấu trúc VNPD_ID929 được vẽ lại bằng TOMOCOMD-CARDD
20
Trang 3011 tham số phân tử phục vụ cho mô hình QSAR phân loại và 14 tham sốphân tử sử dụng cho mô hình QSAR hoạt tính được tính toán dựa trên 174 file *.net
ở trên bằng phần mềm TOMOCOMD-CARDD Kết quả các tham số phân tử thu
được tương ứng với 2 mô hình QSAR cuối cùng được biểu diễn trong Phụ lục 3.
174 hợp chất với độ tương đồng trên 75% tiếp tục được lọc qua mô hìnhQSAR phân loại và QSAR hoạt tính thu được 41 hợp chất được dự đoán là có hoạttính ức chế tyrosinase và 34 hợp chất được dự đoán là có hoạt tính ức chế tyrosinase
mạnh (Phụ lục 4) 34 hợp chất được dự đoán là có hoạt tính ức chế tyrosinase mạnh
chủ yếu thuộc vào nhóm flavonoid (7/34 hợp chất) và triterpenoid (13/34 hợp chất)
Cụ thể phân loại 34 chất vào các nhóm như Hình 10.
Triterpenoid
Flavonoid Stigmastan Terpene lacton
Sesterterpenoid
Ergostane steroid
Naphthalen Stigmastane
Steroid
Hình 10: Phân bố các nhóm chất
3.3 Kết quả Docking
Áp dụng phương pháp Docking 34/1376 hợp chất trong CSDL với trung tâm
hoạt động của enzym tyrosinase được kết quả là danh sách các cấu dạng liên kết và
năng lượng liên kết được trình bày cụ thể trong Phụ lục 5.
Trang 31Phân tích kết quả Docking, tất cả 34 hợp chất đều có khả năng chui vào túi
enzym của trung tâm hoạt động (tất cả đều có năng lượng liên kết âm với đích, từ 8,7921 đến -3,8160 Kcal/mol) nhưng chỉ có 21/34 hợp chất có khả năng liên kết vớiion Cu2+ nằm tại đáy túi trung tâm hoạt động của tyrosinase (Bảng 2) Trong đó, 13
-hợp chất liên kết với cả 2 ion đồng của trung tâm hoạt động, 8 -hợp chất được dựđoán là có khả năng liên kết với 1 ion đồng của trung tâm hoạt động, còn lại 13 hợpchất không tạo được liên kết phối trí với ion đồng và được dự đoán là không có khả
Trang 3218192021
Trang 333.4 Bàn luận
3.4.1 Về phương pháp sàng lọc ảo
Việc ứng dụng các kỹ thuật máy tính (sàng lọc ảo) trong quá trình nghiên cứu
và phát triển thuốc đang là một xu thế chung của các ngành công nghiệp dược phẩmtrên toàn thế giới Số lượng các bài báo về sàng lọc ảo tăng lên hàng năm, chứng tỏlĩnh vực này đang rất được quan tâm Điều này có thể giải thích là do các kỹ thuậtsàng lọc ảo có nhiều ứng dụng trong nghiên cứu về thiết kế thuốc, phát triển các hợpchất ức chế trên đích sinh học khác nhau, điển hình như các đích phân tử cho nhữngbệnh đang được quan tâm hiện nay như ung thư, bệnh do ký sinh trùng, bệnh HIV…
Vì thế, áp dụng các kỹ thuật sàng lọc ảo sẽ giúp Việt Nam tiếp cận và theo kịp vớicác kỹ thuật mới trên thế giới
Mặt khác, trong nghiên cứu này, quá trình sàng lọc ảo được áp dụng trên CSDL
mà nhóm nghiên cứu đã xây dựng được Việc sàng lọc CSDL này là một hướng đinhanh và hiệu quả nhất cho việc phát triển một thuốc mới vì các hợp chất trong CSDL
đã được xác định, phân lập từ thảo dược ở Việt Nam (tránh được giai đoạn tổng hợp)
Để sàng lọc được ngân hàng này nhanh và chính xác, việc thiết lập một quy trình sànglọc ảo một cách hệ thống, có nhiều phễu lọc khác nhau là rất cần thiết
Phương pháp sàng lọc ảo chất ức chế tyrosinase sử dụng các mô hình toán học
mới có tính chính xác cao, được xây dựng sử dụng mô hình hợp (multiclassifiers), và
hệ thống trình sàng lọc ảo (có nhiều phễu lọc) cho phép phát hiện các hợp chất ức chếenzym tyrosinase mới có hoạt tính cao chỉ từ cấu trúc phân tử
Bên cạnh những ưu điểm trên, sàng lọc ảo cũng còn gặp một số khó khănnhư sự khác biệt giữa mô hình hóa và thực tế diễn ra trong cơ thể con người, sựchính xác trong việc xác định cấu trúc 3D của protein, hay việc sử dụng quá nhiềuphễu lọc cũng có thể gây tăng sai số cho quá trình Chính vì vậy, việc phối hợp các
kỹ thuật in silico, in vivo, in vitro là rất cần thiết.
Về kỹ thuật tìm kiếm đồng dạng
Việc sử dụng mô tả 2D để mô tả phân tử vừa đơn giản, dễ thực hiện, vừa tiếtkiệm thời gian Mô tả phân tử 2D thường ổn định hơn so với mô tả phân tử 3D vì mô tả2D chỉ mang một giá trị duy nhất trong khi mô tả 3D có thể mang nhiều giá trị do độlinh động về cấu dạng Vì thế, sử dụng mô tả phân tử 2D sẽ làm tăng hiệu quả cho quá
trình tính toán Trong khóa luận này, vân tay điện tử MACCS (Molecular ACCESS System) được sử dụng để biểu diễn cho các phân tử trong CSDL và các hợp
Trang 34chất mẫu MACCS là một mô tả cấu trúc 2D, sử dụng 166 bit để mã hóa thông tin vềnguyên tử, loại nguyên tử, vòng và các liên kết trong phân tử MACCS được tính toán
bằng phần mềm CDK DescUI-1.4.6 sử dụng dữ liệu đầu vào là SMILE (là ngôn ngữ
dùng để biểu diễn cấu trúc hóa học và các phản ứng) Bên cạnh những ưu điểm của một
mô tả 2D, việc sử dụng MACCS để mô tả phân tử còn có một số hạn chế MACCS làvân tay từ điển (điều này có nghĩa là một từ điển cố định về các mảnh cấu trúc sẽ được
sử dụng trong quá trình mã hóa hợp chất), như vậy, nếu hợp chất có chứa mảnh cấu trúckhông được định nghĩa trong từ điển thì mảnh cấu trúc đó sẽ không xuất hiện trong kếtquả mô tả phân tử nhận được, gây ra sai số cho mô tả
Hệ số Tanimoto được sử dụng để biểu diễn sự giống nhau giữa các chất của
CSDL được sàng lọc và chất mẫu Đây là hệ số tương đồng được sử dụng rộng rãi nhấttrong lĩnh vực hóa tin do thuật toán đơn giản, dễ thực hiện và nhanh chóng và hiệu quảhơn so với các hệ số tương đồng khác Tuy nhiên, trong các nghiên cứu về so sánh các
hệ số tương đồng đã chỉ ra rằng, việc sử dụng kết hợp các hệ số tương đồng sẽ mang lạihiệu quả cao hơn cho quá trình sàng lọc [4] Hoặc việc xây dựng nên một vân tay mẫu
(model fingerprint), là dấu vân tay được kết hợp từ dấu vân tay của các hợp chất mẫu
cũng là một cách làm tăng hiệu quả cho quá trình tìm kiếm
Qua quá trình sàng lọc ảo dựa vào đồng dạng, 12,64% số hợp chất đạt yêucầu đã được lựa chọn, việc làm này đã tiết kiệm được thời gian cho quá trình sànglọc dựa vào đồng dạng, cung cấp các chất đầu vào có tiềm năng cao hơn cho cácphễu lọc sau Như vậy, đây là một phễu lọc vô cùng hữu ích, tiết kiệm được thờigian và công sức cho quá trình sàng lọc
Về kỹ thuật sàng lọc sử dụng mô hình QSAR
QSAR hiện nay đang là một kỹ thuật được ứng dụng trong rất nhiều các lĩnhvực như dược phẩm, y học, hóa học Có rất nhiều nghiên cứu trên thế giới sử dụng
mô hình QSAR để sàng lọc các hoạt chất chống ung thư phổi [85], điều trị bệnhParkinson, điều trị các bệnh đái tháo đường, HIV [58] Trong nước hiện nay cũng
đã bắt đầu sử dụng mô hình QSAR trong nghiên cứu phát triển thuốc như Thái KhắcMinh và cộng sự đã xây dựng thành công mô hình QSAR các hợp chất ức chếtopoisomerase I và các chất chống ung thư [74] Tuy nhiên, các nghiên cứu sử dụng
mô hình QSAR hầu hết chỉ sử dụng mô hình đơn, có rất ít các nghiên cứu sử dụng
hệ thống phân loại hợp (kết hợp đầu ra của các mô hình đơn) trong khi hệ thốngphân loại hợp là một dụng cụ rất hiệu quả trong các nghiên cứu QSAR
Trang 35Nghiên cứu này sử dụng mô hình phân loại hợp QSAR trong các công bốtrước đó của TS Lê Thị Thu Hường cùng nhóm nghiên cứu [34] Nhóm nghiên cứu
đã xây dựng rất nhiều mô hình đơn và mô hình hợp với các thuật toán khác nhau để
mô tả mối liên quan định lượng giữa cấu trúc và tác dụng của hợp chất ức chếenzym tyrosinase Các mô hình lần lượt được đánh giá Kết quả cho thấy, việc sửdụng mô hình hợp mang lại hiệu quả cao hơn so với việc sử dụng mô hình đơntrong việc dự đoán hợp chất có tác dụng ức chế tyrosinase Đồng thời, các mô hìnhđược xây dựng dựa trên tập huấn luyện bao gồm rất nhiều hợp chất (1027 hợp chất)làm tăng độ chính xác của mô hình Chính vì thế mà việc áp dụng mô hình hợpQSAR vào nghiên cứu này đã mang lại hiệu quả cao cho quá trình sàng lọc
Tuy nhiên, mô hình QSAR không phải là mô hình sẵn có, để xây dựng được
mô hình, cần phải có thông tin về cấu trúc, hóa học, thực nghiệm của tập hợp cácchất được dùng làm tập huấn luyện, đồng thời phải có hiểu biết về phân tích thống
kê, mô hình học máy khá phức tạp
Về kỹ thuật docking
Docking là một kỹ thuật phổ biến hiện nay để mô phỏng các tương tác giữa
protein với protein hoặc giữa protein và phối tử, được ứng dụng để thiết kế thuốcdựa vào cấu trúc, tối ưu hóa hợp chất dẫn đường, hay nghiên cứu cơ chế tác dụng
của các thuốc… Tuy nhiên, docking có nhược điểm là cần có thông tin về cấu trúc
3D của protein, cấu dạng của cơ chất và protein đều có thể bị thay đổi, giữa cơ chất
và enzym còn có các tương tác khác như tương tác van der Waals, tương tác tĩnhđiện, trong nhiều trường hợp còn có tương tác hóa học khác
Hơn 60 phần mềm docking được phát triển trong suốt 2 thập kỷ qua bao gồm
cả phần mềm thương mại và phần mềm học thuật như là DOCK [19], AutoDock [3],MOE [59], GOLD [23] Trong đó, các phần mềm thương mại được đánh giá là có
độ chính xác cao hơn so với các phần mềm học thuật MOE 2009.10 là một phần mềm docking thương mại với hàm tính toán có độ chính xác cao nằm trong top đầu [60] Vì thế, các kết quả docking nhận được trong nghiên cứu này đều có độ chính xác cao Đây cũng là lý do vì sao docking được thực hiện bằng phần mềm MOE
2009.10 trong nghiên cứu này.
Tyrosinase tồn tại trong thực vật, động vật, nấm và vi khuẩn Tyrosinase tiêu
biểu nhất là tyrosinase được phân lập từ các loài vi khuẩn Streptomyces, từ nấm
Neurospora crassa và Agaricus bisporus Ngày nay, enzym nội bào từ A.bisporus là