Sơ đồ nghiên cứu hoạt tính estrogen

Một phần của tài liệu (LUẬN án TIẾN sĩ) nghiên cứu quan hệ cấu trúc hóa học và hoạt tính (QSAR) estrogen của bisphenol a và các dẫn xuất (Trang 58 - 65)

Bảng 2.2. Dữ liệu thực nghiệm về hoạt tính sinh học của bộ chất nghiên cứu [60] STT Hợp chất lgEC50 (Gene induction) STT Hợp chất lgEC50 (Gene induction) 1 DM DMB Bis A -1,99 13 MM2 -3,57 2 DMB Bis A -2,03 14 TM Bis A -3,8 3 MM4 -2,28 15 o,p‟-Bis A -3,96 4 Bis A -2,56 16 Mono Mxy Bis A -4,04 5 HF Bis A -2,79 17 P Bis A -4,05 6 DM HPTE -2,91 18 PCP -4,05 7 MM1 -3,15 19 MH MM1 -4,05 8 Bis F -3,28 20 MH Bis F -4,05 9 Bis B -3,28 21 TC Bis A -6,04 10 DM Bis A -3,31 22 TB Bis A -6,04 11 HPTE -3,37 23 Mxy Bis A -6,04 12 1844-00-44 -3,38

2.2. Tính tốn các thơng số hóa lƣợng tử. Chƣơng trình Gaussian

2.2.1. Bộ thơng số hóa lượng tử

Thơng số hóa lƣợng tử tỏ ra khá hiệu quả trong nghiên cứu QSAR xét về chất lƣợng thông tin mô tả cấu trúc phân tử lẫn mức độ phức tạp trong thiết lập mơ hình tính tốn cũng nhƣ độ chính xác thu đƣợc từ các mơ hình tính. Do đó, khá nhiều thơng số hóa lƣợng tử đƣợc khảo sát và ứng dụng trong các nghiên cứu QSAR. BPA BPF TCBPA Luciferin + ATP Luc Tế bào MVLN ERα Phát quang sinh học

Khi xét đến tính đơn giản trong luận giải mối quan hệ cấu trúc - hoạt tính, đồng thời để đảm bảo sự đánh giá khách quan trên diện rộng về những yếu tố quy định dạng phụ thuộc cấu trúc - hoạt tính. Trong luận án này, với kích thƣớc của bộ hợp chất đƣợc lựa chọn để nghiên cứu, tôi ƣu tiên chọn lựa những thông số lƣợng tử cơ bản và cho phép tính tốn với độ chính xác cao bằng các công cụ đƣợc chọn lựa.

Theo đó, bộ thơng số hóa lƣợng tử đƣợc đƣa vào tính tốn trong khn khổ của luận án này đã đƣợc chọn lựa và trình bày ở Bảng 2.3.

Bảng 2.3. Các thông số lượng tử được khảo sát để xây dựng mơ hình

STT Tên và ký hiệu các thông số lƣợng tử Đơn vị

1 Độ dài liên kết Å

2 Góc liên kết Độ

3 Góc nhị diện Độ

4 EHOMO - Năng lƣợng của orbital phân tử bị chiếm cao nhất eV 5 ELUMO- Năng lƣợng của orbital phân tử chƣa bị chiếm thấp nhất eV

6 µ- Moment lƣỡng cực phân tử Debye

7 Esp-Tổng năng lƣợng phân tử eV

8 ΔE = ELUMO - EHOMO: đặc trƣng độ chênh lệch giữa hai mức năng

lƣợng orbital phân tử HOMO và LUMO eV

9 ( )

2

LUMO HOMO

E E

    : độ âm điện của phân tử (trong khuôn khổ thuyết Koopman ELUMO = -A, EHOMO= -I, trong do A: ái lực electron, I- năng luong ion hóa )

eV 10 2 LUMO HOMO E E    độ cứng của phân tử; eV 11 2 2    : chỉ số độ phản ứng (reactivity index)

12 Mật độ electron tại các nguyên tử carbon trên khung phân tử

13 R1_HOMO, R1_LUMO, R2_HOMO, R2_LUMO, GOC_HOMO,

GOC_LUMO: Phần trăm đóng góp vào EHOMO, ELUMO của các thành

phần R1, R2 và vòng thơm trong phân tử khảo sát

2.2.2. Phương pháp tính B3LYP. Chương trình Gaussian

Lý thuyết DFT cho phép tính tốn nhiều đặc tính về cấu trúc hình học của phân tử cũng nhƣ các năng lƣợng liên kết trong phân tử. Tuy nhiên, nhƣ đã đề cập ở trên, hiệu quả của phƣơng pháp phiếm hàm mật độ DFT phụ thuộc vào việc lựa chọn các phiếm hàm tƣơng quan-trao đổi phù hợp. Trong khuôn khổ của hóa học lƣợng tử, có quá nhiều phiếm hàm DFT đƣợc nghiên cứu và tích hợp trong các phần mềm tính tốn với những ƣu điểm và những hạn chế khác nhau. Bên cạnh đó, với cùng một phiếm hàm DFT, các tính tốn tỏ ra khá hiệu quả đối với nhóm tính chất lƣợng tử này lại tỏ ra kém hiệu quả đối với nhóm tính chất lƣợng tử khác. Ngồi ra, chọn lựa một bộ hàm cơ sở thích hợp cũng góp phần cải thiện và nâng cao chất lƣợng và tốc độ của các tính tốn. Do đó, bài tốn quan trọng trong tính tốn các cấu trúc lƣợng tử là khảo sát, đánh giá, so sánh và lựa chọn các phiếm hàm DFT phù hợp với các dạng tham số lƣợng tử cần tính tốn, kết hợp với các bộ hàm cơ sở tƣơng thích.

Trong khn khổ luận án này, để có đƣợc chất lƣợng tính tốn tốt cho nhóm tính chất lƣợng tử cần tính (Bảng 2.3), tơi tiến hành tìm kiếm và phân tích các tài liệu đánh giá về chất lƣợng của một số phiếm hàm DFT đối với nhóm tính chất kể trên.

Các phân tích cho thấy, phƣơng pháp B3LYP tỏ ra khá hiệu quả và đƣợc sử dụng trong nhiều cơng trình nghiên cứu với độ chính xác đáng tin cậy [27, 74, 102]. Bên cạnh đó, trong các nghiên cứu về liên kết hydro, các bộ cơ sở chuẩn 6-31+G(d), 6-31++G(d), 6-31++G(d,p) và 6-311++G(d,p) thƣờng đƣợc sử dụng và cho kết quả tính tốn tốt. Đối với các tính tốn về các năng lƣợng electron khác và các tần số dao động, các bộ cơ sở 6-31+G(d) và 6-31++G(d,p) thƣờng đƣợc sử dụng để đảm bảo độ khuyếch tán và tính linh hoạt góc cho các orbital nguyên tử. Tuy nhiên, bộ cơ sở lớn 6-31++G(d,p) cho kết quả tính tốn rất chậm [77, 23].

Để thực hành phƣơng pháp tính nói trên, tôi sử dụng bộ phần mềm Gaussian 09 và Gaussview 06, trình tự tính tốn đƣợc cho trên Hình 2.3.

Hình 2.3. Trình tự tính tốn thơng số hóa lượng tử sử dụng bộ phần mềm Gaussian 09 và Gaussview 06

- Thiết kế phân tử: cấu trúc phân tử của bộ chất cần tính đƣợc thiết lập

bằng phần mềm Gaussvie 06. Thơng số đầu vào cho việc thiết kế phân tử bao gồm: thông tin về cấu trúc phân tử nhƣ ma trận Z hoặc bảng tọa độ các nguyên tử (Molecular Specification); điện tích và độ bội (Charge & Multiple.); phƣơng pháp tính và bộ hàm cơ sở (Route Section) …

- Tối ưu hố hình học: các cấu trúc vừa xây dựng đƣợc tối ƣu hóa hình học.

- Tính tốn các thơng số lượng tử: thực hiện trên các cấu trúc đã tối ƣu

hóa ở trên, giá trị các thơng số cấu trúc tính đƣợc sẽ đóng vai trị là các biến độc lập để xây dựng mơ hình QSAR.

2.3. Phƣơng pháp xây dựng và đánh giá mơ hình

2.3.1. Lựa chọn thơng số cấu trúc

Các thông số lƣợng tử (cấu trúc, năng lƣợng) thu đƣợc từ q trình tính tốn theo phƣơng pháp mơ tả trong mục 2.2 đƣợc sử dụng nhƣ các biến độc lập, kết hợp với các giá trị sinh hóa thực nghiệm đƣợc chọn lọc - đóng vai trò là các biến phụ thuộc tạo ra bộ dữ liệu số để xây dựng mơ hình QSAR. Tuy nhiên, khơng phải tất cả các thơng số tính tốn đƣợc đều có ý nghĩa thống kê đối với mơ hình. Do đó, phải tiến hành đánh giá chọn lọc các biến tiềm năng để xây dựng bộ dữ liệu cấu trúc. Việc chọn biến đƣợc thực hiện bằng cách khảo sát mức độ tƣơng quan lẫn nhau giữa các thông số cấu trúc và mức độ tƣơng quan của chúng so với các tham số hoạt tính thông qua ma trận hệ số tƣơng quan Pearson - là chỉ số thống kê đo lƣờng mối liên hệ tƣơng quan giữa hai biến số. Hệ số tƣơng quan Pearson giữa 2 biến x, y đƣợc tính theo cơng thức:

Tối ƣu hố hình học Gaussian 09 Tính tốn các thông số lƣợng tử Thiết kế phân tử Gausview 06

( )( ) ( 1) N i i i x y x x y y r N S S      (2.1)

Trong đó: N là số hợp chất quan sát; Sx, Sy là độ lệch chuẩn của từng biến x và y; Hệ số tƣơng quan r có giá trị từ -1 đến 1, r càng gần 0, hai biến số liên hệ với nhau càng ít; ngƣợc lại nếu r = -1 hay r = 1 có nghĩa là hai biến số có một mối liên hệ tuyệt đối. Nếu giá trị của hệ số tƣơng quan là âm (r <0) chúng ta có tƣơng quan nghịch; nếu giá trị hệ số tƣơng quan là dƣơng (r > 0) chúng ta có tƣơng quan thuận.

Hệ số tƣơng quan r có thể đƣợc tính tốn bằng các phần mềm thống kê khác nhau nhƣ SPSS, STATGRAPHICS Centurion. Trong luận án này, tôi sử dụng phần mềm STATGRAPHICS Centurion 15 để khảo sát sự tƣơng quan giữa các tham số cấu trúc và giữa tham số cấu trúc với giá trị hoạt tính.

Căn cứ vào kết quả tính tốn ma trận hệ số tƣơng quan Pearson các tham số cấu trúc khơng có sự tƣơng quan (hoặc kém tƣơng quan) với tham số hoạt tính sẽ bị loại bỏ; đối với các tham số cấu trúc khơng chỉ có mối tƣơng quan với hoạt tính mà cịn có sự tƣơng quan lẫn nhau, chỉ giữ lại 1 tham số có sự tƣơng quan lớn nhất so với hoạt tính.

Sau khi khảo sát mức độ tƣơng quan lẫn nhau giữa các tham số cấu trúc thông qua ma trận hệ số tƣơng quan Pearson, bộ tham số cấu trúc tiếp tục đƣợc lọc lựa thông qua thủ tục khảo sát độ nhạy (Sensitivity about the mean) của chúng với giá trị hoạt tính. Bản chất của thao tác này là khảo sát sự biến thiên hoạt tính theo sự biến thiên của một biến độc lập trong khi vẫn giữ nguyên giá trị các biến độc lập khác. Các thủ tục này đƣợc thực hiện trên chƣơng trình NeuroSolution 6.0 và add-in NeuroSolution for Excel.

2.3.2. Phương pháp hồi quy đa biến tuyến tính. Chương trình STATGRAPHICS Centurion 15 STATGRAPHICS Centurion 15

Sau khi đã sàng lọc bộ dữ liệu cấu trúc và hoạt tính, tiến hành phân tích hồi quy. Hồi quy đa biến tuyến tính (MLR) đƣợc sử dụng rất phổ biến trong thực tế, là tổ hợp tuyến tính giữa các biến phụ thuộc với nhiều biến độc lập. Phân tích hồi quy bao hàm cả ý nghĩa “ƣớc tính” (Estimating) hay “dự đốn” (Predictive) vì sau khi sự tƣơng quan tuyến tính giữa x và y đƣợc thiết lập bởi một biểu thức tốn học cụ thể, ngƣời ta có thể ƣớc tính hay dự đốn giá trị của y từ một giá trị của x. Đƣờng biểu diễn biểu thức toán học ấy đƣợc gọi là đƣờng hồi quy của y theo x.

0 1 1 2 2 ... 0 ij k i i i k ik i j i j y   x  x   x     x  (2.2)

εi thƣờng đƣợc gọi là sai số, là chênh lệch giữa giá trị quan sát đƣợc yk và trung bình của tập con các giá trị của biến y tại điểm xk; εi đƣợc xem là biến ngẫu nhiên, có trung bình bằng 0 và phƣơng sai là ζ2.

Các hệ số trong phƣơng trình đƣợc ƣớc lƣợng theo nguyên tắc bình phƣơng tối thiểu, nghĩa là làm sao cho tổng bình phƣơng các phần dƣ dƣới đây là nhỏ nhất. 2 2 2 0 ij 1 1 1 1 ( - ) N k N N tinh i j i i i i j i i e y   x y y                        (2.3)

Trong đó số bộ dữ liệu N ít nhất phải lớn hơn hoặc bằng số biến độc

lập k;

Điều kiện này đạt đƣợc khi đạo hàm của εi theo các hệ số αi của phƣơng trình hồi quy triệt tiêu: 0

i e

 

 .

Các mơ hình hồi quy đa biến tuyến tính có thể đƣợc thiết lập một cách tự động bởi các chƣơng trình phân tích thống kê nhƣ SPSS, SAS,

STATGRAPHICS Centurion 15… Trong luận án này, tôi sử dụng phần mềm STATGRAPHICS Centurion 15 [96].

Một điểm cần lƣu ý là từ cùng một tập biến có thể xây dựng đƣợc nhiều mơ hình hồi quy. Muốn sàng lọc các biến độc lập xi có tƣơng quan tuyến tính với biến phụ thuộc trong một nhóm dữ liệu có N trƣờng hợp quan sát, ngƣời ta thực hiện hồi quy chọn mơ hình (regrassion model selection). Căn cứ lựa chọn bộ biến độc lập để xây dựng mơ hình QSAR chính là hệ số hiệu chỉnh 2

a

R , nó đƣợc sử dụng để phản ánh sát hơn mức độ phù hợp của mơ hình hồi quy đa biến tuyến tính. Giá trị này thƣờng đƣợc dùng để so sánh mơ hình hồi quy với số biến độc lập khác nhau. 2 2 2 (1 ) 1 a k R R R N k      , (2.4) Trong đó: R2 là hệ số xác định: 2 2 2 (y y ) 1 (y y ) obs calc obs training R       (2.5) N - số hợp chất dùng xây dựng mơ hình k - số biến độc lập sử dụng trong mơ hình

Sau một loạt các thủ tục sàng lọc và lựa chọn biến đầu vào, tiến hành xây dựng mơ hình QSAR. Trình tự xây dựng mơ hình trên phần mềm STATGRAPHICS Centurion 15 bao gồm: 1) nhập số liệu; 2) thiết lập mơ hình; 3) Nhấn OK để hiển thị bảng Analysis Summary.

2.3.3. Phương pháp mạng neural nhân tạo (ANN). Các chương trình xây dựng mạng ANN dựng mạng ANN

NeuroSolutionTM là một trong những phần mềm mô phỏng ANN lâu đời và tƣơng đối hoàn chỉnh do tập đoàn Neuro Dimension Inc. phát triển. Trong luận án này, tôi sử dụng bộ phần mềm NeuroSolutionTM phiên bản 6.0. Giao diện của NeuroSolution for Excel đƣợc minh họa trên Hình 2.4.

Một phần của tài liệu (LUẬN án TIẾN sĩ) nghiên cứu quan hệ cấu trúc hóa học và hoạt tính (QSAR) estrogen của bisphenol a và các dẫn xuất (Trang 58 - 65)

Tải bản đầy đủ (PDF)

(153 trang)