Cửa sổ khởi tạo mạng neural nhân tạo trong Matlab

Một phần của tài liệu (LUẬN án TIẾN sĩ) nghiên cứu quan hệ cấu trúc hóa học và hoạt tính (QSAR) estrogen của bisphenol a và các dẫn xuất (Trang 66)

Hình 2.6. Cửa sổ khởi tạo mạng neural nhân tạo trong Matlab

Trình tự xây dựng mạng ANN trên Matlab về cơ bản không khác biệt so với trên Neuralbuilder. Ƣu điểm của Matlab so với NeuralBuilder là khả năng tự động thiết lập Learning rule phù hợp cũng nhƣ khả năng tự động tính tốn các thơng số thống kê trên bộ kiểm và bộ tham chiếu [7].

2.3.4. Kiểm tra đánh giá mơ hình QSAR

Chất lƣợng và khả năng dự đốn của các mơ hình đƣợc đánh giá bằng các phép tham chiếu trong và ngồi (internal và external validation) thơng qua các chỉ số thống kê.

Mơ hình đánh giá đƣợc xây dựng trên toàn bộ tập dữ liệu và sử dụng

phép tham chiếu chéo-LOO (Leave-one-out cross-validation) để tính tốn các chỉ số dự đốn nội mơ hình. Ở mỗi thủ tục của phép tham chiếu chéo LOO, một hợp chất sẽ bị loại bỏ khỏi tập dữ liệu sau đó tiến hành xây dựng mơ hình QSAR mới trên các hợp chất cịn lại và sử dụng mơ hình này để dự đốn hoạt

tính của hợp chất bị loại bỏ. Thủ tục này đƣợc lặp lại cho đến khi tất cả các hợp chất của bộ dữ liệu đều 1 lần bị loại bỏ và đƣợc dự đốn hoạt tính. Sau khi kết thúc vòng lặp tham chiếu chéo, kết quả dự đoán của tất cả các hợp chất đƣợc tổng hợp để tính tốn các chỉ số dự đốn nội mơ hình [92, 111].

Tuy nhiên, theo Tropsha và các chuyên gia trong lĩnh vực nghiên cứu QSAR [8], các chỉ số dự đốn nội mơ hình khơng đảm bảo khả năng dự đoán đối với các hợp chất mới nằm ngồi mơ hình, một mơ hình QSAR chất lƣợng và có khả năng dự đốn ổn định thực sự phải đƣợc xây dựng kèm theo các phép tham chiếu trong lẫn ngồi.

Mơ hình dự đốn với các phép tham chiếu trong và ngoài đƣợc xây dựng

trên cơ sở phân chia bộ dữ liệu thành bộ luyện (training set) và bộ kiểm (test set). Theo đó, mơ hình dự đốn sẽ đƣợc xây dựng trên các hợp chất của bộ luyện. Phép tham chiếu chéo LOO thực hiện trên bộ luyện đƣợc sử dụng làm phép tham chiếu trong để cho các đánh giá về khả năng dự đốn nội mơ hình. Phép tham chiếu ngồi của mơ hình đƣợc thực hiện bằng cách sử dụng mơ hình để dự đốn hoạt tính của các hợp chất trong bộ kiểm, sau đó các giá trị dự đốn sẽ đƣợc tổng hợp để tính tốn các chỉ số dự đốn ngoại mơ hình.

Các chỉ số thống kê quan trọng của mơ hình QSAR:

Hệ số xác định (R2): bình phƣơng hệ số tƣơng quan giữa các giá trị hoạt

tính sinh hóa tính theo mơ hình hồi quy và các giá trị thực nghiệm.

2 2 2 (y y ) 1 (y y ) obs calc obs training R       , (2.6)

Nếu giá trị R2 càng gần 1, mơ hình mơ tả càng tốt các số liệu thực nghiệm, các giá trị hoạt tính ycalc rất gần các giá trị hoạt tính thực nghiệm yobs.

Hệ số hiệu chỉnh (Ra2): đƣợc sử dụng để phản ánh sát hơn mức độ phù hợp của mơ hình hồi quy đa biến tuyến tính (MLR). Giá trị này thƣờng đƣợc dùng để so sánh mơ hình hồi quy với số biến độc lập khác nhau.

2 2 2 (1 ) 1 a k R R R N k      , (2.7)

N - số hợp chất dùng xây dựng mơ hình; k - số biến độc lập sử dụng

trong mơ hình;

Phương sai (MSE): sử dụng để phản ánh mức độ phân tán của một tập

dữ liệu. 2 (yobs ycalc) MSE n   , (2.8)

Tính tổng qt của mơ hình (Q2): đƣợc sử dụng để kiểm tra khả năng dự đoán nội mơ hình bằng phép tham chiếu trong LOO thực hiện trên bộ khảo luyện (training set).

2 (training) (training) 2 2 (training) training (y y ) 1 (y y ) obs pred LOO obs Q       , (2.9)

Chƣơng III

KẾT QUẢ VÀ THẢO LUẬN

Chƣơng này trình bày kết quả tính tốn các tham số cấu trúc của phân tử BPA và các dẫn xuất; xây dựng mơ hình QSAR giữa các tham số cấu trúc tính đƣợc với hoạt tính estrogen của bộ chất nghiên cứu. Qua đó thiết kế các hợp chất mới và dự đốn hoạt tính của các hợp chất này thơng qua việc tính tốn các thơng số cấu trúc và mơ hình QSAR đã đƣợc lựa chọn.

3.1. Tính tốn các thơng số cấu trúc của phân tử BPA và các dẫn xuất

3.1.1. Lựa chọn bộ hàm cơ sở trong tính tốn cấu trúc phân tử BPA và các dẫn xuất

Các thông số lƣợng tử quyết định cấu trúc hình học của phân tử. Ngƣời ta chấp nhận cấu trúc với trạng thái năng lƣợng toàn phần nhỏ nhất nhƣ mơ hình tồn tại trong thực tế. Từ cấu hình tối ƣu hóa hình học, tơi tính đƣợc các thơng số lƣợng tử quan tâm: năng lƣợng phân tử, mật độ điện tích, độ dài liên kết,… để rút ra một số quy luật và tính chất của bộ chất cần nghiên cứu.

Nhƣ đã đề cập ở phần trên, để tính tốn các thông số cấu trúc lƣợng tử, tôi lựa chọn chủ yếu phƣơng pháp B3LYP với bộ hàm cơ sở 6-31+G*, cc-pvdz và TZVP (Triple-Zeta Valance Polarization) đã đƣợc hiệu chỉnh bằng cách đƣa thêm vào bộ hàm gốc các tệp mật độ cơ sở mô phỏng TZVPfit [38, 40] đƣợc tích hợp trong phiên bản Gaussian 09 để tính tốn. Phép so sánh đƣợc thực hiện trên phân tử BPA là đại diện của bộ chất nghiên cứu, các thơng số tính tốn bao gồm: cấu trúc hình học phân tử (độ dài liên kết và góc liên kết), năng lƣợng phân tử, mật độ electron trên các nguyên tử carbon của vòng thơm và phổ hồng ngoại của phân tử. Kết quả các tính tốn này đƣợc so sánh với kết quả khảo sát thực nghiệm và các tính tốn đã cơng bố trên các tạp chí và cơng trình khoa học uy tín nhằm tìm ra bộ hàm phù hợp nhất. Cửa sổ thiết lập các thông số cần thiết cho q trình tính tốn các tham số lƣợng tử trong chƣơng

trình Gaussian 09 đƣợc trình bày trên Hình 3.1. Cấu trúc 3D của phân tử BPA sau khi chạy mô phỏng động lực học bằng Gaussian minh họa trên Hình 3.2.

Hình 3.1. Cửa sổ thiết lập tính tốn trên phần mềm Gaussian 09

Hình 3.2. Cấu trúc 3D của phân tử BPA trong chương trình Gaussian 09

Kết quả tính tốn các thơng số cấu trúc và năng lƣợng của phân tử BPA đƣợc trình bày trong Bảng 3.1 và 3.2. Sự phân bố điện tích trên nguyên tử carbon trong vịng thơm của BPA đƣợc trình bày trong Bảng 3.3.

Bảng 3.1. Các thông số cấu trúc hình học của phân tử BPA

Độ dài liên kết/Góc liên kết Bộ hàm cơ sở

TZVP 6-31+G* CC-PVDZ

Giá trị trung bình của liên kết

r(Cphenyl - Cphenyl) (Å) 1,394 1,400 1,400 Giá trị trung bình của liên kết

r(Cmetyl - Cphenyl)( Å) 1,510 1,542 1,542

Giá trị trung bình của liên kết

r(Cmetyl- Cmetyl)( Å) 1,528 1,549 1,546 Giá trị trung bình của liên kết

r(Cphenyl- O) (Å) 1,376 1,373 1,366 Giá trị trung bình của liên kết

r(Cmetyl - H) (Å) 1,116 1,096 1,100

Giá trị trung bình của liên kết

r(Cphenyl - H)( Å) 1,098 1,089 1,094

Cphenyl - Cphenyl - O (độ) 116,6 123,031 123,186

Cphenyl - O - H (độ) 107,8 109,759 108,565

Bảng 3.2. Các thông số năng lượng của phân tử BPA

Bộ hàm EHOMO (eV) ELUMO (eV) ΔE (eV) Esp (a.u)

TZVP -5,92 -0,51 5,410 -731,743 6-31+G* -5,93 -0,52 5,413 -731,698 CC-PVDZ -5,71 -0,28 5,436 -731,718

Bảng 3.3. Điện tích các ngun tử carbon trên vịng thơm của BPA (Vị trí đánh số các nguyên tử carbon trong vịng thơm xem trong Hình 2.1)

Atoms TZVP 6-31+G* CC-PVDZ C1 -0,201 -0,222 -0,212 C2 -0,274 -0,311 -0,307 C3 0,278 0,302 0,348 C4 -0,253 -0,277 -0,272 C5 -0,188 -0,208 -0,199 C6 -0,202 -0,208 -0,199 C7 -0,255 -0,277 -0,272 C8 0,278 0,302 0,348 C9 -0,271 -0,311 -0,307 C10 -0,187 -0,222 -0,212

Từ dữ liệu giá trị trong Bảng 3.1 cho thấy các thơng số cấu trúc hình học tính theo các bộ hàm cơ sở TZVP, 6-31+G* và CC-PVDZ có giá trị cơ bản đồng nhất, sai khác lớn nhất khơng q 5,5% (thuộc về góc liên kết Cphenyl -

Cphenyl - O).

Các giá trị năng lƣợng phân tử trong Bảng 3.2 phản ánh sự sai biệt giữa bộ hàm CC-PVDZ và 2 bộ hàm cịn lại. Theo đó, năng lƣợng HOMO và LUMO tính theo bộ hàm CC-PVDZ có giá trị nhỏ hơn đáng kể so với 2 bộ hàm còn lại. Tuy nhiên, rào cản năng lƣợng ΔE và năng lƣợng tồn phần Esp của phân tử tính theo cả 3 bộ hàm đều có giá trị tƣơng đồng. Ở đây, rào cản năng lƣợng ΔE là độ chênh lệch giữa 2 mức năng lƣợng của LUMO và HOMO, tính theo biểu thức: ΔE = ELUMO - EHOMO, phản ánh độ bền hóa học của liên kết trong các tƣơng tác electron. Với các phân tử có giá trị ΔE thấp, các electron ở HOMO chỉ cần một kích thích electron nhỏ để vƣợt qua một rào cản năng lƣợng thấp để chuyển lên obital trống tiếp theo (LUMO) và tham gia tƣơng tác hóa học. Ngƣợc lại, các phân tử có giá trị ΔE cao thể hiện độ bền hóa học cao. Nhƣ vậy, một mặt sự tƣơng đồng giữa các giá trị ΔE tính theo 3 bộ hàm cơ sở thể hiện tính tƣơng đồng của các bộ hàm trong mô tả độ linh động electron của các cấu trúc. Mặt khác, sự tƣơng đồng của các bộ cơ sở TZVP và 6-31+G* trong tính tốn năng lƣợng HOMO và LUMO cho thấy tính ổn định và độ tin cậy của chúng so với bộ hàm CC-PVDZ.

Bên cạnh đó, mật độ electron trên các nguyên tử carbon trong Bảng 3.3 tính theo cả 3 bộ hàm cũng có giá trị tƣơng đồng nhau. Trong đó, các nguyên tử C2 và C9 mang điện tích riêng phần nhỏ nhất, điều này phù hợp với các nghiên cứu thực nghiệm về sự tƣơng tác hóa học của phân tử. Theo đó, trong các phản ứng thế, khả năng thế tại các vị trí C2 và C9 cao hơn so với các vị trí khác [50].

Kết quả phân tích phổ hồng ngoại (IR) của BPA giống nhau đối với 3 bộ hàm và một phần phổ IR của BPA đƣợc trình bày trên Hình 3.3. Phổ này đƣợc so

sánh với phổ IR của BPA thu đƣợc bằng khảo sát thực nghiệm và phổ IR mơ phỏng thu đƣợc trong cơng trình [87] đƣợc trình bày trên Hình 3.4.

Hình 3.3. Một phần phổ IR của BPA tính tốn được theo các bộ hàm TZVP, 6-31+G* và CC-PVDZ

Hình 3.4. Một phần phổ hồng ngoại của BPA [87]

Trên các phổ hồng ngoại của BPA có vùng dao động tần số cao và trung bình là dao động của các nhóm OH, CH3. Vùng dao động tần số thấp ứng với các dao động hỗn hợp của nhiều nhóm chức. So sánh dữ liệu phổ IR thu đƣợc

từ tính tốn và từ thực nghiệm đƣợc cho trong Bảng 3.4. Kết quả cho thấy phổ thu đƣợc từ tính tốn lý thuyết trong luận án tƣơng đối đồng nhất so với phổ thu đƣợc từ mơ phỏng trong cơng trình [87] và phổ đo đƣợc từ thực nghiệm là khá phù hợp với.

Bảng 3.4. So sánh phổ IR của BPA theo tính tốn lý thuyết và thực nghiệm

Dạng dao động Thực nghiệm (cm-1) [87] Mơ phỏng (cm-1) [87] Tính tốn (cm-1) γCCob, γCOob, CCCR 531 543 549 γCOob, γCCob, γCHob, ηR 552 563 569 γCOob, γCHob, γCCob, ηR 564 572 569 ηR, γCOob, γCHob, γCCob 721 734 719

CO, CCCR 734 768 790

γCHob 758 825; 826 796

CO, CCR, γCHob, γCCob, 827 844; 851;

853; 856 799; 815; 821 CCCR, CCR, CCHR 1013 1026; 1029; 1033 1010; 1086 CCR, CCHR 1083, 1102, 1113, 1149 1122; 1132; 1139; 1164 1099; 1112; 1119 CCHR, COH, CCR, CO, 1177 1190; 1191 1179; 1191 CO, CCR, CCHR, 1218 1281; 1281 1214; 1274 CCR, CCHR 1296 1326 1280; 1320 CCHR, COH, CCR 1362 1370;1370 1322; 1385 CCR, CCHR, COH 1435, 1446 1461; 1462 1398; 1478 CCHR, CCR, CO 1510 1545; 1548 1505; 1515 CCR, CCHR, COH 1598 1628 1578 CCR, CCHR, CCCR 1612 1653; 1654 1636 CH3 2870, 2933, 2964, 2975 3029; 3034, 3093, 3098; 3104; 3105 3012; 3015; 3121 OH 3337 3833; 3834 3767; 3768

Kí hiệu: ob: ngồi mặt phẳng (out of plane bending); R: Trên các vòng thơm (rings); ν: Giãn (stretching); τ: xoắn (torsion); γ: Uốn (bending);

Sự phù hợp giữa các phổ hồng ngoại chứng tỏ mơ hình phân tử BPA xây dựng bằng chƣơng trình Gaussian sử dụng DFT với các bộ hàm cơ sở TZVP, 6-31+G* và CC-PVDZ phù hợp với cấu trúc thực của phân tử BPA.

Từ kết quả của các phép kiểm tra trên đây cho thấy cả 3 bộ hàm đều có khả năng ứng dụng vào các tính tốn lƣợng tử trong khn khổ nghiên cứu của cơng trình này. Tơi nhận thấy rằng, phƣơng pháp B3LYP sử dụng bộ hàm TZVP và 6-31+G* có tính ổn định cao hơn so với bộ hàm CC-PVDZ. Thêm vào đó, các tính tốn với bộ hàm 6-31+G* có tốc độ tính cao hơn so với 2 bộ hàm cịn lại. Điều này khẳng định tính tối ƣu của bộ hàm 6-31+G* so với các bộ hàm TZVP và CC-PVDZ trong phạm vi của bộ chất nghiên cứu và bộ thơng số lƣợng tử cần khảo sát.

Do đó, trong Luận án này, phƣơng pháp B3LYP/6-31+G* làm cơng cụ để tính tốn các thơng số cấu trúc lƣợng tử của bộ chất nghiên cứu và các tính tốn đƣợc thực hiện trên bộ phần mềm Gaussian 09 và Gaussview 06.

3.1.2. Tính tốn các thơng số đặc trưng của phân tử BPA và dẫn xuất bằng phần mềm GAUSSIAN bằng phần mềm GAUSSIAN

Sử dụng bộ phần mềm Gaussian 09 và Gaussview 06 bằng phƣơng pháp B3LYP với bộ hàm cơ sở 6-31+G* để xây dựng và tối ƣu cấu trúc phân tử của 22 hợp chất còn lại trong bộ chất nghiên cứu. Tất cả các cấu hình phân tử tối ƣu ứng với trạng thái cực tiểu tồn cục đƣợc xác định bằng việc phân tích các tần số dao động điều hịa và các tiêu chuẩn hội tụ tích hợp sẵn trong phần mềm Gaussian 09 [42, 43].

Theo kết quả thu đƣợc bằng phƣơng pháp B3LYP với bộ hàm cơ sở 6- 31+G*, phân tử BPA và các dẫn xuất của nó đều có cấu trúc khơng gian hình "cánh quạt" với hai vòng phenyl phân bố gần nhƣ so le nhau. Cấu trúc phân tử BPA trên Hình 3.2 và TBBPA trên Hình 3.5 là các ví dụ cho dạng cấu trúc không gian này.

Hình 3.5. Cấu trúc khơng gian phân tử TBBPA

Giá trị tính của các thơng số lƣợng tử đƣợc trình bày trong các Bảng 3.5 đến Bảng 3.8. Trong đó, giá trị các thông số đặc trƣng về mặt cấu trúc hình học của phân tử bao gồm: độ dài liên kết, góc liên kết và góc nhị diện (góc xoắn giữa 2 mặt phẳng - Dihedral) đƣợc trình bày trong Bảng 3.5. Giá trị các thông số đặc trƣng cho các dạng năng lƣợng của phân tử đƣợc trình bày trong Bảng 3.6. Mật độ electron của các nguyên tử carbon trên khung phân tử đƣợc trình bày trong Bảng 3.7.

Bảng 3.5. Một vài thông số cấu trúc hình học phân tử

STT

Độ dài liên kết Góc liên kết/Góc nhị diện

Cphenyl- Cphenyl, (Å)* C12-C13, (Å) C12-C11, (Å) C11C12C13, (Độ) C5C13C12C11, (Độ) 1 1,398 1,548 1,546 108,602 48,505 2 1,399 1,545 1,548 108,785 64,253 3 1,403 1,544 1,544 112,409 37,501 4 1,399 1,543 1,542 109,938 52,036 5 1,401 1,548 1,548 111,547 43,265 6 1,401 1,530 1,530 113,541 48,577 7 1,399 1,529 1,530 112,467 72,697 8 1,398 1,521 1,521 115,000 57,486 9 1,400 1,544 1,543 111,137 45,021 10 1,399 1,543 1,543 109,924 51,628 11 1,401 1,529 1,530 113,569 48,944 12 1,401 1,531 1,531 110,997 95,707 13 1,400 1,534 1,528 113,412 45,343 14 1,397 1,543 1,543 110,098 51,838 15 1,402 1,543 1,544 110,154 58,902 16 1,396 1,542 1,543 109,756 52,374 17 1,399 1,548 1,549 110,770 68,591 18 1,401 1,544 1,542 109,790 51,688 19 1,401 1,530 1,529 112,086 71,404 20 1,401 1,521 1,520 114,895 56,881 21 1,397 1,543 1,543 109,678 52,248 22 1,396 1,541 1,541 109,1073 54,243 23 1,396 1,542 1,542 109,973 51,769

Bảng 3.6. Các thông số năng lượng của bộ chất khảo sát STT EHOMO STT EHOMO (eV) ELUMO (eV) ΔE (eV) µ (Debye) Esp (Hartree) η (eV) χ (eV) ω ρ 1 -5,793 -0,330 -5,463 0,9222 -928,270 2,731 3,061 0,155 0,366 2 -5,922 -0,499 -5,422 1,6253 -849,632 2,711 3,210 0,487 0,368 3 -5,986 -0,550 -5,435 2,278 -810,318 2,717 3,268 0,955 0,367 4 -5,933 -0,520 -5,413 1,729 -731,697 2,706 3,226 0,552 0,369 5 -6,552 -0,963 -5,589 1,576 -1327,169 2,794 3,757 0,444 0,357 6 -6,077 -1,358 -4,718 2,302 -2149,785 2,359 3,717 1,123 0,423

Một phần của tài liệu (LUẬN án TIẾN sĩ) nghiên cứu quan hệ cấu trúc hóa học và hoạt tính (QSAR) estrogen của bisphenol a và các dẫn xuất (Trang 66)

Tải bản đầy đủ (PDF)

(153 trang)