Sơ đồ nghiên cứu QSAR

Một phần của tài liệu (LUẬN án TIẾN sĩ) nghiên cứu quan hệ cấu trúc hóa học và hoạt tính (QSAR) estrogen của bisphenol a và các dẫn xuất (Trang 28 - 43)

1.2.2.2. Các nguyên tắc OECD

Để đảm bảo tính ứng dụng thực tiễn của các mơ hình QSAR từ các nghiên cứu khoa học, một cuộc họp giữa các chuyên gia về nghiên cứu QSAR đƣợc tổ chức tại Bồ Đào Nha vào tháng 3 năm 2002 nhằm thiết lập các quy định trong xây dựng và xác nhận mơ hình QSAR [53]. Các nguyên tắc này sau đó đƣợc Tổ chức Hợp tác và Phát triển Kinh tế thế giới (The Organisation for Economic Cooperation and Development - OECD) cùng cộng đồng khoa học QSAR phê duyệt tại hội nghị lần thứ 37 của Ủy ban Hóa chất và Nhóm hoạt động về Hóa chất, Thuốc trừ sâu và Công nghệ Sinh học vào tháng 11 năm 2004. Các nguyên tắc đƣợc đề ra giải quyết các vấn đề bắt buộc trong nghiên cứu để thiết lập đƣợc các mơ hình QSAR phù hợp, đáng tin cậy và có khả năng tái lập [80]. Có tất cả 5 nguyên tắc đƣợc OECD áp dụng đối với nghiên cứu QSAR nhƣ sau:

Bộ chất nghiên cứu Tính tốn hóa học

về cấu trúc phân tử Phân tích thực nghiệm về hoạt tính sinh học

Thông số cấu trúc Bộ dữ liệu số Thơng số hoạt tính

Thủ tục phân chia bộ dữ liệu Bộ khảo luyện (training set) Bộ kiểm tra (test set) Phân tích tốn học thống kê MLR, PLS, PCRA, ANN, ... Mơ hình QSAR y = f(x1, x2, ...)

Tham chiếu trong R2, P-value, ...

Tham chiếu ngoài R2

test, Q2, ...

Đánh giá mơ hình

Ngun tắc 1: “Hiệu ứng sinh học” xác định (A defined endpoint).

Để đảm bảo tính tồn vẹn của mơ hình xét về mặt đồng nhất của dữ liệu, các thông tin về hiệu ứng sinh học phải đƣợc thu thập từ một nguồn, hoặc từ các nguồn có sự tƣơng thích khắt khe về tính chính xác và các điều kiện thực nghiệm. Tuy nhiên, ngay cả các xét nghiệm về độc tính sinh học đƣợc thực hiện trong cùng một phịng thí nghiệm cũng có thể tạo ra các sai biệt về chất lƣợng của các hoạt tính đo đƣợc, điều này có thể xảy ra do chất lƣợng của các thiết bị thử nghiệm hoặc/và khả năng tái tạo tế bào trong điều kiện thí nghiệm. Do đó, điều quan trọng là phải đánh giá kỹ lƣỡng các phép đo có thể so sánh. Ngồi ra, việc lựa chọn các phân tử đƣợc sử dụng để phát triển mơ hình cũng rất quan trọng, vì nó cung cấp nền tảng cho phạm vi nghiên cứu cũng nhƣ các hạn chế của nó.

Ngun tắc 2: Thuật tốn rõ ràng.

Các mơ hình QSAR phải đảm bảo tính minh bạch trong tất cả các thuật tốn đƣợc sử dụng trong tồn bộ q trình nghiên cứu và xây dựng mơ hình, bao gồm: các quá trình tiền xử lý dữ liệu, phƣơng pháp tính tốn các thông số cấu trúc, các phần mềm đƣợc sử dụng, quy trình chọn biến và phát triển mơ hình.

Nguyên tắc 3: Miền ứng dụng xác định.

Sự cần thiết phải xác định một miền ứng dụng rõ ràng đối với các mơ hình QSAR phản ánh một thực tế rằng, các mơ hình QSAR thu đƣợc chỉ hoạt động hiệu quả trong các giới hạn về các dạng cấu trúc phân tử, các dạng hoạt tính hóa lý cũng nhƣ các dạng cơ chế sinh học nào đó. Miền ứng dụng của một mơ hình QSAR đƣợc định nghĩa là một khơng gian cấu trúc và hoạt tính, đƣợc xác định bởi bản chất của các hợp chất trong bộ luyện. Một hợp chất mới chỉ có thể đƣợc dự đoán đúng khi nằm trong miền ứng dụng của mơ hình. Sẽ rất hữu ích cho các nhà phát triển QSAR khi có thơng tin về miền ứng dụng của

mơ hình để xác định các nội suy (dự đốn đúng) và các ngoại suy (dự đốn ít tin cậy hơn) từ mơ hình.

Nguyên tắc 4: Xác thực về sự phù hợp (goodness-of-fit), độ ổn định (robustness) và khả năng dự đốn (predictivity) của mơ hình.

Để đánh giá về chất lƣợng của một mơ hình QSAR, cần thực hiện các phép tham chiếu trong và ngồi. Theo đó, phép tham chiếu trong (internal validation) cho đánh giá về sự phù hợp và độ ổn định của mơ hình (goodness- of-fit and robustness); phép tham chiếu ngoài (external validation) cho đánh giá về khả năng dự đốn (predictivity) của mơ hình.

Nguyên tắc 5: Luận giải về cơ chế, nếu có thể.

Việc luận giải về mặt cơ chế đối với một mơ hình QSAR khơng phải lúc nào cũng có thể thực hiện đƣợc từ một quan điểm khoa học nào đó. Một mơ hình QSAR thiếu sự luận giải về mặt cơ chế khơng có nghĩa là mơ hình đó khơng có khả năng ứng dụng. Mục đích của ngun tắc thứ 5 này khơng phải là để “từ chối” các mơ hình khơng có cơ sở trong luận giải về cơ chế mà để đảm bảo việc xem xét đến khả năng liên kết các thơng số cấu trúc với các hoạt tính bằng một cơ chế rõ ràng.

1.3. Tổng quan về cơ sở lý thuyết của phƣơng pháp tính lƣợng tử

Năm 1926, nhà vật lý ngƣời Áo Erwin Schrưdinger thiết lập phƣơng trình chính tắc của cơ học lƣợng tử có dạng [5, 34]. (q, t) i H (q, t) (1.1) t    

Trong hóa học, ngƣời ta dùng hàm sóng chỉ phụ thuộc vào tọa độ, gọi là trạng thái dừng (q), đƣợc viết dƣới dạng:

2

2

2m

(q) (E U) (q) 0 (1.1')

     

Từ phƣơng trình này, đã có nhiều phƣơng pháp tính lần lƣợt đƣợc thiết lập:

- Phương pháp bán kinh nghiệm: Các phƣơng pháp bán kinh nghiệm bao gồm phƣơng pháp Huckel (HMO), CNDO, INDO, MINDO, MNDO, ZINDO, AM1, PM3,... Các phƣơng pháp này có ƣu điểm là tính nhanh, dễ sử dụng. Tuy nhiên, nhƣợc điểm là mức độ chính xác khá hạn chế. Hiện nay, đối với các hệ nghiên cứu nhỏ và vừa, ngƣời ta ít sử dụng các phƣơng pháp bán kinh nghiệm. Mặc dù vậy, chúng vẫn đƣợc sử dụng khá phổ biến khi nghiên cứu các hệ phân tử lớn trong y sinh nhƣ các protein.

- Phương pháp tính từ đầu (ab-initio): Phƣơng pháp trƣờng tự hợp Hartree Fock (HF) và các phƣơng pháp Post-HF là các phƣơng pháp tính từ đầu. So với phƣơng pháp bán kinh nghiệm thì phƣơng pháp HF cho kết quả gần đúng tốt hơn. Tuy nhiên, phƣơng pháp này chƣa tính đến năng lƣợng tƣơng quan-trao đổi electron. Để loại bỏ sau sai số này, các phƣơng pháp Post- HF nhƣ phƣơng pháp nhiễu loạn (MP), phƣơng pháp tƣơng tác cấu hình (CI) và phƣơng pháp chùm tƣơng tác (CC) đã xử lý thêm phần hiệu chỉnh tƣơng quan vào mơ hình HF. Kết quả tính theo những phƣơng pháp này rất tốt, đặc biệt là phƣơng pháp CCSD(T). Tuy nhiên, sự gia tăng nhanh chóng về số lƣợng phép tính cần thực hiện đòi hỏi thời gian tính tốn lớn cũng nhƣ hệ thống máy tính đủ mạnh. Vì vậy, việc áp dụng các phƣơng pháp post-HF cho hệ nghiên cứu lớn nhƣ kim loại chuyển tiếp, hay các cụm kim loại gặp nhiều khó khăn.

- Lý thuyết phiếm hàm mật độ (Density Functional Theory - DFT):

Trong lý thuyết DFT, các tính chất của hệ N electron đƣợc biểu diễn thông qua hàm mật độ electron của toàn bộ hệ. Mật độ electron chỉ phụ thuộc vào ba biến tọa độ không gian mà không phụ thuộc vào số electron trong hệ. Điều này khác với thuyết hàm sóng là một hàm sóng mơ tả hệ N electron sẽ phải chứa 3N biến tọa độ không gian và N tọa độ spin. Với cách tiếp cận đó, việc áp dụng các phƣơng pháp DFT khơng chỉ giảm thiểu thời gian tính mà cịn khắc phục đƣợc phần năng lƣợng tƣơng quan electron, do vậy kết quả

thu đƣợc có độ chính xác cao. Hiện nay, các phƣơng pháp DFT đƣợc sử dụng rộng rãi trong các tính tốn hóa học lƣợng tử, đặc biệt cho hệ nghiên cứu lớn và phức tạp.

1.3.1. Lý thuyết phiếm hàm mật độ (DFT-Density Functional Theory) [34]

1.3.1.1. Mật độ trạng thái của electron

Lý thuyết DFT cho phép mô tả trạng thái hệ N electron theo hàm mật độ

( )r

 biểu thị số electron trên một đơn vị thể tích ở trạng thái cho trƣớc, đây là khái niệm rất quan trọng trong DFT. Về mặt toán học biểu thức của mật độ electron đƣợc định nghĩa nhƣ sau:

2

1 1 2 1 2

( )r N ... (x x, ,...,xN d dx ...dxN

     (1.2)

Với xi là tọa độ bao gồm tọa độ không gian ri và tọa độ spin i của

electron i; (r) xác định mật độ xác suất tìm thấy bất kì N electron trong thể

tích nguyên tố dr; (r) là hàm không âm của các biến khơng gian x, y, z. Tích phân trong tồn bộ khơng gian sẽ cho ta toàn bộ số electron.

( )r dr N

 

 (1.3)

1.3.1.2. Mơ hình Thomas - Fermi

Năm 1927, Thomas và Fermi chỉ ra sự tồn tại của một phiếm hàm năng lƣợng và tìm ra biểu thức năng lƣợng Thomas-Fermi cho nguyên tử dựa trên mật độ electron là:   2 2 / 3 5/ 3 1 1 1 2 1 2 ( ) ( ) 3 ( ) 1 (3 ) ( ) 10 2 TF r r r E r dr Z dr dr dr R r r r               (1.4)

Trong đó, Z là điện tích của hạt nhân, R là vectơ tọa độ của hạt nhân,

r là vectơ tọa độ electron. Phƣơng trình này chỉ dùng cho ngun tử (có một

hạt nhân). Ðiều này làm cho lý thuyết Thomas-Fermi đƣợc nhìn nhận nhƣ một mẫu quá đơn giản đối với việc tính tốn định lƣợng trong nguyên tử, phân tử hay chất rắn.

1.3.2. Các định lý Hohenberg - Kohn [34]

- Định lý Hohenberg - Kohn thứ nhất: Mật độ electron (r) tƣơng ứng

xác định một thế ngoài V(r) với một hằng số thêm vào không đáng kể.

Tƣơng quan ánh xạ giữa mật độ (r) và thế ngoài V(r) cho phép xác định hàm mật độ khi có một giá trị thế ngoài V(r). Từ đó, mật độ electron(r) xác

định đƣợc số electron (N) của hệ, hàm sóng  ở trạng thái cơ bản và tất cả các

tính chất của hệ.

E[(r)] = T[(r)] + Ven[(r)] + Vee[(r)] (1.5) E[(r)] = T[(r)] + (r)Vendr + Vee[(r)]

E[(r)] = (r)Vendr + Fhk[(r)] (1.6) với: Fhk[(r)] = T[(r)] + Vee[(r)] (1.7) Ta viết lại dạng của Vee[(r)]:

Vee[(r)]= J[(r)]+ K[(r)]= 1 2 1 2 12 ( ) ( ) 1 2 r r dr dr r    + K[(r)] (1.8) K[(r)] là số hạng phi cổ điển, Fhk[(r)] còn gọi là phiếm hàm Hohenberg- Kohn. Nếu biết giá trị của Fhk[(r)], tức là cả T[(r)] và Vee[(r)] thì chúng ta sẽ giải đƣợc phƣơng trình Schrodinger. Vì phiếm hàm này có một dạng chung độc lập với kích thƣớc hệ nên rất thuận tiện khi áp dụng cho các hệ lớn. Nhiệm vụ chính của DFT hiện nay là đi tìm dạng cụ thể của T[(r)] và K[(r)].

- Định lý thứ hai của Hohenberg-Kohn đƣợc phát biểu dựa trên nguyên

lý biến phân: Đối với một mật độ electron thử ( )r cho trƣớc thỏa mãn 0 ( )r

và( )r drN thì E0E( )r  (1.9) Tức là năng lƣợng của hệ E( )r nhận đƣợc từ ( )r không thể nhỏ hơn năng lƣợng ở trạng thái cơ bản E0. Đây là kết quả đƣợc suy luận trực tiếp từ định lý thứ nhất.

1.3.3. Phương trình Kohn - Sham [34]

Kohn và Sham đề xuất cách lập các phiếm hàm trên bằng cách đƣa vào các orbital không tƣơng tác. Trong đó mật độ ở trạng thái cơ bản của hệ không tƣơng tác bằng với mật độ trạng thái cơ bản của hệ thống tƣơng tác. Những orbital này đƣợc gọi là orbital Kohn - Sham (KS) hay hàm sóng KS. Động năng của hệ không tƣơng tác Ts[(r)] sai khác với động năng của hệ thực T[(r)] một lƣợng là: (T[(r)] - Ts[(r)]). Phần sai khác này cộng với K[(r)] đƣợc gọi là số hạng năng lƣợng tƣơng quan-trao đổi Exc[(r)].

Dùng nguyên lý biến phân cho   sẽ dẫn đến các phƣơng trình KS có dạng:   2       2 2 M 2 2 I 1 2 XC 1 i 1 i i 1 I 1 e 0 12 o 12 ρ r e Z e r V r r ε r 2m 4π r 4π r d                       (1.10)

Theo đó, trong dấu móc của (1.10) thì:

- Số hạng thứ nhất biểu thị tốn tử động năng của các electron.

- Số hạng thứ hai biểu thị toán tử năng lƣợng hút hạt nhân - electron, tổng này đƣợc lấy qua tất cả các hạt nhân theo chỉ số I, nguyên tử số là ZI.

- Số hạng thứ ba biểu thị toán tử năng lƣợng tƣơng tác Coulomb giữa 2 mật độ electron toàn phần (đƣợc lấy tổng qua tất cả các orbital) ρ r1 , ρ r2 tại

2 1,r r   tƣơng ứng.  r i 

 là hàm khơng gian 1 electron, cịn gọi là orbital KS. ρ r là mật độ điện tích hay mật độ electron trạng thái cơ bản tại vị trí r

.

i

ε là năng lƣợng orbital KS.

XC

V là thế trao đổi - tƣơng quan, là đạo hàm của phiếm hàm năng lƣợng trao đổi ΕXC ρ, có biểu thức:

  XC XC δΕ ρ V δ   (1.11)

Nếu ΕXC ρ đã đƣợc biết thì thu đƣợc VXC ρ . Giá trị Exc r

  gồm hai thành phần là năng lƣợng trao đổi Ex và năng lƣợng tƣơng quan Ec, tuy nhiên giá trị năng lƣợng trao đổi-tƣơng quan Exc mới có ý nghĩa vật lý. Vì vậy, kết hợp hai hàm Ex và Ec thành một hàm kết hợp Exc.

             

xc x c x c

E  r E  r E  r   r  r d r  r  r d r (1.12) Sự phát triển của lý thuyết DFT ngày nay là tập trung vào việc làm sao để có phiếm hàm ΕXC ρ ngày càng tốt hơn. Các phƣơng pháp DFT khác nhau

ở dạng của ΕXC ρ.

Để xác định giá trị này, ngƣời ta dựa vào các sự gần đúng khác nhau. Cụ thể:

* Sự gần đúng mật độ cục bộ (Loal Density Approximation -LDA)

Theo đó, giá trị ( ⃗) xấp xỉ với năng lƣợng tƣơng quan trao đổi

của một electron trong khí quyển electron đồng nhất có cùng mật độ electron

( ⃗) theo sự gần đúng cục bộ:

     

LDA

xc xc

E  r   r  r d r (1.13) Phiếm hàm này đƣợc sử dụng cùng với mơ hình của Thomas-Fermi và nó đƣợc gọi là phƣơng pháp Thomas-Fermi-Dirac. Tuy nhiên, nó khơng tạo ra đƣợc cải tiến đáng kể nào đối với những sai sót trong việc lấy xấp xỉ phiếm hàm động năng trong mơ hình Thomas-Fermi.

Sự gần đúng mật độ spin cục bộ (Local Spin Density Approximation - LSDA). Trong lý thuyết phân cực spin của Kohn-Sham, cùng với phƣơng pháp gần đúng mật độ spin cục bộ, năng lƣợng trao đổi-tƣơng quan có dạng nhƣ sau:   , ( ( ), ( )) LSDA xc xc E     r   r  r d r (1.14) Ở đây,  ,  là mật độ spin up và spin down.

Những kết quả nhận đƣợc theo LSDA là tốt nhất khi áp dụng với hệ chất rắn, các tham số cấu trúc mạng cũng nhƣ các tính chất dao động thậm chí đạt độ chính xác cao chỉ sai khác so với thực nghiệm một vài phần trăm. Tuy nhiên, với hệ ngun tử và phân tử, những hệ mà mơ hình khí electron khơng đồng nhất, kết quả nhận đƣợc đƣơng nhiên sẽ sai khác khá nhiều so với thực nghiệm (khoảng 20% lớn hơn lực liên kết, bởi vậy độ dài liên kết thƣờng xuyên ngắn hơn so với thực nghiệm). Để khắc phục sai số này, ta thƣờng sử dụng sự gần đúng gradient suy rộng.

* Sự gần đúng gradient tổng quát (Generalized Gradient Approximation)

Phƣơng pháp gần đúng gradient tổng quát (Generalized Gradient Approximation- GGA) là một phiếm hàm trao đổi-tƣơng quan đang rất phổ biến trong vật lý chất rắn. Ðối với một giá trị mật độ ( ⃗) bất kỳ, việc xác định chính xác giá trị năng lƣợng trao đổi-tƣơng quan gặp nhiều khó khăn. Tuy nhiên, nếu nhƣ ( ⃗) thay đổi tƣơng đối chậm thì ta có thể viết:

  2 (2) ( ( )) ( ) ( ( )) ( ) xc xc xc E    rr d r  r  r d r (1.15) Trong đó,  xc( ( ))r là phần năng lƣợng tƣơng quan trao đổi của số hạng

thứ hai trong khai triển năng lƣợng theo toán tử gradient của mật độ.

Trong khai triển (1.15), nếu chỉ tính đến số hạng đầu tiên, ta có thể nhận ra ngay đó là năng lƣợng trao đổi-tƣơng quan trong LDA, hàm này chỉ phụ thuộc vào ( ⃗). Còn nếu xét thêm đến số hạng thứ hai, ta sẽ thấy năng lƣợng trao đổi-tƣơng quan sẽ phụ thuộc vào 2 biến là ( ⃗) và ∇ ( ⃗). Khi đó nó có

thể đƣợc viết dƣới dạng:

  ( ( ), ( ))

xc

E   fr  r d r (1.16) Đó chính là dạng đơn giản nhất của phƣơng pháp GGA, có sự bao hàm gradient nhƣ là một biến mới. Về sau này, ngƣời ta đã cố gắng tìm đƣợc những sơ đồ tốt nhất có thể để mô tả năng lƣợng tƣơng quan-trao đổi trong phƣơng pháp GGA, chẳng hạn nhƣ thêm vào các thơng số về spin. Nhìn chung, dạng

đầy đủ (tổng quát) của năng lƣợng trao đổi-tƣơng quan trong phƣơng pháp

Một phần của tài liệu (LUẬN án TIẾN sĩ) nghiên cứu quan hệ cấu trúc hóa học và hoạt tính (QSAR) estrogen của bisphenol a và các dẫn xuất (Trang 28 - 43)

Tải bản đầy đủ (PDF)

(153 trang)