Trong một vài năm trở lại đây, ngành hóa tin học ngày càng thu hút được sự chú ý với nhiều nhà hóa học bởi đây là một hướng đi mới và có tiềm năng phát triển lớn. Có nhà khoa học đã nói rằng: “Trong tương lai, các nhà hóa học sẽ vào phòng máy tính trước khi đi vào phòng thí nghiệm”. Câu nói đó khẳng định tầm quan trọng và dự đoán một sự phát triển mới mạnh mẽ của ngành hóa tin học.Trong hóa tin học, lĩnh vực thiết kế phân tử với sự trợ giúp của máy tính là sự kết hợp các hiểu biết về của Hóa lượng tử, Cơ học phân tử, và Động học phân tử để nghiên cứu về mô hình phân tử các hợp chất hữu cơ mới nhằm dự đoán các tính chất hóa lý hay hoạt tính sinh học mong muốn. Nhiều hợp chất có tác dụng sinh học đã được dự đoán bằng mô hình mối tương quan định lượng cấu trúc – tác dụng (QSAR) và đã được tổng hợp thành công trong thực tế tuy nhiên việc nghiên cứu mối tương quan định lượng cấu trúc – tác dụng và mối tương quan định lượng cấu trúc – tính chất đòi hỏi phải có cả kiến thức, kinh nghiệm chuyên môn và cả kiến thức về tin học.Để phục vụ cho sự mô tả mối quan hệ định lượng giữa cấu trúc – tính chất và cấu trúc hoạt tính của các hợp chất hữu cơ, người ta dựa vào các tham số cấu trúc như các thông số cấu tạo, thông số hình học, thông số tĩnh điện, thông số liên quan đến MO, thông số hóa lượng tử, thông số nhiệt động học… Và do vậy, tập hợp số thông số đưa ra này là rất lớn. Các thông số này hoặc có liên quan đến sự sắp xếp tương hỗ giữa các nguyên tử trong phân tử hoặc liên quan đến các yếu tố electron hay không gian, hoặc các tính chất nhiệt động học của phân tử hợp chất hữu cơ.Ví dụ: với thông số momen lưỡng cực cho thông tin quan trọng về bản chất và đặc điểm của dạng tương tác hóa học khác thường như liên kết hidro và đặc tính phân cực hoặc không phân cực của phân tử.
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN KHOA HOÁ HỌC BÀI TIỂU LUẬN THIẾT KẾ PHÂN TỬ Giảng viên hướng dẫn : PGS.TS. NGUYỄN ĐÌNH THÀNH Học viên : Trần Thanh Hà Lớp : Cao học Hóa Hữu cơ K21 Hà Nội-08/2012 MỤC LỤC MỞ ĐẦU 2 Trong một vài năm trở lại đây, ngành hóa tin học ngày càng thu hút được sự chú ý với nhiều nhà hóa học bởi đây là một hướng đi mới và có tiềm năng phát triển lớn. Có nhà khoa học đã nói rằng: “Trong tương lai, các nhà hóa học sẽ vào phòng máy tính trước khi đi vào phòng thí nghiệm”. Câu nói đó khẳng định tầm quan trọng và dự đoán một sự phát triển mới mạnh mẽ của ngành hóa tin học. Trong hóa tin học, lĩnh vực thiết kế phân tử với sự trợ giúp của máy tính là sự kết hợp các hiểu biết về của Hóa lượng tử, Cơ học phân tử, và Động học phân tử để nghiên cứu về mô hình phân tử các hợp chất hữu cơ mới nhằm dự đoán các tính chất hóa lý hay hoạt tính sinh học mong muốn. Nhiều hợp chất có tác dụng sinh học đã được dự đoán bằng mô hình mối tương quan định lượng cấu trúc – tác dụng (QSAR) và đã được tổng hợp thành công trong thực tế tuy nhiên việc nghiên cứu mối tương quan định lượng cấu trúc – tác dụng và mối tương quan định lượng cấu trúc – tính chất đòi hỏi phải có cả kiến thức, kinh nghiệm chuyên môn và cả kiến thức về tin học. Để phục vụ cho sự mô tả mối quan hệ định lượng giữa cấu trúc – tính chất và cấu trúc hoạt tính của các hợp chất hữu cơ, người ta dựa vào các tham số cấu trúc như các thông số cấu tạo, thông số hình học, thông số tĩnh điện, thông số liên quan đến MO, thông số hóa lượng tử, thông số nhiệt động học… Và do vậy, tập hợp số thông số đưa ra này là rất lớn. Các thông số này hoặc có liên quan đến sự sắp xếp tương hỗ giữa các nguyên tử trong phân tử hoặc liên quan đến các yếu tố electron hay không gian, hoặc các tính chất nhiệt động học của phân tử hợp chất hữu cơ. Ví dụ: với thông số momen lưỡng cực cho thông tin quan trọng về bản chất và đặc điểm của dạng tương tác hóa học khác thường như liên kết hidro và đặc tính phân cực hoặc không phân cực của phân tử. Với thông số năng lượng obitan HUMO và LUMO. HUMO là năng lượng obitan phân tử bị chiếm cao nhất (Highest Occupied Molecular Orbital Energy) nhận được từ tính toán obitan phân tử và có liên quan đến thế ion hóa của phân tử và khả năng phản ứng của nó như là một nucleophin. LUMO là năng lượng 3 obitan phân tử trống thấp nhất (Lowest Unoccupied Molecular Orbital Energy) nhận được từ các tính toán obitan phân tử và biểu thị ái lực electron của phân tử hay khả năng phản ứng của nó như là một electrophin…. Vào những năm 1950, Hansh đã đưa ra thông số kị nước và sử dụng phép phân tích hồi quy để đưa ra tương quan hoạt tính sinh học với các tính chất của phân tử. Từ đó phương pháp Hansh được các nhà khoa học phát triển với các phương pháp thống kê tinh vi hơn nhằm phát triển mối tương quan giữa một tính chất hay dạng hoạt tính nào đó của một tập hợp phân tử về tính chất của các nhóm thế riêng biệt. Trong bài tập này đã sử dụng chương trình hyperchem và chương trình tính toán thống kê trên excel để xử lý mối quan hệ giữa các thông số không gian và thông số hóa lý với nồng độ cần thiết gây nên tốc độ của sự đáp ứng sinh học. Và dựa vào các giá trị như phương sai, hệ số tương quan… để đánh giá và đưa ra phương trình Hansh mô tả tốt nhất và phù hợp với các giá trị thực nghiệm. Để từ đó ta có thể giải thích các số liệu thực nghiệm. I. CƠ SỞ LÝ THUYẾT 4 Để đưa ra công thức liên hệ log(1/C) với các thông số hoá-lý. Nhà nghiên cứu Hansch đã dựa vào giả thiết như sau: nếu phản ứng sinh học đang khảo sát BR của cơ thể hay hệ mô phỏng đến một chất nào đó là hệ quả của các quá trình hoá lý liên tiếp xảy ra với sự tham gia của chất theo thời gian t, bắt đầu từ thời điểm tác dụng của chất và kết quả cuối cùng của nó, thì ta có thể liên hệ được với sự tham gia của tốc độ kiểm soát được của quá trình. Khi chất với nồng độ ban đầu gây nên phản ứng sinh học chuẩn C 0 được đưa vào hệ sinh học, thì tồn tại xác suất N nào đó sao cho ở lượng CN thì chất đi đến được vị trí mà ở đó xảy ra phản ứng qua thời gian ∆t dẫn tới [BR] (ở đây [BR] là số đo định lượng hiệu quả sinh học được biểu diễn theo đơn vị tương ứng). Trong trường hợp này, tốc độ của quá trình có thể được biểu diễn ở dạng sau : d[BR]/dt = A*C*K x. Trong đó: A là hệ số tỷ lệ, liên quan với phản ứng sinh học với tốc độ giai đoạn kiểm soát được. K x : hằng số tốc độ hay cân bằng của giai đoạn này. Sử dụng mô hình Hansch để khảo sát và phần mềm hoá học Hyperchem, Ecxel xác định được các thông số như, LUMO, HOMO, δ, α, logP, q x, V, S. Qua các thông số này chúng ta xây dựng được phương trình liên quan giữa các yếu tố đến khả năng tạo gây độc tính của hợp chất Phenol thế. 5 II. THIẾT KẾ PHÂN TỬ VÀ TÍNH TOÁN HỒI QUY. 2.1. Thiết kế phân tử: Phân tử được khảo sát là phenol thế và độc tính của các phenol thế đối với nấm Candida Albicans như sau: R Log 1/C R Log 1/C H 3,37 4-OH 2,92 4-Me 3,39 2,3-C 4 H 4 3,97 2,4-Me 2 3,42 3-Cl 3,95 4-Cl 3,95 2,4-Cl 2 4,48 Sử dụng chương trình Hyperchem để xây dựng 8 phân tử trên. Đồng thời để có được các thông số hóa lý cũng như các thông số không gian nhận được từ chương trình này thì tiến hành tối ưu hóa các phân tử trên bằng phương pháp AM1 để nhận được các giá trị dùng cho tính toán. Trong đó: Log P: Hệ số phân bố π: Thông số ưa dầu б : hằng số thế Hammett. μ (D): momen lưỡng cực của phân tử. V(A 03 ), S(A 02 ): tương ứng là thể tích và diện tích của phân tử. α: là độ khả phân cực của phân tử. q N :là điện tích trên nguyên tử N. q C-NH : điện tích của C trong vòng benzen liên kết với nhóm NH q C(thế R-2) :điện tích của nguyên tử C-2 của vòng benzen chứa nhóm thế R q C(thế R-3) :điện tích của nguyên tử C-3 của vòng benzen chứa nhóm thế R q C(thế R-4) :điện tích của nguyên tử C-4 của vòng benzen chứa nhóm thế R q O : điện tích trên nguyên tử Oxi q C(thế OH): điện tích trên nguyên tử C của vòng benzen liên kết với nhóm OH 6 q C(thế CH3) : điện tích trên nguyên tử C của vòng benzen liên kết với nhóm CH 3 q C(thế CH2) : điện tích trên nguyên tử C của vòng benzen liên kết với nhóm CH 2 q CH3 : điện tích trên nguyên tử C của nhóm CH 3 q CH2 : điện tích trên nguyên tử C của nhóm CH 2 E H : là năng lượng hydrat. E HUMO : năng lượng obital phân tử bị chiếm cao nhất. E LUMO : năng lượng obital phân tử không bị chiếm thấp nhất. Các thông số nhận được từ việc tối ưu hóa các phân tử trong chương trình Hyperchem được đưa ra ở bảng sau: Bảng 1: Các thông số hóa lý và các thông số không gian. R H 4-Me 2,4- Me 2 4-Cl 4-OH 2,3- C 4 H 4 3-Cl 2,4-Cl 2 Log P 0.43 0.58 0.74 0.21 -0.60 0.31 0.21 -0.02 π 0.00 0.15 0.31 -0.22 -1.03 -0.12 -0.22 -0.45 б 0.00 -0.17 -0.12 0.23 -0.37 1.27 0.37 0.28 μ (D) 2.588 2.535 2.424 3.536 2.726 3.149 3.470 3.643 V(A 03 ) 701.64 752.82 797.36 746.71 720.69 867.79 744.90 781.22 S(A 02 ) 438.67 463.85 484.56 460.0 8 445.80 537.14 462.55 480.01 α 25.75 27.59 29.42 27.68 26.39 31.93 27.68 29.61 q N -0.272 -0.266 -0.266 -0.268 -0.261 -0.294 -0.271 -0.270 q C-NH 0.044 0.034 0.032 0.044 0.007 0.130 0.052 0.056 q C(thế R-2) -0.169 -0.161 -0.116 -0.178 -0.148 -0.200 -0.181 -0.112 q C(thế R-3) -0.103 -0.105 -0.104 -0.096 -0.175 -0.097 -0.034 -0.092 q C(thế R-4) -0.165 -0.104 -0.102 -0.096 0.032 -0.098 -0.158 -0.092 q C(thế OH) 0.060 0.060 0.059 0.061 0.060 0.055 0.061 0.061 q O(trong OH) -0.254 -0.254 -0.254 -0.254 -0.253 -0.257 -0.254 -0.254 q C(thế CH3) -0.093 -0.093 -0.093 -0.092 -0.093 -0.098 -0.092 -0.091 q CH3 -0.176 -0.176 -0.175 -0.176 -0.176 -0.175 -0.176 -0.177 q C(thế CH2) -0.124 -0.124 -0.124 -0.126 -0.125 -0.105 -0.126 -0.128 q CH2 -0.010 -0.013 -0.012 -0.011 -0.015 0.006 -0.009 -0.006 E H -8.46 -7.28 -6.06 -8.18 -15.41 -8.57 -8.06 -7.57 7 E HUMO -8.574 -8.289 -8.230 -8.498 -8.265 -7.977 -8.819 -8.778 E LUMO 0.445 0.457 0.473 0.357 0.435 -0.017 0.365 0.259 lg(1/C) 3.370 3.390 3.420 3.950 2.920 3.970 3.950 4.480 2.2. Tính toán theo mô hình Hansch Đầu tiên ta tìm phương trình hồi quy đa biến biểu diễn sự phụ thuộc của các điện tích vào log(1\C) dùng phần mềm Excel để loại bỏ các ảnh hưởng và đưa ra phương trình hồi quy phù hợp. Tất cả được đưa ra trong bảng sau: Bảng 2: Mối liên hệ giữa nồng độ và điện tích. Phương trình hansch r r 2 S log(1/C) = -2.2493 -21.8840.q N 0.4415 0.1949 0.4769 log(1/C) = 3.2864 + 7.9165. q C-NH 0.5749 0.3305 0.4349 log(1/C) = -39.8757 - 171.3157. q O 0.4055 0.1644 0.4858 log(1/C) = 3.3523 + 5.5156. q C(thế OH) 0.0223 0.0005 0.5314 log(1/C) = 3.6526 -0.1806. q C(thế R-2) 0.0114 0.0001 0.5315 log(1/C) = 4.5437 + 8.5608 . q C(thế R-3) 0.6612 0.4373 0.3987 log(1/C) = 3.3452 - 3.4333. q C(thế R-4) 0.4176 0.1743 0.4829 log(1/C) = 5.7661 + 22.3886. q C(thế CH3) 0.0955 0.0091 0.5291 log(1/C) = 4.0615 + 43.4641. q CH2 0.5777 0.3337 0.4338 log(1/C) = -43.4991-268.2608. q CH3 0.3493 0.1220 0.4980 log(1/C) = 4.3311+ 5.2945. q C(thế CH2) 0.0785 0.0061 0.5299 Thông qua bảng trên ta thấy điện tích của C tại nhóm methylen (CH 2 ), C của vòng benzen liên kết với -NH và của C thế ở vị trí 3 vòng benzen là có ảnh 8 hưởng đến hoạt tính sinh học nhất vì phương trình Hansch đưa ra có hệ số tương quan là cao nhất và phương sai là nhỏ nhất. Như vậy ta đã loại bỏ các điện tích không ảnh hưởng đến log(1/C) và do đó sẽ sử dụng hai giá trị này để tính toán các bước tiếp theo. Mặt khác tất cả các giá trị còn lại cũng được tính toán tương tự như trên và được đưa ra trong bảng sau: Bảng 3: Mối tương quan giữa các thông số điện tích trên nguyên tử C, thông số hóa lý; thông số không gian và nồng độ. Phương trình Hansch r r 2 S log(1/C) = 3.7058+ 0.1245. π 0.1039 0.0108 0.5286 log(1/C) = 3.5649 + 0.6245. б 0.6406 0.4104 0.4081 log(1/C) = 1.1686+ 0.8350. μ 0.8450 0.7141 0.2842 log(1/C) = 0.3830 + 0.0043. V 0.4537 0.2058 0.4736 log(1/C) = 0.1671 + 0.0074. S 0.4635 0.2148 0.4710 log(1/C) = -0.3416 + 0.1423. α 0.5739 0.3294 0.4352 log(1/C) = 4.4855+ 0.0924. E H 0.5316 0.2826 0.4502 log(1/C) = 4.2970 - 1.7760. E LUMO 0.5882 0.3460 0.4298 log(1/C) = -2.6619 - 0.7525 . E HUMO 0.4440 0.1971 0.4762 Thông qua bảng 3 ta thấy giá trị μ, б có ảnh hưởng lớn đến log(1/C) vì các giá trị về hệ số hồi quy lớn và phương sai của chúng nhỏ; các giá trị α, E H, E LUMO 9 ảnh hưởng ít hơn. Như vậy: μ, б, α, E H, E LUMO, điện tích của C tại nhóm methylen (q CH2 ), C của vòng benzen liên kết với -NH (q C-NH ) và của C thế ở vị trí 3 vòng benzen (q C(thế R-3) ) có ảnh hưởng lớn đến log(1/C) trong các thông số được đưa ra ở Bảng 1. Vậy từ các thông số này ta lập ma trận hệ số tương quan của chúng( sử dụng chương trình excel để tính toán). Ma trận được đưa ra trong bảng sau: Bảng 4: Ma trận hệ số tương quan: μ б α q CH2 q C-NH q C(thế R-3) E LUMO E H μ 1 б 0.5130 1 α 0.2923 0.7649 1 q CH2 0.3823 0.9655 0.8057 1 q C-NH 0.3658 0.9788 0.7844 0.9852 1 qC (thế R-3) 0.4922 0.4585 0.2418 0.3145 0.3985 1 E LUMO -0.5019 -0.9444 -0.7991 -0.9630 -0.9336 -0.1964 1 E H 0.0896 0.2761 0.3915 0.2371 0.3280 0.7154 -0.0644 1 Thông qua bảng 4 ta thấy phương sai có nghĩa tồn tại giữa б và q CH2; б và q C-NH ; б và E LUMO ; q CH2 và q C-NH ; q CH2 và E LUMO ; q C-NH và E LUMO Dựa vào ma trận các hệ số tương quan ta xây dựng mối quan hệ giữa chúng. Các phương trình hồi quy đa biến được xây dựng giữa các thông số đã chỉ ra. Điều đó được tóm tắt trong bảng sau: Bảng 5: Mối quan hệ đa biến giữa các thông số với hoạt tính Phương trình Hansch r r 2 S log(1/C) = 3.0612 + 1.1933. б - 45.4561.q CH2 0.6597 0.4352 0.2092 log(1/C) = 3.3243+ 0.3058. б + 3.9866.q C-NH 0.8653 0.7487 0.2918 10 [...]... 5 và tổng kết lại thì hoạt tính sinh học được mô tả tốt bởi phương trình : log (1/C) = 1.4474 + 0.1804 π + 2.1107.б + 5.9212 q -149.8933 qCH2 11 C-NH + 0.3435 ELUMO III.BIỆN LUẬN Trong phương trình: log(1/C) = 1.1162+ 2.2502.б + 5.9245 q C-NH + 1.7367 ELUMO - 125.4722 qCH2 (1) ta thấy tất cả các thông số q C-NH; ELUMO; б làm tăng hoạt tính của chất khảo sát Trong đó điện tích trên nguyên tử cacbon . tố đến khả năng tạo gây độc tính của hợp chất Phenol thế. 5 II. THIẾT KẾ PHÂN TỬ VÀ TÍNH TOÁN HỒI QUY. 2.1. Thiết kế phân tử: Phân tử được khảo sát là phenol thế và độc tính của các phenol thế. số phân bố π: Thông số ưa dầu б : hằng số thế Hammett. μ (D): momen lưỡng cực của phân tử. V(A 03 ), S(A 02 ): tương ứng là thể tích và diện tích của phân tử. α: là độ khả phân cực của phân. nguyên tử C của nhóm CH 3 q CH2 : điện tích trên nguyên tử C của nhóm CH 2 E H : là năng lượng hydrat. E HUMO : năng lượng obital phân tử bị chiếm cao nhất. E LUMO : năng lượng obital phân tử