1. Trang chủ
  2. » Luận Văn - Báo Cáo

Ứng dụng thuật toán học máy dự đoán tính chất điện tử của hợp chất đa vòng thơm và một số dẫn xuất của chúng

97 4 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

ĐẠI HỌC QUỐC GIA TP HCM TRƯỜNG ĐẠI HỌC BÁCH KHOA NGUYỄN HỒNG TUẤN ỨNG DỤNG TḤT TỐN HỌC MÁY DỰ ĐỐN TÍNH CHẤT ĐIỆN TỬ CỦA HỢP CHẤT ĐA VÒNG THƠM VÀ MỘT SỐ DẪN XUẤT CỦA CHÚNG Chuyên ngành: Kỹ Thuật Hóa Học Mã số: 8520301 LUẬN VĂN THẠC SĨ TP HỒ CHÍ MINH, tháng năm 2023 CƠNG TRÌNH ĐƯỢC HỒN THÀNH TẠI TRƯỜNG ĐẠI HỌC BÁCH KHOA –ĐHQG –HCM Cán hướng dẫn khoa học: TS Phạm Hồ Mỹ Phương (Ghi rõ họ, tên, học hàm, học vị chữ ký) Cán chấm nhận xét 1: PGS.TS Phạm Trần Nguyên Nguyên (Ghi rõ họ, tên, học hàm, học vị chữ ký) Cán chấm nhận xét 2: PGS.TS Huỳnh Kim Lâm (Ghi rõ họ, tên, học hàm, học vị chữ ký) Luận văn thạc sĩ bảo vệ Trường Đại học Bách Khoa, ĐHQG Tp HCM ngày 18 tháng năm 2023 Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm: (Ghi rõ họ, tên, học hàm, học vị Hội đồng chấm bảo vệ luận văn thạc sĩ) Chủ tịch: TS Lê Thanh Hưng Cán phản biện: PGS.TS Huỳnh Kim Lâm Cán phản biện: PGS.TS Phạm Trần Nguyên Nguyên Ủy viên: TS Phạm Hồ Mỹ Phương Ủy viên, thư ký: TS Nguyễn Thành Duy Quang Xác nhận Chủ tịch Hội đồng đánh giá LV Trưởng Khoa quản lý chuyên ngành sau luận văn sửa chữa (nếu có) CHỦ TỊCH HỘI ĐỒNG TRƯỞNG KHOA KỸ THUẬT HÓA HỌC ĐẠI HỌC QUỐC GIA TP.HCM CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM TRƯỜNG ĐẠI HỌC BÁCH KHOA Độc lập - Tự - Hạnh phúc NHIỆM VỤ LUẬN VĂN THẠC SĨ Họ tên học viên: Nguyễn Hoàng Tuấn MSHV: 2070495 Ngày, tháng, năm sinh: 15/07/1998 Nơi sinh: Tp.HCM Chuyên ngành: Kỹ thuật Hóa học Mã số: 8520301 I TÊN ĐỀ TÀI: Bằng tiếng Việt: Ứng Dụng Thuật Toán Học Máy Dự Đốn Tính Chất Điện Tử Của Hợp Chất Đa Vòng Thơm Và Một Số Dẫn Xuất Của Chúng Bằng tiếng Anh: Application of Machine Learning Algorithms for Predicting Electronic Properties of Polycyclic Aromatic Compounds and Their Derivatives NHIỆM VỤ VÀ NỘI DUNG: - Xây dựng mơ hình máy học giúp dự đốn tính chất điện tử cho hợp chất hydrocarbon đa vòng thơm (PAH) dẫn xuất bao gồm thienoacenes PAH có nhóm - Tiến hành khảo sát tham số thẩm định sai số mơ hình - Khảo sát giao thức active learning cho mơ hình giải thích mơ hình II NGÀY GIAO NHIỆM VỤ: 06/02/2023 III NGÀY HOÀN THÀNH NHIỆM VỤ: 07/2023 IV CÁN BỘ HƯỚNG DẪN: TS Phạm Hồ Mỹ Phương Nội dung yêu cầu LVTN thông qua môn Tp.HCM, ngày….tháng….năm 2023 CÁN BỘ HƯỚNG DẪN CHỦ NHIỆM BỘ MÔN ĐÀO TẠO TRƯỞNG KHOA KỸ THUẬT HĨA HỌC i LỜI CẢM ƠN Cơng trình trình bày luận văn khơng thể hoàn thành thiếu vắng người thầy, người cơ, tiền bối, đàn em nhóm nghiên cứu với tác giả với đóng góp quan trọng dự án sau: - Thầy Trương Nguyện Thành (giáo sư danh dự University of Utah): đặt vấn đề, giám sát hướng dẫn cho dự án; đọc, sửa, duyệt thảo báo khoa học nộp có liên quan đến luận văn - Anh Nguyễn Hoàng Lâm (học viên tiến sĩ Hóa tính tốn Đại Học Khoa Học Tự Nhiên - Đại Học Quốc Gia VN, nghiên cứu sinh ICST): giám sát dự án; đọc, sửa, góp ý cho thảo báo khoa học luận văn - Cô Phạm Hồ Mỹ Phương (Tiến Sĩ, giảng viên trường Đại Học Bách Khoa TP.HCM - Đại Học Quốc Gia VN): giám sát hướng dẫn cho luận văn; đọc, góp ý, duyệt luận văn hồn thành cơng việc giấy tờ có liên quan đến luận văn - Em Lê Minh Khang (sinh viên khoa hóa Đại Học Khoa Học Tự Nhiên - Đại Học Quốc Gia VN): thực xây dựng liệu hợp chất đa vịng thơm có gắn nhóm nitro thực hiên tính tốn lượng tử cho tất phân tử liệu; đọc đóng góp ý kiến cho thảo báo khoa học luận văn Tác giả xin gửi lời cảm ơn chân thành sâu sắc đến người thầy, người cô, tiền bối, đàn em kể Tác giả biết ơn hỗ trợ từ gia đình thời gian làm luận văn Tp.HCM, 12 tháng năm 2023, Học viên thực Nguyễn Hồng Tuấn ii TĨM TẮT ḶN VĂN Nhu cầu giải vấn đề cấp bách giới đại kèm với thách thức tìm kiếm cấu trúc hóa học hay vật liệu mang tính đột phá Tuy nhiên, việc khơng dễ dàng khơng gian tìm kiếm cấu trúc hóa học rộng lớn để tìm kiếm phương pháp thực nghiệm hay tính tốn lý thuyết hiệu cao Sự phát triển mang tính cách mạng phương pháp dựa liệu lớn máy học trí tuệ nhân tạo (ML/AI) đưa cơng cụ tính tốn để tiếp cận toán Một ứng dụng ML/AI hóa học xây dựng mơ hình dựa liệu có khả dự đốn tính chất cấu trúc hóa học hay vật liệu với độ xác chấp nhận so với phương pháp tính tốn lí thuyết hay thực nghiệm Trong đó, xuất nhiều cơng trình đề xuất ML/AI cơng cụ để dự đốn tính chất phân tử hữu cho mục đích làm vật liệu bán dẫn hữu Luận văn tiếp nối cơng trình trước đó[1-4] mơ hình Tương Quan Định Lượng Cấu Trúc – Tính Chất (QSPR) cho tính chất điện tử cho cấu trúc đa vòng thơm dẫn xuất Ba biến thể phương pháp Weisfeiler-Lehman (WL) graph kernel mơ hình học máy Gaussian Process Regressor (GPR) sử dụng cho việc mơ hình hóa Bộ liệu bao gồm Polycyclic Aromatic Hydrocarbons (PAH), thienoacenes, cyano-substituted PAH nitro-substituted PAHs tính tốn lý thuyết Density Functional Theory (DFT) Kết cho thấy phương pháp GPR/WL kernel dự đốn xác tính chất điện tử PAH dẫn xuất chúng với sai số gốc trung bình bình phương 0.15eV Ngồi ra, chứng minh hiệu giao thức active learning cho phương pháp GPR/WL kernel, đặc biệt tập liệu có đa dạng Cách giải thích mơ hình đóng góp ngun tử vào tính chất điện tử dự đốn cung cấp lý cho thành công mô hình vật lý Degree of π-orbital Overlap cơng bố trước iii ASTRACT Searching for novel chemical compounds or materials is often the requirement for solving emergency global problem However, this task is not easy by any means due to the fact that the search space is too vast for experimental methods or even highperformance theoretical computation The revolutional development of computation methods based on big data namely machine learning and artificial intelligence suggest a new approach for this dilemma One application of machine learning algorithms is that they can be used to build data-based models that are capable of predicting properties of chemical structures and materials with acceptable error compare to computaional or experimental methods As such, there are published works that propose ML/AI as computational tools for predicting properties of organic compounds for organic semiconductor appications This thesis will continue prior works[1-4] on the development of Quantitative Structure-Properties Relationship (QSPR) for electronic properties of polycyclic aromatic compounds and their derivatives Three variants of Weisfeiler-Lehman graph kernel and Gaussian Process Regressor (GPR) have been used for modelling The datasets comprise of Polycyclic Aromatic Hydrocarbons (PAH), thienoacenes, cyano-substituted PAH nitro-substituted PAHs that are computed at Density Functional Theory level of theory The result suggests that GPR/WL kernel methods are capable of predicting electronic properties of PAH and derivatives with excellent accuracy of 0.15eV in term of root mean square deviation Furthermore, we also demonstrate the effectiveness of active learning protocol for GPR/WL kernel method, especially for more diversive datasets The interpretation of the model on the contributions of each atom to the predicted electronic properties provides an explanation for the success of the physical model Degree of π-orbital Overlap which have been published before by us iv LỜI CAM ĐOAN Tôi xin cam đoan đề tài “ỨNG DỤNG THUẬT TOÁN HỌC MÁY DỰ ĐỐN TÍNH CHẤT ĐIỆN TỬ CỦA HỢP CHẤT ĐA VÒNG THƠM VÀ MỘT SỐ DẪN XUẤT CỦA CHÚNG” cơng trình nghiên cứu độc lập thực cá nhân tác giả Số liệu tài liệu dẫn chứng luận văn có nguồn gốc rõ ràng, cơng bố quy định Các kết thu luận văn phản ánh khách quan, trung thực, hoàn toàn không chép chưa công bố nghiên cứu khác Nếu phát có gian dối, xin chịu trách nhiệm Tp Hồ Chí Minh, ngày 12 tháng năm 2023 Tác giả đề tài Nguyễn Hoàng Tuấn v MỤC LỤC LỜI CẢM ƠN i TÓM TẮT LUẬN VĂN ii ASTRACT iii LỜI CAM ĐOAN iv MỤC LỤC v DANH MỤC HÌNH ẢNH vii DANH MỤC BẢNG BIỂU ix DANH MỤC CÁC KÝ HIỆU VIẾT TẮT VÀ CHÚ GIẢI THUẬT NGỮ TIẾNG ANH x CHƯƠNG GIỚI THIỆU CHƯƠNG TỔNG QUAN 2.1 Giới thiệu vật liệu bán dẫn hữu dựa phân tử đa vòng thơm 2.2 Giới thiệu machine learning hóa học 2.2.1 Tổng quan thuật toán supervised machine learning 2.2.2 Một số thuật toán toán Supervised Machine learning 2.2.3 Active learning 14 2.3 Biểu diễn cấu trúc hóa học 15 2.4 Huấn luyện đánh giá mơ hình machine learning 19 2.5 Các cơng trình ứng dụng ML cho hóa học tiêu biểu 21 2.5.1 Ứng dụng machine learning mơ hình vật liệu hóa bán dẫn hữu 21 2.5.2 Ứng dụng ML hóa tính tốn/ hóa lý thuyết hóa lý 23 2.5.3 Ứng dụng ML hóa hữu cơ, hóa dược/độc chất học 24 2.5.4 Các cơng trình machine learning khác 27 CHƯƠNG PHƯƠNG PHÁP THÍ NGHIỆM 30 3.1 Cơ sở lý thuyết phương pháp Weisfeiler-Lehman kernel 30 3.1.1 Thuật toán Weisfeiler-Lehman 30 3.1.2 Phương pháp Weisfeiler-Lehman Graph Kernel theo nguyên tử 34 3.1.3 Phương pháp Weisfeiler-Lehman kernel dựa liên kết 37 3.1.4 Phương pháp Weisfeiler-Lehman kernel dựa khoảng cách liên nguyên tử 38 3.1.5 Mơ hình ML hồn chỉnh 38 3.1.6 Phân tích diễn giải dự đốn mơ hình RR/WL-A 40 3.2 Ngơn ngữ lập trình thư viện sử dụng 41 3.2.1 Python 41 vi 3.2.2 Một số thư viện Python cho khoa học liệu 41 3.2.3 Thư viện Python – RDKit 42 3.2.4 Thư viện Python – Scikit-learn 42 3.3 Dữ liệu phương pháp thu thập liệu 43 3.4 Xây dựng mơ hình lập trình 47 3.4.1 Lập trình mơ hình WL kernel 47 3.4.2 Lập trình việc huấn luyện, tối ưu, kiểm tra mơ hình máy học 53 3.4.4 Lập trình giao thức học active learning 55 CHƯƠNG KẾT QUẢ VÀ BÀN LUẬN 58 4.1 Khảo sát ảnh hưởng số vịng lặp thuật tốn WL lên mơ hình 58 4.2 Độ xác phương pháp mơ hình GPR/WL GPR/ECFP 61 4.3 Active learning 62 4.4 Các mô hình tuyến tính giải thích mơ hình 64 4.5 Phân tích sai số mơ hình 67 4.6 So sánh dự đốn mơ hình giá trị thực nghiệm 68 4.7 Mã nguồn hướng dẫn sử dụng 69 CHƯƠNG KẾT LUẬN VÀ KIẾN NGHỊ 72 5.1 Các nhiệm hoàn thành kết 72 5.2 Các thiếu sót hạn chế 73 5.3 Hướng phát triển tương lai 74 DANH MỤC CƠNG TRÌNH KHOA HỌC 75 DANH MỤC TÀI LIỆU THAM KHẢO 76 PHẦN LÝ LỊCH TRÍCH NGANG 83 Thông tin cá nhân 83 Quá trình đào tạo 83 2.1 Đại học: 83 2.2 Sau đại học: 83 Quá trình công tác 83 vii DANH MỤC HÌNH ẢNH Hình 1.1 Hình minh họa cho chiến thuật sàng lọc theo dạng phễu Hình 1.2 Sơ đồ mơ tả mơ hình machine learning cho việc dự đoán band gap PAH Hình 2.1 Một số phân tử đa vòng thơm đề cập Hình 2.2 Flowchart cho quy trình active learning kiểm tra quy trình 15 Hình 2.3 Ví dụ cho cấu trúc liệu graph (a) graph phân tử methanone (b, lược bỏ H) 17 Hình 2.4 Minh họa cho trình k-cross validation với k=5 21 Hình 2.5 Minh họa cho ngun tắc tắc tính đa thức DPO 22 Hình 3.1 Các phân tử ví dụ cho thuật tốn WL phương pháp WL kernel 31 Hình 3.2 Flowchart cho mơ hình machine learning hồn chỉnh 39 Hình 3.3 Phân phối lớp phân tử cho tất ba liệu 43 Hình 3.4 Minh họa cho số phân tử PAH thienoacenes 45 Hình 3.5 Minh họa cho số phân tử PAH có gắn nhóm cyano (PAH-CN) 46 Hình 3.6 Minh họa cho số phân tử PAH có gắn nhóm nitro (PAH-NO2) 47 Hình 4.1 Đồ thị logarithm bậc 10 chiều dài vector 𝜙 cho phương pháp WL-A, WL-AB, WL-AD theo số vịng lặp thuật tốn WL 59 Hình 4.2 Đồ thị sai số RMSD cho band gap theo số vịng lặp thuật tốn WL hay bán kính ECFP cho liệu hỗn hợp, liệu PAH liệu PAH có nhóm theo thứ tự từ xuống Hình A-C cho mơ hình sử dụng ECFP, hình D-F cho mơ hình RR/WL, hình G-I cho mơ hình GPR/WL 60 Hình 4.3 Biểu đồ hộp cho RMSDs thu qua 20 lần chạy cho phương pháp graph kernel GPR/WL mơ hình GPR/ECFP cho bandgap (A-C), EA (D-F), IP (G-I) từ xuống Các điểm vng biểu thị giá trị trung bình RMSDs Các hình cột nằm bên trái (A, D, G), (B, E, H), bên phải (C, F, I) cho liệu kết hợp, liệu PAH, liệu PAH thay thế, tương ứng 62 69 1.90 1.92 1.62b 1.60 1.91 1.60b 2.40 2.39 1.97b 2.98 3.06 2.85a a Dữ liệu thực nghiệm dạng dung dịch b Dữ liệu thực nghiệm dạng phim mỏng Bảng 4.2 liệt kê so sánh giá trị dự đốn mơ hình machine learning, giá trị dự đoán phương pháp lý thuyết DFT, giá trị thực nghiệm có sẵn cho phân tử có gắn nhóm cyano Dễ thấy giá trị dự đốn machine learning gần với giá trị DFT, với ngoại lệ phân tử hàng thứ ba Mặc khác, bàn luận tài liệu tham khảo trước đó,[4] ta lập luận việc sử dụng giá trị DFT xấp xỉ cho giá trị thực nghiệm hoàn toàn phù hợp 4.7 Mã nguồn hướng dẫn sử dụng Mã nguồn mơ hình liệu truy cập trang: https://github.com/Tuan-H-Nguyen/Atomic-based-QSPR-for-fusenes-andderivatives Mã nguồn bao gồm: 70  Code cho mơ hình bàn luận bao gồm thuật tốn WL phương pháp WL kernel, mơ hình GPR hay RR, thuật toán tự động tối ưu siêu tham số mơ hình thuật tốn WL (số vịng lặp thuật tốn WL), tất file pipeline.py  Code để chạy thí nghiệm khảo sát sai số theo số vòng lặp, khảo sát giao thức active learning, khảo sát sai số cho phương pháp cho cấu trúc, giải thích cho mơ hình  Code main.py cho phép huấn luyện mơ hình, lưu mơ hình huấn luyện, code predictor.py thực dự đoán trực tiếp cho chuỗi SMILES command line/ powershell Các ngơn ngữ lập trình, thư viện sử dụng version chúng: Python 3.8.16 zlib 1.2.12 Pandas 1.5.2 Numpy 1.23.5 Matplotlib 3.7.0 sklearn 2022.03.3 rdkit 1.2.0 Hướng dẫn để chạy dự đoán cho chuỗi SMILES: Từ command line, chạy: > python main.py -k subtree -m gpr -d mixed -i -n 10 -p với biến: -k: biến thể WL graph kernel với subtree cho WLA, edge cho WLAB, hay shortest_path cho WLAD -m: mơ hình machine learning, gpr, hay rr -d: liệu sử dụng mixed cho liệu hỗn hợp, pah cho liệu PAH hay, subst cho liệu PAH có nhóm 71 -i: số vịng lặp cho thuật tốn WL Có thể cung cấp nhiều giá trị Mơ hình chọn số giá trị cung cấp (ví dụ 2, dịng code trên) thơng qua grid search cho tối thiểu hóa sai số cross-validation Lưu ý nhiều giá trị cung cấp thời gian chạy lâu -n: số lần lặp lại mơ hình -p: chọn số để lưu mơ hình dạng file pkl File pkl lưu lại có tên model_ensemble_[dataset_name]_[kernel_type]_[regressor] pkl với dataset_name tên liệu, kernel_type tên phương pháp WL, regressor tên mơ hình ML hồi quy Thực dự đoán với cú pháp: > python predictor.py [smiles string] -m gpr -k wla -d mixed Với  [smiles string] chuỗi SMILES cho phân tử cần dự đốn, tạo từ phần mềm chemdraw hay trang web cho phép tạo chuỗi SMILES https://www.cheminfo.org/flavor/malaria/Utilities/SMILES_generator _chec ker/index.html  biến lại tương tự Ví dụ cho việc dự đốn mơ hình cho bảng dưới: PS C:\Users\hoang\dropbox\comp_chem_lab\MLmodel> python predictor.py 'N#Cc5ccc4cc3cc2cc1ccccc1cc2cc3cc4c5' -m gpr -k subtree -d subst (Output) Predictions for Bandgap(eV): 2.13 Predictions for Electron Affinity(eV): 3.08 Predictions for Ionization Potential(eV): 5.38 72 CHƯƠNG KẾT LUẬN VÀ KIẾN NGHỊ 5.1 Các nhiệm hoàn thành kết Luận văn phần thành công việc xây dựng mơ hình dự đốn tính tính chất điện tử band gap, electron affinity, ionization potential hợp chất đa vòng thơm dẫn xuất từ cấu trúc chúng Mơ hình xây dựng mơ hình dựa lý thuyết graph phân tử mơ hình thống kê có khả fit (khớp) với liệu Cụ thể hơn, mơ hình xem xét:  Bao gồm phương pháp Weisfeiler-Lehman (WL) graph kernel Đây phương pháp graph kernel, có nghĩa dựa việc tính tốn tương đồng graph Phương pháp nêu dựa thuật toán Weisfeiler-Lehman, thuật toán tương đối đơn giản có tương đồng với ECFP fingerprint tiếng hóa tin  Có lựa chọn để tùy biến mơ hình bao gồm mơ hình WL dựa ngun tử, mơ hình WL dựa liên kết, mơ hình WL dựa khoảng cách nguyên tử  Sử dụng thuật tốn máy học có giám sát (supervised learning) có sẵn bao gồm mơ hình Ridge Regression (RR) mơ hình Gaussian Process Regression (GPR)  Ngồi ra, mơ hình có chế active learning cho phép xây dựng tập huấn luyện cách hiệu  Mơ hình xây dựng cho liệu bao gồm hydrocarbon đa vòng thơm (PAH), thienoacenes (PAH với vịng thiophene), PAH có gắn 1-4 nhóm CN, PAH có gắn từ 1-4 nhóm NO2 Kiểm tra mơ hình cho thấy số kết sau:  Mơ hình với WL graph kernel khác với mơ hình hồi quy GPR cho sai số tốt: sai số RMSD nằm khoảng 0.15eV nằm phạm vi sai số phương pháp DFT (0.1eV) dùng để tính tốn liệu  Giao thức học active learning kiểm tra cho thấy số kết khích lệ Q trình mở rộng liệu huấn luyện dựa vào active learning có cho thấy 73 cải thiện mơ hình nhanh so với mở rộng liệu huấn luyện cách ngẫu nhiên Tuy nhiên, lợi ích active learning khơng đáng kể so với việc thêm liệu huấn luyện cách ngẫu nhiên phụ thuộc vào độ phức tạp liệu mơ hình hóa  Mơ hình WL graph kernel dựa phân tử hay liên kết cho kết tương đối sử dụng với mơ hình hồi quy tuyến tính RR Tuy nhiên, mơ hình WL graph kernel dựa khoảng cách phân tử (WL-AD) với mơ hình hồi quy tuyến tính lại cho kết ngang với trường hợp mơ hình hồi quy GPR Điều chứng tỏ WL-AD tương quan tuyến tính với tính chất điện tử tốt biến thể lại Do đó, ta tùy biến mơ hình WL graph kernel dựa kiến thức hóa để đạt hiệu mơ hình hóa cao  Mơ hình RR mơ hình tuyến tính ta phân tích kết mơ hình để thu thập thêm kiến thức hóa học học mơ hình Kết cho thấy mơ hình WL graph kernel cho tranh tương đối giống mơ hình lượng tử đề xuất trước đó.[1-4] 5.2 Các thiếu sót hạn chế  Tuy nhiên, nghiên cứu mơ hình gặp khó khăn dự đốn cấu trúc khơng phẳng, mơ hình lượng tử trước  Mơ hình tập trung vào cấu trúc chiều Điều có mặt lợi khơng cần thực tính tốn hay thí nghiệm để có đầu vào cần thiết cho việc dự đốn Tuy nhiên, mơ hình khơng có kể đến đồng phân (isomer) hay cấu dạng (conformer) phân tử  Mơ hình hồn tồn dựa liệu lý thuyết có khả dự đốn kết cho thực nghiệm cịn hạn chế Cũng cần lưu ý việc dự đoán thực nghiệm địi hỏi liệu thí nghiệm có chi phí thực cao so với tính tốn lý thuyết Do đó, việc xác định mức độ hiệu phương pháp lý thuyết cần thiết  Tính chất phân tử mơ hình hóa luận văn bao gồm tính chất bandgap, EA, IP, thiếu tính chất quan trọng cho ứng 74 dụng bán dẫn hữu độ linh động điện tích (charge mobility) lượng tái tổ hợp (reorganization energy), 5.3 Hướng phát triển tương lai  Các cơng trình sau tìm kiếm cách cải thiện độ xác mơ hình cho phân tử lệch phẳng  Nghiên cứu xây dựng mơ hình cho phân tử biểu diễn dạng chiều (ví dụ phân tử có tọa độ nguyên tử rõ ràng) Bằng cách này, yếu tố đồng phân cấu dạng kể đến dự đốn mơ hình  Thêm vào đó, tương tự phương pháp WL graph kernel mơ hình graph neural network tân tiến nay[50] ngầm kết cơng trình có ích q trình xây dựng mơ hình ML/AI hoạt động graph phân tử Các cơng trình nhóm tập trung vào việc xây dựng mơ hình graph phân tử với mạng neuron nhân tạo mở rộng phạm vi hoạt động mơ hình với nhiều phân tử hữu khác có tiềm cho ứng dụng vật liệu bán dẫn hữu  Mặt khác, cơng trình sau tập trung xây dựng mơ hình cho tính chất khác có liên quan mật thiết tới ứng dụng bán dẫn hữu độ linh động điện tích lượng tái tổ hợp, sở mơ hình dự đốn tính chất band gap, EA, IP cho phân tử hữu đa vòng thơm  Trong tương lai, nhóm nghiên cứu xây dựng mơ hình cho mục đích dự đốn giá trị thực nghiệm Điều đòi hỏi việc thu thập liệu thực nghiệm hay thực thí nghiệm Mặc khác, mơ hình cho giá trị thực nghiệm địi hỏi việc thiết kế mơ hình phải kể đến biến số thí nghiệm quy trình tổng hợp, phương pháp tạo vật liệu, nguyên liệu, 75 DANH MỤC CƠNG TRÌNH KHOA HỌC Tạp chí quốc tế T H Nguyen, K M Le, L H Nguyen, and T N Truong, "Machine LearningBased Quantitative Structure–Property Relationships for the Electronic Properties of Cyano Polycyclic Aromatic Hydrocarbons", ACS Omega, vol 8, pp 464-472, Jan 2023 DOI: http://doi.org/10.1021/acsomega.2c05159 76 DANH MỤC TÀI LIỆU THAM KHẢO [1] L H Nguyen and T N Truong "Quantitative Structure–Property Relationships for the Electronic Properties of Polycyclic Aromatic Hydrocarbons", ACS Omega, vol 3, pp 8913-8922, Aug 2018 [2] L H Nguyen et al., "Quantum Mechanical-Based Quantitative Structure– Property Relationships for Electronic Properties of Two Large Classes of Organic Semiconductor Materials: Polycyclic Aromatic Hydrocarbons and Thienoacenes", ACS Omega, vol 4, pp 7516-7523, Apr 2019 [3] T H Nguyen et al., "Application of Machine Learning in Developing Quantitative Structure–Property Relationship for Electronic Properties of Polyaromatic Compounds", ACS Omega, vol 7, pp 22879-22888, Jul 2022 [4] T H Nguyen et al., "Machine Learning-Based Quantitative Structure– Property Relationships for the Electronic Properties of Cyano Polycyclic Aromatic Hydrocarbons", ACS Omega, vol 8, pp 464-472, Jan 2023 [5] D Rogers and M Hahn "Extended-Connectivity Fingerprints", Journal of Chemical Information and Modeling, vol 50, pp 742-754, May 2010 [6] E O Pyzer-Knapp et al., "What Is High-Throughput Virtual Screening? A Perspective from Organic Materials Discovery", Annual Review of Materials Research, vol 45, pp 195-216, Jul 2015 [7] G B Goh et al., "Deep learning for computational chemistry", Journal of Computational Chemistry, vol 38, pp 1291-1307, Jun 2017 [8] A C Mater and M L Coote "Deep Learning in Chemistry", Journal of Chemical Information and Modeling, vol 59, pp 2545-2559, Jun 2019 [9] A S Christensen et al., "OrbNet Denali: A machine learning potential for biological and organic chemistry with semi-empirical cost and DFT accuracy", The Journal of Chemical Physics, vol 155, p 204103, 2021 [10] B Geffroy et al., "Organic light‐emitting diode (OLED) technology: materials, devices and display technologies", Polymer international, vol 55, pp 572-582, 2006 77 [11] J Mei et al., "Integrated Materials Design of Organic Semiconductors for Field-Effect Transistors", Journal of the American Chemical Society, vol 135, pp 6724-6746, May 2013 [12] B S Ong et al., "Thiophene Polymer Semiconductors for Organic Thin-Film Transistors", Chemistry – A European Journal, vol 14, pp 4766-4778, May 2008 [13] R Olivares-Amaya et al., "Accelerated computational discovery of highperformance materials for organic photovoltaics by means of cheminformatics", Energy & Environmental Science, vol 4, pp 4849-4861, Sep 2011 [14] L Schmidt-Mende et al., "Self-Organized Discotic Liquid Crystals for HighEfficiency Organic Photovoltaics", Science, vol 293, pp 1119-1122, Aug 2001 [15] B Geffroy et al., "Organic light-emitting diode (OLED) technology: materials, devices and display technologies", Polymer International, vol 55, pp 572-582, Jun 2006 [16] A Szabo and N S Ostlund Modern quantum chemistry: introduction to advanced electronic structure theory Courier Corporation, 2012 [17] L Zhang et al., "Unconventional, Chemically Stable, and Soluble TwoDimensional Angular Polycyclic Aromatic Hydrocarbons: From Molecular Design to Device Applications", Accounts of Chemical Research, vol 48, pp 500-509, Mar 2015 [18] Y Wan et al., "Molecular design and crystallization process control for thin sheet-shaped organic semiconductor crystals with two-dimensional packing", Journal of Materials Chemistry C, vol 10, pp 2556-2561, 2022 [19] C Yao et al., "Elucidating the Key Role of the Cyano (−C≡N) Group to Construct Environmentally Friendly Fused-Ring Electron Acceptors", The Journal of Physical Chemistry C, vol 124, pp 23059-23068, Oct 2020 [20] K Takimiya et al., "Thienoacene‐based organic semiconductors", Advanced Materials, vol 23, pp 4347-4370, Oct 2011 78 [21] S Shalev-Shwartz and S Ben-David Understanding machine learning: From theory to algorithms Cambridge university press, 2014 [22] C M Bishop and N M Nasrabadi Pattern recognition and machine learning vol 4: Springer, 2006 [23] T Hastie et al., "Linear Methods for Regression," in The Elements of Statistical Learning: Data Mining, Inference, and Prediction, T Hastie, R Tibshirani, and J Friedman, Eds., ed New York, NY: Springer New York, 2009, pp 43-99 [24] T Hastie et al., "Kernel Smoothing Methods," in The Elements of Statistical Learning: Data Mining, Inference, and Prediction, T Hastie, R Tibshirani, and J Friedman, Eds., ed New York, NY: Springer New York, 2009, pp 191218 [25] N M Kriege et al., "A survey on graph kernels", Applied Network Science, vol 5, p 6, Jan 2020 [26] K P Murphy Probabilistic Machine Learning: An introduction MIT Press [27] "6.8 Pairwise metrics, Affinities and Kernels." Internet: , 22/5/2023 [28] I Goodfellow et al., Deep learning MIT press, 2016 [29] T Hastie et al., "Neural Networks," in The Elements of Statistical Learning: Data Mining, Inference, and Prediction, T Hastie, R Tibshirani, and J Friedman, Eds., ed New York, NY: Springer New York, 2009, pp 389-416 [30] C K I Williams and C E Rasmussen Gaussian processes for machine learning vol 2: MIT press Cambridge, MA, 2006 [31] M Tynes et al., "Pairwise Difference Regression: A Machine Learning Metaalgorithm for Improved Prediction and Uncertainty Quantification in Chemical Search", Journal of Chemical Information and Modeling, vol 61, pp 3846-3857, Aug 2021 [32] Y.-H Tang and W A de Jong "Prediction of atomization energy using graph kernel and active learning", The Journal of Chemical Physics, vol 150, p 044107, Jan 2019 79 [33] T Le et al., "Quantitative Structure–Property Relationship Modeling of Diverse Materials Properties", Chemical Reviews, vol 112, pp 2889-2919, May 2012 [34] F Musil et al., "Physics-Inspired Structural Representations for Molecules and Materials", Chemical Reviews, vol 121, pp 9759-9815, Aug 2021 [35] J L Durant et al., "Reoptimization of MDL Keys for Use in Drug Discovery", Journal of Chemical Information and Computer Sciences, vol 42, pp 12731280, Nov 2002 [36] J.-L Faulon et al., "The Signature Molecular Descriptor Using Extended Valence Sequences in QSAR and QSPR Studies", Journal of Chemical Information and Computer Sciences, vol 43, pp 707-720, May 2003 [37] L H Hall and L B Kier "Electrotopological State Indices for Atom Types: A Novel Combination of Electronic, Topological, and Valence State Information", Journal of Chemical Information and Computer Sciences, vol 35, pp 1039-1045, Nov 1995 [38] K Gao et al., "Are 2D fingerprints still valuable for drug discovery?", Physical Chemistry Chemical Physics, vol 22, pp 8373-8390, Mar 2020 [39] M Rupp et al., "Fast and Accurate Modeling of Molecular Atomization Energies with Machine Learning", Physical Review Letters, vol 108, p 058301, Jan 2012 [40] L J Soltzberg and C L Wilkins "Molecular transforms: a potential tool for structure-activity studies", Journal of the American Chemical Society, vol 99, pp 439-443, Jan 1977 [41] G B Goh et al., "Chemception: a deep neural network with minimal chemistry knowledge matches the performance of expert-developed QSAR/QSPR models", arXiv preprint arXiv:1706.06689, 2017 [42] S Zheng et al., "Identifying Structure–Property Relationships through SMILES Syntax Analysis with Self-Attention Mechanism", Journal of Chemical Information and Modeling, vol 59, pp 914-923, Feb 2019 80 [43] D Weininger "SMILES, a chemical language and information system Introduction to methodology and encoding rules", Journal of Chemical Information and Computer Sciences, vol 28, pp 31-36, Feb 1988 [44] W Hu et al., "Ogb-lsc: A large-scale challenge for machine learning on graphs", arXiv preprint arXiv:2103.09430, 2021 [45] T Hastie et al., "Model Assessment and Selection," in The Elements of Statistical Learning: Data Mining, Inference, and Prediction, T Hastie, R Tibshirani, and J Friedman, Eds., ed New York, NY: Springer New York, 2009, pp 219-259 [46] C McGill et al., "Predicting Infrared Spectra with Message Passing Neural Networks", Journal of Chemical Information and Modeling, vol 61, pp 25942609, Jun 2021 [47] K Yang et al., "Analyzing Learned Molecular Representations for Property Prediction", Journal of Chemical Information and Modeling, vol 59, pp 3370-3388, Aug 2019 [48] J Gilmer et al.,, "Neural message passing for quantum chemistry," in The 34th International Conference on Machine Learning, Sydney, Australia, 2017, pp 1263-1272 [49] D K Duvenaud et al., "Convolutional networks on graphs for learning molecular fingerprints", Advances in neural information processing systems, vol 28, 2015 [50] T Lei et al.,, "Deriving neural architectures from sequence and graph kernels," in Proceedings of the 34th International Conference on Machine Learning, Sydney, Australia, pp 2024-2033 [51] W Beker et al., "Machine Learning May Sometimes Simply Capture Literature Popularity Trends: A Case Study of Heterocyclic Suzuki–Miyaura Coupling", Journal of the American Chemical Society, vol 144, pp 48194827, Mar 2022 [52] W Jin et al., "Predicting organic reaction outcomes with weisfeiler-lehman network", Advances in neural information processing systems, vol 30, 2017 81 [53] C N Cavasotto and V Scardino "Machine Learning Toxicity Prediction: Latest Advances by Toxicity End Point", ACS Omega, vol 7, pp 4753647546, Dec 2022 [54] A Thakur et al., "QSAR study on benzenesulphonamide carbonic anhydrase inhibitors: topological approach using Balaban index", Bioorganic & Medicinal Chemistry, vol 12, pp 789-793, Feb 2004 [55] R Huang et al., "Tox21Challenge to Build Predictive Models of Nuclear Receptor and Stress Response Pathways as Mediated by Exposure to Environmental Chemicals and Drugs", Frontiers in Environmental Science, vol 3, 2016 [56] A Mayr et al., "DeepTox: Toxicity Prediction using Deep Learning", Frontiers in Environmental Science, vol 3, Feb 2016 [57] N T Huang and S Villar, "A Short Tutorial on The Weisfeiler-Lehman Test And Its Variants," in ICASSP 2021 - 2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Ontario, Canada, 2021, pp 8533-8537 [58] N Shervashidze et al., "Weisfeiler-lehman graph kernels", Journal of Machine Learning Research, vol 12, 2011 [59] "11 Most In-Demand Programming Languages." Internet: https://bootcamp.berkeley.edu/blog/most-in-demand-programminglanguages/, 4/4/2023 [60] "Python gì?" Internet: https://aws.amazon.com/vi/what-is/python/, 4/4/2023 [61] T Pandas Development Team "Pandas-dev/pandas", Pandas, 2020 [62] J D Hunter "Matplotlib: A 2D graphics environment", Computing in science & engineering, vol 9, pp 90-95, June 2007 [63] C R Harris et al., "Array programming with NumPy", Nature, vol 585, pp 357-362, 2020 [64] "RDKit: Open-source cheminformatics." Internet: https://www.rdkit.org, 7/6/2023 82 [65] F Pedregosa et al., "Scikit-learn: Machine learning in Python", the Journal of machine Learning research, vol 12, pp 2825-2830, 2011 [66] "Gaussian 16." Internet: https://gaussian.com/gaussian16/, 12/06/2023 83 PHẦN LÝ LỊCH TRÍCH NGANG Thơng tin cá nhân Họ tên: Nguyễn Hồng Tuấn Ngày, tháng, năm sinh: 15/07/1998 Nơi sinh: Tp.HCM Địa liên lạc: 708/19/44 Hồng Bàng, Phường 1, Quận 11, Tp.HCM Số điện thoại: 0938087849 Quá trình đào tạo 2.1 Đại học: Đã tốt nghiệp Đại Học Bách Khoa TP.HCM- Đại học Quốc Gia TP.HCM Ngành học: Kỹ thuật Hóa học Thời gian đào tạo: từ 2016-2020 Xếp loại: giỏi 2.2 Sau đại học: Đang theo học Đại Học Bách Khoa TP.HCM- Đại học Quốc Gia TP.HCM Trình độ: Thạc Sĩ Ngành học: Kỹ thuật Hóa học Thời gian đào tạo: từ 2021 – Q trình cơng tác Cộng tác viên nghiên cứu nhóm nghiên cứu Hạ Tầng Tính Tốn giáo sư Trương Nguyện Thành Viên Khoa Học Cơng Nghệ Tính Tốn Tp.HCM (ICST) Vai trị: Nghiên cứu sinh hóa tính tốn chun phát triển cơng cụ tính tốn dựa thuật toán học máy phương pháp liệu lớn cho vật liệu hợp chất hóa học Thời gian: 2018 – 2023 Các cơng trình tiêu biểu: Xem tài liệu tham khảo [2-4]

Ngày đăng: 25/10/2023, 22:19

HÌNH ẢNH LIÊN QUAN

Hình 1.1. Hình minh họa cho chiến thuật sàng lọc theo dạng phễu.[6] - Ứng dụng thuật toán học máy dự đoán tính chất điện tử của hợp chất đa vòng thơm và một số dẫn xuất của chúng
Hình 1.1. Hình minh họa cho chiến thuật sàng lọc theo dạng phễu.[6] (Trang 16)
Hình 2.1. Một số phân tử đa vòng thơm được đề cập. - Ứng dụng thuật toán học máy dự đoán tính chất điện tử của hợp chất đa vòng thơm và một số dẫn xuất của chúng
Hình 2.1. Một số phân tử đa vòng thơm được đề cập (Trang 20)
Hình 2.2. Flowchart cho quy trình active learning cũng như kiểm tra quy trình này. - Ứng dụng thuật toán học máy dự đoán tính chất điện tử của hợp chất đa vòng thơm và một số dẫn xuất của chúng
Hình 2.2. Flowchart cho quy trình active learning cũng như kiểm tra quy trình này (Trang 29)
Hình 2.5. Minh họa cho nguyên tắc tắc tính đa thức DPO.[1] - Ứng dụng thuật toán học máy dự đoán tính chất điện tử của hợp chất đa vòng thơm và một số dẫn xuất của chúng
Hình 2.5. Minh họa cho nguyên tắc tắc tính đa thức DPO.[1] (Trang 36)
Hình 3.1. Các phân tử ví dụ cho thuật toán WL và các phương pháp WL kernel. - Ứng dụng thuật toán học máy dự đoán tính chất điện tử của hợp chất đa vòng thơm và một số dẫn xuất của chúng
Hình 3.1. Các phân tử ví dụ cho thuật toán WL và các phương pháp WL kernel (Trang 45)
Bảng 3.2 cho thấy quá trình thực hiện vòng lặp đầu tiên của quá trình tìm nhãn mới - Ứng dụng thuật toán học máy dự đoán tính chất điện tử của hợp chất đa vòng thơm và một số dẫn xuất của chúng
Bảng 3.2 cho thấy quá trình thực hiện vòng lặp đầu tiên của quá trình tìm nhãn mới (Trang 47)
Bảng 3.3 cho thấy quá trình thực hiện vòng lặp thứ hai của quá trình tìm nhãn mới - Ứng dụng thuật toán học máy dự đoán tính chất điện tử của hợp chất đa vòng thơm và một số dẫn xuất của chúng
Bảng 3.3 cho thấy quá trình thực hiện vòng lặp thứ hai của quá trình tìm nhãn mới (Trang 48)
Bảng 3.4. Bảng các nhãn nguyên tử cho phân tử 1 ở hình 3.1. - Ứng dụng thuật toán học máy dự đoán tính chất điện tử của hợp chất đa vòng thơm và một số dẫn xuất của chúng
Bảng 3.4. Bảng các nhãn nguyên tử cho phân tử 1 ở hình 3.1 (Trang 50)
Bảng 3.5. Bảng các nhãn liên kết ở các vòng lặp từ 0 (khởi tạo) đến vòng lặp thứ 2  cho phân tử 1 trong hình 3.1 - Ứng dụng thuật toán học máy dự đoán tính chất điện tử của hợp chất đa vòng thơm và một số dẫn xuất của chúng
Bảng 3.5. Bảng các nhãn liên kết ở các vòng lặp từ 0 (khởi tạo) đến vòng lặp thứ 2 cho phân tử 1 trong hình 3.1 (Trang 51)
Hình 3.2. Flowchart cho mô hình machine learning hoàn chỉnh. - Ứng dụng thuật toán học máy dự đoán tính chất điện tử của hợp chất đa vòng thơm và một số dẫn xuất của chúng
Hình 3.2. Flowchart cho mô hình machine learning hoàn chỉnh (Trang 53)
Hình 3.3. Phân phối các lớp phân tử cho tất cả ba bộ dữ liệu. - Ứng dụng thuật toán học máy dự đoán tính chất điện tử của hợp chất đa vòng thơm và một số dẫn xuất của chúng
Hình 3.3. Phân phối các lớp phân tử cho tất cả ba bộ dữ liệu (Trang 58)
Hình 3.4. Minh họa cho một số phân tử PAH và thienoacenes. - Ứng dụng thuật toán học máy dự đoán tính chất điện tử của hợp chất đa vòng thơm và một số dẫn xuất của chúng
Hình 3.4. Minh họa cho một số phân tử PAH và thienoacenes (Trang 59)
Hình 3.6. Minh họa cho một số phân tử PAH có gắn nhóm thế nitro (PAH-NO 2 ) - Ứng dụng thuật toán học máy dự đoán tính chất điện tử của hợp chất đa vòng thơm và một số dẫn xuất của chúng
Hình 3.6. Minh họa cho một số phân tử PAH có gắn nhóm thế nitro (PAH-NO 2 ) (Trang 61)
Bảng 3.7: Code Python cho thuật toán Weisfeiler-Lehman cho các graph phân tử. - Ứng dụng thuật toán học máy dự đoán tính chất điện tử của hợp chất đa vòng thơm và một số dẫn xuất của chúng
Bảng 3.7 Code Python cho thuật toán Weisfeiler-Lehman cho các graph phân tử (Trang 63)
Bảng 3.9. Xây dựng mô hình hồi quy với sklearn. - Ứng dụng thuật toán học máy dự đoán tính chất điện tử của hợp chất đa vòng thơm và một số dẫn xuất của chúng
Bảng 3.9. Xây dựng mô hình hồi quy với sklearn (Trang 67)
Bảng 3.10. Xây dựng và tối ưu mô hình thông qua grid search và cross-validation - Ứng dụng thuật toán học máy dự đoán tính chất điện tử của hợp chất đa vòng thơm và một số dẫn xuất của chúng
Bảng 3.10. Xây dựng và tối ưu mô hình thông qua grid search và cross-validation (Trang 68)
Bảng 3.11. Tính sai số RMSD của dự đoán và giá trị “đúng” - Ứng dụng thuật toán học máy dự đoán tính chất điện tử của hợp chất đa vòng thơm và một số dẫn xuất của chúng
Bảng 3.11. Tính sai số RMSD của dự đoán và giá trị “đúng” (Trang 69)
Hình 4.1. Đồ thị của logarithm bậc 10 của chiều dài của các vector ϕ cho các  phương pháp WL-A, WL-AB, và WL-AD theo số vòng lặp của thuật toán WL - Ứng dụng thuật toán học máy dự đoán tính chất điện tử của hợp chất đa vòng thơm và một số dẫn xuất của chúng
Hình 4.1. Đồ thị của logarithm bậc 10 của chiều dài của các vector ϕ cho các phương pháp WL-A, WL-AB, và WL-AD theo số vòng lặp của thuật toán WL (Trang 73)
Hình 4.2. Đồ thị của sai số RMSD cho band gap theo số vòng lặp thuật toán WL  hay bán kính của ECFP cho dữ liệu hỗn hợp, dữ liệu PAH và dữ liệu PAH có nhóm  thế theo thứ tự từ trên xuống dưới - Ứng dụng thuật toán học máy dự đoán tính chất điện tử của hợp chất đa vòng thơm và một số dẫn xuất của chúng
Hình 4.2. Đồ thị của sai số RMSD cho band gap theo số vòng lặp thuật toán WL hay bán kính của ECFP cho dữ liệu hỗn hợp, dữ liệu PAH và dữ liệu PAH có nhóm thế theo thứ tự từ trên xuống dưới (Trang 74)
Bảng 4.1. Bảng phạm vi tìm kiếm cho số vòng lặp WL/bán kính ECFP và hàm nhân  GPR được sử dụng cho mỗi phương pháp - Ứng dụng thuật toán học máy dự đoán tính chất điện tử của hợp chất đa vòng thơm và một số dẫn xuất của chúng
Bảng 4.1. Bảng phạm vi tìm kiếm cho số vòng lặp WL/bán kính ECFP và hàm nhân GPR được sử dụng cho mỗi phương pháp (Trang 74)
Hình 4.3 thể hiện RMSDs của một số mô hình với các kernel GPR/WL hoặc ECFP - Ứng dụng thuật toán học máy dự đoán tính chất điện tử của hợp chất đa vòng thơm và một số dẫn xuất của chúng
Hình 4.3 thể hiện RMSDs của một số mô hình với các kernel GPR/WL hoặc ECFP (Trang 75)
Hình 4.3. Biểu đồ hộp cho RMSDs thu được qua 20 lần chạy cho các phương pháp  graph kernel GPR/WL và mô hình GPR/ECFP cho bandgap (A-C), EA (D-F), và IP - Ứng dụng thuật toán học máy dự đoán tính chất điện tử của hợp chất đa vòng thơm và một số dẫn xuất của chúng
Hình 4.3. Biểu đồ hộp cho RMSDs thu được qua 20 lần chạy cho các phương pháp graph kernel GPR/WL và mô hình GPR/ECFP cho bandgap (A-C), EA (D-F), và IP (Trang 76)
Hình 4.4. Đồ thị của test RMSDs cho band gap theo kích thước tập huấn luyện cho  active learning và random selection (chọn mẫu ngẫu nhiên) - Ứng dụng thuật toán học máy dự đoán tính chất điện tử của hợp chất đa vòng thơm và một số dẫn xuất của chúng
Hình 4.4. Đồ thị của test RMSDs cho band gap theo kích thước tập huấn luyện cho active learning và random selection (chọn mẫu ngẫu nhiên) (Trang 77)
Hình 4.6. Minh họa đóng góp của các nguyên tử vào dự đoán về bandgap của một  số PAH và thienoacene có giá trị bandgap cao nhất (dòng trên cùng), bandgap trung - Ứng dụng thuật toán học máy dự đoán tính chất điện tử của hợp chất đa vòng thơm và một số dẫn xuất của chúng
Hình 4.6. Minh họa đóng góp của các nguyên tử vào dự đoán về bandgap của một số PAH và thienoacene có giá trị bandgap cao nhất (dòng trên cùng), bandgap trung (Trang 80)
Hình 4.7. Minh họa đóng góp của các nguyên tử vào dự đoán về bandgap của một  số PAH có gắn nhóm thế có giá trị bandgap cao nhất (dòng trên cùng), bandgap - Ứng dụng thuật toán học máy dự đoán tính chất điện tử của hợp chất đa vòng thơm và một số dẫn xuất của chúng
Hình 4.7. Minh họa đóng góp của các nguyên tử vào dự đoán về bandgap của một số PAH có gắn nhóm thế có giá trị bandgap cao nhất (dòng trên cùng), bandgap (Trang 81)
Hình 4.8. Các cấu trúc với giá trị sai số LOO lớn nhất. - Ứng dụng thuật toán học máy dự đoán tính chất điện tử của hợp chất đa vòng thơm và một số dẫn xuất của chúng
Hình 4.8. Các cấu trúc với giá trị sai số LOO lớn nhất (Trang 82)
Bảng 4.2. So sánh kết quả dự đoán của mô hình với giá trị thực nghiệm[4] và giá trị  DFT.[4] - Ứng dụng thuật toán học máy dự đoán tính chất điện tử của hợp chất đa vòng thơm và một số dẫn xuất của chúng
Bảng 4.2. So sánh kết quả dự đoán của mô hình với giá trị thực nghiệm[4] và giá trị DFT.[4] (Trang 82)
Bảng 4.2 liệt kê và so sánh giá trị dự đoán bởi mô hình machine learning, giá trị dự  đoán bởi phương pháp lý thuyết DFT, và giá trị thực nghiệm có sẵn cho các phân tử  có gắn nhóm thế cyano - Ứng dụng thuật toán học máy dự đoán tính chất điện tử của hợp chất đa vòng thơm và một số dẫn xuất của chúng
Bảng 4.2 liệt kê và so sánh giá trị dự đoán bởi mô hình machine learning, giá trị dự đoán bởi phương pháp lý thuyết DFT, và giá trị thực nghiệm có sẵn cho các phân tử có gắn nhóm thế cyano (Trang 83)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w