KẾT LUẬN VÀ KIẾN NGHỊ

Một phần của tài liệu Ứng dụng mô hình học máy để dự báo khả năng hấp phụ dược phẩm bằng than sinh học trong môi trường nước (tt) (Trang 26)

Nghiên cứu này thực hiện thu thập dữ liệu từ các bài báo và xây dựng công cụ ML dự báo dung lượng hấp phụ dược phẩm bởi than sinh học. Kết quả chính của nghiên cứu này được trình bày như sau:

1. Từ 267 bài báo khoa học ban đầu, 36 bài báo được lựa chọn để thu thập dữ liệu chi tiết. Dữ liệu bao gồm 19 loại dược phẩm được sử dụng, như kháng sinh, thuốc kích thích thần kinh, thuốc gây mê và thuốc tổng hợp.

2. Qm của BC thường (n = 93) chiếm trung bình là 37,31 mg/g thấp hơn BC biến tính (n = 59) với 65,59 mg/g. BET của BC biến tính đạt trung bình 253,37 m2/g, trong khi đó, BC thường chỉ đạt 151,85 m2/g. Kiểm định thống kê cho thấy: trung bình Qm và BET giữa hai phương pháp nhiệt phân khác nhau đáng kể (có ý nghĩa thống kê, P<0,05). BC biến tính đã làm gia tăng BET và năng lực hấp phụ dược phẩm.

3. Mối tương quan cao nhất với r = 0,507 là giữa Qm và BET; tiếp theo là giữa Qm và PV với r = 0,489, trong khi PS tương quan nghịch với Qm với r = -0,036.

4. Qua kết quả đào tạo, mơ hình KNN và Cubist là 2 mơ hình được lựa chọn là tối ưu nhất với kết quả mơ hình KNN dự báo Qm với dữ liệu đào tạo: RMSE = 23,48 và R2 = 0,83 và với dữ liệu mới: R2 = 0,92 và RMSE =16,62. Mơ hình Cubist dự báo Qe với dữ liệu đạo tạo: R2 là 0,95 và RMSE là 13,90 và dữ liệu mới: RMSE là 14,18; R2 là 0,97.

5. Giao diện người dùng cho mơ hình KNN cho dự báo Qm đã được xây dựng. Người dùng khai báo các giá trị đầu vào (tức là BET, PV, A và S) trên ứng dụng web, kết quả của Qm sẽ được phản hồi trực tiếp.

Bên cạnh một số hiệu quả đạt được; nghiên cứu này có một số hạn chế cần được giải quyết trong nghiên cứu ở tương lai.

1. Trong các biến đầu vào có một số giá trị bị thiếu – mặc dù nó đã được thay thế bằng các giá trị thống kê; tuy nhiên khi dữ liệu đầy đủ chúng ta có thể loại bỏ biến thiếu hoặc đánh giá, phân tích thêm mức độ khơng chắc chắn (uncertainty) của các thuật toán sử dụng.

2. Các biến số hoặc yếu tố của các đặc điểm phản ánh hiệu quả hấp phụ của nghiên cứu, chẳng hạn như: nhóm chức năng, sinh khối, phương pháp chế tạo và biến đổi cũng cần được đề xuất để thu thập và kiểm tra trong các mơ hình ML.

3. Vì độ chính xác và tổng qt của các mơ hình dự báo phụ thuộc vào chất lượng dữ liệu. Việc lựa chọn các thuật toán tối ưu, nghiên cứu trong tương lai cần chú ý đến việc thu thập và khai thác dữ liệu hấp phụ dược phẩm bằng BC.

4. Mối tương quan chặt chẽ giữa thuật toán và tập dữ liệu, do đó, phương pháp thử và sai (trial and error) trong q trình tìm kiếm thuật tốn ML tối ưu cũng rất cần thiết để

triển khai tập dữ liệu hấp phụ nhất định trước khi đưa vào đào tạo và điều chỉnh sâu bất kỳ thuật toán cuối cùng nào.

Một phần của tài liệu Ứng dụng mô hình học máy để dự báo khả năng hấp phụ dược phẩm bằng than sinh học trong môi trường nước (tt) (Trang 26)

Tải bản đầy đủ (PDF)

(26 trang)