các kỹ thuật khai phá dữ liệu ứng dụng trong phân tích dữ liệu công thức dược phẩm

36 25 0
các kỹ thuật khai phá dữ liệu ứng dụng trong phân tích dữ liệu công thức dược phẩm

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BỘ Y TẾ ĐẠI HỌC Y DƯỢC TP HỒ CHÍ MINH BÁO CÁO TỔNG KẾT ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ CẤP TRƯỜNG CÁC KỸ THUẬT KHAI PHÁ DỮ LIỆU ỨNG DỤNG TRONG PHÂN TÍCH DỮ LIỆU CƠNG THỨC DƯỢC PHẨM Mã số: 43/2016/HĐ-NCKH Chủ nhiệm đề tài: ThS Hà Siu Tp Hồ Chí Minh, Tháng 3/Năm 2018 BỘ Y TẾ ĐẠI HỌC Y DƯỢC TP HỒ CHÍ MINH BÁO CÁO TỔNG KẾT ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ CẤP TRƯỜNG CÁC KỸ THUẬT KHAI PHÁ DỮ LIỆU ỨNG DỤNG TRONG PHÂN TÍCH DỮ LIỆU CƠNG THỨC DƯỢC PHẨM Mã số: 43/2016/HĐ-NCKH Chủ nhiệm đề tài: Hà Siu Tp Hồ Chí Minh, Tháng 3/Năm 2018 THƠNG TIN KẾT QUẢ NGHIÊN CỨU ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ CẤP TRƯỜNG Thông tin chung: - Tên đề tài: CÁC KỸ THUẬT KHAI PHÁ DỮ LIỆU ỨNG DỤNG TRONG PHÂN TÍCH DỮ LIỆU CƠNG THỨC DƯỢC PHẨM - Mã số: 43/2016/HĐ-NCKH - Chủ nhiệm đề tài: Hà Siu Điện thoại: 090 825 0123 Email: hasiupc@yahoo.com.vn - Đơn vị quản lý chuyên môn (Khoa, Tổ môn): Bộ môn Vật lý, Khoa Khoa học - Thời gian thực hiện: tháng 6/2016 đến tháng 6/2018 Mục tiêu: Nghiên cứu kỹ thuật khai phá liệu ứng dụng phân tích liệu cơng thức dược phẩm Nội dung chính: Nghiên cứu kỹ thuật phân cụm liệu luật kết hợp cho toán khai phá liệu ứng dụng phân tích liệu công thức dược phẩm Xây dựng công cụ tương ứng với kỹ thuật Đánh giá phần mềm với liệu cơng thức dược phẩm thực nghiệm Phân tích điểm mạnh điểm yếu kỹ thuật khai phá liệu ứng dụng Đưa số đề xuất giúp cải thiện độ xác trình khai phá liệu Kết đạt (khoa học, đào tạo, kinh tế-xã hội, ứng dụng, ): Có thể ứng dụng thực tế Bộ mơn Bào chế, Khoa Dược Đại học Y Dược Thành phố Hồ Chí Minh nhằm tìm thiếu sót có bổ sung cho phù hợp cho việc giải tốn thực tế Có thể ứng dụng thêm nguồn liệu từ thực phẩm Đề tài mở rộng, nâng cấp với chức tối ưu hóa cơng thức dược phẩm, tiên đốn cơng thức dược phẩm, tối ưu quy trình chiết xuất dược liệu, tối ưu môi trường nuôi cấy vi sinh… Xây dựng công cụ hỗ trợ cho nghiên cứu, đặc biệt luận văn sinh viên Đại học Khoa Dược Bên cạnh phần mềm hồn tồn nâng cấp thêm số kỹ thuật khác kỹ thuật tọa độ song song tích hợp vào phần mềm cho phép hỗ trợ nhà bào chế dễ dàng khảo sát mối liên quan nhân-quả Danh sách thành viên tham gia nghiên cứu đề tài đơn vị phối hợp Thành viên: Chủ nhiệm đề tài: Hà Siu Đơn vị phối hợp chính: Bộ môn vật lý, Đại học Y Dược Tp.HCM Bộ môn Công nghệ thông tin – Dược, Đại học Y Dược Tp.HCM Mục lục Thứ tự Nội dung Trang Mở đầu Đối tượng-phương pháp nghiên cứu Kết bàn luận 22 Nhận xét kết luận 34 Tài liệu tham khảo 36 MỞ ĐẦU Q trình thành lập cơng thức dược phẩm trình bắt đầu vài thành phần ban đầu biết trước kết thúc vài công thức dược phẩm thỏa mãn yêu cầu đặt ban đầu Công thức dược phẩm bao gồm dãy mối quan hệ với thành phần, liều lượng, tỉ trọng kinh nghiệm người bào chế chất, kết tạo cơng thức dược phẩm chứa đựng mâu thuẫn tiềm tàng công thức thiết lập Do cần kiểm tra phân tích lại mối quan hệ thành phần cơng thức dược phẩm Đầu tiên phải kể đến thành công việc ứng dụng hệ chuyên gia phân tích cơng thức dược phẩm Tuy nhiên hệ chuyên gia thật hoạt động tốt cung cấp tri thức đắn biết trước Trên thực tế, tri thức biết trước có sẵn, tình trạng gọi trạng thái “thắt cổ chai” Khó khăn lớn khơng biết tồn tri thức phần tri thức mà cung cấp tập hợp ghi (record) Dựa vào ghi này, cần rút luật mà thuộc tính có liên quan với Trường hợp thường xảy dược phẩm mới, thông thường chứa công thức Độ phức tạp sở liệu lớn làm cho nhiệm vụ phân tích cơng thức thêm khó khăn Nhiệm vụ cần tìm tri thức ẩn lớp liệu Trường hợp hay gọi “giàu liệu nghèo tri thức” (“data rich but knowledge poor”) Về nguyên tắc, khai phá liệu dùng mơ hình luật Chúng ta xây dựng mơ hình khai phá liệu dựa tập số liệu thực nghiệm từ tiên đốn cơng thức Tuy nhiên sử dụng mơ hình tiên đốn gặp khó khăn thay đổi thành phần điều kiện cho trước toán Bài toán khai phá liệu ứng dụng phân tích liệu cơng thức dược phẩm mẻ Việt Nam Bằng kiến thức lĩnh vực khoa học máy tính cơng nghệ thơng tin, giúp cho dược sĩ Việt Nam giảm thiểu sai sót đáng tiếc q trình bào chế dược phẩm Khai phá liệu đề tài rộng, đề tài giới hạn lại tập trung chủ yếu vấn đề phân cụm liệu luật kết hợp ứng dụng phân tích liệu cơng thức dược phẩm để tìm mối liên quan thành phần dược chất khác công thức Cơ sở liệu cho đề tài lấy từ tạp chí khoa học chuyên ngành Y Dược thực nghiệm Đề tài tiến hành so sánh ưu điểm nhược điểm kỹ thuật phân cụm liệu luật kết hợp để tìm giải pháp tối ưu cho việc tìm mối quan hệ phân tích cơng thức liệu dược phẩm ĐỐI TƯỢNG-PHƯƠNG PHÁP NGHIÊN CỨU Đối tượng nghiên cứu Đối tượng nghiên cứu công thức dược phẩm cho liệu động sử dụng công cụ phân cụm liệu luật kết hợp cho dạng liệu công thức dược phẩm khác Phương pháp nghiên cứu Từ sở lý thuyết, tiến hành phân cụm liệu cho dạng liệu công thức dược phẩm khác Cách thức tiến hành sử dụng cơng cụ có sẵn thị trường, đồng thời tự viết chương trình ứng dụng Từ đánh giá, so sánh ưu nhược điểm phương pháp phần mềm khác Sau phân cụm liệu, tiến hành rút luật kết hợp để tìm mối quan hệ nhânquả thành phần dược phẩm Chúng tiến hành so sánh việc rút luật kết hợp trước sau phân cụm liệu để so sánh trình ưu việt Phân cụm liệu Phân cụm liệu kỹ thuật quan trọng khai phá liệu, thuộc lớp phương pháp học khơng giám sát Máy học Có nhiều định nghĩa khác kỹ thuật này, chất ta hiểu phân cụm quy trình tìm cách nhóm đối tượng cho vào cụm (clusters), cho đối tượng cụm tương tự đối tượng khác cụm khơng tương tự Mục đích phân cụm tìm chất bên nhóm liệu Các thuật toán phân cụm sinh cụm Tuy nhiên, khơng có tiêu chí xem tốt để đánh giá hiệu phân tích phân cụm, điều phụ thuộc vào mục đích phân cụm như: giảm liệu (data reduction), “cụm tự nhiên” (“natural clusters”), cụm “có ích” (“useful” clusters), phát phần tử ngoại lai (outlier detection) Độ đo khoảng cách Độ đo khoảng cách thường dùng để xác định khác hay giống hai đối tượng tiến hành phân cụm liệu a Khoảng cách Minkowski Cơng thức tính khoảng cách Minkowski: 𝑞 𝑞 𝑞 d(i, j) = √|𝑥𝑖1 − 𝑥𝑗1 | + |𝑥𝑖2 − 𝑥𝑗2 | + … + |𝑥𝑖𝑝 − 𝑥𝑗𝑝 | 𝑞 (1) với i = (xi1, xi2,…, xip) j = (xj1, xj2,…, xjp): hai đối tượng p-chiều q số nguyên dương b Khoảng cách Manhattan Trong công thức (1), q = 1, d khoảng cách Manhattan: d(i, j) = |𝑥𝑖1 − 𝑥𝑗1 | + |𝑥𝑖2 − 𝑥𝑗2 | + … + |𝑥𝑖𝑝 − 𝑥𝑗𝑝 | (2) c Khoảng cách Euclide Trong công thức (1), q = 2, d khoảng cách Euclide: 2 d(i, j) = √|𝑥𝑖1 − 𝑥𝑗1 | + |𝑥𝑖2 − 𝑥𝑗2 | + … + |𝑥𝑖𝑝 − 𝑥𝑗𝑝 | (3) d Tính chất độ đo khoảng cách Độ đo khoảng cách có tính chất sau: - d(i, j) ≥ - d(i, i) = - d(i, j) = d(j, i) - d(i, j) ≤ d(i, k) + d(k, j) Thuật toán k-means K-means thuật toán quan trọng sử dụng phổ biến kỹ thuật phân cụm liệu Ý tưởng thuật tốn k-means tìm cách phân nhóm đối tượng (objects) cho vào k cụm (k số cụm xác định trước, k số nguyên dương) cho tổng bình phương khoảng cách đối tượng đến tâm nhóm (centroid) nhỏ Thuật tốn k-means áp dụng cho đối tượng biểu diễn điểm không gian vectơ d chiều U = {xi | i = 1, … , N}, với xi ∈ ℜ biểu thị đối tượng (hay điểm liệu) thứ i Thuật tốn k-means gom cụm tồn điểm liệu U thành k cụm C = {C1, C2,…, Ck} cho điểm liệu xi nằm cụm Để biết điểm liệu thuộc cụm người ta gán cho mã cụm Các điểm có mã cụm cụm, điểm khác mã cụm cụm khác Một cụm biểu thị vectơ liên thuộc cụm v có độ dài N, với vi mã cụm xi Giá trị k đầu vào thuật toán Giá trị k dựa tiêu chuẩn tri thức trước Trong thuật toán gom cụm, điểm nhóm theo khái niệm “độ gần” hay “độ tương tự” Với k-means, phép đo mặc định cho “độ tương tự” khoảng cách Euclide Đặc biệt, thấy k-means cố gắng cực tiểu hóa hàm giá trị khơng âm sau: n  Cost   arg j || x i  c j ||22 j1  (4) Thuật tốn k-means thực qua bước sau: Chọn ngẫu nhiên k tâm (centroid) cho k cụm (cluster) Mỗi cụm đại diện tâm cụm Tính khoảng cách đối tượng (objects) đến k tâm (thường dùng khoảng cách Euclide) Nhóm đối tượng vào nhóm gần Xác định lại tâm cho nhóm Thực lại bước khơng có thay đổi nhóm đối tượng Thuật toán k-means phát triển nhiều nhà nghiên cứu khác nhau, điển hình Lloyd (1957), Forgey (1965), Friedman (1967), Rubin (1967), McQueen (1967) KẾT QUẢ-BÀN LUẬN Thống kê Bảng 2: Kết thống kê thông số biến độc lập x biến phụ thuộc y x1 x2 x3 y1 y2 y3 0,2 0,34 0,052 0,352 0,672 0,66 0,46 0,66 0,152 0,683 0,992 0,373692 0,154769 0,471154 0,103769 0,520692 0,843538 Giá trị nhỏ Giá trị lớn Trung bình Độ 0,0177825 0,0193429 0,011648 0,000854024 0,00723929 0,0100212 xác Độ lệch 0,133351 0,139079 0,107926 0,0292237 0,085084 0,100106 chuẩn Kết phân cụm liệu phần mềm Weka Bảng 3: Kết phân cụm liệu phần mềm Weka - Thuộc tính Dữ liệu ban đầu Cụm Cụm Cụm x1 0.3737 0.2 0.393 0.3872 x2 0.1548 0.14 0.1872 x3 0.4712 0.66 0.6065 0.4252 y1 0.1038 0.112 0.15 0.0937 y2 0.5207 0.612 0.634 0.4889 y3 0.8435 0.986 0.929 0.8122 Tổng số thực thể 13 10 Tỉ lệ 100% 8% 15% 77% Nhận xét: Weka phân cụm liệu theo cách thông thường thuật toán kmeans Tuy nhiên, thực tế lĩnh vực dược phẩm tiến hành phân cụm liệu theo biến phụ thuộc y nhằm tách biệt biến phụ thuộc y theo trường hợp riêng để khảo sát mối liên quan nhân-quả biến độc lập x lên biến phụ thuộc y Vì ln xảy mối quan hệ nhân-quả biến độc lập lên biến phụ thuộc y, khơng cần thiết phân tích mối quan hệ nhân-quả biến phụ thuộc y với nên cách phân cụm liệu Weka không phù hợp với toán phân cụm liệu ứng dụng việc phân tích cơng thức liệu dược phẩm Kết phân cụm liệu phần mềm ứng dụng a Phân cụm liệu biến phụ thuộc y1 Bảng 4: Phân cụm liệu biến phụ thuộc y1 Cụm trọng tâm Cụm Cụm Cụm Record x1 x2 x3 y1 y2 y3 0,34 0,66 0,152 0,683 0,992 0,446 0,553 0,148 0,585 0,866 13 0,553 0,446 0,143 0,518 0,792 0,2 0,46 0,34 0,104 0,545 0,902 0,2 0,14 0,66 0,112 0,612 0,986 0,66 0,34 0,122 0,448 0,712 0,2 0,353 0,446 0,098 0,576 0,925 0,506 0,153 0,34 0,074 0,388 0,68 0,35 0,15 0,5 0,084 0,512 0,856 0,35 0,15 0,5 0,087 0,518 0,862 10 0,35 0,15 0,5 0,084 0,507 0,851 11 0,35 0,15 0,5 0,089 0,525 0,87 12 0,353 0,306 0,34 0,052 0,352 0,672 b Phân cụm liệu biến phụ thuộc y2 Bảng 5: Phân cụm liệu biến phụ thuộc y2 Cụm trọng tâm Cụm Cụm Cụm Record x1 x2 x3 y1 y2 y3 0,34 0,66 0,152 0,683 0,992 0,2 0,46 0,34 0,104 0,545 0,902 0,2 0,14 0,66 0,112 0,612 0,986 0,446 0,553 0,148 0,585 0,866 0,2 0,353 0,446 0,098 0,576 0,925 0,66 0,34 0,122 0,448 0,712 0,506 0,153 0,34 0,074 0,388 0,68 0,35 0,15 0,5 0,084 0,512 0,856 0,35 0,15 0,5 0,087 0,518 0,862 10 0,35 0,15 0,5 0,084 0,507 0,851 11 0,35 0,15 0,5 0,089 0,525 0,87 12 0,353 0,306 0,34 0,052 0,352 0,672 13 0,553 0,446 0,143 0,518 0,792 c Phân cụm liệu biến phụ thuộc y3 Bảng 6: Phân cụm liệu biến phụ thuộc y3 Cụm trọng tâm Cụm Cụm Cụm - Record x1 x2 x3 y1 y2 y3 0,34 0,66 0,152 0,683 0,992 0,2 0,46 0,34 0,104 0,545 0,902 0,2 0,14 0,66 0,112 0,612 0,986 0,2 0,353 0,446 0,098 0,576 0,925 0,66 0,34 0,122 0,448 0,712 0,446 0,553 0,148 0,585 0,866 0,35 0,15 0,5 0,084 0,512 0,856 0,35 0,15 0,5 0,087 0,518 0,862 10 0,35 0,15 0,5 0,084 0,507 0,851 12 0,353 0,306 0,34 0,052 0,352 0,672 13 0,553 0,446 0,143 0,518 0,792 0,506 0,153 0,34 0,074 0,388 0,68 11 0,35 0,15 0,5 0,089 0,525 0,87 Nhận xét: Phần mềm ứng dụng tiến hành phân cụm liệu theo biến phụ thuộc y, điều cần thiết phù hợp toán ngành Dược Kết rút luật kết hợp phần mềm Weka Bảng 7: Kết rút luật kết hợp phần mềm Weka Luật Luật kết hợp mạnh Độ tin cậy y3=Medium ==> x2=Low y1=Medium ==> x1=Low x3=Medium ==> x2=Low x3=Medium ==> y3=Medium x3=Medium y3=Medium ==> x2=Low x2=Low x3=Medium ==> y3=Medium x3=Medium ==> x2=Low y3=Medium y2=Medium y3=Medium ==> x2=Low x2=Low y2=Medium ==> y3=Medium 10 y2=Medium ==> x1=Low - Nhận xét: Nhằm kết hợp nhiều kỹ thuật thông minh với nên việc sử dụng Weka để rút luật kết hợp cho kết nhanh chóng việc khảo sát đánh giá liệu ban đầu Weka rút luật kết hợp theo thuật toán Apriori Kết bảng sinh 10 luật kết hợp người dùng ấn định sẵn số luật cần sinh theo yêu cầu Weka Kết rút luật kết hợp phần mềm FormRules (i) Rút luật kết hợp biến phụ thuộc y1 a Mối liên quan nhân-quả biến x1 y1 IF x1 is LOW THEN y1 is HIGH (0.97) IF x1 is HIGH THEN y1 is LOW (1.00) b Mối liên quan nhân-quả biến x2 y1 IF x2 is LOW THEN y1 is HIGH (1.00) IF x2 is MID THEN y1 is LOW (1.00) IF x2 is HIGH THEN y1 is LOW (0.88) c Mối liên quan nhân-quả biến x1, x2 y1 IF x2 is MID AND IF x1 is HIGH THEN y1 is LOW (1.00) IF x2 is HIGH AND IF x1 is HIGH THEN y1 is LOW (0.96) IF x2 is MID AND IF x1 is LOW THEN y1 is LOW (0.86) IF x2 is HIGH AND IF x1 is LOW THEN y1 is HIGH (0.54) IF x2 is LOW AND IF x1 is HIGH THEN y1 is HIGH (0.72) IF x2 is LOW AND IF x1 is LOW THEN y1 is HIGH (1.00) d Mơ hình nhân-quả Hình 11: Mơ hình nhân-quả biến độc lập x1, x2 với biến phụ thuộc y1 e Đồ thị nhân-quả ba chiều Hình 12: Đồ thị nhân-quả ba chiều biến độc lập x1, x2 với biến phụ thuộc y1 - Nhận xét: Biến phụ thuộc y1 không phụ thuộc vào biến độc lập x3 (ii) Rút luật kết hợp biến phụ thuộc y2 a Mối liên quan nhân-quả biến x2 y2 IF x2 is LOW THEN y2 is LOW (0.52) IF x2 is MID THEN y2 is LOW (1.00) IF x2 is HIGH THEN y2 is HIGH (1.00) b Mối liên quan nhân-quả biến x3 y2 IF x3 is LOW THEN y2 is LOW (0.97) IF x3 is HIGH THEN y2 is HIGH (1.00) c Mối liên quan nhân-quả biến x2, x3 y2 IF x3 is LOW AND IF x2 is MID THEN y2 is LOW (1.00) IF x3 is LOW AND IF x2 is LOW THEN y2 is LOW (0.74) IF x3 is LOW AND IF x2 is HIGH THEN y2 is HIGH (0.58) IF x3 is HIGH AND IF x2 is MID THEN y2 is HIGH (0.74) IF x3 is HIGH AND IF x2 is LOW THEN y2 is HIGH (1.00) IF x3 is HIGH AND IF x2 is HIGH THEN y2 is HIGH (1.00) d Mơ hình nhân-quả Hình 13: Mơ hình nhân-quả biến độc lập x2, x3 với biến phụ thuộc y2 e Đồ thị nhân-quả ba chiều Hình 14: Đồ thị nhân-quả ba chiều biến độc lập x2, x3 với biến phụ thuộc y2 - Nhận xét: Biến phụ thuộc y2 không phụ thuộc vào biến độc lập x1 (iii) Rút luật kết hợp biến phụ thuộc y3 a Mối liên quan nhân-quả biến x2 y3 IF x2 is LOW THEN y3 is LOW (0.81) IF x2 is MID THEN y3 is LOW (0.86) IF x2 is HIGH THEN y3 is HIGH (1.00) b Mối liên quan nhân-quả biến x3 y3 IF x3 is LOW THEN y3 is LOW (1.00) IF x3 is HIGH THEN y3 is HIGH (1.00) c Mối liên quan nhân-quả biến x2, x3 y3 IF x3 is LOW AND IF x2 is MID THEN y3 is LOW (0.97) IF x3 is LOW AND IF x2 is LOW THEN y3 is LOW (0.95) IF x3 is LOW AND IF x2 is HIGH THEN y3 is HIGH (0.68) IF x3 is HIGH AND IF x2 is MID THEN y3 is HIGH (1.00) IF x3 is HIGH AND IF x2 is LOW THEN y3 is HIGH (1.00) IF x3 is HIGH AND IF x2 is HIGH THEN y3 is HIGH (1.00) d Mơ hình nhân-quả Hình 15: Mơ hình nhân-quả biến độc lập x2, x3 với biến phụ thuộc y3 e Đồ thị nhân-quả ba chiều Hình 16: Đồ thị nhân-quả ba chiều biến độc lập x2, x3 với biến phụ thuộc y3 - Nhận xét: Biến phụ thuộc y3 không phụ thuộc vào biến độc lập x1 Kết rút luật kết hợp phần mềm ứng dụng với thuật toán Apriori kết hợp với logic mờ a Rút luật kết hợp biến phụ thuộc y1 {x1-Cao} ->{y1-Cao} Conf: 100% {x1-Cao} ->{x3-Cao,y1-Cao} Conf: 100% {x1-Cao,x2-Thap} ->{y1-Cao} Conf: 100% {x1-Cao,x2-Thap} ->{x3-Cao,y1-Cao} Conf: 100% {x1-Cao,x2-Thap,x3-Cao} ->{y1-Cao} Conf: 100% {x1-Cao,x3-Cao} ->{y1-Cao} Conf: 100% {x1-Cao,x3-Cao,x2-Cao} ->{y1-Cao} Conf: 100% {x1-Cao,x2-Cao} ->{x3-Cao,y1-Cao} Conf: 100% {x1-Cao,x2-Cao} ->{y1-Cao} Conf: 100% {x2-Thap} ->{x3-Cao,y1-Cao} Conf: 100% {x2-Thap} ->{x1-Cao,x3-Cao,y1-Cao} Conf: 100% {x2-Thap} ->{y1-Cao} Conf: 100% {x2-Thap} ->{x1-Cao,y1-Cao} Conf: 100% {x2-Thap,x3-Cao} ->{x1-Cao,y1-Cao} Conf: 100% {x2-Thap,x3-Cao} ->{y1-Cao} Conf: 100% {x3-Cao} ->{x1-Cao,y1-Cao} Conf: 100% {x3-Cao} ->{y1-Cao} Conf: 100% {x3-Cao,x2-Cao} ->{x1-Cao,y1-Cao} Conf: 100% {x3-Cao,x2-Cao} ->{y1-Cao} Conf: 100% {x2-Cao} ->{x3-Cao,y1-Cao} Conf: 100% {x2-Cao} ->{x1-Cao,y1-Cao} Conf: 100% {x2-Cao} ->{y1-Cao} Conf: 100% {x2-Cao} ->{x1-Cao,x3-Cao,y1-Cao} Conf: 100% b Rút luật kết hợp biến phụ thuộc y2 {x1-Cao} ->{y2-Cao} Conf: 100% {x1-Cao} ->{x3-Cao,y2-Cao} Conf: 100% {x1-Cao,x2-Thap} ->{y2-Cao} Conf: 100% {x1-Cao,x2-Thap} ->{x3-Cao,y2-Cao} Conf: 100% {x1-Cao,x2-Thap,x3-Cao} ->{y2-Cao} Conf: 100% {x1-Cao,x3-Cao} ->{y2-Cao} Conf: 100% {x1-Cao,x3-Cao,x2-Cao} ->{y2-Cao} Conf: 100% {x1-Cao,x2-Cao} ->{x3-Cao,y2-Cao} Conf: 100% {x1-Cao,x2-Cao} ->{y2-Cao} Conf: 100% {x2-Thap} ->{x3-Cao,y2-Cao} Conf: 100% {x2-Thap} ->{x1-Cao,x3-Cao,y2-Cao} Conf: 100% {x2-Thap} ->{y2-Cao} Conf: 100% {x2-Thap} ->{x1-Cao,y2-Cao} Conf: 100% {x2-Thap,x3-Cao} ->{x1-Cao,y2-Cao} Conf: 100% {x2-Thap,x3-Cao} ->{y2-Cao} Conf: 100% {x3-Cao} ->{x1-Cao,y2-Cao} Conf: 100% {x3-Cao} ->{y2-Cao} Conf: 100% {x3-Cao,x2-Cao} ->{x1-Cao,y2-Cao} Conf: 100% {x3-Cao,x2-Cao} ->{y2-Cao} Conf: 100% {x2-Cao} ->{x3-Cao,y2-Cao} Conf: 100% {x2-Cao} ->{x1-Cao,y2-Cao} Conf: 100% {x2-Cao} ->{y2-Cao} Conf: 100% {x2-Cao} ->{x1-Cao,x3-Cao,y2-Cao} Conf: 100% c Rút luật kết hợp biến phụ thuộc y3 {x1-Cao} ->{y3-Cao} Conf: 100% {x1-Cao} ->{x3-Cao,y3-Cao} Conf: 100% {x1-Cao,x2-Thap} ->{y3-Cao} Conf: 100% {x1-Cao,x2-Thap} ->{x3-Cao,y3-Cao} Conf: 100% {x1-Cao,x2-Thap,x3-Cao} ->{y3-Cao} Conf: 100% {x1-Cao,x3-Cao} ->{y3-Cao} Conf: 100% {x1-Cao,x3-Cao,x2-Cao} ->{y3-Cao} Conf: 100% {x1-Cao,x2-Cao} ->{x3-Cao,y3-Cao} Conf: 100% {x1-Cao,x2-Cao} ->{y3-Cao} Conf: 100% {x2-Thap} ->{x3-Cao,y3-Cao} Conf: 100% {x2-Thap} ->{x1-Cao,x3-Cao,y3-Cao} Conf: 100% {x2-Thap} ->{y3-Cao} Conf: 100% {x2-Thap} ->{x1-Cao,y3-Cao} Conf: 100% {x2-Thap,x3-Cao} ->{x1-Cao,y3-Cao} Conf: 100% {x2-Thap,x3-Cao} ->{y3-Cao} Conf: 100% {x3-Cao} ->{x1-Cao,y3-Cao} Conf: 100% {x3-Cao} ->{y3-Cao} Conf: 100% {x3-Cao,x2-Cao} ->{x1-Cao,y3-Cao} Conf: 100% {x3-Cao,x2-Cao} ->{y3-Cao} Conf: 100% {x2-Cao} ->{x3-Cao,y3-Cao} Conf: 100% {x2-Cao} ->{x1-Cao,y3-Cao} Conf: 100% {x2-Cao} ->{y3-Cao} Conf: 100% {x2-Cao} ->{x1-Cao,x3-Cao,y3-Cao} Conf: 100% - Nhận xét: Khi áp dụng thuật toán Apriori phần mềm ứng dụng (chưa qua phân cụm liệu), ta thấy kết chưa tốt so với yêu cầu thực tế vế trái luật không xuất biến phụ thuộc y, nhiên kết sinh nhiều luật có vế phải chứa biến độc lập x Do kết sinh luật kết hợp phần mềm ứng dụng thuật toán Apriori (chưa qua phân cụm liệu) chưa đạt độ xác phù hợp cao so với nhu cầu thực tế Kết rút luật kết hợp phần mềm ứng dụng kết hợp phân cụm liệu, logic mờ thuật toán định C4.5 Sử dụng kết phân cụm theo biến phụ thuộc Y từ phần mềm ứng dụng, sau tiến hành rút luật kết hợp thuật toán định C4.5 a Rút luật kết hợp biến phụ thuộc y1 x1-Cao-x2-Thap-x3-Cao-y1-Cao-Cum1 x1-Cao-x2-Cao-x3-Cao-y1-Cao-Cum2 b Rút luật kết hợp biến phụ thuộc y2 x1-Cao-x2-Thap-x3-Cao-y2-Cao-Cum1 x1-Cao-x2-Cao-x3-Cao-y2-Cao-Cum2 - Nhận xét: Khi kết hợp kỹ thuật phân cụm liệu, logic mờ sinh luật kết hợp thuật toán định C4.5 số luật rút gọn xuống kết tổ hợp luật trường hợp sinh luật kết hợp Kết vế trái vế phải luật kết hợp sinh hoàn toàn phù hợp với thực tế Nhận xét kết luận Với kết đánh giá phần mềm ứng dụng qua liệu hồi cứu có so sánh với phần mềm chuyên nghiệp FormRules phần mềm mã nguồn mở Weka, nhận thấy rằng: Nhận xét 1: Về thuật toán cài đặt - Dữ liệu cơng thức tương đối ít: thời gian huấn luyện liệu nhanh, cấu trúc liệu nhỏ - Phần mềm phần loại trừ trường hợp học mức dự đoán sai (đây nhược điểm mạng nơron) nhờ vào việc kết hợp kỹ thuật phân cụm liệu với thuật toán sinh luật kết hợp - Trong thuật toán sinh luật kết hợp cài đặt, thuật toán C4.5 kết hợp với thuật toán phân cụm liệu lựa chọn nhóm liệu thử cho kết tốt Thuật toán C4.5 kết hợp với phân cụm liệu giải cho kết tốt cho hầu hết liệu thử nghiệm Phần mềm FormRules bổ sung, hỗ trợ cho liệu phức tạp thuật toán C4.5 kết hợp với phân cụm liệu không giải Tác giả đề xuất sử dụng phần mềm nên thi hành phần mềm với thuật toán C4.5 kết hợp với phân cụm liệu kết hợp thêm kết từ FormRules giúp cho nhà bào chế có nhìn tổng quan biến độc lập mà họ khảo sát Nhận xét 2: Về tính hiệu phần mềm - Với liệu thử cho thấy kết rút luật kết hợp từ phần mềm ứng dụng từ phần mềm chuyên nghiệp FormRules có ý nghĩa hỗ trợ bổ sung cho - Với kết đề tài thực hiện, phần mềm ứng dụng tiếp tục sử dụng cho báo cáo đề tài nghiên cứu khoa học cấp sở Đại học Y Dược Thành phố Hồ Chí Minh cho tốn nghiên cứu có liên quan đến phân cụm liệu, rút luật kết hợp định ứng dụng phân tích cơng thức liệu dược phẩm Đánh giá Đề tài đạt kết so với mục tiêu ban đầu sau: 1) Nghiên cứu sở lý thuyết công thức dược phẩm, phân cụm liệu, luật kết hợp, logic mờ, định, mạng nơron mờ, thuật toán k-means, thuật toán Apriori, thuật toán C4.5 2) Xây dựng chương trình khảo sát quy luật nhân-quả công thức dược phẩm kỹ thuật phân cụm liệu kết hợp với luật kết hợp 3) Lựa chọn áp dụng liệu công thức dược phẩm từ cơng trình nghiên cứu phù hợp để đánh giá tính hiệu chương trình Những tồn cần giải Mặc dù cố gắng hoàn thành vấn đề đặt ra, khả có hạn, luận văn cịn tồn số vấn đề sau: 1) Chương trình ứng dụng giải số tốn mơ hình nhân-quả cơng thức quy trình mức độ trung bình (số biến độc lập nhỏ 10) 2) Chưa thử nghiệm với liệu thiết kế thuốc (Hóa Dược) với số biến độc lập 20 (đây hướng phát triển đề tài) 3) Việc xử lý kỹ thuật chương trình cần tiếp tục hồn thiện Hướng phát triển Với đạt hạn chế mắc phải, hướng phát triển đề tài sau: 1) Ứng dụng thực tế Bộ môn Bào chế, Khoa Dược Đại học Y Dược Thành phố Hồ Chí Minh nhằm tìm thiếu sót cho việc giải tốn thực tế có bổ sung 2) Ứng dụng thêm nguồn liệu từ thực phẩm 3) Kết hợp với dược sĩ để hoàn thiện phần mềm mặt giao diện chức 4) Mở rộng ứng dụng cho đề tài nghiên cứu khoa học Đại học Y Dược Thành phố Hồ Chí Minh so với mục tiêu ban đầu phân tích cơng thức liệu dược phẩm 5) Phần mềm mở rộng, nâng cấp với chức tối ưu hóa cơng thức dược phẩm, tiên đốn cơng thức dược phẩm, tối ưu quy trình chiết xuất dược liệu, tối ưu mơi trường nuôi cấy vi sinh… 6) Xây dựng công cụ hỗ trợ cho nghiên cứu, đặc biệt luận văn sinh viên Đại học Khoa Dược TÀI LIỆU THAM KHẢO [1] Hà Siu (2017), Luận văn cao học “Phân cụm liệu luật kết hợp ứng dụng phân tích cơng thức liệu dược phẩm” [2] Do Quang Duong (2012) “Artificial intelligence techniques for prediction of solubility parameters” Journal of Medicine and Pharmacy - Hue University of Medicine and Pharmacy (Special issue in English), Vol - No (2012), 2732 [3] Do Quang Duong, Huynh Van Hoa (2009) “An application of soft-computing in modelling and optimising pharmaceutical formulation” Proceedings of the Sixth Indochina Conference on Pharmaceutical Sciences in Hue (2009), 42-47 [4] Konstantin V Balakin (2010), “Pharmaceutical Data Mining: Approaches and Applications for Drug Discovery”, Wiley Series on Technologies for the Pharmaceutical Industry ... cứu kỹ thuật khai phá liệu ứng dụng phân tích liệu cơng thức dược phẩm Nội dung chính: Nghiên cứu kỹ thuật phân cụm liệu luật kết hợp cho tốn khai phá liệu ứng dụng phân tích liệu công thức dược. ..BỘ Y TẾ ĐẠI HỌC Y DƯỢC TP HỒ CHÍ MINH BÁO CÁO TỔNG KẾT ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ CẤP TRƯỜNG CÁC KỸ THUẬT KHAI PHÁ DỮ LIỆU ỨNG DỤNG TRONG PHÂN TÍCH DỮ LIỆU CƠNG THỨC DƯỢC PHẨM Mã số: 43/2016/HĐ-NCKH... công thức dược phẩm Xây dựng công cụ tương ứng với kỹ thuật Đánh giá phần mềm với liệu công thức dược phẩm thực nghiệm Phân tích điểm mạnh điểm yếu kỹ thuật khai phá liệu ứng dụng Đưa số đề xuất

Ngày đăng: 20/03/2021, 10:38

Từ khóa liên quan

Mục lục

  • 01.BÌA

  • 02.THÔNG TIN KẾT QUẢ NGHIÊN CỨU

  • 03.MỤC LỤC

  • 04.MỞ ĐẦU

  • 05.ĐỐI TƯỢNG-PHƯƠNG PHÁP NGHIÊN CỨU

  • 06.KẾT QUẢ-BÀN LUẬN

  • 07.KẾT LUẬN

  • 08.TÀI LIỆU THAM KHẢO

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan