Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 34 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
34
Dung lượng
1,42 MB
Nội dung
HỘI NGHỊ KHOA HỌC – KỸ THUẬT LẦN THỨ 34 Đề tài PHÂNCỤMDỮLIỆUỨNGDỤNGTRONGPHÂNTÍCHDỮLIỆUCÔNGTHỨCDƯỢCPHẨM Báo cáo viên Hà Siu NỘI DUNG CHÍNH Giới thiệu đề tài Cơ sở lý thuyết Chương trình minh họa Kết thực nghiệm Kết luận hướng phát triển Giới thiệu đề tài Côngthứcdượcphẩm Thành phần Mới Côngthứcdượcphẩm Kinh nghiệm Liều lượng Tỉ trọng Nhiệm vụ nhà bào chế Mâu thuẫn tiềm tàng Kiểm tra lại Phântích lại Các phương pháp nghiên cứu Phương Mâupháp thuẫn thống kê cổ điển -Tuyến tính - Chậm - Đơn giản - Hiệu tốt (95%) tiềm tàng vs Các kỹ thuật khai phá liệu - Phi tuyến - Nhanh - Phức tạp - Hiệu tốt (98%) Cơ sở lý thuyết Phâncụmliệu • Phâncụmliệu kỹ thuật quan trọng khai phá liệu • Có nhiều định nghĩa khác kỹ thuật • Về chất hiểu phâncụm quy trình tìm cách nhóm đối tượng cho vào cụm (clusters), cho đối tượng thuẫn tiềm tàng cụmMâu tương tự đối tượng khác cụm không tương tự • Mục đích phâncụm tìm chất bên nhóm liệu • Tuy nhiên, tiêu chí xem tốt để đánh giá hiệu phântíchphân cụm, điều phụ thuộc vào mục đích phâncụm như: giảm liệu (data reduction), “cụm tự nhiên” (“natural clusters”), cụm “có ích” (“useful” clusters), phát phần tử ngoại lai (outlier detection) Côngthứcdượcphẩm • Dượcphẩm hay thuốc chất dạng đơn chất hỗn hợp có nguồn gốc rõ ràng, dùng cho người sinh vật để chẩn đoán, phòng chữa bệnh, hạn chế thay đổi điều kiện bệnh lý hay sinh lý Mâu thuẫn tiềm tàng • Thiết lập côngthứcdượcphẩm thiết lập dạng côngthức có liều lượng khác Thiết lập côngthứcdượcphẩm định nghĩa tập hợp hoạt động với mục tiêu tạo thuốc có thông số kỹ thuật định đảm bảo việc trì đặc điểm hiệu an toàn thuốc Mục tiêu thiết lập côngthứcdượcphẩm làm cho thuốc vận chuyển dễ dàng thể tương thích với bệnh nhân Hiện mục tiêu quan tâm thiết lập côngthứcdượcphẩm sinh khả dụng thuốc Thuật toán k-means • K-means thuật toán quan trọng sử dụng phổ biến kỹ thuật phâncụmliệu • Ý tưởng thuật toán k-means tìm cách phân nhóm đối tượng Mâu thuẫn(objects) tiềm tàngđã cho vào k cụm (k số cụm xác định trước, k số nguyên dương) cho tổng bình phương khoảng cách đối tượng đến tâm nhóm (centroid) nhỏ • Thuật toán k-means áp dụng cho đối tượng biểu diễn điểm không gian vectơ d chiều U = {xi | i = 1, … , N}, với xi ∈ ℜ biểu thị đối tượng (hay điểm liệu) thứ i 10 Dữliệu cụ thể Bảng 2: Dữliệuthực nghiệm viên nén matrix x1 x2 x3 y1 y2 y3 0,34 0,66 0,152 0,683 0,992 0,2 0,46 0,34 0,104 0,545 0,902 0,2 0,14 0,66 0,112 0,612 0,986 0,66 0,34 0,122 0,448 0,712 0,446 0,553 0,148 0,585 0,866 0,506 0,153 0,34 0,074 0,388 0,68 0,2 0,353 0,446 0,098 0,576 0,925 0,35 0,15 0,5 0,084 0,512 0,856 0,35 0,15 0,5 0,087 0,518 0,862 10 0,35 0,15 0,5 0,084 0,507 0,851 11 0,35 0,15 0,5 0,089 0,525 0,87 12 0,353 0,306 0,34 0,052 0,352 0,672 13 0,553 0,446 0,143 0,518 0,792 20 Giao diện chương trình – Module 1: Dữliệu Hình 3: Giao diện module – Dữliệu 21 Giao diện chương trình – Module 2: Phâncụmliệu Hình 4: Giao diện module – Phâncụmliệu với thuật toán k-means 22 Kết thực nghiệm 23 Thống kê x1 x2 x3 y1 y2 y3 0,2 0,34 0,052 0,352 0,672 0,66 0,46 0,66 0,152 0,683 0,992 0,373692 0,154769 0,471154 0,103769 0,520692 0,843538 0,0177825 0,0193429 0,011648 0,133351 0,139079 0,107926 Giá trị nhỏ Giá trị lớn Trung bình Độ 0,000854024 0,00723929 0,0100212 xác Độ lệch chuẩn 0,0292237 0,085084 24 0,100106 Phâncụmliệu Weka Thuộc tính Dữliệu ban đầu CụmCụmCụm x1 0.3737 0.2 0.393 0.3872 x2 0.1548 0.14 0.1872 x3 0.4712 0.66 0.6065 0.4252 y1 0.1038 0.112 0.15 0.0937 y2 0.5207 0.612 0.634 0.4889 y3 0.8435 0.986 0.929 0.8122 Tổng số thực thể 13 10 Tỉ lệ 100% 8% 15% 77% 25 Nhận xét phâncụmliệu Weka • Thực tế không cần thiết phântích mối quan hệ nhân-quả biến phụ thuộc yi với • Không phù hợp 26 Phâncụmliệu biến phụ thuộc y1 phần mềm Cụmtrọng tâm CụmCụmCụm Record x1 x2 x3 y1 y2 y3 0,34 0,66 0,152 0,683 0,992 0,446 0,553 0,148 0,585 0,866 13 0,553 0,446 0,143 0,518 0,792 0,2 0,46 0,34 0,104 0,545 0,902 0,2 0,14 0,66 0,112 0,612 0,986 0,66 0,34 0,122 0,448 0,712 0,2 0,353 0,446 0,098 0,576 0,925 0,506 0,153 0,34 0,074 0,388 0,68 0,35 0,15 0,5 0,084 0,512 0,856 0,35 0,15 0,5 0,087 0,518 0,862 10 0,35 0,15 0,5 0,084 0,507 0,851 11 0,35 0,15 0,5 0,089 0,525 0,87 12 0,353 0,306 0,34 0,052 0,352 0,672 27 Phâncụmliệu biến phụ thuộc y2 phần mềm Cụmtrọng tâm CụmCụmCụm Record x1 x2 x3 y1 y2 y3 0,34 0,66 0,152 0,683 0,992 0,2 0,46 0,34 0,104 0,545 0,902 0,2 0,14 0,66 0,112 0,612 0,986 0,446 0,553 0,148 0,585 0,866 0,2 0,353 0,446 0,098 0,576 0,925 0,66 0,34 0,122 0,448 0,712 0,506 0,153 0,34 0,074 0,388 0,68 0,35 0,15 0,5 0,084 0,512 0,856 0,35 0,15 0,5 0,087 0,518 0,862 10 0,35 0,15 0,5 0,084 0,507 0,851 11 0,35 0,15 0,5 0,089 0,525 0,87 12 0,353 0,306 0,34 0,052 0,352 0,672 13 0,553 0,446 0,143 0,518 0,792 28 Phâncụmliệu biến phụ thuộc y3 phần mềm Cụmtrọng tâm CụmCụmCụm Record x1 x2 x3 y1 y2 y3 0,34 0,66 0,152 0,683 0,992 0,2 0,46 0,34 0,104 0,545 0,902 0,2 0,14 0,66 0,112 0,612 0,986 0,2 0,353 0,446 0,098 0,576 0,925 0,66 0,34 0,122 0,448 0,712 0,446 0,553 0,148 0,585 0,866 0,35 0,15 0,5 0,084 0,512 0,856 0,35 0,15 0,5 0,087 0,518 0,862 10 0,35 0,15 0,5 0,084 0,507 0,851 12 0,353 0,306 0,34 0,052 0,352 0,672 13 0,553 0,446 0,143 0,518 0,792 0,506 0,153 0,34 0,074 0,388 0,68 11 0,35 0,15 0,5 0,089 0,525 0,87 29 Phâncụmliệuphần mềm • Phần mềm ứngdụng tiến hành phâncụmliệu theo biến phụ thuộc y, điều cần thiết phù hợp toán ngành Dược 30 Kết luận hướng phát triển 31 Nhận xét • • Loại trừ trường hợp học mức dự đoán sai Phù hợp với yêu cầu ngành Dược 32 Hướng phát triển đề tài • • • Ứngdụngthực tế Bộ môn Bào chế Ứngdụng thêm nguồn liệu từ thựcphẩm Mở rộng đề tài nhiều kỹ thuật khai phá liệu khác rút luật kết hợp định (đây đề tài mà tác giả đăng ký nghiên cứu báo cáo Hội nghị Khoa học – Kỹ thuật lần thứ 35, năm 2018) 33 XIN CHÂN THÀNH CẢM ƠN 34 ... liệu U thành k cụm C = {C1, C2,…, Ck} cho điểm liệu xi nằm cụm Để biết điểm liệu thuộc cụm người ta gán cho mã cụm Các điểm có mã cụm cụm, tiềmcụm tàngthì cụm khác Mâu điểmthuẫn khác mã Một cụm. .. Nhận xét phân cụm liệu Weka • Thực tế không cần thiết phân tích mối quan hệ nhân-quả biến phụ thuộc yi với • Không phù hợp 26 Phân cụm liệu biến phụ thuộc y1 phần mềm Cụm trọng tâm Cụm Cụm Cụm Record... • C# 2013 • module chính: • Dữ liệu • Phân cụm liệu với thuật toán k-means 17 Bộ liệu • • • • • Công thức viên nén matrix Công trình Bodea Leucuta, năm 1997 13 công thức thực nghiệm biến độc lập