Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 74 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
74
Dung lượng
1,72 MB
Nội dung
ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG PHẠM THANH TUẤN NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP TÌM CÁC LUẬT KẾT HỢP PHÂN LỚP TRÊN TẬP MẪU HỌC VÀ ỨNG DỤNG TRONG CHẨN ĐOÁN BỆNH LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Thái Nguyên, 2019 Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN http://lrc.tnu.edu.vn ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG PHẠM THANH TUẤN NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP TÌM CÁC LUẬT KẾT HỢP PHÂN LỚP TRÊN TẬP MẪU HỌC VÀ ỨNG DỤNG TRONG CHẨN ĐOÁN BỆNH Chuyên ngành: Khoa học máy tính Mã số: 48 01 01 Người hướng dẫn khoa học: TS Lê Văn Phùng Thái Nguyên, 2019 Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN http://lrc.tnu.edu.vn i LỜI CAM ĐOAN Tơi xin cam đoan cơng trình nghiên cứu thực hiện, hướng dẫn khoa học TS Lê Văn Phùng Các số liệu kết trình bày luận văn trung thực, chưa công bố tác giả hay cơng trình khác Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN http://lrc.tnu.edu.vn ii LỜI CẢM ƠN Trong trình thực đề tài “Nghiên cứu số phương pháp tìm luật kết hợp phân lớp tập mẫu học ứng dụng chẩn đốn bệnh”, tơi nhận nhiều giúp đỡ, tạo điều kiện tập thể Ban Giám hiệu, Phòng Đào tạo, khoa Cơng nghệ thơng tin phịng chức trường Đại học Công nghệ thông tin truyền thông, Đại học Thái Ngun Tơi xin bày tỏ lịng cảm ơn chân thành giúp đỡ quý báu Tơi xin bày tỏ lịng biết ơn sâu sắc đến TS Lê Văn Phùng thầy giáo trực tiếp hướng dẫn, bảo giúp tơi hồn thành luận văn TÁC GIẢ LUẬN VĂN Phạm Thanh Tuấn Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN http://lrc.tnu.edu.vn iii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii DANH MỤC CÁC KÝ HIỆU, CÁC TỪ VIẾT TẮT v DANH MỤC BẢNG BIỂU vi DANH MỤC HÌNH VẼ vii MỞ ĐẦU viii CHƯƠNG PHÂN LỚP VÀ PHƯƠNG PHÁP XÂY DỰNG CÂY PHÂN LỚP THEO TẬP MẪU HỌC 1.1 Tổng quan kỹ thuật khai phá liệu 1.1.1 Khái niệm khai phá liệu 1.1.2 Một số phương pháp khai phá liệu đại thông dụng 1.1.3 Các ứng dụng khai phá liệu 1.2 Những vấn đề chung phân lớp phương pháp phân lớp 1.2.1 Khái niệm phân lớp liệu 1.2.2 Các bước tiến hành phân lớp liệu 1.2.3 Phân lớp theo định 1.2.4 Phân lớp kiểu Bayes 12 1.2.5 Phân lớp dựa quy tắc IF-THEN 13 1.2.6 Phân lớp dựa luật kết hợp 16 1.2.7 Phân lớp dựa vào K-lân cận gần 18 1.2.8 Phân lớp dựa vào giải thuật di truyền 19 1.2.9 Phân lớp theo cách tiếp cận tập thô 20 1.2.10 Phân lớp theo cách tiếp cận tập mờ 21 1.3 Khái niệm tập mẫu học phương pháp xây dựng phân lớp 24 1.3.1 Định nghĩa tập mẫu học 24 1.3.2 Xây dựng phân lớp dựa theo Khóa 24 Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN http://lrc.tnu.edu.vn iv 1.3.3 Xây dựng phân lớp nhờ luật kết hợp phân lớp (Class Association Rules) bảng mẫu học 27 CHƯƠNG MỘT SỐ PHƯƠNG PHÁP TÌM CÁC LUẬT KẾT HỢP PHÂN LỚP TRÊN TẬP MẪU HỌC 29 2.1 Phương pháp phân lớp dựa luật kết hợp 29 2.1.1 Các bước tiến hành phân lớp dựa luật kết hợp 29 2.1.2 Tạo luật kết hợp định 29 2.2 Một số thuật toán cổ điển xây dựng phân lớp dựa luật kết hợp 29 2.2.1 Thuật toán CBA-RG 30 2.2.2 Thuật toán CBA-CB 32 2.3 Thuật toán đại 34 2.3.1 Thuật toán CBA cải tiến 34 2.3.2 Ví dụ áp dụng thuật tốn cải tiến 37 CHƯƠNG CHƯƠNG TRÌNH THỬ NGHIỆM TÌM CÁC LUẬT KẾT HỢP PHÂN LỚP DỰA TRÊN TẬP MẪU HỌC 42 3.1 Bài toán thử nghiệm 42 3.1.1 Bài toán tập mẫu học đầu vào 42 3.1.2 Chọn thuật toán thử nghiệm 46 3.2 Môi trường thử nghiệm 47 3.2.1 Chọn môi trường chứa liệu đầu vào 47 3.2.2 Chọn ngơn ngữ lập trình 47 3.3 Nội dung kết thử nghiệm 47 3.3.1 Mơ hình thuật tốn thử nghiệm 47 3.3.3 Một số giao diện chương trình thử nghiệm 50 3.4 Đánh giá chương trình thử nghiệm 51 3.5 Mở rộng toán 51 KẾT LUẬN 60 TÀI LIỆU THAM KHẢO 62 Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN http://lrc.tnu.edu.vn v DANH MỤC CÁC KÝ HIỆU, CÁC TỪ VIẾT TẮT DM – Data Mining CSDL – Cơ sở liệu CBA - Classification-Based Associon CMAR - Classification based on Multiple Asociation Rule Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN http://lrc.tnu.edu.vn vi DANH MỤC BẢNG BIỂU Bảng 1.1 Ví dụ tập mẫu học…………………………………….… 15 Bảng 1.2 Các huấn luyện phân lớp CSDL……….… 20 Bảng 1.3 Ví dụ tập mẫu học phân lớp dựa theo khóa………… …33 Bảng 2.1 Ví dụ tập mẫu học để tìm luật kết hợp phân lớp theo thuật tốn cải tiến…………………………………………………… ………… 47 Bảng 2.2 Bảng tổng hợp……………………………………… ……… 49 Bảng 2.3a Khoản mục………………………………………… …….… 50 Bảng 2.3b Các luật kết hợp phân lớp phổ biến – Khoản mục…… ….…50 Bảng 2.3c Các luật kết hợp phân lwps – Khoản mục……… ……….…50 Bảng 3.1 Tập mẫu học……………………………………………………55 Bảng 3.2 Bảng mẫu học số hóa…………………………………….56 Bảng 3.3 Bảng tổng hợp kết thu được………………………… … 59 Bảng 3.4 Bảng mấu học (mở rộng) đầu vào…………………………… 60 Bảng 3.5 Bảng mẫu học mở rộng số hóa……………………… 64 Số hóa Trung tâm Học liệu Cơng nghệ thơng tin – ĐHTN http://lrc.tnu.edu.vn vii DANH MỤC HÌNH VẼ Hình 1.1 Cây định cho việc chơi Gold………….……………… ….16 Hình 1.2 Một tập thơ xấp xỉ tập C dùng tập xấp xỉ dước C Các vùng hình chũ nhật biểu diễn lớp tương đương……………………………………………………… ………………27 Hình 1.3 Các giá trị mờ thật với thu nhập, biểu diễn mức thành viên giá trị thu nhập theo loại {thấp, trung bình, cao}…………… …28 Hình 1.4 Cây phân lớp xây dựng với trường hợp…………………………34 Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN http://lrc.tnu.edu.vn viii MỞ ĐẦU Lý chọn đề tài Thế kỷ XXI xem kỷ nguyên công nghệ thông tin Cùng với việc ứng dụng công nghệ thông tin hầu hết lĩnh vực nhiều năm qua dẫn đến lượng liệu, thông tin nhân loại lưu trữ ngày tăng Nguồn liệu khổng lồ tích lũy với tốc độ bùng nổ từ nhiều lĩnh vực: khoa học, kinh doanh, giao dịch, thương mại, chứng khoán,… Vậy khai thác từ “núi” liệu tưởng chừng bỏ Cùng với việc tăng không ngừng khối lượng liệu, hệ thống thơng tin chun mơn hóa, phân hạch hóa theo lĩnh vực sản xuất, tài chính, bn bán thị trường v.v, nhiên hệ quản trị sở liêu truyền thống khai thác lượng thơng tin nhỏ khơng cịn đáp ứng đủ yêu câu, thách thức Do khuynh hướng đời kỹ thuật phát tri thức sở liệu Khai phá liệu (Data Mining – DM) đời phần giải hữu hiệu yêu cầu, thách thức Một lĩnh vực nghiên cứu phương pháp ứng dụng khai phá liệu, tìm kiếm tri thức, kết xuất tri thức… từ liệu tìm kiếm Luật kết hợp phân lớp (Class Association Rules) nghiên cứu từ nhiều năm trước có kết khả quan mang lại hướng ứng dụng có hiệu cao Ngày nay, kỹ thuật khai phá liệu dựa việc tìm kiếm luật kết hợp phân lớp áp dụng mang lại hiệu cho nhiều ngành, nhiều lĩnh vực như: Kinh tế, tài chính, khoa học - kỹ thuật, ngân hàng, thương mại, giáo dục, y tế… kỹ thuật khai phá dự liệu Luật kết hợp phân lớp đa dạng phong phú kỹ thuật dựa thuật toán CBA-RG, CBA-CB,… Với mong muốn nắm vững trình phát tri thức từ liệu Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN http://lrc.tnu.edu.vn 48 Mz,l sau: - Tính độ hỗ trợ Mzl: + Ký hiệu số phần tử chứa Mz,l s+ tiến hành; + s+ = 1; + Nếu Ez,l ⊆ Ei,j thỏa mãn: (z=i) ∨ (z=j) ∨ (l=j) ∨ (l=i) tăng số đếm s+ lên đơn vị (s+ = s+ + 1); + Tính số phần tử theo công thức: Count(Mz,l) = (1 + √1 + 8s + )/2 + Tính độ hỗ trợ cho Mz,l: supt = count(Mz,l)/m - Tính độ chắn cho Mz,l sau: + Ký hiệu số phần tử chứa Xi,j s- tiến hành: s- = 1; + Nếu Xz,l ⊆ Ei,j thỏa mãn: (z=i) ∨ (z=j) ∨ (l=j) ∨ (l=i) tăng số đếm slên đơn vị (s- = s- + 1); + Tính số phần tử chứa Xz,l theo công thức: Count(Xz,l) = (1 + √1 + 8s − )/2 + Tính độ chắn cho Mz,l: confd (Mz,l) = s+/s- Nếu supt(Mz,l) ≥ Minsup confd (Mz,l) ≥ Minconfd SCAR = SCAR ∪ Mz,l - Tỉa luật: Mz,l ⊆ Mi,j với Mz,l, Mi,j ∈ SCAR loại Mz,l khỏi tập SCAR 3.3.2 Xác định luật kết hợp thu Sau thực phép tính tốn theo thuật toán cải tiến trên, ta thu bảng tổng hợp sau: Bảng 3.3.Bảng tổng hợp Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN http://lrc.tnu.edu.vn 49 s+ count supt (Thannhiet,sotnhe),Y 33% (Thannhiet,sotcao),Y 33% (Ơnlanh,ret),Y 33% (Ơnlanh,ret),N 33% (đau đầu,dau dội),Y 33% 33% Mục luật (Thannhiet,sotnhe),(Ơn lanh,ret),N s- count confd 50% 100% (Ơnlanh,ret) 50% (Ơnlanh,ret) 50% 100% 3 67% Condset (Thannhiet, sotnhe) (Thannhiet, sotcao) (Đau đầu, đaududoi) (Thannhiet,sotn he),(Ơnlanh,ret) Như Minsup = 30% Minconfd = 60% ta thấy có mục luật sau vừa phổ biến xác: (Thannhiet, sotnhe) → khơng bị cúm (Ơnlanh, ret) → không bị cúm (Thannhiet, sotcao) → bị cúm (đauđau, đaududoi) → bị cúm Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN http://lrc.tnu.edu.vn 50 3.3.3 Một số giao diện chương trình thử nghiệm Hình 3.1 Giao diện chương trình thử nghiệm Hình 3.2 Giao diện chương trình thử nghiệm Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN http://lrc.tnu.edu.vn 51 3.4 Đánh giá chương trình thử nghiệm Chương trình thử nghiệm với tập mẫu học đưa vào file Excel: Tuan1.xlsx với liệu thu thập từ bệnh nhân bệnh viện đa khoa TW Thái Nguyên cho kết tốt, với kết luận bác sĩ bệnh viện đa khoa TW Thái Nguyên 3.5 Mở rộng toán Mẫu học mở rộng với 50 bệnh nhân 13 thuộc tính đặc trưng thuộc tính phân lớp (cúm) [2] Bảng 3.4 Bảng mẫu học (mở rộng) đầu vào table1 Be nh Dau Da Than Onl Chon Met nh dau uco nhiet anh gmat moi Ho Dau Chaynu Nghe No Tieu Cu hong ocmui tmui n chay m an B0 Khô B0 B0 ng Có Có Cao Có Kh ơng Có Có B0 Khơ Kh B0 ng ơng Có Kh ơng Bình thườn Có g Rất Khơ cao ng Cao Có Bình thườn g Khơ ng Khơn g Khơn g Có Khơn g Có Có Có Có Có Kh Khơng Có Khơng Có Có Có Khơng Có ơng Kh ơng Khơ Kh ng ơng Có Khơng Có Khơng Số hóa Trung tâm Học liệu Cơng nghệ thông tin – ĐHTN Khôn Kh Khôn g ông g Có Khơn Kh Khơn Kh g ơng Kh Khơn Có ông Khôn g Có g Có g ông Có Khôn Kh g ông Kh Khôn Kh ông g ông http://lrc.tnu.edu.vn 52 table1 Be nh Dau Da Than Onl Chon Met nh dau uco nhiet anh gmat moi Ho Dau Chaynu Nghe No Tieu Cu hong ocmui tmui n chay m an B0 Khô ng B0 Khô B0 ng Có B0 Khơ B1 B1 ng Có Cao B1 B1 ng Có Cao Có Kh ơng Cao Có Có Cao Có Có Cao Có Có Cao B1 Khơ Kh Khơ ng ơng Bình thườn g Bình Có Có thườn g Có Có Cao Có Khơn g Khơn g Khơ Khơn ng Khơ ng Khơ ng Có ơng ng Có Có Có g Có Có Có Có Có Có Có Có Có Có Có Có Có g Có g ng Kh Khơ ơng ng Có Có g Có Có Có Có Kh Khơn ơng g ơng g Kh Khơn ơng Có g Khơn g Có Có Có Có Khơn Kh Khơn Kh g Có Có Khơng Có Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN g Khôn Kh Khơn Khơng g ơng Khơn Có Có Có g Khơ Khơn Khơ ng Kh Khơ Kh Khơn Có Khơng Khơ Khơn ng Có Có Có Có Có Có Khơ Khơn ng Có Có Có ơng g ơng Kh Khơn Kh ông Có g Khôn g ông Có http://lrc.tnu.edu.vn 53 table1 Be nh Dau Da Than Onl Chon Met nh dau uco nhiet anh gmat moi Ho Dau Chaynu Nghe No Tieu Cu hong ocmui tmui n chay m an B1 Khô B1 B1 B1 B1 B2 B2 ng Có Cao Có Có Có Có Kh ơng Rất cao Bình thườn g B2 ng Có Có Cao Có Có Có Cao Có Có Kh ơng Bình thườn g ng ơng cao Có Kh ông Cao g Có Khô Khôn Có Có Cao Có B2 Khơ Kh Rất Có Khơn g Khơn g Khơn g Khơn g Khơ Khơn ng g Có Có Có Có Có Có Có Có Có Khơng Có Có g ơng Kh ơng Có Khơng Có Có Có Có Có Có Có Kh Khơ ơng ng Kh ơng Có Có Có Có Khơ Khơn Khơ ng Kh ng Có Có Khơng Khơng Khơng Có Khơng Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN Khơn g Khơn g Khơn g Có Có Có Có Có Khơn Kh g ơng Có Có Khơn g Có Khơn Kh g ơng Có Có Khơn g Có Khơn Kh Khơn Kh g Có ơng g Kh Khơn Kh ông g Khôn Kh Khôn g ông ông g ông Có Khơn Kh Khơn Kh g ơng g ơng http://lrc.tnu.edu.vn 54 table1 Be nh Dau Da Than Onl Chon Met nh dau uco nhiet anh gmat moi Ho Dau Chaynu Nghe No Tieu Cu hong ocmui tmui n chay m an B2 Khô Kh B2 B2 ng ông Có Có Cao Có B2 Khô B2 B2 B3 Cao Có ng Có Có Kh ơng Có Kh ơng Kh ơng Cao Rất cao Bình thườn g Bình thườn g Có Có Cao Khơ ng ng ơng cao B3 Khơ ng Có Rất cao g Có Khơ Khơn ng Có Khơ ng g Khơn g Có Khơ Khơn ng g Có Có Có Khơng Có Có Có Khơng Có Có Có Có ng ng Có g Có Khơn g Khơ ng Khơ ng Có Có Có Có Kh Khơ ơng ng Khơ Khơn Khơ Kh B3 Khô Kh Rất Khô Khôn ng ông Có Có Có Kh Khơ ơng ng Kh Khơ ơng ng Có g Có Khơng Có Có Có Khơng Khơng Khơng Số hóa Trung tâm Học liệu Cơng nghệ thông tin – ĐHTN Khôn g Khôn Kh Khôn Khơng Có Có ơng g Kh Khơn ơng Có Kh ông g Khôn g Có Có Có Có Có Có Khôn Kh Khôn Kh g ông Khôn g Khôn g Khơn g g Có Có Có Có Có ơng Kh ông Kh ông Khôn Kh g ông http://lrc.tnu.edu.vn 55 table1 Be nh Dau Da Than Onl Chon Met nh dau uco nhiet anh gmat moi Ho Dau Chaynu Nghe No Tieu Cu hong ocmui tmui n chay m an B3 Khô Kh B3 B3 B3 ng ông Có ông Có Cao Có Có Có Có Có Có Có Có Có thườn Có Có Có ng Có Rất cao Rất cao B3 B4 ng ông cao Có Có Cao Có B4 Khơ ng Kh ông Có Cao Rất cao Có Có Có Khôn g Có Khơn g Khơ ng Có g Có Khơn g Khơng Khơn Kh Khơn Kh g Có Có Khơng Có Có Có Có Khơng Có Có Khơ Khơn Khơ ng Có Có g B3 Khơ Kh Rất ng ơng Bình B3 Khơ Kh Khơ Kh Cao Có ng Kh ông Kh Khô ông ng Kh Khô ông ng Có Có Có Có Có Có Kh ơng Có B4 Có Có Cao Khơ Khơn Có Có Khơ Khơng Khơng Có Khơng Khơng Có Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN ông g Kh Khơn ơng Có g Khơn g Khơn Kh Khơn g ơng Khơn g Khơn g g Có Có Có Có Khơn Kh Khơn g ơng Khơn Kh g ơng Có Có g Có Khơn g ơng Có Có Có Kh ơng Kh ơng Có Kh ơng Có Có Kh Khơn Có http://lrc.tnu.edu.vn 56 table1 Be nh Dau Da Than Onl Chon Met nh dau uco nhiet anh gmat moi Ho Dau Chaynu Nghe No Tieu Cu hong ocmui tmui n chay m an B4 B4 ng Có Có Cao Có Có Kh ơng Bình thườn g B4 Khô Kh Rất ng ông cao B4 Khô Kh B4 B4 B4 ng ông thườn g Có Có Cao Có Có Có Rất cao Kh Rất ơng cao B5 Khơ Kh Bình ng ông g Khôn g Khô Khôn ng g Có Có Khơ Khơn ng g ng Có Có Có ng g ng Có Có Có Cao Có Khơn g ơng Kh ông Không Có Không Kh Khô ông ng Có Có Kh ơng Có Có Khơn Khơ Kh g Có Có Có Có Khơ Khơn Khơ Có Kh ng ơng ơng Có Khơ ng Có Khơng Khơng Có Kh Khơn Có ông Khôn g Khôn g Có Kh ông Khôn Kh g ơng g Khơn Kh Khơn Khơng Có Có Khơng Có g Khơn g Kh Khơn ơng Khơn g Có ông Kh Khôn Kh Có ông Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN g Có Có g Khơng g g Có Có ơng Có Có Có Kh ơng http://lrc.tnu.edu.vn 57 Sau mã hóa, có: Bảng 3.5 Bảng mẫu học mở rộng số hóa table1 Benh Dau Da Than Onl Chon Met H Dau Chaynu Nghe nhan dau uco nhiet anh gmat moi o hong ocmui tmui N o n Tieu chay C u m B01 1 1 1 0 0 B02 0 1 0 0 B03 1 1 1 1 0 B04 0 1 1 0 0 B05 0 0 1 0 B06 1 1 1 1 0 B07 1 1 1 1 B08 1 1 1 0 B09 1 0 1 0 0 B10 1 0 1 1 0 B11 1 1 1 1 1 B12 0 0 1 1 0 0 B13 1 0 0 1 0 B14 1 0 1 1 B15 1 1 1 1 1 B16 1 1 1 1 0 1 B17 0 0 1 0 0 B18 1 1 1 0 1 Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN http://lrc.tnu.edu.vn 58 table1 Benh Dau Da Than Onl Chon Met H Dau Chaynu Nghe nhan dau uco nhiet anh gmat moi o hong ocmui tmui N o n Tieu chay C u m B19 1 1 1 1 1 B20 1 1 0 0 0 B21 0 0 1 0 B22 0 1 1 1 0 B23 1 0 1 0 0 B24 0 1 1 1 1 B25 1 1 1 0 0 B26 1 0 1 0 0 B27 1 1 0 1 B28 0 1 1 1 1 B29 0 0 0 0 0 B30 1 0 0 0 1 B31 0 1 0 0 1 B32 1 1 0 0 0 B33 0 1 0 0 0 B34 1 1 1 1 0 B35 1 1 1 1 B36 1 1 1 0 0 B37 1 1 0 0 1 B38 0 1 0 0 1 Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN http://lrc.tnu.edu.vn 59 table1 Benh Dau Da Than Onl Chon Met H Dau Chaynu Nghe nhan dau uco nhiet anh gmat moi o hong ocmui tmui N o n C Tieu chay u m B39 1 0 1 0 B40 1 1 1 0 B41 1 1 1 1 B42 1 0 1 1 0 B43 1 1 1 0 B44 0 0 1 0 1 B45 0 1 1 0 0 0 B46 0 0 1 1 0 B47 1 0 1 0 B48 1 1 1 1 1 B49 1 1 0 0 B50 0 1 0 0 1 Bảng mẫu học mở rộng lưu EXCEL: Tuan2.xlsx (dạng chữ số) Từ kết phần mềm cho thấy thuật toán cải tiến dựa luật kết hợp phân lớp trình bày [5] đưa kết giảm nửa số phép tính q trình tính tốn Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN http://lrc.tnu.edu.vn 60 KẾT LUẬN Kết đạt Luận văn “ Nghiên cứu số phương pháp tìm luật kết hợp phân lớp tập mẫu học áp dụng vào chẩn đoán bệnh” đạt kết sau: Chương giới thiệu tổng quan “ Khai phá liệu” số vấn đề như: khái niệm, phương pháp khai phá liệu, ứng dụng khai phá liệu Khái niệm phân lớp liệu, bước tiến hành phân lớp, kiểu phương pháp phân lớp liệu Chương giới thiệu số phương pháp tìm luật kết hợp phân lớp dựa tập mẫu học, phương pháp phân lớp, bước tiến hành phân lớp dựa luật kết hợp Chương giới thiệu thuật toán xây dựng phân lớp dựa luật kết hợp, thuật toán cổ điển CBA-RG, CBA-CB thuật toán cải tiến giúp giảm nửa số phép tính thực tốn Chương mơ tả toán áp dụng thuật toán cải tiến vào chuẩn đoán bệnh cúm bệnh viện đa khoa TW Thái Ngun, quy trình chuẩn đốn xác định bệnh, thơng tin tình trạng bệnh nhận thu thập lưu vào file Excel làm liệu đầu vào toán Cuối chương phần giới thiệu kết xây dựng phần mềm chuẩn đoán bệnh cúm kết thu sau nhập liệu Vì khai phá liệu dựa luật kết hợp nói riêng khai phá liệu nói chung vấn đề rộng lớn, nên hẳn nghiên cứu nhỏ e nhiếu thiếu sót, phần thực nhiệm cịn dạng thử nghiệm thuật tốn cần cải thiện thêm trở thành sản phẩm thực tiễn Em mong nhận góp ý thầy bạn để đề tài ngày hoàn thiện Em xin chân thành cảm ơn! Hướng nghiên cứu Số hóa Trung tâm Học liệu Cơng nghệ thơng tin – ĐHTN http://lrc.tnu.edu.vn 61 Tiếp tục hồn thiện phần mềm để trở thành phần mềm thực tiễn Nghiên cứu áp dụng thuật toán, xây dựng phần mềm chuẩn đốn bệnh khác Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN http://lrc.tnu.edu.vn 62 TÀI LIỆU THAM KHẢO A-Tiếng Việt [1] Nguyễn Khắc Giáo (2013), Khai thác luật kết hợp từ sở liệu giao dịch siêu thị bán lẻ, Luận văn Thạc sĩ Công nghệ thông tin, Đại học Công nghệ, Đại học Quốc gia Hà Nội [2].Nguyễn Đăng Nguyên (2017), Phương pháp xây dựng định dựa tập phụ thuộc hàm xấp xỉ, Luận văn Thạc sĩ Khoa học máy tính, Đại học Cơng nghệ thông tin truyền thông – Đại học Thái Nguyên [3] Lê Văn Phùng (2018), Cơ sở liệu quan hệ cơng nghệ phân tích –thiết kế , Tái lần 1, Nhà xuất Thông tin truyền thông [4] Lê Văn Phùng - Quách Xuân Trưởng, Khai phá liệu (2017), tái lần 1, Nhà xuất Thông tin truyền thông [5] Phạm Hạ Thủy (2006), Một số vấn đề liên quan đến tệp liệu hệ thống sở liệu, Luận án tiến sĩ, Viện CNTT, Viện Hàn lâm Khoa học công nghệ Việt Nam B-Tiếng Anh [6] Han J and M Kamber (2006), Data Mining-Concepts and Techniques (Second Edition) Morgan Kaufmann Publishers [7] B.Liu (1998), integrating classification and association mining, in proc Conf Knowledge discover and data mining p 80-86 nework) [8] Kwok wa Lam (2004) building decision trees using functional dependencies, proceeding of the international conference on information technology: coding and computing) [9] ZijianZheng (1996), Constructing New Attributes for Dacision Tree Learning, The thesis for the degree of Doctor of Philosophy, The University of Sydney) Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN http://lrc.tnu.edu.vn ... dựng phân lớp nhờ luật kết hợp phân lớp (Class Association Rules) bảng mẫu học 27 CHƯƠNG MỘT SỐ PHƯƠNG PHÁP TÌM CÁC LUẬT KẾT HỢP PHÂN LỚP TRÊN TẬP MẪU HỌC 29 2.1 Phương pháp phân lớp. .. ? ?Nghiên cứu số phương pháp tìm luật kết hợp phân lớp tập mẫu học ứng dụng chẩn đoán bệnh? ?? Mục đích thực luận văn tổng hợp kiến thức kỹ thuật khai phá liệu phương pháp tìm luật kết hợp phân lớp. .. cứu đề tài: Nghiên cứu kỹ thuật khai phá liệu nói chung, trọng việc tìm luật kết hợp phân lớp tập mẫu học Nghiên cứu toán ứng dụng phương pháp cải tiến tìm luật kết hợp phân lớp tập mẫu học Phương