Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 84 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
84
Dung lượng
1,56 MB
Nội dung
ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG PHẠM THANH TUẤN NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP TÌM CÁC LUẬT KẾT HỢP PHÂN LỚP TRÊN TẬP MẪU HỌC VÀ ỨNG DỤNG TRONG CHẨN ĐOÁN BỆNH LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Thái Nguyên, 2019 Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN http://lrc.tnu.edu.vn ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG PHẠM THANH TUẤN NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP TÌM CÁC LUẬT KẾT HỢP PHÂN LỚP TRÊN TẬP MẪU HỌC VÀ ỨNG DỤNG TRONG CHẨN ĐOÁN BỆNH Chuyên ngành: Khoa học máy tính Mã số: 48 01 01 Người hướng dẫn khoa học: TS Lê Văn Phùng Thái Nguyên, 2019 Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN http://lrc.tnu.edu.vn i LỜI CAM ĐOAN Tơi xin cam đoan cơng trình nghiên cứu thực hiện, hướng dẫn khoa học TS Lê Văn Phùng Các số liệu kết trình bày luận văn trung thực, chưa công bố tác giả hay cơng trình khác Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN http://lrc.tnu.edu.vn ii LỜI CẢM ƠN Trong trình thực đề tài “Nghiên cứu số phương pháp tìm luật kết hợp phân lớp tập mẫu học ứng dụng chẩn đốn bệnh”, tơi nhận nhiều giúp đỡ, tạo điều kiện tập thể Ban Giám hiệu, Phòng Đào tạo, khoa Cơng nghệ thơng tin phòng chức trường Đại học Công nghệ thông tin truyền thông, Đại học Thái Ngun Tơi xin bày tỏ lòng cảm ơn chân thành giúp đỡ quý báu Tơi xin bày tỏ lòng biết ơn sâu sắc đến TS Lê Văn Phùng thầy giáo trực tiếp hướng dẫn, bảo giúp tơi hồn thành luận văn TÁC GIẢ LUẬN VĂN Phạm Thanh Tuấn Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN http://lrc.tnu.edu.vn MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii DANH MỤC CÁC KÝ HIỆU, CÁC TỪ VIẾT TẮT v DANH MỤC BẢNG BIỂU vi DANH MỤC HÌNH VẼ vii MỞ ĐẦU viii CHƯƠNG PHÂN LỚP VÀ PHƯƠNG PHÁP XÂY DỰNG CÂY PHÂN LỚP THEO TẬP MẪU HỌC 1.1 Tổng quan kỹ thuật khai phá liệu 1.1.1 Khái niệm khai phá liệu 1.1.2 Một số phương pháp khai phá liệu đại thông dụng 1.1.3 Các ứng dụng khai phá liệu 1.2 Những vấn đề chung phân lớp phương pháp phân lớp 1.2.1 Khái niệm phân lớp liệu 1.2.2 Các bước tiến hành phân lớp liệu 1.2.3 Phân lớp theo định 1.2.4 Phân lớp kiểu Bayes 12 1.2.5 Phân lớp dựa quy tắc IF-THEN 13 1.2.6 Phân lớp dựa luật kết hợp 16 1.2.7 Phân lớp dựa vào K-lân cận gần 18 1.2.8 Phân lớp dựa vào giải thuật di truyền 19 1.2.9 Phân lớp theo cách tiếp cận tập thô 20 1.2.10 Phân lớp theo cách tiếp cận tập mờ 21 1.3 Khái niệm tập mẫu học phương pháp xây dựng phân lớp 24 1.3.1 Định nghĩa tập mẫu học 24 1.3.2 Xây dựng phân lớp dựa theo Khóa 24 Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN http://lrc.tnu.edu.vn 1.3.3 Xây dựng phân lớp nhờ luật kết hợp phân lớp (Class Association Rules) bảng mẫu học 27 CHƯƠNG MỘT SỐ PHƯƠNG PHÁP TÌM CÁC LUẬT KẾT HỢP PHÂN LỚP TRÊN TẬP MẪU HỌC 29 2.1 Phương pháp phân lớp dựa luật kết hợp 29 2.1.1 Các bước tiến hành phân lớp dựa luật kết hợp 29 2.1.2 Tạo luật kết hợp định 29 2.2 Một số thuật toán cổ điển xây dựng phân lớp dựa luật kết hợp 29 2.2.1 Thuật toán CBA-RG 30 2.2.2 Thuật toán CBA-CB 32 2.3 Thuật toán đại 34 2.3.1 Thuật toán CBA cải tiến 34 2.3.2 Ví dụ áp dụng thuật tốn cải tiến 37 CHƯƠNG CHƯƠNG TRÌNH THỬ NGHIỆM TÌM CÁC LUẬT KẾT HỢP PHÂN LỚP DỰA TRÊN TẬP MẪU HỌC 42 3.1 Bài toán thử nghiệm 42 3.1.1 Bài toán tập mẫu học đầu vào 42 3.1.2 Chọn thuật toán thử nghiệm 46 3.2 Môi trường thử nghiệm 47 3.2.1 Chọn môi trường chứa liệu đầu vào 47 3.2.2 Chọn ngơn ngữ lập trình 47 3.3 Nội dung kết thử nghiệm 47 3.3.1 Mơ hình thuật toán thử nghiệm 47 3.3.3 Một số giao diện chương trình thử nghiệm 50 3.4 Đánh giá chương trình thử nghiệm 51 3.5 Mở rộng toán 51 KẾT LUẬN 60 TÀI LIỆU THAM KHẢO 62 Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN http://lrc.tnu.edu.vn DANH MỤC CÁC KÝ HIỆU, CÁC TỪ VIẾT TẮT DM – Data Mining CSDL – Cơ sở liệu CBA - Classification-Based Associon CMAR - Classification based on Multiple Asociation Rule Số hóa Trung tâm Học liệu Cơng nghệ thơng tin – ĐHTN http://lrc.tnu.edu.vn DANH MỤC BẢNG BIỂU Bảng 1.1 Ví dụ tập mẫu học…………………………………….… 15 Bảng 1.2 Các huấn luyện phân lớp CSDL……….… 20 Bảng 1.3 Ví dụ tập mẫu học phân lớp dựa theo khóa………… …33 Bảng 2.1 Ví dụ tập mẫu học để tìm luật kết hợp phân lớp theo thuật toán cải tiến…………………………………………………… ………… 47 Bảng 2.2 Bảng tổng hợp……………………………………… ……… 49 Bảng 2.3a Khoản mục………………………………………… …….… 50 Bảng 2.3b Các luật kết hợp phân lớp phổ biến – Khoản mục…… ….…50 Bảng 2.3c Các luật kết hợp phân lwps – Khoản mục……… ……….…50 Bảng 3.1 Tập mẫu học……………………………………………………55 Bảng 3.2 Bảng mẫu học số hóa…………………………………….56 Bảng 3.3 Bảng tổng hợp kết thu được………………………… … 59 Bảng 3.4 Bảng mấu học (mở rộng) đầu vào…………………………… 60 Bảng 3.5 Bảng mẫu học mở rộng số hóa……………………… 64 Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN http://lrc.tnu.edu.vn vii DANH MỤC HÌNH VẼ Hình 1.1 Cây định cho việc chơi Gold………….……………… ….16 Hình 1.2 Một tập thơ xấp xỉ tập C dùng tập xấp xỉ dước C Các vùng hình chũ nhật biểu diễn lớp tương đương……………………………………………………… ………………27 Hình 1.3 Các giá trị mờ thật với thu nhập, biểu diễn mức thành viên giá trị thu nhập theo loại {thấp, trung bình, cao}…………… …28 Hình 1.4 Cây phân lớp xây dựng với trường hợp…………………………34 Số hóa Trung tâm Học liệu Cơng nghệ thơng tin – ĐHTN http://lrc.tnu.edu.vn MỞ ĐẦU Lý chọn đề tài Thế kỷ XXI xem kỷ nguyên công nghệ thông tin Cùng với việc ứng dụng công nghệ thông tin hầu hết lĩnh vực nhiều năm qua dẫn đến lượng liệu, thông tin nhân loại lưu trữ ngày tăng Nguồn liệu khổng lồ tích lũy với tốc độ bùng nổ từ nhiều lĩnh vực: khoa học, kinh doanh, giao dịch, thương mại, chứng khốn, … Vậy khai thác từ “núi” liệu tưởng chừng bỏ Cùng với việc tăng không ngừng khối lượng liệu, hệ thống thông tin chuyên môn hóa, phân hạch hóa theo lĩnh vực sản xuất, tài chính, bn bán thị trường v.v, nhiên hệ quản trị sở liêu truyền thống khai thác lượng thông tin nhỏ không đáp ứng đủ yêu câu, thách thức Do khuynh hướng đời kỹ thuật phát tri thức sở liệu Khai phá liệu (Data Mining – DM) đời phần giải hữu hiệu yêu cầu, thách thức Một lĩnh vực nghiên cứu phương pháp ứng dụng khai phá liệu, tìm kiếm tri thức, kết xuất tri thức… từ liệu tìm kiếm Luật kết hợp phân lớp (Class Association Rules) nghiên cứu từ nhiều năm trước có kết khả quan mang lại hướng ứng dụng có hiệu cao Ngày nay, kỹ thuật khai phá liệu dựa việc tìm kiếm luật kết hợp phân lớp áp dụng mang lại hiệu cho nhiều ngành, nhiều lĩnh vực như: Kinh tế, tài chính, khoa học - kỹ thuật, ngân hàng, thương mại, giáo dục, y tế… kỹ thuật khai phá dự liệu Luật kết hợp phân lớp đa dạng phong phú kỹ thuật dựa thuật tốn CBA-RG, CBA-CB,… Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN http://lrc.tnu.edu.vn Bảng 3.3.Bảng tổng hợp Mục luật s+ count supt (Thannhiet,sotnhe),Y 33% (Thannhiet,sotcao),Y 33% (Ơnlanh,ret),Y 33% (Ơnlanh,ret),N 33% (đau đầu,dau dội),Y (Thannhiet,sotnhe),(Ơn lanh,ret),N 33% 33% Condset s- count confd 50% 100% (Ơnlanh,ret) 50% (Ơnlanh,ret) 50% 100% 3 67% (Thannhiet, sotnhe) (Thannhiet, sotcao) (Đau đầu, đaududoi) (Thannhiet,sotn he),(Ơnlanh,ret) Như Minsup = 30% Minconfd = 60% ta thấy có mục luật sau vừa phổ biến xác: �(Thannhiet, sotnhe) → khơng bị cúm �(Ơnlanh, ret) → không bị cúm �(Thannhiet, sotcao) → bị cúm �(đauđau, đaududoi) → bị cúm 3.3.3 Một số giao diện chương trình thử nghiệm Hình 3.1 Giao diện chương trình thử nghiệm Hình 3.2 Giao diện chương trình thử nghiệm 3.4 Đánh giá chương trình thử nghiệm Chương trình thử nghiệm với tập mẫu học đưa vào file Excel: Tuan1.xlsx với liệu thu thập từ bệnh nhân bệnh viện đa khoa TW Thái Nguyên cho kết tốt, với kết luận bác sĩ bệnh viện đa khoa TW Thái Nguyên 3.5 Mở rộng toán Mẫu học mở rộng với 50 bệnh nhân 13 thuộc tính đặc trưng thuộc tính phân lớp (cúm) [2] Bảng 3.4 Bảng mẫu học (mở rộng) đầu vào table1 Be nh Dau Da Than Onl Chon Met nh dau uco nhiet anh gmat moi Ho Dau Chaynu Nghe No Tieu Cu hong ocmui tmui n chay m an B0 Khô B0 B0 ng Có Có Cao Kh ơng Có Có B0 Khơ Kh B0 ng ơng Có Kh ơng Có Bình thườn Có g Rất Khơ cao ng Cao Có Bình thườn g Khơ ng Khơn g Khơn g Có Khơn g Có Có Có Có Có Kh Khơng Có Khơng Có Có Có Khơng Có ơng Kh ơng Khơ Kh ng ơng Có Khơng Có Khơng Khơn Kh Khơn g ơng g Có Khơn Kh Khơn Kh g Có Khơn g Có ơng g Kh Khơn ơng Có g ông Có Khôn Kh g ông Kh Khôn Kh ông g ông 52 table1 Be nh Dau Da Than Onl Chon Met nh dau uco nhiet anh gmat moi Ho Dau Chaynu Nghe No Tieu Cu hong ocmui tmui n chay m an B0 Khô ng B0 Khô B0 ng Có B0 Khơ B1 B1 ng Có Cao Có Cao Kh ơng Có Cao Có Có Cao Có Có Cao B1 Khơ Kh B1 B1 Cao ng ơng Bình thườn g Bình Có Có thườn g Có Có Cao Khơ ng Có Có Có Khơn g Khơn g Khơ Khơn ng g Khơ Khơn ng Khơ ng Khơ ng g Có Có Khơ Khơn ng g Có Có Có Có Có Có g ơng ng Có Có Có Có Khơn g Có Khơng Có Có Có Khơng Có Có Có Có Có Có Có Có Có Có ng Kh Khơ ơng ng Có Có Có g g Có Có Có Có Kh Khơn ơng g ơng g Kh Khơn ơng Có g Khơn g Có Có Có Có Khơn Kh Khơn Kh g Có Có Khơng Có Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN ông Khôn Kh Khôn Có Có Có Khô Khôn Khô ng Kh Khơ Có Kh Khơn ơng g ơng Kh Khơn Kh ơng Có g Khơn g ơng Có http://lrc.tnu.edu.vn 53 table1 Be nh Dau Da Than Onl Chon Met nh dau uco nhiet anh gmat moi Ho Dau Chaynu Nghe No Tieu Cu hong ocmui tmui n chay m an B1 Khô B1 B1 B1 B1 B2 B2 ng Có Cao Có Có Có Kh ơng Rất cao Bình thườn g B2 Có ng Có Có Có Cao Có Có Có Cao Có Có Kh ơng Bình thườn g ng ơng cao Có Kh ơng Cao g Có Khơ Khơn Có Có Cao B2 Khơ Kh Rất Có Khơn g Khôn g Khôn g Khôn g Khô Khôn ng g Có Có Có Có Có Có Có Có Có Khơng Có Có g ơng Kh ơng Có Khơng Có Có Có Có Có Có Có Kh Khơ ơng ng Kh ông Có Có Có Có Khô Khôn Khô ng Kh ng Có Có Khơng Khơng Khơng Có Khơng Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN Khơn g Khơn g Khơn g Có Có Có Có Có Khơn Kh g ơng Có Có Khơn g Có Khơn Kh g ơng Có Có Khơn g Có Khơn Kh Khơn Kh g Có ơng g Kh Khôn Kh ông g Khôn Kh Khôn g ông ông g ơng Có Khơn Kh Khơn Kh g ơng g ông http://lrc.tnu.edu.vn 54 table1 Be nh Dau Da Than Onl Chon Met nh dau uco nhiet anh gmat moi Ho Dau Chaynu Nghe No Tieu Cu hong ocmui tmui n chay m an B2 Khô Kh B2 B2 ng ơng Có Có Cao Có B2 Khơ B2 B2 B3 Cao ng Có Có Kh ơng Có Kh ơng Kh ơng Cao Rất cao Bình thườn g Bình thườn g Có Có Cao Có Khơ ng ng ơng cao B3 Khơ ng Có Rất cao g Có Khơ Khơn ng Có Khơ ng g Khơn g Có Khơ Khơn ng g Có Có Có Khơng Có Có Có Khơng Có Có Có Có ng ng Có g Có Khơn g Khơ ng Khơ ng Có Có Có Có Kh Khơ ơng ng Khơ Khôn Khô Kh B3 Khô Kh Rất Khô Khôn ng ơng Có Có Có Kh Khơ ơng ng Kh Khơ ơng ng Có g Có Khơng Có Có Có Khơng Khơng Khơng Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN g Khôn Kh Khơn Khơng Có Có Khơn ơng g Kh Khơn ơng Có Kh ơng g Khơn g Có Có Có Có Có Có Khơn Kh Khơn Kh g Khơn g Khơn g Khơn g ơng g Có Có Có Có Có ông Kh ông Kh ông Khôn Kh g ông http://lrc.tnu.edu.vn 55 table1 Be nh Dau Da Than Onl Chon Met nh dau uco nhiet anh gmat moi Ho Dau Chaynu Nghe No Tieu Cu hong ocmui tmui n chay m an B3 Khô Kh B3 B3 B3 Cao Có Có Cao Có Có Có Có Có Có Có thườn Có Có Có ng ơng Có Kh ông Có Có ng Có Rất cao Rất cao B3 B4 ng ơng cao Có Có Cao Có B4 Khơ ng Kh ơng Có Cao Rất cao Có Có Có Khơn g Có Khơn g Khơ ng Có g Có Khơn g Khơng g Có Có Khơng Có Có Có Có Khơng Có Có Khơ Khơn Khơ ng Có Khơn Kh Khơn Kh Có g B3 Khơ Kh Rất ng ơng Bình B3 Khơ Khơ Kh ng Kh ông Kh Khô ông ng Kh Khô ông ng Có Có Có Có Có Có Kh ông Có B4 Có Có Cao Khơ Khơn Có Có Khơ Khơng Khơng Có Khơng Khơng Có Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN ông g Kh Khôn ông Có g Khôn g Khôn Kh Khơn g Khơn g Khơn g ơng g Có Có Có Có Khơn Kh Khơn g ơng Khơn Kh g ơng Có Có g Có Khơn g ơng Có Có Có Kh ơng Kh ơng Có Kh ơng Có Có Kh Khơn Có http://lrc.tnu.edu.vn 56 table1 Be nh Dau Da Than Onl Chon Met nh dau uco nhiet anh gmat moi Ho Dau Chaynu Nghe No Tieu Cu hong ocmui tmui n chay m an B4 B4 ng Có Có Cao Có Kh ơng Bình thườn g B4 Khô Kh Rất ng ông cao B4 Khô Kh B4 B4 B4 ng ông thườn g Có Có Cao Có Có Có Rất cao Kh Rất ơng cao B5 Khơ Kh Bình ng ơng Cao Có g Khơn g Khơ Khơn ng g Có Có Khơ Khơn ng g ng Có Có Có ng g ng Có Có Có Có Khơn g ông Kh ông Không Có Không Kh Khô ông ng Có Có Kh ơng Có Có Khơn Khơ Kh g Có Có Có Có Khơ Khơn Khơ Có Kh ng ông ông Có Khô ng Có Không Không Có Có Khơn g Khơn g Có Kh Khơn ơng Có ơng Khơng Có Có Khơng Có g Kh ơng Khơn Kh g g Khơn Kh Khơn Khơn Có ơng Kh Khơn Kh ơng Số hóa Trung tâm Học liệu Cơng nghệ thơng tin – ĐHTN g Có Có g Khơng g g Khơn g Kh Khơn ơng g Có Có ơng Có Có Có Kh ơng http://lrc.tnu.edu.vn 57 Sau mã hóa, có: Bảng 3.5 Bảng mẫu học mở rộng số hóa table1 Benh Dau Da Than Onl Chon Met H Dau Chaynu Nghe nhan dau uco nhiet anh gmat moi o hong ocmui tmui N o n Tieu chay C u m B01 1 1 1 0 0 B02 0 1 0 0 B03 1 1 1 1 0 B04 0 1 1 0 0 B05 0 0 1 0 B06 1 1 1 1 0 B07 1 1 1 1 B08 1 1 1 0 B09 1 0 1 0 0 B10 1 0 1 1 0 B11 1 1 1 1 1 B12 0 0 1 1 0 0 B13 1 0 0 1 0 B14 1 0 1 1 B15 1 1 1 1 1 B16 1 1 1 1 0 1 B17 0 0 1 0 0 B18 1 1 1 0 1 Số hóa Trung tâm Học liệu Cơng nghệ thông tin – ĐHTN http://lrc.tnu.edu.vn 58 table1 Benh Dau Da Than Onl Chon Met H Dau Chaynu Nghe nhan dau uco nhiet anh gmat moi o hong ocmui tmui N o n Tieu chay C u m B19 1 1 1 1 1 B20 1 1 0 0 0 B21 0 0 1 0 B22 0 1 1 1 0 B23 1 0 1 0 0 B24 0 1 1 1 1 B25 1 1 1 0 0 B26 1 0 1 0 0 B27 1 1 0 1 B28 0 1 1 1 1 B29 0 0 0 0 0 B30 1 0 0 0 1 B31 0 1 0 0 1 B32 1 1 0 0 0 B33 0 1 0 0 0 B34 1 1 1 1 0 B35 1 1 1 1 B36 1 1 1 0 0 B37 1 1 0 0 1 B38 0 1 0 0 1 Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN http://lrc.tnu.edu.vn 59 table1 Benh Dau Da Than Onl Chon Met H Dau Chaynu Nghe nhan dau uco nhiet anh gmat moi o hong ocmui tmui N o n Tieu chay C u m B39 1 0 1 0 B40 1 1 1 0 B41 1 1 1 1 B42 1 0 1 1 0 B43 1 1 1 0 B44 0 0 1 0 1 B45 0 1 1 0 0 0 B46 0 0 1 1 0 B47 1 0 1 0 B48 1 1 1 1 1 B49 1 1 0 0 B50 0 1 0 0 1 Bảng mẫu học mở rộng lưu EXCEL: Tuan2.xlsx (dạng chữ số) Từ kết phần mềm cho thấy thuật toán cải tiến dựa luật kết hợp phân lớp trình bày [5] đưa kết giảm nửa số phép tính q trình tính tốn Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN http://lrc.tnu.edu.vn KẾT LUẬN Kết đạt Luận văn “ Nghiên cứu số phương pháp tìm luật kết hợp phân lớp tập mẫu học áp dụng vào chẩn đoán bệnh” đạt kết sau: � Chương giới thiệu tổng quan “ Khai phá liệu” số vấn đề như: khái niệm, phương pháp khai phá liệu, ứng dụng khai phá liệu Khái niệm phân lớp liệu, bước tiến hành phân lớp, kiểu phương pháp phân lớp liệu � Chương giới thiệu số phương pháp tìm luật kết hợp phân lớp dựa tập mẫu học, phương pháp phân lớp, bước tiến hành phân lớp dựa luật kết hợp Chương giới thiệu thuật toán xây dựng phân lớp dựa luật kết hợp, thuật toán cổ điển CBA-RG, CBA-CB thuật toán cải tiến giúp giảm nửa số phép tính thực tốn � Chương mơ tả tốn áp dụng thuật tốn cải tiến vào chuẩn đoán bệnh cúm bệnh viện đa khoa TW Thái Ngun, quy trình chuẩn đốn xác định bệnh, thơng tin tình trạng bệnh nhận thu thập lưu vào file Excel làm liệu đầu vào toán Cuối chương phần giới thiệu kết xây dựng phần mềm chuẩn đoán bệnh cúm kết thu sau nhập liệu Vì khai phá liệu dựa luật kết hợp nói riêng khai phá liệu nói chung vấn đề rộng lớn, nên hẳn nghiên cứu nhỏ e nhiếu thiếu sót, phần thực nhiệm dạng thử nghiệm thuật tốn cần cải thiện thêm trở thành sản phẩm thực tiễn Em mong nhận góp ý thầy bạn để đề tài ngày hoàn thiện Em xin chân thành cảm ơn! Hướng nghiên cứu Tiếp tục hồn thiện phần mềm để trở thành phần mềm thực tiễn Nghiên cứu áp dụng thuật toán, xây dựng phần mềm chuẩn đoán bệnh khác TÀI LIỆU THAM KHẢO A-Tiếng Việt [1] Nguyễn Khắc Giáo (2013), Khai thác luật kết hợp từ sở liệu giao dịch siêu thị bán lẻ, Luận văn Thạc sĩ Công nghệ thông tin, Đại học Công nghệ, Đại học Quốc gia Hà Nội [2].Nguyễn Đăng Nguyên (2017), Phương pháp xây dựng định dựa tập phụ thuộc hàm xấp xỉ, Luận văn Thạc sĩ Khoa học máy tính, Đại học Cơng nghệ thông tin truyền thông – Đại học Thái Nguyên [3] Lê Văn Phùng (2018), Cơ sở liệu quan hệ cơng nghệ phân tích –thiết kế , Tái lần 1, Nhà xuất Thông tin truyền thông [4] Lê Văn Phùng - Quách Xuân Trưởng, Khai phá liệu (2017), tái lần 1, Nhà xuất Thông tin truyền thông [5] Phạm Hạ Thủy (2006), Một số vấn đề liên quan đến tệp liệu hệ thống sở liệu, Luận án tiến sĩ, Viện CNTT, Viện Hàn lâm Khoa học công nghệ Việt Nam B-Tiếng Anh [6] Han J and M Kamber (2006), Data Mining-Concepts and Techniques (Second Edition) Morgan Kaufmann Publishers [7] B.Liu (1998), integrating classification and association mining, in proc Conf Knowledge discover and data mining p 80-86 nework) [8] Kwok wa Lam (2004) building decision trees using functional dependencies, proceeding of the international conference on information technology: coding and computing) [9] ZijianZheng (1996), Constructing New Attributes for Dacision Tree Learning, The thesis for the degree of Doctor of Philosophy, The University of Sydney) ... dựng phân lớp nhờ luật kết hợp phân lớp (Class Association Rules) bảng mẫu học 27 CHƯƠNG MỘT SỐ PHƯƠNG PHÁP TÌM CÁC LUẬT KẾT HỢP PHÂN LỚP TRÊN TẬP MẪU HỌC 29 2.1 Phương pháp phân lớp. ..ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG PHẠM THANH TUẤN NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP TÌM CÁC LUẬT KẾT HỢP PHÂN LỚP TRÊN TẬP MẪU HỌC VÀ ỨNG DỤNG TRONG CHẨN ĐOÁN BỆNH... liệu sử dụng Luật kết hợp phân lớp vào thực tế nên lựa chọn thực luận văn tốt nghiệp với đề tài Nghiên cứu số phương pháp tìm luật kết hợp phân lớp tập mẫu học ứng dụng chẩn đoán bệnh Mục đích