1. Trang chủ
  2. » Luận Văn - Báo Cáo

(Luận văn) nghiên cứu một số phương pháp tìm các luật kết hợp phân lớp trên tập mẫu học và ứng dụng

74 1 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG PHẠM THANH TUẤN lu an va n NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP to gh tn TÌM CÁC LUẬT KẾT HỢP PHÂN LỚP TRÊN TẬP MẪU HỌC p ie VÀ ỨNG DỤNG TRONG CHẨN ĐOÁN BỆNH d oa nl w ll u nf va an lu LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH oi m z at nh z m co l gm @ Thái Nguyên, 2019 an Lu va http://lrc.tnu.edu.vn n Số hóa Trung tâm Học liệu Cơng nghệ thơng tin – ĐHTN ac th si ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG PHẠM THANH TUẤN lu an va n NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP to gh tn TÌM CÁC LUẬT KẾT HỢP PHÂN LỚP TRÊN TẬP MẪU HỌC p ie VÀ ỨNG DỤNG TRONG CHẨN ĐOÁN BỆNH oa nl w Chuyên ngành: Khoa học máy tính d ll u nf va an lu Mã số: 48 01 01 oi m Người hướng dẫn khoa học: TS Lê Văn Phùng z at nh z m co l gm @ va http://lrc.tnu.edu.vn n Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN an Lu Thái Nguyên, 2019 ac th si i LỜI CAM ĐOAN Tôi xin cam đoan cơng trình nghiên cứu thực hiện, hướng dẫn khoa học TS Lê Văn Phùng Các số liệu kết trình bày luận văn trung thực, chưa công bố tác giả hay cơng trình khác lu an n va p ie gh tn to d oa nl w ll u nf va an lu oi m z at nh z m co l gm @ an Lu va http://lrc.tnu.edu.vn n Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN ac th si ii LỜI CẢM ƠN Trong trình thực đề tài “Nghiên cứu số phương pháp tìm luật kết hợp phân lớp tập mẫu học ứng dụng chẩn đốn bệnh”, tơi nhận nhiều giúp đỡ, tạo điều kiện tập thể Ban Giám hiệu, Phịng Đào tạo, khoa Cơng nghệ thơng tin phòng chức trường Đại học Công nghệ thông tin truyền thông, Đại học Thái Ngun Tơi xin bày tỏ lịng cảm ơn chân thành giúp đỡ q báu Tơi xin bày tỏ lòng biết ơn sâu sắc đến TS Lê Văn Phùng thầy lu giáo trực tiếp hướng dẫn, bảo giúp tơi hồn thành luận văn an va n TÁC GIẢ LUẬN VĂN p ie gh tn to d oa nl w Phạm Thanh Tuấn ll u nf va an lu oi m z at nh z m co l gm @ an Lu va http://lrc.tnu.edu.vn n Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN ac th si iii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii DANH MỤC CÁC KÝ HIỆU, CÁC TỪ VIẾT TẮT v DANH MỤC BẢNG BIỂU vi DANH MỤC HÌNH VẼ vii MỞ ĐẦU viii CHƯƠNG PHÂN LỚP VÀ PHƯƠNG PHÁP XÂY DỰNG CÂY lu an PHÂN LỚP THEO TẬP MẪU HỌC n va 1.1 Tổng quan kỹ thuật khai phá liệu tn to 1.1.1 Khái niệm khai phá liệu gh 1.1.2 Một số phương pháp khai phá liệu đại thông dụng p ie 1.1.3 Các ứng dụng khai phá liệu w 1.2 Những vấn đề chung phân lớp phương pháp phân lớp oa nl 1.2.1 Khái niệm phân lớp liệu d 1.2.2 Các bước tiến hành phân lớp liệu an lu 1.2.3 Phân lớp theo định u nf va 1.2.4 Phân lớp kiểu Bayes 12 1.2.5 Phân lớp dựa quy tắc IF-THEN 13 ll oi m 1.2.6 Phân lớp dựa luật kết hợp 16 z at nh 1.2.7 Phân lớp dựa vào K-lân cận gần 18 1.2.8 Phân lớp dựa vào giải thuật di truyền 19 z 1.2.9 Phân lớp theo cách tiếp cận tập thô 20 @ gm 1.2.10 Phân lớp theo cách tiếp cận tập mờ 21 l 1.3 Khái niệm tập mẫu học phương pháp xây dựng phân lớp 24 m co 1.3.1 Định nghĩa tập mẫu học 24 an Lu 1.3.2 Xây dựng phân lớp dựa theo Khóa 24 va http://lrc.tnu.edu.vn n Số hóa Trung tâm Học liệu Cơng nghệ thông tin – ĐHTN ac th si iv 1.3.3 Xây dựng phân lớp nhờ luật kết hợp phân lớp (Class Association Rules) bảng mẫu học 27 CHƯƠNG MỘT SỐ PHƯƠNG PHÁP TÌM CÁC LUẬT KẾT HỢP PHÂN LỚP TRÊN TẬP MẪU HỌC 29 2.1 Phương pháp phân lớp dựa luật kết hợp 29 2.1.1 Các bước tiến hành phân lớp dựa luật kết hợp 29 2.1.2 Tạo luật kết hợp định 29 2.2 Một số thuật toán cổ điển xây dựng phân lớp dựa luật kết hợp 29 2.2.1 Thuật toán CBA-RG 30 lu an 2.2.2 Thuật toán CBA-CB 32 n va 2.3 Thuật toán đại 34 tn to 2.3.1 Thuật toán CBA cải tiến 34 2.3.2 Ví dụ áp dụng thuật tốn cải tiến 37 gh p ie CHƯƠNG CHƯƠNG TRÌNH THỬ NGHIỆM TÌM CÁC LUẬT KẾT HỢP PHÂN LỚP DỰA TRÊN TẬP MẪU HỌC 42 nl w 3.1 Bài toán thử nghiệm 42 d oa 3.1.1 Bài toán tập mẫu học đầu vào 42 an lu 3.1.2 Chọn thuật toán thử nghiệm 46 va 3.2 Môi trường thử nghiệm 47 ll u nf 3.2.1 Chọn môi trường chứa liệu đầu vào 47 oi m 3.2.2 Chọn ngôn ngữ lập trình 47 3.3 Nội dung kết thử nghiệm 47 z at nh 3.3.1 Mơ hình thuật tốn thử nghiệm 47 z 3.3.3 Một số giao diện chương trình thử nghiệm 50 gm @ 3.4 Đánh giá chương trình thử nghiệm 51 l 3.5 Mở rộng toán 51 m co KẾT LUẬN 60 TÀI LIỆU THAM KHẢO 62 an Lu va http://lrc.tnu.edu.vn n Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN ac th si v DANH MỤC CÁC KÝ HIỆU, CÁC TỪ VIẾT TẮT DM – Data Mining CSDL – Cơ sở liệu CBA - Classification-Based Associon CMAR - Classification based on Multiple Asociation Rule lu an n va p ie gh tn to d oa nl w ll u nf va an lu oi m z at nh z m co l gm @ an Lu va http://lrc.tnu.edu.vn n Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN ac th si vi DANH MỤC BẢNG BIỂU Bảng 1.1 Ví dụ tập mẫu học…………………………………….… 15 Bảng 1.2 Các huấn luyện phân lớp CSDL……….… 20 Bảng 1.3 Ví dụ tập mẫu học phân lớp dựa theo khóa………… …33 Bảng 2.1 Ví dụ tập mẫu học để tìm luật kết hợp phân lớp theo thuật toán cải tiến…………………………………………………… ………… 47 Bảng 2.2 Bảng tổng hợp……………………………………… ……… 49 lu Bảng 2.3a Khoản mục………………………………………… …….… 50 an Bảng 2.3b Các luật kết hợp phân lớp phổ biến – Khoản mục…… ….…50 va n Bảng 2.3c Các luật kết hợp phân lwps – Khoản mục……… ……….…50 Tập mẫu học……………………………………………………55 gh tn to Bảng 3.1 Bảng mẫu học số hóa…………………………………….56 ie Bảng 3.2 Bảng tổng hợp kết thu được………………………… … 59 Bảng 3.4 Bảng mấu học (mở rộng) đầu vào…………………………… 60 p Bảng 3.3 nl w Bảng mẫu học mở rộng số hóa……………………… 64 d oa Bảng 3.5 ll u nf va an lu oi m z at nh z m co l gm @ an Lu va http://lrc.tnu.edu.vn n Số hóa Trung tâm Học liệu Cơng nghệ thông tin – ĐHTN ac th si vii DANH MỤC HÌNH VẼ Hình 1.1 Cây định cho việc chơi Gold………….……………… ….16 Hình 1.2 Một tập thơ xấp xỉ tập C dùng tập xấp xỉ dước C Các vùng hình chũ nhật biểu diễn lớp tương đương……………………………………………………… ………………27 Hình 1.3 Các giá trị mờ thật với thu nhập, biểu diễn mức thành viên giá trị thu nhập theo loại {thấp, trung bình, cao}…………… …28 lu Hình 1.4 Cây phân lớp xây dựng với trường hợp…………………………34 an n va p ie gh tn to d oa nl w ll u nf va an lu oi m z at nh z m co l gm @ an Lu va http://lrc.tnu.edu.vn n Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN ac th si viii MỞ ĐẦU Lý chọn đề tài Thế kỷ XXI xem kỷ nguyên công nghệ thông tin Cùng với việc ứng dụng công nghệ thông tin hầu hết lĩnh vực nhiều năm qua dẫn đến lượng liệu, thông tin nhân loại lưu trữ ngày tăng Nguồn liệu khổng lồ tích lũy với tốc độ bùng nổ từ nhiều lĩnh vực: khoa học, kinh doanh, giao dịch, thương mại, chứng khoán,… Vậy khai thác từ “núi” liệu tưởng chừng bỏ lu Cùng với việc tăng không ngừng khối lượng liệu, hệ thống thơng an tin chun mơn hóa, phân hạch hóa theo lĩnh vực sản xuất, va n tài chính, bn bán thị trường v.v, nhiên hệ quản trị sở liêu truyền gh tn to thống khai thác lượng thơng tin nhỏ khơng cịn đáp ứng đủ ie yêu câu, thách thức Do khuynh hướng đời p kỹ thuật phát tri thức sở liệu Khai phá liệu (Data Mining d oa nl w – DM) đời phần giải hữu hiệu yêu cầu, thách thức an lu Một lĩnh vực nghiên cứu phương pháp ứng dụng khai u nf va phá liệu, tìm kiếm tri thức, kết xuất tri thức… từ liệu tìm kiếm Luật kết hợp phân lớp (Class Association Rules) nghiên cứu từ nhiều ll oi m năm trước có kết khả quan mang lại hướng ứng dụng z at nh có hiệu cao Ngày nay, kỹ thuật khai phá liệu dựa việc tìm kiếm luật kết hợp phân lớp áp dụng mang lại hiệu cho nhiều z ngành, nhiều lĩnh vực như: Kinh tế, tài chính, khoa học - kỹ thuật, ngân hàng, @ l gm thương mại, giáo dục, y tế… kỹ thuật khai phá dự liệu Luật kết hợp CBA-RG, CBA-CB,… m co phân lớp đa dạng phong phú kỹ thuật dựa thuật toán an Lu Với mong muốn nắm vững trình phát tri thức từ liệu va http://lrc.tnu.edu.vn n Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN ac th si 48 Mz,l sau: - Tính độ hỗ trợ Mzl: + Ký hiệu số phần tử chứa Mz,l s+ tiến hành; + s+ = 1; + Nếu Ez,l ⊆ Ei,j thỏa mãn: (z=i) ∨ (z=j) ∨ (l=j) ∨ (l=i) tăng số đếm s+ lên đơn vị (s+ = s+ + 1); + Tính số phần tử theo công thức: Count(Mz,l) = (1 + √1 + 8s + )/2 lu + Tính độ hỗ trợ cho Mz,l: an va supt = count(Mz,l)/m n - Tính độ chắn cho Mz,l sau: to gh tn + Ký hiệu số phần tử chứa Xi,j s- tiến hành: p ie s- = 1; + Nếu Xz,l ⊆ Ei,j thỏa mãn: (z=i) ∨ (z=j) ∨ (l=j) ∨ (l=i) tăng số đếm s- oa nl w lên đơn vị (s- = s- + 1); d + Tính số phần tử chứa Xz,l theo cơng thức: an lu Count(Xz,l) = (1 + √1 + 8s − )/2 u nf va + Tính độ chắn cho Mz,l: confd (Mz,l) = s+/s- ll - Nếu supt(Mz,l) ≥ Minsup confd (Mz,l) ≥ Minconfd m oi SCAR = SCAR ∪ Mz,l z at nh - Tỉa luật: Mz,l ⊆ Mi,j với Mz,l, Mi,j ∈ SCAR loại Mz,l khỏi tập SCAR 3.3.2 Xác định luật kết hợp thu z m co l bảng tổng hợp sau: gm @ Sau thực phép tính tốn theo thuật tốn cải tiến trên, ta thu va http://lrc.tnu.edu.vn n Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN an Lu Bảng 3.3.Bảng tổng hợp ac th si 49 s+ count supt (Thannhiet,sotnhe),Y 33% (Thannhiet,sotcao),Y 33% (Ơnlanh,ret),Y 33% (Ơnlanh,ret),N 33% (đau đầu,dau dội),Y 33% 33% Mục luật lu an n tn to confd 50% 100% (Ơnlanh,ret) 50% (Ơnlanh,ret) 50% 100% 3 67% sotnhe) (Thannhiet, sotcao) (Đau đầu, đaududoi) (Thannhiet,sotn he),(Ơnlanh,ret) Như Minsup = 30% Minconfd = 60% ta thấy có mục p ie gh lanh,ret),N count (Thannhiet, va (Thannhiet,sotnhe),(Ơn s- Condset w luật sau vừa phổ biến xác: oa nl  (Thannhiet, sotnhe) → không bị cúm d  (Ơnlanh, ret) → không bị cúm lu va an  (Thannhiet, sotcao) → bị cúm ll u nf  (đauđau, đaududoi) → bị cúm oi m z at nh z m co l gm @ an Lu va http://lrc.tnu.edu.vn n Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN ac th si 50 3.3.3 Một số giao diện chương trình thử nghiệm lu an n va p ie gh tn to d oa nl w Hình 3.1 Giao diện chương trình thử nghiệm ll u nf va an lu oi m z at nh z m co l gm @ an Lu Hình 3.2 Giao diện chương trình thử nghiệm va http://lrc.tnu.edu.vn n Số hóa Trung tâm Học liệu Cơng nghệ thông tin – ĐHTN ac th si 51 3.4 Đánh giá chương trình thử nghiệm Chương trình thử nghiệm với tập mẫu học đưa vào file Excel: Tuan1.xlsx với liệu thu thập từ bệnh nhân bệnh viện đa khoa TW Thái Nguyên cho kết tốt, với kết luận bác sĩ bệnh viện đa khoa TW Thái Nguyên 3.5 Mở rộng toán Mẫu học mở rộng với 50 bệnh nhân 13 thuộc tính đặc trưng thuộc tính phân lớp (cúm) [2] lu Bảng 3.4 Bảng mẫu học (mở rộng) đầu vào an n va table1 tn to Be nh Dau Da Than Onl Chon Met gh nl Có Cao Có Khơn oa g d ng w B0 Khô hong ocmui tmui n chay m an Dau Chaynu Nghe No Tieu Cu p ie nh dau uco nhiet anh gmat moi Ho Có Có Có Khơng Khơn Kh Khơn g ơng g Có Khơng Khơn Kh Khơn Kh g ơng g g Có Có Kh ơng Khơ Kh Khơng Có Khơng ơng Khơn g Có Có g Có Khơn Kh g ơng Kh Khơn Kh ơng g ơng va http://lrc.tnu.edu.vn n Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN ơng an Lu ng ơng Có m co ng Khơn Kh Khơn Có l g Khơ Có gm thườn Có Có Có ơng @ ơng ng Cao Có Bình Khơng z Có Kh Có z at nh B0 ng ông Rất Khô cao g Kh oi g Có m B0 Khơ Kh Khơn ll Có Có thườn Có u nf B0 ơng Bình va Có Kh an lu B0 ac th si 52 table1 Be nh Dau Da Than Onl Chon Met nh dau uco nhiet anh gmat moi Ho Dau Chaynu Nghe No Tieu Cu hong ocmui tmui n chay m an B0 Khô ng B0 Khô lu an n va B0 Có Có Cao Có Kh ơng ie gh B0 Khơ Cao Có d Có ng Kh ơng ng Có ông Khôn Có g Có Có Không Có Có Có Khơng Có Có Có Có Có Có Có Có Có Có g Bình g Có Có Có Kh Khơn ơng ông ông Có ng Có Có ông Có Có g g Khơn g Có Có Có Có Khơng ơng ơng Có g Khơn g ơng Có va http://lrc.tnu.edu.vn n Số hóa Trung tâm Học liệu Cơng nghệ thơng tin – ĐHTN Có g Kh Khơn Kh an Lu g g m co ng ông ng g Kh Khôn l Khơ Khơn Khơ Kh Khơ Có Khơn Kh Khơn Kh gm Có Có Cao ng Có @ g Khơ Khơn z Có Có thườn ng Có z at nh g Khơ oi thườn m ng ơng Bình g Khơn Kh Khơn Có Có Có ll Khơ Có Khơ Kh Khơn Có u nf B1 g Có Có Có va g an B1 g lu Có Có Cao B1 Khơ Kh Khơn ng oa Có Có Cao nl B1 g Khơ Khơn w Khơn ng B1 ng Có Có Có Khơ Khơn Có Cao p Có ng tn to ng Khơ Có Cao ac th si 53 table1 Be nh Dau Da Than Onl Chon Met nh dau uco nhiet anh gmat moi Ho Dau Chaynu Nghe No Tieu Cu hong ocmui tmui n chay m an B1 Khô B1 lu an va n B1 Rất Có Có Có Bình Kh ơng thườn oa g Có Có Cao Có Khơn d g Khơn Có Có Cao Có u nf va an lu nl B2 Khơn w Có Có Cao Có g B1 Có ng g p g Khơ Khơn ie B1 Khơn Có cao gh tn to ng Có Cao Có g Khơn Có Có Có Có Có Có Có Khơng Có Có Kh ông Kh ông Có Không Có Có Có Có Có Có g Khơng ơng ng g Khơn g Có Có Khơn Kh Khơng Kh Khơ Khơn Có Có Có g ông Có Có Khôn g Có Khôn Kh g ông Có Có Khơn g Có Khơn Kh Khơn Kh g ông g ông ll thườn g Có Có Có Khô Khơn Khơ ng g ng Có Có Kh Khơn Kh ông g Khôn Kh Khôn Có g Không g ông Có Khơn Kh Khơn Kh g ơng g ơng va http://lrc.tnu.edu.vn n Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN ông an Lu ông Cao ơng Có m co Kh Có Khơng l Có Có Có gm B2 ng ơng cao g Kh @ ng Có z B2 Khơ Kh Rất Khơ Khơn z at nh ơng Bình oi Có Kh m B2 ac th si 54 table1 Be nh Dau Da Than Onl Chon Met nh dau uco nhiet anh gmat moi Ho Dau Chaynu Nghe No Tieu Cu hong ocmui tmui n chay m an B2 Khô Kh B2 lu an n va B2 Có Kh ông ie gh B2 Khô ng thườn ông g Có ng Khơng Có Có Có Khơng Có Có Có Có Khơ ng Khơ ng Có Có Có Có Có Khơn g Khơn Kh Khơn g Khơng Có Khơng Có Có Có ơng g Kh Khơn ơng Có Kh ơng g Khơn g Có Có Có Có Có Có ng g Có ll Kh Khơ Khơn Kh Khơn Kh Có ông ng g ông g ông oi m g Khô Khơn u nf thườn va Bình an ơng Khơn Có Có Có lu Kh g g Khơ d Có Kh oa B2 Có nl Có ng Bình w B2 Có Khơ Khơn Cao cao p g ng Rất Có Khơn Khơ Có Có Cao tn to ng ơng Cao Có Có Có Cao Khơ Khơn Khơ Kh ng cao Có Khơn g Có ơng ng Kh Khô ông ng Không g Khôn g Không Khôn Có Có Có Kh ơng Kh ơng Khơn Kh g ông va http://lrc.tnu.edu.vn n Số hóa Trung tâm Học liệu Cơng nghệ thơng tin – ĐHTN g Có Có an Lu ng Rất Kh Khơ Khơn m co Có Có l B3 Khơ ng Có gm ng ơng cao Khơng @ ng ơng Có z B3 Khô Kh Rất Khô g z at nh B3 ac th si 55 table1 Be nh Dau Da Than Onl Chon Met nh dau uco nhiet anh gmat moi Ho Dau Chaynu Nghe No Tieu Cu hong ocmui tmui n chay m an B3 Khô Kh B3 lu an va n B3 Có Kh ơng Có Cao Có Có Có Có Có Có Có Có Có thườn Có p Rất d Có oa cao g Có Có Khơn u nf Có g g Khơng Có Có Có Có Khơng Có va ng ơng cao an B3 Khơ Kh Rất Khơn Khơn Kh Khơn Kh Có lu ng Có Khơng Có nl B3 Khơ cao w Rất Có Có Có Có g ie B3 ng ơng Bình gh tn to ng ơng Khơ Kh Cao Có Có Kh ơng Kh Khơ Khơng ơng ng Kh Khô Không ông ng ông g Kh Khôn ông Có g Khôn g Khôn Kh Khôn g ông Khơn g Khơn g g Có Có Có Có ơng Có Có Có Kh ơng Kh ơng ll Có Rất ng Có Có Có Có Có Khơng Khơn g Có Kh ơng ơng Khơn Kh Có Có Có Kh ơng Có Có Có Có Kh Khơn Có Khơng g Có va http://lrc.tnu.edu.vn n Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN Khôn ông an Lu B4 Có Có Cao Khơ Khơn Có Có Khơ g g m co cao Khô g l ông Cao ng gm ng Kh g @ B4 Khô Khơn Kh Khơn Có z Có ng Có Có z at nh B4 Có Có Cao oi Khơ Khôn Khô m B3 ac th si 56 table1 Be nh Dau Da Than Onl Chon Met nh dau uco nhiet anh gmat moi Ho Dau Chaynu Nghe No Tieu Cu hong ocmui tmui n chay m an B4 ng Có Có Cao Có lu an va B4 n Có Bình Kh ơng thườn g ng Khơn g Khơ Khơn ng g Có Có Có tn to g Có ie gh B4 Khơ Kh Rất ng ơng cao p w Bình nl B4 Khơ Kh ng ơng g ng g ơng Kh ơng Có Khơng Có Khơng Kh Khơ Khơng ơng ng Có Có Có Khơng g Kh Khơn Có ơng Khơn g Khơn g g Có Có Có Có Kh ơng Khơn Kh g ông Kh Khôn Kh Có ông g ông an lu Khơ Khơn Khơ ng u nf Có Có Cao va Khơ Khơn d B4 thườn oa Có Kh ông Có Có g ng Có Có Khôn Kh Khôn Có ơng Khơng Có Có Khơng Có g Có ll g Kh Rất Khôn Khô Kh g ng ng ông Có Khơng g Kh Khơn ơng Khơn g Khơn g Có Có m co ng ơng Khơ l Cao Có g Có Có gm B5 Khơ Kh Khơn ông Có @ ông cao Có Kh z Có cao Có z at nh B4 Rất oi Có Có m B4 Có Có Kh ơng an Lu va http://lrc.tnu.edu.vn n Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN ac th si 57 Sau mã hóa, có: Bảng 3.5 Bảng mẫu học mở rộng số hóa table1 Benh Dau Da Than Onl Chon Met H Dau Chaynu Nghe nhan dau uco nhiet anh gmat moi o hong ocmui tmui N o n Tieu chay C u m 1 1 0 0 B02 0 1 0 0 B03 1 1 1 1 0 B04 0 1 1 0 0 B05 0 0 1 0 0 1 1 1 1 0 1 1 1 1 1 1 1 1 0 1 0 1 0 0 1 1 1 0 n va nl an w lu B01 gh tn to B06 p ie B07 oa B10 1 an B11 1 va u nf 1 1 1 1 B12 0 0 ll 1 1 0 0 B13 1 0 0 1 0 B14 1 0 1 1 B15 1 1 1 1 B16 1 1 1 1 0 1 B17 0 0 1 l 0 B18 1 1 1 0 1 lu oi z at nh z gm @ m co B09 m d B08 an Lu va http://lrc.tnu.edu.vn n Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN ac th si 58 table1 Benh Dau Da Than Onl Chon Met H Dau Chaynu Nghe nhan dau uco nhiet anh gmat moi o hong ocmui tmui N o n Tieu chay C u m 1 1 1 1 1 B20 1 1 0 0 0 B21 0 0 1 0 B22 0 1 1 1 0 B23 1 0 1 0 0 B24 0 1 1 1 1 B25 1 1 1 0 0 1 0 1 0 0 1 1 0 1 nl 0 1 1 1 1 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 1 1 0 1 1 0 lu B19 an n va B27 B28 B29 B30 1 an B31 0 u nf B32 1 m B33 0 1 B34 1 1 B35 1 1 @ B36 1 1 1 B37 1 1 0 m co 1 B38 0 1 0 0 1 p ie gh tn to B26 w d oa lu va ll oi z at nh z l gm an Lu va http://lrc.tnu.edu.vn n Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN ac th si 59 table1 Benh Dau Da Than Onl Chon Met H Dau Chaynu Nghe nhan dau uco nhiet anh gmat moi o hong ocmui tmui N o n C Tieu chay u m 1 0 1 0 B40 1 1 1 0 B41 1 1 1 1 B42 1 0 1 1 0 B43 1 1 1 0 B44 0 0 1 0 1 B45 0 1 1 0 0 0 0 0 1 1 0 0 1 0 nl 1 1 1 1 1 1 0 0 1 0 0 1 lu B39 an n va B47 B48 1 B49 B50 p ie gh tn to B46 w d oa an lu ll u nf va z at nh số) oi m Bảng mẫu học mở rộng lưu EXCEL: Tuan2.xlsx (dạng chữ Từ kết phần mềm cho thấy thuật toán cải tiến dựa luật kết z hợp phân lớp trình bày [5] đưa kết giảm nửa m co l gm @ số phép tính q trình tính tốn an Lu va http://lrc.tnu.edu.vn n Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN ac th si 60 KẾT LUẬN Kết đạt Luận văn “ Nghiên cứu số phương pháp tìm luật kết hợp phân lớp tập mẫu học áp dụng vào chẩn đoán bệnh” đạt kết sau:  Chương giới thiệu tổng quan “ Khai phá liệu” số vấn đề như: khái niệm, phương pháp khai phá liệu, ứng dụng khai phá liệu Khái niệm phân lớp liệu, bước tiến hành phân lớp, kiểu lu phương pháp phân lớp liệu an va  Chương giới thiệu số phương pháp tìm luật kết hợp phân n lớp dựa tập mẫu học, phương pháp phân lớp, bước tiến hành phân lớp gh tn to dựa luật kết hợp Chương giới thiệu thuật toán xây dựng p ie phân lớp dựa luật kết hợp, thuật toán cổ điển CBA-RG, CBA-CB thuật toán cải tiến giúp giảm nửa số phép tính thực tốn oa nl w  Chương mơ tả tốn áp dụng thuật tốn cải tiến vào chuẩn đoán d bệnh cúm bệnh viện đa khoa TW Thái Nguyên, quy trình chuẩn đốn an lu xác định bệnh, thơng tin tình trạng bệnh nhận thu thập lưu vào u nf va file Excel làm liệu đầu vào toán Cuối chương phần giới thiệu ll kết xây dựng phần mềm chuẩn đoán bệnh cúm kết thu sau oi m nhập liệu z at nh Vì khai phá liệu dựa luật kết hợp nói riêng khai phá liệu nói chung vấn đề rộng lớn, nên hẳn nghiên cứu nhỏ e z gm @ cịn nhiếu thiếu sót, phần thực nhiệm dạng thử nghiệm thuật tốn cần cải thiện thêm trở thành sản phẩm thực tiễn Em mong nhận l Em xin chân thành cảm ơn! m co góp ý thầy bạn để đề tài ngày hoàn thiện va http://lrc.tnu.edu.vn n Số hóa Trung tâm Học liệu Cơng nghệ thông tin – ĐHTN an Lu Hướng nghiên cứu ac th si 61 Tiếp tục hoàn thiện phần mềm để trở thành phần mềm thực tiễn Nghiên cứu áp dụng thuật toán, xây dựng phần mềm chuẩn đoán bệnh khác lu an n va p ie gh tn to d oa nl w ll u nf va an lu oi m z at nh z m co l gm @ an Lu va http://lrc.tnu.edu.vn n Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN ac th si 62 TÀI LIỆU THAM KHẢO A-Tiếng Việt [1] Nguyễn Khắc Giáo (2013), Khai thác luật kết hợp từ sở liệu giao dịch siêu thị bán lẻ, Luận văn Thạc sĩ Công nghệ thông tin, Đại học Công nghệ, Đại học Quốc gia Hà Nội [2].Nguyễn Đăng Nguyên (2017), Phương pháp xây dựng định dựa tập phụ thuộc hàm xấp xỉ, Luận văn Thạc sĩ Khoa học máy tính, Đại học Cơng nghệ thơng tin truyền thông – Đại học Thái Nguyên lu [3] Lê Văn Phùng (2018), Cơ sở liệu quan hệ cơng nghệ phân an tích –thiết kế , Tái lần 1, Nhà xuất Thông tin truyền thông va n [4] Lê Văn Phùng - Quách Xuân Trưởng, Khai phá liệu (2017), tái ie gh tn to lần 1, Nhà xuất Thông tin truyền thông [5] Phạm Hạ Thủy (2006), Một số vấn đề liên quan đến tệp liệu p hệ thống sở liệu, Luận án tiến sĩ, Viện CNTT, Viện Hàn lâm Khoa học oa nl w công nghệ Việt Nam B-Tiếng Anh d an lu [6] Han J and M Kamber (2006), Data Mining-Concepts and u nf va Techniques (Second Edition) Morgan Kaufmann Publishers [7] B.Liu (1998), integrating classification and association mining, in ll oi m proc Conf Knowledge discover and data mining p 80-86 nework) z at nh [8] Kwok wa Lam (2004) building decision trees using functional dependencies, proceeding of the international conference on information z gm @ technology: coding and computing) [9] ZijianZheng (1996), Constructing New Attributes for Dacision Tree l Sydney) m co Learning, The thesis for the degree of Doctor of Philosophy, The University of an Lu va http://lrc.tnu.edu.vn n Số hóa Trung tâm Học liệu Công nghệ thông tin – ĐHTN ac th si

Ngày đăng: 21/07/2023, 09:14

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w