Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 77 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
77
Dung lượng
1,54 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO UBND TỈNH THANH HÓA TRƢỜNG ĐẠI HỌC HỒNG ĐỨC n PHẠM TRUNG DŨNG NGHIÊN CỨU ỨNG DỤNG KỸ THUẬT KHAI PHÁ DỮ LIỆU HỖ TRỢ CƠNG TÁC CHẨN ĐỐN BỆNH TẠI BỆNH VIỆN ĐA KHOA TỈNH THANH HĨA LUẬN VĂN THẠC SĨ CƠNG NGHỆ THƠNG TIN THANH HĨA, NĂM 2020 BỘ GIÁO DỤC VÀ ĐÀO TẠO UBND TỈNH THANH HÓA TRƯỜNG ĐẠI HỌC HỒNG ĐỨC PHẠM TRUNG DŨNG NGHIÊN CỨU ỨNG DỤNG KỸ THUẬT KHAI PHÁ DỮ LIỆU HỖ TRỢ CƠNG TÁC CHẨN ĐỐN BỆNH TẠI BỆNH VIỆN ĐA KHOA TỈNH THANH HÓA LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Chuyên ngành: Khoa học máy tính Mã số: 8.48.01.01 Ngƣời hƣớng dẫn khoa học: TS Nguyễn Thế Cƣờng THANH HÓA, NĂM 2020 Danh sách Hội đồng đánh giá luận văn Thạc sĩ khoa học (Theo Quyết định số: 1320/QĐ-ĐHHĐ ngày tháng năm 2020 Hiệu trưởng Trường Đại học Hồng Đức) Học hàm, học vị, Họ Tên Cơ quan công tác Chức danh Hội đồng PGS,TS Hoàng Văn Dũng Trường ĐHSP KT HCM TS Trần Quang Diệu Học viện CTQG HCM Phản biện PGS.TS Vũ Việt Vũ Trường ĐHQG Hà Nội Phản biện PGS.TS Phạm Thế Anh Trường ĐH Hồng Đức Ủy viên TS Trịnh Viết Cường Trường ĐH Hồng Đức Thư ký Xác nhận Ngƣời hƣớng dẫn Học viên chỉnh sửa theo ý kiến Hội đồng Ngày tháng năm 2020 TS Nguyễn Thế Cƣờng i Chủ tịch LỜI CAM ĐOAN Tôi xin cam đoan: Những nội dung luận văn thực hướng dẫn người hướng dẫn Mọi tham khảo dùng luận văn trích dẫn rõ ràng tên tác giả, tên cơng trình, thời gian, địa điểm cơng bố Mọi chép không hợp lệ, vi phạm quy chế đào tạo, tơi xin chịu hồn tồn trách nhiệm Tác giả Phạm Trung Dũng ii LỜI CẢM ƠN Để hoàn thành luận này, nhận hướng dẫn tận tình, giúp đỡ chu đáo TS Nguyễn Thế Cường – Phó trưởng khoa Cơng nghệ Thơng tin Truyền thơng, xin tỏ lịng biết ơn sâu sắc đến thầy Qua xin chân thành cảm ơn Ban Giám hiệu, Phịng Đào tạo sau đại học, Khoa Cơng nghệ Thông tin Truyền thông Trường Đại học Hồng Đức - Tỉnh Thanh Hóa giúp đỡ, tạo điều kiện thuận lợi cho tơi hồn thành luận văn Về phía Bệnh viện Đa khoa tỉnh Thanh Hóa, tơi xin trân trọng cảm ơn TS.BS Lê Văn Cường – Phó Giám đốc bệnh viện, Ths.BS Lê Duy Long khoa Hồi sức tích cực hỗ trợ tơi mặt chuyên môn Tôi xin gửi lời cảm ơn tới tất người thân gia đình, bạn bè đồng nghiệp động viên, giúp đỡ tơi suốt q trình học tập thực luận văn Tôi xin trân trọng cảm ơn! iii MỤC LỤC LỜI CAM ĐOAN LỜI CẢM ƠN iii MỤC LỤC iv DANH MỤC CÁC TỪ VIẾT TẮT iv DANH MỤC CÁC HÌNH vii DANH MỤC CÁC BẢNG BIỂU viii MỞ ĐẦU 1 Lý chọn đề tài: Mục tiêu nghiên cứu: Đối tượng phạm vi nghiên cứu: Phương pháp nghiên cứu: 5 Ý nghĩa đề tài: Cấu trúc luận văn: CHƢƠNG 1: TỔNG QUAN VỀ BỆNH VIỆN ĐA KHOA TỈNH THANH HOÁ 1.1 Tổng quan Bệnh viện Đa khoa Tỉnh Thanh Hoá 1.2 Quy trình khám chữa bệnh bệnh viện Đa khoa Tỉnh Thanh Hoá 10 1.3 Nhu cầu việc ứng dụng công nghệ thông tin hỗ trợ khám chữa bệnh 13 1.4 Kết luận chương 15 CHƢƠNG 2: CÁC KỸ THUẬT KHAI PHÁ DỮ LIỆU TRONG Y TẾ 16 2.1 Tổng quan khai phá liệu 16 2.2 Các kỹ thuật khai phá liệu điển hình 17 2.2.1 Các công cụ khai phá liệu 18 2.2.2 Các kỹ thuật khai phá liệu 19 2.3 Khai phá liệu y khoa 23 2.4 Các nghiên cứu liên quan hệ hỗ trợ chẩn đoán bệnh 25 2.5 Khai phá liệu sử dụng định 29 iv 2.5.1 Tổng quan định 29 2.5.2 Khai phá liệu định 33 2.5.3 Ưu điểm nhược điểm định 39 2.6 Kết luận chương 40 CHƢƠNG 3: MƠ HÌNH CHẨN ĐỐN BỆNH SUY TIM 42 3.1 Tổng quan bệnh suy tim 42 3.2 Các yếu tố lâm sàng liên quan 42 3.2.1 Triệu chứng lâm sàng 42 3.2.2 Tiếp cận chẩn đoán suy tim 44 3.2.3 Tiếp cận chẩn đốn suy tim mạn tính theo Hội tim mạch Châu Âu (ESC 2016) 46 3.3 Xây dựng định hỗ trợ chẩn đoán suy tim 49 3.4 Thu thập liệu huấn luyện 50 3.5 Xây dựng định với phần mềm WEKA 53 3.5.1 Các tính Weka 54 3.5.2 Trích chọn thuộc tính 55 3.5.3 Xây dựng liệu huấn luyện WEKA 56 3.6 Kết luận chương 62 KẾT LUẬN 63 Kết đạt 63 Hạn chế 63 Hướng phát triển 63 DANH MỤC TÀI LIỆU THAM KHẢO 65 v DANH MỤC CÁC TỪ VIẾT TẮT BHYT Bảo hiểm y tế BNN Mạng nơ-ron Bayer BPNN Mạng nơ-ron lan truyền CDS Hỗ trợ định lâm sàng CDSS Hệ thống hỗ trợ định lâm sàng CNTT Công nghệ thông tin CTDL Cấu trúc liệu DMKT Danh mục kỹ thuật IHD Thiếu máu cục KPDL Khai phá liệu NYHA Hội tim mạch NewYork RBF Radial Basic Function SVM Máy vector hỗ trợ vi DANH MỤC CÁC HÌNH Hình 1.1 Sơ đồ tổ chức máy hoạt động Bệnh viên Đa khoa Tỉnh Hình 1.2 Sơ đồ quy trình khám chữa bệnh bệnh viên Đa khoa Tỉnh Thanh Hoá 12 Hinh Các bước Datamining[22] 17 Hinh 2 Ví dụ phân cụm liệu 21 Hình 3.1 Quy trình chẩn đoán suy tim[2] 46 Hình Mẫu liệu thu nhận từ hệ thống quản lý khám chữa bệnh Bệnh viện Đa khoa Tỉnh Thanh Hóa năm 2020 51 Hình 3.3 Cơng cụ ArffViewer cho phép chuyển đổi tệp liệu từ csv thành arff 57 Hình 3.4 Dữ liệu đọc ArffViewer 57 Hình 3.5 Kết đánh giá mơ hình theo phương pháp Percentage Split 60 Hình 3.6 Kết đánh giá mơ hình theo phương pháp K-folds (với K=10) 60 Hình 3.7 Mơ hình định dùng để chấn đoán bệnh suy tim bệnh viện Đa khoa Tỉnh Thanh hóa 61 vii DANH MỤC CÁC BẢNG BIỂU Bảng 3.1 Phân loại mức độ suy tim theo NYHA 49 Bảng Bảng liệu lọc thông tin khơng cần thiết cho q trình xây dựng định 52 Bảng 3 Mẫu liệu mã hóa 53 Bảng 3.4 Kết thu từ liệu huấn luyện 61 viii A1 B2 C2 D2 SUY_TIM_1 A1 B2 C3 D1 SUY_TIM_1 A4 B1 C1 D2 SUY_TIM_4 A3 B1 C2 D1 SUY_TIM_3 A1 B2 C2 D2 SUY_TIM_1 A1 B2 C2 D1 SUY_TIM_1 A1 B2 C3 D1 SUY_TIM_1 Bảng 3 Mẫu liệu mã hóa 3.5 Xây dựng định với phần mềm WEKA Weka (Waikato Environment for Knowledge Analysis) phần mềm khai thác liệu thuộc dự án nghiên cứu đại học Waikato năm 1993, New Zealand Mục tiêu xây dựng công cụ đại nhằm phát triển kỹ thuật máy học áp dụng chúng vào toán khai thác liệu thực tế Weka chứa công cụ phục vụ cho tiền xử lý liệu, phân loại, hồi quy, phân cụm, luật liên quan trực quan hóa Phần mềm có khả chạy nhiều hệ điều hành khác Windows, Mac, Linux Sau phiên WEKA năm 1993 năm 1997, Đại học Waikato định xây dựng lại WEKA từ đầu ngơn ngữ Java có cài đặt thuật tốn mơ hình hóa Đến năm 2005, WEKA nhận giải thưởng SIGKDD Data Mining and Knowledge Discovery Service Award WEKA chia sẻ rộng rãi website http://www.cs.waikato.ac.nz/~ml/weka/index.html Hiện tại, phiên ổn định Weka Weka 3.8 Ngồi ra, Đại học Waikato cịn cung cấp phiên phát triển Weka 3.9 Đối với phiên bản, Weka cung cấp đầy đủ phiên cho hệ điều hành Windows, Mac OS X, Linux Để chạy phiên Weka cụ thể máy tính phải cài phiên Java.Với Weka 3.8 tại, máy tính cần cài đặt phiên Java 1.7 trở lên WEKA xây dựng ngôn ngữ Java, cấu trúc gồm 600 lớp, tổ chức thành 10 packages, package thực nhiệm vụ trình khai phá liệu Các lớp, packages mô tả cách chi tiết 53 tài liệu hướng dẫn sử dụng nhà cung cấp Giao diện đồ họa người sử dụng WEKA phát triển theo hướng trực quan dễ sử dụng 3.5.1 Các tính Weka Những tính vượt trội Weka kể đến là: - Mã nguồn mở; - Khảo sát liệu: tiền xử lý liệu, phân lớp, gom nhóm liệu khai thác luật kết hợp; - Thực nghiệm mơ hình: cung cấp phương tiện để kiểm chứng, đánh giá mơ hình học; - Hỗ trợ thuật tốn học máy (machine learning) khai phá liệu; - Biểu diễn trực quan liệu nhiều dạng đồ thị khác nhau; - Trực quan hóa, dễ dàng xây dựng ứng dụng thực nghiệm; - Do sử dụng JVM nên Weka độc lập với mơi trường Mơi trường Weka bao gồm: Hình 7: Giao diện phần mềm WEKA 54 - Explorer: Môi trường cho phép tiến hành khai phá liệu với tính tiền xử lý liệu (Preprocess), phân lớp (Classify), phân cụm (Cluster), khai thác luật kết hợp (Associate) Ngồi ra, cịn cung cấp thêm tính hỗ trợ lựa chọn thuộc tính (Select attributes) mơ hình hóa liệu (Visualize) - Experimenter: cho phép tiến hành thí nghiệm thực kiểm tra thống kê mơ hình học máy; - KnowledgeFlow: Mơi trường hỗ trợ tính giống Explorer với giao diện kéo thả để hỗ trợ học tập gia tăng - SimpleCLI: Cung cấp giao diện dòng lệnh đơn giản cho phép thực thi trực tiếp lệnh WEKA cho hệ điều hành không cung cấp giao diện dịng lệnh riêng - Workbench: Mơi trường kết hợp môi trường nêu trên, người sử dụng tùy ý chuyển đổi mà không cần phải quay lại cửa sổ “Weka GUI Chooser” 3.5.2 Trích chọn thuộc tính Trích chọn thuộc tính nhiệm vụ quan trọng giai đoạn tiền xử lý liệu triển khai mơ hình khai phá liệu Một vấn đề gặp phải dataset dùng để xây dựng Data mining Models thường chứa nhiều thông tin không cần thiết cho việc xây dựng mơ hình Chẳng hạn, dataset gồm hàng trăm thuộc tính dùng để mơ tả khách hàng doanh nghiệp thu thập, nhiên xây dựng Data mining model cần khoảng 50 thuộc tính từ hàng trăm thuộc tính Nếu ta sử dụng tất thuộc tính (hàng trăm) khách hàng để xây dựng mơ hình ta cần nhiều CPU, nhiều nhớ trình Training model, chí thuộc tính khơng cần thiết làm giảm độ xác mơ hình gây khó khăn việc phát tri thức Các phương pháp trích chọn thuộc tính thường tính trọng số (score) thuộc tính sau chọn thuộc tính có trọng số tốt để 55 sử dụng cho mơ hình Các phương pháp cho phép bạn hiệu chỉnh ngưỡng (threshold) để lấy thuộc tính có Score ngưỡng cho phép Q trình trích chọn thuộc tính ln thực trước q trình Training Model Có nhiều phương pháp để lựa chọn thuộc tính tùy thuộc vào cấu trúc liệu dùng cho mơ hìnhvà thuật tốn dùng để xây dựng mơ hình Sau số phương pháp phổ biến dùng trích chọn thuộc tính: - Interestingness score: Được sử dụng để xếp hạng (rank) thuộc tính thuộc tính có kiểu liệu liên tục (continuous) - Shannon's Entropy: Được sử dụng liệu kiểu rời rạc (discretized data) Ngồi cịn có số phương pháp khác thường sử dụng lựa chọn thuộc tính Bayesian with K2 Prior, Bayesian Dirichlet Equivalent with Uniform Prior 3.5.3 Xây dựng liệu huấn luyện WEKA Dữ liệu lưu dạng xlsx chuyển đổi thành định dạng csv để thuận lợi cho việc tạo tệp arff loại định dạng dùng WEKA Sau chuyển đổi thành định dạng ARFF, công cụ ArffViewer cung cấp WAKA 56 Hình 3.3 Cơng cụ ArffViewer cho phép chuyển đổi tệp liệu từ csv thành arff Hình 3.4 Dữ liệu đọc ArffViewer Sau liệu lưu dạng arff Tên tệp liệu @relation TrainedData_500 Danh sách thuộc tính giá trị thuộc tính rời rạc hóa @attribute KHO_THO {A1,A3,A4,A2} 57 @attribute proBNP {B1,B2} @attribute RAN_PHOI {C1,C3,C2} @attribute PHU_CHAN {D1,D2} @attribute BENH_TIM {KHONG_SUYTIM,SUY_TIM_1,SUY_TIM_3, SUY_TIM_4,SUY_TIM_2} Dữ liệu sử dụng xây dựng định @data A1,B1,C1,D1,KHONG_SUYTIM A1,B2,C3,D1,SUY_TIM_1 A1,B2,C2,D2,SUY_TIM_1 A1,B1,C1,D2,KHONG_SUYTIM A1,B2,C2,D2,SUY_TIM_1 A1,B2,C2,D2,SUY_TIM_1 A1,B2,C2,D2,SUY_TIM_1 A1,B2,C3,D1,SUY_TIM_1 A1,B2,C2,D2,SUY_TIM_1 A1,B2,C2,D1,SUY_TIM_1 A1,B2,C3,D1,SUY_TIM_1 A1,B2,C3,D1,SUY_TIM_1 A1,B2,C2,D2,SUY_TIM_1 A1,B2,C3,D1,SUY_TIM_1 Như thấy trên, tập tin ARFF gồm 02 phần riêng biệt Phần thứ gọi phần mơ tả Nó chứa thơng tin về: tên quan hệ, thuộc tính quan hệ dạng liệu thuộc tính Phần thứ hai phần liệu Nó bắt đầu với từ khóa “@data” dịng riêng biệt Sau thể (instance) thể dòng Giá trị thuộc tính thể phân cách dấu “,” Giá trị thuộc tính xuất theo thứ tự khai báo phần mô tả Các giá trị bị thiếu thể “?” Tên quan hệ khai báo dòng tập tin với cú pháp: @relation Một thuộc tính khai báo với cú pháp: 58 @attribute Tên quan hệ tên thuộc tính chuỗi ký tự khơng bắt đầu ký tự đặc biệt “{”, “}”, “,”, “%” đặt dấu nháy đơn nêu chứa khoảng trắng Tập tin ARFF định nghĩa thuộc tính theo kiểu chính: - Thuộc tính dạng số: @attribute math numeric - Thuộc tính dạng chuỗi: @attribute sentence string - Thuộc tính định danh: @attribute name {,,} - Thuộc tính dạng ngày tháng: @attribute birthday date "", định dạng ngày theo tiêu chuẩn ISO-8601 Ví dụ “yyyy-MM-dd HH:mm:ss” Đối với liệu đầu vào, cần lưu ý với thuộc tính có giá trị “0” thuộc tính chưa có giá trị (missing value) Thuộc tính có giá trị “0” khơng phải thuộc tính chưa có giá trị Những thuộc tính chưa có giá trị cần thể cách rõ ràng dấu “?” Sau tác giả sử dụng phân lớp J48 (là phiên C4.5 cài đặt WEKA) để thực việc kiểm thử tập liệu xây dựng Kết đánh giá mơ hình cho kết độ xác 97.561% lựa chọn chia tập liệu thành phần liệu huấn luyện 66% liệu test 34% Đối với việc đánh giá mơ hình theo phương pháp K-folds (k=10), kết đánh giá 98.75% 59 Hình 3.5 Kết đánh giá mơ hình theo phương pháp Percentage Split Hình 3.6 Kết đánh giá mơ hình theo phương pháp K-folds (với K=10) 60 Với mơ hình liệu xây dựng, ta có định sử dụng để chẩn đốn việc bệnh nhân có bị suy tim hay khơng có khả suy tim độ xây dựng hình vẽ sau Hình 3.7 Mơ hình định dùng để chấn đoán bệnh suy tim bệnh viện Đa khoa Tỉnh Thanh hóa Trong phần thực nghiệm, tác giả thực nhiều tập liệu có kích thước nhằm tăng cường đánh giá độ xác định việc hỗ trợ chẩn đoán bệnh suy tim Bệnh viện Đa khoa tỉnh Thanh Hóa Kết thu sau: STT Kích thƣớc liệu 500 1000 1500 2000 2500 10-Folds (%) 98.4 99.8 99.1 99.95 99.5 Percentage Split (%) 97.65 98.4 97.5 98.24 98.12 Bảng 3.4 Kết thu từ liệu huấn luyện Kết cho thấy độ xác dao động tăng số lượng ghi tăng giảm không đồng điều cho thấy kích thước liệu huấn luyện khơng ảnh hưởng đến độ xác định Việc độ xác dao động quy tụ 61 khoảng 98% cho phép hoàn toàn có sở để xây dựng hệ hỗ trợ chẩn đốn bệnh suy tim cách xác 3.6 Kết luận chƣơng Trong chương tác giả trình bày tổng quan bệnh suy tim, cách thức chẩn đoán bệnh dựa yếu tố lâm sàng liên quan Tác giả trình bày phương pháp thu nhận liệu để xây dựng mơ hình hỗ trợ chẩn đoán bệnh sử dụng định Bằng việc áp dụng phần mềm WEKA, tác giả xây dựng định để phục vụ công tác hỗ trợ chẩn đoán bệnh suy tim với tỉ lệ độ sác cao 98% 62 KẾT LUẬN Kết đạt đƣợc * Về mặt khoa học Luận văn tiến hành phân tích, tìm hiểu quy trình khám chữa bệnh bệnh viện Đa khoa Tỉnh Thanh Hóa, bệnh suy tim yếu tố liên quan đến bệnh suy tim Xây dựng sở liệu liên quan đến bệnh suy tim yếu tố lâm sàng ảnh hưởng đến chẩn đoán bệnh Nắm phương pháp mơ hình toán học, áp dụng để giải yêu cầu luận văn đặt Nghiên cứu vận dụng giải thuật C4.5 để xây dựng mơ hình dự đốn định * Về mặt thực tiễn Luận văn nêu giải pháp kỹ thuật để xây dựng mơ hình chẩn đốn bệnh suy tim bệnh nhân khám chữa bệnh bệnh viện Đa khoa Tỉnh Thanh Hóa Đã xây dựng định để hỗ trợ công tác khám chữa bệnh liên quan đến bệnh tim bệnh viên đa khoa Tỉnh Hạn chế Tuy nhiên, hạn chế kết : - Hệ thống xây dựng mang tính hỗ trợ chính; - Cịn nhiều yếu tốt ảnh hưởngđến bệnh suy tim mà liệu huấn luyện chưa thể hết được, dẫn đến kết chưa theo mong muốn Hiện tại, hệ thống chạy mơ hình phần mềm WEKA Hƣớng phát triển Cài đặt phần mềm hoàn chỉnh cách sử dụng tính Weka để xây dựng công cụ hỗ trợ khám chữa bệnh Tác giả hi vọng 63 phát triển mơ hình cơng cụ lập trình trực quan, xây dựng giao diện cập nhật liệu đưa kết luận trực quan với người dùng Tác giả muốn phát triển liệu huấn luyện lớn để tăng độ xác cho q trình chẩn đoán bệnh 64 DANH MỤC TÀI LIỆU THAM KHẢO Tài liệu Tiếng việt [1] Võ Hài An, Bùi Thị Hoàng Anh (2012), Xây dựng hệ chuyên gia hỗ trợ chẩn đoán bệnh y khoa, luận văn thạc sĩ, Đại học công nghệ thông tin – Đại học quốc gia thành phố Hồ Chí Minh [2] Bộ Y tế (2020), (Quyết định ban hành số 1762/QĐ-BYT), Hướng dẫn chẩn đoán điều trị suy tim mạn tính [3] Trần Thị Ngân, Nguyễn Thị Dung, Nguyễn Long Giang, Trần Mạnh Tuấn (2020), “Ứng dụng hệ suy diễn mờ phức hỗ trợ hẩn đoán bệnh xơ gan”, TNU Jounal of Science and Technology 225(06): 186191 [4] Nguyễn Văn Phi, Trần Văn Lăng, Phan Huy Anh Vũ, Nguyễn Tuấn Anh (2011), “Nghiên cứu giải pháp xây dựng bệnh án điện tử hỗ trợ chẩn đoán y khoa”, Một số vấn đề chọn lọc Công nghệ thông tin truyền thông, Cần Thơ, 7-8 tháng 10 năm 2011 [5] Tống Đức Phong (2004), Ứng dụng khai phá liệu xây dựng hệ hỗ trợ chẩn đoán y khoa, Luận văn thạc sĩ, Trường Đại học Hồng Bàng, thành phố Hồ Chí Minh [6] Văn Thế Thành, Trần Minh Bảo (2012), “Xây dựng hệ hỗ trợ định chẩn đốn bệnh”, Tạp chí khoa học, Đại học Huế, Tập 74A, Số , (2012), 129-139 [7] Hoàng Văn Tiến (2018), Khai phá liệu ứng dụng y tế dự phòng, Luận văn thạc sĩ, Đại học quốc gia Hà Nội, trường Đại học Công nghệ [8] Nguyễn Thu Trà (2006), Nghiên cứu áp dụng số kỹ thuật khai phá liệu với sở liệu ngành thuế Việt Nam, Luận văn thạc sĩ, trường Đại học Bách khoa Hà Nội 65 [9] Trịnh Quốc Việt (2017), Ứng dụng lý thuyết Bayes phân lớp để xây dựng hệ thống hỗ trợ chẩn đoán bệnh viêm phế quản, Luận văn Thạc sĩ, Trường Đại học Bách khoa Đà Nẵng [10] Phạm Hải Yến (2017), Khai phá liệu hồ sơ bệnh nhân ứng dụng hỗ trợ chẩn đoán bệnh bệnh viện Đa khoa y học cổ truyền Tuệ Tĩnh, Luận văn Thạc sĩ, Học viện Công nghệ Bưu viễn thơng Tài liệu Tiếng anh [11] Simut Bhatia, Praveen Prakash, G.N.Pillai (2018), “SVM Based decision support system for heart disease classification with Integer – Coded genetic Alforithm to select critical featues”, Proceedings of the world congress on Engineering and Computer science 2018 [12] Niti Guru, Anil Dahiya, Navin Rajpal “Decision Support in Heart Disease Diagnosis using neural network”, Delhi business review Vol 8, No.1 (January – June 2007) 13 [13] V Krishnaiah, G Narsimaha, N Subhash Chandra (2015), “Heart Disease Prediction System Using Data Mining Technique by Fuzzy KNN Approach”; Emerging ICT for Bridging the Future – Volume 1, Advances in Intelligent Systems and Computing 337 [14] Hlaudi Daniel Masethe, Mosima Anna Masthe (2014), “Prediction of heart disease using classification Algorithms”, Proceedings of the world congress on Engineering and Computer science 2014 Vol II [15] Sellappan Palaniappan, Rafia Awang (2008), “Intelligenr heart disease prediction system using data mining techniques”, International Journal of Computer sicience and netword security, VOL.8 No 8, August 2008 [16] Purushottam; Prof (Dr.) Kanak Saxena, Richa Sharma (2015), “Efficient Heart Disease Prediction System using Decision Tree”, International Conference on Computing, Automation (ICCCA2015) 66 Comminication and [17] Mrs.G.Subblakshmo, Mr.K.Rames, Mr.M.Chinna Rao (2011), “DecisionSupport in Heart Disease Prediction System using Naïve Bayes”, G.Subbalakshmi et al/ Indian Journal of Computer Science and Enghieering (IJCSE) Vol.2 No.2 Apr-May 2011 [18] Abhishek Taneja (2013), “Heart disease prediction system using data mining techniques”, Oriental hournal of computer science & technology, December 2013 [19] K Thenmozhi, P Deepika (2014), “Heart disease prediction using classification with difenrent decision tree techniques”, International Fournal of Engineering Research and General Science Volume 2, Issue 6, October-November 2014 Tài liệu Internet [20] https://bigdatauni.com/vi/tin-tuc/thuat-toan-cay-quyet-dinh-p-4-uukhuyet-diem-stopping-pruning-method.html [21] https://insight.isb.edu.vn/data-mining-la-gi-cac-cong-cu-khai-pha-dulieu/ [22] https://viblo.asia/p/cac-ky-thuat-khai-pha-du-lieu-ogBG2lprRxnL 67