Nghiên Cứu Một Số Thuật Toán Học Máy Và Ứng Dụng Trong Phân Loại Bệnh.pdf

69 2 0
Nghiên Cứu Một Số Thuật Toán Học Máy Và Ứng Dụng Trong Phân Loại Bệnh.pdf

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - PHẠM XUÂN THU NGHIÊN CỨU MỘT SỐ THUẬT TOÁN HỌC MÁY VÀ ỨNG DỤNG TRONG PHÂN LOẠI BỆNH LUẬN VĂN THẠC SĨ KỸ THUẬT (Theo định hướng ứng dụng) HÀ NỘI – 2021 HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - PHẠM XUÂN THU NGHIÊN CỨU MỘT SỐ THUẬT TOÁN HỌC MÁY VÀ ỨNG DỤNG TRONG PHÂN LOẠI BỆNH CHUYÊN NGÀNH: HỆ THỐNG THÔNG TIN MÃ SỐ: 8.48.01.04 LUẬN VĂN THẠC SĨ KỸ THUẬT (Theo định hướng ứng dụng) NGƯỜI HƯỚNG DẪN KHOA HỌC: TS VŨ VĂN THỎA HÀ NỘI – 2021 i LỜI CAM ĐOAN Tôi cam đoan công trình nghiên cứu riêng tơi Nội dung luận văn có tham khảo sử dụng tài liệu, thơng tin đăng tải tạp chí khoa học trang web liệt kê danh mục tài liệu tham khảo Tất tài liệu tham khảo có xuất xứ rõ ràng trích dẫn hợp pháp Tơi xin hồn tồn chịu trách nhiệm chịu hình thức kỷ luật theo quy định cho lời cam đoan Hà nội, ngày tháng Người cam đoan Phạm Xuân Thu năm 2021 ii LỜI CẢM ƠN Được đồng ý Học Viện Cơng Nghệ Bưu Chính Viễn Thơng, thầy giáo hướng dẫn TS Vũ Văn Thỏa, học viên thực đề tài luận văn tốt nghiệp Thạc sĩ: “Nghiên cứu số thuật toán học máy ứng dụng phân loại bệnh” Để hoàn thành luận văn này, học viên xin chân thành cảm ơn thầy cô giáo tận tình hướng dẫn, giảng dạy suốt trình học tập, nghiên cứu rèn luyện Học Viện Cơng Nghệ Bưu Chính Viễn Thơng Học viên xin đặc biệt gửi lời cảm ơn đến TS Vũ Văn Thỏa, người thầy trực tiếp hướng dẫn trình thực luận văn tốt nghiệp Nhờ động viên bảo tận tình thầy thời gian qua giúp học viên vượt qua khó khăn nghiên cứu để luận văn hoàn thành Học viên xin gửi lời cảm ơn tới gia đình, bạn bè đồng nghiệp, người bên cổ vũ tinh thần, tạo điều kiện thuận lợi để học viên học tập hồn thành tốt luận văn Học viên có nhiều cố gắng để thực luận văn cách hồn chỉnh Tuy nhiên, cịn nhiều hạn chế kiến thức kinh nghiệm nên tránh khỏi thiếu sót định mà học viên chưa thấy Học viên mong nhận góp ý quý Thầy, Cô giáo bạn đồng nghiệp để luận văn hoàn chỉnh Học viên xin trân trọng cám ơn! Hà Nội, ngày tháng năm 2021 Học viên Phạm Xuân Thu iii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN .ii MỤC LỤC iii DANH MỤC CÁC THUẬT NGỮ VIẾT TẮT v DANH MỤC BẢNG vi DANH MỤC HÌNH vii MỞ ĐẦU CHƯƠNG TỔNG QUAN VỀ BÀI TOÁN PHÂN LOẠI BỆNH VÀ HỌC MÁY 1.1 Giới thiệu toán phân loại bệnh vấn đề liên quan 1.1.1 Khái niệm phân lớp liệu toán phân loại bệnh 1.1.2 Quy trình thực phân loại bệnh 1.1.3 Các độ đo đánh giá mơ hình phân loại bệnh 1.1.4 Các ứng dụng toán phân loại bệnh 1.2 Tổng quan học máy 1.2.1 Khái niệm học máy phân loại kỹ thuật học máy 1.2.2 Ứng dụng học máy xây dựng mơ hình phân loại bệnh 1.3 Tổng quan học sâu 1.3.1 Khái niệm học sâu 1.3.2 Hướng tiếp cận học sâu 10 1.4 Kết luận chương 11 CHƯƠNG NGHIÊN CỨU THUẬT TOÁN CÂY QUYẾT ĐỊNH VÀ THUẬT TOÁN MÁY VECTOR HỖ TRỢ 13 2.1 Khảo sát thuật toán định vấn đề liên quan 13 2.1.1 Giới thiệu phương pháp 13 2.1.2 Khảo sát nội dung phương pháp 14 2.1.3 Đánh giá phương pháp 15 2.2 Khảo sát thuật toán máy vectơ hỗ trợ vấn đề liên quan 15 2.2.1 Giới thiệu phương pháp 15 2.2.2 Kỹ thuật SVM tuyến tính với tập liệu phân tách 18 iv 2.2.3 Kỹ thuật SVM tuyến tính với tập liệu không phân tách 21 2.2.4 Kỹ thuật SVM phi tuyến phân lớp nhị phân 24 2.2.5 Kỹ thuật tối thiểu SMO 27 2.2.6 Kỹ thuật SVM phân lớp đa lớp 27 2.2.7 Đánh giá phương pháp 29 2.3 Kết luận chương 29 CHƯƠNG THỰC NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ 31 3.1 Tổng quan xét nghiệm hóa nghiệm 31 3.1.1 Giới thiệu chung xét nghiệm hóa nghiệm 31 3.1.1 Đặc điểm liệu xét nghiệm hóa nghiệm 33 3.1.2 Thu thập liệu nghiên cứu 34 3.2 Bài toán phân loại bệnh dựa kết xét nghiệm hóa nghiệm 36 3.2.1 Đặt toán 36 3.2.2 Tiền xử lý liệu 36 3.2.3 Các kịch thử nghiệm 38 3.2.4 Công cụ thực nghiệm 39 3.3 Kết thực nghiệm đánh giá 40 3.3.1 Chuẩn bị liệu thực thử nghiệm 40 3.3.2 Kết thực nghiệm 43 3.3.3 Phân tích đánh giá kết thực nghiệm 49 3.4 Kết luận chương 53 DANH MỤC TÀI LIỆU THAM KHẢO 55 Tiếng Việt 55 Tiếng Anh 55 PHỤ LỤC 57 v DANH MỤC CÁC THUẬT NGỮ VIẾT TẮT Viết tắt Tiếng Anh Tiếng việt ANN Artificial Neural Network Mạng nơ-ron nhân tạo CNTT Information Technology Công nghệ thông tin CSDL Database Cơ sở liệu FN False Negative Số mẫu âm phân loại sai FP False Positive Số mẫu dương phân loại sai HL Training Huấn luyện KC Test Kiểm chứng KDD Knowledge Discovery and Data Phát tri thức khai phá Mining liệu SVM Support Vector Machines Máy véc tơ hỗ trợ SMO Sequential Minimal Optimization Tối thiểu TN True Negative Số mẫu âm phân loại TP True Positive Số mẫu dương phân loại WEKA Waikato Environment for Công cụ kiểm thử học máy Knowledge Acquisition vi DANH MỤC BẢNG Bảng 3.1: Số lượng bệnh nhân 35 Bảng 3.2: Phân bố số lượng mẫu nhóm theo kích cỡ mẫu 40 Bảng 3.3: Cơ cấu nhóm bệnh với số mẫu HL KC tương ứng 41 Bảng 3.4: Chi tiết tập tin liệu 42 Bảng 3.5: Kết phân lớp phương pháp SVM theo chiến lược 1/k với nhóm mẫu 43 Bảng 3.6: Kết phân lớp phương pháp SVM theo chiến lược 1/1 với nhóm mẫu 44 Bảng 3.7: Kết phân lớp theo định 44 Bảng 3.8: Bảng kết huấn luyện thuật tốn theo nhóm mẫu 44 Bảng 3.9: Bảng kết kiểm chứng thuật tốn theo nhóm mẫu 45 Bảng 3.10: Kết phân lớp phương pháp SVM theo chiến lược 1/k với nhóm mẫu 45 Bảng 3.11: Kết phân lớp phương pháp SVM theo chiến lược 1/1 với nhóm mẫu 46 Bảng 3.12: Kết phân lớp theo j48 .46 Bảng 3.13: Bảng kết huấn luyện thuật tốn theo nhóm mẫu 46 Bảng 3.14: Bảng kết kiểm chứng thuật tốn theo nhóm mẫu 47 Bảng 3.15: Kết phân lớp phương pháp SVM theo chiến lược 1/k với nhóm mẫu 47 Bảng 3.16: Kết phân lớp phương pháp SVM theo chiến lược 1/1 với nhóm mẫu 48 Bảng 3.17: Kết phân lớp theo j48 .48 Bảng 3.18: Bảng kết huấn luyện thuật tốn theo nhóm mẫu 48 Bảng 3.19: Bảng kết kiểm chứng thuật tốn theo nhóm mẫu 49 vii DANH MỤC HÌNH Hình 1.1 Bài toán phân loại bệnh .4 Hình 1.2 Quy trình phân loại bệnh .5 Hình 1.3 Mơ tả học sâu Hình 1.4 Quá trình học tăng cường 11 Hình 2.1 Mơ hình dạng định .14 Hình 2.2 Sự quan trọng biên siêu phẳng phân tách .16 Hình 2.3 Ví dụ biên tối ưu siêu phẳng phân tách 17 Hình 2.4 Ảnh hưởng C đến độ rộng biên 22 Hình 2.5 Khơng gian chiều ánh xạ từ không gian chiều 25 Hình 2.6 Phân lớp đa lớp sử dụng chiến lược OAA OAO 28 Hình 3.1: Kết xét nghiệm BN lần xét nghiệm khác 36 Hình 3.2: Dữ liệu xét nghiệm BN tách thành dòng liệu min, max 37 Hình 3.3: Dữ liệu xét nghiệm có ý nghĩa BN xác định .37 Hình 3.4: Dữ liệu xét nghiệm chuẩn hóa với miền [0.0;10.0] 38 Hình 3.5: Màn hình WEKA 40 Hình 3.6: Biểu đồ so sánh độ xác phân loại thử nghiệm theo thuật toán nhóm 50 Hình 3.7: Biểu đồ so sánh độ xác phân loại thử nghiệm theo thuật tốn nhóm 51 Hình 3.8 Biểu đồ so sánh độ xác phân loại thử nghiệm theo thuật tốn nhóm 51 Hình 3.9: Biểu đồ so sánh thời gian thuật tốn thử nghiêm tập HL .52 Hình 3.10: Biểu đồ so sánh thời gian thuật toán thử nghiêm tập KC 53 MỞ ĐẦU Trên giới Việt Nam, công tác y tế chăm sóc sức khỏe tồn dân có vị trí to lớn quan trọng phát triển xã hội Đặc biệt, thời kỳ đại dịch Covid-19, công tác khám, chữa bệnh cho bệnh nhân có ý nghĩa quan trọng Q trình điều trị bệnh nhân phụ thuộc nhiều vào kết xét nghiệm cận lâm sàng (bao gồm xét nghiệm định, chẩn đốn hình ảnh thăm dị chức năng) Các kết xét nghiệm đóng vai trò quan trọng định bác sĩ, điều dưỡng nhân viên y tế tồn q trình điều trị, chăm sóc bệnh nhân Trong giai đoạn nay, tình trạng bệnh tật có xu hướng gia tăng đại dịch diễn với quy mơ tồn giới Do đó, việc đảm bảo chất lượng khám điều trị thách thức sở khám, chữa bệnh phải đối mặt với tình trạng tải Một yêu cầu cấp bách đặt phải có hệ thống hỗ trợ việc phân loại bệnh nhanh chóng, xác để kịp thời cứu chữa bệnh nhân Cùng với phát triển mạnh mẽ công nghệ thông tin, kỹ thuật học máy học sâu nghiên cứu triển khai ứng dụng nhiều lĩnh vực, giải hiệu tốn phân lớp (Classification) liệu Phân lớp liệu việc xếp liệu vào lớp khác Ví dụ: Phân lớp sinh viên theo kết học tập, phân lớp lồi thực vật, … Bài tốn phân lớp liệu thường giải cách sử dụng số kỹ thuật học máy như: Cây định (Decision Tree), Máy vector hỗ trợ (Support Vector Machine), Mạng Nơ-ron nhân tạo (Artificial Neural Network), Thuật toán Bayes (Naive Bayes), … Bài toán phân loại bệnh dựa kết xét nghiệm thuộc lớp tốn phân lớp liệu Do áp dụng kỹ thuật học máy khác để giải

Ngày đăng: 20/09/2023, 00:00

Tài liệu cùng người dùng

Tài liệu liên quan