1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên ứu á mô hình họ máy với dữ liệu y tế và ứng dụng trong sàng lọ bệnh tiểu đường

63 2 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI LUẬN VĂN THẠC SĨ Nghiên cứu mơ hình học máy với liệu y tế ứng dụng sàng lọc bệnh tiểu đường Trần Khoa Bách trankhoabach@gmail.com Ngành Kỹ thuật phần mềm Giảng viên hướng dẫn: TS Phạm Ngọc Hưng Viện: Công nghệ Thông tin Truyền thông HÀ NỘI, 10/2020 Tai ngay!!! Ban co the xoa dong chu nay!!! 17061132202241000000 LỜI CAM ĐOAN Những kiến thức trình bày luận văn tơi tìm hiểu, nghiên cứu trình bày theo kiến thức tổng hợp cá nhân Kết nghiên cứu luận văn chưa cơng bố cơng trình khác Trong q trình làm luận văn, tơi có tham khảo tài liệu có liên quan ghi rõ nguồn tài liệu tham khảo Tôi xin cam đoan cơng trình nghiên cứu tơi khơng chép Tơi xin chịu hồn tồn trách nhiệm, sai, tơi xin chịu hình thức kỷ luật theo quy định Hà Nội, ngày tháng 10 năm 2020 Học viên Trần Khoa Bách LỜI CẢM ƠN Để hồn thành luận văn này, tơi nhận nhiều động viên, giúp đỡ nhiều cá nhân tập thể Trước tiên, xin bày tỏ lòng biết ơn sâu sắc tới thầy giáo, giáo viên hướng dẫn TS Phạm Ngọc Hưng, Viện Công nghệ Thông tin Truyền thông, Trường Đại học Bách Khoa Hà Nội nhiệt tình hướng dẫn, tạo điều kiện thuận lợi cho nghiên cứu khoa học, giúp tơi hồn thành luận văn cách tốt Cuối xin gửi lời cám ơn đến gia đình, bạn bè người ln bên tơi, động viên khuyến khích tơi trình thực đề tài nghiên cứu Học viên Trần Khoa Bách MỤC LỤC MỤC LỤC DANH MỤC CÁC CHỮ VIẾT TẮT DANH MỤC CÁC BẢNG DANH MỤC HÌNH VẼ CHƯƠNG GIỚI THIỆU ĐỀ TÀI 1.1 Tổng quan đề tài 1.1.1 Lý chọn đề tài 1.1.2 Mục tiêu nhiệm vụ nghiên cứu 1.1.3 Đối tượng phạm vi nghiên cứu 1.1.4 Phương pháp nghiên cứu 1.1.5 Ý nghĩa khoa học thực tiễn 10 1.1.6 Bố cục luận văn 10 1.2 Tổng quan học máy 11 1.3 Ứng dụng học máy y học 13 1.3.1 Ứng dụng học máy tiên lượng, chẩn đoán bệnh 14 1.3.2 Ứng dụng học máy nghiên cứu phát triển thuốc 15 1.3.3 Ứng dụng học máy điều trị bệnh 15 1.3.4 Ứng dụng học máy dự đoán dịch bệnh 16 1.3.5 Một số khó khăn việc áp dụng học máy y học 15 CHƯƠNG NGHIÊN CỨU CÁC MƠ HÌNH HỌC MÁY 16 VỚI DỮ LIỆU Y TẾ 18 2.1 Phân loại mơ hình học máy 18 2.2 Ứng dụng học máy y tế 19 2.2.1 Học máy với liệu bệnh án điện tử 19 2.2.2 Học máy với liệu ảnh y tế 20 2.3 Một số mơ hình học máy điển hình 21 2.3.1 Hồi quy Logistic - Logistic regression 21 2.3.2 Máy vector hỗ trợ - Support Vector Machine (SVM) 25 2.3.3 Cây định – Decision Tree 31 2.3.4 Rừng ngẫu nhiên - Random Forest 33 2.4 Một số mơ hình học máy nâng cao 35 2.4.1 Học sâu rộng - Wide Deep Learning 35 2.4.2 XGBoost 38 2.5 Đánh giá hiệu mơ hình học máy 40 2.5.1 Ma trận nhầm lẫn 40 2.5.2 Các thang đo hiệu học máy 41 2.5.3 Đường cong ROC 42 2.5.4 Ví dụ 43 CHƯƠNG ĐÁNH GIÁ CÁC MƠ HÌNH HỌC MÁY 39 TRONG SÀNG LỌC BỆNH TIỂU ĐƯỜNG 44 3.1 Giới thiệu chung bệnh tiểu đường 45 3.2 Bài toán chẩn đoán bệnh tiểu đường 46 3.2.1 Giới thiệu toán 46 3.2.2 Mục tiêu toán 46 3.2.3 Dữ liệu đầu vào 46 3.2.4 Chọn lọc liệu 48 3.2.5 Trực quan hóa liệu 50 3.2.6 Tiền xử lý liệu 52 3.2.7 Phương pháp phân lớp 53 3.2.8 Một số ảnh lập trình minh họa 55 3.2.9 Thí nghiệm đánh giá kết 56 CHƯƠNG KẾT LUẬN 58 4.1 Kết luận chung 58 4.2 Kết đạt 58 4.3 Định hướng 58 TÀI LIỆU THAM KHẢO 59 DANH MỤC CÁC CHỮ VIẾT TẮT STT Tên viết tắt AI AUC BMI DT FN FP GPU ID3 ILSVRC Tên đầy đủ Tiếng Việt 10 LR 11 NHANES 12 NPV Artificial Intelligence Area Under Curve Body Mass Index Decision Tree False Negative False Positive Graphics Processing Unit Iterative Dichotomiser ImageNet Large-Scale Visual Recognition Challenge Logistic Regression National Health and Nutrition Examination Survey Negative Predictive Value 13 PPV Positive Predictive Value 14 RF 15 ROC 16 17 18 SVM TN TP XGBoost, XGB Random Forest Receiver Operating Characteristic Support Vector Machine True Negative True Positive Trí tuệ nhân tạo Khu vực đường cong Chỉ số khối thể Cây định Âm tính giả Âm tính thật Bộ xử lý đồ họa Thuật toán ID3 Thử thách nhận dạng hình ảnh quy mơ lớn ImageNet Hồi quy Logistic Khảo sát Kiểm tra Sức khỏe Dinh dưỡng Quốc gia Giá trị chẩn đốn âm tính Giá trị chẩn đốn dương tính Rừng ngẫu nhiên Đặc trưng hoạt động thu nhận Máy vectơ hỗ trợ Dương tính giả Dương tính thật Extreme Gradient Boosting Siêu tăng cường độ dốc 19 DANH MỤC CÁC BẢNG Bảng 2.1 Ma trận nhầm lẫn mơ tả kết dự đốn người mắc bệnh 43 Bảng 3.1 Mô tả thông tin trường liệu chọn 50 Bảng 3.2 Bảng thông số hiệu mơ hình 56 DANH MỤC HÌNH VẼ Hình 1.1 Sự khác biệt học sâu, học máy trí tuệ nhân tạo [1] 13 Hình 1.2 Ảnh scan võng mạc mắt thông qua Google Deep Mind [2] 14 Hình 1.3 Ảnh scan thể bệnh nhân thông qua phần mềm Aidoc [9] 16 Hình 1.4 Ứng dụng Promed-mail giúp chẩn đốn dịch bệnh [10] 17 Hình 2.1 Dữ liệu phân loại mơ hình hồi quy logistic [1] 22 Hình 2.2 Hai lớp phân chia cho khoảng cách đạt giá trị lớn [1] 26 Hình 2.3 Tập liệu ánh xạ thơng qua phương pháp Kernel [1] 28 Hình 2.4 Mơ hình định [1] 31 Hình 2.5 Đồ thị Entropy [1] 32 Hình 2.6 Mơ hình định [1] 34 Hình 2.7 Mơ hình sâu rộng [14] 35 Hình 2.8 Hiệu suất thư viện XGB so với thư viện khác 39 Hình 2.9 Đồ thị đường cong ROC mơ hình học máy [1] 42 Hình 3.1 Bộ liệu NHANES dạng file Excel 47 Hình 3.2 Thông tin trường liệu trang chủ NHANES 47 Hình 3.3 Quy trình sàng lọc đánh dấu người bị tiểu đường 48 Hình 3.4 Phân bố tập liệu theo thuộc tính quan sát 52 Hình 3.5 Biểu đồ thể liệu toán cân 53 Hình 3.6 Mơ hình kỹ thuật Easy Ensemble chia liệu 54 Hình 3.7 Mơ hình mơ tả trình tự thực việc chẩn đốn bệnh tiểu đường 54 Hình 3.8 Import thư viện sử dụng 55 Hình 3.9 Chẩn đốn người bị tiểu đường qua mơ hình SVM 56 Hình 3.10 Đồ thị đường cong ROC mơ hình sử dụng 57 Hình 3.11 Biểu đồ điểm quan trọng thơng qua mơ hình định 57 CHƯƠNG GIỚI THIỆU ĐỀ TÀI 1.1 Tổng quan đề tài 1.1.1 Lý chọn đề tài Học máy (machine learning) đóng vai trị quan trọng cách mạng cơng nghiệp 4.0, thúc đẩy phát triển nhiều ngành, có ngành y tế thúc đẩy mạnh mẽ Phân tích liệu lớn học máy mang lại lợi đáng kể cho việc đồng hóa đánh giá lượng lớn liệu chăm sóc sức khỏe phức tạp Ưu điểm học máy bao gồm tính linh hoạt khả mở rộng so với phương pháp thống kê sinh học truyền thống, việc giúp học máy triển khai cho nhiều nhiệm vụ khác nhau, ví dụ phân tầng rủi ro, chẩn đoán, phân loại dự đoán tỷ lệ sống Một ưu điểm khác mơ hình học máy khả phân tích loại liệu khác hồ sơ y tế, liệu nhân học, liệu xét nghiệm y tế, liệu hình ảnh áp dụng chúng vào tiên lượng, chẩn đoán nguy mắc bệnh, phương pháp điều trị thích hợp Mặc dù có ưu điểm này, việc áp dụng học máy y tế gặp nhiều khó khăn cơng việc thu thập liệu bệnh nhân không dễ dàng, khơng có cho phép bệnh nhân việc sử dụng liệu bệnh nhân cho mục đích vi phạm pháp luật Tại Việt Nam, việc áp dụng học máy việc chẩn đốn bệnh áp dụng thành cơng y tế, điển hình phương pháp chẩn đốn bệnh qua hình ảnh với tỉ lệ xác cao bệnh viện lớn bệnh viện Việt Nam Cuba, bệnh viện Quân Y 103, bệnh viện Vinmec, Tuy nhiên, việc thu thập liệu cịn khó khăn bao gồm cần cho phép bệnh nhân đồng ý chia sẻ bệnh viện nên việc áp dụng học máy chưa rộng rãi bệnh viện khác Việc áp dụng học máy, trí tuệ nhân tạo đóng góp to lớn vào việc hỗ trợ bác sỹ, chuyên gia chẩn đoán, điều trị bệnh Luận văn thực đề tài nghiên cứu mơ hình học máy ứng dụng y học với dạng liệu y tế khác thử nghiệm với toán cụ thể sàng lọc bệnh tiểu đường 1.1.2 Mục tiêu nhiệm vụ nghiên cứu Qua nghiên cứu mơ hình học máy ứng dụng chẩn đốn bệnh với liệu y tế, lập trình chương trình thực nghiệm với liệu thực, số kết đạt sau: o Nắm chất học máy mơ hình học máy o Hiểu tính thực tế học máy tới y tế thông qua ứng dụng học máy o Áp dụng mơ hình học máy để xây dựng phần mềm chẩn đốn bệnh nhân có bị tiểu đường hay khơng liệu thực o Rút độ thực tiễn ý nghĩa khoa học việc áp dụng học máy vào ứng dụng chẩn đoán bệnh với liệu y tế 1.1.3 Đối tượng phạm vi nghiên cứu Đối tượng nghiên cứu: o Kiến thức học máy bao gồm phương pháp ứng dụng thực tế o Kiến thức chung bệnh tiểu đường Phạm vi nghiên cứu: Áp dụng mơ hình học máy để xây dựng chương trình chẩn đốn bệnh tiểu đường 1.1.4 Phương pháp nghiên cứu Nghiên cứu lý thuyết: Nghiên cứu khảo sát học máy ứng dụng học máy chẩn đoán bệnh dựa liệu y tế từ nguồn tài liệu giáo trình, giảng, báo cáo khoa học, … để chọn mơ hình học máy phù hợp với việc sàng lọc bệnh nhân bị tiểu đường Tìm hiểu ứng dụng dùng mô

Ngày đăng: 26/01/2024, 15:43

Xem thêm:

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w