Đề tài Chẩn đoán bệnh lý tim mạch dựa trên dữ liệu thăm khám lâm sàng, cận lâm sàng bằng trí tuệ nhân tạo đã xây dựng mô hình phân loại nhị phân và phép kết hợp mô hình dựa theo lý thuyết Dempster - Shafer, đánh giá và so sánh mô hình và phép kết hợp xây dựng được so với các mô hình và phép kết hợp truyền thống; giải thích quá trình xử lý dữ liệu của máy tính để đưa ra được kết quả, dựa vào đó để đánh giá hiệu quả và tính tối ưu của mô hình đã xây dựng và các thuật toán được ứng dụng trong nghiên cứu; xác định ảnh hưởng của bộ dữ liệu đưa vào với kết quả đầu ra và độ chính xác của kết quả.
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC Y DƯỢC LÊ TRẦN ĐẠT CHẨN ĐOÁN BỆNH LÝ TIM MẠCH DỰA TRÊN DỮ LIỆU THĂM KHÁM LÂM SÀNG, CẬN LÂM SÀNG BẰNG TRÍ TUỆ NHÂN TẠO KHĨA LUẬN TỐT NGHIỆP ĐẠI HỌC NGÀNH DƯỢC HỌC Hà Nội - 2022 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC Y DƯỢC Người thực hiện: LÊ TRẦN ĐẠT CHẨN ĐOÁN BỆNH LÝ TIM MẠCH DỰA TRÊN DỮ LIỆU THĂM KHÁM LÂM SÀNG, CẬN LÂM SÀNG BẰNG TRÍ TUỆ NHÂN TẠO KHĨA LUẬN TỐT NGHIỆP ĐẠI HỌC NGÀNH DƯỢC HỌC Khóa: QH.2017.Y Cán hướng dẫn 1: ThS BS NGUYỄN THÁI HÀ DƯƠNG Cán hướng dẫn 2: ThS BS LÊ ĐÌNH KHIẾT Hà Nội - 2022 LỜI CẢM ƠN Đối với sinh viên, khóa luận tốt nghiệp nơi đúc kết lại kiến thức học giúp giảng viên đánh giá lực trình độ nghiên cứu khoa học sinh viên Trong thời gian thực khóa luận, em học nhiều điều nhận nhiều giúp đỡ từ thầy cô hướng dẫn em, bạn học trường Lời đầu tiên, em xin gửi lời cảm ơn tới thầy cô giáo giảng viên Trường đại học Y Dược - ĐHQGHN truyền tải cho em nhiều kiến thức thuộc chuyên ngành suốt năm qua Tiếp theo, em xin gửi lời cảm ơn sâu sắc đến ThS Nguyễn Thái Hà Dương ThS Lê Đình Khiết giảng viên hướng dẫn cho em thực khóa luận này, thầy giúp đỡ em nhiều trình nghiên cứu, tạo điều kiện tốt để em tìm hiểu nắm rõ vấn đề liên quan đến khóa luận hướng dẫn thực trình bày báo cáo khoa học Xin cảm ơn đến bạn, em thuộc nhóm MI-lab tích cực giúp đỡ công việc xử lý số liệu trợ giúp thực khóa luận Trong q trình làm khóa luận tốt nghiệp, em cảm thấy học tập trải nghiệm nhiều điều vô hữu ích Từ để em học hỏi rút kinh nghiệm cho trình làm việc sau Khóa luận em cịn nhiều hạn chế thiếu sót Em mong nhận nhận xét góp ý từ q thầy bạn học lớp giúp khóa luận hồn thiện Em xin chân thành cảm ơn! Hà Nội, ngày 06 tháng 06 năm 2022 Sinh viên Lê Trần Đạt DANH MỤC KÝ HIỆU VÀ CHỮ VIẾT TẮT Ký hiệu Ý nghĩa DT Decision tree DST Dempster - Shafer theory ECG Điện tâm đồ FN False negative (âm tính giả) FP False positive (dương tính giả) KNN K-nearest neighbor ML Multi-layer Perception NV Naive Bayes RF Random forest SVM Support vector machine TN True negative (âm tính thật) TP True positive (dương tính thật) DANH MỤC HÌNH VẼ Hình 1.1 Vị trí giải phẫu tim Hình 1.2 Giải phẫu mạch vành Hình 1.3 Hình ảnh nội soi huỳnh quang mạch vành Hình 1.4 Trí tuệ nhân tạo chăm sóc sức khỏe Hình 2.1 Sơ đồ bước nghiên cứu 16 Hình 3.1 Ma trận lỗi phương pháp DST kết hợp GD [p{0; 1}] 27 Hình 3.2 Ma trận lỗi phương pháp DST kết hợp GD [p0 , p1 ] 29 Hình 3.3 Ma trận lỗi mơ hình logistic regression cho biến phân loại 31 Hình 3.4 Ma trận lỗi phép kết hợp mơ hình 32 DANH MỤC BẢNG BIỂU Bảng 2.1 Thống kê số bệnh nhân liệu 14 Bảng 2.2 Ma trận lỗi 23 Bảng 3.1 Kết tổng quát nghiên cứu 26 Bảng 3.2 Các tham số sau tối ưu hóa GD [p{0;1} ] 28 Bảng 3.3 Các tham số sau tối ưu hóa GD [p0 , p1 ] 30 Bảng 3.4 Độ xác mơ hình 33 Bảng 3.5 Phần không chắn mô hình sau tối ưu hóa 33 Bảng 3.6 Độ xác mơ hình 34 Mục lục MỞ ĐẦU CHƯƠNG 1: TỔNG QUAN TÀI LIỆU 1.1 Cấu tạo hệ tim mạch 1.2 Bệnh lý mạch vành 1.2.1 Tổng quan bệnh lý mạch vành 1.2.2 Các yếu tố nguy bệnh lý mạch vành 1.2.3 Chẩn đoán bệnh lý mạch vành 1.3 Trí tuệ nhân tạo ứng dụng y học 1.4 Lý thuyết chứng Dempster - Shafer 10 1.5 Các nghiên cứu liên quan 11 CHƯƠNG 2: ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU 13 2.1 Đối tượng nghiên cứu 13 2.2 Số mẫu phương pháp lấy mẫu 14 2.3 Nội dung nghiên cứu 15 2.4 Phương pháp nghiên cứu 17 2.4.1 Tiền xử lý liệu 17 2.4.2 Các mơ hình sử dụng 17 2.4.3 Phương pháp đánh giá 23 CHƯƠNG 3: KẾT QUẢ NGHIÊN CỨU 3.1 Kết mơ hình mơ hình xây dựng dựa lý thuyết DST 26 26 3.1.1 Tối ưu hóa p{0;1} (uncertainty) gradient descent 26 3.1.2 Tối ưu hóa [p0 , p1 ] gradient descent 28 3.2 Kết mô hình logistic regression cho biến phân loại 30 3.3 Kết kết hợp mô hình 31 CHƯƠNG 4: BÀN LUẬN 35 4.1 Đánh giá mơ hình phép kết hợp mơ hình 35 4.1.1 Mơ hình logistic regression 35 4.1.2 Mơ hình xây dựng dựa DST 35 4.1.3 Kết hợp mơ hình 36 4.2 Đánh giá tham số mơ hình dựa theo DST 36 4.2.1 Phương pháp tối ưu hóa p{0;1} 36 4.2.1 Phương pháp tối ưu hóa [p0 , p1 ] 37 4.3 Đánh giá ảnh hưởng liệu thiếu tới mô hình 37 4.4 So sánh với nghiên cứu thực giới 38 4.4.1 Bộ liệu 38 4.4.2 Kết nghiên cứu 38 4.5 Một số điểm hạn chế nghiên cứu 38 4.6 Ý nghĩa nghiên cứu 39 KẾT LUẬN 41 Đánh giá ứng dụng DST xây dựng mơ hình chẩn đoán 41 Đánh giá ứng dụng DST kết hợp mơ hình chẩn đốn 41 Kết luận 42 Hướng nghiên cứu tương lai 42 TÀI LIỆU THAM KHẢO PHỤ LỤC MỞ ĐẦU Hệ tim mạch hệ quan quan trọng thể người Trái tim thực nhiệm vụ bơm máu vào động mạch nhận máu từ tĩnh mạch Hệ thống mạch đóng vai trị đường máu, giúp máu tuần hoàn toàn thể Từ chức trên, thấy hệ thống tim mạch đảm nhận vai trò vận chuyển chất theo đường tuần hoàn khắp thể nhằm trì sống, ngồi hệ tim mạch cịn đảm nhận chức khác bảo vệ trì cân yếu tố bên thể Do đảm nhận chức quan trọng vậy, bệnh lý liên quan đến tim mạch ảnh hưởng lớn đến đời sống sức khỏe bệnh nhân tạo gánh nặng lớn cho toàn xã hội Theo WHO, bệnh tim mạch nguyên nhân hàng đầu gây tử vong tồn cầu Ước tính có 17,9 triệu người tử vong bệnh tim mạch vào năm 2019, chiếm 32% tổng số ca tử vong tồn cầu Trong đó, 75% số ca tử vong bệnh tim mạch xảy nước thu nhập trung bình thấp Một nghiên cứu Mỹ vào năm 2016 S Nelson L Whitsel dự báo đến năm 2035 có 132 triệu người Mỹ mắc bệnh tim mạch chi phí mà xã hội trả để điều trị bệnh tim mạch vào năm 2035 368 tỷ đô la Tại Việt Nam, theo thông kê WHO, số người tử vong bệnh tim mạch vào năm 2016 170 nghìn người, chiếm 31% số ca tử vong năm Với tính chất trên, việc chẩn đốn nhanh chóng xác bệnh tim mạch trở nên quan trọng nhằm sớm đưa hướng chữa trị giảm tỷ lệ tử vong cho bệnh nhân Hiện nay, thực trạng chẩn đoán bệnh tim mạch cịn nhiều khó khăn như: bệnh nhân thường đến bệnh viện bệnh tiến triển vào giai đoạn nặng, xuất triệu chứng nặng; việc phân tích dấu hiệu nhằm chẩn đốn bệnh phải tiến hành chuyên gia có kiến thức kinh nghiệm, việc chẩn đoán tốn thời gian, đồng thời số lượng bệnh nhân lớn vượt khả xử lý đội ngũ y tế điều kiện sở vật chất sở y tế địa phương cịn gây khó khăn việc chẩn đốn sàng lọc bệnh nhân bị bệnh tim mạch Những khó khăn khiến việc chẩn đốn trở nên khó khăn chậm trễ, điều làm ảnh hưởng đến việc đưa hướng điều trị kịp thời cho bệnh nhân Vì vậy, việc đưa phương pháp chẩn đốn cách xác ... Người thực hiện: LÊ TRẦN ĐẠT CHẨN ĐOÁN BỆNH LÝ TIM MẠCH DỰA TRÊN DỮ LIỆU THĂM KHÁM LÂM SÀNG, CẬN LÂM SÀNG BẰNG TRÍ TUỆ NHÂN TẠO KHĨA LUẬN TỐT NGHIỆP ĐẠI HỌC NGÀNH DƯỢC HỌC Khóa: QH.2017.Y Cán hướng... nghiên cứu ? ?Chẩn đoán bệnh lý tim mạch dựa liệu thăm khám lâm sàng, cận lâm sàng trí tuệ nhân tạo? ?? nhằm mục đích: • Xây dựng mơ hình phân loại nhị phân phép kết hợp mơ hình dựa theo lý thuyết Dempster... 1.2.3 Chẩn đốn bệnh lý mạch vành Hiện nay, việc chẩn đoán bệnh tim thiếu máu cục dựa vào triệu chứng lâm sàng xét nghiệm cận lâm sàng sau [5, 7]: • Đau thắt ngực: triệu chứng lâm sàng điển hình bệnh