Đề tài Chẩn đoán bệnh lý tim mạch bằng phương pháp kết hợp bằng chứng sử dụng lý thuyết Dempster Shafer nghiên cứu xây dựng mô hình chẩn đoán bệnh lý tim mạch bằng trí tuệ nhân tạo sử dụng lý thuyết Dempster shafer để kết hợp các bằng chứng; so sánh kết quả chẩn đoán bệnh lý tim mạch của mô hình trí tuệ nhân tạo sử dụng lý thuyết Dempster shafer so với mô hình sử dụng lý thuyết Bayes truyền thống.
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC Y DƯỢC NGUYỄN HỮU KIÊN CHẨN ĐOÁN BỆNH LÝ MẠCH VÀNH BẰNG PHƯƠNG PHÁP KẾT HỢP BẰNG CHỨNG SỬ DỤNG LÝ THUYẾT DEMPSTER SHAFER KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC NGÀNH DƯỢC HỌC Hà Nội - 2022 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC Y DƯỢC Người thực hiện: NGUYỄN HỮU KIÊN CHẨN ĐOÁN BỆNH LÝ MẠCH VÀNH BẰNG PHƯƠNG PHÁP KẾT HỢP BẰNG CHỨNG SỬ DỤNG LÝ THUYẾT DEMPSTER SHAFER KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC NGÀNH DƯỢC HỌC Khóa: QH.2017.Y Cán hướng dẫn 1: ThS BS Nguyễn Thái Hà Dương Cán hướng dẫn 2: ThS BS Lê Đình Khiết Hà Nội - 2022 LỜI CẢM ƠN Mỗi sinh viên thực khóa luận tốt nghiệp niềm vinh hạnh, học mà sinh vinh học nhiều kiến thức từ đó, cá nhân em vậy, em cảm thấy hạnh phúc hồn thành khóa luận Do em muốn gửi lời cảm ơn chân thành đến người cho em hội giúp đỡ em hồn thành khóa luận Đầu tiên, em xin cảm ơn thầy cô giảng viên, nhân viên Trường đại học Y Dược - ĐHQGHN tạo điều kiện để em học tập rèn luyện năm học qua Tiếp theo, em xin gửi lời cảm ơn sâu sắc đến ThS.BS Nguyễn Thái Hà Dương ThS.BS Lê Đình Khiết, em cảm ơn hai thầy định hướng, dạy, khun bảo trân thành để em hồn thành tốt khóa luận ý nghĩa Xin gửi lời cảm ơn đến người bạn Đạt, em Phương, em Xuân, em Huế, em Lan thành viên nhóm nghiên cứu thực hồn thiện nghiên cứu này, cảm ơn người nhiều ! Cuối em xin cảm ơn gia đình bạn bè quan tâm em q trình làm khóa luận Em xin chân thành cảm ơn! Hà Nội, ngày 06 tháng 06 năm 2022 Sinh viên Nguyễn Hữu Kiên DANH MỤC TỪ VIẾT TẮT Ký hiệu Ý nghĩa AI Artificial intelligence (Trí tuệ nhân tạo) CVDs Cardiovascular Disease (Bệnh tim mạch) DST Dempster Shafer Theory ĐTNKÔĐ Đau thắt ngực không ổn định ĐMV Động mạch vành GD Gradient descent HCMVC Hội chứng động mạch vành cấp HCMVCKSTCL Hội chứng mạch vành cấp khơng có ST chênh lên HSBA Hồ sơ bệnh án NMCTC Nhồi máu tim cấp DANH MỤC BẢNG Bảng 2.1 Thống kê số bệnh nhân liệu 17 Bảng 2.2 Mô tả 23 triệu chứng phân loại 18 Bảng 3.1 Tổng quan kết mơ hình 29 Bảng 3.2 Trọng số phương pháp DST + GD [p] 34 Bảng 3.3 Trọng số phương pháp DST + GD [p0, p1] 35 DANH MỤC HÌNH Hình 1.1 Vị trí trái tim lồng ngực Hình 1.2 Hình ảnh hệ thống động mạch vành Hình 2.1 Kiểm tra chéo (Cross validation) 23 Hình 2.2 Minh họa tối ưu sườn dốc (Gradient descent) 25 Hình 2.3 Ma trận confusion matrix 27 Hình 3.1 Confusion matrix mơ tả kết DST + GD [p{0; 1}] 30 Hình 3.2 Confusion matrix mơ tả kết DST + GD [p0, p1] 32 Hình 3.3 Confusion matrix mơ tả kết Bayes kết hợp Logistic Regression 33 Mục lục ĐẶT VẤN ĐỀ CHƯƠNG 1: TỔNG QUAN 1.1 Sinh lý tim mạch giải phẫu tim mạch 1.1.1 Hình thể bên tim 1.1.2 Cấu tạo tim 1.2.1 Sinh lý bệnh bệnh động mạch vành 1.2.2 Nguyên nhân gây bệnh động mạch vành 1.2.3 Hội chứng mạch vành mạn 1.2.4 Hội chứng mạch vành cấp 1.3 Trí tuệ nhân tạo ứng dụng y học 10 1.3.1 Khái niệm 10 1.3.2 Tổng quan lịch sử trí tuệ nhân tạo y học thách thức cần vượt qua 10 1.3.3 Học máy hướng triển vọng giải vấn đề đặt 11 1.3.4 Quy trình làm việc áp dụng trí tuệ nhân tạo vào chẩn đốn lâm sàng 11 1.4 Lý thuyết kết hợp chứng Dempster Shafer theory 12 1.4.1 Khái niệm lý thuyết Dempster Shafer 12 1.4.2 Luật kết hợp – Dempster’s Rule 13 1.4.3 So sánh thuyết Dempster Shafer với thuyết Bayes 13 1.5 Các nghiên cứu liên quan 15 CHƯƠNG 2: ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU 17 2.1 Đối tượng nghiên cứu 17 2.2 Phương pháp nghiên cứu 19 2.2.1 Tiền xử lý liệu 19 2.2.2 Dempster Shafer Theory 19 2.2.3 Phương pháp Bayes classification (Logistics regression) 21 2.2.4 Kiểm tra chéo (Cross-validation) 23 2.2.5 Tối ưu hóa sườn dốc (Gradient descent) 24 2.2.6 Ma trận nhiễu (Confusion matrix) 26 CHƯƠNG 3: KẾT QUẢ 29 3.1 Mơ hình sử dụng thuật tốn Dempster Shafer kết hợp với tối ưu hóa trọng số cho phần uncertainty gradient descent (DST + GD [p]) 29 3.2 Mơ hình sử dụng thuật tốn Dempster Shafer kết hợp với tối ưu hóa trọng số cho phần khả bị bệnh không bị bệnh triệu chứng gradient descent (DST + GD [p0 , p1 ]) 31 3.3 Mơ hình sử dụng lý thuyết xác suất Bayes kết hợp Logistic Regression 32 3.4 Bộ trọng số khả không bị bệnh, khả bị bệnh không xác định sau chạy gradient descent 34 CHƯƠNG 4: BÀN LUẬN 36 4.1 Hai mơ hình sử dụng Dempster Shafer Theory 36 4.1.1 Mơ hình sử dụng thuật tốn Dempster Shafer kết hợp với tối ưu hóa trọng số cho phần uncertainty gradient descent (DST + GD [p]) 36 4.1.2 Mơ hình sử dụng thuật tốn Dempster Shafer kết hợp với tối ưu hóa trọng số cho phần khả bị bệnh không bị bệnh triệu chứng gradient descent (DST + GD [p0 , p1 ]) 36 4.1.3 Hạn chế tiềm mơ hình sử dụng thuật tốn Dempster Shafer Theory 37 4.2 So sánh kết hai mơ hình sử dụng Dempster Shafer Theory mơ hình sử dụng lý thuyết xác suất Bayes kết hợp Logistic Regression 38 KẾT LUẬN 39 Thuật toán Dempster Shafer 39 Hạn chế nghiên cứu 39 Đề xuất nhóm nghiên cứu 40 TÀI LIỆU THAM KHẢO ĐẶT VẤN ĐỀ Bệnh tim mạch (CVDs) công nhận nguyên nhân hàng đầu bệnh tật tử vong, gây thiệt hại lớn cho kinh tế giới hàng năm Trong vòng 25 năm từ năm 1990 đến năm 2015 số ca tử vong bệnh lý tim mạch tăng 42,4% [28] Vào năm 2016, CVDs nguyên nhân gây gần phần ba tổng số ca tử vong toàn cầu [30] Mặt khác, CVDs dẫn đến 17 triệu người chết, 330 triệu năm 35,6 triệu năm sống với tàn tật vào năm 2017 toàn giới [24, 41] Ngày nay, bệnh tim mạch nguyên nhân gây tử vong hàng đầu toàn giới với 17,9 triệu ca tử vong hàng năm [27] nguyên nhân 23 triệu ca tử vong vào năm 2030 khắp giới [26] Theo Tổ chức Y tế Thế giới, 3/4 số ca tử vong CVDs xảy nước có thu nhập thấp trung bình [42] Tại Việt Nam, CVDs nguyên nhân gây 31% tổng số ca tử vong năm 2016 tương đương 170.000 người nguyên nhân tử vong hàng đầu bệnh khơng lây nhiễm [32] Với tình trạng đó, nhu cầu phát chẩn đốn sớm bệnh giai đoạn bệnh bệnh lý tim mạch trở nên cấp thiết Q trình chẩn đốn điều trị bệnh thực chủ yếu bệnh viện y bác sĩ thông qua thông tin thăm khám lâm sàng cận lâm sàng Ngày nay, với hiểu biết chế nhiều tình trạng bệnh lý với hỗ trợ máy móc khoa học kỹ thuật đại, trình chẩn đốn trở nên bớt khó khăn hơn, xác Tuy nhiên bệnh lý gây thách thức việc chẩn đoán kịp thời, nhu cầu phát sớm nguy mắc bệnh, nhu cầu khám sàng lọc số lượng lớn người địi hỏi cần có hỗ trợ q trình xử lý thơng tin Ngày trí tuệ nhân tạo (AI) ứng dụng để giải nhiều vấn đề sống khơng thể không kể đến ngành y tế Việc áp dụng AI hay thuật toán học máy vào y tế hướng triển vọng giúp giải vấn đề phức tạp [13] Tuy nhiên hầu hết phương pháp dựa lý thuyết xác suất thống kê kinh điển Bayes Mặc dù, lý thuyết Bayes đóng vai trò trung tâm phương pháp luận khoa học liệu, hướng khác – lý thuyết Dempster Shafer theory ... thực hiện: NGUYỄN HỮU KIÊN CHẨN ĐOÁN BỆNH LÝ MẠCH VÀNH BẰNG PHƯƠNG PHÁP KẾT HỢP BẰNG CHỨNG SỬ DỤNG LÝ THUYẾT DEMPSTER SHAFER KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC NGÀNH DƯỢC HỌC Khóa: QH.2017.Y Cán hướng... dựng mô hình chẩn đốn bệnh lý tim mạch lý thuyết Dempster Shafer Mỗi triệu chứng xem chứng để kết luận bệnh với trọng số đóng vai trị xác suất Phép kết hợp Dempster sử dụng để kết hợp chứng lại,... định dự đoán cuối Mục tiêu đề tài là: Xây dựng mơ hình chẩn đốn bệnh lý tim mạch trí tuệ nhân tạo sử dụng lý thuyết Dempster shafer để kết hợp chứng So sánh kết chẩn đoán bệnh lý tim mạch mơ