ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC Y DƯỢC ĐÀO DUY THIỆU CHẨN ĐOÁN BỆNH CƠ TIM PHÌ ĐẠI BẰNG ÁP DỤNG KỸ THUẬT PHÂN TÍCH TÍN HIỆU LÊN DỮ LIỆU ĐIỆN TÂM ĐỒ KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC NGÀNH DƯỢC HỌC H[.]
tai lieu, luan van1 of 98 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC Y DƯỢC ĐÀO DUY THIỆU CHẨN ĐỐN BỆNH CƠ TIM PHÌ ĐẠI BẰNG ÁP DỤNG KỸ THUẬT PHÂN TÍCH TÍN HIỆU LÊN DỮ LIỆU ĐIỆN TÂM ĐỒ KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC NGÀNH DƯỢC HỌC Hà Nội - 2022 document, khoa luan1 of 98 tai lieu, luan van2 of 98 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC Y DƯỢC Người thực hiện: ĐÀO DUY THIỆU CHẨN ĐỐN BỆNH CƠ TIM PHÌ ĐẠI BẰNG ÁP DỤNG KỸ THUẬT PHÂN TÍCH TÍN HIỆU LÊN DỮ LIỆU ĐIỆN TÂM ĐỒ KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC NGÀNH DƯỢC HỌC Khóa: QH.2017.Y Người hướng dẫn 1: ThS BS LÊ ĐÌNH KHIẾT Người hướng dẫn 2: ThS BS NGUYỄN THÁI HÀ DƯƠNG Hà Nội - 2022 document, khoa luan2 of 98 tai lieu, luan van3 of 98 LỜI CẢM ƠN Em xin bày tỏ lòng kính trọng biết ơn sâu sắc tới hai người thầy hướng dẫn em hồn thành khóa luận tốt nghiệp: ThS Lê Đình Khiết ThS Nguyễn Thái Hà Dương Hai thầy tận tình hướng dẫn kiến thức phương pháp luận, đồng thời sát sao, động viên em suốt trình thực hồn thành khóa luận tốt nghiệp Em xin bày tỏ lịng kính trọng cảm ơn ThS Trần Tiến Đạt Thầy ln nhiệt tình bảo, hướng dẫn, lắng nghe, giúp đỡ em giải từ vấn đề nhỏ góp nhiều cơng sức nghiên cứu em Các thầy không truyền đạt lại kiến thức mà truyền cho em niềm đam mê, lòng nhiệt huyết với nghề ln sẵn sàng giúp đỡ em gặp khó khăn Em xin gửi lời cảm ơn tới nhà trường, gia đình bạn bè, người ln bên, động viên khích lệ giúp em vượt qua gia đoạn khó khăn suốt năm đại học q trình thực khóa luận Trong q trình hồn thành khóa luận, kiến thức cịn hạn hẹp nhiều thiếu sót nên khơng tránh khỏi lỗi cần bổ sung Em kính mong nhận góp ý thầy cơ, anh chị để khóa luận hồn thiện Hà Nội, ngày 06 tháng 06 năm 2022 Sinh viên Đào Duy Thiệu document, khoa luan3 of 98 tai lieu, luan van4 of 98 DANH MỤC KÝ HIỆU VÀ TỪ VIẾT TẮT Ký hiệu Ý nghĩa AI Artificial Intelligence (Trí tuệ nhân tạo) AV Atrioventricular (Nút nhĩ thất) CD Cardiovascular Disease (Rối loạn nhịp tim) CVD Cardiovascular Disease (Bệnh tim mạch) DT Decision Tree (cây định) ECG Electrocardiogram (Điện tâm đồ) FFT Fast Fourier Transform (Biến đổi nhanh Fourier) FN False Negative (Âm tính giả) FP False Positive (Dương tính giả) HYP Hypertrophic Cardiomyopathy (Phì đại tim) ML Machine Learning (Máy học) MI Myocardial Infarction (Nhồi máu tim) NV Naive Bayes (Bộ phân loại Naive Bayes) NORM Normal (Bình Thường) TP True Positive (Dương tính thực) TN True Negative (Âm tính thực) SA Sinoatrial Node (Nút xoang) STTC ST/T Change (Thay đổi ST/T) SVM Support Vector Machine (Máy vector hỗ trợ) document, khoa luan4 of 98 tai lieu, luan van5 of 98 DANH MỤC HÌNH Hình 1.1 Giải phẫu tim Hình 1.2 Hình ảnh nút xoang Hình 1.3 Cách mắc điện tâm đồ Hình 1.4 Electrocardiogram 10 Hình 2.1 Đồ thị hàm số Sigmoid 21 Hình 3.1 Biểu diễn điện tâm đồ chuyển đạo DI bệnh nhân 24 Hình 3.2 Miền tần số tín hiệu điện tim sau FFT 25 Hình 3.3 Thuật tốn xác định đỉnh R 25 Hình 3.4 Biểu diễn khoảng R-R sau chuẩn hóa chuyển đạo DI 20 bệnh nhân mắc bệnh phì đại tim Hình 3.5 Biểu diễn khoảng R-R sau chuẩn hóa chuyển đạo DI 20 người bình thường Hình 3.6 27 Biểu diễn khoảng R-R sau chuẩn hóa chuyển đạo V2 20 người mắc bệnh phì đại tim Hình 3.7 26 27 Biểu diễn khoảng R-R sau chuẩn hóa chuyển đạo V2 20 người bình thường 28 Hình 3.8 Ma trận nhiễu mơ hình phân tích chuyển đạo DI 30 Hình 3.9 Ma trận nhiễu mơ hình phân tích chuyển đạo V2 31 document, khoa luan5 of 98 tai lieu, luan van6 of 98 DANH MỤC BẢNG Bảng 2.1 document, khoa luan6 of 98 Ma trận lỗi 22 tai lieu, luan van7 of 98 Mục lục MỞ ĐẦU CHƯƠNG 1: TỔNG QUAN TÀI LIỆU 1.1 Giải phẫu, cấu tạo sinh lý hệ tim mạch 1.1.1 Giải phẫu tim 1.1.2 Hệ thống dẫn truyền tim 1.1.3 Điện hoạt động tim 1.1.4 Chu kỳ hoạt động tim 1.1.5 Nguyên lý điện tâm đồ 1.2 Bệnh phì đại tim mạch 11 1.3 Trí tuệ nhân tạo ứng dụng y học 12 1.4 Các nghiên cứu liên quan 13 1.5 Ý nghĩa nghiên cứu 15 CHƯƠNG 2: ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU 2.1 Đối tượng nghiên cứu 17 2.2 Nội dung nghiên cứu 18 2.3 Phương pháp nghiên cứu 18 2.3.1 Tiền xử lý liệu 18 2.3.2 Mơ hình logistic regression 20 2.3.3 Phương pháp đánh giá 21 CHƯƠNG 3: KẾT QUẢ NGHIÊN CỨU document, khoa luan7 of 98 17 24 tai lieu, luan van8 of 98 3.1 Xác định khoảng R-R 24 3.2 Kết hợp chuẩn hóa khoảng R-R 26 3.3 Kết chẩn đốn mơ hình 28 3.4 Đánh giá trình xử lý liệu 32 3.5 Đánh giá kết phân loại 32 KẾT LUẬN Kết qủa biểu diễn điện tâm đồ 34 Kết xây dựng mơ hình dự đốn 34 Ưu, nhược điểm triển vọng nghiên cứu 34 TÀI LIỆU THAM KHẢO document, khoa luan8 of 98 34 tai lieu, luan van9 of 98 MỞ ĐẦU Bệnh tim mạch gánh nặng bệnh tật giới chiếm gần nửa số bệnh không lây nhiễm nguyên nhân gây tử vong hàng đầu toàn cầu, chiếm 17,3 triệu ca tử vong năm, số dự kiến tăng lên 23,6 triệu vào năm 2030 [1] Báo cáo WHO cho biết tỷ lệ bệnh tim mạch ngày tăng cao nước phát triển có Việt Nam Bên cạnh đó, chi phí cho khám chữa bệnh tim mạch gánh nặng kinh tế với hàng trăm tỷ năm Việt Nam có khoảng 25% dân số mắc bệnh tim mạch 46% mắc tăng huyết áp Hơn nữa, bệnh tim mạch nguyên nhân gây tử vong nước cơng nghiệp hóa, chiếm 31% tổng số ca tử vong tồn giới Do đó, xác định dấu hiệu để chẩn đoán sớm điều trị kịp thời điều quan trọng Các tín hiệu điện tâm đồ Electrocardiogram (ECG) biết đến công cụ lâm sàng để đánh giá chức tim với ưu điểm khơng xâm lấn tốn Trong thực hành lâm sàng, tín hiệu điện tâm đồ thường giải thích nhà điện sinh lý học, người địi hỏi trình độ chun mơn cao Giải thích điện tâm đồ phụ thuộc nhiều vào diễn giải cá nhân, dẫn đến việc đưa định thiếu tính khách quan Thuật ngữ Trí tuệ nhân tạo Artificial Intelligence (AI) John McCarthy đặt vào năm 1956 hội nghị tổ chức chủ đề Tuy nhiên, khả máy móc mơ hành vi suy nghĩ thực người đưa trước Alan Turing, người phát triển kiểm tra Turing để phân biệt người với máy móc Kể từ đó, sức mạnh tính tốn phát triển đến mức tính tốn đánh giá liệu theo liệu đánh giá trước Ngày nay, AI tích hợp vào sống hàng ngày nhiều hình thức, chẳng hạn trợ lý cá nhân (Siri, Alexa, trợ lý Google, v.v.), vận tải hàng loạt tự động, hàng khơng chơi game máy tính Gần đây, AI bắt đầu tích hợp vào y học để cải thiện việc chăm sóc bệnh nhân cách tăng tốc quy trình đạt độ xác cao hơn, mở đường cung cấp dịch vụ chăm sóc sức khỏe tổng thể tốt Hình ảnh, slide bệnh lý bệnh án điện tử bệnh nhân đánh giá máy học, hỗ trợ q trình chẩn đốn, điều trị bệnh nhân nâng cao lực bác sĩ document, khoa luan9 of 98 tai lieu, luan van10 of 98 Kỷ nguyên chăm sóc sức khỏe cơng nghệ hướng tới định lượng phân tích hiệu tín hiệu điện tâm đồ để hỗ trợ bác sĩ đánh giá nguy bệnh nhân Những năm qua, gia tăng lớn hồ sơ sức khỏe điện tử chứa sưu tập số hóa với Machine Learning (ML) tạo nhiều hội cho ngành y tế Sự phát triển áp dụng công nghệ ML áp dụng để tối đa hóa thơng tin trích xuất từ tín hiệu ECG cách tồn diện Các thuật tốn học sâu áp dụng cho liệu lớn điện tâm đồ, có khả xác định nhịp tim bất thường rối loạn chức học, đồng thời hỗ trợ định chăm sóc sức khỏe Cho đến ngày nay, ECG nằm số phương tiện dễ tiếp cận nhất, hiệu chi phí khơng xâm lấn để đánh giá hoạt động chức tim Nhờ ưu điểm trên, việc ứng dụng trí tuệ nhân tạo việc xử lý tín hiệu điện tâm đồ có tiềm lớn y học, nhiên việc quản lý phân loại liệu cịn nhiều vấn đề Do chúng tơi thực nghiên cứu: "Chẩn đoán bệnh lý tim mạch dựa điện tâm đồ sử dụng kỹ thuật AI" nhằm mục tiêu sau đây: • Biểu diễn liệu ECG • Xây dựng mơ hình dự đốn bệnh tim phì đại document, khoa luan10 of 98 tai lieu, luan van31 of 98 b K-fold Cross Validation K-fold Cross Validation phương pháp thống kê sử dụng nhằm đánh giá hiệu mơ hình học máy điều kiện liệu thu không đủ lớn so sánh nhằm chọn mơ hình tối ưu cho tốn đặt Kỹ thuật bao gồm bước: • Xáo trộn liệu cách ngẫu nhiên • Chia liệu thành k nhóm • Với nhóm thực hiện: sử dụng nhóm để đánh giá hiệu mơ hình, nhóm khác tập training, sau huấn luyện đánh giá mơ hình • Đánh giá hiệu mơ hình dựa trung bình kết dự đoán 23 document, khoa luan31 of 98 tai lieu, luan van32 of 98 CHƯƠNG 3: KẾT QUẢ NGHIÊN CỨU 3.1 Xác định đỉnh R khoảng R-R Nghiên cứu sử dụng tín hiệu điện tâm đồ 12 chuyển đạo để phân tích Đối với chuyển đạo, liệu đọc, sau sử dụng FFT để chuyển tín hiệu từ biểu diễn miền thời gian sang biểu diễn miền tần số Hình 3.1 3.2 cho thấy biểu diễn tín hiệu điện tâm đồ chuyển đạo DI miền thời gian miền tần số mẫu điện tâm đồ bình thường Hình 3.1: Biểu diễn điện tâm đồ chuyển đạo DI bệnh nhân Qua hình ảnh biểu diễn điện tâm đồ, thấy ghi điện tâm đồ mẫu khác nhau, số mẫu có tín hiệu nhiễu, tín hiệu nhiễu ảnh hưởng đến thuật toán xác định đỉnh R 24 document, khoa luan32 of 98 tai lieu, luan van33 of 98 Hình 3.2: Miền tần số tín hiệu điện tim sau FFT Dữ liệu biểu diễn miền tần số cho biết biên độ tần số sóng tạo thành tín hiệu ECG Sóng có biên độ lớn biểu diễn miền tần số sóng đại diện cho đỉnh R Dựa vào biên độ sóng này, đỉnh R xác định miền thời gian Kết cho thấy phương pháp tìm kiếm đỉnh R ghi ECG có trường hợp phát thiếu sai đỉnh Hình 3.3: Thuật tốn xác định đỉnh R Hình 3.3 thể thuật tốn phát đỉnh R, ta thấy thuật tốn phát xác đỉnh R Tuy nhiên, tín hiệu điện tâm đồ bị nhiễu, dẫn đến thuật tốn phát thiếu sai đỉnh R Điều ảnh hưởng đến kết 25 document, khoa luan33 of 98 tai lieu, luan van34 of 98 phép chuẩn hóa 3.2 Kết hợp chuẩn hóa khoảng R-R Đối với bệnh nhân, số lượng thời gian khoảng R-R khác Vì vậy, cần phải kết hợp khoảng R-R chuẩn hóa kết để phân tích Sau kết hợp chuẩn hóa, liệu bệnh nhân biểu diễn ma trận (1x100) biểu diễn cho khoảng R-R bệnh nhân 10 giây Biểu diễn khoảng R-R sau kết hợp chuẩn hóa 20 mẫu nhóm biểu diễn hình 3.3 3.4: Hình 3.4: Biểu diễn khoảng R-R sau chuẩn hóa chuyển đạo DI 20 bệnh nhân mắc bệnh phì đại tim Qua hình 3.4 nhận thấy khoảng R-R sau chuẩn hóa chuyển đạo DI bệnh nhân mắc phì đại tim có hình dạng tương đồng thuật tốn xác định tương đối xác đỉnh R Hơn nữa, có tín hiệu nhiễu hình Từ sử dụng tín hiệu chuyển đạo DI để làm liệu đầu vào cho mơ hình có khả cho kết có độ xác cao 26 document, khoa luan34 of 98 tai lieu, luan van35 of 98 Hình 3.5: Biểu diễn khoảng R-R sau chuẩn hóa chuyển đạo DI 20 người bình thường Hình 3.5 biểu diễn khoảng R-R sau chuẩn hóa chuyển đạo DI người bình thường có nhiễu so với người mắc bệnh, điều ghi điện tâm đồ người mắc bệnh có tín hiệu nhiễu nhiều Khi quan sát hình dạng sóng T hai nhóm mắc bệnh khơng mắc bệnh, thấy sóng T người bị bệnh có điện áp thấp hơn, tiêu chí quan trọng việc chẩn đốn phì đại tim Hình 3.6: Biểu diễn khoảng R-R sau chuẩn hóa chuyển đạo V2 20 người mắc bệnh phì đại tim 27 document, khoa luan35 of 98 tai lieu, luan van36 of 98 Hình 3.7: Biểu diễn khoảng R-R sau chuẩn hóa chuyển đạo V2 20 người bình thường Quan sát hình 3.6 3.7 thấy chuyển đạo V2 người mắc bệnh người bình thường sau chuẩn hóa có nhiều tín hiệu bị nhiễu, dẫn đến kết đưa vào đánh giá có độ xác thấp Ngun nhân tín hiệu bị nhiễu thuật toán xác định đỉnh R sai ghi điện tâm đồ có tín hiệu nhiễu từ đầu 3.3 Kết chẩn đốn mơ hình Các ma trận biểu diễn khoảng R-R mẫu liệu đầu vào để huấn luyện cho mô hình Logistic Regression Chúng tơi sử dụng phương pháp Cross Valadition để đánh giá kết mà mơ hình đưa chẩn đốn liệu chưa nhìn thấy Tập liệu chia làm 10 tập liệu con, tập sử dụng để chẩn đốn tập cịn lại sử dụng để huấn luyện mơ hình Độ xác tính trung bình cộng 10 lần chạy Kết thu cho thấy mơ hình liệu ECG 12 chuyển đạo sau xử lý trình bày bảng 3.1: 28 document, khoa luan36 of 98 tai lieu, luan van37 of 98 Bảng 3.1: Độ xác mơ hình Mơ hình Độ xác Độ lệch chuẩn DI 74% 0,1 DII 62,5% 0,08 DIII 64,5% 0,1 AVR 63% 0,12 AVL 57% 0,08 AVF 54% 0,15 V1 56,5% 0,09 V2 51% 0,08 V3 55,5% 0,08 V4 53% 0,1 V5 69% 0,13 V6 71,5% 0,1 Có thể thấy cấc chuẩn đạo DI, DII, DIII, AVR, V5, V6 có độ xác cao 60% Các chuẩn đạo lại có độ xác thấp AVL, AVF, V1, V2, V3, V4 Chuyển đạo có độ xác cao chuyển đạo DI lên tới 74% Chuyển độ có độ xác thấp chuyển đạo V2 với 51% Các ma trận nhiễu từ mơ hình có độ xác cao thấp trình bày hình 3.8 3.9: 29 document, khoa luan37 of 98 tai lieu, luan van38 of 98 Hình 3.8: Ma trận nhiễu mơ hình phân tích chuyển đạo DI precision = recall = F1 = × 74 = 0, 79 74 + 20 74 = 0, 74 74 + 26 0, 79 × 0, 74 = 0, 76 0, 79 + 0, 74 Fβ (β = 2) = (1 + 22 ) × 0, 79 × 0, 74 = 0, 75 (22 × 0, 79) + 0, 74 30 document, khoa luan38 of 98 tai lieu, luan van39 of 98 Hình 3.9: Ma trận nhiễu mơ hình phân tích chuyển đạo V2 Qua ma trận nhiễu số tính được, ta thấy số bao gồm F1 Fβ mơ hình xử lý tín hiệu từ chuyển đạo DI có giá trị tốt (>0,75) precision = recall = F1 = × 46 = 0, 51 46 + 44 46 = 0, 46 46 + 54 0, 51 × 0, 46 = 0, 48 0, 51 + 0, 46 Fβ (β = 2) = (1 + 22 ) × 0, 51 × 0, 46 (22 × 0, 51) + 0, 46 = 0, 47 Giá trị F1 Fβ mơ hình xử lý tín hiệu từ chuyển đạo V2 cho thấy mơ hình thực phân loại chưa tốt số đánh giá có giá trị thấp (