ĐẠI HỌC QUỐC GIA TP.HCM
TRƯỜNG ĐẠI HỌC BÁCH KHOA
-
Trang 2CÔNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI TRƯỜNG ĐẠI HỌC BÁCH KHOA – ĐHQG-HCM Cán bộ hướng dẫn khoa học : PGS TS Lưu Thành Tùng
Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm:
(Ghi rõ họ, tên, học hàm, học vị của Hội đồng chấm bảo vệ luận văn thạc sĩ) 1 PGS.TS Nguyễn Quốc Chí - Chủ tịch hội đồng
2 PGS.TS Lê Mỹ Hà – Phản biện 1 3 PGS.TS Nguyễn Hùng – Phản biện 2 4 PGS.TS Lê Đức Hạnh - Ủy viên 5 TS Phạm Phương Tùng – Thư ký
Xác nhận của Chủ tịch Hội đồng đánh giá LV và Trưởng Khoa quản lý chuyên ngành sau khi luận văn đã được sửa chữa (nếu có)
Trang 3
NHIỆM VỤ LUẬN VĂN THẠC SĨ
Họ tên học viên: Phan Khánh Duy MSHV:2170093 Ngày, tháng, năm sinh: 14/2/1998 Nơi sinh: Tiền Giang Chuyên ngành: Kỹ thuật Cơ – điện tử Mã số : 8520114
I TÊN ĐỀ TÀI:
CHẨN ĐOÁN RỐI LOẠN NHỊP TIM DỰA TRÊN XỬ LÝ VÀ PHÂN TÍCH TÍN HIỆU PPG (Arrhythmia Detection Based on Photoplethysmography Signal)
II NHIỆM VỤ VÀ NỘI DUNG:
Nghiên cứu thuật toán phát hiện rối loạn nhịp tim
Nghiên cứu thuật toán đánh giá tín hiệu PPG thô nhằm xem xét và giữ lại các đoạn tín hiệu tốt, không bị ảnh hưởng bởi nhiễu do cử động của người dùng
III NGÀY GIAO NHIỆM VỤ : 14/02/2022
IV NGÀY HOÀN THÀNH NHIỆM VỤ: 20/6/2023 V CÁN BỘ HƯỚNG DẪN: PGS.TS Lưu Thanh Tùng
Tp HCM, ngày 20 tháng 6 năm 2023
CÁN BỘ HƯỚNG DẪN
(Họ tên và chữ ký) CHỦ NHIỆM BỘ MÔN ĐÀO TẠO (Họ tên và chữ ký)
TRƯỞNG KHOA CƠ KHÍ
(Họ tên và chữ ký)
Trang 4I
LỜI CẢM ƠN
Lời đầu tiên, tôi xin được cảm ơn gia đình, những luôn ở phía sau đồng hành và ủng hộ tôi trên con đường học tập, nghiên cứu Trong suốt đại dịch Covid 19 vừa qua tuy có nhiều khó khăn, nhưng Thầy, PGS.TS Lưu Thanh Tùng đã tạo mọi điều kiện, hướng dẫn tôi trong quá trình học tập cũng như trong việc hoàn thành luận văn này, xin chân thành gửi lời cảm ơn đến thầy
Do giới hạn kiến thức và khả năng lý luận của bản thân còn nhiều thiếu sót và hạn chế, kính mong sự chỉ dẫn và đóng góp của các Thầy, Cô để bài luận văn của tôi được hoàn thiện hơn Xin chân thành cảm ơn!
Học viên
Phan Khánh Duy
Trang 5II
TÓM TẮT
Luận văn trình bày hai thuật toán phát hiện và loại bỏ các đoạn tín hiệu
photoplethysmography (PPG) bị ảnh hưởng do cử động và thuật toán phát hiện rối loạn
nhịp tim dựa trên tín hiệu PPG dựa trên các thuật toán phân tích tín hiệu và mô hình học sâu Trong đó, thuật toán phát hiện và loại bỏ các đoạn tín hiệu PPG bị ảnh hưởng do cử động có chức năng xử lý và lọc các đoạn tín hiệu PPG đạt tiêu chuẩn cho các ứng dụng sử dụng tín hiệu PPG, một trong số đó là phát hiện rối loạn nhịp tim Và thuật toán phát hiện rối loạn nhịp tim dựa trên tín hiệu PPG có chức năng phát hiện các đoạn tín hiệu PPG có xuất hiện rối loạn nhịp tim gây ra bởi rung tâm nhĩ và ngoại thu tâm thất Kết quả đánh giá hai thuật toán được tiến hành trên hai bộ dữ liệu khác nhau là bộ dữ liệu MIMICIII và bộ dữ liệu từ bệnh viện Thống Nhất
ABSTRACT
The thesis presents two algorithms for detecting and removing motion artifacts in photoplethysmography (PPG) signals and an algorithm for detecting cardiac arrhythmias based on PPG signals using signal analysis techniques and deep learning models The algorithm for detecting and removing motion-induced artifacts in PPG signals aims to process and filter the PPG segments to meet the standards required for PPG signal applications, one of which is the detection of cardiac arrhythmias The algorithm for detecting cardiac arrhythmias based on PPG signals is designed to identify PPG segments exhibiting arrhythmias caused by atrial and ventricular ectopic beats The evaluation of the two algorithms is conducted on two different datasets: the MIMIC-III dataset and the dataset from Thong Nhat Hospital
Trang 6III
LỜI CAM ĐOAN
Tôi xin cam đoan đây là bài báo cáo luận văn tốt nghiệp của tôi đã thực hiện trong thời gian qua Những số liệu và kết quả nghiên cứu là trung thực, hoàn toàn được thực hiện tại trường Đại học Bách Khoa TP.HCM, không sao chép bất kỳ nguồn nào khác Ngoài ra, trong bài báo cáo có sử dụng một số nguồn tài liệu tham khảo đã được trích dẫn nguồn và chú thích rõ ràng Tôi xin hoàn toàn chịu trách nhiệm trước bộ môn, khoa và nhà trường về sự cam đoan này
TP.HCM, ngày … tháng … năm 2023
Học viên
Phan Khánh Duy
Trang 7IV
MỤC LỤC
LỜI CẢM ƠN ITÓM TẮT IILỜI CAM ĐOAN IIIMỤC LỤC IVDANH SÁCH BẢNG BIỂU VIIIDANH SÁCH HÌNH ẢNH IX
2.1.2 Phương pháp sử dụng mô hình học máy 9
2.1.3 Phương pháp sử dụng mô hình học sâu 10
2.1.4 So sánh các phương pháp 15
Trang 8V
2.2 Các phương pháp nhận diện và loại bỏ các đoạn tín hiệu PPG bị ảnh
hưởng do cử động 20
2.2.1 Phương pháp sử dụng chỉ số đánh giá chất lượng 20
2.2.2 Phương pháp sử dụng mẫu tín hiệu PPG (photoplethysmographic waveform) 222.2.3 So sánh các phương pháp 23
2.3 Phương án phát triển thuật toán 24
2.3.1 Thuật toán nhận diện và loại bỏ các đoạn tín hiệu PPG bị ảnh hưởng do cử động 242.3.2 Thuật toán phát hiện rối loạn nhịp tim dựa trên tín hiệu PPG 24CHƯƠNG 3: CƠ SỞ LÝ THUYẾT 26
3.1 Tín hiệu PPG 26
3.1.1 Nguồn gốc của tín hiệu PPG 26
3.1.2 Thiết bị thu tín hiệu PPG 28
3.3.2 Cấu trúc của mạng autoencoder 33
3.3.3 Hàm mất mát và huấn luyện mạng autoencoder 34
3.4 Mạng thần kinh tích chập 35
3.5 Mạng thần kinh bộ nhớ ngắn-dài 37
Trang 9VI
CHƯƠNG 4: XÂY DỰNG THUẬT TOÁN 40
4.1 Dữ liệu sử dụng trong luận văn 40
4.1.1 Bộ dữ liệu MIMICIII 41
4.1.2 Bộ dữ liệu từ bệnh viện Thống Nhất 41
4.2 Thuật toán tiền xử lý tín hiệu PPG 42
4.2.1 Thuật toán 42
4.2.2 Thuật toán tìm đỉnh và thuật toán tạo mẫu 43
4.2.3 Mô hình autoencoder và phát hiện đoạn tín hiệu bị ảnh hưởng do cứ động 464.2.4 Phương pháp đánh giá thuật toán 48
4.3 Thuật toán phân loại rối loạn nhịp tim 49
4.3.1 Thuật toán 49
4.3.2 Biến đổi thành miền thời gian – tần số 49
4.3.3 Cấu trúc mô hình học sâu 55
4.3.4 Huấn luyện và đánh giá mô hình 57
5.2 Phát hiện rối loạn nhịp tim 64
5.2.1 Phổ thời gian – tần số của tín hiệu PPG 64
Trang 10VII
5.2.2 Cấu trúc của mô hình học sâu 68
5.2.3 Kết quả huấn luyện 70
5.2.4 Kết quả dự đoán trên tập kiểm tra 76
5.2.5 So sánh hai mô hình CNN và CNN-LSTM 82
5.2.6 So sánh với các nghiên cứu liên quan 83
CHƯƠNG 6: KẾT LUẬN VÀ KIẾN NGHỊ NHỮNG NGHIÊN CỨU TIẾP THEO866.1 Kết luận 86
6.1.1 Thuật toán đánh giá tín hiệu PPG 86
6.1.2 Thuật toán phát hiện rối loạn nhịp tim 86
6.2 Kiến nghị những nghiên cứu tiếp theo 87
TÀI LIỆU THAM KHẢO 88
PHẦN LÝ LỊCH TRÍCH NGANG 95
Trang 11VIII
DANH SÁCH BẢNG BIỂU
Bảng 1.1: Số liệu trường hợp mắc các bệnh rối loạn nhịp tim 1
Bảng 4.1: Thông số thiết bị lấy mẫu 41
Bảng 4.2: Đặc điểm của dữ liệu thu từ bệnh viện Thống Nhất 42
Bảng 4.3: Cấu trúc mạng autoencoder dùng trong xử lý tín hiệu 46
Bảng 5.1: Cấu trúc mạng CNN dùng trong phát hiện rối loạn nhịp tim 68
Bảng 5.2: Cấu trúc mạng CNN-LSTM dùng trong phát hiện rối loạn nhịp tim 69
Bảng 5.3:Giá trị hàm mất mát và độ chính xác trung bình của bốn epoch cuối của mô hình CNN 73
Bảng 5.4: Giá trị hàm mất mát và độ chính xác trung bình của bốn epoch cuối của mô hình CNN 75
Bảng 5.5: Bảng thể hiện kết quả của hai mô hình trên bộ dự liệu kiểm tra từ MIMICIII với bộ tham số được huấn luyện trong các fold khác nhau 76
Bảng 5.6: Bảng thể hiện kết quả của hai mô hình trên bộ dự liệu kiểm tra từ MIMICIII với bộ tham số được huấn luyện trong các fold khác nhau 79
Bảng 5.7: Bảng so sánh một số nghiên cứu ứng dụng mô hình học sâu trong phát hiện rối loạn nhịp tim dựa trên tín hiệu PPG 85
Trang 12IX
DANH SÁCH HÌNH ẢNH
Hình 1.1: Đo điện tâm đồ bằng thiết bị holter [5] 2Hình 2.1: Tín hiệu PPG có sự khác biệt giữa người không mắc và mắc các bệnh rối loạn nhịp tim [10] 6Hình 2.2: Khoảng cách đỉnh (PP) của tính hiệu PPG [11] 7Hình 2.3: Sơ đồ quy trình chung của các thuật toán phát hiện rối loạn nhịp tim bằng phương pháp thống kê 8Hình 2.4: Sơ đồ quy trình chung của các thuật toán phát hiện rối loạn nhịp tim bằng phương pháp mô hình học máy 10Hình 2.5: Sơ đồ quy trình chung của các thuật toán phát hiện rối loạn nhịp tim bằng phương pháp mô hình học sâu 10Hình 2.6: (a) Kết quả phát hiện các trường hợp rối loạn nhịp tim và không rối loạn nhip tim của phương pháp sử dụng mô hình DCNN và các phương pháp khác (b) Biểu đồ thể hiện sự phân cụm của các bệnh dựa trên hai chiều đầu của lớp ẩn, cho thấy tín hiệu quả trong việc phát hiện nhịp tim [10] 12Hình 2.7: Phương pháp sử dụng kết hợp giữa phân tích đặc tính và mạng CNN [20] 13Hình 2.8: Mô hình kết hợp CNN và LSTM để dự đoán xác suất mắc bệnh rối loạn nhịp tim [22] 14Hình 2.9: Mô hình học phân loại các trường hợp mắc và không mắc rung tâm nhĩ dựa trên dữ liệu đầu vào là biến đơi wavelet của tín hiệu PPG thô và mô hình kết hợp CNN và LSTM [23] 15Hình 2.10: Sự khác biệt về phổ thời gian – tần số từ biến đổi wavelet giữa tín hiệu PPG mắc và không mắc rối loạn nhịp tim (a) Tín hiệu PPG, ECG và phổ thời gian –
Trang 13X
tần số trong trường hợp không có rối loạn nhịp tim (b), (c) và (d) Tín hiệu PPG,
ECG và phổ thời gian – tần số trong trường hợp khi có rối loạn nhịp tim [23] 15
Hình 2.11: (a) So sánh kết quả phân loại rung tâm nhĩ dựa trên hệ số Kappa với các độ dài mẫu khác nhau lần lượt là 30s, 60s, 120s [24] (b) So sánh kết quả phân loại rung tâm nhĩ dựa trên đường cong ROC với các độ dài mẫu khác nhau lần lượt là 1 phút, 2 phút và 10 phút [15] 17
Hình 2.12: Sơ đồ thể hiện thuật toán phân loại rối loạn nhịp tim dựa trên mô hình SVM và RFE [25] 17
Hình 2.13: Sự khác nhau của chỉ số kurtosis và skewness trong trong phân phối của các tín hiệu PPG với mức độ nhiễu khác nhau [28] 21
Hình 2.14: Sơ đồ thuật toán sử dụng hệ số thống kê để phát hiện đoạn PPG bị nhiễu và giá trị kurtosis (a), skewness (b) và độ lệch chuẩn (c) của từng tín hiệu đoạn trên tín hiệu PPG gốc (a) Giá trị của các chỉ số này thể hiện rõ sự khác biệt ở các đoạn tín hiệu bị nhiễu do cứ động [27] 22
Hình 3.1: (a) Cấu trúc mô dưới da, (b) những ánh sáng có bước sóng khác nhau có mức độ đâm xuyên khác nhau [35] 27
Hình 3.2: Thiết bị PPG của Hertzman qua các năm (a) (b) 1937, (c) 1938 [35] 27
Hình 3.3: Hệ thống thu thập tín hiệu PPG và tín hiệu PPG [35] 28
Hình 3.4:Cấu hình một số mạch phát của tín hiệu PPG [35] 29
Hình 3.5: Tín hiệu PPG thay đổi theo chu kỳ co bóp của tim với thành phần DC và thành phần DC Thành phần AC chủ yếu xuất hiện do sự thay đổi lưu lượng máy ở động mạch theo chu kỳ tim (hình bên dưới), trong khi lưu lượng máu của tĩnh mạch hầu như không thay đổi và chủ yếu đóng góp vào thành phần DC của tín hiệu 30
Hình 3.6: Sự ảnh hưởng của các yếu tố bên trong cơ thể đến tín hiệu PPG 31
Hình 3.7: Các vị trí đặt điện cực của 12 chuyển đạo khi đo điện tâm đồ [36] 32
Trang 14XI
Hình 3.8: Tín hiệu ECG đầy đủ gồm sóng P, bộ phức QRS và sóng T [37] 32
Hình 3.9: Ngoại thu tâm thất [37] 33
Hình 3.16: Cấu trúc của mạng LSTM (nguồn: internet) 38
Hình 4.1: Sơ đồ thuật toán phát hiện và loại bỏ đoạn tín hiệu PPG bị ảnh hưởng do tác động của cử động 43
Hình 4.2: Kết quả thuật toán bắt đỉnh cho tín hiệu PPG từ bộ dữ liệu của bệnh viện Thống Nhất (a), và dữ liệu MIMICIII (b) Các hình tròn màu tím là kết quả của thuật toán bắt đỉnh 44
Hình 4.3: Tín hiệu PPG gốc (hình trên) và tín hiệu PPG đã trừ đường bao dưới (hình dưới) 44
Hình 4.4: (a) Tín hiệu PPG, (b) Một nhịp của tín hiệu PPG trích xuất từ tín hiệu (vùng màu đỏ) bằng thuật toán tìm đỉnh, (c) Nhịp sau khi chuẩn hóa để thu được một mẫu tín hiệu PPG 45
Hình 4.5: Một số mẫu tín hiệu từ dữ liệu MIMICIII dùng để huấn luyện mô hình autoencoder 48
Trang 15XII
Hình 4.6: Sơ đồ thể hiện thuật toán phát hiện rối loạn nhịp tim từ tín hiệu PPG 49Hình 4.7: Phổ thời gian – tần số từ biến đổi wavelet của tín hiệu 𝑥 = 𝑠𝑖𝑛(𝑡2) vẽ bằng phần mềm Matlab 50Hình 4.8: Phổ thời gian – tần số từ biến đổi Hilbert của tín hiệu 𝑥 = 𝑠𝑖𝑛(𝑡2) vẽ bằng phần mềm Matlab Phổ thể hiện rõ sự thay đổi của tần số tín hiệu gần bằng một làm 𝑓𝑡 = 2𝑡 với 𝑡 là thời gian Phần dao động ở đầu và đuôi tín hiệu là do thuật toán tín toán trên miền rời rạc và thời gian có giới giạn của Matlab.Nếu tính toán với tín hiệu trên miền liên tục và thời gian vô hạn thì tần số sẽ đúng bằng f𝑡 = 2𝑡 51Hình 4.9: (a) phân tích VMD của tín hiệu 𝑥 = 𝑐𝑜𝑠4𝜋𝑡 + 2𝑐𝑜𝑠20𝜋𝑡 + 4𝑐𝑜𝑠60𝜋𝑡 +0,01 𝑁(𝑡), với bốn kênh IMF đại diện cho bốm thành phần tần số (b) Phổ thời gian – tần số của tín hiệu thông qua biến đổi Hilbert thể hiện bốn kênh IMF dưới dạng tần số tức thời và biên đô tức thời 53
Hình 4.10: Hiện tượng end-effect xảy ra ở hai vùng phổ từ 0 giây đến 0,1 giây và từ
0,9 giây đến 1 giây làm các vùng của phổ thời gian – tần số ở thời điểm đầu và cuối tín hiệu không chính xác 54Hình 4.11: Cấu trúc tổng quát mô hình CNN-LSTM 56Hình 4.12: Tín hiệu ECG và tín hiệu PPG của người không mắc bệnh rối loạn nhịp tim từ dữ liệu MIMICIII 58Hình 4.13: Tín hiệu ECG và tín hiệu PPG của người không mắc bệnh rối loạn nhịp tim từ dữ liệu MIMICIII 58Hình 4.14: Tín hiệu ECG và tín hiệu PPG của người không mắc bệnh rối loạn nhịp tim từ dữ liệu MIMICIII 58Hình 4.15: Tín hiệu ECG và tín hiệu PPG của người mắc bệnh rối loạn nhịp tim từ dữ liệu MIMICIII 59
Trang 16XIII
Hình 4.16: Tín hiệu ECG và tín hiệu PPG của người mắc bệnh rối loạn nhịp tim từ dữ liệu MIMICIII 59Hình 5.1: Giá trị hàm mất mát trong quá trình huấn luyện mạng autoencoder 61Hình 5.2: Một số ví dụ về các mẫu được xử ly bằng mô hình autoencoder từ tín hiệu PPG của người không mắc bệnh rối loạn nhịp tim 62Hình 5.3: Một số ví dụ về các mẫu được xử ly bằng mô hình autoencoder từ tín hiệu
PPG của người không mắc bệnh rối loạn nhịp tim 62
Hình 5.4: Phân phối giá trị hàm mất mát của phầm huấn luyện và phần thẩm dịnh sau khi được tính toán từ mô hình autoencoder 63Hình 5.5: Kết quả của thuật toán xử lý tín hiệu dựa trên mô hình autoencoder Đường màu cam là đường mức thể hiện việc chọn và loại bỏ tín hiệu tương ứng, với mức cao là chọn và mức thấp là loại bỏ Các ô màu xanh thể hiện đoạn tín hiệu được dán nhãn là đạt yêu cầu Các vòng trong màu đỏ khoanh vùng các cơn rối loạn nhịp tim 64Hình 5.6: Phân tích VMD và phổ tần số thời gian – tần số của của tín hiệu PPG từ người không mắc bệnh rối loạn nhịp tim (a) Tín hiệu PPG, (b) Tín hiệu ECG, (c) Các kênh IMF, (d) Phổ FFT, (e) Phổ thời gian – tần số, (f) Kết quả của thuật toán tìm cạnh trên phổ thời gian – tần só, (g) ma trận hiệp phương sai giữ các IMF và tín hiệu PPG gốc 66Hình 5.7: Phân tích VMD và phổ tần số thời gian – tần số của của tín hiệu PPG từ người có một cơn rối loạn nhịp tim (a) Tín hiệu PPG, (b) Tín hiệu ECG, (c) Các kênh IMF, (d) Phổ FFT, (e) Phổ thời gian – tần số, (f) Kết quả của thuật toán tìm cạnh trên phổ thời gian – tần só, (g) ma trận hiệp phương sai giữ các IMF và tín hiệu PPG gốc 67Hình 5.8: Phân tích VMD và phổ tần số thời gian – tần số của của tín hiệu PPG từ người mắc rối với số cơn loạn nhịp dày đặc (a) Tín hiệu PPG, (b) Tín hiệu ECG, (c)
Trang 17XIV
Các kênh IMF, (d) Phổ FFT, (e) Phổ thời gian – tần số, (f) Kết quả của thuật toán tìm cạnh trên phổ thời gian – tần só, (g) ma trận hiệp phương sai giữ các IMF và tín hiệu PPG gốc 68Hình 5.9: Đồ thị giá trị hàm mất mát (trái) và độ chính xác (phải) của fold 1 trong quá trình huấn luyện 71Hình 5.10: Đồ thị giá trị hàm mất mát (trái) và độ chính xác (phải) của fold 2 trong quá trình huấn luyện 71Hình 5.11: Đồ thị giá trị hàm mất mát (trái) và độ chính xác (phải) của fold 3 trong quá trình huấn luyện 72Hình 5.12: Đồ thị giá trị hàm mất mát (trái) và độ chính xác (phải) của fold 4 trong quá trình huấn luyện 72Hình 5.13: Đồ thị giá trị hàm mất mát (trái) và độ chính xác (phải) của fold 5 trong quá trình huấn luyện 72Hình 5.14: Đồ thị giá trị hàm mất mát (trái) và độ chính xác (phải) của fold 1 trong quá trình huấn luyện 73Hình 5.15: Đồ thị giá trị hàm mất mát (trái) và độ chính xác (phải) của fold 2 trong quá trình huấn luyện 74Hình 5.16: Đồ thị giá trị hàm mất mát (trái) và độ chính xác (phải) của fold 3 trong quá trình huấn luyện 74Hình 5.17: Đồ thị giá trị hàm mất mát (trái) và độ chính xác (phải) của fold 4 trong quá trình huấn luyện 74Hình 5.18: Đồ thị giá trị hàm mất mát (trái) và độ chính xác (phải) của fold 5 trong quá trình huấn luyện 75
Trang 181
CHƯƠNG 1: MỞ ĐẦU VÀ ĐẶT VẤN ĐỀ 1.1 Tín hiệu PPG và rối loạn nhịp tim
Tim là một bộ phận vô cùng quan trọng trong cơ thể của mỗi chúng ta Với chức năng là một chiếc máy bơm cung cấp oxy và chất dinh dưỡng đến từng cơ quan, thì bất cứ bất ổn nào xảy ra trong quá trình hoạt động của tim đều dẫn đến các hậu quả nghiệm trọng Trong đó, rối loạn nhịp tim là một trong các bất ổn về tim đáng lo ngại Theo thống kê Bảng 1.1, số lượng người mắc các vấn đề về rối loạn nhịp tim khá cao
Bảng 1.1: Số liệu trường hợp mắc các bệnh rối loạn nhịp tim
Các loại rối loạn nhịp tim
Giai đoạn
Tình trạng Khu vực Tham khảo
Rung nhĩ 2013 467.000 ca nhập viện và hơn 99.000 ca tử vong mỗi năm
Bắc Mĩ
[1] Rung nhĩ 2010 33,5 triệu người mắc
[2] Rối loạn nhịp tim 2010 3.000 bệnh nhân mỗi
[3] Mặc dù trong hầu hết các trường hợp rối loạn nhịp tim không dẫn đến các nguy hiểm ngây lập tức đối với sức khỏe, nhưng hoạt động bất thường của tim góp phần hình thành các huyết khối cũng như các hậu quả trong việc cung cấp máu kém hiệu quả đến các cơ quan Và đây chính là tiền đề để dẫn đến các căn bệnh nguy hiểm [1], [4] tiêu biểu như đột quỵ, suy tim, đột tử:
Đột quỵ
Rung tâm nhĩ là loại rối loạn nhịp tim phổ biến (1/3 các trường hợp rối loạn nhip tim) và cũng là tác nhân làm tăng nguy cơ đột quỵ Đây là rối loạn mà tâm nhĩ chỉ rung với tần số cao nhưng không co bóp để tống máu về tâm thất Điều này tạo điều kiện cho các huyết khối dễ hình thành, làm tắc mạch và dẫn đến đột quỵ
Trang 192
Đột tử
Rung tâm thất là loại nguy hiểm nhất và có nguy cơ dẫn đến đột tử Biểu hiện của bệnh là tâm thất co bóp hỗn loạn không tuân theo chu kỳ của tim vì vậy chức năng của hệ tuần hoàn không được đảm bảo dẫn đến nguy hiểm đến tính mạng cần được cấp cứu ngay
Suy tim
Hệ thần kinh tự động và hệ tuần hoàn có vai trò mật thiết vì vậy khi mắc các bệnh liên quan đến rối loạn nhịp tim làm cho máu không đủ cung cấp cho các cơ quan thì hệ thần kinh sẽ bắt tim làm việc nhiều hơn dẫn đến các tế bào cơ tim làm việc quá sức
Rối loạn nhip tim khó chẩn đoán trong khám lâm sàn do trong giai đoạn đầu của bệnh, các xung nhịp lỗi không xuất hiện thường xuyên mà chỉ xuất hiện trong một khoảng thời gian, đặc biệt là ngoại thu tâm thất Điều này làm giảm khả năng chẩn đoán chính xác bệnh và làm tăng số lần thăm khám Vì vậy, các thiết bị theo dõi trong thời
gian dài được sử dụng như holter, thẻ tim, Hình 1.1 Bệnh nhân sẽ đeo các thiết bị này
trong một khoảng thời gian đủ dài để theo dõi hoạt động của tim
Hình 1.1: Đo điện tâm đồ bằng thiết bị holter [5].
Tuy nhiên nhược điểm của các thiết bị theo dõi trong thời gian dài hạn chế ở các điểm sau:
Trang 203
Giá thành cao và không phổ biến cho sử dụng cá nhân
Một số thiết bị gây bất tiện cho người dùng vì sự cồng kềnh và thao tác vận hành Ví dụ, holter với bản chất là một thiết bị đo điện tâm đồ thu nhỏ, vì vậy khi sử dụng, người bệnh phải dán các điện cực lên người nên sẽ gây cản trở và khó chịu trong sinh hoạt [6]
Những năm gần đây, với sự phát triển của công nghệ, các thiết bị y tế trong lĩnh vực chăm sóc sức khỏe ngày càng nhỏ gọn và hiệu quả Trong đó, có thể kể đến là thiết
bị đo nồng độ oxy trong máu (pulse oximeter) có thể tích hợp trong các đồng hồ thông
minh rất tiện lợi Các thiết bị này hoạt động dựa trên việc xử lý tín hiệu
photoplethysmography (PPG) sinh ra do sự hấp thụ ánh sáng khác nhau của từng vị trí
trên cơ thể theo sự thay đổi lưu lượng máu và nồng độ phân tử O2HHb và HHb có trong hồng cầu
Do có thể theo dõi sự thay đổi lưu lượng máu nên trong hai thập kỉ qua đã có rất nhiều nghiên cứu sử dụng PPG để phát hiện và phân loại các bệnh rối loạn nhịp tim Các nghiên cứu đáng chú ý:
Dong Han, [7] sử dụng PPG kết hợp với Poincare’s Plot và mô hình học máy để phân loại các rối loạn nhịp tim như AF, PVC, PAC và nhịp tim bình thường Ngoài ra một số nghiên cứu khác sử dụng các mô hình học sâu để phát hiện
người bị bệnh rung tâm nhĩ, [8], [9]
Ưu điểm của thiết bị này so với các phương pháp truyền thống là: Giá thành rẻ mà bất kỳ ai cũng có thể mua trên thị trường
Gọn nhẹ nhờ được tích hợp trong các đồng hồ thông minh nên có thể sử dụng mọi lúc mọi nơi Một số thiết bị có thể kể đến như Oura (thế hệ thứ 3), Fitbit Charge 5, E4 wristband
Cách sử dụng đơn giản so với các thiết bị dựa trên điện tâm đồ
Trang 214
1.2 Đặt vấn đề
Có thể thấy rối loạn nhịp tim làm một căn bệnh nguy hiểm và có sự điều trị phức tạp, thêm vào đó với hiện trạng quá tải ở các bệnh viện công thì đây quả là một khó khăn đối với những người mắc bệnh May mắn thay với công nghệ chăm sóc sức khỏe và y tế từ xa, khả năng tiếp cận điều trị của người bệnh sẽ được cải thiện, hơn thế nữa, vấn đề về thiết bị đầu cuối nhằm hỗ trợ theo dõi bệnh tình sẽ được cải thiện đáng kể về hiệu quả và giá thành nhờ vào công nghệ PPG
Tuy nhiên hiện nay với ý tưởng sử dụng thiết bị PPG để hỗ trợ phát hiện rối loạn nhịp tim thì có hai vấn đề luôn được quan tâm:
Để sử dụng được thiết bị PPG trong sinh hoạt hằng ngày thì cần phải lọc nhiễu được tín hiệu hoặc ít nhất xác định được các đoạn tín hiệu tin cậy để phục vụ công tác tính toán xử lý để đưa ra kết quả Mặc dù hiện nay hầu hết các nghiên cứu đều chỉ thực hiện với các đoạn tín hiệu không quá nhiễu nhưng việc đánh giá đoạn tín hiệu nào là tốt nhất gặp phải vấn đề nhầm lẫn tín hiệu PPG ứng với biểu hiện của bệnh là tín hiệu nhiễu
Tín hiệu PPG có thể khác nhau ở các chủng người khác nhau do điều kiện sinh lý cơ thể ví dụ như màu da, nhưng hiện nay vẫn chưa có nghiên cứu nào tiến hành ở người Việt Nam
1.3 Mục tiêu và phạm vi nghiên cứu 1.3.1 Mục tiêu
Nghiên cứu thuật toán phát hiện rối loạn nhịp tim dựa trên mô hình học sâu với độ đặc hiệu, độ nhạy, độ chính xác đạt 95% với hai bộ dữ liệu khác nhau Nghiên cứu thuật toán đánh giá tín hiệu PPG thô nhằm xem xét và giữ lại các
đoạn tín hiệu tốt, không bị ảnh hưởng bởi nhiễu do cử động của người dùng
Trang 225
1.3.2 Phạm vi nghiên cứu
Nghiên cứu tập trung phân biệt giữa các trường hợp có và không có mắc rối loạn nhịp tim Trong đó rối loạn nhịp tim là do rung tâm nhĩ và ngoại thu tâm thất gây ra
1.4 Nội dung bài luận
Luận văn có cấu trúc gồm 5 chương: Chương 1: Mở đầu và đặt vấn đề Chương 2: Tổng quan
Chương 3: Cơ sở lý thuyết Chương 4: Xây dựng thuật toán Chương 5: Kết quả và thảo luận
Trang 236
2.1 Các phương pháp phát hiện rối loạn nhịp tim dựa trên tín hiệu PPG
Ý tưởng sử dụng tín hiệu PPG để phát hiện rối loạn nhịp tim xuất phát từ thực tế rằng, rối loạn nhịp tim thay đổi nhịp co bóp của tim dẫn đến sự thay đổi lưu lượng máu bơm đi khắp cơ thể Chính vì vậy, hệ quả dẫn đến là sự thay đổi của tín hiệu PPG Hình 2.1 cho thấy khi có sự xuất hiện của rối loạn nhịp tim, tín hiệu PPG trở nên không ổn định và có sự thay đổi rõ rệt về tần số và biên độ so với khi không có rối loạn nhịp tim
Hình 2.1: Tín hiệu PPG có sự khác biệt giữa người không mắc và mắc các bệnh rối loạn
nhịp tim [10]
Rối loạn nhịp tim có rất nhiều biến thể khác nhau như là rung tâm nhĩ, cuồng tâm nhĩ, co thắt tâm thất sớm và co thắt tâm nhĩ sớm Tuy nhiên hiện nay hầu hết các nhà nghiên cứu trong lĩnh vực này chỉ tập trung vào rung tâm nghĩ bởi sự nguy hiểm và độ phổ biến của nó
Hiện nay các phương pháp dựa trên PPG để chẩn đoán rối loạn nhịp tim chủ yếu
dựa trên các phương pháp dựa trên phân tích dữ liệu thực nghiệm (data-driven) Theo
Trang 247
đó, các nhà nghiên cứu thu thập tín hiệu PPG cùng một số thông số liên quan đến sức khỏe , tiền sử bệnh trên từng bệnh nhân hoặc tình nguyện viên, tiếp đến họ sẽ phân loại và “dán nhãn dữ liệu” tương ứng với tình trạng bệnh cụ thể bằng các phương pháp chẩn đoán truyền thống mà ở đây là tín hiệu điện tâm đồ (ECG) Sau khi hoàn thành công việc thu thập và dán nhãn dữ liệu, các mô hình phân tích dữ liệu được xây dựng để tìm ra mối liên hệ giữa PPG và rối loạn nhịp tim và từ đó phát hiện được rối loạn nhịp tim từ PPG Có ba phương pháp phân tích dữ liệu thực nghiệm được sử dụng rộng rãi trong các nghiên cứu trong phát hiện rối loạn nhịp tim dựa trên tín hiệu PPG gồm:
Sử dụng mô hình thống kê Sử dụng mô hình học máy Sử dụng mô hình học sâu
2.1.1 Phương pháp sử dụng mô hình thống kê
Xu hướng chung của các nghiên cứu sử dụng mô hình thống kê để chẩn đoán rối loạn nhịp tim là đưa ra một khoảng giá trị giới hạn cho các chỉ số, được tính toán dựa
trên chuỗi khoảng cách giữa các đỉnh của tín hiệu PPG (PP-interval), Hình 2.2
Hình 2.2: Khoảng cách đỉnh (PP) của tính hiệu PPG [11]
Thuật toán phát hiện rối loạn nhịp tim từ PPG của các nghiên cứu sử dụng phương pháp thông kê nhìn chung được tiến hành theo các bước gồm tiền xử lý
(preprocessing), tìm đỉnh (peak detection), tính toán chỉ số, phân loại Hình 2.3 mô tả
thuật toán để tiến hành phát hiện rối loạn nhịp tim bằng các phương pháp sử dụng mô hình thống kê Tiền xử lý (bước 1): có nhiệm vụ lọc nhiễu và đánh giá các đoạn tín hiệu PPG đủ tiêu chuẩn để có thể sử dụng trong việc phát hiện rối loạn nhịp tim Tìm đỉnh (bước 2): xác định các đỉnh của tín hiệu PPG, từ đó tính toán được khoảng thời gian giữa
Trang 258
các đỉnh Tính toán các chỉ số (bước 3): từ chuỗi khoảng cách đỉnh được tính toán ở bước 2, các chỉ số thống kê được tính toán Bước 4: sau khi tính toán các giá trị của các chỉ số thống kê, việc phân biệt giữa tín hiệu thể hiện rối loạn và bình thường được quyết định bởi lớn hay nhỏ một giá trị ngưỡng
Hình 2.3: Sơ đồ quy trình chung của các thuật toán phát hiện rối loạn nhịp tim bằng phương pháp thống kê
Kết quả của các thuật toán sẽ được đánh giá dựa trên độ đặc hiệu (specificity), độ chính xác (accuracy), độ nhạy (sensitivity) (tiêu chuẩn này cũng được các nghiên cứu
sử dụng để đánh giá thuật toán dựa trên mô hình học máy và học sâu) Ngoài ra đường
cong ROC (Receiver operating characteristic) cùng với diện trích dưới đường cong
(AUC) cũng được sử dụng khá nhiều Chúng dùng để lựa chọn các giá trị tham số phù hợp cho thuật toán ví dụ như giá trị các ngưỡng cũng như so sánh tính hiệu quả giữa các thuật toán khác nhau, theo đó thuật toán có chỉ số AUC cao hơn cho thấy kết quả chính xác hơn trong việc phát hiện rối loạn nhịp tim
Có nhiều nghiên cứu sử dụng phương pháp này và điểm khác biệt duy nhất nằm ở chỉ số nào được sử dụng để phát hiện bệnh rối loạn nhịp tim Các chỉ số được sử dụng
phổ biến bao gồm Root mean square of successive difference ( RMSSD), Sample entropy
Trang 26biểu đồ Poincare , [15] [16] [17]
𝐶𝑜𝑚𝑏 = 𝑤 × 𝑅𝑀𝑆𝑆𝐷 + (1 − 𝑤) × 𝑆𝑎𝑚𝑝𝐸𝑛 (2.1)
2.1.2 Phương pháp sử dụng mô hình học máy
So với phương pháp sử dụng mô hình thống kê, phương pháp sử dụng mô hình
học máy (machine learning) sử dụng đa dạng các chỉ số hay nói chính xác hơn là các đặc trưng (feature) khác nhau để xác định một đoạn tín hiệu PPG có bị rối loạn nhịp tim
hay không Bên cạnh các chỉ số thống kê, một số các đặc trưng được sử dụng như đặc
trưng trong miền thời gian (Time-domain features), [18], đặc trưng trong miền tần số (Frequency-domain features), [19], đặc trưng mô tả dạng sóng của tính hiệu PPG (Waveform descriptors), [18]
Một thuật toán sử dựng mô hình học máy để phát hiện rối loạn nhịp tim dựa trên tín hiệu PPG sẽ trải qua các bước tiền xử lý, trích xuất đặc trưng, phân loại bằng mô hình học máy Có thể thấy, so với phương pháp thống kê mô hình học máy khác ở hai điểm Điểm thứ nhất là số lượng đặc trưng nhiều hơn, điều này có nghĩa sẽ cần nhiều thuật toán
Trang 2710
hơn để trích xuất các đặc trưng giống nhau Điểm thứ hai nằm ở phương pháp phân loại, ở đây thay vì sử dụng các ngưỡng so sánh thì một mô hình học máy được sử dựng Các
mô hình được sử dụng phổ biến gồm (k–nearest neighbors, support vector machine,…)
Chính vì sử dụng các mô hình học máy do đó, để hình thành mô hình cần trải qua hai
giai đoạn là giai đoạn huấn luyện (training) và giai đoạn đánh giá (testing) Hình 2.4 mô
tả tổng thể một nghiên cứu sử dụng mô hình học máy để phát hiện rối loạn nhịp tim
Hình 2.4: Sơ đồ quy trình chung của các thuật toán phát hiện rối loạn nhịp tim bằng phương pháp mô hình học máy
2.1.3 Phương pháp sử dụng mô hình học sâu
Hình 2.5: Sơ đồ quy trình chung của các thuật toán phát hiện rối loạn nhịp tim bằng phương pháp mô hình học sâu
Trang 2811
Học sâu (deep learning) là một phần trong một nhánh của phương pháp học máy
dựa trên mạng thần kinh nhân tạo kết hợp với việc học biểu diễn đặc trưng
(representation learning) Vì vậy về cơ bản một nghiên cứu sử dụng mô hình học sâu sẽ
không khác nhiều so với mô hình học máy, Hình 2.5 Điểm khác biệt duy nhất giữa hai phương pháp này chính là mô hình học sâu có khả năng tự động trích xuất đặc trưng
thông qua các kiến trúc mạng thần kinh (neural network) Mô hình học sâu được sử dụng nhiều nhất là mạng nơ-ron tích chập (convolution neural network-CNN) CNN được áp dụng để phân tích hình bằng cách sử dụng các bộ lọc (kernel – filter) và phép tích chập
để xác định các đặc trưng của dữ liệu một cách tự động Điều này đặc biệt thích hợp trong các tác vụ liên quan đến xác định đặc trưng của các tập dữ liệu Nhờ đặc điểm này mà các thuật toán sử dụng CNN không cần các thuật toán trích xuất đặc trưng như trong mô hình học máy, giảm bớt các tác vụ hiệu chỉnh tham số cho thuật toán, vốn là những yếu tố gây ảnh hưởng đến độ chính xác và phạm vi áp dụng của thuật toán Poh và các
cộng sự, [10] đã tiến hành một nghiên cứu sử dụng mô Dense CNN (DCNN) để phát
hiện rung tâm nhĩ, ngoại thu tâm nhĩ và nhịp tim bình thường với đầu vào là tín hiệu PPG thô Nghiên cứu này so sánh tính hiệu quả của mạng DCNN với các thuật toán sử dụng phương pháp thống kê và học máy, và cho thấy DCNN hiệu quả hơn so với các
phương pháp còn lại dựa trên ma trận nhầm lẫn (confusion matrix) Bằng cách quan sát
các bộ lọc sau khi huấn luyện, nghiên cứu này cho thấy các mạng DCNN có xu hướng trích xuất các đỉnh của tín hiệu PPG Điều này giống như cơ sở lập luận của các phương pháp sử dụng chỉ số thống kê
Trang 2912
Hình 2.6: (a) Kết quả phát hiện các trường hợp rối loạn nhịp tim và không rối loạn nhip tim của phương pháp sử dụng mô hình DCNN và các phương pháp khác (b) Biểu đồ thể hiện sự phân cụm của các bệnh dựa trên hai chiều đầu của lớp ẩn, cho thấy tín hiệu quả
trong việc phát hiện nhịp tim [10]
Để tăng tính hiệu quả, một số nghiên cứu còn sử dụng kết hợp giữa CNN và các đặc trưng như đã đề cập ở phần trên Shashikumar và các cộng sự, [20] sử dụng mạng
CNN với đầu vào phổ thời gian – tần số thông qua biến đổi wavelet kết hợp với các đặc
trưng để phát hiện các trường hợp bị rung tâm nhĩ, Hình 2.7 Nghiên cứu này cho rằng việc bổ sung các đặc trưng của tín hiệu vào một mạng CNN đơn giản giúp tăng tính hiệu quả trong việc phân loại khi các đặc trưng sẽ cho mạng CNN phân biệt được giữa tín hiệu bị rối loạn nhịp tim và tín hiệu nhiễu, vốn khó phân biệt khi sử dụng phương pháp thống kê hay học máy
Trang 3013
Hình 2.7: Phương pháp sử dụng kết hợp giữa phân tích đặc tính và mạng CNN [20]
Mặt khác, ở một số bệnh nhân xuất hiện rối loạn nhịp tim, hiện tượng bệnh sẽ không xay ra liên tục và cần thời gian dài để đánh giá bệnh tình [21] Vì vậy, một vài
nghiên cứu kết hợp giữa CNN và mạng thần kinh hồi tiếp (Recurent neural network) để
phát hiện hoặc tính toán xác suất có thể bị bệnh rối loạn nhịp tim I Gotlibovych và các cộng sự, [22] đã tính toán xác suất bị bệnh rung tâm nhĩ bằng cách sử dụng CNN và bộ nhớ ngắn - dài (LSTM), Hình 2.8 Theo đó CNN có nhiệm vụ trích xuất các đặc trưng của tín hiệu, LSTM có nhiệm vụ tính toán xác suất mắc bệnh dựa trên các dữ liệu đã phân tích trước đó Với việc sử dụng mạng LSTM, nghiên cứu này tin rằng việc chẩn đoán nguy cơ mắc các bệnh liên quan đến rối loạn nhịp tim thông qua giám sát dữ liệu thu thập từ bệnh nhân bằng các thiết bị đeo tay sẽ được cải thiện đáng kể Dữ liệu sẽ được giám sát liên tục cả ở quá khứ và hiện tại để đưa ra kết quả chính xác nhất là không cần quá nhiều dung lượng bộ nhớ để lưu trữ Bên cạnh đó thuật toán cũng giảm thiểu đáng kể sự can thiệp đến từ người dùng
Trang 32thời gian – tần số trong trường hợp khi có rối loạn nhịp tim [23]
2.1.4 So sánh các phương pháp
Từ các nghiên cứu, việc áp dụng tín hiệu PPG trong việc phát hiện rối loạn nhịp tim cần phải xem xét đến các vấn đề như độ dài tín hiệu mức độ đáp ứng đối với dữ liệu, độ phức tạp của thuật toán
Trang 3316
Độ dài của tín hiệu
Độ dài của tín hiệu hay nói cách khác là thời gian thu tín hiệu PPG là bao nhiêu để tín hiệu đó có thể dự đoán chính xác tình trạng bệnh Yếu tố này đặc biệt quan trọng đối với các phương pháp sử dụng chỉ số thống kê Do các chỉ số thống kê là đại diện cho một phân phối của tín hiệu, vì vậy, với một thời gian đủ dài thì chỉ số đó sẽ đại diện tốt cho phân phối hơn Đã có nhiều nghiên cứu đề cập và tiến hành thử nghiệm với các độ dài mẫu cũng như các chỉ số thống kê khác nhau [24] so sánh kết quả phân loại rung
tâm nhĩ dựa trên chỉ số đánh giá Kappa với các độ dài mẫu tín hiệu lần lượt là 30 giây,
60 giây và 120 giây Kết quả nghiên cứu cho thấy ở tất cả các chỉ số thống kê được sử dụng để phân loại bao gồm Shannon entropy, RMSSD, thì với mẫu có độ dài 120 giây cho hiệu quả phân loại tốt nhất với chỉ số Kappa đạt 0,956, Hình 2.11a thể hiện kết quả của việc so sánh AUC của thuật toán phân loại rung tâm nhĩ với các độ dài mẫu từ 1 đến 10 phút, [15] Nghiên cứu cho thấy với độ dài mẫu càng lớn thì hiệu quả phân loại càng cao thể hiệu qua AUC, Hình 2.11b Tuy nhiên, điều này không có nghĩa là độ dài mẫu càng lớn càng tốt, vì nghiên cứu cũng chỉ ra rằng khi độ dài mẫu tăng đến một giá trị nào đó thì sự chênh lệch AUC là không quá đáng kể, mà ở đây là 2 phút Và thêm nữa, việc lấy mẫu trong thời gian quá dài sẽ làm tăng dung lượng bộ nhớ và hiệu quả tính toán của thuật toán, đồng thời cũng tăng xác suất gặp phải các tín hiệu nhiễu do bệnh nhân có thể cử động do mỏi trong lúc thu tín hiệu
Trang 3417
Hình 2.11: (a) So sánh kết quả phân loại rung tâm nhĩ dựa trên hệ số Kappa với các độ
dài mẫu khác nhau lần lượt là 30s, 60s, 120s [24] (b) So sánh kết quả phân loại rung
tâm nhĩ dựa trên đường cong ROC với các độ dài mẫu khác nhau lần lượt là 1 phút, 2
phút và 10 phút [15]
Các thuật toán dựa trên mô hình học máy và học sâu, mặc dù chỉ sử dụng độ dài mẫu tín hiệu từ 10 đến 30 giây vẫn cho kết quả tương đương [25] sử dụng tín hiệu PPG
với độ dài 10 giây kết hợp với thuật toán SVM Recursive Feature Elimination
(SVM-RFE) và các đặc trưng trong cả miền tần số và miền thời gian, Hình 2.12 Bằng cách so sánh độ chính xác với của thuật toán với các độ dài tín hiệu và các tập đặc trưng khác nhau, nghiên cứu chỉ ra rằng kết quả tốt nhất ứng với độ dài tín hiệu 10 giây Các nghiên cứu sử dụng mô hình CNN, [10] [8] lần lượt nghiên cứu với độ dài mẫu 17 giây và 30 giây cho kết quả khá tốt với AUC đạt 0,99
Hình 2.12: Sơ đồ thể hiện thuật toán phân loại rối loạn nhịp tim dựa trên mô hình SVM
và RFE [25].
Mức độ đáp ứng đối với dữ liệu
Trang 3518
Mức độ đáp ứng đối với dữ liệu là khả năng phân loại với số lượng dữ liệu lớn Về yếu tố này các thuật toán sử dụng mô hình học sâu có đáp ứng với lượng dữ liệu lớn tốt hơn so với học máy và thống kê [21] Điều này có thể lý giải rằng các dữ liệu là tổ hợp của các phân phối khác nhau, trong khi các chỉ số thống kê với một ngưỡng cho trước chỉ mô tả tốt cho một phân phối, do đó các phương pháp thông kê khó có thể đáp ứng tốt đối với lượng dữ liệu lớn vốn phức tạp hơn Trái lại, một mô hình học sâu gồm có hàng trăm thông số, được xác định thông qua quá trình huấn luyện với tập dữ liệu lớn sẽ có đáp ứng tốt hơn Một bằng chứng cho thấy các mô hình học sâu có khả năng đáp ứng tốt với lượng dữ liệu lớn là trong khi các mô hình thống kê chỉ tập trung phân biệt một loại bệnh thì các mô hình học sâu có khả năng phân biệt một vài bệnh khác nhau ví dụ [10] phân biệt giữ ngoại thu tâm nghĩ, rung tâm nhĩ và các trường hợp bình thường
Độ phức tạp của thuật toán
Độ phức tạp của thuật toán dựa trên số lượng phép tính của thuật toán
(computation complexity) Yếu tố này rất quan trọng vì nó sẽ quyết định khả năng tích
hợp thuật toán vào các thiếu bị đeo tay Từ các phân tích ở phần trên có thể thấy các thuật toán dựa trên mô hình thống kê và học máy có độ phức tạp thấp có khả năng tích hợp cao, trong khi các thuật toán sử dụng mô hình học sâu cần rất nhiều phép tính vì vậy đòi hỏi thiết bị có khả năng tính toán cao
Kết luận
Mặc dù so với các phương pháp sử dụng hệ số thống kê và học máy, phương pháp học sâu có độ phức tạp về mặt tính toán cao hơn và khó tích hợp vào các thiết bị đeo tay trên thị trường nhưng phương pháp này có những ưu điểm không thể thay thế được như sau:
Mô tả tốt đối với các dữ liệu có số lượng lớn và độ phức tạp cao Điều này hoàn toàn phù hợp cho việc dự đoán rối loạn nhịp tim với đa dạng các chủng tộc khác
Trang 36 Phát hiện tốt đối với các mẫu tín hiệu có độ dài nhỏ Việc này sẽ giúp giảm thiểu xác suất bị ảnh hưởng bởi cử động của người dùng
Bên cạnh đó với sự tiến bộ của công nghệ thì nhược điểm của các thuật toán sử dụng mô hình học sâu có thể khắc phục như sau:
Các thuật toán sử dụng mô hình học sâu thay vì tích hợp vào các thiết bị đeo tay
thì sẽ được tích hợp vào các đám mây trên thông qua internet Theo đó, thiết bị
đeo tay sẽ có nhiệm vụ thu nhận tín hiệu và gửi lên thuật toán đã được lưu trữ trên cơ sở dữ liệu đám mây
Đôi khi việc theo dõi và phát hiện rối loạn nhịp tim sẽ mang tính cá nhân hóa, vì vậy có thể dựa vào tính ghi nhớ của các mạng RNN, thuật toán sẽ cập nhật và huấn luyện theo thời gian thực Dữ liệu sẽ liên tục cập nhật thông qua các thiết bị đeo
Tuy nhiên, đối với các thuật toán sử dụng mô hình học sâu còn một vấn đề về dữ liệu đầu vào Như đã trình bày, có hai loại dữ liệu đầu vào cho mô hình học sâu đó là dữ liệu dạng chuỗi thời gian hay nói chính xác hơn là loại dữ liệu PPG thô đã thông qua tiền xử lý bằng các bộ lọc thông dải và loại dữ liệu dưới dạng phổ thời gian – tần số được
biến đổi trực tiếp từ tín hiệu thô bằng biến đổi wavelet Trong đó loại dữ liệu đầu vào
dưới dạng chuỗi thời gian kém hiệu quả hơn do các bộ lọc sẽ làm mất đi thông tin của tín hiệu, [23], đặc biệt là đối với các tín hiệu có xuất hiện bệnh rối loạn nhịp tim Không chỉ vậy, phổ thời gian – tần số còn có những ưu điểm tốt giúp tăng hiệu quả trong việc phát hiện rối loạn nhịp tim như:
Trang 3720
Phổ thời gian – tần số giúp thể hiện rõ sự thay đổi của tần số và biên độ theo thời gian [26], vì vậy khi có bất kỳ sự thay đổi đột ngột nào của tín hiệu, phổ sẽ thể hiện rõ sư thay đổi đó Việc này rất hữu ích trong việc phát hiện rối loạn nhịp tim, vì các cơn rối loạn trong một số trường hợp sẽ là các tín hiệu xuất hiện đột ngột làm thay đổi tần số và biên độ của tín hiệu
Phổ thời gian – tần số hoạt động như là một bộ lọc, chúng tách tín hiệu thành các thành phần tần số khác nhau trong đó gồm các vùng tần số cấu thành tín hiệu và vùng tần số nhiễu, do đó chỉ cần giới hạn vùng tần số mà tim hoạt động thì đã đủ để phát hiện rối loạn nhịp tim mà không sợ làm mất mát thông tin của tín hiệu
Về mặt mô hình được sử dụng thì cho đến hiện nay phổ biến nhất là hai dạng CNN và dạng lai CNN-LSTM Các nghiên cứu cho thất cả hai mô hình đều cho kết quả tốt vì vậy vẫn chưa thể kết luận mô hình nào là tốt nhất
2.2 Các phương pháp nhận diện và loại bỏ các đoạn tín hiệu PPG bị ảnh hưởng do cử động
Một trong những nhược điểm của tín hiệu PPG là dễ dàng bị ảnh hưởng bởi cử động của người sử dụng Chính vì vậy việc phát hiện và loại bỏ các đoạn tín hiệu không đạt chất lượng là rất quan trọng để có thể phục vụ cho các ứng dụng khác mà ở đây là phát hiện rối loạn nhịp tim là vô cùng quan trọng Và cho đến này, các nghiên cứu về nhận diện tín hiêu PPG có thể phân thành các hướng như phương pháp sử dụng chỉ số đánh giá chất lượng (SQI – signal quality index) và phương pháp so sánh với đoạn tín hiệu PPG mẫu
2.2.1 Phương pháp sử dụng chỉ số đánh giá chất lượng
Phương pháp sử dụng chỉ số đánh giá chất lượng dựa trên quan sát rằng tín hiệu PPG là một tín hiệu tuần hoàn Nghiên cứu sử dụng phương pháp này cho rằng, tín hiệu PPG có một phân phối xác định, vì vậy các tín hiệu PPG bình thường sẽ có phân phối
Trang 3821
khác với các tín hiệu nhiễu Phân phối của tín hiệu PPG đại diện bởi các chỉ đánh giá
chất lượng tín hiệu Hình 2.13 miêu tả sự khác nhau của chỉ số kurtosis và skewness
trong phân phối của các tín hiệu PPG với mức độ nhiễu khác nhau, tuy nhiên các nghiên cứu cũng chưa đưa ra một kết luận cụ thể về sự khác nhau cũng như vùng giá trị cụ thể cho các chỉ số này Thuật toán sử dụng phương pháp sử dụng chỉ số đánh giá chất lượng chia đoạn tín hiệu thành các đoạn tín hiệu nhỏ hơn, sau đó sẽ tiến hành tính toán các chỉ số tương ứng với từng đoạn tín hiệu này, các đoạn tín hiệu có các chỉ số nằm trong ngưỡng cho trước sẽ giữ lại, ngược lại sẽ là các đoạn tín hiệu nhiễu và bị loại bỏ Hình
2.14 diễn tả thuật toán và kết quả sử dụng ba chỉ số độ nghiêng (skewness), độ nhọn
(kurtoisis) và độ lệch chuẩn của nghiên cứu [27] trong việc phát hiện các đoạn tín hiệu
PPG bị ảnh hưởng do cử động
Hình 2.13: Sự khác nhau của chỉ số kurtosis và skewness trong phân phối của các tín
hiệu PPG với mức độ nhiễu khác nhau [28].
Trang 3922
Hình 2.14: Sơ đồ thuật toán sử dụng hệ số thống kê để phát hiện đoạn PPG bị nhiễu và giá trị kurtosis (a), skewness (b) và độ lệch chuẩn (c) của từng tín hiệu đoạn trên tín hiệu PPG gốc (a) Giá trị của các chỉ số này thể hiện rõ sự khác biệt ở các đoạn tín hiệu bị
nhiễu do cứ động [27]
Tương tự như hầu hết các thuật toán sử dụng các chỉ số đánh giá, việc được quan tâm nhiều nhất đó chính là độ dài đoạn tín hiệu dùng để tính chỉ số và chỉ số nào sẽ được sử dụng [29] đã tiến hành khảo sát sự hiệu quả của chỉ số đánh giá chất lượng bao gồm
perfusion, skewness, kurtosis, entropy, zero crossing rate, signal-to-noise ratio dưới sự
giám sát và đánh giá của các chuyên gia và các phương pháp thống kê Nghiên cứu kết
luận rằng chỉ số skewness là tốt nhất trong việc đánh giá chất lượng của tín hiệu PPG
2.2.2 Phương pháp sử dụng mẫu tín hiệu PPG (photoplethysmographic waveform)
Phương pháp này tạo ra một mẫu PPG đặc trưng cho một đoạn tín hiệu Mẫu
được tạo ra bằng cách xem xét đoạn tín hiệu PPG giữ hai đỉnh (một nhịp tín hiệu PPG) Nghiên cứu của Li và các công sự, [30] sử dụng kỹ thuật dynamic time warping (DWT)
để đánh giá chất lượng từng nhịp PPG thông qua mức động giống nhau giữa nhịp đó và tín hiệu PPG mẫu Tín hiệu mẫu được trích xuất từ tín hiệu bằng hệ số tương quan và thuật toán tìm đỉnh tín hiệu PPG Sau đó họ sử dụng một mô hình học máy để kiểm phân loại đỉnh đạt chuẩn và không đạt chuẩn Phương pháp này được đề xuất nhằm khắc phục
Trang 4023
sự không cố định về mặt sinh lý dòng máu, dẫn đến sự thay đổi về chiều cao, chiều rộng và hình thái của tín hiệu PPG Một số nghiên cứu tương tự có thể tham khảo là [31], [32], [33]
2.2.3 So sánh các phương pháp
Hiện nay phương pháp nào là tốt nhất để đánh giá tín hiệu PPG vẫn chưa thể khẳng định một cách chắc chắn Nhất là trong ứng dụng PPG vào phát hiện rối loạn nhịp tim Điều này là do mỗi thuật toán sẽ đặc biệt hiệu quả cho từng tình huống khác nhau Việc áp dụng thuật toán nào đề xử lý tín hiệu PPG phụ thuộc vào từng tình huống áp dụng của tín hiệu Các thuật toán sử dụng chỉ số đánh giá đặc biệt phù hợp cho các trường hợp bệnh nhân không cử động quá nhiều hoặc cử động trong phạm vi cho phép có tính tuần hoàn (chạy bộ, tập thể dục) Tuy nhiên, khi áp dụng cho phát hiện rối loạn nhịp tim phương pháp sử dụng chỉ số thống kê gặp phải các vấn đề sau:
Tín hiệu rối loạn nhịp tim dễ bị nhầm lần với tín hiệu nhiễu
Khó khăn trong việc lựa chọn chỉ số đánh giá phù hợp Mặc dù có nhiều nghiên cứu quan tâm đến vấn đề này nhưng với số lượng lớn chỉ số thì khó mà đưa ra một kết luận và so sánh tổng quát Không chỉ vậy, với nhược điểm hạn chế về số lượng dữ liệu, nên không loại trừ trường hợp một hay một số chỉ số chỉ thích hợp với từng nhóm người nhất định
Tín hiệu PPG thu thập với các thiết bị khác nhau và với các điều kiện sinh lý cơ thể khác nhau sẽ không đồng nhất về độ lớn của biên độ Ví dụ, trên thị trường
các tín thiết bị thường sử dụng bộ ADC (analog to digital converter) 8bit hoặc
10bit, việc này dẫn đến biên độ của tín hiệu ở dạng số sẽ khác nhau
Những khó khăn trên của phương pháp sử dụng chỉ số đánh giá chất lượng có thể giải quyết bằng cách kết hợp giữa đánh giá mẫu và mô hình học sâu Việc sử dụng đánh giá mẫu sẽ giải quyết sự khác nhau giữa các tín hiệu PPG từ các thiết bị khác nhau Còn mô hình học sâu với khả năng mô tả tốt dữ liệu có cấu trúc phức tạp sẽ có thể giải