1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận văn thạc sĩ Kỹ thuật cơ điện tử: Chẩn đoán rối loạn nhịp tim dựa trên xử lý và phân tích tín hiệu PPG

112 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

Trang 1

ĐẠI HỌC QUỐC GIA TP.HCM

TRƯỜNG ĐẠI HỌC BÁCH KHOA

-

Trang 2

CÔNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI TRƯỜNG ĐẠI HỌC BÁCH KHOA – ĐHQG-HCM Cán bộ hướng dẫn khoa học : PGS TS Lưu Thành Tùng

Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm:

(Ghi rõ họ, tên, học hàm, học vị của Hội đồng chấm bảo vệ luận văn thạc sĩ) 1 PGS.TS Nguyễn Quốc Chí - Chủ tịch hội đồng

2 PGS.TS Lê Mỹ Hà – Phản biện 1 3 PGS.TS Nguyễn Hùng – Phản biện 2 4 PGS.TS Lê Đức Hạnh - Ủy viên 5 TS Phạm Phương Tùng – Thư ký

Xác nhận của Chủ tịch Hội đồng đánh giá LV và Trưởng Khoa quản lý chuyên ngành sau khi luận văn đã được sửa chữa (nếu có)

Trang 3

NHIỆM VỤ LUẬN VĂN THẠC SĨ

Họ tên học viên: Phan Khánh Duy MSHV:2170093 Ngày, tháng, năm sinh: 14/2/1998 Nơi sinh: Tiền Giang Chuyên ngành: Kỹ thuật Cơ – điện tử Mã số : 8520114

I TÊN ĐỀ TÀI:

CHẨN ĐOÁN RỐI LOẠN NHỊP TIM DỰA TRÊN XỬ LÝ VÀ PHÂN TÍCH TÍN HIỆU PPG (Arrhythmia Detection Based on Photoplethysmography Signal)

II NHIỆM VỤ VÀ NỘI DUNG:

Nghiên cứu thuật toán phát hiện rối loạn nhịp tim

Nghiên cứu thuật toán đánh giá tín hiệu PPG thô nhằm xem xét và giữ lại các đoạn tín hiệu tốt, không bị ảnh hưởng bởi nhiễu do cử động của người dùng

III NGÀY GIAO NHIỆM VỤ : 14/02/2022

IV NGÀY HOÀN THÀNH NHIỆM VỤ: 20/6/2023 V CÁN BỘ HƯỚNG DẪN: PGS.TS Lưu Thanh Tùng

Tp HCM, ngày 20 tháng 6 năm 2023

CÁN BỘ HƯỚNG DẪN

(Họ tên và chữ ký) CHỦ NHIỆM BỘ MÔN ĐÀO TẠO (Họ tên và chữ ký)

TRƯỞNG KHOA CƠ KHÍ

(Họ tên và chữ ký)

Trang 4

I

LỜI CẢM ƠN

Lời đầu tiên, tôi xin được cảm ơn gia đình, những luôn ở phía sau đồng hành và ủng hộ tôi trên con đường học tập, nghiên cứu Trong suốt đại dịch Covid 19 vừa qua tuy có nhiều khó khăn, nhưng Thầy, PGS.TS Lưu Thanh Tùng đã tạo mọi điều kiện, hướng dẫn tôi trong quá trình học tập cũng như trong việc hoàn thành luận văn này, xin chân thành gửi lời cảm ơn đến thầy

Do giới hạn kiến thức và khả năng lý luận của bản thân còn nhiều thiếu sót và hạn chế, kính mong sự chỉ dẫn và đóng góp của các Thầy, Cô để bài luận văn của tôi được hoàn thiện hơn Xin chân thành cảm ơn!

Học viên

Phan Khánh Duy

Trang 5

II

TÓM TẮT

Luận văn trình bày hai thuật toán phát hiện và loại bỏ các đoạn tín hiệu

photoplethysmography (PPG) bị ảnh hưởng do cử động và thuật toán phát hiện rối loạn

nhịp tim dựa trên tín hiệu PPG dựa trên các thuật toán phân tích tín hiệu và mô hình học sâu Trong đó, thuật toán phát hiện và loại bỏ các đoạn tín hiệu PPG bị ảnh hưởng do cử động có chức năng xử lý và lọc các đoạn tín hiệu PPG đạt tiêu chuẩn cho các ứng dụng sử dụng tín hiệu PPG, một trong số đó là phát hiện rối loạn nhịp tim Và thuật toán phát hiện rối loạn nhịp tim dựa trên tín hiệu PPG có chức năng phát hiện các đoạn tín hiệu PPG có xuất hiện rối loạn nhịp tim gây ra bởi rung tâm nhĩ và ngoại thu tâm thất Kết quả đánh giá hai thuật toán được tiến hành trên hai bộ dữ liệu khác nhau là bộ dữ liệu MIMICIII và bộ dữ liệu từ bệnh viện Thống Nhất

ABSTRACT

The thesis presents two algorithms for detecting and removing motion artifacts in photoplethysmography (PPG) signals and an algorithm for detecting cardiac arrhythmias based on PPG signals using signal analysis techniques and deep learning models The algorithm for detecting and removing motion-induced artifacts in PPG signals aims to process and filter the PPG segments to meet the standards required for PPG signal applications, one of which is the detection of cardiac arrhythmias The algorithm for detecting cardiac arrhythmias based on PPG signals is designed to identify PPG segments exhibiting arrhythmias caused by atrial and ventricular ectopic beats The evaluation of the two algorithms is conducted on two different datasets: the MIMIC-III dataset and the dataset from Thong Nhat Hospital

Trang 6

III

LỜI CAM ĐOAN

Tôi xin cam đoan đây là bài báo cáo luận văn tốt nghiệp của tôi đã thực hiện trong thời gian qua Những số liệu và kết quả nghiên cứu là trung thực, hoàn toàn được thực hiện tại trường Đại học Bách Khoa TP.HCM, không sao chép bất kỳ nguồn nào khác Ngoài ra, trong bài báo cáo có sử dụng một số nguồn tài liệu tham khảo đã được trích dẫn nguồn và chú thích rõ ràng Tôi xin hoàn toàn chịu trách nhiệm trước bộ môn, khoa và nhà trường về sự cam đoan này

TP.HCM, ngày … tháng … năm 2023

Học viên

Phan Khánh Duy

Trang 7

IV

MỤC LỤC

LỜI CẢM ƠN ITÓM TẮT IILỜI CAM ĐOAN IIIMỤC LỤC IVDANH SÁCH BẢNG BIỂU VIIIDANH SÁCH HÌNH ẢNH IX

2.1.2 Phương pháp sử dụng mô hình học máy 9

2.1.3 Phương pháp sử dụng mô hình học sâu 10

2.1.4 So sánh các phương pháp 15

Trang 8

V

2.2 Các phương pháp nhận diện và loại bỏ các đoạn tín hiệu PPG bị ảnh

hưởng do cử động 20

2.2.1 Phương pháp sử dụng chỉ số đánh giá chất lượng 20

2.2.2 Phương pháp sử dụng mẫu tín hiệu PPG (photoplethysmographic waveform) 222.2.3 So sánh các phương pháp 23

2.3 Phương án phát triển thuật toán 24

2.3.1 Thuật toán nhận diện và loại bỏ các đoạn tín hiệu PPG bị ảnh hưởng do cử động 242.3.2 Thuật toán phát hiện rối loạn nhịp tim dựa trên tín hiệu PPG 24CHƯƠNG 3: CƠ SỞ LÝ THUYẾT 26

3.1 Tín hiệu PPG 26

3.1.1 Nguồn gốc của tín hiệu PPG 26

3.1.2 Thiết bị thu tín hiệu PPG 28

3.3.2 Cấu trúc của mạng autoencoder 33

3.3.3 Hàm mất mát và huấn luyện mạng autoencoder 34

3.4 Mạng thần kinh tích chập 35

3.5 Mạng thần kinh bộ nhớ ngắn-dài 37

Trang 9

VI

CHƯƠNG 4: XÂY DỰNG THUẬT TOÁN 40

4.1 Dữ liệu sử dụng trong luận văn 40

4.1.1 Bộ dữ liệu MIMICIII 41

4.1.2 Bộ dữ liệu từ bệnh viện Thống Nhất 41

4.2 Thuật toán tiền xử lý tín hiệu PPG 42

4.2.1 Thuật toán 42

4.2.2 Thuật toán tìm đỉnh và thuật toán tạo mẫu 43

4.2.3 Mô hình autoencoder và phát hiện đoạn tín hiệu bị ảnh hưởng do cứ động 464.2.4 Phương pháp đánh giá thuật toán 48

4.3 Thuật toán phân loại rối loạn nhịp tim 49

4.3.1 Thuật toán 49

4.3.2 Biến đổi thành miền thời gian – tần số 49

4.3.3 Cấu trúc mô hình học sâu 55

4.3.4 Huấn luyện và đánh giá mô hình 57

5.2 Phát hiện rối loạn nhịp tim 64

5.2.1 Phổ thời gian – tần số của tín hiệu PPG 64

Trang 10

VII

5.2.2 Cấu trúc của mô hình học sâu 68

5.2.3 Kết quả huấn luyện 70

5.2.4 Kết quả dự đoán trên tập kiểm tra 76

5.2.5 So sánh hai mô hình CNN và CNN-LSTM 82

5.2.6 So sánh với các nghiên cứu liên quan 83

CHƯƠNG 6: KẾT LUẬN VÀ KIẾN NGHỊ NHỮNG NGHIÊN CỨU TIẾP THEO866.1 Kết luận 86

6.1.1 Thuật toán đánh giá tín hiệu PPG 86

6.1.2 Thuật toán phát hiện rối loạn nhịp tim 86

6.2 Kiến nghị những nghiên cứu tiếp theo 87

TÀI LIỆU THAM KHẢO 88

PHẦN LÝ LỊCH TRÍCH NGANG 95

Trang 11

VIII

DANH SÁCH BẢNG BIỂU

Bảng 1.1: Số liệu trường hợp mắc các bệnh rối loạn nhịp tim 1

Bảng 4.1: Thông số thiết bị lấy mẫu 41

Bảng 4.2: Đặc điểm của dữ liệu thu từ bệnh viện Thống Nhất 42

Bảng 4.3: Cấu trúc mạng autoencoder dùng trong xử lý tín hiệu 46

Bảng 5.1: Cấu trúc mạng CNN dùng trong phát hiện rối loạn nhịp tim 68

Bảng 5.2: Cấu trúc mạng CNN-LSTM dùng trong phát hiện rối loạn nhịp tim 69

Bảng 5.3:Giá trị hàm mất mát và độ chính xác trung bình của bốn epoch cuối của mô hình CNN 73

Bảng 5.4: Giá trị hàm mất mát và độ chính xác trung bình của bốn epoch cuối của mô hình CNN 75

Bảng 5.5: Bảng thể hiện kết quả của hai mô hình trên bộ dự liệu kiểm tra từ MIMICIII với bộ tham số được huấn luyện trong các fold khác nhau 76

Bảng 5.6: Bảng thể hiện kết quả của hai mô hình trên bộ dự liệu kiểm tra từ MIMICIII với bộ tham số được huấn luyện trong các fold khác nhau 79

Bảng 5.7: Bảng so sánh một số nghiên cứu ứng dụng mô hình học sâu trong phát hiện rối loạn nhịp tim dựa trên tín hiệu PPG 85

Trang 12

IX

DANH SÁCH HÌNH ẢNH

Hình 1.1: Đo điện tâm đồ bằng thiết bị holter [5] 2Hình 2.1: Tín hiệu PPG có sự khác biệt giữa người không mắc và mắc các bệnh rối loạn nhịp tim [10] 6Hình 2.2: Khoảng cách đỉnh (PP) của tính hiệu PPG [11] 7Hình 2.3: Sơ đồ quy trình chung của các thuật toán phát hiện rối loạn nhịp tim bằng phương pháp thống kê 8Hình 2.4: Sơ đồ quy trình chung của các thuật toán phát hiện rối loạn nhịp tim bằng phương pháp mô hình học máy 10Hình 2.5: Sơ đồ quy trình chung của các thuật toán phát hiện rối loạn nhịp tim bằng phương pháp mô hình học sâu 10Hình 2.6: (a) Kết quả phát hiện các trường hợp rối loạn nhịp tim và không rối loạn nhip tim của phương pháp sử dụng mô hình DCNN và các phương pháp khác (b) Biểu đồ thể hiện sự phân cụm của các bệnh dựa trên hai chiều đầu của lớp ẩn, cho thấy tín hiệu quả trong việc phát hiện nhịp tim [10] 12Hình 2.7: Phương pháp sử dụng kết hợp giữa phân tích đặc tính và mạng CNN [20] 13Hình 2.8: Mô hình kết hợp CNN và LSTM để dự đoán xác suất mắc bệnh rối loạn nhịp tim [22] 14Hình 2.9: Mô hình học phân loại các trường hợp mắc và không mắc rung tâm nhĩ dựa trên dữ liệu đầu vào là biến đơi wavelet của tín hiệu PPG thô và mô hình kết hợp CNN và LSTM [23] 15Hình 2.10: Sự khác biệt về phổ thời gian – tần số từ biến đổi wavelet giữa tín hiệu PPG mắc và không mắc rối loạn nhịp tim (a) Tín hiệu PPG, ECG và phổ thời gian –

Trang 13

X

tần số trong trường hợp không có rối loạn nhịp tim (b), (c) và (d) Tín hiệu PPG,

ECG và phổ thời gian – tần số trong trường hợp khi có rối loạn nhịp tim [23] 15

Hình 2.11: (a) So sánh kết quả phân loại rung tâm nhĩ dựa trên hệ số Kappa với các độ dài mẫu khác nhau lần lượt là 30s, 60s, 120s [24] (b) So sánh kết quả phân loại rung tâm nhĩ dựa trên đường cong ROC với các độ dài mẫu khác nhau lần lượt là 1 phút, 2 phút và 10 phút [15] 17

Hình 2.12: Sơ đồ thể hiện thuật toán phân loại rối loạn nhịp tim dựa trên mô hình SVM và RFE [25] 17

Hình 2.13: Sự khác nhau của chỉ số kurtosis và skewness trong trong phân phối của các tín hiệu PPG với mức độ nhiễu khác nhau [28] 21

Hình 2.14: Sơ đồ thuật toán sử dụng hệ số thống kê để phát hiện đoạn PPG bị nhiễu và giá trị kurtosis (a), skewness (b) và độ lệch chuẩn (c) của từng tín hiệu đoạn trên tín hiệu PPG gốc (a) Giá trị của các chỉ số này thể hiện rõ sự khác biệt ở các đoạn tín hiệu bị nhiễu do cứ động [27] 22

Hình 3.1: (a) Cấu trúc mô dưới da, (b) những ánh sáng có bước sóng khác nhau có mức độ đâm xuyên khác nhau [35] 27

Hình 3.2: Thiết bị PPG của Hertzman qua các năm (a) (b) 1937, (c) 1938 [35] 27

Hình 3.3: Hệ thống thu thập tín hiệu PPG và tín hiệu PPG [35] 28

Hình 3.4:Cấu hình một số mạch phát của tín hiệu PPG [35] 29

Hình 3.5: Tín hiệu PPG thay đổi theo chu kỳ co bóp của tim với thành phần DC và thành phần DC Thành phần AC chủ yếu xuất hiện do sự thay đổi lưu lượng máy ở động mạch theo chu kỳ tim (hình bên dưới), trong khi lưu lượng máu của tĩnh mạch hầu như không thay đổi và chủ yếu đóng góp vào thành phần DC của tín hiệu 30

Hình 3.6: Sự ảnh hưởng của các yếu tố bên trong cơ thể đến tín hiệu PPG 31

Hình 3.7: Các vị trí đặt điện cực của 12 chuyển đạo khi đo điện tâm đồ [36] 32

Trang 14

XI

Hình 3.8: Tín hiệu ECG đầy đủ gồm sóng P, bộ phức QRS và sóng T [37] 32

Hình 3.9: Ngoại thu tâm thất [37] 33

Hình 3.16: Cấu trúc của mạng LSTM (nguồn: internet) 38

Hình 4.1: Sơ đồ thuật toán phát hiện và loại bỏ đoạn tín hiệu PPG bị ảnh hưởng do tác động của cử động 43

Hình 4.2: Kết quả thuật toán bắt đỉnh cho tín hiệu PPG từ bộ dữ liệu của bệnh viện Thống Nhất (a), và dữ liệu MIMICIII (b) Các hình tròn màu tím là kết quả của thuật toán bắt đỉnh 44

Hình 4.3: Tín hiệu PPG gốc (hình trên) và tín hiệu PPG đã trừ đường bao dưới (hình dưới) 44

Hình 4.4: (a) Tín hiệu PPG, (b) Một nhịp của tín hiệu PPG trích xuất từ tín hiệu (vùng màu đỏ) bằng thuật toán tìm đỉnh, (c) Nhịp sau khi chuẩn hóa để thu được một mẫu tín hiệu PPG 45

Hình 4.5: Một số mẫu tín hiệu từ dữ liệu MIMICIII dùng để huấn luyện mô hình autoencoder 48

Trang 15

XII

Hình 4.6: Sơ đồ thể hiện thuật toán phát hiện rối loạn nhịp tim từ tín hiệu PPG 49Hình 4.7: Phổ thời gian – tần số từ biến đổi wavelet của tín hiệu 𝑥 = 𝑠𝑖𝑛⁡(𝑡2) vẽ bằng phần mềm Matlab 50Hình 4.8: Phổ thời gian – tần số từ biến đổi Hilbert của tín hiệu 𝑥 = 𝑠𝑖𝑛⁡(𝑡2) vẽ bằng phần mềm Matlab Phổ thể hiện rõ sự thay đổi của tần số tín hiệu gần bằng một làm 𝑓𝑡 = 2𝑡 với 𝑡 là thời gian Phần dao động ở đầu và đuôi tín hiệu là do thuật toán tín toán trên miền rời rạc và thời gian có giới giạn của Matlab.Nếu tính toán với tín hiệu trên miền liên tục và thời gian vô hạn thì tần số sẽ đúng bằng f𝑡 = 2𝑡 51Hình 4.9: (a) phân tích VMD của tín hiệu ⁡𝑥⁡ = ⁡𝑐𝑜𝑠4𝜋𝑡 + 2𝑐𝑜𝑠20𝜋𝑡 + 4𝑐𝑜𝑠60𝜋𝑡 +0,01 𝑁(𝑡), với bốn kênh IMF đại diện cho bốm thành phần tần số (b) Phổ thời gian – tần số của tín hiệu thông qua biến đổi Hilbert thể hiện bốn kênh IMF dưới dạng tần số tức thời và biên đô tức thời 53

Hình 4.10: Hiện tượng end-effect xảy ra ở hai vùng phổ từ 0 giây đến 0,1 giây và từ

0,9 giây đến 1 giây làm các vùng của phổ thời gian – tần số ở thời điểm đầu và cuối tín hiệu không chính xác 54Hình 4.11: Cấu trúc tổng quát mô hình CNN-LSTM 56Hình 4.12: Tín hiệu ECG và tín hiệu PPG của người không mắc bệnh rối loạn nhịp tim từ dữ liệu MIMICIII 58Hình 4.13: Tín hiệu ECG và tín hiệu PPG của người không mắc bệnh rối loạn nhịp tim từ dữ liệu MIMICIII 58Hình 4.14: Tín hiệu ECG và tín hiệu PPG của người không mắc bệnh rối loạn nhịp tim từ dữ liệu MIMICIII 58Hình 4.15: Tín hiệu ECG và tín hiệu PPG của người mắc bệnh rối loạn nhịp tim từ dữ liệu MIMICIII 59

Trang 16

XIII

Hình 4.16: Tín hiệu ECG và tín hiệu PPG của người mắc bệnh rối loạn nhịp tim từ dữ liệu MIMICIII 59Hình 5.1: Giá trị hàm mất mát trong quá trình huấn luyện mạng autoencoder 61Hình 5.2: Một số ví dụ về các mẫu được xử ly bằng mô hình autoencoder từ tín hiệu PPG của người không mắc bệnh rối loạn nhịp tim 62Hình 5.3: Một số ví dụ về các mẫu được xử ly bằng mô hình autoencoder từ tín hiệu

PPG của người không mắc bệnh rối loạn nhịp tim 62

Hình 5.4: Phân phối giá trị hàm mất mát của phầm huấn luyện và phần thẩm dịnh sau khi được tính toán từ mô hình autoencoder 63Hình 5.5: Kết quả của thuật toán xử lý tín hiệu dựa trên mô hình autoencoder Đường màu cam là đường mức thể hiện việc chọn và loại bỏ tín hiệu tương ứng, với mức cao là chọn và mức thấp là loại bỏ Các ô màu xanh thể hiện đoạn tín hiệu được dán nhãn là đạt yêu cầu Các vòng trong màu đỏ khoanh vùng các cơn rối loạn nhịp tim 64Hình 5.6: Phân tích VMD và phổ tần số thời gian – tần số của của tín hiệu PPG từ người không mắc bệnh rối loạn nhịp tim (a) Tín hiệu PPG, (b) Tín hiệu ECG, (c) Các kênh IMF, (d) Phổ FFT, (e) Phổ thời gian – tần số, (f) Kết quả của thuật toán tìm cạnh trên phổ thời gian – tần só, (g) ma trận hiệp phương sai giữ các IMF và tín hiệu PPG gốc 66Hình 5.7: Phân tích VMD và phổ tần số thời gian – tần số của của tín hiệu PPG từ người có một cơn rối loạn nhịp tim (a) Tín hiệu PPG, (b) Tín hiệu ECG, (c) Các kênh IMF, (d) Phổ FFT, (e) Phổ thời gian – tần số, (f) Kết quả của thuật toán tìm cạnh trên phổ thời gian – tần só, (g) ma trận hiệp phương sai giữ các IMF và tín hiệu PPG gốc 67Hình 5.8: Phân tích VMD và phổ tần số thời gian – tần số của của tín hiệu PPG từ người mắc rối với số cơn loạn nhịp dày đặc (a) Tín hiệu PPG, (b) Tín hiệu ECG, (c)

Trang 17

XIV

Các kênh IMF, (d) Phổ FFT, (e) Phổ thời gian – tần số, (f) Kết quả của thuật toán tìm cạnh trên phổ thời gian – tần só, (g) ma trận hiệp phương sai giữ các IMF và tín hiệu PPG gốc 68Hình 5.9: Đồ thị giá trị hàm mất mát (trái) và độ chính xác (phải) của fold 1 trong quá trình huấn luyện 71Hình 5.10: Đồ thị giá trị hàm mất mát (trái) và độ chính xác (phải) của fold 2 trong quá trình huấn luyện 71Hình 5.11: Đồ thị giá trị hàm mất mát (trái) và độ chính xác (phải) của fold 3 trong quá trình huấn luyện 72Hình 5.12: Đồ thị giá trị hàm mất mát (trái) và độ chính xác (phải) của fold 4 trong quá trình huấn luyện 72Hình 5.13: Đồ thị giá trị hàm mất mát (trái) và độ chính xác (phải) của fold 5 trong quá trình huấn luyện 72Hình 5.14: Đồ thị giá trị hàm mất mát (trái) và độ chính xác (phải) của fold 1 trong quá trình huấn luyện 73Hình 5.15: Đồ thị giá trị hàm mất mát (trái) và độ chính xác (phải) của fold 2 trong quá trình huấn luyện 74Hình 5.16: Đồ thị giá trị hàm mất mát (trái) và độ chính xác (phải) của fold 3 trong quá trình huấn luyện 74Hình 5.17: Đồ thị giá trị hàm mất mát (trái) và độ chính xác (phải) của fold 4 trong quá trình huấn luyện 74Hình 5.18: Đồ thị giá trị hàm mất mát (trái) và độ chính xác (phải) của fold 5 trong quá trình huấn luyện 75

Trang 18

1

CHƯƠNG 1: MỞ ĐẦU VÀ ĐẶT VẤN ĐỀ 1.1 Tín hiệu PPG và rối loạn nhịp tim

Tim là một bộ phận vô cùng quan trọng trong cơ thể của mỗi chúng ta Với chức năng là một chiếc máy bơm cung cấp oxy và chất dinh dưỡng đến từng cơ quan, thì bất cứ bất ổn nào xảy ra trong quá trình hoạt động của tim đều dẫn đến các hậu quả nghiệm trọng Trong đó, rối loạn nhịp tim là một trong các bất ổn về tim đáng lo ngại Theo thống kê Bảng 1.1, số lượng người mắc các vấn đề về rối loạn nhịp tim khá cao

Bảng 1.1: Số liệu trường hợp mắc các bệnh rối loạn nhịp tim

Các loại rối loạn nhịp tim

Giai đoạn

Tình trạng Khu vực Tham khảo

Rung nhĩ 2013 467.000 ca nhập viện và hơn 99.000 ca tử vong mỗi năm

Bắc Mĩ

[1] Rung nhĩ 2010 33,5 triệu người mắc

[2] Rối loạn nhịp tim 2010 3.000 bệnh nhân mỗi

[3] Mặc dù trong hầu hết các trường hợp rối loạn nhịp tim không dẫn đến các nguy hiểm ngây lập tức đối với sức khỏe, nhưng hoạt động bất thường của tim góp phần hình thành các huyết khối cũng như các hậu quả trong việc cung cấp máu kém hiệu quả đến các cơ quan Và đây chính là tiền đề để dẫn đến các căn bệnh nguy hiểm [1], [4] tiêu biểu như đột quỵ, suy tim, đột tử:

Đột quỵ

Rung tâm nhĩ là loại rối loạn nhịp tim phổ biến (1/3 các trường hợp rối loạn nhip tim) và cũng là tác nhân làm tăng nguy cơ đột quỵ Đây là rối loạn mà tâm nhĩ chỉ rung với tần số cao nhưng không co bóp để tống máu về tâm thất Điều này tạo điều kiện cho các huyết khối dễ hình thành, làm tắc mạch và dẫn đến đột quỵ

Trang 19

2

Đột tử

Rung tâm thất là loại nguy hiểm nhất và có nguy cơ dẫn đến đột tử Biểu hiện của bệnh là tâm thất co bóp hỗn loạn không tuân theo chu kỳ của tim vì vậy chức năng của hệ tuần hoàn không được đảm bảo dẫn đến nguy hiểm đến tính mạng cần được cấp cứu ngay

Suy tim

Hệ thần kinh tự động và hệ tuần hoàn có vai trò mật thiết vì vậy khi mắc các bệnh liên quan đến rối loạn nhịp tim làm cho máu không đủ cung cấp cho các cơ quan thì hệ thần kinh sẽ bắt tim làm việc nhiều hơn dẫn đến các tế bào cơ tim làm việc quá sức

Rối loạn nhip tim khó chẩn đoán trong khám lâm sàn do trong giai đoạn đầu của bệnh, các xung nhịp lỗi không xuất hiện thường xuyên mà chỉ xuất hiện trong một khoảng thời gian, đặc biệt là ngoại thu tâm thất Điều này làm giảm khả năng chẩn đoán chính xác bệnh và làm tăng số lần thăm khám Vì vậy, các thiết bị theo dõi trong thời

gian dài được sử dụng như holter, thẻ tim, Hình 1.1 Bệnh nhân sẽ đeo các thiết bị này

trong một khoảng thời gian đủ dài để theo dõi hoạt động của tim

Hình 1.1: Đo điện tâm đồ bằng thiết bị holter [5].

Tuy nhiên nhược điểm của các thiết bị theo dõi trong thời gian dài hạn chế ở các điểm sau:

Trang 20

3

 Giá thành cao và không phổ biến cho sử dụng cá nhân

 Một số thiết bị gây bất tiện cho người dùng vì sự cồng kềnh và thao tác vận hành Ví dụ, holter với bản chất là một thiết bị đo điện tâm đồ thu nhỏ, vì vậy khi sử dụng, người bệnh phải dán các điện cực lên người nên sẽ gây cản trở và khó chịu trong sinh hoạt [6]

Những năm gần đây, với sự phát triển của công nghệ, các thiết bị y tế trong lĩnh vực chăm sóc sức khỏe ngày càng nhỏ gọn và hiệu quả Trong đó, có thể kể đến là thiết

bị đo nồng độ oxy trong máu (pulse oximeter) có thể tích hợp trong các đồng hồ thông

minh rất tiện lợi Các thiết bị này hoạt động dựa trên việc xử lý tín hiệu

photoplethysmography (PPG) sinh ra do sự hấp thụ ánh sáng khác nhau của từng vị trí

trên cơ thể theo sự thay đổi lưu lượng máu và nồng độ phân tử O2HHb và HHb có trong hồng cầu

Do có thể theo dõi sự thay đổi lưu lượng máu nên trong hai thập kỉ qua đã có rất nhiều nghiên cứu sử dụng PPG để phát hiện và phân loại các bệnh rối loạn nhịp tim Các nghiên cứu đáng chú ý:

 Dong Han, [7] sử dụng PPG kết hợp với Poincare’s Plot và mô hình học máy để phân loại các rối loạn nhịp tim như AF, PVC, PAC và nhịp tim bình thường  Ngoài ra một số nghiên cứu khác sử dụng các mô hình học sâu để phát hiện

người bị bệnh rung tâm nhĩ, [8], [9]

Ưu điểm của thiết bị này so với các phương pháp truyền thống là:  Giá thành rẻ mà bất kỳ ai cũng có thể mua trên thị trường

 Gọn nhẹ nhờ được tích hợp trong các đồng hồ thông minh nên có thể sử dụng mọi lúc mọi nơi Một số thiết bị có thể kể đến như Oura (thế hệ thứ 3), Fitbit Charge 5, E4 wristband

 Cách sử dụng đơn giản so với các thiết bị dựa trên điện tâm đồ

Trang 21

4

1.2 Đặt vấn đề

Có thể thấy rối loạn nhịp tim làm một căn bệnh nguy hiểm và có sự điều trị phức tạp, thêm vào đó với hiện trạng quá tải ở các bệnh viện công thì đây quả là một khó khăn đối với những người mắc bệnh May mắn thay với công nghệ chăm sóc sức khỏe và y tế từ xa, khả năng tiếp cận điều trị của người bệnh sẽ được cải thiện, hơn thế nữa, vấn đề về thiết bị đầu cuối nhằm hỗ trợ theo dõi bệnh tình sẽ được cải thiện đáng kể về hiệu quả và giá thành nhờ vào công nghệ PPG

Tuy nhiên hiện nay với ý tưởng sử dụng thiết bị PPG để hỗ trợ phát hiện rối loạn nhịp tim thì có hai vấn đề luôn được quan tâm:

 Để sử dụng được thiết bị PPG trong sinh hoạt hằng ngày thì cần phải lọc nhiễu được tín hiệu hoặc ít nhất xác định được các đoạn tín hiệu tin cậy để phục vụ công tác tính toán xử lý để đưa ra kết quả Mặc dù hiện nay hầu hết các nghiên cứu đều chỉ thực hiện với các đoạn tín hiệu không quá nhiễu nhưng việc đánh giá đoạn tín hiệu nào là tốt nhất gặp phải vấn đề nhầm lẫn tín hiệu PPG ứng với biểu hiện của bệnh là tín hiệu nhiễu

 Tín hiệu PPG có thể khác nhau ở các chủng người khác nhau do điều kiện sinh lý cơ thể ví dụ như màu da, nhưng hiện nay vẫn chưa có nghiên cứu nào tiến hành ở người Việt Nam

1.3 Mục tiêu và phạm vi nghiên cứu 1.3.1 Mục tiêu

 Nghiên cứu thuật toán phát hiện rối loạn nhịp tim dựa trên mô hình học sâu với độ đặc hiệu, độ nhạy, độ chính xác đạt 95% với hai bộ dữ liệu khác nhau  Nghiên cứu thuật toán đánh giá tín hiệu PPG thô nhằm xem xét và giữ lại các

đoạn tín hiệu tốt, không bị ảnh hưởng bởi nhiễu do cử động của người dùng

Trang 22

5

1.3.2 Phạm vi nghiên cứu

Nghiên cứu tập trung phân biệt giữa các trường hợp có và không có mắc rối loạn nhịp tim Trong đó rối loạn nhịp tim là do rung tâm nhĩ và ngoại thu tâm thất gây ra

1.4 Nội dung bài luận

Luận văn có cấu trúc gồm 5 chương:  Chương 1: Mở đầu và đặt vấn đề  Chương 2: Tổng quan

 Chương 3: Cơ sở lý thuyết  Chương 4: Xây dựng thuật toán  Chương 5: Kết quả và thảo luận

Trang 23

6

2.1 Các phương pháp phát hiện rối loạn nhịp tim dựa trên tín hiệu PPG

Ý tưởng sử dụng tín hiệu PPG để phát hiện rối loạn nhịp tim xuất phát từ thực tế rằng, rối loạn nhịp tim thay đổi nhịp co bóp của tim dẫn đến sự thay đổi lưu lượng máu bơm đi khắp cơ thể Chính vì vậy, hệ quả dẫn đến là sự thay đổi của tín hiệu PPG Hình 2.1 cho thấy khi có sự xuất hiện của rối loạn nhịp tim, tín hiệu PPG trở nên không ổn định và có sự thay đổi rõ rệt về tần số và biên độ so với khi không có rối loạn nhịp tim

Hình 2.1: Tín hiệu PPG có sự khác biệt giữa người không mắc và mắc các bệnh rối loạn

nhịp tim [10]

Rối loạn nhịp tim có rất nhiều biến thể khác nhau như là rung tâm nhĩ, cuồng tâm nhĩ, co thắt tâm thất sớm và co thắt tâm nhĩ sớm Tuy nhiên hiện nay hầu hết các nhà nghiên cứu trong lĩnh vực này chỉ tập trung vào rung tâm nghĩ bởi sự nguy hiểm và độ phổ biến của nó

Hiện nay các phương pháp dựa trên PPG để chẩn đoán rối loạn nhịp tim chủ yếu

dựa trên các phương pháp dựa trên phân tích dữ liệu thực nghiệm (data-driven) Theo

Trang 24

7

đó, các nhà nghiên cứu thu thập tín hiệu PPG cùng một số thông số liên quan đến sức khỏe , tiền sử bệnh trên từng bệnh nhân hoặc tình nguyện viên, tiếp đến họ sẽ phân loại và “dán nhãn dữ liệu” tương ứng với tình trạng bệnh cụ thể bằng các phương pháp chẩn đoán truyền thống mà ở đây là tín hiệu điện tâm đồ (ECG) Sau khi hoàn thành công việc thu thập và dán nhãn dữ liệu, các mô hình phân tích dữ liệu được xây dựng để tìm ra mối liên hệ giữa PPG và rối loạn nhịp tim và từ đó phát hiện được rối loạn nhịp tim từ PPG Có ba phương pháp phân tích dữ liệu thực nghiệm được sử dụng rộng rãi trong các nghiên cứu trong phát hiện rối loạn nhịp tim dựa trên tín hiệu PPG gồm:

 Sử dụng mô hình thống kê  Sử dụng mô hình học máy  Sử dụng mô hình học sâu

2.1.1 Phương pháp sử dụng mô hình thống kê

Xu hướng chung của các nghiên cứu sử dụng mô hình thống kê để chẩn đoán rối loạn nhịp tim là đưa ra một khoảng giá trị giới hạn cho các chỉ số, được tính toán dựa

trên chuỗi khoảng cách giữa các đỉnh của tín hiệu PPG (PP-interval), Hình 2.2

Hình 2.2: Khoảng cách đỉnh (PP) của tính hiệu PPG [11]

Thuật toán phát hiện rối loạn nhịp tim từ PPG của các nghiên cứu sử dụng phương pháp thông kê nhìn chung được tiến hành theo các bước gồm tiền xử lý

(preprocessing), tìm đỉnh (peak detection), tính toán chỉ số, phân loại Hình 2.3 mô tả

thuật toán để tiến hành phát hiện rối loạn nhịp tim bằng các phương pháp sử dụng mô hình thống kê Tiền xử lý (bước 1): có nhiệm vụ lọc nhiễu và đánh giá các đoạn tín hiệu PPG đủ tiêu chuẩn để có thể sử dụng trong việc phát hiện rối loạn nhịp tim Tìm đỉnh (bước 2): xác định các đỉnh của tín hiệu PPG, từ đó tính toán được khoảng thời gian giữa

Trang 25

8

các đỉnh Tính toán các chỉ số (bước 3): từ chuỗi khoảng cách đỉnh được tính toán ở bước 2, các chỉ số thống kê được tính toán Bước 4: sau khi tính toán các giá trị của các chỉ số thống kê, việc phân biệt giữa tín hiệu thể hiện rối loạn và bình thường được quyết định bởi lớn hay nhỏ một giá trị ngưỡng

Hình 2.3: Sơ đồ quy trình chung của các thuật toán phát hiện rối loạn nhịp tim bằng phương pháp thống kê

Kết quả của các thuật toán sẽ được đánh giá dựa trên độ đặc hiệu (specificity), độ chính xác (accuracy), độ nhạy (sensitivity) (tiêu chuẩn này cũng được các nghiên cứu

sử dụng để đánh giá thuật toán dựa trên mô hình học máy và học sâu) Ngoài ra đường

cong ROC (Receiver operating characteristic) cùng với diện trích dưới đường cong

(AUC) cũng được sử dụng khá nhiều Chúng dùng để lựa chọn các giá trị tham số phù hợp cho thuật toán ví dụ như giá trị các ngưỡng cũng như so sánh tính hiệu quả giữa các thuật toán khác nhau, theo đó thuật toán có chỉ số AUC cao hơn cho thấy kết quả chính xác hơn trong việc phát hiện rối loạn nhịp tim

Có nhiều nghiên cứu sử dụng phương pháp này và điểm khác biệt duy nhất nằm ở chỉ số nào được sử dụng để phát hiện bệnh rối loạn nhịp tim Các chỉ số được sử dụng

phổ biến bao gồm Root mean square of successive difference ( RMSSD), Sample entropy

Trang 26

biểu đồ Poincare , [15] [16] [17]

𝐶𝑜𝑚𝑏⁡ = ⁡𝑤 × 𝑅𝑀𝑆𝑆𝐷⁡ + (1 − 𝑤) × 𝑆𝑎𝑚𝑝𝐸𝑛 (2.1)

2.1.2 Phương pháp sử dụng mô hình học máy

So với phương pháp sử dụng mô hình thống kê, phương pháp sử dụng mô hình

học máy (machine learning) sử dụng đa dạng các chỉ số hay nói chính xác hơn là các đặc trưng (feature) khác nhau để xác định một đoạn tín hiệu PPG có bị rối loạn nhịp tim

hay không Bên cạnh các chỉ số thống kê, một số các đặc trưng được sử dụng như đặc

trưng trong miền thời gian (Time-domain features), [18], đặc trưng trong miền tần số (Frequency-domain features), [19], đặc trưng mô tả dạng sóng của tính hiệu PPG (Waveform descriptors), [18]

Một thuật toán sử dựng mô hình học máy để phát hiện rối loạn nhịp tim dựa trên tín hiệu PPG sẽ trải qua các bước tiền xử lý, trích xuất đặc trưng, phân loại bằng mô hình học máy Có thể thấy, so với phương pháp thống kê mô hình học máy khác ở hai điểm Điểm thứ nhất là số lượng đặc trưng nhiều hơn, điều này có nghĩa sẽ cần nhiều thuật toán

Trang 27

10

hơn để trích xuất các đặc trưng giống nhau Điểm thứ hai nằm ở phương pháp phân loại, ở đây thay vì sử dụng các ngưỡng so sánh thì một mô hình học máy được sử dựng Các

mô hình được sử dụng phổ biến gồm (k–nearest neighbors, support vector machine,…)

Chính vì sử dụng các mô hình học máy do đó, để hình thành mô hình cần trải qua hai

giai đoạn là giai đoạn huấn luyện (training) và giai đoạn đánh giá (testing) Hình 2.4 mô

tả tổng thể một nghiên cứu sử dụng mô hình học máy để phát hiện rối loạn nhịp tim

Hình 2.4: Sơ đồ quy trình chung của các thuật toán phát hiện rối loạn nhịp tim bằng phương pháp mô hình học máy

2.1.3 Phương pháp sử dụng mô hình học sâu

Hình 2.5: Sơ đồ quy trình chung của các thuật toán phát hiện rối loạn nhịp tim bằng phương pháp mô hình học sâu

Trang 28

11

Học sâu (deep learning) là một phần trong một nhánh của phương pháp học máy

dựa trên mạng thần kinh nhân tạo kết hợp với việc học biểu diễn đặc trưng

(representation learning) Vì vậy về cơ bản một nghiên cứu sử dụng mô hình học sâu sẽ

không khác nhiều so với mô hình học máy, Hình 2.5 Điểm khác biệt duy nhất giữa hai phương pháp này chính là mô hình học sâu có khả năng tự động trích xuất đặc trưng

thông qua các kiến trúc mạng thần kinh (neural network) Mô hình học sâu được sử dụng nhiều nhất là mạng nơ-ron tích chập (convolution neural network-CNN) CNN được áp dụng để phân tích hình bằng cách sử dụng các bộ lọc (kernel – filter) và phép tích chập

để xác định các đặc trưng của dữ liệu một cách tự động Điều này đặc biệt thích hợp trong các tác vụ liên quan đến xác định đặc trưng của các tập dữ liệu Nhờ đặc điểm này mà các thuật toán sử dụng CNN không cần các thuật toán trích xuất đặc trưng như trong mô hình học máy, giảm bớt các tác vụ hiệu chỉnh tham số cho thuật toán, vốn là những yếu tố gây ảnh hưởng đến độ chính xác và phạm vi áp dụng của thuật toán Poh và các

cộng sự, [10] đã tiến hành một nghiên cứu sử dụng mô Dense CNN (DCNN) để phát

hiện rung tâm nhĩ, ngoại thu tâm nhĩ và nhịp tim bình thường với đầu vào là tín hiệu PPG thô Nghiên cứu này so sánh tính hiệu quả của mạng DCNN với các thuật toán sử dụng phương pháp thống kê và học máy, và cho thấy DCNN hiệu quả hơn so với các

phương pháp còn lại dựa trên ma trận nhầm lẫn (confusion matrix) Bằng cách quan sát

các bộ lọc sau khi huấn luyện, nghiên cứu này cho thấy các mạng DCNN có xu hướng trích xuất các đỉnh của tín hiệu PPG Điều này giống như cơ sở lập luận của các phương pháp sử dụng chỉ số thống kê

Trang 29

12

Hình 2.6: (a) Kết quả phát hiện các trường hợp rối loạn nhịp tim và không rối loạn nhip tim của phương pháp sử dụng mô hình DCNN và các phương pháp khác (b) Biểu đồ thể hiện sự phân cụm của các bệnh dựa trên hai chiều đầu của lớp ẩn, cho thấy tín hiệu quả

trong việc phát hiện nhịp tim [10]

Để tăng tính hiệu quả, một số nghiên cứu còn sử dụng kết hợp giữa CNN và các đặc trưng như đã đề cập ở phần trên Shashikumar và các cộng sự, [20] sử dụng mạng

CNN với đầu vào phổ thời gian – tần số thông qua biến đổi wavelet kết hợp với các đặc

trưng để phát hiện các trường hợp bị rung tâm nhĩ, Hình 2.7 Nghiên cứu này cho rằng việc bổ sung các đặc trưng của tín hiệu vào một mạng CNN đơn giản giúp tăng tính hiệu quả trong việc phân loại khi các đặc trưng sẽ cho mạng CNN phân biệt được giữa tín hiệu bị rối loạn nhịp tim và tín hiệu nhiễu, vốn khó phân biệt khi sử dụng phương pháp thống kê hay học máy

Trang 30

13

Hình 2.7: Phương pháp sử dụng kết hợp giữa phân tích đặc tính và mạng CNN [20]

Mặt khác, ở một số bệnh nhân xuất hiện rối loạn nhịp tim, hiện tượng bệnh sẽ không xay ra liên tục và cần thời gian dài để đánh giá bệnh tình [21] Vì vậy, một vài

nghiên cứu kết hợp giữa CNN và mạng thần kinh hồi tiếp (Recurent neural network) để

phát hiện hoặc tính toán xác suất có thể bị bệnh rối loạn nhịp tim I Gotlibovych và các cộng sự, [22] đã tính toán xác suất bị bệnh rung tâm nhĩ bằng cách sử dụng CNN và bộ nhớ ngắn - dài (LSTM), Hình 2.8 Theo đó CNN có nhiệm vụ trích xuất các đặc trưng của tín hiệu, LSTM có nhiệm vụ tính toán xác suất mắc bệnh dựa trên các dữ liệu đã phân tích trước đó Với việc sử dụng mạng LSTM, nghiên cứu này tin rằng việc chẩn đoán nguy cơ mắc các bệnh liên quan đến rối loạn nhịp tim thông qua giám sát dữ liệu thu thập từ bệnh nhân bằng các thiết bị đeo tay sẽ được cải thiện đáng kể Dữ liệu sẽ được giám sát liên tục cả ở quá khứ và hiện tại để đưa ra kết quả chính xác nhất là không cần quá nhiều dung lượng bộ nhớ để lưu trữ Bên cạnh đó thuật toán cũng giảm thiểu đáng kể sự can thiệp đến từ người dùng

Trang 32

thời gian – tần số trong trường hợp khi có rối loạn nhịp tim [23]

2.1.4 So sánh các phương pháp

Từ các nghiên cứu, việc áp dụng tín hiệu PPG trong việc phát hiện rối loạn nhịp tim cần phải xem xét đến các vấn đề như độ dài tín hiệu mức độ đáp ứng đối với dữ liệu, độ phức tạp của thuật toán

Trang 33

16

Độ dài của tín hiệu

Độ dài của tín hiệu hay nói cách khác là thời gian thu tín hiệu PPG là bao nhiêu để tín hiệu đó có thể dự đoán chính xác tình trạng bệnh Yếu tố này đặc biệt quan trọng đối với các phương pháp sử dụng chỉ số thống kê Do các chỉ số thống kê là đại diện cho một phân phối của tín hiệu, vì vậy, với một thời gian đủ dài thì chỉ số đó sẽ đại diện tốt cho phân phối hơn Đã có nhiều nghiên cứu đề cập và tiến hành thử nghiệm với các độ dài mẫu cũng như các chỉ số thống kê khác nhau [24] so sánh kết quả phân loại rung

tâm nhĩ dựa trên chỉ số đánh giá Kappa với các độ dài mẫu tín hiệu lần lượt là 30 giây,

60 giây và 120 giây Kết quả nghiên cứu cho thấy ở tất cả các chỉ số thống kê được sử dụng để phân loại bao gồm Shannon entropy, RMSSD, thì với mẫu có độ dài 120 giây cho hiệu quả phân loại tốt nhất với chỉ số Kappa đạt 0,956, Hình 2.11a thể hiện kết quả của việc so sánh AUC của thuật toán phân loại rung tâm nhĩ với các độ dài mẫu từ 1 đến 10 phút, [15] Nghiên cứu cho thấy với độ dài mẫu càng lớn thì hiệu quả phân loại càng cao thể hiệu qua AUC, Hình 2.11b Tuy nhiên, điều này không có nghĩa là độ dài mẫu càng lớn càng tốt, vì nghiên cứu cũng chỉ ra rằng khi độ dài mẫu tăng đến một giá trị nào đó thì sự chênh lệch AUC là không quá đáng kể, mà ở đây là 2 phút Và thêm nữa, việc lấy mẫu trong thời gian quá dài sẽ làm tăng dung lượng bộ nhớ và hiệu quả tính toán của thuật toán, đồng thời cũng tăng xác suất gặp phải các tín hiệu nhiễu do bệnh nhân có thể cử động do mỏi trong lúc thu tín hiệu

Trang 34

17

Hình 2.11: (a) So sánh kết quả phân loại rung tâm nhĩ dựa trên hệ số Kappa với các độ

dài mẫu khác nhau lần lượt là 30s, 60s, 120s [24] (b) So sánh kết quả phân loại rung

tâm nhĩ dựa trên đường cong ROC với các độ dài mẫu khác nhau lần lượt là 1 phút, 2

phút và 10 phút [15]

Các thuật toán dựa trên mô hình học máy và học sâu, mặc dù chỉ sử dụng độ dài mẫu tín hiệu từ 10 đến 30 giây vẫn cho kết quả tương đương [25] sử dụng tín hiệu PPG

với độ dài 10 giây kết hợp với thuật toán SVM Recursive Feature Elimination

(SVM-RFE) và các đặc trưng trong cả miền tần số và miền thời gian, Hình 2.12 Bằng cách so sánh độ chính xác với của thuật toán với các độ dài tín hiệu và các tập đặc trưng khác nhau, nghiên cứu chỉ ra rằng kết quả tốt nhất ứng với độ dài tín hiệu 10 giây Các nghiên cứu sử dụng mô hình CNN, [10] [8] lần lượt nghiên cứu với độ dài mẫu 17 giây và 30 giây cho kết quả khá tốt với AUC đạt 0,99

Hình 2.12: Sơ đồ thể hiện thuật toán phân loại rối loạn nhịp tim dựa trên mô hình SVM

và RFE [25].

Mức độ đáp ứng đối với dữ liệu

Trang 35

18

Mức độ đáp ứng đối với dữ liệu là khả năng phân loại với số lượng dữ liệu lớn Về yếu tố này các thuật toán sử dụng mô hình học sâu có đáp ứng với lượng dữ liệu lớn tốt hơn so với học máy và thống kê [21] Điều này có thể lý giải rằng các dữ liệu là tổ hợp của các phân phối khác nhau, trong khi các chỉ số thống kê với một ngưỡng cho trước chỉ mô tả tốt cho một phân phối, do đó các phương pháp thông kê khó có thể đáp ứng tốt đối với lượng dữ liệu lớn vốn phức tạp hơn Trái lại, một mô hình học sâu gồm có hàng trăm thông số, được xác định thông qua quá trình huấn luyện với tập dữ liệu lớn sẽ có đáp ứng tốt hơn Một bằng chứng cho thấy các mô hình học sâu có khả năng đáp ứng tốt với lượng dữ liệu lớn là trong khi các mô hình thống kê chỉ tập trung phân biệt một loại bệnh thì các mô hình học sâu có khả năng phân biệt một vài bệnh khác nhau ví dụ [10] phân biệt giữ ngoại thu tâm nghĩ, rung tâm nhĩ và các trường hợp bình thường

Độ phức tạp của thuật toán

Độ phức tạp của thuật toán dựa trên số lượng phép tính của thuật toán

(computation complexity) Yếu tố này rất quan trọng vì nó sẽ quyết định khả năng tích

hợp thuật toán vào các thiếu bị đeo tay Từ các phân tích ở phần trên có thể thấy các thuật toán dựa trên mô hình thống kê và học máy có độ phức tạp thấp có khả năng tích hợp cao, trong khi các thuật toán sử dụng mô hình học sâu cần rất nhiều phép tính vì vậy đòi hỏi thiết bị có khả năng tính toán cao

Kết luận

Mặc dù so với các phương pháp sử dụng hệ số thống kê và học máy, phương pháp học sâu có độ phức tạp về mặt tính toán cao hơn và khó tích hợp vào các thiết bị đeo tay trên thị trường nhưng phương pháp này có những ưu điểm không thể thay thế được như sau:

 Mô tả tốt đối với các dữ liệu có số lượng lớn và độ phức tạp cao Điều này hoàn toàn phù hợp cho việc dự đoán rối loạn nhịp tim với đa dạng các chủng tộc khác

Trang 36

 Phát hiện tốt đối với các mẫu tín hiệu có độ dài nhỏ Việc này sẽ giúp giảm thiểu xác suất bị ảnh hưởng bởi cử động của người dùng

Bên cạnh đó với sự tiến bộ của công nghệ thì nhược điểm của các thuật toán sử dụng mô hình học sâu có thể khắc phục như sau:

 Các thuật toán sử dụng mô hình học sâu thay vì tích hợp vào các thiết bị đeo tay

thì sẽ được tích hợp vào các đám mây trên thông qua internet Theo đó, thiết bị

đeo tay sẽ có nhiệm vụ thu nhận tín hiệu và gửi lên thuật toán đã được lưu trữ trên cơ sở dữ liệu đám mây

 Đôi khi việc theo dõi và phát hiện rối loạn nhịp tim sẽ mang tính cá nhân hóa, vì vậy có thể dựa vào tính ghi nhớ của các mạng RNN, thuật toán sẽ cập nhật và huấn luyện theo thời gian thực Dữ liệu sẽ liên tục cập nhật thông qua các thiết bị đeo

Tuy nhiên, đối với các thuật toán sử dụng mô hình học sâu còn một vấn đề về dữ liệu đầu vào Như đã trình bày, có hai loại dữ liệu đầu vào cho mô hình học sâu đó là dữ liệu dạng chuỗi thời gian hay nói chính xác hơn là loại dữ liệu PPG thô đã thông qua tiền xử lý bằng các bộ lọc thông dải và loại dữ liệu dưới dạng phổ thời gian – tần số được

biến đổi trực tiếp từ tín hiệu thô bằng biến đổi wavelet Trong đó loại dữ liệu đầu vào

dưới dạng chuỗi thời gian kém hiệu quả hơn do các bộ lọc sẽ làm mất đi thông tin của tín hiệu, [23], đặc biệt là đối với các tín hiệu có xuất hiện bệnh rối loạn nhịp tim Không chỉ vậy, phổ thời gian – tần số còn có những ưu điểm tốt giúp tăng hiệu quả trong việc phát hiện rối loạn nhịp tim như:

Trang 37

20

 Phổ thời gian – tần số giúp thể hiện rõ sự thay đổi của tần số và biên độ theo thời gian [26], vì vậy khi có bất kỳ sự thay đổi đột ngột nào của tín hiệu, phổ sẽ thể hiện rõ sư thay đổi đó Việc này rất hữu ích trong việc phát hiện rối loạn nhịp tim, vì các cơn rối loạn trong một số trường hợp sẽ là các tín hiệu xuất hiện đột ngột làm thay đổi tần số và biên độ của tín hiệu

 Phổ thời gian – tần số hoạt động như là một bộ lọc, chúng tách tín hiệu thành các thành phần tần số khác nhau trong đó gồm các vùng tần số cấu thành tín hiệu và vùng tần số nhiễu, do đó chỉ cần giới hạn vùng tần số mà tim hoạt động thì đã đủ để phát hiện rối loạn nhịp tim mà không sợ làm mất mát thông tin của tín hiệu

Về mặt mô hình được sử dụng thì cho đến hiện nay phổ biến nhất là hai dạng CNN và dạng lai CNN-LSTM Các nghiên cứu cho thất cả hai mô hình đều cho kết quả tốt vì vậy vẫn chưa thể kết luận mô hình nào là tốt nhất

2.2 Các phương pháp nhận diện và loại bỏ các đoạn tín hiệu PPG bị ảnh hưởng do cử động

Một trong những nhược điểm của tín hiệu PPG là dễ dàng bị ảnh hưởng bởi cử động của người sử dụng Chính vì vậy việc phát hiện và loại bỏ các đoạn tín hiệu không đạt chất lượng là rất quan trọng để có thể phục vụ cho các ứng dụng khác mà ở đây là phát hiện rối loạn nhịp tim là vô cùng quan trọng Và cho đến này, các nghiên cứu về nhận diện tín hiêu PPG có thể phân thành các hướng như phương pháp sử dụng chỉ số đánh giá chất lượng (SQI – signal quality index) và phương pháp so sánh với đoạn tín hiệu PPG mẫu

2.2.1 Phương pháp sử dụng chỉ số đánh giá chất lượng

Phương pháp sử dụng chỉ số đánh giá chất lượng dựa trên quan sát rằng tín hiệu PPG là một tín hiệu tuần hoàn Nghiên cứu sử dụng phương pháp này cho rằng, tín hiệu PPG có một phân phối xác định, vì vậy các tín hiệu PPG bình thường sẽ có phân phối

Trang 38

21

khác với các tín hiệu nhiễu Phân phối của tín hiệu PPG đại diện bởi các chỉ đánh giá

chất lượng tín hiệu Hình 2.13 miêu tả sự khác nhau của chỉ số kurtosis và skewness

trong phân phối của các tín hiệu PPG với mức độ nhiễu khác nhau, tuy nhiên các nghiên cứu cũng chưa đưa ra một kết luận cụ thể về sự khác nhau cũng như vùng giá trị cụ thể cho các chỉ số này Thuật toán sử dụng phương pháp sử dụng chỉ số đánh giá chất lượng chia đoạn tín hiệu thành các đoạn tín hiệu nhỏ hơn, sau đó sẽ tiến hành tính toán các chỉ số tương ứng với từng đoạn tín hiệu này, các đoạn tín hiệu có các chỉ số nằm trong ngưỡng cho trước sẽ giữ lại, ngược lại sẽ là các đoạn tín hiệu nhiễu và bị loại bỏ Hình

2.14 diễn tả thuật toán và kết quả sử dụng ba chỉ số độ nghiêng (skewness), độ nhọn

(kurtoisis) và độ lệch chuẩn của nghiên cứu [27] trong việc phát hiện các đoạn tín hiệu

PPG bị ảnh hưởng do cử động

Hình 2.13: Sự khác nhau của chỉ số kurtosis và skewness trong phân phối của các tín

hiệu PPG với mức độ nhiễu khác nhau [28].

Trang 39

22

Hình 2.14: Sơ đồ thuật toán sử dụng hệ số thống kê để phát hiện đoạn PPG bị nhiễu và giá trị kurtosis (a), skewness (b) và độ lệch chuẩn (c) của từng tín hiệu đoạn trên tín hiệu PPG gốc (a) Giá trị của các chỉ số này thể hiện rõ sự khác biệt ở các đoạn tín hiệu bị

nhiễu do cứ động [27]

Tương tự như hầu hết các thuật toán sử dụng các chỉ số đánh giá, việc được quan tâm nhiều nhất đó chính là độ dài đoạn tín hiệu dùng để tính chỉ số và chỉ số nào sẽ được sử dụng [29] đã tiến hành khảo sát sự hiệu quả của chỉ số đánh giá chất lượng bao gồm

perfusion, skewness, kurtosis, entropy, zero crossing rate, signal-to-noise ratio dưới sự

giám sát và đánh giá của các chuyên gia và các phương pháp thống kê Nghiên cứu kết

luận rằng chỉ số skewness là tốt nhất trong việc đánh giá chất lượng của tín hiệu PPG

2.2.2 Phương pháp sử dụng mẫu tín hiệu PPG (photoplethysmographic waveform)

Phương pháp này tạo ra một mẫu PPG đặc trưng cho một đoạn tín hiệu Mẫu

được tạo ra bằng cách xem xét đoạn tín hiệu PPG giữ hai đỉnh (một nhịp tín hiệu PPG) Nghiên cứu của Li và các công sự, [30] sử dụng kỹ thuật dynamic time warping (DWT)

để đánh giá chất lượng từng nhịp PPG thông qua mức động giống nhau giữa nhịp đó và tín hiệu PPG mẫu Tín hiệu mẫu được trích xuất từ tín hiệu bằng hệ số tương quan và thuật toán tìm đỉnh tín hiệu PPG Sau đó họ sử dụng một mô hình học máy để kiểm phân loại đỉnh đạt chuẩn và không đạt chuẩn Phương pháp này được đề xuất nhằm khắc phục

Trang 40

23

sự không cố định về mặt sinh lý dòng máu, dẫn đến sự thay đổi về chiều cao, chiều rộng và hình thái của tín hiệu PPG Một số nghiên cứu tương tự có thể tham khảo là [31], [32], [33]

2.2.3 So sánh các phương pháp

Hiện nay phương pháp nào là tốt nhất để đánh giá tín hiệu PPG vẫn chưa thể khẳng định một cách chắc chắn Nhất là trong ứng dụng PPG vào phát hiện rối loạn nhịp tim Điều này là do mỗi thuật toán sẽ đặc biệt hiệu quả cho từng tình huống khác nhau Việc áp dụng thuật toán nào đề xử lý tín hiệu PPG phụ thuộc vào từng tình huống áp dụng của tín hiệu Các thuật toán sử dụng chỉ số đánh giá đặc biệt phù hợp cho các trường hợp bệnh nhân không cử động quá nhiều hoặc cử động trong phạm vi cho phép có tính tuần hoàn (chạy bộ, tập thể dục) Tuy nhiên, khi áp dụng cho phát hiện rối loạn nhịp tim phương pháp sử dụng chỉ số thống kê gặp phải các vấn đề sau:

 Tín hiệu rối loạn nhịp tim dễ bị nhầm lần với tín hiệu nhiễu

 Khó khăn trong việc lựa chọn chỉ số đánh giá phù hợp Mặc dù có nhiều nghiên cứu quan tâm đến vấn đề này nhưng với số lượng lớn chỉ số thì khó mà đưa ra một kết luận và so sánh tổng quát Không chỉ vậy, với nhược điểm hạn chế về số lượng dữ liệu, nên không loại trừ trường hợp một hay một số chỉ số chỉ thích hợp với từng nhóm người nhất định

 Tín hiệu PPG thu thập với các thiết bị khác nhau và với các điều kiện sinh lý cơ thể khác nhau sẽ không đồng nhất về độ lớn của biên độ Ví dụ, trên thị trường

các tín thiết bị thường sử dụng bộ ADC (analog to digital converter) 8bit hoặc

10bit, việc này dẫn đến biên độ của tín hiệu ở dạng số sẽ khác nhau

Những khó khăn trên của phương pháp sử dụng chỉ số đánh giá chất lượng có thể giải quyết bằng cách kết hợp giữa đánh giá mẫu và mô hình học sâu Việc sử dụng đánh giá mẫu sẽ giải quyết sự khác nhau giữa các tín hiệu PPG từ các thiết bị khác nhau Còn mô hình học sâu với khả năng mô tả tốt dữ liệu có cấu trúc phức tạp sẽ có thể giải

Ngày đăng: 30/07/2024, 17:05

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN