Khóa luận tốt nghiệp Hệ thống thông tin: Xây dựng mô hình phân loại sớm bất thường tim mạch dựa trên tín hiệu điện tâm đồ

Tuy nhiên, với sự phát triển của công nghệthông tin, cũng như những van đề còn tồn đọng trong các nghiên cứu về khai thác và xử lý đữ liệu mà sinh viên khảo sát được, tiến hành áp dụng c

Trang 1

ĐẠI HOC QUOC GIA TP HO CHÍ MINH

TRUONG DAI HOC CONG NGHE THONG TIN

KHOA HE THONG THONG TIN

DO THÁO QUYEN - 20520295 NGUYEN QUOC TRUNG - 20522073

KHOA LUAN TOT NGHIEP

XAY DUNG MO HINH PHAN LOAI SOM BAT THUONG

TIM MACH DUA TREN TIN HIEU DIEN TAM DO

BUILDING AN EARLY ABNORMAL CARDIAC

CLASSIFICATION MODEL BASED ON ELECTROCARDIOGRAM SIGNALS

KY SU/ CU NHAN NGANH HE THONG THONG TIN

GIANG VIEN HUONG DAN

PGS NGUYEN DINH THUAN

TP HO CHÍ MINH, 2024

Trang 2

LỜI CẢM ƠN

Lời đầu tiên, chúng em xin gửi lời cảm ơn chân thành đến Thầy PGS NguyễnĐình Thuân đã hướng dẫn và hỗ trợ chúng em trong suốt quá trình thực hiện khóaluận tốt nghiệp Những góp ý quý báu của Thầy không chỉ giúp chúng em hoàn thànhkhóa luận tốt nghiệp mà còn trang bị cho chúng em những kiến thức cần thiết dé tiền

xa hơn trên con đường học thuật Sự nhiệt huyết và tận tâm của Thầy là nguồn động

lực lớn giúp em vượt qua khó khăn và thử thách trong suốt quá trình thực hiện khóa

luận.

Tiếp theo, chúng em xin gửi lời cảm ơn chân thành đến KS Nguyễn Minh

Nhựt, KS Trịnh Thị Thanh Trúc và nhóm nghiên cứu FITSU Cam ơn các anh chị đã

tạo điều kiện cho chúng em được tham gia học tập và đồng hành cùng các anh chịtrong suốt quá trình thực hiện khóa luận Sự hỗ trợ và chia sẻ kinh nghiệm quý báu

từ các anh chị đã giúp chúng em củng có thêm kiến thức và những góc nhìn mới trên

con đường học thuật.

Chúng em xin gửi lời cảm ơn chân thành đến các Thầy Cô trong khoa Hệ thống

Thông tin — Trường Đại học Công nghệ Thông Tin Những hướng dẫn và hỗ trợ mà

các Thầy Cô đã dành cho chúng em trong việc giảng dạy và truyền đạt kiến thức đãgiúp chúng em xây dựng được nên tảng dé hoàn thành khóa luận này Từ đó giúp

chúng em thêm tự trong quá trình thực hiện khóa luận.

Lời cuối cùng, chúng em xin bày tỏ lòng biết ơn sâu sắc đến Thầy Cô phảnbiện về khoá luận tốt nghiệp Những góp ý này là những tín hiệu quý giá giúp chúng

em nhận ra những điểm còn thiếu sót và cần được cải thiện trong đề tài Điều này sẽgiúp em hoàn thiện và phát triển hơn trong hướng nghiên cứu tương lai

TP Hồ Chí Minh, ngày tháng năm 2024

Sinh viên thực hiện

Đỗ Thảo Quyên

Nguyễn Quốc Trung

Trang 3

MỤC LỤC

CHƯƠNG 1 TONG QUAN ĐÈ TAL 2-5-5652 SE‡EE‡ESEEEEE+EEEEEEEEEerkerxrkerxrri 5

IS? lure nghién na 5

1⁄2 Phát biểu bài tốn -++++EEktEEH HH ưệu6

1.3 Thách thức - SG HH HH HH HH Hà Hà Hư 7

1.4 Mục tiêu đề tài ccct nhe 81.5 D6i tượng và phạm vi nghiên cứu ¿2 ©+©++x++£x++zx++rxezrxesred 8

1.6 Dong gĩp cho nghién ctu 0.0 eee cecceseeseceseeseeeseeeeeeseceeeeeceeeeaeeeseeseeeaeeeeeeas 9

CHƯƠNG 2 CƠ SỞ LÝ THUYET wiecessescsssssscssssesessseescsssecessnsccessneeeesnneesennneeesses 10

2.1 Cac nghiên cứu liÊn QU41 - 5 c5 +38 321139113 EESEEskreeerreree 10

2.2 Tín hiệu điện tâm đồ - ECG c¿ccc+tsccteerrrrtrrrrrrrrrrrrrrrree 12

2.2.1 Cấu trúc của một nhịp tim tiêu chuân 2- 2 ss2+c22szz£z+sz 12

2.2.2 Phan loại các nhịp tIM 6 c3 11833 E911 1E Eskeskese 13

CHƯƠNG 3 PHƯƠNG PHÁP THỰC NGHIỆM 2- ¿+22 17

3.1 _ Các thuật tốn học máy thong kê - 2 s22 ++£++E++E++E++Ezrzrezree 17

3.1.1 Nạve Bay©s LH HH HH HH TH HH HH 17

3.1.2 Stochastic gradient descent — SGD - + +c se eree 18 3.1.3 PasSIV€CÀBĐT€SSIVC Ă HH HH HH TT HH HH gu 20 3.1.4 XGBOOSK Ăn HH HH HH TH HH nr 22 3.2 Cac thuat todn HOC 0:ađdđdđđaÝŸÝŸÝỐỐ 23

B.Q1 LST m— OẢ.L-)^:”:.LỐL.ẦẦ 23

S9 24

3.3 Transfer LearnIng - - ccc c1 119111911 91111 vn ng key 26

Trang 4

CHUONG 4._ THỰC NGHIỆM, ĐÁNH GIA VÀ HƯỚNG CẢI TIÉN 27

4.1 Bộ dữ liệu -+cc22kcEk 2E E21 221121127121101121 211 re 27

4.1.1 _ Bộ dữ liệu MIT BIH Arrhythmia 2- 2 52 5+2cx+2zx2zxcczee2 27

4.1.2 Bộ dữ liệu MIT BIH Normsal Sinus Rhythm 5-5 28

4.2 Xử lý dữ liệu ck2H TT H222 11 erree 28

4.3 Chia dữ liệu © 27k+2k2EEEk 2E 2112212112111 1tr 30

4.3.1 _ Thống kê dữ liệu - 2: ©5¿+2<+EE£+E2EEEEEEEEEEEEEEEEEEEEEEErrkrrkrree 30

4.3.2 Chia mẫu học giám sát ¿- 2 + +E+EE+E£EE£EE+EEEEEErEerkrrrrkrree 31

44 D6 do icon ằ 32

4.4.1 ACCUTACVY Ă.QQ Q.11 HH HH HH nưy 32

4.4.2 S€DSIẨIV ĂẶQ HH HH1 HH ng ng 33 4.4.3 Precision 4 > <£ Ẻ iiiiii.ve 33 4.4.4 Mean Squared ETTOT - -. 5c 112319911 9k ve re 33

4.5 Đánh giá kết quả -. :- 2 ++S< SE E2 SE 1E11211211211211 1111111, 34

4.5.1 _ Phân tích kết quả -2¿©-++2+++2+++E+++EE+tEke+rkesrkrrrkrrrree 344.5.2 Cải tiến kết quả ¿5c t2 E1121221221211271111111 2121 re.434.5.3 Đề xuất kiến trúC - + ©+++EE+EkE2EEEEEE1211271 2112112121 re.444.5.4, Đánh giá kết qua cccccccccccsssesssesssesssecssessecssecssecssecssesssecsuecssesssssecssecsses 51

CHƯƠNG 5 KÉT LUẬN VÀ HƯỚNG PHÁT TRIEN -:-¿ 52

5.1 Kếtluận -c-©c.22ESEE 2 2212212211211 1121121111211 11c eeye 525.2 Kết quả đạt được -: 22c ke xEEEEE1111121121121111 1.1.1 xe 535.3 Hướng phát triỀn - + ©£+k+EEtEEEEEEEEEEEEEEEEEEEEEEEEEkrrkrrrkrrkee 54

CHƯƠNG 6 PHỤ LỤC 2¿22-©+22£+EE+EE2EEEEEEEEEEEEEEECEEEErkrrkrrrrervee 55

6.1 _ Hình ảnh kết quả theo Hướng tiẾp cận 2 - 2-2 22s s+sz+£zxz+se2 55

Trang 5

6.2 Hình ảnh kết quả theo Hướng cải tiến 2 2-2 2+5++sz+£z£zzz+se2 64

6.3 Bảng kết quả thực nghiệm -¿- 2¿©+¿22++2E++EE+tEEESEEE+rkeerxrrrxrrrree 73

6.3.1 Bang kết quả của Hướng tiếp cận l ¿2 s+ce+cczeccxzes 736.3.2 Bảng kết quả của Hướng cải thiện l 2-52 s+czz£zEzxres 786.3.3 Bảng kết quả của Hướng tiếp cận 2 -:- 2 ++cx++cxerxesree 806.3.4 Bảng kết quả của Hướng cải thiện 2 - 2-2-2252 ++£zEzrrrres 89

Trang 6

DANH MỤC HÌNH ÁNH

Hình 1.1: Mô hình tiếp cận theo hai hướng . -¿- 2 2 2 + £+££+E£+EzxzEzxzxez 7

Hình 2.1: Hình ảnh minh họa của một cấu trúc nhịp tim tiêu chuẩn . 13

Hình 2.2: Tóm tắt các ánh xạ giữa các chú thích nhịp tim và các loại nhịp tim theo tiêu chuẩn AAMI ECS7 [12] - -2¿22+++t22S++ttEEEtrttEkttrtrtrtrrrttrrrrrrrtrrrrrrker 13 Hình 2.3: Hình ảnh các loại nhip tim theo tiêu chuẩn AAMI [22] . - 16

Hình 3.2.1: Minh hoạ kiến trúc LSTM [24] -:-2- 22 ©522+22s++z++zxezx+zzxzrsez 23 Hình 3.1: Hình minh hoa kiến trúc CNN [25] cccccccccccsssscscsesesececeesesceesececsesesveveeeeceees 25 Hình 4.1: Một số hình ảnh của tín hiệu điện tâm đồ được ghi lại - 27

Hình 4.2: Luồng xử lý dữ liệu - 2 2 +©+£+EE+EE+2EE£EEtEEEEEEEEEEEErkerkrrrkerkeee 28 Hình 4.3: Thống kê phân phối nhãn trên tập train và tập test của bộ dữ liệu MIT-BIH Hee SEE ⁄7⁄277 WN: QƯN, 31

Hình 4.4: Minh hoạ các mẫu dữ liệu được chia theo bước thời gian được xác định ¬ đ£“ € “6 Số ẽố hố 32

Hình 4.5: Dự báo hồi quy nhịp tim trong tương lai ở hai mô hình LSTM-CNN 35

I9 011 Ắ 42

(0019.721 đ 42

(C) IO-St€DS 2-Š5 QQQQ.nHHSH HH TH TH HH Họ HH HH ke 42 0019 0000 00 42

Hình 4.15: Biéu đồ đánh giá của thuật toán DuoHF-CNN qua mỗi epoch trong IO-Ôi 4 49

Hình 4.16: Biéu đồ đánh giá của thuật toán DuoHF-CNN qua mỗi epoch trong IO-Di 49

Hình 4.17: Biéu đồ đánh giá của thuật toán DuoHF-CNN qua mỗi epoch trong IO-Ôi 5 3 50

Hình 6.1: Biéu đồ đánh giá các độ đo của các thuật toán trong IO-steps 1-1 55

Hình 6.2: Biéu đồ đánh giá độ đo của các thuật toán trong IO-steps 2-I 56

Hình 6.3: Biểu đồ so sánh độ đo F1 của các thuật toán trong IO-steps 5-1 56

Hình 6.4: Biểu đồ đánh giá độ đo của các thuật toán trong IO-steps 10-1 57

Trang 7

Hình 6.5: Biéu đồ đánh giá các độ do của các thuật toán trong IO-steps 1-2 57

Hình 6.6: Biéu đồ đánh giá độ do của các thuật toán trong IO-steps 2-2 58

Hình 6.7: Biéu đồ đánh giá độ đo của các thuật toán trong IO-steps 5-2 58

Hình 6.11: Biêu đồ đánh giá các độ đo của các thuật toán trong IO-steps 5-5 61

Hình 6.12: Biéu đồ so sánh độ đo F1 của các thuật toán trong IO-steps 10-5 61

Hình 6.14: Biéu đồ so sánh độ đo F1 của các thuật toán trong IO-steps 2-10 63

Hình 6.16: Biểu đồ so sánh độ đo F1 của các thuật toán trong IO-steps 10-10 64

Hình 6.17: Biéu đồ đánh giá các độ đo của thuật toán DuoHF-CNN qua mỗi epoch trong IO-Sf€pS Í-Í -SĂ LH TH TH HH HH 65 Hình 6.18: Biểu đồ đánh giá các độ đo của thuật toán DuoHF-CNN qua mỗi epoch trong IO-Sf€DS 2-1 .- L2 1H TH TH HT HH kt 65 Hình 6.19: Biéu đồ đánh giá các độ đo của thuật toán DuoHF-CNN qua mỗi epoch trong TO-steps T1 66

Hình 6.20: Biểu đồ đánh giá các độ do của thuật toán DuoHF-CNN qua mỗi epoch trong IO-sfeps IŨ- Ï - HH HH HH HH kh 67 Hình 6.21: Biéu đồ danh giá các độ đo của thuật toán DuoHF-CNN qua mỗi epoch trong [O-S(€DS 2- Ï - Go H H HH 67 Hình 6.22: Biểu đồ đánh giá các độ do của thuật toán DuoHF-CNN qua mỗi epoch 0/x)i13016951i1 022/205 Ỏ 68 Hình 6.23: Biểu đồ đánh giá các độ đo của thuật toán DuoHF-CNN qua mỗi epoch trong IO-steps 11/2 68

Hình 6.24: Biéu đồ độ đánh giá các độ đo của thuật toán DuoHF-CNN qua mỗi epoch

trong IO-sfeps IŨ-2 kg TH nh tt 69

Trang 8

Hình 6.25: Biểu đồ đánh giá các độ đo của thuật toán DuoHF-CNN qua mỗi epoch

Hình 6.29: Biểu đồ đánh giá các độ đo của thuật toán DuoHF-CNN qua mỗi epoch

trong IO-sfeps 2-10 0 eeeeesceesseessecescecsseceseeeseesseeesaeceseecseeceaeesceceaeeeeeseaeeeneeeeaeeeaes 72

Hình 6.30: Biểu đồ đánh giá các độ do của thuật toán DuoHF-CNN qua mỗi epoch

trong [O-s(eps TŨ- [Ũ - 2c c1 L1 E01 1T nh TH HH HH HH 73

Trang 9

DANH MỤC BANG

Bang 2.1: Bảng phân biệt sự khác nhau về hình dạng sóng của nhịp tim 15Bang 6.1: Bảng kết quả Hướng tiếp cận l ¿- 2-2 25+ ++£++EzEzzzrzreee 77Bảng 6.2: Bảng kết quả Hướng tiếp cận 2 ¿-©2¿©5222++2cx2Exttrxerrxersreee 80Bảng 6.3: Bảng kết quả của Hướng tiếp cận I -2- 52 5z2cx+2zxvszxccrsez 89Bang 6.4: Bảng kết quả Hướng cải tiễn 2 - 2-52 25£+E£+EE+E2EE+EzErEerrerreee 99

Trang 10

DANH MỤC TỪ VIET TAT

1 ECG Electrocardiogram — Điện tâm đồ

2 Association for the Advancement of Medical

AAMI cư &Instrumentation — Hiệp hội Tiên bộ Công cụ Y tê

3 MIT-BIH Arrhythmia Database — cơ sở dữ liệu lưu trữ các

MIT-BIH :

ban ghi điện tam đô

WHO World Health Organization — Tô chức y tê thê giới

2 CNN Convolutional neural network — Mang no ron tich chap

6 RNN Recurrent Neural Network — Mang no ron tai phat

[Ae mỹ ` LÍ

|

7 SVM Thuật toán Support Vector Machine

8 Duo Heart Feature Convolutional Neural Network — Mang

DuoHF-CNN no ron tích chập được su dung trong bai toán dự đoán nhịp

tim

Ọ LSTM Long short-term memory — Mạng bộ nhớ dai ngăn hạn

10 SGD Thuật toán Stochastic gradient descent

11 XGBoost Thuật toán Extreme Gradient Boosting

12 Acc Accuracy — Độ chính xác của mô hình

13 Cls Classification — Phan lớp

l4 Reg Regression — Hồi quy

15 Conv Convolution Layer — Lớp tích chập

l6 Pool Pooling Layer — Lớp gộp

17 EC Fully Connected Layer — Lớp kết nối day đủ

Trang 11

[18 MSE Mean Squared Error — Sai số trung bình phương sai

E MLP Multi-Layer Perceptron — mang no-ron da tang

Trang 12

TÓM TẮT KHÓA LUẬN

Trong lĩnh vực y tế hiện nay, việc phát hiện va chân đoán bệnh tim mạch nhanhchóng và kịp thời là một vấn đề vô cùng cấp thiết Trong các cơ sở y tế, việc sử dụngđiện tâm đồ (ECG) dé chan đoán là một phương pháp phổ biến và hiệu quả Tuynhiên, việc phân tích đữ liệu ECG theo phương pháp truyền thống đang đối mặt vớinhiều thách thức do sự đa dang và phức tạp của dir liệu Hơn nữa, trong việc chânđoán và điều trị các vấn đề về tim mạch, việc theo dõi liên tục và đáp ứng kịp thờitrong suốt quá trình hoạt động hàng ngày của bệnh nhân gặp phải nhiều trở ngại và

khó khăn Với tình hình gia tăng các trường hợp bệnh tim mạch, việc khám chữa trị

truyền thống đã gặp phải nhiều hạn chế Tuy nhiên, với sự phát triển của công nghệthông tin, cũng như những van đề còn tồn đọng trong các nghiên cứu về khai thác và

xử lý đữ liệu mà sinh viên khảo sát được, tiến hành áp dụng cả hai hướng tiếp cậnhọc máy là Phân lớp và Hồi quy trên miền dữ liệu chuỗi thời gian cho nhiệm vụ pháthiện sớm nhịp tim bat thường Thực nghiệm được triển khai trên các mô hình máyhọc thống kê và mô hình học sâu với mục tiêu so sánh hiệu quả của hai cách tiếp cậnqua các mô hình thực nghiệm Kết quả sau cùng, hướng tiếp cận Phân lớp dựa trênhồi quy nhịp tim thông qua các mô hình học sâu (LSTM, CNN) có khả năng tập trungvào phân loại các nhịp tim bat thường trên miền dữ liệu mất sự cân bằng Tuy nhiên,

để cải thiện độ chính xác trong việc dự đoán bất thường nhịp tim, chúng tôi sử dụng

phương pháp transfer learning đối với các mô hình hồi quy sử dụng bộ dữ liệu BIH Normal Sinus Rhythm Mặc dù đối mặt nhiều han chế về số lượng dữ liệu song,các mô hình học sâu theo hướng Phân lớp trực tiếp phần nào nhận diện được các lớpbất thường của nhịp tim Trong hướng tiếp cận này, chúng tôi đề xuất một kiến trúc

MIT-mạng CNN cải tiến giúp cải thiện hiệu quả của mô hình dự đoán chính xác về các lớp

nhịp tim Sau cùng, hướng tiếp cận này đã giúp mô hình học sâu có thể nhận diệnđược các lớp bất thường Hướng cải thiện và phát triển trong tương lai cũng đã được

đê cập trong các phân sau của khoá luận.

Báo cáo gôm 6 chương với các nội dung như sau:

Trang 13

Chương 1: Tong quan đề tài Giới thiệu về nội dung đề tài bao gồm động lực

nghiên cứu, phat biểu bài toán, thách thức, mục tiêu, phạm vi đối tượng nghiên

cứu, và những đóng góp chính trong nghiên cứu.

Chương 2: Cơ sở lý thuyết Trình bày tổng quan về các lý thuyết cơ sở trong

dự báo sớm nhịp tim Trình bày các khảo sát về hướng tiếp cận dự báo từ các

công trình đi trước.

Chương 3: Phương pháp thực nghiệm Trình bày về các khái niệm về dự báohồi quy và dự báo phân lớp Trình bày các thuật toán máy học thống kê truyềnthống và các thuật toán học sâu

Chương 4: Thực nghiệm, đánh giá và hướng cải tiến Trình bày quy trình xử

lý dữ liệu và thực nghiệm, các thông số chỉ tiết cho quá trình thực nghiệm vàcác phương pháp về cải tiến mô hình Báo cáo kết quả thực nghiệm và phân tíchkết quả

Chương 5: Kết luận và hướng phát triển Tổng kết các kết quả chính đã đạt

được trong đề tài và hướng phát triển của đề tài trong tương lai

Chương 6: Phụ lục Bồ sung chi tiết các kết quả trong quá trình thực nghiệm

Trang 14

CHUONG 1 TONG QUAN DE TÀI

1.1 Động lực nghiên cứu

Bệnh tim mạch là một trong những nguyên nhân chính gây tử vong trên toàn

cầu, chiếm khoảng 32% theo số liệu của Té chức Y tế Thế giới năm 2021 [1] Ở Việt

Nam, vấn đề liên quan đến bệnh tim mạch đang gây ra một mối lo ngại đáng kê với

tỷ lệ tử vong do bệnh tim mạch chiếm khoảng 33% trong tổng số ca tử vong hàngnăm [2] Hơn nữa, theo nghiên cứu của BMC Medicine từ năm 1990 đến năm 2019trên 204 quốc gia cho thấy tỷ lệ tử vong do bệnh tim dang dan trẻ hóa trong độ tudi

từ 15 đến 39 [3] Để phát hiện sớm các vấn đề này, các cơ sở chăm sóc sức khỏe banđầu có thể đo lường và đánh giá nguy cơ đau tim, đột quy, suy tim và các biến chứngkhác Tuy nhiên, theo WHO các bệnh tim mạch thường không xuất hiện các triệuchứng rõ ràng [I] Trên thực tế, một cơn đau tim hoặc đột quy có thé là dau hiệu đầutiên cho sự tôn tại của một bệnh lý nền Dé đảm bảo khả năng chân đoán chính xácbệnh tim, các chuyên gia y tế cần được hỗ trợ bằng các công cụ và thiết bị y tế phùhợp Tuy nhiên, phương pháp tiếp cận truyền thống này có thể đòi hỏi nhiều thời gian

và kinh phí đáng kể từ người bệnh

Với sự phát triển nhanh chóng của công nghệ thông tin hiện nay, nhu cầu chomột ứng dụng di động và thiết bị y tế thông minh hỗ trợ người bệnh theo dõi các bấtthường tim mạch là rất lớn Một trong các kỹ thuật chính và phé biến nhất dé theodõi sức khỏe của người bệnh là dựa trên điện tâm đồ (Electrocardiogram - ECG) Tuynhiên, việc phân tích thủ công nhịp tim đối mặt với những thách thức lớn do sự đadạng và phức tạp của dữ liệu ECG Hình dạng biến thé của sóng ECG thường có sựbiến đôi đáng kê giữa các bệnh nhân, gây khó khăn trong việc nhận diện và phân loại.Hơn nữa, dữ liệu ECG thường bị ảnh hưởng bởi nhiễu từ nhiều nguồn khác nhau, nhưdao động điện từ môi trường, chuyên động cơ thé và tín hiệu điện khác, gây mat mátthông tin quan trọng liên quan đến nhịp tim Từ đó cho thấy việc xử lý lượng lớn cácbản ghi ECG đòi hỏi rất nhiều thời gian và công sức Mặt khác, với tính bất ngờ và

khó lường von di trong các vân đê về tim mạch, việc theo dõi liên tục và đáp ứng một

Trang 15

cách tức thời xuyên suốt quá trình sinh hoạt của bệnh nhân dé kịp thời chan đoán vàđiều trị là rất cần thiết Tuy nhiên, với áp lực từ sự gia tăng của các ca tim mạch vàcũng như tâm lý nặng nề của một số người khi phải đi thăm khám tại các cơ sở y tế,khiến các mô hình thăm khám truyền thống còn bộc lộ nhiều hạn chế Điều này thúcđây một nhu cầu rất lớn trong việc tích hợp các phương pháp tự động và công nghệ,

hỗ trợ việc theo dõi và chân đoán tại nhà, giúp cải thiện hiệu suất, giảm áp lực đặt ra

cho các chuyên gia y tế

Hiện nay, nghiên cứu trong lĩnh vực phân tích nhịp tim đã đạt được những thành

tựu đáng kể, tích hợp nhiều phương pháp như phân tích thống kê hay trí tuệ nhân tạovới khả năng đánh giá cũng như dự báo sớm được các triệu chứng về tim mạch Một

số nghiên cứu tập trung vào việc dự báo hồi quy nhịp tim cho tương lai [4] [5] Tuynhiên, kết qua dự báo này thường chỉ có thé được tiếp cận và sử dụng bởi các chuyêngia có kiến thức chuyên môn Trong khi đó, đối với người dùng phô thông, họ chỉ cóthé tiép cận với các kết quả tường minh, dễ hiểu, cụ thé như chính xác một loại bấtthường nhịp tim nào đó trong tương lai mà họ có thể gặp phải Đây cũng chính là bài

toán mà phân loại nhịp tim có thể giải quyết Ngoài ra, một khoảng trống khác mà

các nghiên cứu này vẫn chưa giải quyết đó là khía cạnh về hiệu suất phát hiện sớmcho các bat thường về tim mạch của các mô hình phân loại vẫn chưa được phân tíchcặn kẽ Trong khi đó, thời gian là một yếu tố vô cùng quan trọng đối với một hệ thống

cảnh báo sớm và đồng thời đóng vai trò quyết định trong quá trình thực hiện các biện

pháp cấp cứu tim mạch tại nhà cho bệnh nhân

1.2 Phát biểu bài toán

Đầu vào: Dữ liệu các đặc trưng về nhip tim được đưa vào theo từng đoạn RR-interval

Xử lý: Nhiệm vụ thực hiện được chia làm hai hướng tiếp cận:

+ Hướng tiếp cận 1: Đầu vào là đặc trưng của dữ liệu ECG trong quá khứ Qua

các mô hình dự báo hồi quy thu được chuỗi ECG trong tương lai Sử dụng giá

trị ECG trong tương lai vừa được dự báo như là đầu vào của mô hình phân lớp

Trang 16

Đầu ra sau cùng là lớp bất thường có thể được dự báo cho đoạn ECG trong

tương lai.

+ Hướng tiếp cận 2: Đầu vào là đặc trưng của dữ liệu ECG trong quá khứ Qua

các mô hình dự báo phân lớp Đầu ra mục tiêu sẽ là lớp bat thường có thé được

dự đoán cho một số thời điểm trong tương lai

Đầu ra: Loại nhịp tim tương lai

DP , / Hướng tiếp cận 1 Hướng tiếp cận 2

{_ Mô hình dự báo hồi quy | [ Mô hình dự báo phân lớp _ ] Mô hình dự báo phân lớp

Mô hình máy Mô hình Mô hình máy Mô hình | Mô hình má ô hì y Mô hình

học thống kê || học sâu học thống kê || học sâu học thống kê || học sâu

Ì Ỷ

ECG Loại nhịp tim Loại nhịp tim

(Tương lai) (Tương lai) (Tương lai)

Hình 1.1: Mô hình tiếp cận theo hai hướng

1.3 Thách thức

— Về dữ liệu:

+ Hình dạng biến thé của sóng ECG thường có sự biến đổi đáng kể giữa các

bệnh nhân là một thử thách rất lớn dé có thể xây dựng tính tổng quát của mô

hình dự đoán đối với dữ liệu bệnh nhân chưa biết

+ Dữ liệu ECG thường bị anh hưởng bởi nhiễu từ nhiều nguồn khác nhau, như

dao động điện từ môi trường, chuyền động cơ thê và tín hiệu điện khác, gâymắt mát thông tin quan trọng liên quan đến nhịp tim

— Về phương pháp:

+ Mô hình dự báo sớm là đối mặt với hiệu suất giảm khi phải xử lý những yếu

tố bất ngờ và không lường trước được trong tương lai khi mô hình chỉ có thể

dựa vào những dữ liệu được biết trong quá khứ

Trang 17

+ Mất cân bang trong bài toán dự báo bất thường luôn là một thách thức quan

trọng, đặc biệt khi xét đến ngữ cảnh của đặc trưng chuỗi thời gian Trong ngữcảnh này, việc sử dung các kỹ thuật tăng cường dit liệu thông thường có thégây mat mát về mối tương quan thời gian của các đặc trưng chuỗi thời gian,làm giảm tính hiệu quả của mô hình trong việc dự báo và phân loại bất

— Xây dựng ứng dung di động phân loại nhịp tim từ mô hình dự báo sớm.

1.5 Đối tượng và phạm vi nghiên cứu

Đối tượng: Dữ liệu nhịp tim chứa các loại nhịp tim bất thường và bình thường

Dữ liệu:

— Bộ dữ liệu MIT-BIH Arrhythmia [6]: Bao gồm 48 tap dit liệu ECG, ghi lai sự

di chuyển của dòng điện trong tim Những tập dữ liệu này được thu thập từ 47

bệnh nhân được nghiên cứu bởi Phòng thí nghiệm BIH Arrhythmia từ năm 1975

— 1979 Trong đó, có 23 tập được chọn ngẫu nhiên từ tập bản ghi ECG được thu

thập trong 24 giờ từ một nhóm bệnh nhân nội trú; các tập dữ liệu còn lại được

chọn từ các tập bao gồm các rối loạn nhịp tim ít phổ biến

— Bộ dữ liệu MIT-BIH Normal Sinus Rhythm [7]: Bao gồm 18 tập dữ liệu ECG

của các đối tượng không có bat kỳ rỗi loạn nhịp nào đáng ké và bệnh lý về tim

trước đó.

Pham vi nghiên cứu:

— Khảo sát và đánh giá các công trình đã công bồ về bài toán hồi quy dit liệu điện

tâm d6 và bài toán phân lớp bat thường nhịp tim

Trang 18

Nghiên cứu các phương pháp xử lý dữ liệu nhip tim.

Nghiên cứu các mô hình máy học thống kê và mô hình học sâu tiên tiến

Thực nghiệm các mô hình hình theo từng hướng tiếp cận và thực nghiệm cáchướng cải tiến được đề xuất

Xây dựng ứng dụng phân loại sớm nhip tim.

1.6 Đóng góp cho nghiên cứu

Giới thiệu các phương pháp tiếp cận dự báo sớm trong nhịp tim tập trung vàocác yếu tố gồm: các đặc trưng đầu vào, hướng tiếp cận huấn luyện mô hình, các

mô hình phân lớp, mốc thời gian dự báo trong tương lai

Phân tích hiệu quả xây dựng mô hình dự báo sớm bat thường trong nhịp timtheo hai hướng: phân lớp và hồi quy

Phân tích và đánh giá hiệu suất dự báo sớm của mô hình thông qua các mốc thờigian tương lai được thực nghiệm một cách chi tiết (Vd: 1—2—5— 10 phút)

Thực nghiệm và đánh giá hiệu suất trên cả mô hình máy học thống kê và mô

hình học sâu.

Với từng hướng tiếp cận đưa ra đề xuất, thực nghiệm và đánh giá kết quả cáchướng cải tiễn tương ứng

Trang 19

CHUONG 2 CƠ SỞ LÝ THUYET

2.1 Các nghiên cứu liên quan

Về loại đặc trưng đầu vào: Trong lĩnh vực phân loại nhịp tim bất thường, mô

hình dự báo có thé được tiếp cận theo hai phương pháp [8] Phương pháp đầu tiên là

dựa trên chuỗi thời gian của các tín hiệu ECG được ghi nhận (time serles — based

approaches), trực tiếp sử dụng dữ liệu chuỗi thời gian gốc dé xử lý và phân tích Năm

2012, Ye cùng cộng sự [9] đã tiễn hành nghiên cứu để phân loại dữ liệu từ bộ đữ liệuMIT-BIH thành 15 lớp khác nhau băng cách sử dụng mô hình SVM Trong quá trìnhlay đặc trưng đầu vào, các nhóm nghiên cứu đã lay một chuỗi thời gian dài 300 mau(0,83 giây) từ mỗi nhịp tim, bao gồm 100 điểm trước điểm R (0.27 giây) (điểm đánhdấu sự co bóp của tim) và 200 điểm (0.56 giây) sau điểm R Kết quả thực nghiệm chothấy rằng phương pháp này đạt được độ chính xác trung bình là 99,25% Điều nàycho thấy phương pháp được sử dụng là rất hiệu quả trong việc phân loại dữ liệu nhịp

tim từ bộ dữ liệu MIT-BIH Năm 2014, trong nghiên cứu của Tran, Pham va Vuong

[10], họ sử dụng ba phương pháp tiếp cận mang neural dé phan loại dtr liệu gồm

multi-layer perceptron (MLP), support vector machine (SVM) và mạng TSK

(Takagi-Sugeno-Kang) Dé lay được đặc trưng đầu vào, họ sử dụng hệ số của hàm cơ sởHermite bậc 15 (HBF) và khoảng thời gian RR từ mỗi nhịp tim Đầu tiên, chuỗi thờigian 250 mili giây với 91 mẫu được chia thành các đoạn, trong đó mỗi đoạn lay 45mẫu xung quanh điểm R của nhịp tim Từ các đoạn nay, họ trích xuất các hệ số HBF

Kết quả được báo cáo cho thấy tỷ lệ nhận diện đúng (Se%) đạt 99.02% và tỷ lệ nhận

diện sai (Sp%) đạt 99.25%.

Phương pháp thứ hai là dựa trên đặc trưng (feature-based approaches), sử dụng

dữ liệu chuỗi thời gian gốc dé tính toán các đặc trưng cần thiết từ đó huấn luyện mô

hình dự đoán hoặc phân loại Năm 2009, Ince, Kiranyaz và Gabbouj [11] sử dụng bộ

dữ liệu huấn luyện bao gồm các nhịp tim được trích xuất ngẫu nhiên từ các bản ghi

từ 5 phút đầu tiên Họ trích xuất vector đặc trưng gồm 180 mẫu (500 mili giây ở tốc

độ lay mau 360 mau/giay), được căn chỉnh tại điểm R Độ nhạy được báo cáo là

10

Trang 20

97,1%, 62,1%, 83,4%, 61,3% tương ứng cho các lớp N, S, V và F, và độ chính xác

dương tính được báo cáo là 98,3% và 97,4% tương ứng cho các lớp S và V Năm

2014, Das va Ari [12] sử dụng thuật toán Pan-Tompkins dé xác định các điểm chuẩnquan trọng gồm sóng Q, R và S trên mỗi nhịp tim điện tim Từ đó, họ đã lấy mộtchuỗi thời gian 180 mẫu (tương ứng với 500 mili giây tại tốc độ lấy mẫu 360mẫu/giây), được căn chỉnh tại điểm R, và sử dụng nó dé tính toán các đặc trưng dựatrên biến đổi S (S-tranform) Ngoài ra, tác giả không chi sử dụng biến đổi S để trích

xuất đặc trưng, mà còn trích xuất 4 đặc trưng từ khoảng thời gian giữa các nhịp tim

(khoảng RR) và kết hợp chúng với 180 đặc trưng khác dựa trên biến đổi S tranform), tạo thành một vector đặc trưng tổng hợp 184 chiều dé mô tả tín hiệu ECGmột cách toàn diện Kết quả cho thấy độ nhạy (Se%) lần lượt là 98,1%, 74,0%, 91,4%

(S-và 67,0% cho các lớp N, S, V (S-và E.

Về việc huấn luyện mô hình: Có hai cách thức tiếp nhận dữ liệu thường được

đề cập, bao gồm phân loại nội bệnh nhân (intra-patient) và phân loại giữa các bệnh

nhân (inter-patient) [8] Trong đó, mô hình phân loại nội bệnh nhân chia dữ liệu của

từng bệnh nhân cho cả tập huấn luyện và kiểm thử mô hình [11] [12] [13] [14] Mặt

khác, mô hình phân loại giữa các bệnh nhân [15] [16] [17] sử dụng các tập huấn luyện

và kiểm thử độc lập từ các bản ghi của các bệnh nhân khác nhau nhằm mục đích đánhgiá khả năng tong quát của mô hình dự đoán đối với dữ liệu bệnh nhân chưa biết Môhình sau khi được huấn luyện theo phương pháp phân loại giữa các bệnh nhân có khảnăng áp dụng cho bất kỳ bệnh nhân nào mà nó chưa từng gặp qua, đảm bảo tính ápdụng thực tế Tuy nhiên, hiệu suất của mô hình phân loại giữa các bệnh nhân thường

còn khá thấp, cần cải thiện để đạt được độ chính xác cao hơn và đáng tin cậy hơn

trong việc phân loại dữ liệu từ các bệnh nhân.

Về các mô hình phân loại nhịp tim: Nhiều mô hình máy học đã được thựcnghiệm cho bài toán này như SVM [18] [19] [16], RNN [20], CNN [21] Hau hết, các

mô hình máy học thống kê truyền thống được khảo sát còn nhiều hạn chế, hơn nữa,

hiệu suât của các mô hình học sâu vân còn chưa được khai thác nhiêu.

11

Trang 21

Về các mốc thời gian dự báo tương lai: Các nghiên cứu trước đây chưa cungcấp những bước thời gian cụ thé và rõ ràng cho van dé phát hiện sớm, với phần lớntập trung vào phân loại và phát hiện các lớp bất thường hoặc chỉ xác định các bước

thời gian đâu vào trong khi các bước thời gian dau ra vân chưa rõ ràng.

2.2 Tín hiệu điện tâm đồ - ECG

2.2.1 Cấu trúc của một nhịp tim tiêu chuẩn

Câu trúc của một nhịp tim tiêu chuân gôm có sóng P, sóng T, và sóng phức

QRS Trong đó, mỗi sóng đại diện cho:

+ Sóng P thể hiện sự depolarization (ton thương) của tử cung, tức là quá trình

điện tử khi co tim tử cung bị kích thích dé co bóp và day máu vào that trái vàthất phải

+ Sóng T thé hiện sự repolarization (phục hồi) của tử cung, tức là quá trình điện

tử khi cơ tim tử cung phục hồi sau quá trình co bóp

+ Phức QRS biéu thị sự depolarization (tồn thương) của túi AV và các thất Nó

đại điện cho quá trình điện tử khi cơ tim túi AV và các thiết bị kích thích dé

co bóp và đây máu ra khỏi tim

Khoảng RR là khoảng thời gian giữa hai đỉnh R liên tiếp trên đồ thị ECG, đolường thời gian từ một điểm đỉnh R đến điểm đỉnh R kế tiếp Khoảng RR là một thôngtin quan trọng trong chân đoán bệnh tim, đặc biệt trong việc phát hiện nhịp tim khôngđều Bằng cách sử dụng khoảng thời gian trước RR và sau RR làm đặc trưng thờigian, bác sĩ có thé xác định khoảng cách giữa các nhịp tim liền kề và thu thập thôngtin về tình trạng tim mạch Thông qua phân tích các đặc trưng này, các chuyên gia y

tế có thé đưa ra đánh giá và chân đoán chính xác về sức khỏe tim mach của bệnh

nhân.

12

Trang 22

heartbeat A heartbeat B

Hình 2.1: Hình ảnh minh họa của một cấu trúc nhip tim tiêu chuẩn.

2.2.2 Phân loại các nhịp tim

Dựa theo tiêu chuẩn theo tiêu chuân EC57 của Hiệp hội Tiến bộ Công cụ Y

khoa (AAMD), bộ dữ liệu MIT-BIH Arrhythmia được chia thành 5 loại và được chú thích bảng sau:

AAMI class MIT-BIH heart beat types Normal beat (N) Normal beat (N) Left bundle Right bundle Atrial escape beat (e) Nodal

branch block branch block beat (junctional) beat (L) (R) escape beat (j)

Supraventricular Atrial premature Aberrated atrial Nodal (junctional) Supraventricular ectopic beat (S) beat (A) premature beat premature beat (J) _ premature beat (S)

Unknown beat (Q) Paced beat (/) Fusion of paced Unclassified beat

and normal beat (Q)

(f)

Hình 2.2: Tóm tắt các ánh xạ giữa các chú thích nhip tim và các loại nhịp tim theo

tiêu chuẩn AAMI EC57 [12]

Trong đó, các đặc trưng cua nhip tim dé phân loại dựa trên tiêu chí:

13

Trang 23

+ Nhịp tim được xếp vào lớp N (Normal beat) khi nhịp tim hoạt động trong

trạng thái bình thường mà không có bat kỳ biến thé hay sự khác biệt đáng kê.

+ Nhịp tim được xếp vào lớp S (Supraventricular premature beat) có dau hiệu

khi tâm thất hoạt động sớm hơn so với một nhịp đập của tim bình thường,

gây ra sự gián đoạn cho nhịp tim.

+ Nhịp tim được xếp vào lớp V (Premature ventricular contraction) là kết quả

của sự kích thích sớm của tim Xuất hiện khi nhịp tim phụ sẽ bắt đầu ở mộttrong hai buồng bơm phía dưới của tim (tâm thất), làm gián đoạn nhịp timđều đặn bình thường, đôi khi gây ra cảm giác rung hoặc hụt nhịp trong ngực.+ Nhịp tim được xếp vào lớp F (Fusion beat) khi hai nhịp tim xuất phát từ tâm

nhĩ và một nhịp tim khác xuất phát từ tâm thất xảy ra đồng thời

+ Nhịp tim được xếp vào lớp Q (Unclassifiable beat) khi có các đặc điểm đặc

biệt hoặc không đủ thông tin dé xác định

¢ Phân biệt các loại nhịp tim: Dé phân biệt được các loại nhịp tim, các chuyên

N 5 Vv F

Nhip tim binh Nhip tim Nhip tim réi Nhip tim

thường | nhanh loan cham

(Hinh 3.a) (Hinh 3.b) (Hinh 3.c) (Hinh 3.d)

Khoảng Cosuéndinh Có xu hướng Có khoảng cách Có khoảng cáchcách ngắn hơn không đều đài hơn

RR

« Đối xứngvà s Sóng P có Số lượng vàhình « Song P có

hình dạng amplitude dạng sóng P amplitude

Sóng P đều tăng do tăng không đều, có thé giảm do dẫn

tốc dẫn xuất hiện sóng P truyền điện

bồ trợ (PVC hoặc

14

Trang 24

0,06-0,10 giây) và

hoặc có hình dạng

bất thường

Độ rộng của

phức QRS có

thể thay đổiđáng kể, cóthé rộng hon

hoac hep hon

so với phức QRS binh thuong.

Hình dang cua phức QRS_ không

hoặc có hình dạng

bất thường

Bảng 2.1: Bảng phân biệt sự khác nhau về hình dạng sóng của nhịp tim

15

Trang 25

(a) Normal heartbeat (b) Supraventricular premature beat

(c) Premature ventricular contraction (d) Fusion of ventricular and normal beat

Hình 2.3: Hình anh các loại nhip tim theo tiêu chuan AAMI [22]

16

Trang 26

CHƯƠNG 3 PHƯƠNG PHÁP THỰC NGHIỆM3.1 Các thuật toán học máy thống kê

3.1.1 Naive Bayes

Giải thuật phân lớp Naive Bayes được thực hiện với ý tưởng tim ra lớp c có xác

suất xuất hiện điểm dữ liệu x đang xét cao nhất, thì lớp c đó sẽ là lớp mà điểm dữliệu thuộc về Đặc trưng của điểm dữ liệu x có thé là một véc tơ x € IR#

Tổng quát hoá, ta sẽ có công thức như sau:

Mặt khác, vì mau so x là không phụ thuộc vào c cho nên công thức trên có thê

đơn giản phần mẫu số như sau:

c = argmax?(x|c)p(c) (3)

c

Trong đó, thành phan p(x|c) được hiéu là phân phối của các điểm dữ liệu tronglớp c thường rất khó tính toán vì x được thể hiện băng một biến ngẫu nhiên, vì vậy

cần rất nhiều quan sát mới có thể xây dựng được phân phối nay Dé đơn giản, Naive

Bayes thường giả định thành phan của biến ngẫu nhiên x là độc lập với nhau Tứcphân phối của p(x|c) được trình bày như sau:

Trang 27

_ Nei (5)

p(xjlc) = N

Cc

Trong đó, N,; là số mau mà điểm dữ liệu x với đặc trưng x; thuộc về lớp c, N,

số lượng đặc trưng của các điểm dữ liệu từng thuộc về lớp c Tuy nhiên, vớimột đặc trưng chưa từng xuất hiện trong lớp c thì biéu thức trên sẽ bằng 0 Vìvậy thông thường sẽ áp dụng kỹ thuật Laplace dé giải quyết van đề này như

sau:

p(¡Ìc) = N.+da

Với a là một số dương, thường bang 1, dé tránh trường hop tử số bằng 0

— Phân phối Bernoulli:

p(xilc) = pữ|£)x¡ + (1 — pũ|y))( — z¡) (7)

3.1.2 Stochastic gradient descent - SGD

Gradient Descent (GD) là một thuật toán tối ưu hóa được sử dụng rộng rãi tronglĩnh vực Học Máy nói riêng và Toán Tối Ưu nói chung Ý tưởng của GD là lặp đểtìm điểm cực tiêu của một hàm số bằng cách di chuyên theo hướng ngược với gradient(đạo hàm) của hàm số tại một điểm nhất định Bằng cách lặp đi lặp lại, GD sẽ dần hội

tụ về một điểm cực tiểu của hàm số, tùy thuộc vào điểm bắt đầu và tốc độ học

Xét hàm một biến f(x), thuật toán Gradient Descent tìm cực tiểu của hàm sốbang cách khởi tạo giá trị x tại một điểm ngẫu nhiên, sau đó di chuyên x ngược hướngvới dao hàm của f(x) Tiếp tục lặp lại cho đến khi đạt được điểm cực tiểu Ta cócông thức cập nhập giá trị x sau mỗi lần lặp thứ t:

X:+i = Xp — a * ƒ '(x,) (8)

Trong đó: ø là tốc độ hoc (learning rate), ƒ”(x¿) là đạo hàm của ham ƒ tại điểm

Đối với hàm nhiều biến ƒ (3), thuật toán này sẽ tính Gradient (vector đạo hàm)của hàm ƒ tại điểm ngẫu nhiên x, sau đó di chuyển # ngược hướng với Gradient này

Ta có công thức cập nhập x tại bước thứ £:

18

Trang 28

#t+1 = Xi+ia — ø*Vƒ(Œ,) (9)

Trong đó: a là tốc độ hoc (learning rate), Vf (3,) là Gradient của hàm ƒ tại điểm

Có nhiều biến thể được phát triển từ ý tưởng của GD tuỳ thuộc vào việc lựa

chọn dỡ liệu huấn luyện và thứ tự cập nhật Thuật toán SGD dựa trên ý tưởng thay vi

tính toán gradient dựa trên toàn bộ tap dữ liệu, ta chỉ tính toán gradient dựa trên một

mẫu dữ liệu ngẫu nhiên (một phan của tập dữ liệu) - tức là cập nhập X từ một điểm

dữ liệu huấn luyện ngẫu nhiên, giúp tăng tốc độ hội tụ so với Gradient Descent truyềnthống

Stochastic Gradient Descent (SGD) là một phương pháp tối ưu hóa phô biến vớinhiều ưu điểm đáng kể, đặc biệt là trong các bai toán có độ phức tạp lớn Một trongnhững ưu điểm của SGD là hiệu quả khi làm việc với tập dit liệu lớn Thay vì cần xử

lý toàn bộ dit liệu như trong Gradient Descent truyền thống thì SGD chỉ thực hiệncập nhật tham số sau mỗi mẫu đơn lẻ, điều này giúp quá trình học diễn ra nhanh hơn.Đồng thời, tính chất ngẫu nhiên trong cập nhật của SGD giúp mô hình tránh được cáccực tri địa phương (local minima), từ đó có khả năng tìm ra các điểm cực tiểu tốt hơntrong không gian tham sé, điều này đặc biệt hữu ích khi tối ưu hóa các hàm phi tuyến

và không lỗi Ngoài ra, SGD còn thích ứng tốt với các luồng dữ liệu liên tục, nhờ khả

năng cập nhật liên tục sau mỗi quan sát mới, làm cho nó trở thành lựa chọn lý tưởng

cho các ứng dụng thời gian thực [23].

Tuy nhiên, SGD cũng tồn tại một số nhược điểm cần được khắc phục Sự biếnđộng lớn trong quá trình học do mỗi lần cập nhật chỉ dựa trên một mẫu dữ liệu duynhất có thé dẫn đến sự thay đổi không 6n định trong gradient và các tham số mô hình

Việc chon learning rate phù hợp cũng là một thách thức, khi learning rate quá nhỏ

dẫn đến học chậm, còn learning rate quá lớn có thé gây ra sự dao động mạnh và khônghội tụ được đến cực tiêu toàn cục Hơn nữa, SGD dé bi mắc ket tại các điểm yên ngựa

(saddle points), nơi gradient gần bằng 0 ở mọi chiều, làm chậm quá trình hội tụ hoặc

khiến SGD không thé tìm được cực tiêu tốt hơn Cuối cùng, sự không 6n định trong

19

Trang 29

việc cập nhật tham số có thé gây khó khăn khi xử lý các hàm mắt mát phức tạp, khiến

các tham số dao động mạnh và khó 6n định trong quá trình huấn luyện [23]

3.1.3 PassiveAggressive

Online Learning Algorithms là một nhóm các thuật toán xử lý dữ liệu theo trình

tự Trong phương pháp này, một thuật toán nhận một đầu vào, đưa ra dự đoán, sau đó

nhận phản hôi về độ chính xác của dự đoán đó Phản hồi này được sử dụng dé cập

nhật mô hình cho các dự đoán tương lai Đặc điểm chính của online learning là thuật

toán cập nhật mô hình một cách tuần tự khi dữ liệu mới xuất hiện, thay vì huấn luyện

lai từ dau trên toàn bộ tập di liệu mỗi lần.

Thuật toán Passive Aggressive (PA) là một họ các thuật toán hoc online dựa

trên margin, được thiết kế để giải quyết nhiều nhiệm vụ dự đoán khác nhau bằng cách

cập nhật mô hình một cách tức thời sau mỗi lần quan sát dữ liệu mới Cơ sở lý thuyết

của PA dựa trên việc duy trì sự cân bang giữa việc hoc hỏi từ các mau mới va giữ cho

mô hình hiện tại không thay đổi quá nhiều Điều này được thực hiện thông qua một

bài toán tối ưu hóa có rang buộc, dam bao rang su cap nhat chi dién ra khi can thiét

dé sửa lỗi dự đoán hoặc duy tri margin tối thiêu

Cu thé, đối với bài toán phân loại nhị phân, hàm mat mát (hinge loss) được sửdụng để đánh giá mức độ sai lệch của dự đoán so với nhãn thực tế Hàm mất mát này

được định nghĩa như sau:

I(w; (x; y)) = max(0.1 — y * (w- x) (10)

Dựa trên hàm mất mát này, bài toán tối ưu hóa của PA được biểu diễn dưới

dạng:

Wear = argminyep2 : llw — w;||Ÿ s - t - law; (x;; y¿)) = 0 (11)

Trong đó, w, là vector trọng số của mô hình tai thời điểm ¢, x, là vector đặctrưng của mẫu dữ liệu tại thời điểm ¿, y, là nhãn thực tế của mẫu dữ liệu tại thời điểm

t, nhãn này có thể là -1 hoặc +1 trong bài toán phân loại nhị phân

20

Trang 30

Giải pháp của bài toán tối ưu hóa trên dẫn đến công thức cập nhật trọng số:

Wes = We + CV eXt (12)

lt

IIxell?

Trong đó, £, là hệ số cập nhật được tinh bằng: t, =

Dé điêu chỉnh mức độ "aggressive" của quá trình cập nhật, có hai biên thê của

thuật toán PA được đề xuất:

ft — mí tt

e PA-II: t, = min (« ait) (14)

Trong đó, C là tham sô điêu chỉnh mức độ "aggressive" của thuật toán, giúp cân băng giữa việc học từ dữ liệu mới và việc git nguyên mô hình hiện tại.

Quy trình cập nhật của thuật toán PA cho phân loại nhị phân như sau:

thể của nó đã chứng tỏ tính hiệu quả trong nhiều ứng dụng học máy, từ phân loại

nhị phân, phân loại đa lớp, hồi quy đến dự đoán chuỗi thời gian

21

Trang 31

3.1.4 XGBoost

Ensemble Learning là một kỹ thuật trong học máy mà ý tưởng cơ bản là kết hợpnhiều mô hình học máy cơ bản (gọi là base learners) dé tạo ra một mô hình tổng hợpmạnh hơn Thay vì dựa vào một mô hình duy nhất, Ensemble Learning sử dụng sự đadạng của nhiều mô hình khác nhau dé cải thiện độ chính xác, độ tin cậy và ôn định

của dự đoán Có nhiều cách tiếp cận khác nhau trong Ensemble Learning, bao gồm

Bagging, Boosting và Stacking Trong đó, Boosting là một trong những kỹ thuật Ensemble giúp làm giảm giá tri bias.

Boosting hoạt động bằng cách xây dựng một chuỗi các mô hình học cơ bản, mỗi

mô hình được huấn luyện đề khắc phục những sai sót của mô hình trước đó Quá trìnhnày được lặp lại nhiều vòng, mỗi lần tao ra một mô hình mới dé bổ sung vào tập hợp.Cuối cùng, tất cả các mô hình trong tập hợp sẽ được kết hợp lại, tạo ra một mô hìnhtổng hợp có khả năng dự đoán chính xác hơn nhiều so với mô hình cơ bản đơn lẻ.Boosting giải quyết bài toán tối ưu sau:

Thay vì tim cùng một lúc tất cả các giá trị C,,W, để đạt được nghiệm tối ưu

toàn cục, Boosting sẽ tìm nghiệm cục bộ sau khi thêm từng mô hình weak learner

mới vào chuỗi dé dan tiến tới nghiệm tối ưu toàn cục Công thức sau:

mứnc,w„L,W„_ + CrWy), với Wn_+ = XI =1 CNM (16)

Một biến thé nâng cao của Boosting là XGBoost (Extreme Gradient Boosting),

là một giải thuật được xây dung dựa trên gradient boosting Được cai tiễn về mặt tối

22

Trang 32

ưu thuật toán, sự kết hợp hoàn hảo giữa sức mạnh phần mềm và phần cứng, giúp đạtđược những kết quả vượt trội cả về thời gian training cũng như bộ nhớ sử dụng.

3.2 Các thuật toán học sâu

3.2.1 LSTM

Kiến trúc bộ nhớ dài ngắn hạn — Long short-term memory (LSTM) là một môhình RNN được phát triển bởi như một giải pháp cho vấn đề về gradient khi cập nhậttrọng số thông qua quá nhiều và hàng loạt các điểm liền kề trước đó trong chuỗi Cau

trúc cơ bản của LSTM bao gồm 3 công chính: Cổng đầu vào (Input Gate) - kiểm soát

luồng thông tin mới được đưa vào trạng thái tế bao; Cong quên (Forget Gate) - kiếmsoát thông tin cần được giữ lại hay bỏ đi từ trạng thái tế bào trước đó; và Công đầu

ra (Output Gate) - Kiểm soát thông tin được đưa ra làm đầu ra của LSTM Các cổngnày đóng vai trò quan trọng trong việc điều khiến luồng thông tin cần thiết cho quá

trình dự đoán trong chuỗi dữ liệu đầu vào.

he - Output

Cell state Next cell state

hes CÓ)

Hidden state Next hidden state

Inputs: Outputs: Nonlinearities: Vector operations:

Scaling of

X_ ) Current input CC, ) New updated -Ơ Simoi layer x iRoiastiodiot” memory

Tanh layer +

Cà.) Memory from) Current out

SỬ tast LSTM unit Ggy Currenf output

Output of last Bias

hes LSTM unit k °

Hình 3.2.1: Minh hoa kiến trúc LSTM [24]

Dựa vào kiến trúc được minh hoạ ở Hình 3.2.1.1 có thể thấy rằng, đầu vào của

khối LSTM bao gồm trạng thái ẩn từ bước thời gian trước đó h¿_; va đặt trưng đầuvào x, Những đầu vào này được kết hợp với trạng thái tế bao từ bước trước C,_, dé

23

Trang 33

quyết định nên giữ lại hay phải quên những thông tin không thực sự quan trọng (cổngquên) Tiếp theo, LSTM sẽ quyết định những thông tin mới nào cần được lưu vàotrạng thái tế bào hiện tại C, bang cách sử dụng hàm sigmoid dé xác định những thànhphan mới quan trong, sau đó kết hợp với giá trị đầu vào đã được biến đổi bang hàmtanh (công đầu vào) Cuối cùng, LSTM sẽ quyết định dau ra h, dựa trên trạng thái

tế bào hiện tại Œ,, thông qua việc sử dụng hàm sigmoid dé xác định những thành

phan quan trọng cần giữ lại (công đầu ra).

3.2.2 CNN

Mạng Thần Kinh Tích Chập (Convolutional Neural Network - CNN) là một môhình học sâu đặc biệt, được phát triển dựa trên mạng nơ-ron nhân tao CNN ban đầuđược thiết kế dé thực hiện nhiệm vụ phân tích ảnh Đầu vào của CNN là một ma trậnchứa thông tin thô của ảnh Sau đó, một loạt các bộ lọc sẽ được áp dụng lên ảnh đểbắt các vùng, các đặc trưng quan trọng trong ảnh Từ đó, đầu ra của mạng có thé phânloại ảnh vào các lớp phù hợp với bài toán So với các thuật toán phân loại ảnh truyềnthống, CNN có yêu cầu tiền xử lý thấp hơn nhiều Trong khi các phương pháp truyềnthống cần thiết kế các bộ lọc một cách thủ công, CNN có khả năng tự học các bộ lọc

để rút trích đặc trưng ảnh Nhờ vào cấu trúc và cách hoạt động đặc biệt này, CNN đãtrở thành một trong những mô hình học sâu phô biến và hiệu quả trong các bài toán

liên quan đên xử lý ảnh.

Mang thần tích chập được đánh giá là một trong những mang học sâu phổ biến

và tiên tiên hiện nay Mạng được câu tạo từ các thành phân sau:

+ Lớp Tích Chap (Convolution Layer — Conv): Mục tiêu của lớp Conv là trích

xuất các đặc trưng cấp cao từ thông tin thô của đầu vào, thông qua việc sử dụngcác bộ lọc (filter/kernel) Đặc biệt, mạng thần kinh tích chập không chỉ bao gồmmột lớp tích chập đơn lẻ Thông thường, lớp tích chập đầu tiên sẽ chịu tráchnhiệm nắm bắt các đặc trưng cấp thấp như góc cạnh, màu sắc, hướng gradient,

Khi thêm các lớp sau đó, kiến trúc của mạng sẽ được thiết kế dé dần thu thập

24

Trang 34

các đặc trưng cấp cao hơn Nhờ vào cách tiếp cận này, mạng thần kinh tích chập

có thê học được những thông tin và hiéu biết sâu về mặt ý nghĩa, tương tự như

cách con người hiệu và nhận thức về thế giới xung quanh

Lớp Gộp (Pooling Layer - Pool): Mục đích chính của lớp Pooling là tăng tính

bat biến không gian (spatial invariance) cho mạng, giúp mạng có thé học được

các đặc trưng quan trọng mà không phụ thuộc quá nhiều vào vị trí chính xác củachúng trong ảnh đầu vào Ngoài ra, lớp Pooling còn có tác dụng làm giảm tínhtoán và thời gian huấn luyện mạng Thông qua một phép downsampling, lớpPooling giảm kích thước của đữ liệu đầu vào, từ đó giảm nhu cầu về tài nguyên

tính toán và rút ngắn thời gian huấn luyện mạng mà vẫn giữ được các đặc trưng

quan trọng, đảm bảo rằng mạng vẫn có thể học được các thông tin cần thiết Cónhiều loại phép Pooling khác nhau như Sum Pooling, L2 Pooling, Max Pooling

va Average Pooling Trong đó, Max Pooling va Average Pooling là hai dang

phép Pooling phố biến nhất được sử dung trong các mô hình CNN

Lớp Kết Nói Day Đủ (Fully Connected Layer - FC): Đầu vào là dit liệu đã đượclàm phăng (flattened), trong đó tất cả các neuron trong lớp hiện tại sẽ được kếtnối với tất cả các neuron trong lớp trước đó Trong mô hình CNN, sau khi tríchxuất các đặc trưng quan trọng thông qua các lớp Tích Chập và lớp Gộp, dữ liệu

sẽ được đưa vào lớp FC Mục đích của lớp này là đưa ra kết quả cuối cùng phù

hợp với bài toán đã đặt ra ban đầu Lớp EC có thể bao gồm một hoặc nhiều lớp,tuỳ thuộc vào độ phức tạp của bài toán Nó giúp tổng hợp và kết hợp các đặc

trưng đã được trích xuât ở các lớp trước đó đê đưa ra dự đoán cuôi cùng.

INPUT CONVOLUTION + RELU POOLING CONVOLUTION + RELU POOLING FLATTEN Ne pee €ONNECTEo 7

TY a

FEATURE LEARNING CLASSIFICATION

Hình 3.2: Hình minh họa kiến trúc CNN [25]

25

Trang 35

Với tính năng ưu việc trong trích xuất và xử lý thông tin, mạng thần kinh tíchchập cũng có thé được sử dụng dé phân tích các miền dữ liệu khác như là văn banhoặc dit liệu số dạng chuỗi thời gian Đối với dang di liệu hình ảnh, bộ lọc được sử

dụng là một lưới 2 chiều, trong khi đó, lưới 1 chiều thường được sử dụng cho dạng

dữ liệu như văn bản hoặc chuỗi thời gian.

3.3 Transfer Learning

Transfer learning, hay học chuyền giao, là một kỹ thuật học máy cho phép tậndụng kiến thức đã hoc được từ một nhiệm vụ này dé giải quyết một nhiệm vụ khác.Thay vì huấn luyện một mô hình hoàn toàn mới từ đầu cho mỗi nhiệm vụ, transferlearning tận dụng lại các trọng số đã được huấn luyện trước đó của một mô hình lớntrên một tập dữ liệu lớn, sau đó điều chỉnh lại để phù hợp với nhiệm vụ mới Điều

này giúp tiết kiệm đáng kể thời gian và tài nguyên tính toán, đồng thời cải thiện hiệu

suất của mô hình, đặc biệt khi lượng dữ liệu cho nhiệm vụ mới là hạn chế

Cơ chế hoạt động của transfer learning dựa trên giả định rằng các đặc trưnghọc được từ một nhiệm vụ có thê hữu ích cho các nhiệm vụ liên quan Quá trìnhtransfer learning thường bao gồm hai giai đoạn chính:

e Pre-training: Huấn luyện một mô hình lớn trên một tập dữ liệu lớn dé học các

đặc trưng chung.

e_ Fine-tuning: Điều chỉnh lại các lớp cuối cùng của mô hình pre-trained dé phù

hợp với nhiệm vụ mới Các kỹ thuật transfer learning phô biến bao gồm:

e Feature extraction: Sử dung các lớp đặc trưng của mô hình pre-trained như là

đầu vào cho một mô hình mới

e Fine-tuning: Điều chỉnh toàn bộ hoặc một phần của mô hình pre-trained trên

dt liệu mới.

e Multi-task learning: Huan luyện một mô hình dé thực hiện nhiều nhiệm vụ

cùng một lúc.

26

Trang 36

CHƯƠNG 4 THỰC NGHIỆM, ĐÁNH GIÁ VÀ HƯỚNG CẢI TIỀN

4.1 Bộ dữ liệu

4.1.1 Bộ dữ liệu MIT BIH Arrhythmia

Bộ dữ liệu MIT BIH Arrhythmia [6] gồm 48 tập dữ liệu ECG (records) từ 2

kênh (V1 ghi lại sự di chuyên của đòng điện trong tim từ góc nhìn trước, MLII ghi

lại sự di chuyển của dòng điện trong tim từ góc nhìn nằm ngang của tim) kéo dai

trong thời gian 30 phút Những tập dữ liệu này được thu thập từ 47 bệnh nhân được nghiên cứu bởi Phòng thí nghiệm BIH Arrhythmia từ năm 1975 - 1979 Trong đó, có

23 tập được chọn ngẫu nhiên từ tập bản ghi ECG được thu thập trong 24 giờ từ một

nhóm bệnh nhân nội trú (khoảng 60%) và bệnh nhân ngoại trú (khoảng 40%) tại Bệnh

viện Beth Israel ở Boston; các tập dữ liệu còn lại được chọn từ cùng tập bao gồm cácrồi loạn nhịp tim ít phô biến

Tất cả các dữ liệu ECG trong cơ sở dữ liệu MIT-BIH Arrhythmia đã đượcchuyền đổi thành dạng số dé lưu trữ và phân tích Quá trình số hóa này đã ghi lai ditliệu ECG với tốc độ thu thập là 360Hz (cu thé trong mỗi giây thu được 360 mẫu trênmỗi kênh) Dé dam bảo tính chính xác, mỗi bản ghi đã được đánh dấu chú thích nhãnbệnh bởi ít nhất hai bác sĩ tim mạch (Hình 4.1) Cụ thé Hình 4.1 bên dưới, 4.1a làbản ghi nhịp tim của một người bình thường, 4.1b là bản ghi nhịp tim bat thường của

a Tin hiệu nhịp tim bình thường b Tin hiệu nhịp tim bat thường

Hình 4.1: Một số hình anh của tín hiệu điện tâm đồ được ghi lai

27

Trang 37

4.1.2 Bộ dữ liệu MIT BIH Normsal Sinus Rhythm

Bộ dữ liệu MIT-BIH Normal Sinus Rhythm [7] là tập dữ liệu gồm các trườnghợp ghi nhận trong thời gian dài về ECG của những người được giới thiệu đến Phòngxét nghiệm Rối loạn nhịp ở Bệnh viện Beth Israel ở Boston (hiện nay là Trung tâm

Y tế Beth Israel Deaconess) Các đối tượng trong bộ dit liệu không có bat kỳ rối loạnnhịp nào đáng ké và bệnh lý về tim trước đó; bao gồm 5 nam giới, trong độ tuôi từ 26đến 45, và 13 phụ nữ, trong độ tuổi từ 20 đến 50 Bộ dữ liệu này được sử dụng để

nghiên cứu và phân tích nhip tim bình thường (normal sinus rhythm) Bộ dữ liệu cung

cấp thông tin về các bản ghi ECG trong khoảng thời gian dài của các tình nguyện

viên.

4.2 Xử lý dữ liệu

Dữ liệu trong các bản ghi được xử lý lần lượt theo các bước sau: (1) Trích xuấtkhoảng R-R; (2) Thêm song phức QRS; (3) Đưa về tần số 125 Hz; (4) Chuan hóa ditliệu; (5) Xử lý đữ liệu thiếu; (6) Phân loại nhịp tim Luéng xử lý dữ liệu tong quan

được trình bày ở Hình 4.2.1.

Trích xuất Thêm sóng Đưa về tan ` | Chuan hóa Xử lý dữ liệu Phân loại

khoảng R-R phức QRS 125 Hz dữ liệu thiêu nhịp tim

Hình 4.2: Luồng xử lý dữ liệu

Chi tiết các bước xử lý như sau:

— Bước 1: Trích xuất dữ liệu Chia nhỏ bản ghi được từ bệnh nhân thành các

bản ghi nhịp riêng lẻ chứa khoảng R-R.

— Bước 2: Thêm sóng phức QRS Từ mỗi bản ghi nhịp tim riêng lẻ, thực hiện

mở rộng lấy sóng phức QRS bằng cách thêm vào 40 lần đọc của bản ghi nhịptim tiếp theo

28

Trang 38

# Append some extra readings from next beat.

beats[idx] = np.append(beats[idx], beats[idx+1][:40])

Bước 3: Đưa về tần số 125 Hz Thực hiện chuyển đổi mau từ tan số 360 Hzsang 125 Hz Việc đưa về tan số 125 Hz giúp giảm khối lượng dữ liệu và tăngtốc quá trình tính toán, đồng thời vẫn giữ được các đặc trưng quan trọng trong

tín hiệu ECG.

# Resample from 360Hz to 125Hz

newsize = int((beats[idx].size * 125 / 360) + 0.5)

beats[idx] = signal.resample(beats[idx], newsize)

Bước 4: Chuẩn hóa dữ liệu Dua các giá trị trong bản ghi về khoảng [0 —1]

Bởi vì, giá trị dữ liệu được giới hạn trong một khoảng nhất định gitip viéc huan

luyện mô hình máy học hội tụ nhanh hon, và mô hình sau cùng cũng sẽ dua ra

kết quả dự đoán tốt hơn

# Normalize the readings to a 0-1 range for ML purposes.

beats[idx] = (beats[idx] - beats[idx].min()) / beats[idx].ptpQ

Bước 5: Xử ly dữ liệu thiếu Dé dam bảo độ dài đồng nhất cho các bản ghinhịp tim, chúng được đệm thêm giá tri 0 ở cuối cho đến khi đạt độ dài tiêu

chuẩn là 187 giá trị Đồng thời, các bản ghi có độ dài vượt quá giới hạn này sẽ

Trang 39

zerocount = 187 - beats[idx].size

beats[idx] = np.pad(beats[idx], (0, zerocount), ‘constant’, constant_values=(0.0, 0.0))

— Bước 6: Phân loại nhịp tim Phân loại nhịp tim từ các dữ liệu chú thích của

tập dữ liệu và được thêm vào cuối mỗi bản ghi nhịp tim Mỗi hàng sẽ có chínhxác 188 giá trị Đồng thời, các bản ghi nhịp tim không được phân loại sẽ bị

loại bỏ.

# Append the classification to the beat data.

eats[idx] = np.append(beats[idx], catval)

# Remove first and last beats and the ones without classification.

beats = np.delete(beats, beatstoremove)

4.3 Chia dữ liệu

4.3.1 Thống kê dữ liệu

Trong quá trình huấn luyện mô hình, chúng tôi áp dụng phân loại giữa các bệnhnhân (inter-patient) Điều này có nghĩa là chúng tôi chia nhỏ dữ liệu thành hai tệp:tệp huấn luyện và tệp kiểm tra Phân chia dữ liệu thành tệp huấn luyện và tệp kiểmtra theo cách này giúp đánh giá khả năng tổng quát hóa của mô hình

+ Trong tệp huấn luyện, chúng tôi có các bệnh nhân với các ID sau: 100, 101,

Dựa vào thống kê phân phối nhãn trong tập huấn luyện (Hình 4.3.1), bộ dữ lieu

MIT-BIH có sự mất cân bằng trong dữ liệu giữa các lớp Đặc biệt, lớp 0 và lớp 4

chiếm tỉ lệ lớn nhất trong tập huấn luyện

30

Trang 40

4.3.2 Chia mẫu học giám sát

Trong bài toán dự báo chuỗi thời gian, các đặc trưng được đưa vào mô hình theo

từng chuỗi với một số lượng điểm dữ liệu nhất định, được gọi là bước thời gian

(time-step) Một mẫu đữ liệu học giám sát cho dự đoán chuỗi thời gian bao gồm t điểm dữliệu đặc trưng và ƒ điểm dữ liệu mục tiêu, trong đó £ là số lượng bước thời gian của

t điểm đữ liệu đặc trưng, và ƒ là số điểm dữ liệu mục tiêu được dự đoán trong tương

lai Nếu dit liệu gốc có N điểm dữ liệu (tương đương với N nhịp R-R), thì số lượng

mẫu dữ liệu học giám sat được tạo ra lan = N — ƒ — t + 1 Việc chia các mẫu dữ

liệu được thực hiện theo cách cuộn dan theo chiều thời gian, như Hình 4.4 minh họa

voit =5, ƒ = 1 và số lượng mẫu học dit liệu „ = 15 — 5— 1+1 = 10.

31

Tiêu đề	Xây Dựng Mô Hình Phân Loại Sớm Bất Thường Tim Mạch Dựa Trên Tín Hiệu Điện Tâm Đồ
Tác giả	Đỗ Thảo Quyên, Nguyễn Quốc Trung
Người hướng dẫn	PGS. Nguyễn Đình Thuân
Trường học	Đại học Quốc gia TP. Hồ Chí Minh - Trường Đại học Công nghệ Thông tin
Chuyên ngành	Hệ thống thông tin
Thể loại	khóa luận tốt nghiệp
Năm xuất bản	2024
Thành phố	TP. Hồ Chí Minh

Định dạng
Số trang	112
Dung lượng	35,69 MB