Tuy nhiên, với sự phát triển của công nghệthông tin, cũng như những van đề còn tồn đọng trong các nghiên cứu về khai thác và xử lý đữ liệu mà sinh viên khảo sát được, tiến hành áp dụng c
Trang 1ĐẠI HOC QUOC GIA TP HO CHÍ MINH
TRUONG DAI HOC CONG NGHE THONG TIN
KHOA HE THONG THONG TIN
DO THÁO QUYEN - 20520295 NGUYEN QUOC TRUNG - 20522073
KHOA LUAN TOT NGHIEP
XAY DUNG MO HINH PHAN LOAI SOM BAT THUONG
TIM MACH DUA TREN TIN HIEU DIEN TAM DO
BUILDING AN EARLY ABNORMAL CARDIAC
CLASSIFICATION MODEL BASED ON ELECTROCARDIOGRAM SIGNALS
KY SU/ CU NHAN NGANH HE THONG THONG TIN
GIANG VIEN HUONG DAN
PGS NGUYEN DINH THUAN
TP HO CHÍ MINH, 2024
Trang 2LỜI CẢM ƠN
Lời đầu tiên, chúng em xin gửi lời cảm ơn chân thành đến Thầy PGS NguyễnĐình Thuân đã hướng dẫn và hỗ trợ chúng em trong suốt quá trình thực hiện khóaluận tốt nghiệp Những góp ý quý báu của Thầy không chỉ giúp chúng em hoàn thànhkhóa luận tốt nghiệp mà còn trang bị cho chúng em những kiến thức cần thiết dé tiền
xa hơn trên con đường học thuật Sự nhiệt huyết và tận tâm của Thầy là nguồn động
lực lớn giúp em vượt qua khó khăn và thử thách trong suốt quá trình thực hiện khóa
luận.
Tiếp theo, chúng em xin gửi lời cảm ơn chân thành đến KS Nguyễn Minh
Nhựt, KS Trịnh Thị Thanh Trúc và nhóm nghiên cứu FITSU Cam ơn các anh chị đã
tạo điều kiện cho chúng em được tham gia học tập và đồng hành cùng các anh chịtrong suốt quá trình thực hiện khóa luận Sự hỗ trợ và chia sẻ kinh nghiệm quý báu
từ các anh chị đã giúp chúng em củng có thêm kiến thức và những góc nhìn mới trên
con đường học thuật.
Chúng em xin gửi lời cảm ơn chân thành đến các Thầy Cô trong khoa Hệ thống
Thông tin — Trường Đại học Công nghệ Thông Tin Những hướng dẫn và hỗ trợ mà
các Thầy Cô đã dành cho chúng em trong việc giảng dạy và truyền đạt kiến thức đãgiúp chúng em xây dựng được nên tảng dé hoàn thành khóa luận này Từ đó giúp
chúng em thêm tự trong quá trình thực hiện khóa luận.
Lời cuối cùng, chúng em xin bày tỏ lòng biết ơn sâu sắc đến Thầy Cô phảnbiện về khoá luận tốt nghiệp Những góp ý này là những tín hiệu quý giá giúp chúng
em nhận ra những điểm còn thiếu sót và cần được cải thiện trong đề tài Điều này sẽgiúp em hoàn thiện và phát triển hơn trong hướng nghiên cứu tương lai
TP Hồ Chí Minh, ngày tháng năm 2024
Sinh viên thực hiện
Đỗ Thảo Quyên
Nguyễn Quốc Trung
Trang 3MỤC LỤC
CHƯƠNG 1 TONG QUAN ĐÈ TAL 2-5-5652 SE‡EE‡ESEEEEE+EEEEEEEEEerkerxrkerxrri 5
IS? lure nghién na 5
1⁄2 Phát biểu bài tốn -++++EEktEEH HH ưệu6
1.3 Thách thức - SG HH HH HH HH Hà Hà Hư 7
1.4 Mục tiêu đề tài ccct nhe 81.5 D6i tượng và phạm vi nghiên cứu ¿2 ©+©++x++£x++zx++rxezrxesred 8
1.6 Dong gĩp cho nghién ctu 0.0 eee cecceseeseceseeseeeseeeeeeseceeeeeceeeeaeeeseeseeeaeeeeeeas 9
CHƯƠNG 2 CƠ SỞ LÝ THUYET wiecessescsssssscssssesessseescsssecessnsccessneeeesnneesennneeesses 10
2.1 Cac nghiên cứu liÊn QU41 - 5 c5 +38 321139113 EESEEskreeerreree 10
2.2 Tín hiệu điện tâm đồ - ECG c¿ccc+tsccteerrrrtrrrrrrrrrrrrrrrree 12
2.2.1 Cấu trúc của một nhịp tim tiêu chuân 2- 2 ss2+c22szz£z+sz 12
2.2.2 Phan loại các nhịp tIM 6 c3 11833 E911 1E Eskeskese 13
CHƯƠNG 3 PHƯƠNG PHÁP THỰC NGHIỆM 2- ¿+22 17
3.1 _ Các thuật tốn học máy thong kê - 2 s22 ++£++E++E++E++Ezrzrezree 17
3.1.1 Nạve Bay©s LH HH HH HH TH HH HH 17
3.1.2 Stochastic gradient descent — SGD - + +c se eree 18 3.1.3 PasSIV€CÀBĐT€SSIVC Ă HH HH HH TT HH HH gu 20 3.1.4 XGBOOSK Ăn HH HH HH TH HH nr 22 3.2 Cac thuat todn HOC 0:ađdđdđđaÝŸÝŸÝỐỐ 23
B.Q1 LST m— OẢ.L-)^:”:.LỐL.ẦẦ 23
S9 24
3.3 Transfer LearnIng - - ccc c1 119111911 91111 vn ng key 26
Trang 4CHUONG 4._ THỰC NGHIỆM, ĐÁNH GIA VÀ HƯỚNG CẢI TIÉN 27
4.1 Bộ dữ liệu -+cc22kcEk 2E E21 221121127121101121 211 re 27
4.1.1 _ Bộ dữ liệu MIT BIH Arrhythmia 2- 2 52 5+2cx+2zx2zxcczee2 27
4.1.2 Bộ dữ liệu MIT BIH Normsal Sinus Rhythm 5-5 28
4.2 Xử lý dữ liệu ck2H TT H222 11 erree 28
4.3 Chia dữ liệu © 27k+2k2EEEk 2E 2112212112111 1tr 30
4.3.1 _ Thống kê dữ liệu - 2: ©5¿+2<+EE£+E2EEEEEEEEEEEEEEEEEEEEEEErrkrrkrree 30
4.3.2 Chia mẫu học giám sát ¿- 2 + +E+EE+E£EE£EE+EEEEEErEerkrrrrkrree 31
44 D6 do icon ằ 32
4.4.1 ACCUTACVY Ă.QQ Q.11 HH HH HH nưy 32
4.4.2 S€DSIẨIV ĂẶQ HH HH1 HH ng ng 33 4.4.3 Precision 4 > <£ Ẻ iiiiii.ve 33 4.4.4 Mean Squared ETTOT - -. 5c 112319911 9k ve re 33
4.5 Đánh giá kết quả -. :- 2 ++S< SE E2 SE 1E11211211211211 1111111, 34
4.5.1 _ Phân tích kết quả -2¿©-++2+++2+++E+++EE+tEke+rkesrkrrrkrrrree 344.5.2 Cải tiến kết quả ¿5c t2 E1121221221211271111111 2121 re.434.5.3 Đề xuất kiến trúC - + ©+++EE+EkE2EEEEEE1211271 2112112121 re.444.5.4, Đánh giá kết qua cccccccccccsssesssesssesssecssessecssecssecssecssesssecsuecssesssssecssecsses 51
CHƯƠNG 5 KÉT LUẬN VÀ HƯỚNG PHÁT TRIEN -:-¿ 52
5.1 Kếtluận -c-©c.22ESEE 2 2212212211211 1121121111211 11c eeye 525.2 Kết quả đạt được -: 22c ke xEEEEE1111121121121111 1.1.1 xe 535.3 Hướng phát triỀn - + ©£+k+EEtEEEEEEEEEEEEEEEEEEEEEEEEEkrrkrrrkrrkee 54
CHƯƠNG 6 PHỤ LỤC 2¿22-©+22£+EE+EE2EEEEEEEEEEEEEEECEEEErkrrkrrrrervee 55
6.1 _ Hình ảnh kết quả theo Hướng tiẾp cận 2 - 2-2 22s s+sz+£zxz+se2 55
Trang 56.2 Hình ảnh kết quả theo Hướng cải tiến 2 2-2 2+5++sz+£z£zzz+se2 64
6.3 Bảng kết quả thực nghiệm -¿- 2¿©+¿22++2E++EE+tEEESEEE+rkeerxrrrxrrrree 73
6.3.1 Bang kết quả của Hướng tiếp cận l ¿2 s+ce+cczeccxzes 736.3.2 Bảng kết quả của Hướng cải thiện l 2-52 s+czz£zEzxres 786.3.3 Bảng kết quả của Hướng tiếp cận 2 -:- 2 ++cx++cxerxesree 806.3.4 Bảng kết quả của Hướng cải thiện 2 - 2-2-2252 ++£zEzrrrres 89
Trang 6DANH MỤC HÌNH ÁNH
Hình 1.1: Mô hình tiếp cận theo hai hướng . -¿- 2 2 2 + £+££+E£+EzxzEzxzxez 7
Hình 2.1: Hình ảnh minh họa của một cấu trúc nhịp tim tiêu chuẩn . 13
Hình 2.2: Tóm tắt các ánh xạ giữa các chú thích nhịp tim và các loại nhịp tim theo tiêu chuẩn AAMI ECS7 [12] - -2¿22+++t22S++ttEEEtrttEkttrtrtrtrrrttrrrrrrrtrrrrrrker 13 Hình 2.3: Hình ảnh các loại nhip tim theo tiêu chuẩn AAMI [22] . - 16
Hình 3.2.1: Minh hoạ kiến trúc LSTM [24] -:-2- 22 ©522+22s++z++zxezx+zzxzrsez 23 Hình 3.1: Hình minh hoa kiến trúc CNN [25] cccccccccccsssscscsesesececeesesceesececsesesveveeeeceees 25 Hình 4.1: Một số hình ảnh của tín hiệu điện tâm đồ được ghi lại - 27
Hình 4.2: Luồng xử lý dữ liệu - 2 2 +©+£+EE+EE+2EE£EEtEEEEEEEEEEEErkerkrrrkerkeee 28 Hình 4.3: Thống kê phân phối nhãn trên tập train và tập test của bộ dữ liệu MIT-BIH Hee SEE ⁄7⁄277 WN: QƯN, 31
Hình 4.4: Minh hoạ các mẫu dữ liệu được chia theo bước thời gian được xác định ¬ đ£“ € “6 Số ẽố hố 32
Hình 4.5: Dự báo hồi quy nhịp tim trong tương lai ở hai mô hình LSTM-CNN 35
I9 011 Ắ 42
(0019.721 đ 42
(C) IO-St€DS 2-Š5 QQQQ.nHHSH HH TH TH HH Họ HH HH ke 42 0019 0000 00 42
Hình 4.15: Biéu đồ đánh giá của thuật toán DuoHF-CNN qua mỗi epoch trong IO-Ôi 4 49
Hình 4.16: Biéu đồ đánh giá của thuật toán DuoHF-CNN qua mỗi epoch trong IO-Di 49
Hình 4.17: Biéu đồ đánh giá của thuật toán DuoHF-CNN qua mỗi epoch trong IO-Ôi 5 3 50
Hình 6.1: Biéu đồ đánh giá các độ đo của các thuật toán trong IO-steps 1-1 55
Hình 6.2: Biéu đồ đánh giá độ đo của các thuật toán trong IO-steps 2-I 56
Hình 6.3: Biểu đồ so sánh độ đo F1 của các thuật toán trong IO-steps 5-1 56
Hình 6.4: Biểu đồ đánh giá độ đo của các thuật toán trong IO-steps 10-1 57
Trang 7Hình 6.5: Biéu đồ đánh giá các độ do của các thuật toán trong IO-steps 1-2 57
Hình 6.6: Biéu đồ đánh giá độ do của các thuật toán trong IO-steps 2-2 58
Hình 6.7: Biéu đồ đánh giá độ đo của các thuật toán trong IO-steps 5-2 58
Hình 6.8: Biéu đồ đánh giá các độ đo của các thuật toán trong IO-steps 10-2 59
Hình 6.9: Biéu đồ đánh giá các độ đo của các thuật toán trong IO-steps 1-5 60
Hình 6.10: Biéu đồ đánh giá các độ đo của các thuật toán trong IO-steps 2-5 60
Hình 6.11: Biêu đồ đánh giá các độ đo của các thuật toán trong IO-steps 5-5 61
Hình 6.12: Biéu đồ so sánh độ đo F1 của các thuật toán trong IO-steps 10-5 61
Hình 6.13: Biéu đồ đánh giá các độ đo của các thuật toán trong IO-steps 1-10 62
Hình 6.14: Biéu đồ so sánh độ đo F1 của các thuật toán trong IO-steps 2-10 63
Hình 6.15: Biéu đồ đánh giá các độ đo của các thuật toán trong IO-steps 5-10 63
Hình 6.16: Biểu đồ so sánh độ đo F1 của các thuật toán trong IO-steps 10-10 64
Hình 6.17: Biéu đồ đánh giá các độ đo của thuật toán DuoHF-CNN qua mỗi epoch trong IO-Sf€pS Í-Í -SĂ LH TH TH HH HH 65 Hình 6.18: Biểu đồ đánh giá các độ đo của thuật toán DuoHF-CNN qua mỗi epoch trong IO-Sf€DS 2-1 .- L2 1H TH TH HT HH kt 65 Hình 6.19: Biéu đồ đánh giá các độ đo của thuật toán DuoHF-CNN qua mỗi epoch trong TO-steps T1 66
Hình 6.20: Biểu đồ đánh giá các độ do của thuật toán DuoHF-CNN qua mỗi epoch trong IO-sfeps IŨ- Ï - HH HH HH HH kh 67 Hình 6.21: Biéu đồ danh giá các độ đo của thuật toán DuoHF-CNN qua mỗi epoch trong [O-S(€DS 2- Ï - Go H H HH 67 Hình 6.22: Biểu đồ đánh giá các độ do của thuật toán DuoHF-CNN qua mỗi epoch 0/x)i13016951i1 022/205 Ỏ 68 Hình 6.23: Biểu đồ đánh giá các độ đo của thuật toán DuoHF-CNN qua mỗi epoch trong IO-steps 11/2 68
Hình 6.24: Biéu đồ độ đánh giá các độ đo của thuật toán DuoHF-CNN qua mỗi epoch
trong IO-sfeps IŨ-2 kg TH nh tt 69
Trang 8Hình 6.25: Biểu đồ đánh giá các độ đo của thuật toán DuoHF-CNN qua mỗi epoch
Hình 6.29: Biểu đồ đánh giá các độ đo của thuật toán DuoHF-CNN qua mỗi epoch
trong IO-sfeps 2-10 0 eeeeesceesseessecescecsseceseeeseesseeesaeceseecseeceaeesceceaeeeeeseaeeeneeeeaeeeaes 72
Hình 6.30: Biểu đồ đánh giá các độ do của thuật toán DuoHF-CNN qua mỗi epoch
trong [O-s(eps TŨ- [Ũ - 2c c1 L1 E01 1T nh TH HH HH HH 73
Trang 9DANH MỤC BANG
Bang 2.1: Bảng phân biệt sự khác nhau về hình dạng sóng của nhịp tim 15Bang 6.1: Bảng kết quả Hướng tiếp cận l ¿- 2-2 25+ ++£++EzEzzzrzreee 77Bảng 6.2: Bảng kết quả Hướng tiếp cận 2 ¿-©2¿©5222++2cx2Exttrxerrxersreee 80Bảng 6.3: Bảng kết quả của Hướng tiếp cận I -2- 52 5z2cx+2zxvszxccrsez 89Bang 6.4: Bảng kết quả Hướng cải tiễn 2 - 2-52 25£+E£+EE+E2EE+EzErEerrerreee 99
Trang 10DANH MỤC TỪ VIET TAT
1 ECG Electrocardiogram — Điện tâm đồ
2 Association for the Advancement of Medical
AAMI cư &Instrumentation — Hiệp hội Tiên bộ Công cụ Y tê
3 MIT-BIH Arrhythmia Database — cơ sở dữ liệu lưu trữ các
MIT-BIH :
ban ghi điện tam đô
WHO World Health Organization — Tô chức y tê thê giới
2 CNN Convolutional neural network — Mang no ron tich chap
6 RNN Recurrent Neural Network — Mang no ron tai phat
[Ae mỹ ` LÍ
|
7 SVM Thuật toán Support Vector Machine
8 Duo Heart Feature Convolutional Neural Network — Mang
DuoHF-CNN no ron tích chập được su dung trong bai toán dự đoán nhịp
tim
Ọ LSTM Long short-term memory — Mạng bộ nhớ dai ngăn hạn
10 SGD Thuật toán Stochastic gradient descent
11 XGBoost Thuật toán Extreme Gradient Boosting
12 Acc Accuracy — Độ chính xác của mô hình
13 Cls Classification — Phan lớp
l4 Reg Regression — Hồi quy
15 Conv Convolution Layer — Lớp tích chập
l6 Pool Pooling Layer — Lớp gộp
17 EC Fully Connected Layer — Lớp kết nối day đủ
Trang 11[18 MSE Mean Squared Error — Sai số trung bình phương sai
E MLP Multi-Layer Perceptron — mang no-ron da tang
Trang 12TÓM TẮT KHÓA LUẬN
Trong lĩnh vực y tế hiện nay, việc phát hiện va chân đoán bệnh tim mạch nhanhchóng và kịp thời là một vấn đề vô cùng cấp thiết Trong các cơ sở y tế, việc sử dụngđiện tâm đồ (ECG) dé chan đoán là một phương pháp phổ biến và hiệu quả Tuynhiên, việc phân tích đữ liệu ECG theo phương pháp truyền thống đang đối mặt vớinhiều thách thức do sự đa dang và phức tạp của dir liệu Hơn nữa, trong việc chânđoán và điều trị các vấn đề về tim mạch, việc theo dõi liên tục và đáp ứng kịp thờitrong suốt quá trình hoạt động hàng ngày của bệnh nhân gặp phải nhiều trở ngại và
khó khăn Với tình hình gia tăng các trường hợp bệnh tim mạch, việc khám chữa trị
truyền thống đã gặp phải nhiều hạn chế Tuy nhiên, với sự phát triển của công nghệthông tin, cũng như những van đề còn tồn đọng trong các nghiên cứu về khai thác và
xử lý đữ liệu mà sinh viên khảo sát được, tiến hành áp dụng cả hai hướng tiếp cậnhọc máy là Phân lớp và Hồi quy trên miền dữ liệu chuỗi thời gian cho nhiệm vụ pháthiện sớm nhịp tim bat thường Thực nghiệm được triển khai trên các mô hình máyhọc thống kê và mô hình học sâu với mục tiêu so sánh hiệu quả của hai cách tiếp cậnqua các mô hình thực nghiệm Kết quả sau cùng, hướng tiếp cận Phân lớp dựa trênhồi quy nhịp tim thông qua các mô hình học sâu (LSTM, CNN) có khả năng tập trungvào phân loại các nhịp tim bat thường trên miền dữ liệu mất sự cân bằng Tuy nhiên,
để cải thiện độ chính xác trong việc dự đoán bất thường nhịp tim, chúng tôi sử dụng
phương pháp transfer learning đối với các mô hình hồi quy sử dụng bộ dữ liệu BIH Normal Sinus Rhythm Mặc dù đối mặt nhiều han chế về số lượng dữ liệu song,các mô hình học sâu theo hướng Phân lớp trực tiếp phần nào nhận diện được các lớpbất thường của nhịp tim Trong hướng tiếp cận này, chúng tôi đề xuất một kiến trúc
MIT-mạng CNN cải tiến giúp cải thiện hiệu quả của mô hình dự đoán chính xác về các lớp
nhịp tim Sau cùng, hướng tiếp cận này đã giúp mô hình học sâu có thể nhận diệnđược các lớp bất thường Hướng cải thiện và phát triển trong tương lai cũng đã được
đê cập trong các phân sau của khoá luận.
Báo cáo gôm 6 chương với các nội dung như sau:
Trang 13Chương 1: Tong quan đề tài Giới thiệu về nội dung đề tài bao gồm động lực
nghiên cứu, phat biểu bài toán, thách thức, mục tiêu, phạm vi đối tượng nghiên
cứu, và những đóng góp chính trong nghiên cứu.
Chương 2: Cơ sở lý thuyết Trình bày tổng quan về các lý thuyết cơ sở trong
dự báo sớm nhịp tim Trình bày các khảo sát về hướng tiếp cận dự báo từ các
công trình đi trước.
Chương 3: Phương pháp thực nghiệm Trình bày về các khái niệm về dự báohồi quy và dự báo phân lớp Trình bày các thuật toán máy học thống kê truyềnthống và các thuật toán học sâu
Chương 4: Thực nghiệm, đánh giá và hướng cải tiến Trình bày quy trình xử
lý dữ liệu và thực nghiệm, các thông số chỉ tiết cho quá trình thực nghiệm vàcác phương pháp về cải tiến mô hình Báo cáo kết quả thực nghiệm và phân tíchkết quả
Chương 5: Kết luận và hướng phát triển Tổng kết các kết quả chính đã đạt
được trong đề tài và hướng phát triển của đề tài trong tương lai
Chương 6: Phụ lục Bồ sung chi tiết các kết quả trong quá trình thực nghiệm
Trang 14CHUONG 1 TONG QUAN DE TÀI
1.1 Động lực nghiên cứu
Bệnh tim mạch là một trong những nguyên nhân chính gây tử vong trên toàn
cầu, chiếm khoảng 32% theo số liệu của Té chức Y tế Thế giới năm 2021 [1] Ở Việt
Nam, vấn đề liên quan đến bệnh tim mạch đang gây ra một mối lo ngại đáng kê với
tỷ lệ tử vong do bệnh tim mạch chiếm khoảng 33% trong tổng số ca tử vong hàngnăm [2] Hơn nữa, theo nghiên cứu của BMC Medicine từ năm 1990 đến năm 2019trên 204 quốc gia cho thấy tỷ lệ tử vong do bệnh tim dang dan trẻ hóa trong độ tudi
từ 15 đến 39 [3] Để phát hiện sớm các vấn đề này, các cơ sở chăm sóc sức khỏe banđầu có thể đo lường và đánh giá nguy cơ đau tim, đột quy, suy tim và các biến chứngkhác Tuy nhiên, theo WHO các bệnh tim mạch thường không xuất hiện các triệuchứng rõ ràng [I] Trên thực tế, một cơn đau tim hoặc đột quy có thé là dau hiệu đầutiên cho sự tôn tại của một bệnh lý nền Dé đảm bảo khả năng chân đoán chính xácbệnh tim, các chuyên gia y tế cần được hỗ trợ bằng các công cụ và thiết bị y tế phùhợp Tuy nhiên, phương pháp tiếp cận truyền thống này có thể đòi hỏi nhiều thời gian
và kinh phí đáng kể từ người bệnh
Với sự phát triển nhanh chóng của công nghệ thông tin hiện nay, nhu cầu chomột ứng dụng di động và thiết bị y tế thông minh hỗ trợ người bệnh theo dõi các bấtthường tim mạch là rất lớn Một trong các kỹ thuật chính và phé biến nhất dé theodõi sức khỏe của người bệnh là dựa trên điện tâm đồ (Electrocardiogram - ECG) Tuynhiên, việc phân tích thủ công nhịp tim đối mặt với những thách thức lớn do sự đadạng và phức tạp của dữ liệu ECG Hình dạng biến thé của sóng ECG thường có sựbiến đôi đáng kê giữa các bệnh nhân, gây khó khăn trong việc nhận diện và phân loại.Hơn nữa, dữ liệu ECG thường bị ảnh hưởng bởi nhiễu từ nhiều nguồn khác nhau, nhưdao động điện từ môi trường, chuyên động cơ thé và tín hiệu điện khác, gây mat mátthông tin quan trọng liên quan đến nhịp tim Từ đó cho thấy việc xử lý lượng lớn cácbản ghi ECG đòi hỏi rất nhiều thời gian và công sức Mặt khác, với tính bất ngờ và
khó lường von di trong các vân đê về tim mạch, việc theo dõi liên tục và đáp ứng một
Trang 15cách tức thời xuyên suốt quá trình sinh hoạt của bệnh nhân dé kịp thời chan đoán vàđiều trị là rất cần thiết Tuy nhiên, với áp lực từ sự gia tăng của các ca tim mạch vàcũng như tâm lý nặng nề của một số người khi phải đi thăm khám tại các cơ sở y tế,khiến các mô hình thăm khám truyền thống còn bộc lộ nhiều hạn chế Điều này thúcđây một nhu cầu rất lớn trong việc tích hợp các phương pháp tự động và công nghệ,
hỗ trợ việc theo dõi và chân đoán tại nhà, giúp cải thiện hiệu suất, giảm áp lực đặt ra
cho các chuyên gia y tế
Hiện nay, nghiên cứu trong lĩnh vực phân tích nhịp tim đã đạt được những thành
tựu đáng kể, tích hợp nhiều phương pháp như phân tích thống kê hay trí tuệ nhân tạovới khả năng đánh giá cũng như dự báo sớm được các triệu chứng về tim mạch Một
số nghiên cứu tập trung vào việc dự báo hồi quy nhịp tim cho tương lai [4] [5] Tuynhiên, kết qua dự báo này thường chỉ có thé được tiếp cận và sử dụng bởi các chuyêngia có kiến thức chuyên môn Trong khi đó, đối với người dùng phô thông, họ chỉ cóthé tiép cận với các kết quả tường minh, dễ hiểu, cụ thé như chính xác một loại bấtthường nhịp tim nào đó trong tương lai mà họ có thể gặp phải Đây cũng chính là bài
toán mà phân loại nhịp tim có thể giải quyết Ngoài ra, một khoảng trống khác mà
các nghiên cứu này vẫn chưa giải quyết đó là khía cạnh về hiệu suất phát hiện sớmcho các bat thường về tim mạch của các mô hình phân loại vẫn chưa được phân tíchcặn kẽ Trong khi đó, thời gian là một yếu tố vô cùng quan trọng đối với một hệ thống
cảnh báo sớm và đồng thời đóng vai trò quyết định trong quá trình thực hiện các biện
pháp cấp cứu tim mạch tại nhà cho bệnh nhân
1.2 Phát biểu bài toán
Đầu vào: Dữ liệu các đặc trưng về nhip tim được đưa vào theo từng đoạn RR-interval
Xử lý: Nhiệm vụ thực hiện được chia làm hai hướng tiếp cận:
+ Hướng tiếp cận 1: Đầu vào là đặc trưng của dữ liệu ECG trong quá khứ Qua
các mô hình dự báo hồi quy thu được chuỗi ECG trong tương lai Sử dụng giá
trị ECG trong tương lai vừa được dự báo như là đầu vào của mô hình phân lớp
Trang 16Đầu ra sau cùng là lớp bất thường có thể được dự báo cho đoạn ECG trong
tương lai.
+ Hướng tiếp cận 2: Đầu vào là đặc trưng của dữ liệu ECG trong quá khứ Qua
các mô hình dự báo phân lớp Đầu ra mục tiêu sẽ là lớp bat thường có thé được
dự đoán cho một số thời điểm trong tương lai
Đầu ra: Loại nhịp tim tương lai
DP , / Hướng tiếp cận 1 Hướng tiếp cận 2
{_ Mô hình dự báo hồi quy | [ Mô hình dự báo phân lớp _ ] Mô hình dự báo phân lớp
Mô hình máy Mô hình Mô hình máy Mô hình | Mô hình má ô hì y Mô hình
học thống kê || học sâu học thống kê || học sâu học thống kê || học sâu
Ì Ỷ
ECG Loại nhịp tim Loại nhịp tim
(Tương lai) (Tương lai) (Tương lai)
Hình 1.1: Mô hình tiếp cận theo hai hướng
1.3 Thách thức
— Về dữ liệu:
+ Hình dạng biến thé của sóng ECG thường có sự biến đổi đáng kể giữa các
bệnh nhân là một thử thách rất lớn dé có thể xây dựng tính tổng quát của mô
hình dự đoán đối với dữ liệu bệnh nhân chưa biết
+ Dữ liệu ECG thường bị anh hưởng bởi nhiễu từ nhiều nguồn khác nhau, như
dao động điện từ môi trường, chuyền động cơ thê và tín hiệu điện khác, gâymắt mát thông tin quan trọng liên quan đến nhịp tim
— Về phương pháp:
+ Mô hình dự báo sớm là đối mặt với hiệu suất giảm khi phải xử lý những yếu
tố bất ngờ và không lường trước được trong tương lai khi mô hình chỉ có thể
dựa vào những dữ liệu được biết trong quá khứ
Trang 17+ Mất cân bang trong bài toán dự báo bất thường luôn là một thách thức quan
trọng, đặc biệt khi xét đến ngữ cảnh của đặc trưng chuỗi thời gian Trong ngữcảnh này, việc sử dung các kỹ thuật tăng cường dit liệu thông thường có thégây mat mát về mối tương quan thời gian của các đặc trưng chuỗi thời gian,làm giảm tính hiệu quả của mô hình trong việc dự báo và phân loại bất
— Xây dựng ứng dung di động phân loại nhịp tim từ mô hình dự báo sớm.
1.5 Đối tượng và phạm vi nghiên cứu
Đối tượng: Dữ liệu nhịp tim chứa các loại nhịp tim bất thường và bình thường
Dữ liệu:
— Bộ dữ liệu MIT-BIH Arrhythmia [6]: Bao gồm 48 tap dit liệu ECG, ghi lai sự
di chuyển của dòng điện trong tim Những tập dữ liệu này được thu thập từ 47
bệnh nhân được nghiên cứu bởi Phòng thí nghiệm BIH Arrhythmia từ năm 1975
— 1979 Trong đó, có 23 tập được chọn ngẫu nhiên từ tập bản ghi ECG được thu
thập trong 24 giờ từ một nhóm bệnh nhân nội trú; các tập dữ liệu còn lại được
chọn từ các tập bao gồm các rối loạn nhịp tim ít phổ biến
— Bộ dữ liệu MIT-BIH Normal Sinus Rhythm [7]: Bao gồm 18 tập dữ liệu ECG
của các đối tượng không có bat kỳ rỗi loạn nhịp nào đáng ké và bệnh lý về tim
trước đó.
Pham vi nghiên cứu:
— Khảo sát và đánh giá các công trình đã công bồ về bài toán hồi quy dit liệu điện
tâm d6 và bài toán phân lớp bat thường nhịp tim
Trang 18Nghiên cứu các phương pháp xử lý dữ liệu nhip tim.
Nghiên cứu các mô hình máy học thống kê và mô hình học sâu tiên tiến
Thực nghiệm các mô hình hình theo từng hướng tiếp cận và thực nghiệm cáchướng cải tiến được đề xuất
Xây dựng ứng dụng phân loại sớm nhip tim.
1.6 Đóng góp cho nghiên cứu
Giới thiệu các phương pháp tiếp cận dự báo sớm trong nhịp tim tập trung vàocác yếu tố gồm: các đặc trưng đầu vào, hướng tiếp cận huấn luyện mô hình, các
mô hình phân lớp, mốc thời gian dự báo trong tương lai
Phân tích hiệu quả xây dựng mô hình dự báo sớm bat thường trong nhịp timtheo hai hướng: phân lớp và hồi quy
Phân tích và đánh giá hiệu suất dự báo sớm của mô hình thông qua các mốc thờigian tương lai được thực nghiệm một cách chi tiết (Vd: 1—2—5— 10 phút)
Thực nghiệm và đánh giá hiệu suất trên cả mô hình máy học thống kê và mô
hình học sâu.
Với từng hướng tiếp cận đưa ra đề xuất, thực nghiệm và đánh giá kết quả cáchướng cải tiễn tương ứng
Trang 19CHUONG 2 CƠ SỞ LÝ THUYET
2.1 Các nghiên cứu liên quan
Về loại đặc trưng đầu vào: Trong lĩnh vực phân loại nhịp tim bất thường, mô
hình dự báo có thé được tiếp cận theo hai phương pháp [8] Phương pháp đầu tiên là
dựa trên chuỗi thời gian của các tín hiệu ECG được ghi nhận (time serles — based
approaches), trực tiếp sử dụng dữ liệu chuỗi thời gian gốc dé xử lý và phân tích Năm
2012, Ye cùng cộng sự [9] đã tiễn hành nghiên cứu để phân loại dữ liệu từ bộ đữ liệuMIT-BIH thành 15 lớp khác nhau băng cách sử dụng mô hình SVM Trong quá trìnhlay đặc trưng đầu vào, các nhóm nghiên cứu đã lay một chuỗi thời gian dài 300 mau(0,83 giây) từ mỗi nhịp tim, bao gồm 100 điểm trước điểm R (0.27 giây) (điểm đánhdấu sự co bóp của tim) và 200 điểm (0.56 giây) sau điểm R Kết quả thực nghiệm chothấy rằng phương pháp này đạt được độ chính xác trung bình là 99,25% Điều nàycho thấy phương pháp được sử dụng là rất hiệu quả trong việc phân loại dữ liệu nhịp
tim từ bộ dữ liệu MIT-BIH Năm 2014, trong nghiên cứu của Tran, Pham va Vuong
[10], họ sử dụng ba phương pháp tiếp cận mang neural dé phan loại dtr liệu gồm
multi-layer perceptron (MLP), support vector machine (SVM) và mạng TSK
(Takagi-Sugeno-Kang) Dé lay được đặc trưng đầu vào, họ sử dụng hệ số của hàm cơ sởHermite bậc 15 (HBF) và khoảng thời gian RR từ mỗi nhịp tim Đầu tiên, chuỗi thờigian 250 mili giây với 91 mẫu được chia thành các đoạn, trong đó mỗi đoạn lay 45mẫu xung quanh điểm R của nhịp tim Từ các đoạn nay, họ trích xuất các hệ số HBF
Kết quả được báo cáo cho thấy tỷ lệ nhận diện đúng (Se%) đạt 99.02% và tỷ lệ nhận
diện sai (Sp%) đạt 99.25%.
Phương pháp thứ hai là dựa trên đặc trưng (feature-based approaches), sử dụng
dữ liệu chuỗi thời gian gốc dé tính toán các đặc trưng cần thiết từ đó huấn luyện mô
hình dự đoán hoặc phân loại Năm 2009, Ince, Kiranyaz và Gabbouj [11] sử dụng bộ
dữ liệu huấn luyện bao gồm các nhịp tim được trích xuất ngẫu nhiên từ các bản ghi
từ 5 phút đầu tiên Họ trích xuất vector đặc trưng gồm 180 mẫu (500 mili giây ở tốc
độ lay mau 360 mau/giay), được căn chỉnh tại điểm R Độ nhạy được báo cáo là
10
Trang 2097,1%, 62,1%, 83,4%, 61,3% tương ứng cho các lớp N, S, V và F, và độ chính xác
dương tính được báo cáo là 98,3% và 97,4% tương ứng cho các lớp S và V Năm
2014, Das va Ari [12] sử dụng thuật toán Pan-Tompkins dé xác định các điểm chuẩnquan trọng gồm sóng Q, R và S trên mỗi nhịp tim điện tim Từ đó, họ đã lấy mộtchuỗi thời gian 180 mẫu (tương ứng với 500 mili giây tại tốc độ lấy mẫu 360mẫu/giây), được căn chỉnh tại điểm R, và sử dụng nó dé tính toán các đặc trưng dựatrên biến đổi S (S-tranform) Ngoài ra, tác giả không chi sử dụng biến đổi S để trích
xuất đặc trưng, mà còn trích xuất 4 đặc trưng từ khoảng thời gian giữa các nhịp tim
(khoảng RR) và kết hợp chúng với 180 đặc trưng khác dựa trên biến đổi S tranform), tạo thành một vector đặc trưng tổng hợp 184 chiều dé mô tả tín hiệu ECGmột cách toàn diện Kết quả cho thấy độ nhạy (Se%) lần lượt là 98,1%, 74,0%, 91,4%
(S-và 67,0% cho các lớp N, S, V (S-và E.
Về việc huấn luyện mô hình: Có hai cách thức tiếp nhận dữ liệu thường được
đề cập, bao gồm phân loại nội bệnh nhân (intra-patient) và phân loại giữa các bệnh
nhân (inter-patient) [8] Trong đó, mô hình phân loại nội bệnh nhân chia dữ liệu của
từng bệnh nhân cho cả tập huấn luyện và kiểm thử mô hình [11] [12] [13] [14] Mặt
khác, mô hình phân loại giữa các bệnh nhân [15] [16] [17] sử dụng các tập huấn luyện
và kiểm thử độc lập từ các bản ghi của các bệnh nhân khác nhau nhằm mục đích đánhgiá khả năng tong quát của mô hình dự đoán đối với dữ liệu bệnh nhân chưa biết Môhình sau khi được huấn luyện theo phương pháp phân loại giữa các bệnh nhân có khảnăng áp dụng cho bất kỳ bệnh nhân nào mà nó chưa từng gặp qua, đảm bảo tính ápdụng thực tế Tuy nhiên, hiệu suất của mô hình phân loại giữa các bệnh nhân thường
còn khá thấp, cần cải thiện để đạt được độ chính xác cao hơn và đáng tin cậy hơn
trong việc phân loại dữ liệu từ các bệnh nhân.
Về các mô hình phân loại nhịp tim: Nhiều mô hình máy học đã được thựcnghiệm cho bài toán này như SVM [18] [19] [16], RNN [20], CNN [21] Hau hết, các
mô hình máy học thống kê truyền thống được khảo sát còn nhiều hạn chế, hơn nữa,
hiệu suât của các mô hình học sâu vân còn chưa được khai thác nhiêu.
11
Trang 21Về các mốc thời gian dự báo tương lai: Các nghiên cứu trước đây chưa cungcấp những bước thời gian cụ thé và rõ ràng cho van dé phát hiện sớm, với phần lớntập trung vào phân loại và phát hiện các lớp bất thường hoặc chỉ xác định các bước
thời gian đâu vào trong khi các bước thời gian dau ra vân chưa rõ ràng.
2.2 Tín hiệu điện tâm đồ - ECG
2.2.1 Cấu trúc của một nhịp tim tiêu chuẩn
Câu trúc của một nhịp tim tiêu chuân gôm có sóng P, sóng T, và sóng phức
QRS Trong đó, mỗi sóng đại diện cho:
+ Sóng P thể hiện sự depolarization (ton thương) của tử cung, tức là quá trình
điện tử khi co tim tử cung bị kích thích dé co bóp và day máu vào that trái vàthất phải
+ Sóng T thé hiện sự repolarization (phục hồi) của tử cung, tức là quá trình điện
tử khi cơ tim tử cung phục hồi sau quá trình co bóp
+ Phức QRS biéu thị sự depolarization (tồn thương) của túi AV và các thất Nó
đại điện cho quá trình điện tử khi cơ tim túi AV và các thiết bị kích thích dé
co bóp và đây máu ra khỏi tim
Khoảng RR là khoảng thời gian giữa hai đỉnh R liên tiếp trên đồ thị ECG, đolường thời gian từ một điểm đỉnh R đến điểm đỉnh R kế tiếp Khoảng RR là một thôngtin quan trọng trong chân đoán bệnh tim, đặc biệt trong việc phát hiện nhịp tim khôngđều Bằng cách sử dụng khoảng thời gian trước RR và sau RR làm đặc trưng thờigian, bác sĩ có thé xác định khoảng cách giữa các nhịp tim liền kề và thu thập thôngtin về tình trạng tim mạch Thông qua phân tích các đặc trưng này, các chuyên gia y
tế có thé đưa ra đánh giá và chân đoán chính xác về sức khỏe tim mach của bệnh
nhân.
12
Trang 22heartbeat A heartbeat B
Hình 2.1: Hình ảnh minh họa của một cấu trúc nhip tim tiêu chuẩn.
2.2.2 Phân loại các nhịp tim
Dựa theo tiêu chuẩn theo tiêu chuân EC57 của Hiệp hội Tiến bộ Công cụ Y
khoa (AAMD), bộ dữ liệu MIT-BIH Arrhythmia được chia thành 5 loại và được chú thích bảng sau:
AAMI class MIT-BIH heart beat types Normal beat (N) Normal beat (N) Left bundle Right bundle Atrial escape beat (e) Nodal
branch block branch block beat (junctional) beat (L) (R) escape beat (j)
Supraventricular Atrial premature Aberrated atrial Nodal (junctional) Supraventricular ectopic beat (S) beat (A) premature beat premature beat (J) _ premature beat (S)
Unknown beat (Q) Paced beat (/) Fusion of paced Unclassified beat
and normal beat (Q)
(f)
Hình 2.2: Tóm tắt các ánh xạ giữa các chú thích nhip tim và các loại nhịp tim theo
tiêu chuẩn AAMI EC57 [12]
Trong đó, các đặc trưng cua nhip tim dé phân loại dựa trên tiêu chí:
13
Trang 23+ Nhịp tim được xếp vào lớp N (Normal beat) khi nhịp tim hoạt động trong
trạng thái bình thường mà không có bat kỳ biến thé hay sự khác biệt đáng kê.
+ Nhịp tim được xếp vào lớp S (Supraventricular premature beat) có dau hiệu
khi tâm thất hoạt động sớm hơn so với một nhịp đập của tim bình thường,
gây ra sự gián đoạn cho nhịp tim.
+ Nhịp tim được xếp vào lớp V (Premature ventricular contraction) là kết quả
của sự kích thích sớm của tim Xuất hiện khi nhịp tim phụ sẽ bắt đầu ở mộttrong hai buồng bơm phía dưới của tim (tâm thất), làm gián đoạn nhịp timđều đặn bình thường, đôi khi gây ra cảm giác rung hoặc hụt nhịp trong ngực.+ Nhịp tim được xếp vào lớp F (Fusion beat) khi hai nhịp tim xuất phát từ tâm
nhĩ và một nhịp tim khác xuất phát từ tâm thất xảy ra đồng thời
+ Nhịp tim được xếp vào lớp Q (Unclassifiable beat) khi có các đặc điểm đặc
biệt hoặc không đủ thông tin dé xác định
¢ Phân biệt các loại nhịp tim: Dé phân biệt được các loại nhịp tim, các chuyên
N 5 Vv F
Nhip tim binh Nhip tim Nhip tim réi Nhip tim
thường | nhanh loan cham
(Hinh 3.a) (Hinh 3.b) (Hinh 3.c) (Hinh 3.d)
Khoảng Cosuéndinh Có xu hướng Có khoảng cách Có khoảng cáchcách ngắn hơn không đều đài hơn
RR
« Đối xứngvà s Sóng P có Số lượng vàhình « Song P có
hình dạng amplitude dạng sóng P amplitude
Sóng P đều tăng do tăng không đều, có thé giảm do dẫn
tốc dẫn xuất hiện sóng P truyền điện
bồ trợ (PVC hoặc
14
Trang 240,06-0,10 giây) và
hoặc có hình dạng
bất thường
Độ rộng của
phức QRS có
thể thay đổiđáng kể, cóthé rộng hon
hoac hep hon
so với phức QRS binh thuong.
Hình dang cua phức QRS_ không
hoặc có hình dạng
bất thường
Bảng 2.1: Bảng phân biệt sự khác nhau về hình dạng sóng của nhịp tim
15
Trang 25(a) Normal heartbeat (b) Supraventricular premature beat
(c) Premature ventricular contraction (d) Fusion of ventricular and normal beat
Hình 2.3: Hình anh các loại nhip tim theo tiêu chuan AAMI [22]
16
Trang 26CHƯƠNG 3 PHƯƠNG PHÁP THỰC NGHIỆM3.1 Các thuật toán học máy thống kê
3.1.1 Naive Bayes
Giải thuật phân lớp Naive Bayes được thực hiện với ý tưởng tim ra lớp c có xác
suất xuất hiện điểm dữ liệu x đang xét cao nhất, thì lớp c đó sẽ là lớp mà điểm dữliệu thuộc về Đặc trưng của điểm dữ liệu x có thé là một véc tơ x € IR#
Tổng quát hoá, ta sẽ có công thức như sau:
Mặt khác, vì mau so x là không phụ thuộc vào c cho nên công thức trên có thê
đơn giản phần mẫu số như sau:
c = argmax?(x|c)p(c) (3)
c
Trong đó, thành phan p(x|c) được hiéu là phân phối của các điểm dữ liệu tronglớp c thường rất khó tính toán vì x được thể hiện băng một biến ngẫu nhiên, vì vậy
cần rất nhiều quan sát mới có thể xây dựng được phân phối nay Dé đơn giản, Naive
Bayes thường giả định thành phan của biến ngẫu nhiên x là độc lập với nhau Tứcphân phối của p(x|c) được trình bày như sau:
Trang 27_ Nei (5)
p(xjlc) = N
Cc
Trong đó, N,; là số mau mà điểm dữ liệu x với đặc trưng x; thuộc về lớp c, N,
số lượng đặc trưng của các điểm dữ liệu từng thuộc về lớp c Tuy nhiên, vớimột đặc trưng chưa từng xuất hiện trong lớp c thì biéu thức trên sẽ bằng 0 Vìvậy thông thường sẽ áp dụng kỹ thuật Laplace dé giải quyết van đề này như
sau:
p(¡Ìc) = N.+da
Với a là một số dương, thường bang 1, dé tránh trường hop tử số bằng 0
— Phân phối Bernoulli:
p(xilc) = pữ|£)x¡ + (1 — pũ|y))( — z¡) (7)
3.1.2 Stochastic gradient descent - SGD
Gradient Descent (GD) là một thuật toán tối ưu hóa được sử dụng rộng rãi tronglĩnh vực Học Máy nói riêng và Toán Tối Ưu nói chung Ý tưởng của GD là lặp đểtìm điểm cực tiêu của một hàm số bằng cách di chuyên theo hướng ngược với gradient(đạo hàm) của hàm số tại một điểm nhất định Bằng cách lặp đi lặp lại, GD sẽ dần hội
tụ về một điểm cực tiểu của hàm số, tùy thuộc vào điểm bắt đầu và tốc độ học
Xét hàm một biến f(x), thuật toán Gradient Descent tìm cực tiểu của hàm sốbang cách khởi tạo giá trị x tại một điểm ngẫu nhiên, sau đó di chuyên x ngược hướngvới dao hàm của f(x) Tiếp tục lặp lại cho đến khi đạt được điểm cực tiểu Ta cócông thức cập nhập giá trị x sau mỗi lần lặp thứ t:
X:+i = Xp — a * ƒ '(x,) (8)
Trong đó: ø là tốc độ hoc (learning rate), ƒ”(x¿) là đạo hàm của ham ƒ tại điểm
Đối với hàm nhiều biến ƒ (3), thuật toán này sẽ tính Gradient (vector đạo hàm)của hàm ƒ tại điểm ngẫu nhiên x, sau đó di chuyển # ngược hướng với Gradient này
Ta có công thức cập nhập x tại bước thứ £:
18
Trang 28#t+1 = Xi+ia — ø*Vƒ(Œ,) (9)
Trong đó: a là tốc độ hoc (learning rate), Vf (3,) là Gradient của hàm ƒ tại điểm
Có nhiều biến thể được phát triển từ ý tưởng của GD tuỳ thuộc vào việc lựa
chọn dỡ liệu huấn luyện và thứ tự cập nhật Thuật toán SGD dựa trên ý tưởng thay vi
tính toán gradient dựa trên toàn bộ tap dữ liệu, ta chỉ tính toán gradient dựa trên một
mẫu dữ liệu ngẫu nhiên (một phan của tập dữ liệu) - tức là cập nhập X từ một điểm
dữ liệu huấn luyện ngẫu nhiên, giúp tăng tốc độ hội tụ so với Gradient Descent truyềnthống
Stochastic Gradient Descent (SGD) là một phương pháp tối ưu hóa phô biến vớinhiều ưu điểm đáng kể, đặc biệt là trong các bai toán có độ phức tạp lớn Một trongnhững ưu điểm của SGD là hiệu quả khi làm việc với tập dit liệu lớn Thay vì cần xử
lý toàn bộ dit liệu như trong Gradient Descent truyền thống thì SGD chỉ thực hiệncập nhật tham số sau mỗi mẫu đơn lẻ, điều này giúp quá trình học diễn ra nhanh hơn.Đồng thời, tính chất ngẫu nhiên trong cập nhật của SGD giúp mô hình tránh được cáccực tri địa phương (local minima), từ đó có khả năng tìm ra các điểm cực tiểu tốt hơntrong không gian tham sé, điều này đặc biệt hữu ích khi tối ưu hóa các hàm phi tuyến
và không lỗi Ngoài ra, SGD còn thích ứng tốt với các luồng dữ liệu liên tục, nhờ khả
năng cập nhật liên tục sau mỗi quan sát mới, làm cho nó trở thành lựa chọn lý tưởng
cho các ứng dụng thời gian thực [23].
Tuy nhiên, SGD cũng tồn tại một số nhược điểm cần được khắc phục Sự biếnđộng lớn trong quá trình học do mỗi lần cập nhật chỉ dựa trên một mẫu dữ liệu duynhất có thé dẫn đến sự thay đổi không 6n định trong gradient và các tham số mô hình
Việc chon learning rate phù hợp cũng là một thách thức, khi learning rate quá nhỏ
dẫn đến học chậm, còn learning rate quá lớn có thé gây ra sự dao động mạnh và khônghội tụ được đến cực tiêu toàn cục Hơn nữa, SGD dé bi mắc ket tại các điểm yên ngựa
(saddle points), nơi gradient gần bằng 0 ở mọi chiều, làm chậm quá trình hội tụ hoặc
khiến SGD không thé tìm được cực tiêu tốt hơn Cuối cùng, sự không 6n định trong
19
Trang 29việc cập nhật tham số có thé gây khó khăn khi xử lý các hàm mắt mát phức tạp, khiến
các tham số dao động mạnh và khó 6n định trong quá trình huấn luyện [23]
3.1.3 PassiveAggressive
Online Learning Algorithms là một nhóm các thuật toán xử lý dữ liệu theo trình
tự Trong phương pháp này, một thuật toán nhận một đầu vào, đưa ra dự đoán, sau đó
nhận phản hôi về độ chính xác của dự đoán đó Phản hồi này được sử dụng dé cập
nhật mô hình cho các dự đoán tương lai Đặc điểm chính của online learning là thuật
toán cập nhật mô hình một cách tuần tự khi dữ liệu mới xuất hiện, thay vì huấn luyện
lai từ dau trên toàn bộ tập di liệu mỗi lần.
Thuật toán Passive Aggressive (PA) là một họ các thuật toán hoc online dựa
trên margin, được thiết kế để giải quyết nhiều nhiệm vụ dự đoán khác nhau bằng cách
cập nhật mô hình một cách tức thời sau mỗi lần quan sát dữ liệu mới Cơ sở lý thuyết
của PA dựa trên việc duy trì sự cân bang giữa việc hoc hỏi từ các mau mới va giữ cho
mô hình hiện tại không thay đổi quá nhiều Điều này được thực hiện thông qua một
bài toán tối ưu hóa có rang buộc, dam bao rang su cap nhat chi dién ra khi can thiét
dé sửa lỗi dự đoán hoặc duy tri margin tối thiêu
Cu thé, đối với bài toán phân loại nhị phân, hàm mat mát (hinge loss) được sửdụng để đánh giá mức độ sai lệch của dự đoán so với nhãn thực tế Hàm mất mát này
được định nghĩa như sau:
I(w; (x; y)) = max(0.1 — y * (w- x) (10)
Dựa trên hàm mất mát này, bài toán tối ưu hóa của PA được biểu diễn dưới
dạng:
Wear = argminyep2 : llw — w;||Ÿ s - t - law; (x;; y¿)) = 0 (11)
Trong đó, w, là vector trọng số của mô hình tai thời điểm ¢, x, là vector đặctrưng của mẫu dữ liệu tại thời điểm ¿, y, là nhãn thực tế của mẫu dữ liệu tại thời điểm
t, nhãn này có thể là -1 hoặc +1 trong bài toán phân loại nhị phân
20
Trang 30Giải pháp của bài toán tối ưu hóa trên dẫn đến công thức cập nhật trọng số:
Wes = We + CV eXt (12)
lt
IIxell?
Trong đó, £, là hệ số cập nhật được tinh bằng: t, =
Dé điêu chỉnh mức độ "aggressive" của quá trình cập nhật, có hai biên thê của
thuật toán PA được đề xuất:
ft — mí tt
e PA-II: t, = min (« ait) (14)
Trong đó, C là tham sô điêu chỉnh mức độ "aggressive" của thuật toán, giúp cân băng giữa việc học từ dữ liệu mới và việc git nguyên mô hình hiện tại.
Quy trình cập nhật của thuật toán PA cho phân loại nhị phân như sau:
thể của nó đã chứng tỏ tính hiệu quả trong nhiều ứng dụng học máy, từ phân loại
nhị phân, phân loại đa lớp, hồi quy đến dự đoán chuỗi thời gian
21
Trang 313.1.4 XGBoost
Ensemble Learning là một kỹ thuật trong học máy mà ý tưởng cơ bản là kết hợpnhiều mô hình học máy cơ bản (gọi là base learners) dé tạo ra một mô hình tổng hợpmạnh hơn Thay vì dựa vào một mô hình duy nhất, Ensemble Learning sử dụng sự đadạng của nhiều mô hình khác nhau dé cải thiện độ chính xác, độ tin cậy và ôn định
của dự đoán Có nhiều cách tiếp cận khác nhau trong Ensemble Learning, bao gồm
Bagging, Boosting và Stacking Trong đó, Boosting là một trong những kỹ thuật Ensemble giúp làm giảm giá tri bias.
Boosting hoạt động bằng cách xây dựng một chuỗi các mô hình học cơ bản, mỗi
mô hình được huấn luyện đề khắc phục những sai sót của mô hình trước đó Quá trìnhnày được lặp lại nhiều vòng, mỗi lần tao ra một mô hình mới dé bổ sung vào tập hợp.Cuối cùng, tất cả các mô hình trong tập hợp sẽ được kết hợp lại, tạo ra một mô hìnhtổng hợp có khả năng dự đoán chính xác hơn nhiều so với mô hình cơ bản đơn lẻ.Boosting giải quyết bài toán tối ưu sau:
Thay vì tim cùng một lúc tất cả các giá trị C,,W, để đạt được nghiệm tối ưu
toàn cục, Boosting sẽ tìm nghiệm cục bộ sau khi thêm từng mô hình weak learner
mới vào chuỗi dé dan tiến tới nghiệm tối ưu toàn cục Công thức sau:
mứnc,w„L,W„_ + CrWy), với Wn_+ = XI =1 CNM (16)
Một biến thé nâng cao của Boosting là XGBoost (Extreme Gradient Boosting),
là một giải thuật được xây dung dựa trên gradient boosting Được cai tiễn về mặt tối
22
Trang 32ưu thuật toán, sự kết hợp hoàn hảo giữa sức mạnh phần mềm và phần cứng, giúp đạtđược những kết quả vượt trội cả về thời gian training cũng như bộ nhớ sử dụng.
3.2 Các thuật toán học sâu
3.2.1 LSTM
Kiến trúc bộ nhớ dài ngắn hạn — Long short-term memory (LSTM) là một môhình RNN được phát triển bởi như một giải pháp cho vấn đề về gradient khi cập nhậttrọng số thông qua quá nhiều và hàng loạt các điểm liền kề trước đó trong chuỗi Cau
trúc cơ bản của LSTM bao gồm 3 công chính: Cổng đầu vào (Input Gate) - kiểm soát
luồng thông tin mới được đưa vào trạng thái tế bao; Cong quên (Forget Gate) - kiếmsoát thông tin cần được giữ lại hay bỏ đi từ trạng thái tế bào trước đó; và Công đầu
ra (Output Gate) - Kiểm soát thông tin được đưa ra làm đầu ra của LSTM Các cổngnày đóng vai trò quan trọng trong việc điều khiến luồng thông tin cần thiết cho quá
trình dự đoán trong chuỗi dữ liệu đầu vào.
he - Output
Cell state Next cell state
hes CÓ)
Hidden state Next hidden state
Inputs: Outputs: Nonlinearities: Vector operations:
Scaling of
X_ ) Current input CC, ) New updated -Ơ Simoi layer x iRoiastiodiot” memory
Tanh layer +
Cà.) Memory from) Current out
SỬ tast LSTM unit Ggy Currenf output
Output of last Bias
hes LSTM unit k °
Hình 3.2.1: Minh hoa kiến trúc LSTM [24]
Dựa vào kiến trúc được minh hoạ ở Hình 3.2.1.1 có thể thấy rằng, đầu vào của
khối LSTM bao gồm trạng thái ẩn từ bước thời gian trước đó h¿_; va đặt trưng đầuvào x, Những đầu vào này được kết hợp với trạng thái tế bao từ bước trước C,_, dé
23
Trang 33quyết định nên giữ lại hay phải quên những thông tin không thực sự quan trọng (cổngquên) Tiếp theo, LSTM sẽ quyết định những thông tin mới nào cần được lưu vàotrạng thái tế bào hiện tại C, bang cách sử dụng hàm sigmoid dé xác định những thànhphan mới quan trong, sau đó kết hợp với giá trị đầu vào đã được biến đổi bang hàmtanh (công đầu vào) Cuối cùng, LSTM sẽ quyết định dau ra h, dựa trên trạng thái
tế bào hiện tại Œ,, thông qua việc sử dụng hàm sigmoid dé xác định những thành
phan quan trọng cần giữ lại (công đầu ra).
3.2.2 CNN
Mạng Thần Kinh Tích Chập (Convolutional Neural Network - CNN) là một môhình học sâu đặc biệt, được phát triển dựa trên mạng nơ-ron nhân tao CNN ban đầuđược thiết kế dé thực hiện nhiệm vụ phân tích ảnh Đầu vào của CNN là một ma trậnchứa thông tin thô của ảnh Sau đó, một loạt các bộ lọc sẽ được áp dụng lên ảnh đểbắt các vùng, các đặc trưng quan trọng trong ảnh Từ đó, đầu ra của mạng có thé phânloại ảnh vào các lớp phù hợp với bài toán So với các thuật toán phân loại ảnh truyềnthống, CNN có yêu cầu tiền xử lý thấp hơn nhiều Trong khi các phương pháp truyềnthống cần thiết kế các bộ lọc một cách thủ công, CNN có khả năng tự học các bộ lọc
để rút trích đặc trưng ảnh Nhờ vào cấu trúc và cách hoạt động đặc biệt này, CNN đãtrở thành một trong những mô hình học sâu phô biến và hiệu quả trong các bài toán
liên quan đên xử lý ảnh.
Mang thần tích chập được đánh giá là một trong những mang học sâu phổ biến
và tiên tiên hiện nay Mạng được câu tạo từ các thành phân sau:
+ Lớp Tích Chap (Convolution Layer — Conv): Mục tiêu của lớp Conv là trích
xuất các đặc trưng cấp cao từ thông tin thô của đầu vào, thông qua việc sử dụngcác bộ lọc (filter/kernel) Đặc biệt, mạng thần kinh tích chập không chỉ bao gồmmột lớp tích chập đơn lẻ Thông thường, lớp tích chập đầu tiên sẽ chịu tráchnhiệm nắm bắt các đặc trưng cấp thấp như góc cạnh, màu sắc, hướng gradient,
Khi thêm các lớp sau đó, kiến trúc của mạng sẽ được thiết kế dé dần thu thập
24
Trang 34các đặc trưng cấp cao hơn Nhờ vào cách tiếp cận này, mạng thần kinh tích chập
có thê học được những thông tin và hiéu biết sâu về mặt ý nghĩa, tương tự như
cách con người hiệu và nhận thức về thế giới xung quanh
Lớp Gộp (Pooling Layer - Pool): Mục đích chính của lớp Pooling là tăng tính
bat biến không gian (spatial invariance) cho mạng, giúp mạng có thé học được
các đặc trưng quan trọng mà không phụ thuộc quá nhiều vào vị trí chính xác củachúng trong ảnh đầu vào Ngoài ra, lớp Pooling còn có tác dụng làm giảm tínhtoán và thời gian huấn luyện mạng Thông qua một phép downsampling, lớpPooling giảm kích thước của đữ liệu đầu vào, từ đó giảm nhu cầu về tài nguyên
tính toán và rút ngắn thời gian huấn luyện mạng mà vẫn giữ được các đặc trưng
quan trọng, đảm bảo rằng mạng vẫn có thể học được các thông tin cần thiết Cónhiều loại phép Pooling khác nhau như Sum Pooling, L2 Pooling, Max Pooling
va Average Pooling Trong đó, Max Pooling va Average Pooling là hai dang
phép Pooling phố biến nhất được sử dung trong các mô hình CNN
Lớp Kết Nói Day Đủ (Fully Connected Layer - FC): Đầu vào là dit liệu đã đượclàm phăng (flattened), trong đó tất cả các neuron trong lớp hiện tại sẽ được kếtnối với tất cả các neuron trong lớp trước đó Trong mô hình CNN, sau khi tríchxuất các đặc trưng quan trọng thông qua các lớp Tích Chập và lớp Gộp, dữ liệu
sẽ được đưa vào lớp FC Mục đích của lớp này là đưa ra kết quả cuối cùng phù
hợp với bài toán đã đặt ra ban đầu Lớp EC có thể bao gồm một hoặc nhiều lớp,tuỳ thuộc vào độ phức tạp của bài toán Nó giúp tổng hợp và kết hợp các đặc
trưng đã được trích xuât ở các lớp trước đó đê đưa ra dự đoán cuôi cùng.
INPUT CONVOLUTION + RELU POOLING CONVOLUTION + RELU POOLING FLATTEN Ne pee €ONNECTEo 7
TY a
FEATURE LEARNING CLASSIFICATION
Hình 3.2: Hình minh họa kiến trúc CNN [25]
25
Trang 35Với tính năng ưu việc trong trích xuất và xử lý thông tin, mạng thần kinh tíchchập cũng có thé được sử dụng dé phân tích các miền dữ liệu khác như là văn banhoặc dit liệu số dạng chuỗi thời gian Đối với dang di liệu hình ảnh, bộ lọc được sử
dụng là một lưới 2 chiều, trong khi đó, lưới 1 chiều thường được sử dụng cho dạng
dữ liệu như văn bản hoặc chuỗi thời gian.
3.3 Transfer Learning
Transfer learning, hay học chuyền giao, là một kỹ thuật học máy cho phép tậndụng kiến thức đã hoc được từ một nhiệm vụ này dé giải quyết một nhiệm vụ khác.Thay vì huấn luyện một mô hình hoàn toàn mới từ đầu cho mỗi nhiệm vụ, transferlearning tận dụng lại các trọng số đã được huấn luyện trước đó của một mô hình lớntrên một tập dữ liệu lớn, sau đó điều chỉnh lại để phù hợp với nhiệm vụ mới Điều
này giúp tiết kiệm đáng kể thời gian và tài nguyên tính toán, đồng thời cải thiện hiệu
suất của mô hình, đặc biệt khi lượng dữ liệu cho nhiệm vụ mới là hạn chế
Cơ chế hoạt động của transfer learning dựa trên giả định rằng các đặc trưnghọc được từ một nhiệm vụ có thê hữu ích cho các nhiệm vụ liên quan Quá trìnhtransfer learning thường bao gồm hai giai đoạn chính:
e Pre-training: Huấn luyện một mô hình lớn trên một tập dữ liệu lớn dé học các
đặc trưng chung.
e_ Fine-tuning: Điều chỉnh lại các lớp cuối cùng của mô hình pre-trained dé phù
hợp với nhiệm vụ mới Các kỹ thuật transfer learning phô biến bao gồm:
e Feature extraction: Sử dung các lớp đặc trưng của mô hình pre-trained như là
đầu vào cho một mô hình mới
e Fine-tuning: Điều chỉnh toàn bộ hoặc một phần của mô hình pre-trained trên
dt liệu mới.
e Multi-task learning: Huan luyện một mô hình dé thực hiện nhiều nhiệm vụ
cùng một lúc.
26
Trang 36CHƯƠNG 4 THỰC NGHIỆM, ĐÁNH GIÁ VÀ HƯỚNG CẢI TIỀN
4.1 Bộ dữ liệu
4.1.1 Bộ dữ liệu MIT BIH Arrhythmia
Bộ dữ liệu MIT BIH Arrhythmia [6] gồm 48 tập dữ liệu ECG (records) từ 2
kênh (V1 ghi lại sự di chuyên của đòng điện trong tim từ góc nhìn trước, MLII ghi
lại sự di chuyển của dòng điện trong tim từ góc nhìn nằm ngang của tim) kéo dai
trong thời gian 30 phút Những tập dữ liệu này được thu thập từ 47 bệnh nhân được nghiên cứu bởi Phòng thí nghiệm BIH Arrhythmia từ năm 1975 - 1979 Trong đó, có
23 tập được chọn ngẫu nhiên từ tập bản ghi ECG được thu thập trong 24 giờ từ một
nhóm bệnh nhân nội trú (khoảng 60%) và bệnh nhân ngoại trú (khoảng 40%) tại Bệnh
viện Beth Israel ở Boston; các tập dữ liệu còn lại được chọn từ cùng tập bao gồm cácrồi loạn nhịp tim ít phô biến
Tất cả các dữ liệu ECG trong cơ sở dữ liệu MIT-BIH Arrhythmia đã đượcchuyền đổi thành dạng số dé lưu trữ và phân tích Quá trình số hóa này đã ghi lai ditliệu ECG với tốc độ thu thập là 360Hz (cu thé trong mỗi giây thu được 360 mẫu trênmỗi kênh) Dé dam bảo tính chính xác, mỗi bản ghi đã được đánh dấu chú thích nhãnbệnh bởi ít nhất hai bác sĩ tim mạch (Hình 4.1) Cụ thé Hình 4.1 bên dưới, 4.1a làbản ghi nhịp tim của một người bình thường, 4.1b là bản ghi nhịp tim bat thường của
a Tin hiệu nhịp tim bình thường b Tin hiệu nhịp tim bat thường
Hình 4.1: Một số hình anh của tín hiệu điện tâm đồ được ghi lai
27
Trang 374.1.2 Bộ dữ liệu MIT BIH Normsal Sinus Rhythm
Bộ dữ liệu MIT-BIH Normal Sinus Rhythm [7] là tập dữ liệu gồm các trườnghợp ghi nhận trong thời gian dài về ECG của những người được giới thiệu đến Phòngxét nghiệm Rối loạn nhịp ở Bệnh viện Beth Israel ở Boston (hiện nay là Trung tâm
Y tế Beth Israel Deaconess) Các đối tượng trong bộ dit liệu không có bat kỳ rối loạnnhịp nào đáng ké và bệnh lý về tim trước đó; bao gồm 5 nam giới, trong độ tuôi từ 26đến 45, và 13 phụ nữ, trong độ tuổi từ 20 đến 50 Bộ dữ liệu này được sử dụng để
nghiên cứu và phân tích nhip tim bình thường (normal sinus rhythm) Bộ dữ liệu cung
cấp thông tin về các bản ghi ECG trong khoảng thời gian dài của các tình nguyện
viên.
4.2 Xử lý dữ liệu
Dữ liệu trong các bản ghi được xử lý lần lượt theo các bước sau: (1) Trích xuấtkhoảng R-R; (2) Thêm song phức QRS; (3) Đưa về tần số 125 Hz; (4) Chuan hóa ditliệu; (5) Xử lý đữ liệu thiếu; (6) Phân loại nhịp tim Luéng xử lý dữ liệu tong quan
được trình bày ở Hình 4.2.1.
Trích xuất Thêm sóng Đưa về tan ` | Chuan hóa Xử lý dữ liệu Phân loại
khoảng R-R phức QRS 125 Hz dữ liệu thiêu nhịp tim
Hình 4.2: Luồng xử lý dữ liệu
Chi tiết các bước xử lý như sau:
— Bước 1: Trích xuất dữ liệu Chia nhỏ bản ghi được từ bệnh nhân thành các
bản ghi nhịp riêng lẻ chứa khoảng R-R.
— Bước 2: Thêm sóng phức QRS Từ mỗi bản ghi nhịp tim riêng lẻ, thực hiện
mở rộng lấy sóng phức QRS bằng cách thêm vào 40 lần đọc của bản ghi nhịptim tiếp theo
28
Trang 38# Append some extra readings from next beat.
beats[idx] = np.append(beats[idx], beats[idx+1][:40])
Bước 3: Đưa về tần số 125 Hz Thực hiện chuyển đổi mau từ tan số 360 Hzsang 125 Hz Việc đưa về tan số 125 Hz giúp giảm khối lượng dữ liệu và tăngtốc quá trình tính toán, đồng thời vẫn giữ được các đặc trưng quan trọng trong
tín hiệu ECG.
# Resample from 360Hz to 125Hz
newsize = int((beats[idx].size * 125 / 360) + 0.5)
beats[idx] = signal.resample(beats[idx], newsize)
Bước 4: Chuẩn hóa dữ liệu Dua các giá trị trong bản ghi về khoảng [0 —1]
Bởi vì, giá trị dữ liệu được giới hạn trong một khoảng nhất định gitip viéc huan
luyện mô hình máy học hội tụ nhanh hon, và mô hình sau cùng cũng sẽ dua ra
kết quả dự đoán tốt hơn
# Normalize the readings to a 0-1 range for ML purposes.
beats[idx] = (beats[idx] - beats[idx].min()) / beats[idx].ptpQ
Bước 5: Xử ly dữ liệu thiếu Dé dam bảo độ dài đồng nhất cho các bản ghinhịp tim, chúng được đệm thêm giá tri 0 ở cuối cho đến khi đạt độ dài tiêu
chuẩn là 187 giá trị Đồng thời, các bản ghi có độ dài vượt quá giới hạn này sẽ
Trang 39zerocount = 187 - beats[idx].size
beats[idx] = np.pad(beats[idx], (0, zerocount), ‘constant’, constant_values=(0.0, 0.0))
— Bước 6: Phân loại nhịp tim Phân loại nhịp tim từ các dữ liệu chú thích của
tập dữ liệu và được thêm vào cuối mỗi bản ghi nhịp tim Mỗi hàng sẽ có chínhxác 188 giá trị Đồng thời, các bản ghi nhịp tim không được phân loại sẽ bị
loại bỏ.
# Append the classification to the beat data.
eats[idx] = np.append(beats[idx], catval)
# Remove first and last beats and the ones without classification.
beats = np.delete(beats, beatstoremove)
4.3 Chia dữ liệu
4.3.1 Thống kê dữ liệu
Trong quá trình huấn luyện mô hình, chúng tôi áp dụng phân loại giữa các bệnhnhân (inter-patient) Điều này có nghĩa là chúng tôi chia nhỏ dữ liệu thành hai tệp:tệp huấn luyện và tệp kiểm tra Phân chia dữ liệu thành tệp huấn luyện và tệp kiểmtra theo cách này giúp đánh giá khả năng tổng quát hóa của mô hình
+ Trong tệp huấn luyện, chúng tôi có các bệnh nhân với các ID sau: 100, 101,
Dựa vào thống kê phân phối nhãn trong tập huấn luyện (Hình 4.3.1), bộ dữ lieu
MIT-BIH có sự mất cân bằng trong dữ liệu giữa các lớp Đặc biệt, lớp 0 và lớp 4
chiếm tỉ lệ lớn nhất trong tập huấn luyện
30
Trang 404.3.2 Chia mẫu học giám sát
Trong bài toán dự báo chuỗi thời gian, các đặc trưng được đưa vào mô hình theo
từng chuỗi với một số lượng điểm dữ liệu nhất định, được gọi là bước thời gian
(time-step) Một mẫu đữ liệu học giám sát cho dự đoán chuỗi thời gian bao gồm t điểm dữliệu đặc trưng và ƒ điểm dữ liệu mục tiêu, trong đó £ là số lượng bước thời gian của
t điểm đữ liệu đặc trưng, và ƒ là số điểm dữ liệu mục tiêu được dự đoán trong tương
lai Nếu dit liệu gốc có N điểm dữ liệu (tương đương với N nhịp R-R), thì số lượng
mẫu dữ liệu học giám sat được tạo ra lan = N — ƒ — t + 1 Việc chia các mẫu dữ
liệu được thực hiện theo cách cuộn dan theo chiều thời gian, như Hình 4.4 minh họa
voit =5, ƒ = 1 và số lượng mẫu học dit liệu „ = 15 — 5— 1+1 = 10.
31