Việc tiếp cận và hiểu được kiến thức cơ bản về ứng dụng mô hình học sâu trong thực tế thông qua quá trình nghiên cứu và thực nghiệm các phương pháp phân lớp giai đoạn giấc ngủ đã đem đến
Trang 1ĐẠI HỌC QUOC GIA TP HO CHÍ MINH
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
KHOA HỆ THÓNG THÔNG TIN
TAN THUY TRANG - 19522384 NGUYEN THI HONG - 19521550
KHOA LUAN TOT NGHIEP
PHAN LOP CAC GIAI DOAN GIAC NGU
SU DUNG PHUONG PHAP HOC SAU
SLEEP STAGES CLASSIFICATION
USING DEEP LEARNING METHODS
KY SU NGANH HE THONG THONG TIN
GIANG VIEN HUONG DAN
ThS DUONG PHI LONG
TP HO CHi MINH, 2023
Trang 2LỜI CÁM ƠN
Chúng em xin gửi lời cảm ơn tới ThS Duong Phi Long đã hướng dan tan
tình để chúng em có được định hướng tốt nhất, xác định được đúng dé tài, mục tiêu,quy trình cần thiết dé xây dựng và hoàn thiện khóa luận này Bên cạnh đó, Thay còngiúp chúng em chỉnh sửa cũng như bổ sung những thiếu sót trong quá trình thực
hiện.
Xin được cảm ơn quý Thầy Cô Khoa Hệ thống Thông tin, Trường Đại họcCông nghệ Thông tin DHQG-HCM đã tạo điều kiện về cơ sở vật chất, hệ thống thưviện, tài liệu cũng như kiến thức đã hỗ trợ chúng em trong suốt quá trình nghiêncứu, tìm hiểu và làm khoá luận Cảm ơn hội đồng chấm khoá luận đã đưa ra nhiềugóp ý dé giúp hoàn thiện đề tài
Cảm ơn gia đình, người thân đã tạo động lực, điều kiện để chúng em có thể
hoàn toàn tập trung và nỗ lực Cảm ơn bạn bè đã giúp đỡ, hỗ trợ chúng em trong
quá trình thực hiện khoá luận này Quá trình làm khóa luận đã cung cấp cho chúng
em những kiến thức, kinh nghiệm và kỹ năng học tập, nghiên cứu quan trọng Đây
là nền tảng vững chắc cho sự nghiệp tương lai để chúng em học hỏi và áp dụng vào
công việc của mình sau này
Một lần nữa xin gửi đến Thầy Cô, bạn bè, người thân lời cảm ơn chân thành
và tốt đẹp nhất!
Nhóm sinh viên thực hiện
Trang 3CHUONG 2 CƠ SỞ LÝ THUYET VA CÁC NGHIÊN CỨU LIÊN QUAN 92.1 Cac khái niệm về sóng não và các giai đoạn của giấc ngủ - 9
2.1.1 Sóng não và điện não đồ - + + ©x++x++EE£EEEEEEEEEEEEEEEEEEEErrrrrkervee 92.1.2 Các giai đoạn của giẤc ngủ -c¿ccc¿©2cc 2c 2ck2EeEkEEkrErkrrkrerkrerrerrree 112.1.3 Cách phân lớp các giai đoạn của giấc ngủ -¿©-s+cce+cxccreeee 14
2.2 Các hướng tiếp cận liên quan đến bài toán . -sss s2 5s se 16
2.2.1 Hướng tiếp cận theo phương pháp học máy truyền thống 172.2.2 Hướng tiếp cận dựa trên học sâu - << << +33 *++22esexessseexe 19
CHƯƠNG 3 MOT SO PHƯƠNG PHAP PHAN LỚP CÁC GIAI DOAN
GIÁC NGỦ DỰA TREN HỌC SAU 2-2-2 se©se©ssessesseessesses 23
3.1 DeepSleepiNe( o- cọ cọ In 0000900 23
3.1.1 Kiến trúc tổng quan - ¿+ +++k+Ek+EE2EEEEEEEEEEE2E121171 712211211 ExrxeeU 23
3.1.2 Huấn luyện và kết quả ¿- 2 2 £+E+E+EE£EEEEEEEEEEEEEE2E12171 212121 xe, 28
3.2 TinySleepÌNet co cọ Họ HH TH 00000000990 30
3.2.1 Kiến trúc tổng quan - :- + 2+S£+E+E£EE£EEEEEEEEEEEEEE2E12112171 21212 xe, 303.2.2 Huấn luyện và kết quả -¿- + + ++E£+E£+EE£EEtEEEEEEEEEEEEEEECrErrrkrrkerreee 33
Rs Pa: 109 | To) (213 9 34
3.3.1 Kiến trúc tổng Quan sceccecceeccsscessessessesssessessessesssessessessesssssessessessessesseesees 34
3.3.2 Huấn luyện và kết qua.c ceccececcccssessesessesessssessessessessessesessssesseesessesseseesees 38
3.4 TS-TCC SH HH TH THỌ THỌ TH TH TH HH 00100000900 40
3.4.1 Kiến trúc tổng quan -¿-©2¿©+++2++2E++EE+SEEEEEEEEEEEEEEEEEEEEErkerkrrrrees 40
Trang 43.4.2 Huấn luyện và Kết quả - 2-2 ©++E+E£EE£EEEEE2EEEEEEEEEEEEEErrkrrkerkeee 43
4.5 CA-TCCC HH HH HH HỌC HH HH 0000000000 44
3.5.1 Kiến trúc tổng quan ¿- 2+ ++22+2E+£EE+2EEE2EEE2EEE2E22E21.21eEkcrrree 443.5.2 Huấn luyện và kết quả ¿- ¿+ ++++2x++Ek2EEtEEESEESEkrrkkrrkrerkrrrrees 46CHUONG 4 THỰC NGHIỆM VÀ ĐÁNH GIÁ ° 2 5s ss©sses 494.1 Giới thiệu về bộ dữ liệu s-s<sssse+s+ssessesserserserssrrserssrsser 494.2 Tiền xử lý dữ liệu và phương pháp thực nghiệm - 51
4.2.1 Tiền xử lý đữ LGU oe eeceeccecccccccscssessecsessesssessessessesssessessessesssesseesessessseeseeseess 51
4.2.2 Phương pháp thực nghiệm cc ecceeseceseesceeseeesecseeeeeeseeeeeeseeeeeeseeeneesees 53
4.3 Các tiêu chí đánh giá œ- 5< 5< KH HH 90 00106 33
4.4 Kết quả thực nghiệm, đánh giá và bàn luận . -s-s- s2 ssss 55
4.4.1 Kết qua Chung o ecceccscesccsessesssssessssvesessvesessessessssvesessessessessesucssssessesseeseesease 554.4.2 Kết quả của từng giai doath ccccceccccccesesssessessessesssessessessesssessessessessseeseeseess 57CHƯƠNG 5 THỨ NGHIEM CAI TIEN VÀ ĐÁNH GIA KET QUÁ 625.1 Những quan sát và thử nghiệm cải tiem esssessssesescscsecsccecsecsecescesees 625.2 Thực nghiệm, kết quả và đánh giá các thử nghiệm -. 65
5.2.1 Kết quả chung 2- +5£22+S2+E tk EEEEEE121121121121 7111111 crxe, 655.2.2 Kết quả từng giai đOạn ¿5c S2 1S E19 1511211211211 11 11111110 68CHƯƠNG 6 XÂY DỰNG CÔNG CỤ PHAN LỚP CÁC GIAI DOAN GIÁC
NGUpisssssssssssssssssssssssesssssssessssssssssssssssssssnssssssssesssssssssssssssessssssesssssssesssssssesssssssesesssseees 72
6.1 Mô tả công CỤ G5 cọ Họ Họ TH 0.0 00006 0.0 72 6.2 Môi trường cài đặt và các thư viện sử dụng - s55 55s sss< se 73
6.2.1 Python occ a 73
5/2/86: aa 73
6.2.3 CHart.jS 7 74
6.2.4 Anaconda 4.5.1 nh ẻ ố 74
6.3 Một số màn hình của công CỤ °-s- se se©ssssesseessvssessesserssrssse 75
6.3.1 Chức năng phân tích hiệu quả phân lớp của các mô hình - 76
6.3.2 Chức năng phân lớp, dự đoán các giai đoạn giấc ngủ trên dit liệu thô 81
Trang 5CHƯƠNG 7 KET LUẬN VA HUONG PHAT TRIÊN - ° 83
7.1 Kết luận scsccesccsersersetesEsstrsersereettstrserssresrsserserssrssree 837.2 Hướng phát triỄn s- << se se se sEsessesseseeseesersersersesee 85TÀI LIEU THAM KHẢO 2-2 se ©ss£ss©Ss£Ess£EsseEssexserssersserssre 86
3:008009/2007 90
Trang 6DANH MỤC CÁC HINH VE, DO THỊ
Hình 1.1: Minh họa một epoch 30 giây cua tín hiệu EEG Fpz — CZ 4
Hình 1.2: Minh họa 10 epochs của tín hiệu EEG Fpz — Z ©+-<<+++e++ 5
Hình 1.3: Minh hoạ kết quả phân lớp giai đoạn giấc ngủ của một epoch 30 giây 5Hình 1.4: Minh hoạ kết qua phân lớp giai đoạn giấc ngủ của đoạn 10 epoch 6Hình 2.1: Biểu diễn các loại sóng não [ 16] -¿ 2¿- ¿©++2+++x++z++zx++zxezrxesrxez 9Hình 2.2: Các vị trí đặt điện cực theo chuẩn quốc tế 10 — 20 [17] -. - 10Hình 2.3: Chu kỳ giấc ngủ [ 1 §] - 2-2 2 2+ +E£EE#EEEEESEEEEEEEEEEEEErkerkerkerkrree 12Hình 2.4: Tín hiệu điện não đồ cho các giai đoạn khác nhau của giấc ngủ [20] 16Hình 2.5: Kiến trúc mang nơ-ron nhân tạo [22 ] - «+ +£++sk£+seexeseesssees 20Hình 3.1: Kiến trúc tong quan của DeepSleepNet [I 1] ¿ -¿-sz5sscs+ 24Hình 3.2: Kiến trúc tong quan của TinySleepNet [12] -¿- ¿525552 3lHình 3.3: Kiến trúc tong quan của AttnSleep [13] -: -¿ssz2cx+zs+zxesc+z 35
Hình 3.4: Kiến trúc của Multi-head attention (MHA) [13] -.- c2 5s szs+s+z 38
Hình 3.5: Kiến trúc tông quan của TS-TCC [ 14] 2-2 2 2+s££+ezk+£x+rzrszsez 41Hình 3.6: Kiến trúc của mô hình Transformer được sử dung trong mô-đun Temporal
Contrasting [ Í4] - c1 3311123011930 11 1H TH HH Họ ng rry Al
Hình 3.7: So sánh mô hình TS-TCC với các phương pháp khác [14] 44
Hình 3.8: Kiến trúc tng quan của CA-TCC [ 15] - 2-2 2 2+s££xezx+zx+rzrszsez 45
Hình 3.9: a) So sánh không giám sát (Unsupervised contrasting) và b) So sánh có
giám sát (Supervised COTTASfIT)) cv 1T TH kg HH kg ky 46
Hình 3.10 : So sánh CA — TCC với TS-TCC và chế độ huấn luyện giám sát với bộ
dit ligu Fault Diagnosis (FD) [15] 0: 48
Hình 3.11: Ap dung tăng cường dif liệu va so sánh với TS — TCC [15] 48
Hình 4.1: Minh họa tín hiệu EEG Fpz-cz, EEG Pz-oz, EOG và EMG của bộ dữ liệu
— 50
Hình 4.2: Thông tin các kênh dữ liệu dưới dang CSV - 52-55 +S<<++ss+sssss 50
Hình 4.3: Biểu đồ so sánh kết quả giữa các phương pháp -: -: -5- 57Hình 4.4: Kết quả Fl-score của các phương pháp cho từng giai đoạn giấc ngủ 60
Trang 7Hình 4.5: Kết quả G-mean của các phương pháp cho từng giai đoạn giấc ngủ 61
Hình 5.1: So sánh hàm kích hoạt ReLU và GELU [50] . -<<+ 64
Hình 5.2: Biéu đồ so sánh Accuracy của các phương pháp khi sử dụng ReLU va
Hình 5.6: Biểu đồ so sánh FI-score cho từng giai đoạn giấc ngủ của TS-TCC khi sử
dụng ReLU và GIELƯÙ - - c +25 122 1221119931191 1 9111111111 HH ng rry 70
Hình 6.1: Sơ đồ usecase của công cụ phân lớp giai đoạn giấc ngủ - 73
Hình 6.2: Giao diện chính của CONG CỤ - 5 <5 3 1311831 E33 ESEEEssesekeseekre 75
Hình 6.3: Giao diện nap file EDF và EDF+ dé phân tích hiệu quả của các mô hình
se BỘ FM ĐÀ TM J < 76 Hình 6.4: Giao diện Kết quả phân lớp giai đoạn giấc ngủ cho 1 epoch 77
Hình 6.5: Giao diện phân tích kết quả phân lớp của các mô hình trên đoạn tin hiệuSONg ZOM 10 2/3 001077.7 Ả ÔỎ 78Hình 6.6: Giao diện phân lớp giai đoạn giấc ngủ với 20 epochs 79Hình 6.7: Giao điện phân lớp giai đoạn giấc ngủ với một file edf 80
Hình 6.8: Giao diện chọn chức năng Dự đoán 5 5c + cs + sstsseereersrrrss 81
Hình 6.9: Giao điện dự đoán giai đoạn giấc ngủ với 1 epoch -:-:s- 82Hình 6.10: Giao diện dự đoán giai đoạn giấc ngủ với 20 epochs 82Hình PL.1: Biểu đồ so sánh Accuracy của các phương pháp khi sử dụng ReLU,
GELU, PReLU và LeakylReLƯU - 6 + 2% 132k 9E ng ng rrệp 91
Hình PL 2: Biểu đồ so sánh W.Avg FI của các phương pháp khi sử dụng ReLU,
GELU, PReLU và LeakylReÌLL - - <1 133119931 13911 9111 9111 1 1n ng kg rưy 91
Trang 8Hình PL.3: Biểu đồ so sánh W.Avg G-mean của các phương pháp khi sử dụng
ReLU, GELU, PReLU và LeakylReLLỦ - -¿- 6 +52 E12 #EEsrrrrkreerkree 92
Trang 9DANH MỤC CÁC BÁNG
Bang 3.1: Kết qua của DeepSleepNet trên các bộ dữ liệu 5-2-2 30
Bảng 3.2: Bảng so sánh kết quả của TinySleepNet và DeepSleepNet 33
Bảng 3.3: So sánh kết quả của AttnSleep với DeepSleepNet trên các bộ dữ liệu 39
Bảng 4.1: Thống kê số lượng epoch của từng giai đoạn trong bộ dữ liệu 52
Bảng 4.2: So sánh giữa các tập dữ liệu huấn luyện, kiểm định và kiểm thử 52
Bảng 4.3: Thống kê số lượng epoch của từng giai đoạn trong mỗi tập dit liệu 52
Bang 4.4: Thông số huấn luyện của các phương pháp - 2-5 s52 53 Bảng 4.5: Kết qua Accuracy, WAvg F1 và WAvg Gm của các phương pháp 55
Bảng 4.6: Confusion matrix và Kết quả trên từng lớp của DeepSleepNet 58
Bang 4.7: Confusion matrix và Kết quả trên từng lớp của TinySleepNet 58
Bang 4.8: Confusion matrix và Kết quả trên từng lớp của AttnSleep 58
Bang 4.9: Confusion matrix và Kết quả trên từng lớp của TS-TCC 58
Bang 4.10: Confusion matrix và Kết quả trên từng lớp của CA-TCC - 59
Bang 5.1: So sánh kết quả của các phương pháp khi sử dung ReLU và GELU 66
Bảng 5.2: So sánh Fl-score từng giai đoạn khi sử dung ReLU và GELU 68
Bang 5.3: So sánh G-mean từng giai đoạn khi sử dụng ReLU và GELU 68
Bang PL.1: Bảng thống kê kết quả thử nghiệm cải tiến với các hàm kích hoạt 90
Trang 10DANH MỤC CAC TỪ VIET TAT
AASM American Academy of Sleep Medicine
Adam Adaptive Moment Estimation
AFR Adaptive feature recalibration
ANN Artificial Neural Networks
Attn Attention
BiLSTM Bidirectional Long Short-Term Memory
CA-TCC Class-Aware Time-Series Representation Learning via Temporal
and Contextual Contrasting CNN Convolutional neural network
EDF European Data Format
EEG Electroencephalogram
EMG Electromyogram
EOG Electrooculogram
FC Fully Connected GELU Gaussian Error Linear Unit
GRU Gated Recurrent Unit
KNN K-Nearest Neighbors KNN
LSTM Long Short-Term Memory
MHA Multi-head attention
MRCNN Multi-resolution convolutional neural network
NN Neural Network ReLU Rectified Linear Unit
SVM Support Vector Machines
TCE Temporal context encoder
TS-TCC Time-Series Representation Learning via Temporal and
Contextual Contrasting
Trang 11TÓM TẮT KHÓA LUẬN TÓT NGHIỆP
Giác ngủ không chỉ đơn thuần là một trạng thái nghỉ ngơi của cơ thể con
người, mà nó còn đóng vai trò quan trọng trong việc duy tri sức khỏe va trạng thái
toàn diện của chúng ta Nó có ảnh hưởng sâu sắc đến mọi khía cạnh của cuộc sống
hàng ngày, bao gồm sức khỏe cả về thê chất lẫn tinh thần Một giấc ngủ đủ và chất
lượng là yếu tố quan trọng để cơ thể phục hồi, tăng cường hệ miễn dịch, cải thiện
chức năng nhận thức và tinh than, và thúc day quá trình học tập và ghi nhớ Nó cũng
đóng vai trò quan trọng trong việc duy trì sự cân bằng năng lượng, giảm stress, và
tái tạo lại cơ thê để chuẩn bị cho một ngay mới
Trong xã hội hiện đại, các vấn đề liên quan đến rối loạn giấc ngủ đa dạng vàphức tạp ngày càng trở nên quan trọng Việc khảo sat và phân tích cấu trúc giấc ngủ
sẽ cung cấp những thông tin quan trọng về loại giấc ngủ, chu kỳ giấc ngủ và sự thayđổi trong các giai đoạn khác nhau Tuy nhiên, phân lớp giai đoạn giấc ngủ thủ công
dang gặp nhiều hạn chế, do đó, cần có giải pháp hữu hiệu dé dự phân lớp giai đoạn
giấc ngủ
Mục tiêu chính của khóa khóa luận tốt nghiệp này là tìm hiểu, nghiên cứu và
sử dụng phương pháp học sâu dé giải quyết bài toán phân lớp giai đoạn giấc ngủ.Nhóm sinh viên đã tìm hiểu, nghiên cứu và thực nghiệm đối với 5 phương pháp học
sâu là DeepSleepNet, TinySleepNet, AttnSleep, TS-TCC và CA-TCC trên bộ dữ
liệu Expanded Sleep-EDF Bộ dữ liệu này bao gồm 153 ban ghi biểu diễn tín hiệu
đa ký giấc ngủ của 78 đối tượng có độ tuổi từ 25 đến 101 tuổi Từ những kết quả
thực nghiệm, chúng em đã thu được những thông tin quan trọng, chi ra những thách
thức chính của bài toán, đề xuất và đánh giá kết quả một số cách thức cải thiện độ
chính xác Qua đó xây dựng công cụ dự đoán giai đoạn giấc ngủ
Việc tiếp cận và hiểu được kiến thức cơ bản về ứng dụng mô hình học sâu
trong thực tế thông qua quá trình nghiên cứu và thực nghiệm các phương pháp phân
lớp giai đoạn giấc ngủ đã đem đến cái nhìn rõ hơn về tầm quan trọng của giấc ngủ
đồng thời mở ra nhiều cơ hội ứng dụng học sâu trong lĩnh vực chăm sóc sức khỏe vànghiên cứu giắc ngủ trong tương lai
Trang 12Chương 1 TONG QUAN DE TÀI
Nội dung chương này trình bay phan đặt van dé, phát biểu tong quan về bàitoán, các thách thức gặp phải và xác định mục tiêu và cuối cùng là bố cục của khóa
luận.
1.1 Đặt vấn đề
Giác ngủ là một nhu cầu quan trọng của cơ thé con người và có ảnh hưởng to
lớn đến mọi khía cạnh của cuộc sống hàng ngày Trong quá trình ngủ, cơ thể đượcphục hồi và tái tạo năng lượng Nó giúp tái tạo tế bào, tăng cường hệ miễn dịch vàkhôi phục sức khỏe cho hoạt động hàng ngày Giấc ngủ đủ thời gian và chất lượngtốt đóng vai trò quan trọng trong sức khỏe Thiếu ngủ hoặc chất lượng giấc ngủ kém
có thé gây mệt mỏi, suy giảm tập trung và làm giảm hệ miễn dịch, góp phần vào
nguy cơ mắc các bệnh tim mạch, tiêu đường, tăng huyết áp và thừa cân [1]
Giấc ngủ cũng có ảnh hưởng lớn đến trạng thái tâm lý và cảm xúc Thiếu ngủhoặc chất lượng giấc ngủ kém có thể gây lo âu, trầm cảm, căng thăng thần kinh vàkhó tập trung Nó cũng ảnh hưởng đến trí nhớ và quá trình học tập Nghiên cứu đãchỉ ra răng giấc ngủ đủ và chất lượng tốt giúp cải thiện khả năng tập trung, ghi nhớthông tin và giải quyết van đề Ngoài ra, giấc ngủ tốt còn có tác động tích cực đến
hiệu suất làm việc và sáng tạo Người có giấc ngủ tốt thường có khả năng tư duy
sáng tạo và ra quyết định tốt hơn Giấc ngủ kém cũng có thể ảnh hưởng đến cânnặng và quản lý cân nặng Thiếu ngủ có thé làm tăng cảm giác đói và ảnh hưởngđến cân bằng hormone liên quan đến cảm giác no Ngoài ra, giấc ngủ không đủ cũnglàm giảm sự tập trung và thời gian phản ứng, góp phần vào nguy cơ tai nạn giaothông và làm giảm hiệu suất công việc [2]
Việc khảo sát và phân tích cấu trúc giấc ngủ cung cấp thông tin quan trọng về
loại giấc ngủ, chu kỳ giấc ngủ, mật độ sóng não và trạng thái thức giấc gián đoạn.Những thông tin này giúp đánh giá chất lượng giấc ngủ, xác định các vấn đề liênquan đến giấc ngủ và cung cấp cơ sở dé đưa ra các phương pháp điều trị và quản lý
phù hợp cho các vân đê giâc ngủ Các nghiên cứu cho thây con người có chât lượng
Trang 13giác ngủ tốt sẽ có sức khỏe và các chức năng của não hoạt động tốt hơn Mặt khác,
thời gian ngủ bị gián đoạn có thể gây ra một số rối loạn giấc ngủ, chăng hạn như
mat ngủ hoặc ngưng thở khi ngủ Các rối loạn giấc ngủ da dang và phức tap đang
trở thành một vấn đề ngày càng quan trọng trong xã hội hiện đại Nếu không đượcchân đoán và điều trị kịp thời, chúng có thé gây ra những hệ quả đáng kê đối vớichất lượng cuộc sống và sức khoẻ của con người Điều quan trọng là nhận biết và
chân đoán chính xác các rối loạn giấc ngủ dé áp dụng liệu pháp phù hợp cho việc
điều trị rối loạn giấc ngủ Điều này giúp cải thiện chất lượng giấc ngủ, giảm cáctriệu chứng liên quan và tăng cường sức khỏe và chất lượng cuộc sống [2]
Mục đích của việc nhận diện các giai đoạn giấc ngủ là giúp các chuyên gia y
tế có hiểu biết sâu hơn về quá trình ngủ của cơ thé con người, giúp họ chan đoán cácvân đề liên quan đến giấc ngủ Ngoài ra, phân lớp giai đoạn giấc ngủ cũng giúp hiểu
rõ hơn về hoạt động của cơ thê trong suốt quá trình ngủ
Trong những năm gần đây, một số nghiên cứu đã sử dụng mô hình mạng ron đề phân lớp giấc ngủ trong các tình trạng bệnh như tắc nghẽn đường thở khi ngủ(OSA), động kinh, hô hấp Cheyne Stokes và bệnh Parkinson Các nghiên cứu nàytập trung vào việc phân tích chu kỳ giấc ngủ, phô năng lượng của giấc ngủ dé phanlớp các giai đoạn giấc ngủ Một số nghiên cứu khác tập trung vào việc kết hợp dữliệu về nhịp tim và hô hấp đề chân đoán các rối loạn hô hấp trong giấc ngủ [3], [4].Một số nghiên cứu cũng nghiên cứu về tín hiệu ngáy Đáng chú ý, trước đây đã cónghiên cứu sử dụng trí tuệ nhân tạo dé phân lớp giấc ngủ ở trẻ sơ sinh, đặc biệt lànhững trẻ có nguy cơ mắc hội chứng đột tử ở trẻ sơ sinh (SIDS) [5]
nơ-Việc sử dụng học máy trong phân lớp giai đoạn giấc ngủ, dé từ đó xác định
cau trúc và các đặc điểm của giấc ngủ mà con người khó có thé xác định hoặc tốnnhiều thời gian và công sức Các đặc điểm này bao gồm microspindles, chuyên đổigiác ngủ và thức dậy, cũng như sự không đồng bộ giữa ngực và bụng Những đặc
điểm này có thé hỗ trợ việc chan đoán và theo dõi tiến triển của một số rối loạn giấcngủ Phân tích dữ liệu lớn từ các thiết bị đeo và ghi lại có thê là một công cụ hữu ích
cho các bác sĩ chuyên vê giâc ngủ giúp đánh giá sức khỏe giâc ngủ [6] Điêu nay
Trang 14cũng có thê được áp dụng ở câp độ dân sô đê tạo ra các ý tưởng về cách cải thiện
van dé sức khỏe, bao gồm cả tình trạng thiếu ngủ và rối loạn giấc ngủ [5], [7]
1.2 Ly do chọn đề tài
Cấu trúc giấc ngủ là sự phân chia và biến đổi của các trạng thái giấc ngủ trong
suốt quá trình ngủ của con người Cấu trúc của giấc ngủ được xác định thông qua
việc phân tích các đặc điểm của từng trạng thái giấc ngủ, dựa trên thông tin thu thập
từ bản ghi đa ký giấc ngủ (polysomnography) Da ký giấc ngủ là phương pháp ghilại các thông số sinh lý của người khi đang ngủ, nhằm chan đoán và đánh giá các rối
loạn giấc ngủ khác nhau Máy ghi da ký giấc ngủ bao gồm các kênh cơ bản dé ghilại hoạt động điện não, điện cơ mắt, điện cơ cằm, điện tim, và nhiều kênh khác
Các bản ghi đa ký giấc ngủ được lưu trữ dưới dạng tập tin EDF (European
Data Format) Trong tập tin EDF, có các kênh tương ứng với các loại tín hiệu khác
nhau được thu thập trong quá trình ghi giấc ngủ của bệnh nhân Các kênh quan
trọng bao gồm:
- EEG (Electroencephalogram): Ghi lại hoạt động điện não trên da đầu củabệnh nhân, được sử dụng để phân tích trạng thái giấc ngủ và hoạt động não bộ trong
giấc ngủ
- EOG (Electrooculogram): Ghi lại hoạt động điện của mắt, được sử dụng dé
phát hiện chuyên động mắt trong giấc ngủ
- EMG (Electromyogram): Ghi lại hoạt động điện của cơ bắp, được sử dụng
để phát hiện sự co bóp cơ bắp trong giấc ngủ
Sử dụng các kênh này giúp xác định thông tin sinh lý của bệnh nhân trong giấcngủ, phát hiện và chân đoán các rối loạn giấc ngủ và tình trạng sức khỏe khác Phân
tích đữ liệu từ các kênh này cung cấp những thông tin quan trọng để hiểu về hoạt
động của cơ thể trong quá trình ngủ và đưa ra các đánh giá về chất lượng giấc ngủ
và các van dé liên quan đến giac ngủ
Phân lớp các giai đoạn giấc ngủ băng phương pháp thủ công, như phân lớpbằng mắt thường, có nhược điểm về thời gian và công sức Việc phân lớp từng phân
Trang 15đoạn của dữ liệu giấc ngủ một cách chi tiết và chính xác đòi hỏi thời gian và công
sức đáng ké Đồng thời, độ chính xác của phân lớp bị ảnh hưởng bởi yếu tố con
người như sự mệt mỏi, sự chú ý không tập trung, và khả năng nhận diện giai đoạn
giác ngủ không đồng đều trong quá trình ghi dữ liệu [2], [8] Nhiều mô hình tự độngphân lớp các giai đoạn giấc ngủ dựa trên học sâu được đề xuất đã giúp cải thiện độchính xác, tiết kiệm thời gian và hỗ trợ các chuyên gia trong việc phân tích giấc ngủ
Nhận thấy tính thực tế, nhóm sinh viên chọn đề tải này với mong muốn tìmhiểu, thực nghiệm và đánh giá các phương pháp phân lớp các giai đoạn giấc ngủ dựa
trên học sâu sử dụng tín hiệu đa ký.
1.3 Phat biếu bài toán và các thách thức
Dữ liệu đầu vào của bài toán là các bản ghi đa ký bao gồm các tín hiệu đo điệnnão EEG, vì nó có độ phân giải cao và khả năng phân tích đặc trưng tần số của hoạtđộng điện não Tín hiệu EEG cung cấp khả năng giám sát hoạt động điện não thờigian thực, dam bảo độ chính xác và đáng tin cậy trong phân lớp giai đoạn giấc ngủ.Tín hiệu EEG có tính khả diễn giải cao, mang lại thông tin quan trọng về tình trạnggiác ngủ của bệnh nhân [9]
Trang 1610 |Z0 0 |4U' DU ZU' |30' 40 5Ư W ' |0 JZU 20 40 DƯ |U ' 10 JZ0 20 4U DƯ :
Hình 1.2: Minh hoa 10 epochs của tín hiệu EEG Fpz — Cz
Dữ liệu đầu ra của bài toán là phân lớp các giai đoạn trong giấc ngủ qua đógiúp phân tích cấu trúc giác ngủ, bao gồm 5 giai đoạn: W (Stage Wake), NI (Stage
1), N2 (Stage 2), N3 (Stage 3), REM (Rapid Eye Movement).
Trang 17410 |ZỞ |3U |4W 5U |U ' {LU |ZU |3U |4U DU |U ' |LU |ZU |3U 40 [SU JU ` |1Ư |ZU |3U 40 |5U |U ' [1U |ZU |3U 40 5Ơ
Hình 1.4: Minh hoa kết qua phân lớp giai đoạn gidc ngủ của đoạn 10 epoch
Các bản ghi đa ký giác ngủ được chia thành các phân đoạn có độ dài cố định
30 giây, mỗi phân đoạn này được gọi là “epoch” Sau đó, một chuyên gia về giấcngủ sẽ gán nhãn thủ công cho từng thời kỳ theo tiêu chuẩn chấm điểm giấc ngủ doAmerican Academy of Sleep Medicine (AASM) [10] hoặc theo tiêu chuan
Rechtschaffen và Kales [8] cung cấp Mỗi bản ghi đa ký trung bình dai khoảng 8giờ Do đó, việc chấm điểm thủ công một tín hiệu dai như vay đối với một chuyên
gia về giấc ngủ là một công việc tẻ nhạt, tốn nhiều thời gian và công sức Cácphương pháp chú thích này cũng phụ thuộc rất nhiều vào thỏa thuận giữa cácchuyên gia đánh giá Mặc dù các phương pháp này đã đạt được hiệu suất hợp lý,nhưng cũng còn một số hạn chế như yêu cầu có kiến thức trước về phân tích giấc
ngủ và không thé tổng quát hóa thành các bộ dữ liệu lớn hon từ nhiều bệnh nhân với
kiểu ngủ khác nhau
Việc chuyền đổi giữa giai đoạn tỉnh giấc W (Stage Wake) và NI có thé diễn ramột cách mờ nhạt, không rõ ràng Điều này khiến cho việc xác định thời điểm chínhxác của giai đoạn N1 trở nên khó khăn Một số tính chất của giai đoạn N1 có thétương đồng với các giai đoạn khác, chang hạn như giai đoạn REM (giai đoạn mo)
hoặc thức giấc Điều này gây khó khăn trong việc phân biệt NI và loại bỏ sự nhằm
lẫn giữa giai đoạn W và giai đoạn NI [10].
Trang 181.4 Mục tiêu và phạm vi
Trong phạm vi của một đề tài khóa luận tốt nghiệp đại học, mục tiêu chính của
khóa luận này là:
(1) Tìm hiểu tổng quan về bài toán phân lớp các giai đoạn giấc ngủ, hiểu rõ
các khía cạnh quan trọng và thách thức liên quan đến việc phân lớp chính xác các
giai đoạn giấc ngủ từ dữ liệu đa ký giac ngủ
(2) Tìm hiểu và hệ thống lại các hướng nghiên cứu, các phương pháp liênquan đến bài toán phân lớp các giai đoạn giấc ngủ
(3) Trình bày ngắn gọn các phương pháp phân lớp các giai đoạn giấc ngủ
dựa trên học sâu tiên tiễn hiện nay, cụ thé là các phương pháp DeepSleepNet [11],
TinySleepNet [12], AttnSleep [13], TS-TCC [14], CA-TCC [15].
(4) Thuc nghiém lai va danh gia cac phuong phap da tim hiểu trên bộ đữ liệuSleep EDF Expanded Đánh giá hiệu suất của các mô hình theo các tiêu chí như:Accuracy, Fl-score Các kết quả thực nghiệm sẽ giúp đánh giá khả năng ứng dụng
của các phương pháp học sâu trong bài toán phân lớp giai đoạn giấc ngủ
(5) Dựa trên kết quả thực nghiệm, nghiên cứu đưa ra kết luận tổng quan vềhiệu suất và ưu điểm của các phương pháp học sâu đã thực nghiệm Đồng thời, thửnghiệm những kỹ thuật và cải tiễn tiềm năng đề nâng cao kết quả phân lớp giai đoạngiác ngủ
(6) Xây dựng công cụ cho phép người dùng nạp dữ liệu về giấc ngủ và cho
ra kết quả phân lớp tự động cho các dữ liệu đầu vào
1.5 Bô cục của khóa luận
Khóa luận được bô cục bao gôm 7 chương, nội dung chính của từng chương
như sau:
Chương 1: Tông quan dé tài Gidi thiệu vê van dé nghiên cứu và mục tiêu của
khóa luận.
Trang 19Chương 2: Cơ sở lý thuyết và các nghiên cứu liên quan Tìm hiểu về các khái
niệm cơ bản liên quan đến phân lớp giai đoạn giấc ngủ và tổng hợp những nghiên
cứu có liên quan đến đề tài
Chương 3: Một số phương pháp phân lóp giai đoạn giấc ngủ dựa trên họcsâu Trình bày chỉ tiết về các phương pháp sử dụng học sâu dé phân lớp giai đoạngiấc ngủ và đánh giá hiệu suất của chúng
Chương 4: Thực nghiệm và đánh giá Mô tả quy trình thực hiện thực nghiệm,
các bộ dữ liệu sử dụng và kết quả đạt được từ các phương pháp đã thực nghiệm
Chương 5: Thử nghiệm cải tiễn và đánh giá kết quả Trình bày thử nghiệm cảitiễn dé nâng cao hiệu suất phân lớp giai đoạn giấc ngủ và đánh giá hiệu quả của
Trang 20Chương 2 CƠ SỞ LÝ THUYET VA CÁC NGHIÊN CỨU LIEN QUAN
Nội dung chương này sẽ giới thiệu cơ sở lý thuyết và các công trình nghiêncứu liên quan gan đây về việc dự đoán giai đoạn giấc ngủ Nhóm sinh viên đã tiếnhành tìm hiểu các nghiên cứu có liên quan đến dé tài dé có kiến thức sâu hơn về bài
toán và các phương pháp đã được áp dụng trong lĩnh vực này Việc nắm vững cơ sở
lý thuyết và tổng quan về các nghiên cứu trước đây sẽ giúp nhóm xác định và xây
dựng một cách tiếp cận hiệu quả trong việc giải quyết bài toán phân lớp các giai
đoạn giác ngủ
2.1 Cac khái niệm về sóng não và các giai đoạn của giác ngủ
2.1.1 Sóng não và điện não đồ
Gamma
Problem solving, concentration
Trang 21Don vị uV (microvolt) được sử dung dé đo biên độ của các tín hiệu điện não.
Trong nghiên cứu sóng não giấc ngủ, biên độ của sóng não được sử dụng để phân
tích các đặc trưng của các giai đoạn giắc ngủ
Đơn vị Hz (hertz) được sử dụng để đo tần số của các sóng não Trong nghiêncứu sóng não giấc ngủ, tần số của các sóng não cũng được sử dung dé phân tích các
đặc trưng của các giai đoạn giấc ngủ
2.1.12 Điện não đồ EEG
Điện não đồ EEG: EEG (Electroencephalography) là hệ thống ghi lại các xungđiện từ não con người Đây là sự phản ứng điện sinh học từ tế bào não được ghi lại
thông qua vỏ não EEG thu thập các tín hiệu điện nhỏ từ các khu vực khác nhau của
não bằng cách gắn nhiều điện cực xung quanh đầu Mỗi điện cực được coi là một
kênh, thu nhận các xung điện từ khu vực riêng biệt [17].
Hình 2.2: Các vị trí đặt điện cực theo chuẩn quốc té 10 — 20 [17]
10
Trang 22Theo hệ thống đặt điện cực chuẩn quốc tế 10-20, sẽ sử dụng một bộ 21 điện
cực gắn lên da đầu:
- Vị trí các điểm mốc:
e _ Điểm gốc mũi (Nasion), năm giữa hai chân lông mày (Glabella)
e Điểm châm (Inion)
e Ong tai ngoài hai bên
- Các ký hiệu ving não:
e F 1a vùng trán (Frontal).
e Ca vùng trung tâm (Central).
e _ O là vùng châm (Occipital)
e =P là vùng đỉnh (Parietal).
- Các điện cực được đánh số lẻ nếu ở phía trái và sô chăn nếu ở phía phải
- Các điểm mốc được kết nối trên mạng phi điện não đồ bao gồm: Fpz, Fz,
Cz, Pz, Oz, T3, T4, C3, C4, E3, F4, P3, P4.
e _ Điểm Fpz đặt cách gốc mũi 10%
e _ Điểm Cz là trung tâm đỉnh đầu
e DiémPz đặt cách điểm châm 10%
e Đường vòng cung phía trong gồm các diém Fpl, C3, OI bên trái va
Fp2, C4, O2 bên phải.
e _ Đường vòng cung phía ngoài gồm các điểm Fpz, T3, Oz, T4
2.1.2 Cac giai đoạn của giác ngủ
Theo tài liệu tên “Physiology, Sleep Stages” [18] giấc ngủ xảy ra trong năm
giai đoạn: Wake (Wakefulness), N1 (NREM 1), N2 (NREM 2), N3 (NREM 3) và
REM (Rapid Eye Movement) Các giai đoạn N1 đến N3 được gọi là giai đoạn giắc
ngủ chuyên động mắt không nhanh (None Rapid Eye Movement - NREM), với mỗi
giai đoạn là một giấc ngủ sâu hơn dần dần Khoảng 75% giấc ngủ được dành chogiai đoạn NREM, với phần lớn được dành cho giai đoạn N2 (45%), giai đoạn NI là5% và giai đoạn N3 là 25% [18] Một giấc ngủ ban đêm điển hình bao gồm 4 đến 5
11
Trang 23chu kỳ giác ngủ, voi su tiến triển của các giai đoạn ngủ theo thứ tự sau: N1, N2, N3,
N2, REM [19] Một chu kỳ giấc ngủ hoàn chỉnh mat khoảng 90 đến 110 phút Giai
đoạn REM đầu tiên ngắn và khi màn đêm kéo dai, giai đoạn REM dài hơn và giảm
thời gian ngủ sâu (NREM) xảy ra.
Giác ngủ NREM gồm ba giai đoạn khác nhau Giấc ngủ NREM có giai đoạncàng cao thì càng khó đánh thức một người Khi chuyên qua giai đoạn NI, giai đoạn
N2 và sau đó là giai đoạn N3 của giấc ngủ NREM, các chức năng cơ thê khác nhau
sẽ chậm lại hoặc dừng hoàn toàn, cho phép các quá trình phục hồi và tái tạo sức
khỏe điển ra.
2.1.2.1 — Giai đoạn W (Wake)
Giai đoạn Wake là giai đoạn khi con người ở trạng thái tỉnh táo và có khả năng
tương tác với môi trường xung quanh, thường xảy ra khi con người thức dậy sau
một đợt ngủ hoặc trong suốt khoảng thời gian thức trong ngày Trong giai đoạn này,
hoạt động não bộ được kích hoạt, cho phép con người tham gia vào các hoạt động
như làm việc, học tập, giao tiếp xã hội và thực hiện các nhiệm vụ hàng ngày Giaiđoạn Wake đóng vai trò quan trọng trong chu kỳ giấc ngủ và ảnh hưởng đến sự tỉnh
táo và năng suât của con người trong thời gian thức dậy.
12
Trang 242.1.2.2 Giai đoạn NI
Giai đoạn NI của giấc ngủ thường chỉ kéo dài từ 1 đến 7 phút Trong giai đoạn
này, mặc dù các hoạt động của cơ thể và não bộ bắt đầu chậm lại với những khoảngthời gian chuyên động ngắn, nhưng cơ thê vẫn chưa hoàn toàn thư giãn Ngoài ra, có
một số thay đổi nhỏ trong hoạt động của não liên quan đến việc chìm vào giấc ngủ
trong giai đoạn này.
Mặc dù có thé dé dàng đánh thức ai đó trong giai đoạn ngủ này, nhưng nếukhông bị quay ray, người đó có thé nhanh chóng chuyền sang giai đoạn 2 Vào buồitối, nêu một người ngủ không bị gián đoạn, họ có thé không dành nhiều thời gianhơn cho giai đoạn 1 khi chuyên sang chu kỳ giấc ngủ tiếp theo
2.1.2.3 Giai đoạn N2
Trong giai đoạn N2, cơ thé giam nhiét d6 va co bap thư giãn, nhip thở va nhịp
tim chậm lại Sóng não hiển thị một mô hình mới và chuyển động của mắt dừng lại.
Tuy hoạt động của não chậm lại, nhưng vẫn có những dot hoạt động ngắn giúp
chống lại việc bị đánh thức bởi kích thích bên ngoài Giai đoạn N2 có thé kéo dai từ
10 đến 25 phút trong chu kỳ ngủ đầu tiên và kéo dài hon trong đêm Trong tổng thời
gian ngủ của một người thì khoảng một nửa thời gian là ở giai đoạn N2.
2.1.2.4 Giai đoạn N3
Giai đoạn N3 còn được gọi là giai đoạn giấc ngủ sâu, là giai đoạn khó đánhthức nhất trong quá trình ngủ Trong giai đoạn này, cơ thể hoàn toàn thư giãn, dẫnđến giảm lực cơ, mạch và nhịp thở Ngoài ra, hoạt động của não cũng rơi vào môhình sóng delta, được gọi là giấc ngủ delta hoặc giấc ngủ sóng chậm
Giai đoạn này rất quan trọng đối với quá trình phục hồi và tăng trưởng cơ thể
Nó có thé tăng cường hệ thống miễn dịch và các quá trình khác của cơ thé Mặc dù
hoạt động của não giảm nhưng có bằng chứng cho thấy giấc ngủ sâu có thể giúp con
người suy nghĩ sâu sắc hơn, sáng tạo và cải thiện bộ nhớ
Con người dành nhiều thời gian nhất dé ngủ sâu trong nửa đầu của đêm Trong
chu kỳ ngủ sớm, giai đoạn N3 thường kéo dai từ 20 đến 40 phút Tuy nhiên, khi tiếp
13
Trang 25tục ngủ, thời gian cho giai đoạn này sẽ ngăn lại và thay vào đó, con người sẽ dành
nhiều thời gian hơn cho giai đoạn giấc ngủ REM
2.1.2.5 Giai đoạn REM
Trong giai đoạn REM, mắt di chuyền nhanh sau khi nhắm mắt, nhịp tim tăngnhanh và hơi thở trở nên không đều Trái ngược với các giai đoạn khác của giấcngủ, ở giai đoạn REM sóng não chậm lại, não hoạt động tích cực hơn trong giác ngủREM va sóng não của trở nên biến đổi hơn
Giác ngủ REM là một trong những giai đoạn hấp dẫn nhất của giấc ngủ vì nóliên quan đến giấc mơ, một phan vì nó rất khác so với các giai đoạn khác của giắcngủ Các đặc điểm của giấc ngủ REM giúp phân biệt nó với giấc ngủ NREM bao
gồm:
- Hoạt động của sóng não giống với trạng thái tỉnh táo hơn bất kỳ giai đoạn
nào khác của giấc ngủ
- Mất trương lực cơ hoàn toàn so với trương lực cơ một phan của giấc ngủ
NREM.
- Nhịp thở không đều so với nhịp thở đều đặn, chậm hơn của giấc ngủ
NREM.
- Nhịp tim tăng so với sự chậm lại trong giấc ngủ NREM
- Não hoạt động tích cực trong suốt giai đoạn REM, và chuyền hoá não tăng
lên khoảng 20% [18].
2.1.3 Cách phân lớp các giai đoạn của giác ngủ
Dé xác định các giai đoạn của giấc ngủ dựa trên EEG, cần phân tích dữ liệuEEG theo các đặc điểm khác nhau của sóng não Các sóng não này được phân lớpthành các giai đoạn khác nhau của giấc ngủ, từ giai đoạn tỉnh táo đến giai đoạnREM Dưới đây là cách phân tích EEG thường được sử dụng để xác định các giai
đoạn của giác ngủ [20]:
14
Trang 26- Giai đoạn NI:
e Song theta (tần số 4 — 8Hz) và sóng alpha giảm dan
e Sóng hypnagogic (sóng nhỏ, không đều) xuất hiện khi người ngủ vừa
bắt đầu chìm vào giấc ngủ
- Giai đoạn N2:
e Song theta và sóng sleep spindle (sóng giống như trục quay) xuất hiện.Một day sóng hình sin riêng biệt có tần số 11 — 16Hz (phổ biến nhất là 12 —14Hz)
với thời lượng > 0.5 giây.
e Sóng K-complex (sóng hình chữ K) xuất hiện khi có sự kích thích bất
ngờ từ môi trường xung quanh.
- Giai đoạn N3:
e_ Sóng delta (tần số 0 5 — 4Hz) xuất hiện
e _ Sóng slow wave (sóng chậm) xuất hiện Đây là giai đoạn ngủ sâu
- Giai đoạn REM:
e _ Sóng theta và sóng beta xuất hiện
e Song sawtooth (sóng răng cưa) xuất hiện Hoạt động đồng loạt của mat
di chuyén nhanh và sự hoạt động da dang của co thê
Hình 2.4 minh họa tín hiệu điện não đồ dé mô phỏng các giai đoạn khác nhau
của giấc ngủ, bao gồm NI, N2, N3, REM và giai đoạn thức (W) Trong biểu đồ, các
thành phần tần số khác nhau như tần số hỗn hợp biên độ thấp, sóng Alpha, trục ngủ,
K-compex, sóng delta và sóng răng cưa được hiển thị Giai đoạn giấc ngủ đượcnhận biết dựa trên các đặc trưng từ tín hiệu điện não đồ và các sự kiện cùng với thời
gian xuât hiện của chúng Cụ thê:
15
Trang 27- Giai đoạn Wake (W) được đặc trưng bởi mức độ biên độ thấp và tần số hỗn
hợp trong tín hiệu EEG.
- Giai đoạn NI, tín hiệu điện não dé có biên độ cao nhất, tần số trong khoảng
2-7 Hz và có sự hiện diện của sóng Alpha.
- GIai đoạn N2 được đặc trưng bởi sự xuất hiện của trục ngủ (12-14 Hz) và
K-complex.
- Giai đoạn N3 là giai đoạn ngủ sâu nhất, có tần số sóng thấp dưới 2 Hz; cũng
có thể xuất hiện trục ngủ và K-complex
- Giai đoạn REM thẻ hiện điện áp thấp, tần số hỗn hợp trong tín hiệu điện não
đổ, và có sự tương đồng với sóng răng cưa
Low Amplitude mixed frequency
Ey Alpha waves ik Bane
3 sn eine Ị Nan Hive mm 9
+ L ——— + —— SE `
= 5 Lj ~m 5 a
t0 time (sec)
> 1 Sleep spindle Keomplex N2 Stage
= ey" Yeni 9B gown ptm nehaarenant HR Ni
Hình 2.4: Tín hiệu điện não đồ cho các giai đoạn khác nhau của giác ngủ [20]
2.2 Các hướng tiếp cận liên quan đến bài toán
Cho đến nay, các hướng tiếp cận được sử dụng để giải quyết bài toán phân lớpcác giai đoạn giác ngủ chủ yếu bao gồm hướng tiếp cận theo phương pháp học máy
truyén thông và hướng tiép cận dựa trên học sâu.
16
Trang 282.2.1 Hướng tiếp cận theo phương pháp hoc máy truyền thống
Trong phân lớp các giai đoạn giấc ngủ, một số phương pháp học máy truyềnthống phô biến được sử dụng và đạt được kết quả khả quan Dưới đây là một số
phương pháp học máy truyền thống được áp dụng trong lĩnh vực nay:
- Random Forests: Random Forests là một phương pháp học máy dựa trên tap
hợp các cây quyết định (decision trees) Mỗi cây quyết định được huấn luyện trên
một tập dữ liệu con được lay ngẫu nhiên từ tap huấn luyện ban đầu Sau đó, các câyquyết định này bỏ phiếu dé quyết định phân lớp cuối cùng Random Forests có thé
sử dụng các đặc trưng từ tín hiệu EEG dé phân lớp giai đoạn giấc ngủ [20]
- Support Vector Machines (SVM): SVM là một thuật toán học giám sat được
sử dụng cho phân lớp và hồi quy Nó tìm siêu phăng có khoảng cách biên lớn nhất
đến các điểm đữ liệu huấn luyện, tạo ra đường ranh giới rõ ràng giữa các lớp Mục
tiêu của SVM là tối đa khoảng cách biên dé đảm bảo tính tổng quát và kha năngphân lớp chính xác SVM tìm cách tạo ra một đường phân chia tuyến tính tốt nhấtgiữa các lớp dữ liệu khác nhau Trong việc phân lớp giai đoạn giấc ngủ, SVM có thê
sử dụng các đặc trưng trích xuất từ tín hiệu EEG dé phân lớp các giai đoạn khác
nhau như REM, NI, N2, và N3 [21].
- K-Nearest Neighbors (KNN): KNN là một phương pháp học máy đơn giản
nhưng hiệu quả trong việc phân lớp KNN tìm k điểm dữ liệu gần nhất với truy van
và quyết định dự đoán dựa trên bỏ phiếu Hiệu quả của KNN phụ thuộc vào giá trị k
được chọn Trong phân lớp giai đoạn giấc ngủ, KNN có thê sử dụng các đặc trưng
từ tín hiệu EEG và so sánh với các điểm dữ liệu huấn luyện dé xác định giai đoạn
tương ứng [21].
- Naive Bayes: Naive Bayes là một phương pháp phân lớp dựa trên nguyên
tắc xác suất Bayes Phương pháp này giả định rang các đặc trưng độc lập với nhau
và tính toán xác suất dé xác định lớp phân lớp Trong phân lớp giai đoạn giấc ngủ,Naive Bayes có thé sử dụng các đặc trưng từ tín hiệu EEG dé tính toán xác suất của
từng giai đoạn và chọn lớp có xác suất cao nhất [21]
17
Trang 29Các phương pháp học máy truyền thống này đã được áp dụng trong nhiều
nghiên cứu liên quan đến phân lớp giai đoạn giấc ngủ và đạt được kết quả khả quan
Năm 2012, Fraiwan và cộng sự đề xuất một hệ thống xác định giai đoạn giấc
ngủ tự động từ tín hiệu EEG trong bài báo "Automated sleep stage identification
system based on tine-frequency analysis of a single EEG channel and random
forest classifier" [20] Phuong pháp này sử dung phân tích thời gian-tan số và môhình phân lớp Random Forest dé trích xuất đặc trưng va phân lớp giai đoạn giấc
ngủ Kết quả cho thấy hệ thống đề xuất có độ chính xác và hiệu suất tốt trong việc
xác định giai đoạn giấc ngủ từ một kênh EEG duy nhất
Năm 2012, trong bai báo "An ensemble system for automatic sleep stage
classification using single channel EEG signal", B Koley and D Dey tap trung vao
việc phát triên một hệ thống (ensemble system) phân lớp các giai đoạn giấc ngủ tựđộng sử dụng tín hiệu EEG từ một kênh duy nhất và sử dụng kết hợp ba phương
pháp: Support Vector Machines (SVM), K-Nearest Neighbors (KNN) va Naive
Bayes [21] Mỗi phương pháp đều được huấn luyện và thử nghiệm độc lập trên tập
dữ liệu huấn luyện và kiểm thử Sau khi rút trích các đặc trưng đại diện cho các đặcđiểm quan trọng, ba phương pháp SVM, KNN và Naive Bayes được áp dụng đểphân lớp các giai đoạn giấc ngủ Mỗi phương pháp đưa ra một quyết định riêng dựa
trên các đặc trưng đầu vào Hệ thống được tạo ra bằng cách kết hợp kết quả phânlớp từ ba phương pháp thành một quyết định cuối cùng Điều này có thể được thực
hiện thông qua việc sử dụng nguyên tắc biểu quyết (voting) hoặc cân nhắc các trọng
số khác nhau cho mỗi phương pháp
Bài báo “Application of Machine Learning to Sleep Stage Classification” được
dé xuất năm 2021, trình bày một khảo sát về các phương pháp hoc máy được ápdụng trong lĩnh vực này, bao gồm mạng neural nhân tạo (Artificial Neural Networks
- ANN), SVM, Decision Tree và KNN [22] Các đặc trưng từ tín hiệu giấc ngủ được
trích xuất và sử dụng làm đầu vào cho các mô hình học máy Bài báo cũng đề cậpđến việc xử lý và tiền xử lý đữ liệu giấc ngủ để cải thiện chất lượng phân lớp Kết
18
Trang 30quả nghiên cứu cho thấy machine learning có thê đạt được kết quả phân lớp khá tốt
và chính xác trong việc phân lớp giai đoạn giấc ngủ
Mặc dù phân lớp giai đoạn giấc ngủ bằng học máy có thể đạt được kết quảtương đối tốt, nhưng độ chính xác vẫn không thể đảm bảo hoàn toàn Thuật toán họcmáy dựa trên việc học từ đữ liệu huấn luyện có thể gặp khó khăn Đối với nhữngphương pháp này, việc chọn và xác định đặc trưng của dữ liệu EEG (điện não đô)
hoặc biến đổi của nó là yếu tố quan trọng Tuy nhiên, việc chọn đặc trưng phù hợp
và hiệu quả vẫn là một thách thức, và có thể ảnh hưởng đến hiệu suất phân lớp Bên
cạnh đó, phương pháp phân lớp giai đoạn giấc ngủ dựa trên học máy đòi hỏi quátrình huấn luyện mô hình trên dữ liệu huấn luyện Tuy nhiên, hiệu quả và độ chínhxác của phương pháp phụ thuộc vào quá trình huấn luyện và xử lý các tình huốngmới không được luân luyện trước đó [20], [21]
2.2.2 Hướng tiếp cận dựa trên học sâu
Do giới hạn của các phương pháp học máy truyền thống, nó đang dần đượcthay thế bằng các phương pháp dựa trên học sâu Trong những năm gần đây, nhiềuphương pháp dựa trên học sâu xuất hiện và mang lại những cải tiến hiệu suất khátốt
Mạng nơ-ron nhân tạo (neural network) là một thuật toán máy học được lấycảm hứng từ cau trúc và hoạt động của hệ thống thần kinh trong bộ não người [23]
Nó là một mô hình tính toán thông qua một tập hợp các đơn vi tính toán nhỏ gọi là
nơ-ron và các liên kết giữa chúng Mạng neural bao gồm nhiều lớp nơ-ron được kếtnối với nhau, trong đó mỗi nơ-ron trong lớp trước đó kết nối với các nơ-ron tronglớp sau đó Các nơ-ron trong mạng nhận đầu vào, tính toán và truyền tiếp giá trị tớicác nơ-ron tiếp theo, cuối cùng đưa ra đầu ra dự đoán Các liên kết giữa các nơ-rontrong mạng có trọng số, các giá trị này quyết định mức độ quan trọng của đầu vàođối với kết quả đầu ra Qua quá trình huấn luyện, mạng nơ-ron thay đổi các trọng sốnày để tìm ra một mô hình tối ưu cho việc dự đoán và phân lớp dữ liệu
Kiên trúc cơ bản của một mạng nơ-ron nhan tạo bao gồm 3 lớp:
19
Trang 31- Lớp đầu vào (input layer): Là lớp bên trái cùng của mạng thể hiện cho các
đầu vào của mạng
- Lớp đầu ra (output layer): Là lớp bên phải cùng của mạng thé hiện cho các
Hình 2.5: Kiến trúc mang no-ron nhân tạo [23]
Một số phương pháp dựa trên mạng nơ-ron này được cải tiến, đề xuất và sửdụng trong nhiệm vụ phân lớp các giai đoạn giấc ngủ, như là mạng nơ-ron hồi quy
(Recurrent Neural Network — RNN) và mạng nơ-ron tích chập (Convolutional
neural network — CNN) Mang no-ron hồi quy (RNN), đặc biệt là mạng bộ nhớ dài
ngắn (Long Short-Term Memory — LSTM), đã được sử dụng dé phân lớp giai đoạngiấc ngủ Mạng LSTM có khả năng xử lý dữ liệu chuỗi và nhớ thông tin lâu dài,giúp phân tích các mẫu thời gian trong dữ liệu giấc ngủ Mạng nơ-ron tích chập
(CNN) được áp dụng thành công trong nhiều bài toán thị giác máy tính, và cũng
được sử dụng để phân lớp giai đoạn giấc ngủ Các mạng CNN có khả năng nhậndiện các đặc trưng cục bộ và tạo ra các bản đồ đặc trưng, từ đó giúp phân lớp các
giai đoạn giâc ngủ.
20
Trang 32Năm 2008, F Ebrahimi và cộng sự đề xuất phương pháp sử dụng mạng nơ-ron
va wavelet packet coefficients dé phân lớp giai đoạn giấc ngủ từ dữ liệu EEG được
giới thiệu [24] Phương pháp này đã được đánh giá và thực nghiệm trên tập dữ liệu
thực, và kết qua cho thấy hiệu suất phân lớp của nó đạt mức cao và khả năng tongquát hóa tốt [24] Phương pháp này đã được đánh giá và thực nghiệm trên tập dữliệu thực, và kết quả cho thấy hiệu suất phân lớp của nó đạt mức cao và khả năng
tổng quát hóa tốt Điều này cho thấy tiềm năng và hiệu quả của việc kết hợp các
phương pháp học sâu trong việc đạt được phân lớp chính xác và tin cậy của các giai
đoạn giấc ngủ từ dir liệu EEG
Năm 2017, A Supratak và cộng sự đề xuất phương pháp DeepSleepNet [11]
sử dụng Mạng neural tích chập (CNN) trong phần học biểu diễn dé trích xuất cácđặc trưng không thay đồi theo thời gian từ dữ liệu EEG va sử dụng mạng LongShort-Term Memory - LSTM trong phần học dư thừa chuỗi để mã hóa thông tin
thời gian và xử lý các đầu vào epoch EEG theo trình tự
Năm 2018, H Phan và cộng sự trình bày một phương pháp học sâu khác sử
dụng mạng nơ-ron tích chập (CNN) đề phân lớp tự động các giai đoạn giác ngủ[25] Mạng CNN được thiết kế đề trích xuất đặc trưng từ dữ liệu giấc ngủ và đưa ra
dự đoán cho cả giai đoạn hiện tai và giai đoạn tiếp theo của giác ngủ Quá trình huấnluyện mô hình được thực hiện trên một tập dữ liệu lớn chứa các mẫu giấc ngủ được
gán nhãn Mạng CNN được tối ưu hóa để đạt hiệu suất phân lớp tốt nhất cho các
giai đoạn giấc ngủ Kết quả thử nghiệm cho thấy phương pháp học sâu này đạt hiệusuất phân lớp cao và cung cấp khả năng dự đoán cho giai đoạn tiếp theo của giấc
ngủ.
Năm 2019, N Michielli và cộng sự đã đề xuất một phương pháp học sâu sửdụng mạng LSTM liên tiếp dé phân lớp giai đoạn giấc ngủ tự động từ tín hiệu EEG
đơn [26] Kết quả thử nghiệm cho thấy mô hình đạt hiệu suất phân lớp cao và có
tiềm năng ứng dụng trong chân đoán và quản lý giấc ngủ
Năm 2020 một mô hình mở rộng từ DeepSleepNet [4| là TinySleepNet được
A Supratak và cộng sự giới thiệu Đây là một mô hình học sâu hiệu quả cho việc
21
Trang 33phân loại giai đoạn giấc ngủ dựa trên tín hiệu EEG từ một kênh don Mô hình này
sử dụng mạng học sâu tích chập (CNN) và được tối ưu hóa để đáp ứng yêu cầu về
tài nguyên tính toán và kích thước mô hình.
Tác giả Eldele và cộng sự đã giới thiệu 2 phương pháp học sâu vào năm 2021.
Đầu tiên tác giả đề xuất một kiến trúc mạng học sâu mang tên AttnSleep, dựa trên
cơ chế chú ý (attention) dé phân loại các giai đoạn giấc ngủ sử dụng tín hiệu EEG từmột kênh duy nhất [13] Tiếp theo tác giả giới thiệu phương pháp TS-TCC [14] liênquan đến việc tạo ra hai chế độ xem khác nhau của đữ liệu đầu vào bằng cách sử
dụng các phép tăng mạnh và yếu, theo sau là mô-đun tương phản theo thời gian đểkhám phá các đặc điểm theo thời gian của dữ liệu bằng mô hình tự hồi quy Sau đó
1 năm tác giả tiếp tục đề xuất một biến thê thứ 2 của TS-TCC [14] là Class-AwareTS-TCC (CA-TCC) [15], nhằm hoạt động trong môi trường bán giám sát Phươngpháp này đặt nỗ lực lên việc tận dụng một vài dữ liệu được gán nhãn có sẵn để cảithiện biểu diễn học được từ TS-TCC [14]
Cũng trong năm 2022, C Li và cộng sự đề xuất một mô hình học sâu có tên làEEGSNet dựa trên các mang neural tích chập (CNN) dé trích xuất các đặc trưngtrong Spectrogram của tín hiệu EEG và Bi-LSTM giúp phân lớp giai đoạn giấc ngủ[27] Kết quả cho thấy phương pháp học sâu đạt được độ chính xác cao trong việcphân loại giai đoạn giấc ngủ, vượt qua các phương pháp truyền thống Bài báo nàyđóng góp quan trọng trong lĩnh vực phân loại giấc ngủ và đưa ra một hướng tiếp cận
mới sử dụng học sâu và Spectrogram của tín hiệu EEG.
Các phương pháp dựa trên học sâu ngày cảng được quan tâm và áp dụng rộng
rãi trong nhiều bài toán khác nhau, bao gồm bài toán phân lớp giấc ngủ Việc sử
dụng các phương pháp học sâu trong phân lớp giấc ngủ đem lại nhiều lợi ích, như
tăng cường khả năng chan đoán, giảm thời gian và công sức của các chuyên gia y tế,
đồng thời cung cấp thông tin quan trọng dé nghiên cứu và cải thiện chất lượng giắc
ngủ nên khóa luận này tập trung vào nghiên cứu các phương pháp dựa trên học sâu
và áp dụng vào bài toán phân lớp giai đoạn giấc ngủ
22
Trang 34Chương 3 MỘT SO PHƯƠNG PHÁP PHAN LỚP CÁC GIAI DOAN
GIÁC NGỦ DUA TREN HỌC SÂU
Niue đã trình bày ở chương 2, các nghiên cứu gan đây về bài toán phân lớp
các giai đoạn giác ngủ có xu hướng đê ` xuất và cải tiến các phương pháp dựa trên
học sâu để cải thiện độ chính xác Do đó, nội dung chương 3 của khóa luận tập
trung vào việc trình bày một số phương pháp phân lớp giai đoạn giác ngủ dựa trên
học sâu nhu DeepSleepNet, TinySleepNet, AttnSleep, TS-TCC và CA-TCC.
3.1 DeepSleepNet
Bai bao “DeepSleepNet: a Model for Automatic Sleep Stage Scoring based on
Raw Single-Channel EEG” được viết bởi Akara Supratak, Hao Dong, Chao Wu vaYike Guo va được xuất bản vào năm 2017 [11] Nghiên cứu này đề xuất một môhình học sâu có tên là DeepSleepNet đề đánh giá tự động các giai đoạn giấc ngủ dựa
trên tín hiệu EEG từ một kênh duy nhất.
Trước đây, hầu hết các phương pháp ton tại dựa trên các đặc trưng được thiết
kế trước đòi hỏi kiến thức tiên quyết về phân tích giấc ngủ Chỉ có một số ít trong sốchúng mã hóa thông tin thời gian DeepSleepNet sử dụng mang học sâu dé tự độnghọc các đặc trưng từ tín hiệu EEG gốc mà không cần đến các đặc trưng được xâydựng trước Mô hình này đã được thử nghiệm và đánh giá trên các tập dữ liệu giấc
ngủ công khai, và kết qua cho thấy nó có khả năng phân lớp các giai đoạn giấc ngủ
một cách tự động và chính xác Bài báo này cung cấp thông tin quan trọng và cơ sởcho việc phát triển các phương pháp tự động hóa phân lớp giai đoạn giấc ngủ dựa
trên tín hiệu EEG.
3.1.1 Kiến trúc tổng quan
Kiến trúc của DeepSleepNet [11] được minh hoạ trong Hình 3.1 bao gồm 2
phần chính: Học biểu diễn (Representation Learning) và Học dư thừa chuỗi
(Sequence Residual Learning).
23
Trang 35Non-trainable Layer Concatenate
Non-trainable Layer Copy (included only training)
Hình 3.1: Kiến trúc tổng quan của DeepSleepNet [11]
3.1.1.1 Representation Learning
Representation Learning với nhiệm vụ su dung các bộ lọc dé trích xuất cácđặc trưng không thay đôi theo thời gian (time-invariant features) từ mỗi epoch EEG
đầu vào Các đặc trưng này có thể bao gồm các thông số về tần số, độ lớn, biên độ,
và các đặc trưng khác của sóng não.
24
Trang 36Một kiến trúc mạng nơ-ron được sử dụng cho việc trích xuất đặc trưng từ cácepoch EEG (electroencephalogram) có thời lượng 30 giây Kiến trúc mạng này đượcthiết kế dựa trên phương pháp điều khiến sự đánh đổi giữa độ chính xác thời gian vatần số trong các thuật toán trích xuất đặc trưng của các chuyên gia xử lý tín hiệu.Kiến trúc mạng này bao gồm hai mạng CNN (Convolutional Neural Networks) vớicác kích thước bộ lọc khác nhau ở các lớp đầu tiên, gồm:
- CNN với bộ lọc nhỏ (small filter): Trích xuất thông tin về thời gian(temporal information) từ các epoch EEG Ví dụ, băng cách xác định thời điểm xuất
hiện của các mẫu sóng não trong các epoch EEG.
- CNN với bộ lọc lớn (large filter): Trích xuất thông tin về tan số (frequencyinformation) từ các epoch EEG Ví dụ, bằng cách xác định các thành phần tần số
cua sóng não trong các epoch EEG.
Bằng cách kết hợp hai loại bộ lọc này, kiến trúc mạng nơ-ron có khả năng
trích xuất đầy đủ thông tin từ các epoch EEG dé giúp phân lớp các trạng thái của
não một cách chính xác hơn Cụ thé trong trường hợp này, kiến tric mạng nơ-ronđược sử dụng dé phân lớp các epoch EEG thành các trạng thái khác nhau của giấcngủ dựa trên tiêu chuẩn của American Academy of Sleep Medicine (AASM) va
Rechtschaffen and Kales (R&K) [8].
Cụ thé, mỗi CNN bao gồm bốn lớp tích chap (convolutional layers) và hai lớpmax-pooling layers Mỗi lớp tích chập thực hiện ba hoạt động tuần tự: 1D-tích chậpvới bộ lọc của nó, chuẩn hóa mini-batch (batch normalization) [15], và áp dụng hàmkích hoạt ReLU (Rectified Linear Unit) Mỗi lớp max-pooling giảm kích thước đầu
vào bằng cách sử dụng phép tối đa (max operation) Mỗi khối tích chập hiền thị mộtkích thước bộ lọc, số lượng bộ lọc và một kích thước bước Mỗi khối tối đa hóa hiển
thị một kích thước tối đa và một kích thước bước
Dé trích xuất các đặc trưng từ các epoch EEG, các lớp tích chập trong kiến
trúc mạng nơ-ron này sử dụng các bộ lọc khác nhau dé tìm kiếm các mẫu đặc trưng
trong tín hiệu EEG Các lớp max-pooling sau đó giảm kích thước của các đặc trưng
trích xuất được dé giảm chỉ phí tính toán Sử dụng các lớp tích chập và lớp
max-25
Trang 37pooling lặp lại nhiều lần cùng với các hoạt động khác như chuẩn hóa và kích hoạtReLU cho phép mạng học cách tổng hợp các đặc trưng phức tạp từ các đặc trưng cơ
bản.
Sử dụng hai mô hình CNN để trích xuất các đặc trưng không thay đổi theo
thời gian từ các epoch EEG có độ dài 30 giây Giả sử có N epoch EEG {#¡, xy}.
và sử dụng hai mô hình CNN để trích xuất đặc trưng i-th từ epoch EEG i-th x; như
- Ghép các đặc trưng được trích xuất từ hai mô hình CNN với nhau để tạo ra
một đặc trưng hoàn chỉnh cho epoch EEG i.
và tần số từ tín hiệu EEG theo hướng dẫn của nghiên cứu [28] Trong Hình 3.1, kích
thước bộ loc (filter size) của lớp conv] của CNN-1 (nhánh bên trái) được đặt là
Fs/2 (tức là nửa tốc độ lay mau F's), và độ dịch chuyển (stride size) được đặt là
Fs/16 để phát hiện khi những mẫu EEG nhất định xuất hiện Trong khi đó, kíchthước bộ lọc của lớp conv] của CNN-2 (nhánh bên phải) được dat là Fs x 4 dé thu
thập thành phần tần số của EEG tốt hơn Độ dịch chuyển của nó cũng được đặt là
Fs/2, cao hơn lớp conv1 của CNN-1, vì không cần thực hiện tính toán tích chập chitiết dé trích xuất thành phần tần số Kích thước bộ lọc và độ dịch chuyển của các lớp
26
Trang 38tích chập tiếp theo conv2_[1 — 3] được chon dé có kích thước cố định nhỏ Việc sửdụng nhiều lớp tích chập với kích thước bộ lọc nhỏ thay vì một lớp tích chập lớnđược cho rằng có thé giảm số lượng thông số và chi phí tính toán, và van đạt được
cùng mức độ biểu diễn của mô hình [11]
3.1.1.2 Sequence Residual Learning
Sequence Residual Learning có nhiệm vu hoc cách mã hóa thông tin thời gian,
bao gồm các quy tắc chuyển đổi giai đoạn (stage transition rules) giữa các epoch
EEG Phan này có thé sử dụng một kiến trúc mạng học sâu (deep learning) nhưmạng LSTM (Long Short-Term Memory) hoặc GRU (Gated Recurrent Unit) dé hocthông tin chuỗi va xử lý các đầu vào epoch EEG theo trình tự
Sequence Residual Learning gồm hai thành phan chính: Bidirectional-LSTMs
va Shortcut connection BiLSTMs được sử dung dé học thông tin thời gian trongchuỗi dit liệu, trong khi Shortcut connection cho phép mô hình kết hợp thông tin từ
các chuỗi đầu vào trước đó và đặc trưng trích xuất từ mạng CNN, cho phép mô hình
thêm thông tin thời gian vào đặc trưng đầu ra
“+ Bidirectional LSTM (BiLSTM)
Bidirectional LSTM (BiLSTM) là một loại mạng nơ-ron hồi quy (RNN), là
một dạng của mạng LSTM (Long Short-Term Memory), được sử dụng để học thông
tin về thứ tự các giai đoạn của giấc ngủ Mạng này cho phép việc xử lý chuỗi đầu
vào được thực hiện theo cả hai hướng (forward và backward), giúp mô hình có thể
sử dụng thông tin từ quá khứ và tương lai để dự đoán các giai đoạn tiếp theo củagiác ngủ
«+ Shortcut connection
Shortcut connection được sử dụng dé kết hợp thông tin từ mang CNN vaBidirectional-LSTMs lại với nhau Kết quả từ Bidirectional-LSTMs được cộng với
kết quả từ mô hình CNN thông qua lớp Fully Connected (FC) Lớp này có chức
năng biến đổi các đặc trưng trích xuất từ CNN thành một vector có thể cộng đượcvới đầu ra từ BiLSTMs Kết quả từ lớp Fully Connected sẽ được chuẩn hóa theo
batch và áp dụng hàm kích hoạt ReLU (Rectified Linear Unit).
27
Trang 39Bang cách này, mô hình có thé học được thông tin thời gian từ các đầu vào củaphần Sequence Residual Learning trước đó và kết hợp nó với các đặc trưng trích
xuất từ CNN dé dự đoán các giai đoạn của giấc ngủ
Công thức tính toán cho phần huấn luyện của mạng LSTM và kết hợp với
CNN thông qua Shortcut connection:
Công thức đầu tiên (3.4) tính toán hidden state và cell state của LSTM thuậntại thời điểm t, dựa trên hidden state, cell state và đầu vào trước đó Công thức thứhai (3.6) tính toán hidden state và cell state của LSTM nghịch tại thời điểm t, dựa
trên hidden state, cell state và đầu vào tiếp theo Và công thức cuối cùng (3.6) tính
toán đầu ra tại thời điểm t bằng cách cộng hai hidden state ghép và kết quả sau khi
áp dụng fully-connected layer.
Các tham số của BiLSTMs và lớp Fully Connected được đặt nhỏ hơn đầu racủa phần học biểu diễn, là 1024 Điều này nhằm hạn chế mô hình chọn và kết hợp
chỉ những đặc trưng quan trọng dé ngăn chặn hiện tượng overfitting Khi mô hình
quá khớp, nó sẽ học nhớ các đặc trưng không quan trọng, dẫn đến hiệu suất dự đoán
kém trên dữ liệu mới Giảm kích thước của các tham số này sẽ giúp mô hình tập
trung vào các đặc trưng quan trọng hơn, từ đó giảm khả năng quá khớp.
3.1.2 Huấn luyện và kết qua
DeepSleepNet sử dụng hàm mất mát là hàm Cross-Entropy Loss có trọng số(Weighted Cross-Entropy Loss) Hàm mat mát này giúp giải quyết van dé mat cân
28
Trang 40bang lớp (class imbalance) trong dit liệu Nó giúp mô hình tập trung vào lớp NI, lớp
có tần suất xuất hiện thấp hơn so với các lớp khác trong tập dữ liệu
DeepSleepNet được huấn luyện qua hai giai đoạn chính: tiền huấn luyện học
biểu diễn và tinh chỉnh lại toàn bộ mô hình Trong hai giai đoạn nay, áp dụng kỹthuật tối ưu hóa Adam Optimizer, là một thuật toán kết hợp kỹ thuật của RMS prop
và momentum Thuật toán sử dụng hai momentum: internal states momentum (m)
va squared momentum (v) cua gradient cho các tham số Sau mỗi batch huấn luyện,
giá tri của m và v duoc cập nhật lại sử dung exponential weighted average, m và 0
được cập nhật theo công thức:
Trong đó, ø là learning rate, e là giá tri được thêm vào đê ngăn việc chia cho
Trong giai đoạn tiền huấn luyện, sử dung tập huấn luyện tăng cường, sử dụngtrình tối ưu hóa Adam Optimizer và kích thước mini-batch là 100, trong đó learningrate, B, và „lần lượt là 10~*, 0.9 và 0.999
Trong giai đoạn tinh chỉnh, các tham số của trình tối ưu hóa Adam optimizertương tự như giai đoạn tiền huấn luyện, trừ việc learning rate của mỗi phan Ir1 vàIr2 tương ứng là 1075 và 10~* Ngưỡng gradient clipping được đặt là 10, dé giớihạn giá trị của gradient trong quá trình huấn luyện mô hình Số epoch cho giai đoạntiền huấn luyện và giai đoạn tinh chỉnh được đặt tương ứng là 100 và 200
DeepSleepNet được huấn luyện và đánh giá trên 2 bộ dữ liệu Montreal
Archive of Sleep Studies(MASS) [29] và Sleep-EDF [30] bằng các kênh tín hiệu
EEG khác nhau.
Bộ dữ liệu Sleep-EDF nhóm tác giả sử dụng bản ghi của 20 đối tượng từ
Sleep-Cassette.
29