Sau khi tim hiểu các phương pháp phân lớp các giai đoạn giấc ngủ dựa trên học sâu, chúng em tiến hành huấn luyện và thực nghiệm trên bộ dữ liệu đa ký gidc ngủ. Nội dung chương 4 giới thiệu về bộ dữ liệu Expanded Sleep-EDF, phương pháp tiến hành thực nghiệm, các tiêu chí đánh giá, các kết quả thực nghiệm và đưa
ra những nhận định, đánh giá. Trong quá trình huấn luyện, các thông số của mô hình được điều chỉnh dé toi ưu hóa hiệu suất phân lop.
4.1. Giới thiệu về bộ dữ liệu
Khóa luận này sử dụng nguồn dữ liệu mở về tín hiệu đa ký giấc ngủ của PHYSIONET là Expanded Sleep-EDF (ES-EDF) [30]. Bộ dữ liệu bao gồm 153 bản ghi biểu diễn tín hiệu đa ký giấc ngủ (PolySomnoGraphic — PSG) của 78 đối tượng
có độ tuổi từ 25 đến 101 tuổi (37 nam và 41 nữ), đã được gán nhãn các giai đoạn
giấc ngủ. Trong đó thé hiện các loại tín hiệu như tín hiệu đo điện não (EEG), tín
hiệu đo điện quang mắt (EOG), tín hiệu đo điện cơ (EMG).
Bộ dữ liệu có 2 loại tập tin:
- PSG.edf: chứa dữ liệu về các tín hiệu sinh lý được ghi lại trong quá trình nghiên cứu giấc ngủ, bao gồm các tín hiệu như EEG (Electroencephalography),
EOG (Electrooculography), EMG (Electromyography), ECG (Electrocardiography),
va có thé bao gồm cả các tín hiệu khác như đo lưu lượng không khí, đo chuyên động, và đo oxy huyết.
- Hypnogram.edf: thông tin về hypnogram được biéu diễn dưới dạng các mã hoặc ký hiệu đại diện cho các giai đoạn giấc ngủ, bao gồm các chú thích nhãn gồm
giai đoạn thức W, giai đoạn NI, giai đoạn N2, giai đoạn N3, giai đoạn N4, và giai
đoạn REM (Rapid Eye Movement), Movement(M) là thời gian chuyén động, UNKNOWN và mốc thời gian cho các tín hiệu thu được trong từng giai đoạn của giấc ngủ tương ứng với tập tin PSG.
49
Mỗi tập tin EDF và Hypnograms có một tiêu đề giúp xác định bệnh nhân (an danh giới tinh và độ tuổi), chi tiết về bản ghi (cu thé là khoảng thời gian được ghi)
và các đặc điểm của tín hiệu.
“pu jw” |19' J207|30
+100 uV
: Mia / Vand fe A wi AWN A A 7 AA
0:01:43 (7:37:43) 5:00 (0.9 mm/sec)
J
time EEG Fpz-Cz EEG Pz-Oz EOG horizontal Resp oro-nasal EMG submental Temp rectal Event marker Label
0 0 -48.93919414 0.067399267 34.98412698 -627000000 4.024 37506114.77 977000000 0
1 0.01 -8.715750916 -3.27032967 39.32478632 -621563750.3 4.021946271 37505947.96 977323811.6 0
2 0.02 -32.54432234 -1.208791209 52.34676435. -615775154.1 4.019905286 37505775.3 977647380.8 0
3 0.03 -24.4996337 -1.208791209 52.82905983 -609636202 4.017878135 37505596.95 977970387.6 0
4 0.04 -35.3956044 2.521611722 48.48840049 -603149120.4 4.0158659 37505413.09 978292513.5 0
5 0.05 -27.86007326 2.521611722 31.12576313 -596316371.3 4.013869647 37505223.88 978613441.2 0
6 0.06 -27.14725275_ 2.128937729 26.78510379 -589140651.8 4.011890432 37505029.51 978932855.4 0
7 0.07 -16.047/61905 2.128937729 21.47985348 -581624893.8 4.009929298 37504830.15 979250442.8 0
8 0.08 -32.13699634 1.049084249 23.40903541 -573772263.8 4.007987273 37504625.98 979565892.8 0
9 0.09 -30.1003663 -0.816117216 11.35164835 -565586161.5 4.00606537 37504417.18 979878897.2 0
10 0.1 -20.83369963 -1.601465201 46.55921856 -557070219.2 4.004164589 37504203.93 980189151.1 0
11 0.11 -20.42637363 -7.295238095 38.36019536 -548228300.4 4.002285913 37503986.41 980496352.9 0
12 0.12 -16.96410256 -11.22197802 16.65689866 -539064498.8 4.000430308 37503764.81 980800204.5 0
13 0.13 -13.603663 -8.375091575 33.05494505 -529583136.5 3.998598724 37503539.32 981100411.8 0
14 0.14 -12.58534799 -3.859340659 28.23199023 -519788762.4 3.996792094 37503310.13 981396685 0
15 0.15 -6.984615385 -6.117216117 31.12576313 -509686150.1 3.995011333 37503077.42 981688738.6 0
16 0.16 3.096703297 -4.055677656 31.12576313 -499280296.2 3.993257337 37502841.37 981976292 0
17 017 6.966300366 -2.975824176 24.37362637 -488576417.9 3.991530983 37502602.2 982259069.6 0
18 018 0.041758242 -0.521611722 5.081807082 -477579950.2 3.989833131 37502360.07 982536801.1 0
19 0.19 3.3003663 -1.797802198 33.53724054 -466296544 3.988164617 37502115.19 982809221.9 0
20 02 2.791208791 -3.27032967 -0.705738706 -454732062.6 3.986526261 37501867.74 983076073.1 0
Hình 4.2: Thông tin các kênh dữ liệu dưới dạng csv
Các bản ghi đa ký giấc ngủ được chia thành các phân đoạn có độ dài cô định
30 giây, mỗi phân đoạn này được gọi là “epoch”. Sau đó, một chuyên gia về giấc ngủ sẽ gán nhãn thủ công cho từng thời kỳ theo tiêu chuẩn chấm điểm giấc ngủ do
50
American Academy of Sleep Medicine (AASM) hoặc tiêu chuẩn Rechtschaffen và Kales cung cấp [40].
4.2. Tiền xử lý dữ liệu và phương pháp thực nghiệm
4.2.1. Tiền xử lý dữ liệu
Trong phân lớp giai đoạn giấc ngủ, dữ liệu đơn kênh EEG là phương pháp phổ biến được sử dụng dé giám sát hoạt động điện não trong não bộ của con người. EEG
có khả năng phân tích các đặc trưng tần số của hoạt động điện não với độ phân giải cao hơn so với các phương pháp khác như giám sát hành vi hoặc theo dõi chuyển động của con người trong giấc ngủ. EEG có khả năng giám sát hoạt động điện não
của con người trong thời gian thực, đảm bảo sự chính xác và độ tin cậy trong việc
phân lớp các giai đoạn giấc ngủ.
Các tín hiệu EEG được thu thập có tính khả diễn giải cao, do đó có thể được sử dụng dé đưa ra những thông tin quan trọng về tinh trạng giấc ngủ của bệnh nhân [9]. Tín hiệu xuất hiệu trong các giai đoạn giấc ngủ có một số đặc điểm cụ thể chăng hạn như K-complexes, delta activities và sleep spindles, thường xảy ra chủ yếu trong thùy trán của não, và kênh Fpz-cz được đặt ở vùng trán có thể dễ dàng ghi nhận chúng. Bên cạnh đó một số nghiên cứu trước đó đã so sánh kết quả giữa hai kênh Fpz-cz và Pz-oz cho thấy mô hình sử dụng Fpz-cz có hiệu suất tốt hơn, vì vậy nhóm
sử dụng dữ liệu tín hiệu EEG Fpz-cz dé tiến hành huấn luyện [41].
Sau khi tiến hành rút trích kênh tín hiệu EEG Fpz-cz, dữ liệu được lưu trữ dưới định dạng file NPZ để thuận tiện cho việc xử lý và phân tích dữ liệu bằng việc chuyển đổi dit liệu dạng sóng thành dạng số, trong đó x có 3000 giá trị và y có 5
nhãn là 0, 1, 2, 3, 4 tương ứng với giai đoạn thức W, giai đoạn NI, giai đoạn ngủ N2, giai đoạn N3, giai đoạn REM. Cũng tại bước này, loại bỏ các epoch có nhãn
Movement (M), Unknown và gộp giai đoạn N4 vào giai đoạn N3. Giai đoạn
Movement không đủ chính xác và đồng nhất, gây ra sự không nhất quán và khó khăn trong đánh giá giấc ngủ. Bằng cách loại bỏ hai nhãn này, chúng ta có thê tập
trung vào phân tích giâc ngủ chât lượng và câu trúc của nó, đông thời đơn giản hóa
51
hệ thống phân lớp. Giai đoạn N4 và giai đoạn N3 có những đặc điểm tương đồng như có biên độ sóng cao, chiếm đa phan là sóng delta. Điều nay dẫn đến thiếu hụt các đặc điểm hình thái rõ ràng để phân biệt 2 giai đoạn này, gây ra sự không nhất quán và khó khăn trong đánh giá giấc ngủ. Vậy nên việc gộp giai đoạn N4 và giai đoạn N3 nhằm đơn giản hóa và thống nhất hệ thống phân loại giấc ngủ, từ đó tập trung vào các khía cạnh quan trọng khác của giấc ngủ và điều chỉnh ý nghĩa lâm
sàng của từng giai đoạn [42].
Bảng 4.1: Thống kê số lượng epoch của từng giai đoạn trong bộ dữ liệu
Giai đoạn W N1 N2 N3 REM
S6 epoch 79,055 24,887 80,441 15,280 29,382
Dữ liệu được thành 3 nhóm tuôi: thanh niên (18 — 25 tudi), người lớn (26 — 64
tuổi) và người cao tuôi (từ 65 tuổi trở lên) [43]. Sau đó chia mỗi nhóm thành 2 tập huấn luyện (train) và tập kiểm thử (test) với tỉ lệ 8:2, sau đó tiếp tục chia tập huấn luyện thành tập huấn luyện và tập kiểm định (validation) với tỉ lệ 8:2 dựa trên tiêu chí cân băng về tỉ lệ các stage trong từng tập. Theo đó tập huấn luyện có 98 file npz, tập kiểm định có 24 file npz và tập kiểm thử có 31 file. Mỗi file sẽ có thời lượng là
86,400 giây sau khi loại bỏ giai đoạn Movement và Unknown.
Bảng 4.2: So sánh giữa các tập dữ liệu huấn luyện, kiểm định và kiểm thử
Tập dữ liệu Số lượng file Số epochs Tập huấn luyện 98 158,383 Tập kiểm định 24 34,390 Tập kiểm thir 31 36,272
Bảng 4.3: Thống kê số lượng epoch của từng giai đoạn trong mỗi tập dữ liệu
Giai đoạn Ww NI N2 N3 REM
Tập huấn luyện 55,304 16,979 54,873 10613 | 20,614 Tập kiểm định 13,260 3,418 11,808 2,289 3,615 Tap kiém thir 10,491 4,490 13,760 2,378 5,153
52
4.2.2. Phương pháp thực nghiệm
Để huấn luyện và thực nghiệm các phương pháp, chúng em cai đặt lại các thông số phù hợp với bộ dữ liệu và cấu hình của máy tính như bafch size, mini _batch, số lượng vòng lặp.
Bảng 4.4: Thông số huấn luyện của các phương pháp
DeepSleepNet | TinySleepNet | TS-TCC | CA-TCC | AttnSleep
Số fold 2 2 1 1 2
Số epochs 200 200 40 40 100
Batch size 128 15 128 128 128
Hàm tối ưu Adam Adam Adam Adam Adam
Hàm loss Cross entropy | Cross entropy Cross Cross Cross
entropy entropy entropy
Các kịch bản thực nghiệm trên bộ dữ liệu, các thông số huấn luyện được mô
tả trong Bang 4.4. Tất cả các thực nghiệm được tiến hành trên Google Colab, sử
dụng GPU, Tesla T4, RAM 12.7 GB.
4.3. Các tiêu chí đánh giá
Recall (độ bao phủ) là tỷ lệ số mẫu Positive mô hình dự đoán đúng (True Positive) trên tổng số mẫu thật sự là Positive (True Positive và False Negative).
Recall =
TP
TP +FN
(4.1)
Precision (độ chính xác) là ty lệ số mẫu Positive mô hình dự đoán đúng (True Positive) trên tổng số mẫu mô hình dự đoán là Positive (True Positive và False
Positive).
Precision =
TP
TP + FP
(4.2)
Accuracy là tỷ lệ giữa số mẫu được dự đoán đúng (True Positive va True Negative) và tong số mẫu trong tập dữ liệu kiêm thử.
TP+TN
Accuracy =
TP+FP+TN+FN
(4.3)
53
Fl-score là trung bình điêu hòa (harmonic mean) của Precision va Recall,
được tính theo công thức.
F1 _ 2 X Precision X Recall (4.4)
score = Precision + Recall ,
Geometric Mean (G-Mean) 1a gia tri dé do lường sự cân bằng giữa hiệu suất phân lớp trên cả lớp đa số và lớp thiểu số. G-Mean thấp là dấu hiệu cho thấy hiệu suất kém trong việc phân lớp các trường hợp Positive ngay cả khi các trường hợp Negative được phân lớp chính xác. Đối với phân lớp không cân bằng, Sensitivity (tỷ
lệ phân lớp Positive đúng) có thể tốt hơn Specificity (tỷ lệ phân lớp Negative đúng). G-Mean kết hợp Sensitivity va Specificity dé cân bằng cả hai yếu tô trên, được tính băng công thức:
G — mean = ,/Sensitivity x Specificity (4.5)
Với:
TP
itivity = ————— 4.6
Sensitivity Oo EN, (4.6)
Specificity = “ki (4.7)pecificity = =ơ-rp .
Bài toán phân lớp giai đoạn giấc ngủ bao gồm 05 lớp: W, NI, N2, N3 va REM. Trong khóa luận này, áp dụng 03 tiêu chí để đánh giá hiệu quả của các mô hình phân loại giai đoạn giấc ngủ, cụ thể là Accuracy, Weighted-averaged F1-score
(WAvg. FI), Weighted-averaged G-mean (WAvg. Gm). WAvg. Fl và WAvg. Gm
là tiêu chí phố biến dé đánh giá hiệu suất của các mô hình trên các bộ dữ liệu không cân bang [44], [45].
K TP,
A = 2L” (4.8)ccuracy M
K
WAvg.F1 = ằ w; < F1 — score; (4.9)
i=1
54
K
WAvg.Gm = ằ w; X G — mean;
i=1
Với:
(4.10)
- K là số lớp, trong bài toán này K = 5 tương ứng với số giai đoạn giấc ngủ.
- M là số mẫu dữ liệu (số lượng epoch 30 giây)
- M¿ là trọng số, được xác định bằng tỷ lệ của mẫu dữ liệu thực tế thuộc lớp i
Wi =
Số lượng mẫu thực tế thuộc lớp i
Tổng số lượng mẫu dữ liệu (4.11)
Bên cạnh đó, khóa luận này cũng đánh giá các mô hình theo từng lớp (giai
đoạn giấc ngủ), bang cách sử dụng per-class precision, per-class recall, per-class F1- score, per-class G-mean. Chúng được tính như trong phân lớp nhị phân bằng cách coi một lớp là lớp Positive và bốn lớp còn lại là lớp Negative.
4.4. _ Kết quả thực nghiệm, đánh giá và bàn luận
4.4.1. Kết quả chung
Sau khi sử dụng các phương pháp để huấn luyện mô hình, khóa luận thực nghiệm kiêm thử các mô hình trên tập kiêm thử đã chia trước đó. Kết quả Accuracy, WAvg. F1 và WAvg. Gm của các phương pháp được thê hiện trong Bảng 4.5.
Bang 4.5: Kết quả Accuracy, WAvg. Fl và WAvg. Gm của các phương pháp
Phương pháp Accuracy | WAvg. F1 | WAvg. Gm
DeepSleepNet 75.20% 75.03% 82.98%
TinySleepNet 81.88 % 81.97% 87.56%
AttnSleep 77.73% 77.56% 84.51%
TS-TCC 70.26% 68.01% 75.84%
CA-TCC 68.66% 69.35% 78.25%
Kết quả cho thấy, các phương pháp đạt hiệu quả khá tốt trên bộ dữ liệu. Phương pháp CA-TCC và TS-TCC cho thấy hiệu suất ở mức trung bình với
55
Accuracy và WAvg. FI khoảng 70%, thấp nhất trong các phương pháp. CA-TCC
dat Accuracy là 68.66% va WAvsg. FI là 69.35%, TS-TCC đạt Accuracy là 70.26%
va WAvsg. FI là 69.35%.
Phương pháp DeepSleepNet, AttnSleep có hiệu quả tốt hơn với Accuracy lần lượt là 75.20%, 77.73% và WAvg. F1 lần lượt là 75.03%, 77.56%.
Phương pháp TinySleepNet có hiệu suất tương đối cao với Accuracy là 81.88% và WAvg. FI là 81.97%, cho thấy khả năng phân lớp chính xác nhất trong
các phương pháp
Ca 5 phương pháp đều cho kết quả WAvg. Gm khá tốt, cho thay các phương pháp phù hợp với bài toán phân lớp giấc ngủ, một bài toán có sự không cân bằng giữa số lượng mẫu dữ liệu thuộc các lớp (số lượng epoch thuộc các giai đoạn giấc
ngủ).
Tổng quan, phương pháp TinySleepNet đạt kết quả tốt nhất trên cả 3 tiêu chí Accuracy, WAvg. Fl và WAvg. Gm, cho thay khả năng phân lớp giữa các giai đoạn giác ngủ tốt nhất. DeepSleepNet và AttnSleep cũng cho thấy hiệu suất ở mức khá. TS-TCC và CA-TCC có hiệu suất ở mức trung bình, CA-TCC có hiệu suất thấp hơn
so với các phương pháp khác.
56
SO SÁNH KET QUA CÁC PHƯƠNG PHAP
90.00%
85.00%
81.88% 81.97%
80.00%
° 7.73% 78.25%
75.00%
70.00%
65.00%
60.00% ==
Accuracy WAvg. Gm
= DeepSleepNet #TinySleepNet AttnSleep &TS-TCC #CA-TCC
Hình 4.3: Biéu do so sánh kết quả giữa các phương pháp
4.4.2. Kết qua của từng giai đoạn
Đề có thé có thêm những đánh giá về hiệu quả của các phương pháp qua đó có những nhìn nhận đánh giá và thử nghiệm cải thiện kết quả, nhóm tiến hành tính toán
per-class precision (PR), per-class recall (RE), per-class Fl-score (F1), per-class G-
mean (GM) của mỗi phương pháp cho từng giai đoạn của giấc ngủ. Kết qua đánh giá được tính toán dựa trên sự so sánh giữa kết quả dự đoán của các phương pháp và nhãn chuẩn của từng giai đoạn giấc ngủ. Accuracy thé hiện tỷ lệ phan trăm của các
dự đoán chính xác, Fl-score đánh giá sự cân bằng giữa độ chính xác và độ phủ của
mô hình, G-mean thê hiện sự cân bằng giữa hiệu suất phân lớp trên cả lớp đa số và lớp thiêu số.
57
Bảng 4.6: Confusion matrix và Kết quả trên từng lớp của DeepSleepNet
DỰ ĐOÁN ĐÁNH GIÁ TRÊN TỪNG LỚP
Ww NI N2 N3 REM PR RE F1 GM
W 9959 347 60 15 110 | 82.61% 94.93% 88.34% 93.38% N1 1229 1927 614 7 713 | 45.54% 42.92% 45.54% 63.37% N2 423. 1,182 9,795 349 2,011 | 85.85% 71.18% 77.83% 81.29% N3 7 15 555 1,773 28 82.54% 74.56% 78.35% 85.87% REM 438 502 3385 4 3,824 | 57.19% 74.21% 64.60% §2.09%
Bang 4.7: Confusion matrix và Kết quả trên từng lớp của TinySleepNet
DU DOAN DANH GIA TREN TUNG LOP
W NI N2 N3 REM PR RE F1 GM
WwW 9,636 707 59 7 82 92.31% 9185% 92.08% 94.33%
NI 708 2,452 1,050 26 254 51.86% 54.61% 53.20% 71.20% N2 51 1044 11,718 504 443 84.60% 85.16% 84.88% 87.80% N3 1 14 516 1,846 1 76.03% 77.63% 76.82% 87.35% REM 43 S11 508 45 4,046 83.84% 78.52% 81.09% 87.49%
Bang 4.8: Confusion matrix và Kết quả trên từng lớp của AttnSleep
DỰ ĐOÁN ĐÁNH GIÁ TRÊN TỪNG LỚP
W NI N2 N3 REM l PR RE Fl GM
W 9,479 653 119 30 210 88.90% 90.35% 89.62% 92.85%
NI 765 1,818 1,086 37 784 43.92% 40.49% 42.14% 61.26% N2 101 1,079 11,453 399 728 83.30% 83.23% 83.27% 86.46% N3 0 8 587 1,783 0 76.26% 74.98% 75.61% 85.88% REM 317 581 504 89 3,662 | 68.02% 71.07% 69.51% 81.93%
Bang 4.9: Confusion matrix và Kết quả trên từng lớp của TS-TCC
DỰ ĐOÁN ĐÁNH GIÁ TRÊN TỪNG LỚP
W NI N2 N3 REM PR RE Fl GM
WwW 8,896 546 903 99 47 87.40% 84.80% 86.08% 89.77%
NI 835 1,072 2,343 80 160 34.39% 23.88% 28.18% 47.26% N2 86 539 12,191 429 515 67.75% 88.60% 76.78% 81.09% N3 10 6 447 1,794 121 68.76% 75.44% 71.95% 85.81% REM 351 954 2,110 207 1,531 | 64.49% 29.71% 40.68% 53.76%
58
Bảng 4.10: Confusion matrix và Kết quả trên từng lớp của CA-TCC
DỰ ĐOÁN ĐÁNH GIÁ TRÊN TỪNG LỚP
W NI N2 N3 REM PR RE Fl GM
Ww 7,576 1,800 606 203 306 93.97% 72.21% 81.67% 84.17%
NI 405 154/7 1,644 120 714 31.29% 34.45% 32.80% 55.47% N2 13 657 11,001 530 1,559 | 75.50% 79.95% 77.66% 82.02% N3 0 6 461 1,774 137 60.90% 74.60% 67.06% 84.91% REM 68 934 859 286 3,006 | 51.99% 58.33% 54.98% 72.89%
Kết quả được thé hiện trong Bang 4.6, 4.7, 4.8, 4.9 và 4.10 cho thay sự khác biệt trong việc phân lớp cho từng giai đoạn giấc ngủ của các phương pháp:
- Giai đoạn W: Phương pháp TinySleepNet đạt Fl-score va G-mean cao nhất
trong các phương pháp với F1-score là 92.08% và G-mean là 94.33%. Các phương
pháp còn lại cũng cho kết quả phân lớp khá cao (trên 80%) cho giai đoạn W này.
- Giai đoạn NI: Phương pháp CA-TCC và TS-TCC cho kết quả thấp, F1- score chỉ khoảng 30%, G-mean chỉ khoảng 50% thấp nhất trong các phương pháp cho giai đoạn NI này. Phương pháp AttnSleep và DeepSleepNet đạt kết quả tốt hơn tuy nhiên van khá thấp. Phương pháp TinySleepNet cho kết quả trung bình, với FI- score trên 50%. Điều cho này cho thay các phương pháp vẫn còn gặp nhiều khó
khăn trong việc phân lớp giai đoạn N1 này.
- GIai đoạn N2: Giai đoạn 2 là giai đoạn có hiệu suất khá tốt khi mà Fl-score đều từ 70% và G mean của các đều từ 80% trên lên. DeepSleepNet đạt precision
85.85% và recall 71.18% trong việc phân loại giai đoạn N2. TinySleepNet có hiệu
suất cao hơn với precision 84.60% va recall 85.16% trong việc phân loại giai đoạn N2. AttnSleep cũng cho thấy hiệu suất tương đương với precision 83.30% và recall
83.23% trong việc phân loại giai đoạn N2. TS-TCC gặp khó khăn hơn với precision
67.75% và recall 88.60% trong việc phân loại giai đoạn N2. CA-TCC có hiệu suất tốt với precision 75.50% và recall 79.95% trong việc phân loại giai đoạn N2. Tóm lại, DeepSleepNet, TinySleepNet và AttnSleep cho thấy hiệu suất tốt trong việc
phân loại giai đoạn N2, trong khi TS-TCC gặp khó khăn hơn. CA-TCC cũng đạt
hiệu suất tốt trong việc phân loại giai đoạn này.
59
- Giai đoạn N3: DeepSleepNet, TinySleepNet và AttnSleep cho thấy hiệu suất tương đối tốt trong việc phân loại giai đoạn N3, với Fl-score từ 75% và G
mean từ 85%. Tuy nhiên, TS-TCC và CA-TCC gặp khó khăn hơn trong việc phân
loại giai đoạn này, có Fl-score chỉ khoảng 60%. Tổng quan, các phương pháp này
có hiệu suất trung bình trong việc nhận diện giai đoạn N3.
- Giai đoạn REM: TinySleepNet cho thấy hiệu suất tương đối tốt trong việc phân loại giai đoạn REM, với precision lên đến 83.84% và G mean là 87.49%. DeepSleepNet và AttnSleep có hiệu suất tương đối trong giai đoạn này với Fl-score
khoảng 60% và Gmean khoảng 80%. Trong khi, TS-TCC và CA-TCC gặp khó khăn
hơn và có hiệu suất thấp hơn, với recall của TS-TCC chi 29.71% và Fl-score tương ứng với TS-TCC và CA-TCC lần lượt là 40.68% và 54.98%. Các phương pháp này
có khả năng phân loại giai đoạn REM ở mức trung bình, cần tiếp tục cải thiện dé đạt
được độ chính xác cao hơn.
KẾT QUA F1-SCORE CUA CÁC PHƯƠNG PHAP
CHO TỪNG GIAI ĐOẠN GIẤC NGỦ
100.00%
92.089
88.34% = Enis
= 84.88% 86.08%
90.00%
80.00%
70.00% IN
60.00%
50.00%
40.00%
30.00%
20.00%
DeepSleepNet TinySleepNet AttnSleep
BW EBN1 EN2 BN3 BREM
Hình 4.4: Kết quả F1-score của các phương pháp cho từng giai đoạn giấc ngủ
Các kết quả này cho thấy đối với phân lớp giai đoạn giấc ngủ từ dữ liệu kênh EEG Fpz-Cz, các phương pháp đều đạt được hiệu quả phân lớp khá tốt trong hầu hết
60
các giai đoạn, tốt nhất là trong giai đoạn W. Tuy nhiên, cả 5 phương pháp đều cho hiệu quả thấp trong giai đoạn N1. Việc phân lớp giai đoạn NI thường khó khăn hon
các giai đoạn khác (N2, N3 va REM) vì nó có đặc trưng tương tự với các giai đoạn
khác và có thời gian ngăn hơn. Giai đoạn NI là giai đoạn ngủ đầu tiên, kéo dai từ 5-
10 phút và chiếm 5% tông thời gian ngủ [46]. Đặc trưng của N1 bao gồm sóng não theta và alpha, nhưng các đặc trưng này cũng xuất hiện ở N2 và REM, gây khó khăn trong việc phân lớp. Do thời gian ngắn và số lượng mẫu dữ liệu ít hơn, các mô hình học sâu có thé gặp khó khăn trong việc học và phân lớp đúng NI [10].
Các phương pháp phân lớp đều có ưu điểm và hạn chế riêng, và hiệu quả phụ
thuộc vào từng giai đoạn. Việc phân lớp giai đoạn NI thường gặp khó khăn hơn do
đặc trưng tương tu với các giai đoạn khác và thời gian ngắn hơn. Dé cải thiện hiệu suất, có thé cần phát triển các phương pháp tập trung vào việc nhận diện và xử lý
các đặc trưng đặc biệt cua từng giai đoạn.
KẾT QUÁ G-MEAN CỦA CÁC PHƯƠNG PHÁP
CHO TỪNG GIAI ĐOẠN GIẤC NGỦ
100.00%
93.38% 94.398 92.85%
F | | 87.35% n 89.77%
90.00% 85.87% B7.80% | 87.49% (86.46% 85.88% 85.81% 24 17, 84.91%O/
81.2994] 82.09% | iim f81.93% | 31.0988) ry 82.0290
80.00% | Fl | bapa |
71.20% pea0/
70.00% r1
68.37% dt ven.
60.00% i. In ị. 0 Í | 0,
| lội 53.76% fl
ry
50.00% H 47.26%
40.00% -MãMẫ.ldi lẩbẩ, bẩbd bkábẩ, lil cl Rl al Kl al
DeepSleepNet TinySleepNet AttnSleep TS-TCC CA-TCC
mW @N1 @N2 BN3 BREM
Hình 4.5: Kết quả G-mean của các phương pháp cho từng giai đoạn giấc ngủ
61