3.3.3. Thử nghiệm
3.3.3.1. Thiết lập mơ hình thử nghiệm
Mạng bộ nhớ dài ngắn (LSTM): Được hiệu chỉnh để phù hợp cho các pha huấn luyện và dự đốn trên các tập dữ liệu thử nghiệm, với đặc tính cĩ thể nhớ thơng tin trong một khoảng thời gian dài thì những đặc trưng ở mức cao trích chọn từ dữ liệu cảm biến được sử dụng hiệu quả tại bước dự đốn.
3.3.3.2. Kết quả
Với các thiết lập thử nghiệm, NCS tiếp tục sử dụng phương pháp kiểm chứng chéo 10 lần. Kết quả của mơ hình mạng LSTM phát hiện VĐBT được trình bày chi tiết trong bảng 3.3.
Bảng 3.3. Kết quả của mơ hình sử dụng LSTM trên 4 tập dữ liệu (%)
Tập dữ liệu Độ chính xác Độ bao phủ UTD 89,37 94,03 91,64 MobiFall 83,66 87,12 85,35 PTITAct 89,22 88,96 89,09 CMDFALL 79,23 80,81 80,01 Trung bình 85,37 87,73 86,52
Từ bảng 3.3 cho thấy, mơ hình sử dụng LSTM cũng cho kết quả tốt nhất với tập dữ liệu UDT lên đến 91,64% (vì đây là tập dữ liệu đơn giản nhất với 1 vận động ngã). Tập dữ liệu MobiFall và PTITAct với lần lượt 4 và 8 vận động ngã cũng cĩ kết quả khá tốt lên đến 85,35% và 89,09%. Với 11 vận động ngã và các vận động bất thường khác cĩ độ phức tạp cao, kết quả trên tập dữ liệu CMDFALL thấp nhất nhưng vẫn đạt 80,01%. Kết quả tổng thể trên cả 4 tập dữ liệu đạt 86,52%, thấp hơn một chút so với mơ hình sử dụng CNN đã giới thiệu trong phần 3.2.
Bảng 3.4. So sánh kết quả (F1-score) của mơ hình sử dụng LSTM, RF và SVM trên 4 tập dữ liệu (%)
Phương pháp/tập dữ liệu UTD MobiFall PTITAct CMDFALL
SVM 85,17 78,84 87,12 45,26
RF 88,95 80,41 84,92 51,21
LSTM 91,64 85,35 89,09 80,01
Từ bảng 3.4, một lần nữa cĩ thể thấy rằng, nếu so sánh với phương pháp trích chọn đặc trưng thủ cơng bằng RF và SVM, mơ hình học sâu LSTM với việc tự động học và nhớ các đặc trưng cho kết quả cao hơn khá nhiều trên cả 4 tập dữ liệu, đặc biệt gần gấp đơi trên tập dữ liệu CMDFALL (RF là 51,21%, SVM cịn thấp hơn là 45,26% trong khi đĩ LSTM lên đến 80,01%).
3.4. Mơ hình kết hợp CNN-LSTM phát hiện VĐBT
Qua thử nghiệm với 4 tập dữ liệu, cĩ thể thấy CNN và LSTM đều thể hiện được sự hiệu quả trong phát hiện VĐBT. Đối với mơ hình học sâu CNN với khả năng học các đặc trưng tự động hiệu quả qua các phép nhân chập giữa các bộ lọc, đã lựa chọn được các đặc trưng với đặc tính khơng-thời gian rất tốt. Cịn đối với mơ hình LSTM cho kết quả tương đối tốt xấp xỉ với mơ hình CNN mặc dù học và biểu diễn các đặc trưng khơng-thời gian chưa phải là điểm mạnh của LSTM, nhưng bù lại, LSTM lại cĩ khả năng nhớ các thơng tin theo chuỗi thời gian trong khoảng thời gian dài. Do đĩ, NCS đề xuất phương pháp kết hợp CNN và LSTM với kỳ vọng cĩ thể khai thác được những lợi thế của hai mơ hình, giúp cải thiện hơn nữa hiệu suất của việc phát hiện VĐBT, đặc biệt là các VĐBT phức tạp.
3.4.1. Mơ hình kết hợp CNN-LSTM
NCS đề xuất kiến trúc mạng học sâu nhân chập kết hợp mạng bộ nhớ dài ngắn (CNN-LSTM) trong phát hiện VĐBT ở người. Mơ hình đề xuất được mơ tả trong
hình 3.8, dữ liệu cảm biến được tiền xử lý trước khi đưa vào mạng. Kiến trúc mạng bao gồm 3 thành phần chính: Nhân chập, bộ nhớ dài ngắn và lớp đầu ra.