Các tập dữ liệu thử nghiệm

Một phần của tài liệu LA_Nguyễn-Tuấn-Linh (Trang 110 - 112)

5. Bố cục của luận án

3.1.1. Các tập dữ liệu thử nghiệm

Trong thử nghiệm phát hiện VĐBT bằng học sâu, NCS chủ yếu sử dụng 4 tập dữ liệu gồm: UTD [33], MobiFall [115], PTITAct [77] và CMDFALL [113]. Chi tiết về mỗi tập dữ liệu như sau:

UTD [33]: Đây là tập dữ liệu được thu thập từ 12 người đeo 2 cảm biến là cảm biến gia tốc và con quay hồi chuyển với tần số lấy mẫu là 200Hz. Tập dữ liệu cĩ độ dài 30 phút bao gồm 6 hoạt động bình thường và 1 vận động ngã. Để huấn huyện mơ hình CNN với tập dữ liệu này NCS đĩng băng thành phần dành cho cảm biến từ tính và giảm tần số lấy mẫu (down sampling) xuống của các cảm biến khác xuống cịn 100 Hz. Với độ dài cửa sổ trượt là 2 giây sẽ cĩ tổng cộng 900 mẫu được sử dụng cho mơ hình.

MobiFall [115]: Là tập dữ liệu được thu thập từ 15 người để điện thoại thơng minh trong túi quần thực hiện các kiểu vận động ngã khác nhau trên một tấm nệm dày 5cm. Tất cả các vận động ngã đều được hướng dẫn một cách cụ thể để đảm bảo việc thực nghiệm mơ phỏng chính xác nhất vận động ngã trong thực tế. Một chiếc điện thoại nhãn hiệu Samsung Galaxy S3 tích hợp mơ-đun cảm biến quán tính LSM330DLC được sử dụng để thu thập dữ liệu chuyển động. Dữ liệu cảm biến quán tính bao gồm cảm biến gia tốc và con quay hồi chuyển được thu thập với tần số lấy mẫu là 90Hz bằng một ứng dụng được phát triển riêng cài đặt trên chính chiếc điện

thoại này. Tập dữ liệu cĩ độ dài 360 phút bao gồm 9 hoạt động bình thường và 4 loại vận động ngã là các tư thế vận động ngã khác nhau như ngã về phía trước cĩ chống tay, ngã về phía trước cĩ chống đầu gối, ngã nghiêng khi đứng, ngã về phía sau khi cố gắng ngồi lên một chiếc ghế. Để huấn huyện mơ hình CNN với tập dữ liệu này NCS đĩng băng thành phần dành cho cảm biến từ tính và tăng tần số lấy mẫu (up sampling) của các cảm biến khác lên 100 Hz bằng phương pháp GAN cho dữ liệu chuỗi thời gian [15]. Với độ dài cửa sổ trượt là 2 giây sẽ cĩ tổng cộng 10.800 mẫu được sử dụng cho mơ hình.

PTITAct [77]: Là tập dữ liệu được thu thập từ 26 người gắn thiết bị internet vạn vật kết nối (IoT) ở thắt lưng. Thiết bị được tích hợp cảm biến gia tốc, con quay hồi chuyển và từ kế. Dữ liệu cảm biến được thu thập với tần số lấy mẫu là 50Hz. Tập dữ liệu cĩ độ dài 240 phút bao gồm 8 loại vận động ngã ở các tư thế khác nhau và 8 hoạt động bình thường. Trước khi huấn huyện mơ hình CNN, dữ liệu được tăng tần số lấy mẫu lên 100 Hz bằng phương pháp GAN [15]. Tập dữ liệu PTITAct đã được mơ tả chi tiết hơn ở chương số 2 của luận án. Với độ dài cửa sổ trượt là 2 giây sẽ cĩ tổng cộng 7.200 mẫu được sử dụng cho mơ hình.

CMDFALL [113]: Là tập dữ liệu khá lớn và phức tạp được thu thập từ 50 người đeo 2 cảm biến tại vị trí cổ tay và thắt lưng. Tập dữ liệu cĩ độ dài 420 phút gồm 9 nhãn hoạt động bình thường (như đi lại, nằm lên giường, ngồi xuống ghế v.v) và 11 vận động bất thường trong đĩ cĩ vận động ngã như ngã ngửa, ngã về bên trái, đi loạng choạng, trượt chân v.v. Do tần số lấy mẫu của tập dữ liệu là 50Hz nên trước khi thực nghiệm trên tập này, NCS thực hiện tăng tần số lấy mẫu lên 100 Hz bằng phương pháp GAN [15]. Tập dữ liệu CMDFALL đã được mơ tả chi tiết hơn ở chương số 2 của luận án. Với độ dài cửa sổ trượt là 2 giây sẽ cĩ tổng cộng 12.600 mẫu được sử dụng cho mơ hình.

Đây đều là những tập dữ liệu đã được cơng bố và được sử dụng khá rộng rãi trong cộng đồng nghiên cứu về phát hiện VĐBT. Các tập dữ liệu đều cĩ những thách thức như khơng cân bằng và cĩ nhiều vận động bất thường khá giống với vận động

ngã và các hoạt động thường ngày (ví dụ ngã ra giường khá giống với ngồi và nằm xuống giường).

Một phần của tài liệu LA_Nguyễn-Tuấn-Linh (Trang 110 - 112)