CHƯƠNG 3: CÀI ĐẶT VÀ THỰC NGHIỆM
Chương này mơ tả các phương pháp sử dụng để đánh giá dữ liệu cảm biến gia tốc, tìm kiếm mơ hình hoạt động và huấn luyện phân lớp để dự đốn cho dữ liệu mới với các hành vi tương ứng.
3.1. Bộ dữ liệu nhận dạng hành vi
Giả thuyết của luận văn này là kiểm tra khả năng thực hiện một thuật tốn phân loại trên điện thoại thơng minh để nhận dạng hành vi con người, cĩ tính đến sự đánh giá pin và hạn chế bộ nhớ. Với mục đích này, chúng cần nghiên cứu các kỹ thuật cần thiết cho bộ tiền xử lý và phân loại dữ liệu gia tốc, sử dụng một bộ dữ liệu cạnh tranh.
Trong luận văn này, bộ dữ liệu về nhận dạng hành vi được cung cấp sẵn [6] với đặc tính của dữ liệu:
Các thí nghiệm được tiến hành với một nhĩm 30 tình nguyện viên trong phạm vi độ tuổi từ 19 tuổi đến 48 tuổi. Mỗi người thực hiện 6 hành vi và đeo một chiếc điện thoại thơng minh (Galaxy S II) vào thắt lưng, đặt theo chiều dọc. Sử dụng cảm biến gia tốc, con quay hồi chuyển họ đã lấy được dữ liệu gia tốc tuyến tính 3 trục và vận tốc gĩc 3 trục ở một tốc độ khơng thay đổi 50Hz. Các thí nghiệm được ghi hình lại để gán nhãn dữ liệu bằng tay.
Hình 3.1: Thu thập dữ liệu từ cảm biến của điện thoại thơng minh
Bộ dữ liệu này cung cấp các tín hiệu gia tốc và con quay hồi chuyển cho mỗi bộ dữ liệu (huấn luyện và kiểm thử) cũng như các nhãn hành vi cho mỗi trường hợp.
“Các tín hiệu cảm biến (gia tốc và con quay hồi chuyển) được tiền xử lý bằng cách áp dụng các bộ lọc nhiễu và sau đĩ lấy mẫu với cửa sổ trượt 2,56 giây và 50% chồng chéo. Tín hiệu cảm biến gia tốc, trong đĩ thành phần hấp dẫn và chuyển động cơ thể được phân tách bằng bộ lọc thơng thấp Butterworth. Lực hấp dẫn được giả định là thành phần cĩ tần số thấp, do đĩ một bộ lọc với tần số cắt 0.3Hz được sử dụng. Với mỗi cửa sổ, một vector tính năng được thu lại bởi cách tính tốn từ biến thời gian và miền tần số.” [6]
Hình 3.2: Ví dụ về dữ liệu của cảm biến gia tốc
Các tính năng này được chuẩn hĩa và giới hạn trong khoảng [-1, 1]. Việc chuẩn hĩa được thực hiện theo hàm số:
Trường xNorm là tính năng được chuẩn hĩa, x là các tính năng và Min và Max là các giá trị tối thiểu và tối đa tương ứng với tính năng x.
Để một phân loại chính xác hơn, các bộ dữ liệu nên được cân bằng và tất cả 6 lớp nên cùng cĩ một số trường hợp. Sự phân lớp từ các dữ liệu cạnh tranh được giới thiệu trong bảng 3.1.