5. Bố cục của luận án
3.2.2. Phát hiện VĐBT bằng mạng CNN
Với lợi thế về phụ thuộc cục bộ và bất biến, CNN đã được nhiều nghiên cứu sử dụng trong lĩnh vực nhận dạng hoạt động nĩi chung và phát hiện VĐBT ở người nĩi riêng [39, 42]. Sự phụ thuộc cục bộ sẽ giúp các tín hiệu lân cận trong HAR cĩ khả năng tương quan với nhau, trong khi sự bất biến đề cập đến sự bất biến tỷ lệ đối với những tốc độ và tần số khác nhau của tín hiệu. Đối với VĐBT, sử dụng CNN cĩ lợi thế trong việc trích xuất và phân lớp đặc trưng một cách tự động và đồng bộ từ đầu đến cuối, CNN sử dụng các trình trích xuất đặc trưng là các phép biến đổi phi tuyến được học trực tiếp từ dữ liệu thơ do đĩ nĩ tạo ra các đặc trưng cĩ tính phân biệt cao đối với các lớp hoạt động của con người [39, 121].
CNN sử dụng cho bài tốn phát hiện VĐBT bao gồm các cấu trúc phân cấp kết hợp với việc nhân chập bằng cách sử dụng các bộ lọc cĩ thể học và các hàm kích hoạt phi tuyến, bao gồm cả việc lấy mẫu và phân lớp. Chúng ánh xạ đầu vào thành một đại diện nhỏ gọn hơn, hoặc phân loại thành các lớp tuỳ theo từng mục tiêu cụ thể. Các lớp nhân chập trích xuất các đặt trưng cụ thể tại những vị trí khác nhau từ đầu vào của chúng. Bằng kỹ thuật xếp chồng và lấy mẫu kết quả đầu ra, CNN sẽ trích xuất các đặc trưng trừu tượng và phức tạp hơn, thực hiện bất biến đối với sự thay đổi và dịch chuyển tạm thời. Đối với bài tốn phát hiện VĐBT, đầu vào cho CNN là chuỗi dữ liệu (thu được từ các cảm biến quán tính) theo thời gian đa kênh đã được phân đoạn thành các cửa sổ trượt theo một khoảng thời cĩ độ dài 2 giây. Cĩ thể coi
đầu vào này là ma trận 2D bao gồm các phép đo T cho mỗi cảm biến D, minh hoạ trong hình 3.2. Ngồi ra, việc nhân chập và lấy mẫu cịn được thực hiện dọc theo trục thời gian, theo cách này CNN trích xuất các vận động của cơ thể theo thứ bậc, từ các vận động cơ bản đến các vận động phức tạp, Bên cạnh đĩ chúng cịn học sự phụ thuộc tạm thời giữa các vận động khác nhau.
Hình 3.2. Dữ liệu cảm biến đầu vào cho CNN