Quá trình xử lý của hệ thống đề xuất được thực hiện như hình sau:
Hình 3.5 Giải pháp đề xuất
Võ sư đứng trước camera Kinect và thực hiện những động tác võ thuật. Khi đó, cơ thể võ sư sẽ chuyển động và thể hiện những tư thế đặc trưng của các động tác võ. Khi các tư thế đặc trưng đó được thực hiện trong vùng quan sát của camera Kinect, nó sẽ được ghi nhận lại những thông tin chính là hình chiếu của đối tượng, tức là những hình ảnh với thông tin màu và chiều sâu so với camera Kinect.
Những thông tin hình chiếu này được tiến hành xử lý qua bộ SDK của Kinect. Hệ thống sẽ thực hiện phân tích các dữ liệu cường độ điểm ảnh cũng như thông tin chiều sâu đã có trên cơ sở đối sánh với dữ liệu về cơ thể con người để thực hiện xác định những vị trí khớp trên cơ thể người. Những tính năng này được hỗ trợ từ bộ SDK của Kinect, từ đó ta có thể tận dụng để trích
Khung xương cơ thể Tọa độ các khớp xương Vị trí tương đối của các khớp xương so với nhau Hình chiếu đối tượng Kết quả Tiền xử lý Trích đặc trưng Xây dựng mô hình Huấn luyện Phân lớp
53
rút được thông tin khung xương cơ thể người, cụ thể hơn đó là danh sách của từng điểm trong không gian ba chiều mà trong đó mỗi điểm sẽ có ngữ nghĩa tương ứng là một vị trí khớp cụ thể của người thực hiện. Vì võ sư đã thực hiện những tư thế võ thuật đặc trưng của các bài võ cổ truyền, do đó sau bước này ta sẽ thu được các khung xương tương ứng thể hiện các tư thế võ thuật đặc trưng. Đây chính là những thông tin quan trọng ta cần sử dụng để tiến hành xử lý để nhận dạng ra được trạng thái mong muốn là đầu ra cho chương trình thực nghiệm.
Các khung xương sẽ được tiến hành trích đặc trưng phục vụ nhận dạng, cụ thể hơn trong ngữ cảnh này ta sẽ quan tâm đến việc tính toán một bộ các thông số thể hiện mối tương quan giữa vị tri tương đối của các khớp so với nhau trên một khung xương cụ thể nào đó. Với một khung xương, chính mối tương quan cục bộ này sẽ thể hiện trạng thái tư thế mà người đó đang thực hiện. Ví dụ đơn giản như khi một người thực hiện một cú đá, chân giơ cao, tức là góc giữa đùi và thân người sẽ gần với một góc vuông hơn là một góc bẹt, hay khi một người đứng thẳng, khoảng cách giữa cổ tay với hông sẽ rất nhỏ… Việc của hệ thống là chuẩn bị để thực hiện tính toán những đặc trưng cục bộ như vậy làm cơ sở cho quá trình nhận dạng.
Quá trình tiếp theo đó chính là bước vào việc xây dựng cách thức qua quyết định. Thông thường sẽ gồm hai pha là huấn luyện và phân lớp. Pha huấn luyện sẽ thực hiện trước để tạo ra được một mô hình tối ưu dựa trên tập dữ liệu. Pha phân lớp sử dụng kết quả mô hình của pha huấn luyện để thực hiện tính toán phân lớp trên mẫu dữ liệu khung xương đầu vào mới để ra kết luận về trạng thái khung xương, tức là kết luận về tư thế võ thuật trong ngữ cảnh này.
54