Máy vector hỗ trợ là một thuật toán học máy nổi tiếng được sử dụng để giải quyết bài toán phân lớp. Thuật toán SVM ban đầu được phát minh bởi
30
Vladimir N. Vapnik [24], là một bộ phân loại tuyến tính, phương pháp của nó dựa trên lý thuyết học thống kê và hàm hạt nhân. Ý tưởng của SVM là nhận dữ liệu vào và phân loại chúng vào hai lớp khác nhau. SVM đã được áp dụng rất thành công trong việc giải quyết các vấn đề của thế giới thực như nhận dạng văn bản, hình ảnh, chữ viết tay…
Cho một tập huấn luyện gắn nhãn (1.4) với (1.5). Các hàm dưới đây có thể được sử dụng để phân lớp dữ liệu SVM: - Hàm tuyến tính: (1.6) - Hàm đa thức: (1.7) - Hàm cơ sở bán kính: (1.8) - Hàm Sigmoid: (1.9) Với là các tham số.
Các tác giả đã tiến hành thử nghiệm một hệ thống phân loại giới tính tự động bằng cách phân tích dữ liệu từ trạng thái hoạt động của con người. Hệ thống phân loại giới tính bao gồm ba giai đoạn:(1) phát hiện, khai thác việc di chuyển của cơ thể người và đánh dấu đường viền của nó từ hình ảnh quỹ đạo; (2) xây dựng mô hình trạng thái hoạt động của con người từ những góc khớp và các điểm nối cơ thể; (3) phân tích chuyển động và trích xuất đặc trưng để phân loại giới tính trong các mẫu trạng thái hoạt động.
Một tập tuần tự các khung xương 2D được sử dụng để biểu diễn cho mô hình trạng thái hoạt động là dữ liệu đặc trưng trạng thái hoạt động dựa
31
trên thông số chuyển động. Sau đó, một bộ phân lớp SVM được sử dụng để phân loại giới tính trong mô hình trạng thái hoạt động. Thí nghiệm được thực hiện trên 100 đối tượng khác nhau (84 nam và 16 nữ), mỗi đối tượng xây dựng 7 mô hình trạng thái hoạt động. Trong 700 mô hình trạng thái hoạt động (≈19,534 hình ảnh), được trích xuất thành các vector, các nhà nghiên cứu chọn ra 400 vector để huấn luyện, 100 vector để đánh giá, và 200 vector dùng để kiểm tra. Kết quả phân loại giới tính đạt 96%.
Hình 1.16. Mẫu mô hình trạng thái hoạt động
Các tác giả sử dụng SVM với mục đích nhận dạng tự động loại trạng thái hoạt động của hai nhóm người: trẻ tuổi và lớn tuổi từ mô hình trạng thái hoạt động tương ứng. Nghiên cứu này sử dụng hệ thống phân tích chuyển động PEAK-2D để phân tích dữ liệu về khoảng cách tối thiểu bàn chân. Khi 30 người trẻ tuổi và 28 người lớn tuổi tiến hành thử nghiệm đi bộ liên tục với
32
tốc độ tự chọn trong 20 phút trên máy chạy bộ, các mẫu trạng thái hoạt động được trích xuất về khoảng cách tối thiểu bàn chân được sử dụng để huấn luyện SVM. Kết quả kiểm tra cho biết hiệu suất tổng quát để nhận dạng trạng thái hoạt động người trẻ và người già của phương pháp SVM trung bình là 83.3% ( so với kết quả chính xác 75.0% ( khi dùng phương pháp mạng nơron để nhận dạng trên tập dữ liệu này.