Nhận dạng sử dụng phương pháp tối ưu bầy đàn

Một phần của tài liệu Ứng dụng cảm biến 3d kinect trong nhận diện ngôn ngữ cử chỉ tiếng việt hỗ trợ việc giao tiếp với người khuyết tật khiếm thính (Trang 34)

Về lý thuyết, rất khó để tìm lời giải tường minh cho phương trình (5) khi mà không gian các lời giải của bài toán là dạng hàm mũ của số bậc tự do của ngón tay. Thật vậy, trong khảo sát của Stenger với hàm mục tiêu Chamfer Distance (Hình 21) cho thấy ngay cả khi các ngón tay của mô hình giả định trùng với mô hình quan sát, việc dịch chuyển của sáu bậc tự do của cổ tay sẽ cho kết quả đồ thị là một hàm có nhiều cực trị.

Hình 21: Đồ thị của Stenger biểu diễn sự biến thiên của hàm đánh giá mục tiêu Chamfer Distance khi bàn tay di chuyển trong không gian.

(a) ảnh đầu vào với 2 mô hình đường biên được vẽ chồng lên, (b) kết quả tách biên của ảnh đầu vào, (c) đồ thị biến thiên của hàm mục tiêu khi dịch chuyển mô hình giả định trong không gian – mô hình giả định này trùng với mô hình quản sát trong hình a , (d) đổ thị biến thiên của hàm mục tiêu khi dịch chuyển mô hình giả định có trạng thái không giống với mô hình quan sát.

Một xu hướng mới hiện nay đó là áp dụng các thuật toán heuristic vào các bài toán tối ưu nhằm tìm ra những giá trị gần với giá trị tối ưu. Các thuật toán xấp xỉ được phát triển để tìm ra những lời giải tốt nằm trong một cận xấp xỉ đối với lời giải tối ưu. Trong bài toán nhận dạng bàn tay, các phương pháp giải thống kê thường được sử dụng như giải thuật Powell [6], giải thuật Nelder – Mead [7], hay giải thuật di truyền [8]. Trong luận văn này, chúng tôi sử dụng phương pháp tối ưu bầy đàn nhờ tốc độ hội tụ nhanh và đơn giản trong cài đặt [9].

Một phần của tài liệu Ứng dụng cảm biến 3d kinect trong nhận diện ngôn ngữ cử chỉ tiếng việt hỗ trợ việc giao tiếp với người khuyết tật khiếm thính (Trang 34)

Tải bản đầy đủ (PDF)

(55 trang)