So sánh và đánh giá

Một phần của tài liệu Tìm hiểu các kỹ thuật áp dụng cho bài toán nhận dạng ký hiệu người câm (Trang 60 - 63)

Hệ thống nhận dạng mặt người của ViolaJones [1] được đánh giá là hệ thống nhận dạng mặt người nhanh và chính xác nhất hiện nay. ViolaJones xây dựng hệ thống này trên tập huấn luyện gồm 4916 ảnh mặt người và 9500 ảnh background. Hình 37 là kết quả thử nghiệm của ViolaJones:

Hình 36 - Kết quả thử nghiệm của Viola và Jones

Kết quả trên có được trên tập test gồm 503 ảnh mặt người và 130 ảnh background. Ta thấy với detection rate là 94.1% thì false alarm của họ là 422, tức là bộ nhận dạng nhận nhậm 422 vùng ảnh thành mặt người trong số 75081800 vùng ảnh background đưa vào. Trong khi đó, do hạn chế về số lượng mẫu, mỗi cử chỉ chỉ có được khoảng 30 mẫu chụp, cộng với số lượng phát sinh do các phép biến đổi thì cũng chỉ có 630 mẫu/cử chỉ thì việc kết quả bộ nhận dạng từng cử chỉ của chúng em khi đạt false alarm là 213 trên 84 ảnh negative cũng có thể xem là một kết quả khả quan.

Kolsch [6] cũng áp dụng mô hình Cascade of Boosted Classifiers lên bài toán phân loại cử chỉ với hệ thống gồm 8 cử chỉ:

Hình 37 - Hệ thống 8 cử chỉ trong bài toán của Kolsch

Chúng ta có thể thấy ký hiệu Victory được đề cập có hình dạng giống như cử chỉ V, Lpalm giống với cử chỉ L trong hệ thống cử chỉ mà chúng ta đang sử dụng. Theo kết quả quá trình huấn luyện, với false alarm ở mức 10-5 thì tỉ lệ hitrate giữa ký tự V chúng

Chương 5. Kết quả thử nghiệm

em đã huấn luyện và ký hiệu Victory trong bài viết của Kolsch (chọn false alarm ở mức 10-3) có thể hiện qua biểu đồ sau:

Hình 38 - Biểu đồ so sánh Hit Rate giữa ký hiệu Victory với cử chỉ V

Còn với cùng tỉ lệ false alarm như vậy cho ký tự L và ký hiệu Lpalm, ta sẽ có kết quả như sau:

Hình 39 - Biểu đồ so sánh Hit Rate giữa ký hiệu LPalm với cử chỉ L

Chương 5. Kết quả thử nghiệm

tương quan giữa 2 hệ thống, bởi vì các số liệu trên lấy từ các tập huấn luyện và tập test khác nhau.

Chương 6. Tổng kết

Chương 6 Tng kết

Một phần của tài liệu Tìm hiểu các kỹ thuật áp dụng cho bài toán nhận dạng ký hiệu người câm (Trang 60 - 63)