Hệ thống nhận dạng mặt người của Viola và Jones [1] được đánh giá là hệ thống nhận dạng mặt người nhanh và chính xác nhất hiện nay. Viola và Jones xây dựng hệ thống này trên tập huấn luyện gồm 4916 ảnh mặt người và 9500 ảnh background. Hình 37 là kết quả thử nghiệm của Viola và Jones:
Hình 36 - Kết quả thử nghiệm của Viola và Jones
Kết quả trên có được trên tập test gồm 503 ảnh mặt người và 130 ảnh background. Ta thấy với detection rate là 94.1% thì false alarm của họ là 422, tức là bộ nhận dạng nhận nhậm 422 vùng ảnh thành mặt người trong số 75081800 vùng ảnh background đưa vào. Trong khi đó, do hạn chế về số lượng mẫu, mỗi cử chỉ chỉ có được khoảng 30 mẫu chụp, cộng với số lượng phát sinh do các phép biến đổi thì cũng chỉ có 630 mẫu/cử chỉ thì việc kết quả bộ nhận dạng từng cử chỉ của chúng em khi đạt false alarm là 213 trên 84 ảnh negative cũng có thể xem là một kết quả khả quan.
Kolsch [6] cũng áp dụng mô hình Cascade of Boosted Classifiers lên bài toán phân loại cử chỉ với hệ thống gồm 8 cử chỉ:
Hình 37 - Hệ thống 8 cử chỉ trong bài toán của Kolsch
Chúng ta có thể thấy ký hiệu Victory được đề cập có hình dạng giống như cử chỉ V, Lpalm giống với cử chỉ L trong hệ thống cử chỉ mà chúng ta đang sử dụng. Theo kết quả quá trình huấn luyện, với false alarm ở mức 10-5 thì tỉ lệ hitrate giữa ký tự V chúng
Chương 5. Kết quả thử nghiệm
em đã huấn luyện và ký hiệu Victory trong bài viết của Kolsch (chọn false alarm ở mức 10-3) có thể hiện qua biểu đồ sau:
Hình 38 - Biểu đồ so sánh Hit Rate giữa ký hiệu Victory với cử chỉ V
Còn với cùng tỉ lệ false alarm như vậy cho ký tự L và ký hiệu Lpalm, ta sẽ có kết quả như sau:
Hình 39 - Biểu đồ so sánh Hit Rate giữa ký hiệu LPalm với cử chỉ L
Chương 5. Kết quả thử nghiệm
tương quan giữa 2 hệ thống, bởi vì các số liệu trên lấy từ các tập huấn luyện và tập test khác nhau.
Chương 6. Tổng kết
Chương 6 Tổng kết