5 Nội dung nghiên cứu
2.5 Nhận dạng khuôn mặt với thuật toán ADABOOST
Mục tiêu của quá trình nhận dạng là phân loại phân loại ảnh nhận được dựa trên giá trị của các thuộc tính đơn giản. Có nhiều lý do để đưa đến việc dùng các thuộc tính thay cho phân tích trên các pixel, lý do chính đó là các thuộc tính có thể được dùng để mã hóa thành dạng kiến thức học mà nếu thực hiện dựa trên pixel sẽ chậm hơn rất nhiều. Paul Viola và Michael Johns đã trình bày một phương pháp phát hiện khuôn mặt bằng cách áp dụng chuỗi phân loại với thuật toán Adaboost trong bài báo "Rapid Object Detection using a Boosted Cascade of Simple Features " [4].
Hình 2.14 Dạng thuộc tính Haar-like được dùng trong quá trình phát hiện khuôn mặt : thuộc tính 2 hình chữ nhật ở hình A và B có tác dụng với cạnh, 3 hình chữ nhật ở hình C có tác dụng với đường và 4 hình chữ nhật ở hình C có tác dụng với đường chéo
Các thuộc tính đơn giản được sử dụng gợi nhớ đến các hàm cơ bản của Haar. Chi tiết hơn chúng ta sử dụng 3 dạng thuộc tính như trên hình 5.8 . Giá trị của thuộc tính 2 hình chữ nhật là hiệu của tổng các pixel trong phần xám và các pixel trong phần trắng. Hai hình chữ nhật này có thể nằm theo chiều dọc hoặc ngang nhưng với cùng kích thước. Thuộc tính 3 hình chữ nhật tính tổng 2 phần ngoài rồi trừ cho tổng phần trong. Cuối cùng, thuộc tính 4 hình chữ nhật tính hiệu của tổng 2 cặp hình chữ nhật theo đường chéo.
Giả sử rằng độ phân giải cơ bản của bộ phát hiện là 24x24, một bộ thuộc tính đầy đủ thì khá lớn, trên 180000 thuộc tính. Khác với cơ sở Haar, một tập các thuộc tính như vậy là “quá đầy đủ” vì lý do: một tập
cơ sở không có sự phụ thuộc tuyến tính giữa các phần tử như hình ảnh cần xử lý sẽ có số phần tử tương ứng với số pixel là 576, quá nhỏ so với tập các thuộc tính !