Phương pháp dựa trên sự phân bố

Một phần của tài liệu Phát triển khuôn mặt nghiêng trên ảnh và video (Trang 30 - 31)

Sung và Poggio[15] phát triển một hệ thống phát hiện khuôn mặt dựa trên sự phân bố. Hệ thống chỉ ra sự phân bố của các mẫu ảnh của cùng lớp đối tƣợng có thể đƣợc học từ các mẫu chứa khuôn mặt và không chứa khuôn mặt của cùng lớp đó. Hệ thống của hai ông gồm hai thành phần chính:

- Mô hình phân bố của các mẫu khuôn mặt / không phải khuôn mặt. - Bộ phân loại đa tầng dựa vào thị giác.

Mỗi ảnh khuôn mặt / không phải khuôn mặt đƣợc chuẩn hóa xử lí thành một ảnh có kích thƣớc cố định 19x19 điểm và đƣợc xem nhƣ một véc-tơ 361 chiều. Sau đó các mẫu đƣợc nhóm vào các nhóm, mỗi nhóm gồm sáu mẫu cùng loại là khuôn mặt hoặc không phải khuôn mặt bằng thuật toán k-means:

29

Hình 7 Gom mỗi nhóm có 6 mẫu cùng loại

Mỗi nhóm đƣợc biểu diễn nhƣ một hàm Gauss nhiều chiều với một ảnh trung bình và một ma trận hiệp phƣơng sai. Hai độ đo khoảng cách dùng để tính khoảng cách giữa ảnh đƣa vào và tâm của nhóm. Thành phần khoảng cách đầu tiên là khoảng cách Mahalanobis đƣợc chuẩn hóa giữa mẫu kiểm tra và tâm nhóm nhƣng tính trong không gian con sinh bởi 75 véc-tơ riêng lớn nhất, hai là khoảng cách Ơclit giữa mẫu kiểm tra và hình chiếu trong không gian véc-tơ vừa nói trên. Cuối cùng là dùng mạng đa tầng Multilayer Perceptron Network- MPL đã đƣợc học trƣớc đó để phân loại dựa trên 12 cặp khoảng cách tới mỗi nhóm khuôn mặt và không phải khuôn mặt. Để giải quyết khó khăn khi xây dựng tập mẫu cho huấn luyện họ sử dụng giải thuật bootstrap đƣợc áp dụng cho hệ thống mạng học để tự tăng cƣờng mẫu không phải khuôn mặt.

Một phần của tài liệu Phát triển khuôn mặt nghiêng trên ảnh và video (Trang 30 - 31)

Tải bản đầy đủ (PDF)

(75 trang)