Trong đa số các trường hợp, một hệ nhận dạng mặt người bao gồm hai bộ phận sau
đây [5] :
Bộ dò tìm hay định vị gương mặt người (Face Image Detector) có nhiệm vụ
xác định vị trí của gương mặt từ một bức ảnh bình thường.
Bộ phận nhận dạng hay phân lớp gương mặt (Face Recognizer) được sử
dụng để xác định người có gương mặt tương ứng là ai.
Cả hai bộ phận trên sử dụng cùng một mô hình trong hoạt động : chúng đều có một chức năng rút trích đặc trưng (feature extractor) nhằm biến đổi các điểm ảnh trong ảnh sang dạng biểu diễn vector có ý nghĩa, và một chức năng nhận dạng mẫu (pattern recognizer) có nhiệm vụ tìm kiếm một cá nhân có ảnh được lưu trong cơ sở dữ liệu trùng khớp nhất với ảnh mặt đưa vào.
Tuy nhiên, hai bộ phận trên khác nhau ở chỗ : trong bộ phận dò tìm gương mặt, chức năng nhận dạng mẫu sẽ phân lớp vector đặc trưng cần nhận dạng vào hai lớp : lớp
ảnh mặt người và lớp không phải ảnh mặt người. Trong khi đó, chức năng nhận dạng mẫu của bộ phận nhận dạng / phân lớp gương mặt sẽ phân loại các vector đặc trưng (đã
KHOA CNTT –
ĐH KHTN
================================ ================================ 49 định trong cơ sở dữ liệu (chẳng hạn mặt của anh A, anh B,…). Mô hình tiêu biểu của một hệ nhận dạng mặt người được thể hiện trong Hình 2-1 [5].
Hình 2- 1 : Mô hình nhận dạng mặt người tiêu biểu
Trong bức ảnh ban đầu có thể có rất nhiều thông tin hỗn tạp nên bộ dò tìm thường chỉ cho ra vị trí tương đối của gương mặt. Nhằm xác định chính xác vị trí của gương mặt cho quá trình nhận dạng, những người thiết kế hệ thống nhận dạng mặt người thường sử dụng vị trí của đôi mắt như một thông tin bổ sung cho quá trình định vị. Chính vì vậy mô hình đưa ra trong Hình 2-1 có bổ sung thêm một bộ phận gọi là bộ
phân lập đôi mắt (Eye Localizer). Trong hệ thống này, cả ba bộ phận dò tìm gương mặt, phân lập đôi mắt và nhận dạng mặt đều dựa theo mô hình “rút trích đặc trưng + nhận dạng mẫu”.