Nhận dạng khuôn mặt (Face detetion) là bước đầu tiên trong hai bước của quá trình nhận dạng khuôn mặt người (Face recognition). Nhận dạng khuôn mặt là một công nghệđược phát triển rất mạnh đã có nhiều ứng dụng mạnh mẽ trong nhiều lĩnh vực từ công nghiệp, dịch vụ, y tế cho đến quân sự. Nhận dạng khuôn mặt cũng giống như nhận dạng bằng sóng vô tuyến, là một công nghệ nhận dạng tự động AIDC và nằm trong hệ thống các phương pháp nhận dạng dựa trên các đặc điểm sinh trắc học (biometric) bao gồm một số phương pháp như nhận dạng khuôn mặt, nhận dạng vân tay (fingerprint), nhận dạng đồng tử mắt (iris recognition) hay nhận dạng tiếng nói (Voice recognition)…[4, 5, 6]
Xác định khuôn mặt người là một kỹ thuật máy tính dùng để xác định vị trí và kích thước của khuôn mặt từ hình ảnh thu nhận được từ thiết bị thu nhân ảnh [2]. Công nghệ nhận dạng khuôn mặt cho phép phân biệt được khuôn mặt người (face) với các chi tiết không phải khuôn mặt người (non-face) trong ảnh như nhà cửa, cây cối….Lịch sử phát triển của công nghệ nhận dạng khuôn mặt đã trải qua nhiều thập kỷ với sự tiến bộ từ những công nghệ xử lý đơn giản đối với ảnh đen trắng, xám, cho đến ảnh màu và thậm chí là công nghệ nhận dạng 3D như ngày nay. Các yêu cầu đặt ra với bài toán nhận dạng khuôn mặt cũng không ngừng được nâng cao từ lúc ban đầu khi mỗi bức hình đen trắng chỉ có một khuôn mặt, đầu luôn ở tư thế nhìn thẳng cho đến những bức ảnh màu, trong hình gồm nhiều khuôn mặt khác
nhau và có thểở nhiều tư thế cũng nhưở những điều kiện ánh sáng khác nhau. Hiện nay, công nghệ nhận dạng khuôn mặt đã được phát triển giải quyết được những bài toán phức tạp như nhận dạng 3D, nhận dạng thời gian thực khi camera số ghi lại hình ảnh và phần mềm nhận dạng khuôn mặt có thể phát hiện và bám sát mục tiêu được nhận dạng là khuôn mặt. Đây chính là sự tiến bộ vượt bậc khiến công nghệ nhận dạng khuôn mặt đã được áp dụng rộng rãi trong lĩnh vực công nghiệp như áp dụng trong máy ảnh kỹ thuật số (digital camera), trong giao tiếp người và máy tính (human computer interaction), công nghệ nhận dạng khuôn mặt cùng với xác thực khuôn mặt (face authentication) được áp dụng phổ biến trong các hệ thống an ninh (security system) như chứng thực hộ chiếu (passport verification), nhận dạng tội phạm (criminal verification).
Có rất nhiều phương pháp nhận dạng khuôn mặt người, tuy nhiên, tổng kết lại có thể chia làm 4 hướng tiếp cận chính [2]:
• Hướng tiếp cận dựa trên tri thức (knowledge-based).
• Hướng tiếp cận dựa trên các đặc trưng không thay đổi (feature invariant). • Hướng tiếp cận dựa trên so khớp mẫu (template matching).
• Hướng tiếp cận dựa trên diện mạo (appearance-based).
a) Hướng tiếp cận dựa trên tri thức
Hướng tiếp cận này chủ yếu dựa trên các luật định nghĩa về khuôn mặt người. Các luật này thường mô tả về các mối quan hệ giữa các thành phần trên khuôn mặt người. Các quan hệđặc trưng có thểđược mô tả như quan hệ về khoảng cách và vị trí. Theo phương pháp này, những người thực hiện sẽ trích chọn đặc trưng của khuôn mặt trước tiên để có được các ứng viên, sau đó các ứng viên này sẽđược xác định thông qua các luật để biết ứng viên nào là khuôn mặt và ứng viên nào không phải là mặt. Khó khăn với phương pháp này là làm sao chuyển từ tri thức của con người về khuôn mặt sang các luật một cách có hiệu quả vì nếu các luật chặt chẽ quá thì có thể xác định thiếu
luật. Một số phương pháp nghiên cứu theo hướng này như Kanade, G.Yang, Kotropoulos, Sahbi và Boujemaa, Farhad và Abdolhorsein…
b) Hướng tiếp cận dựa trên các đặc trưng không thay đổi
Hướng tiếp cận này tập trung vào việc tìm kiếm những đặc trưng độc lập của khuôn mặt – những đặc trưng không phụ thuộc vào tư thế khuôn mặt nghiêng hay thẳng, điều kiện chiếu sáng, chất lượng hình ảnh v.v. Các đặc trưng thỏa mãn những điều đó gọi là các đặc trưng bất biến và được sử dụng để phát hiện khuôn mặt. Các nghiên cứu đầu tiên sẽ chỉ ra các đặc trưng của khuôn mặt sau đó quyết định xem khuôn mặt có nằm trong ảnh hay không. Các đặc trưng như lông mày, mắt, mũi, miệng và đường viền của tóc được trích chọn bằng phương pháp xác định cạnh. Trên cơ sở các đặc trưng này, xây dựng mô hình thống kê để mô tả quan hệ của các đặc trưng này và xác định sự tồn tại của khuôn mặt trong ảnh. Phương pháp này có thể xác định dựa trên các đặc trưng cạnh của khuôn mặt, phân bố của màu da… với các nghiên cứu của Sirohey, Chetverikov và Lerch, Yow và Cipolla, Augusteijin và Skufca, Sobottka và Pitas…
c) Hướng tiếp cận dựa trên so khớp mẫu.
Trong hướng tiếp cận này, một mẫu khuôn mặt được định nghĩa bằng tay trước hoặc được tham số hóa bằng một hàm số. Mẫu này được sử dụng để phát hiện khuôn mặt người bằng cách quét nó qua ảnh và tính toán giá trị tương đồng cho mỗi vị trí ví dụ về đường viền khuôn mặt, mắt, mũi và miệng. Việc xuất hiện một khuôn mặt tại một vị trí nào đó trong ảnh phụ thuộc và giá trị tương đồng của điểm đó so với mẫu chuẩn. Hướng tiếp cận này có lợi thế là dễ sử dụng, nhưng không có hiệu quả khi tỷ lệ, tư thế và hình dáng thay đổi. Nhiều độ phân giải, đa tỷ lệ, các mẫu con và các mẫu biến dạng được xem xét thành bất biến về tỷ lệ và hình dạng.
Phương pháp tiêu biểu trong hướng tiếp cận này là PCA để xác định hình chiếu của khuôn mặt được sử dụng như các mẫu để xác định khuôn mặt người, hình chiếu được mô tả như một mảng các bit.
d) Hướng tiếp cận dựa trên diện mạo
Phương pháp này thường dùng một mô hình máy học nên còn được gọi là phương pháp máy học (machine learning-based). Ngược với phương pháp so sánh mẫu sử dụng các mẫu được định nghĩa trước, phương pháp này sử dụng những mẫu được rút trích qua một quá trình học. Nói cách khác, các thuật toán dựa trên máy học dùng các kỹ thuật phân tích thống kê và máy học xấp xỉ một hàm phân lớp tuyến tính. Có nhiều mô hình máy học được áp dụng trong hướng tiếp cận này như : Eigenface (M.Turk và A. Pentland), Mô hình dựa trên phân phối (K.Sung và T.Poggion), Mạng nơron (H.Rowley), Support Vector Machine (E.Osuna), Phân lớp Bayes (H.Schneiderman và T.Kanade), Mô hình Markov ẩn (A.Rajagopalan) và các mô hình tăng cường như AdaBoost (P.Viola và M.Jones), FloatBoost (Stan Z.Li và Zhen Qiu
Zhang)…