Hầu hết việc làm trước đây trong hệ thống tự nhận dạng gương mặt đều cho rằng việc nhận ra các góc cạnh của gương mặt trong các trạng thái khác nhau là rất quan trọng trong việc nhận dạng, thừa nhận rằng việc xác nhận trước các khoảng cách là rất quan trọng và cần thiết. Điều đó đề xuất chúng tôi đưa ra phương pháp lý thuyết thông tin cho việc mã hóa và giải mã những ảnh mặt người, đưa ra bản chất nội dung thông tin của những ảnh mặt người, nhấn mạnh những đặc trưng “cục bộ” và “toàn cục”. Những đặc trưng có hoặc không có liên quan trực tiếp đến cách quan sát bằng trực giác của chúng ta về các đặc trưng của gương mặt như cặp mắt, mũi, môi hoặc mái tóc.
Trong ngôn ngữ của lý thuyết thông tin, chúng ta muốn trích xuất các thông tin quan trọng của ảnh mặt người, mã hóa một cách hiệu quả trong phạm vi có thể, và so sánh gương mặt mã hóa với kho dữ liệu của các mẫu được mã hóa một cách tương tự. Một cách dễ dàng để trích xuất thông tin chứa đựng trong bức ảnh mặt người là bằng cách nào đó chỉ ra sự khác biệt trong tập hợp ảnh mặt người, độc lập trong phân tích các nét mặt, và sử dụng những thông tin này mã hóa và so sánh các ảnh gương mặt cá thể.
Về mặt toán học, chúng ta tìm ra các thành phần chính trong sự phân bố của mặt người, hoặc các vectơ riêng (eigenvectors) từ ma trận tương quan của dãy ảnh mặt người. Những vectơ riêng này có thể được xem như là dãy những điểm đặc trưng, chúng liên kết nhau để mô tả sự khác nhau giữa các ảnh mặt người. Mỗi vị trí của ảnh góp phần tạo ra mỗi vectơ riêng, vì vậy ta có thể trình bày vectơ riêng bằng một loại mặt ma “ghostly face” mà ta còn gọi là eigenface. Một số mặt loại này được trình bày trong hình 3.7.
Hình 3.7 Bảy Eigenfaces được tính toán từ dãy huấn luyện của hình 4.6, phông nền đã
được loại bỏ
Mỗi ảnh mặt người trong dãy huấn luyện có thể được tái hiện chính xác thông qua eigenfaces. Số lượng eigenfaces tương đương với sốảnh mặt người được đưa vào huấn luyện. Tuy nhiên các gương mặt có thể xấp xỉ bằng cách chỉ sử dụng “best eigenfaces”, được tạo ra từ các giá trị riêng lớn nhất và từ đó có thể tính toán độ sai biệt lớn nhất với chuỗi ảnh mặt người. Lý do chính cho việc sử dụng ít eigenfaces là nhờ sự hiệu qủa trong quá trình tính toán. M’ eigenfaces sẽ mở rộng ra không gian con M’ chiều - “không gian mặt người”- của tất cảảnh có thể. Đường hình sin biểu thị các pha và tần số khác nhau là hàm cơ bản của phân bố Fourier (là hàm riêng của hệ thống tuyến tính).
Ý tưởng sử dụng eigenfaces được thúc đẩy bởi sự phát triển kỹ thuật của Sirvokick và Kirby - những bức hình miêu tả hiệu qủa các gương mặt sử dụng phương pháp phân tích các thành phần chính (principal component analysis - PCA). Họ chứng minh rằng các bộ sưu tập ảnh mặt người có thể được tạo lại một cách gần đúng bằng việc lưu trữ bộ trọng số cho mỗi gương mặt và một chuỗi nhỏ bức hình chuẩn (có thể
nhỏ hơn rất nhều so với bộ sưu tập ban đầu).
Quá trình nhận dạng có thể tóm tắt như sau:
• Chuẩn bị: Thu thập dãy huấn luyện của ảnh mặt người và tính toán các eigenfaces, xác định không gian mặt người.
• Khi nhận được bức ảnh mới, tính toán dãy trọng số dựa vào ảnh đầu vào và M eigenfaces bằng cách chiếu ảnh đầu vào với từng eigenface.
• Có thể xác định ảnh đầu vào có phải là gương mặt hay không dưa vào việc kiểm tra ảnh đó có gần không gian mặt người hay không.
• Nếu đã là gương mặt thi phân loại các trọng số xem đó có phải người đã biết trước hay chưa.
• (không bắt buộc) Nếu gương mặt chưa biết xuất hiện vài lần thì tính toán các trọng số thành phần và sát nhập vào những gương mặt đã biết (học nhận dạng).