Xây dựng thuật giả
3.2 Không gian intra-personal và không gian extra-personal
Moghaddam, Wahid và Pentland đã sử dụng cách tiếp cận về thống kê để định nghĩa hai không gian intra-personal và extra-personal như sau: không gian intra-personal (IS) bao gồm sự khác biệt trong các bức ảnh khác nhau của cùng một đối tượng, không gian extra-personal (ES) bao gồm sự khác biệt trong các bức ảnh khác nhau của các đối tượng khác nhau. Ước lượng các phân phối của hai không gian này dựa trên giả định rằng phân phối của không gian intra-personal là phân phối Gauss [23].
Bằng việc sử dụng các vectơ đặc trưng Gabor, hai không gian này được xác định như sau:
( p) ( ) ,q
IS = G I −G I p=q (3.6)
( p) ( ) ,q
ES = G I −G I pq (3.7)
trong đó Ip và Iq là ảnh khuôn mặt của đối tượng p và q ; G(I) là vector đặc trưng Gabor của ảnh I.
Hai không gian IS và ES này hồn tồn rời nhau, do đó từ bài tốn đa lớp ta đã chuyển được về bài toán hai lớp. Các vectơ (hay còn gọi là các mẫu) trong không gian IS được gán nhãn là +1 (mẫu dương tính) và các mẫu trong không gian ES được gán nhãn là -1 (mẫu âm tính), hình 3.2, hình 3.3.
Sau khi chuyển từ bài toán đa lớp (bài toán nhận dạng mặt người) về bài tốn hai lớp. Chúng tơi sẽ dùng phương pháp AdaBoost để chọn lựa đặc trưng và xây dựng nên phân loại mạnh dựa trên các mẫu được lấy từ hai không gian IS và ES. Tập mẫu huấn luyện sẽ được chọn trong không gian: IE=IS ES.
Ví dụ 3.1: Giả sử cơ sở dữ liệu của chúng ta gồm 600 bức ảnh khuôn mặt
của 200 người, như vậy mỗi người sẽ có 3 ảnh lưu trong cơ sở dữ liệu. Khi đó, số lượng mẫu trong không gian IS là: 200 3 600
2
=
ES là: 200 3 200 3 179100
2 2
− =
. Ta thấy rằng số lượng mẫu trong không gian
ES lớn hơn rất nhiều so với số lượng mẫu trong không gian IS. Vậy số lượng mẫu trong không gian IE là 179700.
Hình 3.2 – Một mẫu trong khơng gian IS