Thuật tốn PCA

Khuơn mặt con người cĩ rất nhiều nét để nhận biết, nếu như ta gặp lại một người bạn quen cũ sau một thời gian dài, ta cĩ thể nhận ra ngay người đĩ dù những chi tiết cụ thể trên mặt cĩ thể thay đổi như da, mái tĩc. Ta nhận ra khơng phải vì nhớ đơi mắt, hay mũi hay mơi hay tĩc, lơng mày người đĩ mà ta nhận ra vì nhớ diện mạo của người đĩ. Tức là trên khuơn mặt tồn tại một nét tổng thể nào đĩ để cĩ thể nhận diện, thuật tốn của ta bắt đầu từ ý tưởng này.

Phân tích thành phần chính (Principal Component Analysis ) gọi tắt là PCA là thuật tốn nhận dạng ảnh dựa trên những nét tổng thể của khuơn mặt, ta sẽ áp dụng thuật tốn này để thực hiện hai cơng việc sau:

+ Thứ nhất là tìm một khuơn mặt giống với khuơn mặt cho trước. + Thứ hai là xác định vị trí những khuơn mặt người trong một bức ảnh.

Ban đầu ta cĩ một tập ảnh khuơn mặt gọi là tập ảnh huấn luyện (training set). Giả sử mỗi ảnh cĩ kích thước M×N, ta coi mỗi bức ảnh này là một vector trong khơng gian M×N chiều. Bây giờ mỗi khuơn mặt là một vector, ta thấy những vector này khơng phân bố ngẫu nhiên trong khơng gian ảnh mà phân bố theo một quy luật tương đối nào đĩ, ta cĩ thể nĩi những vector này nằm trong một khơng gian con gọi là khơng gian khuơn mặt. Từ những vector trong tập huấn luyện, ta sẽ tìm một cơ sở trực chuẩn cho khơng

- 37 -

gian khuơn mặt. Những vector thuộc cơ sở này cĩ thể coi là những vector mang những nét tổng thể đặc trưng về khuơn mặt.

Giả sử tập huấn luyện cĩ P ảnh, khi đĩ ta sẽ cĩ P vector: T1, T2,…, Tp. Tính vector ảnh trung bình: 1 1 p i i m T p    .

Sự khác biệt giữa những khuơn mặt với ảnh trung bình là những vector:

Ai = Ti – m, với i=1…P

Ý tưởng của việc phân tích thành phần chính là tìm một tập những

vector trực chuẩn uk sao cho những vector này mơ tả tốt nhất sự phân bố

những vector khuơn mặt trong khơng gian. Những vector uk được chọn sao cho:      1 nÕu i = j | u 0 nÕu i j i j u 2 1 p k i u | Ak i     lớn nhất.

Những vector uk và giá trị vơ hướng λkchính là những vector riêng và

trị riêng tương ứng của ma trận AAT.

u | v là tích vơ hướng giữa hai vector u, v và A = [A1A2…Ap].

Ta thấy ma trận A cĩ kích thước M×N×P, cịn ma trận AAT cĩ kích thước (M×N)×(M×N), do kích thước ma trận này quá lớn nên ta khơng thể tìm được những vector riêng và những trị riêng trực tiếp được, thay vào đĩ ta

sẽ tìm những vector riêng của ma trận ATA cĩ kích thước P×P.

Nếu v là một vector riêng của ATA và λ là trị riêng tương ứng, khi đĩ ta cĩ:

ATAv = λv  AATA = λAv, tức là Av là một trị riêng của ma trận AAT. Thơng thường ta chỉ lấy một số Q vector riêng ứng với Q trị riêng cĩ giá trị lớn nhất.

- 38 -

Sau khi cĩ các vector riêng của ma trận AAT, ta sẽ chuẩn hĩa chúng để thu được một cơ sở trực chuẩn của khơng gian khuơn mặt.

Đặt L = ATA, tìm V là tập hợp các vector riêng của L, D là tập hợp các

trị riêng tương ứng.

V bao gồm Q vector riêng ứng với những trị riêng lớn hơn một giá trị nào đĩ hoặc ứng với Q trị riêng lớn nhất trong D.

E = AV là tập các vector riêng của AAT. Do đây là những vector riêng, mà nĩ lại cĩ dạng khuơn mặt nên cịn đuợc gọi là Eigenfaces. E là ma trận M×N×Q, mỗi cột là một vector riêng.

Chuẩn hĩa các vector cột trong E (chia mỗi vector cho độ dài của vector đĩ). Bây giờ, ta cĩ thể coi E là một cơ sở trực chuẩn của khơng gian khuơn mặt.

Với H là bức ảnh cĩ cùng kích thước với những bức ảnh trong tập huấn luyện. Ta sẽ xét nĩ cĩ phải là bức ảnh khuơn mặt hay khơng, cũng như tìm bức ảnh giống với nĩ nhất trong tập huấn luyện.

H được xem là một vector trong khơng gian M×N chiều. Đặt K = H - m với m là vector ảnh trung bình.

Cho V là một khơng gian cĩ tích vơ hướng hữu hạn chiều và W là một

khơng gian con của. Giả sử W cĩ một cơ sở trực chuẩn là {u1,…,uQ}. Khi đĩ hình chiếu trực giao của vector u bất kỳ lên W được xác định như sau:

0 1 Q w i i i pr u u u | u u    

Độ dài uu0 được gọi là khoảng cách từ u đến W.

Tập hợp ci  u | ui , với i = 1,…,Q được gọi là tọa độ của u0 trong

khơng gian W.

Tìm C = ETK là tọa độ của hình chiếu Kf của K lên khơng gian khuơn

- 39 - 1 Q f i i i K c .e 

  với ci = C(i , 1); ei = E(: , i).

Với là một cột trong ma trận A (tương ứng với bức ảnh Ti trong tập huấn luyện). Ta tính ci E AT i là tọa độ của hình chiếu

f i

A của Ai lên khơng

gian khuơn mặt.

Ta tính hai đại lượng sau:

- s = K Kf xem như khoảng cách từ bức ảnh H đến khơng gian mặt

- si = c  ci xem như khoảng cách từ H đến bức ảnh Ti trong tập huấn luyện

Xét α và β là hai ngưỡng nào đĩ.

- s < α thì H là bức ảnh khuơn mặt (do H đủ gần với khơng gian mặt)

- si < β thì Ti là bức ảnh của cùng một người với H. (H đủ gần với Ti ) Vậy là ta đã cĩ thể tìm bức ảnh trong tập huấn luyện giống với bức ảnh H hay xác định đĩ cĩ phải là bức ảnh khuơn mặt hay khơng. Tuy nhiên ảnh H phải cĩ cùng kích thước với những bức ảnh trong tập huấn luyện. Bây giờ trong một bức ảnh lớn H cĩ nhiều khuơn mặt, ta sẽ xác định vị trí những khuơn mặt trong bức ảnh.

- Tại mỗi vị trí (x,y) trong H, đặt H(x,y) là một vùng trong ảnh H cĩ kích thước M×N tại (x,y) ta xem ảnh con H(x,y) là một vector M×N chiều. K(x,y) = H(x,y) – m;

- Tìm K (x, y) là hình chiếu của K(x,y) lên khơng gian khuơn mặt. f

- Tính s(x,y) = K(x, y) K (x, y) f

Tập hợp các giá trị s(x,y) tạo thành một bản đồ khuơn mặt (face map) của H, từ đĩ ta cĩ thể xác định vị trí những khuơn mặt trong ảnh.

- 40 -

CHƯƠNG 3: XÂY DỰNG CHƯƠNG TRÌNH THỬ NGHIỆM

Hướng tiếp cận dựa trên so khớp mẫu

Thuật tốn PCA nhận dạng khuơn mặt người