Hình A.4.10. 2- 1:Minh họa kiến trú c1 trong mô hình ICA

Một phần của tài liệu Báo cáo đề xuất phương pháp truy tìm ảnh mặt người trên video (Trang 75 - 77)

tập ảnh cơ sở độc lập thống kê S kết hợp bởi một ma trận trộn A chưa xác định. Thuật toán ICA sẽ xác định các trọng số của ma trận W – được sử dụng để phục hồi lại tập ảnh cơ sở độc lập trong các hàng của U. Trong kiến trúc này sự tách nguồn được thực hiện trên không gian các khuôn mặt. Sự chiếu của tập ảnh đầu vào xuống bộ vectơ học được W sẽ tạo ra các ảnh cơ sở độc lập. Sự biểu diễn nén của một ảnh khuôn mặt (compressed representation) hoặc là sự mã khuôn mặt (code image) là một véctơ các hệ số được sử dụng cho sự kết hợp tuyến tính của tập các ảnh cơ sở độc lập để sinh ra ảnh (các ảnh trong X).

Hàng giữa trong hình dưới chỉ ra 8 ảnh cơ sở sinh ra bởi kiến trúc 1, chúng xác định không gian khuôn mặt không giống như PCA (hàng trên) và ICA kiến trúc 2 (hàng dưới). Barlett [18,19] trước tiên đã áp dụng PCA để chiếu dữ liệu xuống một không gian con m chiều để điều khiển số thành phần độc lập xác định bởi ICA. Một trong các thuật toán ICA được áp dụng lên các vectơ riêng để cực tiểu hóa sự phụ thuộc thống kê giữa các ảnh cơ sở kết quả. Như vậy PCA bất tương quan dữ liệu đầu vào, các sự phụ thuộc bậc cao còn lại được tách ra bởi ICA.

Hình A.4.10.2 - 2: véctơ đặc trưng cho mỗi kĩ thuật. Hàng đầu chứa 8 véctơ riêng với 8 trị riêng lớn nhất trong PCA. Hàng 2 chứa các vectơ đặc trưng trong ICA với kiến trúc I, hàng 3 chỉ ra 8 véctơ đặc

trưng trong ICA với kiến trúc 2.

Mô tả toán học cho kiến trúc I:

Đặt R là ma trận p*m chứa m véctơ riêng đầu tiên của tập n ảnh khuôn mặt (trong PCA). Đặt p là số lượng pixel trong một ảnh huấn luyện. Các hàng của ma trận dữ liệu đầu vào ICA là các biến ngẫu nhiên và các cột là các sự quan sát vì vậy ICA được thực hiện trên RT ,m ảnh cơ sở độc lập trong các hàng của U được tính toán bởi U = W*RT. Sau đó ma trận B n*m các hệ số ICA cho sự kết hợp tuyến tính của tập ảnh cơ sở độc lập trong U được tính toán như sau:

Đặt C = X * R (C kích thước n*m) như vậy X = C * RT (R trực giao). Từ U = W*RT và thừa nhận rằng W khả nghịch ta có

RT = W-1 * U. Vì vậy X = C * RT = C * W-1 * U = B * U.

Mỗi hàng của B chứa các hệ số cho sự kết hợp tuyến tính các ảnh cơ sở để tạo nên các ảnh khuôn mặt tương ứng các hàng trong X. Vì vậy X là sự xây dựng lại của dữ liệu ban đầu với bình phương lỗi nhỏ nhất như trong PCA

Hình A.4.10.2 - 3:Mô hình tổng hợp ảnh cho kiến trúc 1 của ICA

Một phần của tài liệu Báo cáo đề xuất phương pháp truy tìm ảnh mặt người trên video (Trang 75 - 77)