X 200x320 512000 double array
5. Tiền xử lý ICA
Thường trước khi ước lượng ICA cho dữ liệu quan sát được người ta áp dụng một hai tiền xử lý để việc ước lượng ICA được thuận lợi hơn [1].
5.1 Qui tâm
Như đã nêu ở trước, các tín hiệu trộn quan sát được x phải có trị trung bình m = E[x] bằng khơng, điều này cũng có nghĩa là các tín hiệu nguồn s cũng có trị trung bình là khơng. Nếu các tín hiệu chưa có trị trung bình là khơng ta thực hiện phép qui tâm tức trừ phân bố của các biến ngẫu nhiên với các trị trung bình của chúng:
{ }
x x= −′ E x′
trong đó x′là vector ngẫu nhiên chưa có trung bình là khơng. Sau khi
đã ước lượng ma trận A và các thành phần s ta có thể thêm trở lại các trị trung bình của chúng. Khi vector ngẫu nhiên x (hoặc s) có trị trung bình là khơng thì hiệp phương sai và tương quan của nó giống nhaụ
5.2 Trắng hóa
Sau khi đã qui tâm các biến ngẫu nhiên x, ta áp dụng một biến đổi tuyến tính trên x để được vector mới là trắng. Sự làm trắng hay trắng hóa whitening), cịn gọi cầu hóa (sphering), có mục đích làm cho dữ liệu bất tương quan. Giả sử ta có vector ngẫu nhiên x bất tương quan, tức các xuyên phương sai của các phần tử bằng không, dẫn đến ma trận hiệp phương sai là ma trận chéo có các số hạng chéo tương ứng với các phương sai của các phần tử của x. Nếu các phương sai này được cho
bằng 1 , nghĩa là ma trận hiệp phương sai được cho bằng với ma trận đồng nhất I thì vector ngẫu nhiên x là trắng:
E[xxT] = I (x là trắng)
Việc làm trắng là một biến đổi tuyến tính
z = Vx
trong đó x là dữ liệu cần làm trắng, V là ma trận làm trắng, z là dữ liệu đã trắng hóạ Cách thường dùng nhất để tìm ma trận làm trắng là thực hiện sự phân ly trị riêng (Eigenvalue Decomposition - EVD) trên ma trận hiệp phương sai:
trong đó E là ma trận trực giao của các vector riêng của E[xxT] và D là
ma trận chéo của các trị riêng của chúng, D = chéo(d1, d2, …,dn), n là số lượng nguồn quan sát được x. Ma trận làm trắng là:
V= ED-1/2ET
Trong đó 1/ 2 -1/2 -1/2
1 n
éo(d ,...,d )
D− =ch ma trận làm trắng trên cũng có thể biểu diễn như:
1/ 2 1/ 2[ T] [ T] xx V =E xx − =C− Trong đó [ T] xx
C =E xx là ma trận hiệp phương saị Vậy
z Vx VAs= = = As%
Trong đó A VA%= là ma trận trộn đã làm trắng. Mặt khác z là dữ liệu đã làm trắng nên E={xxT}=I
{ T} { [ ] }T { T} T
E zz =E As As% % = AE ss A% %=I
Ta cần chú ý rằng các thành phần độc lập si đều giả sử có phương sai
đơn vị. Vậy ma trận đã làm trắng là trực giao (ở ma trận trực giao nghịch đảo bằng chuyển vị: 1 T
A%− = A%).
Ta biết ma trận n x n nếu không trực giao chứa n2 độ tự do, còn nếu trực giao chỉ chứa n(n-1)/2 độ tự dọ Với dữ liệu hai chiều điều này có nghĩa là độ tự do chỉ là một cho một biến đổi trực giaọ Khi số chiều lớn, độ tự do của một ma trận trực giao chỉ là phân nửa độ tự do của ma trận không trực giaọ Do đó người ta nói làm trắng là đã giải quyết phân nửa bài tốn ICẠ Bởi vì trắng hóa là một thủ tục đơn giản hơn bất cứ thuật toán ICA nào nên là một tiền xử lý thông dụng.
Sau khi đã ước lượng ma trận trắng hóa, thì việc ước lượng các thành phần độc lập s trở thành:
s = Wz
trong đó W là đảo nghịch
được W, việc ước lượng ma trận gốc A cho bởi 1/ 2 1/ 2 1/ 2 1 1/ 2 T T A VA D E A A ED A ED W ED W − − − − − = = ⇒ = = = % % Do W trực giao nên W-1=WT Chương 4 NHẬN DẠNG MẶT NGƯỜI DÙNG ICA 1. Yêu cầu
Chương trình thực hiện trên phần mềm Matlab 7
Nhận dạng được khuôn mặt thuộc lớp các khuôn mặt được trong cơ sở dữ liệu ( gồm dữ liệu test và dữ liệu train)
2. Cơ sở
Ngõ vào Tiền xử lý Trích đặc trưng Tập huấn luyện Ngõ ra: Bộ phân loại nhận dạng Cơ sở dữ liệu ảnh mặt 2.1 Ngõ vào
Ngõ vào là ảnh mặt người cần nhận dạng có thể lấy từ nhiều nguồn khác nhau như từ máy ảnh, từ một file ảnh, camera quan sát,…. Trong đề tài này sử dụng tập ảnh màu chỉ chứa phần mặt ngườị
2.2 Khâu tiền xử lý
Ở khâu này, các ảnh được chuẩn hóa đến giá trị mong muốn để cải thiện chất lượng hệ thống nhận dạng. Một số bước tiền xử lý như: cân bằng sáng tối, chuyển ảnh màu về ảnh xám, nâng cao độ tương phản, khử nhiễu…
2.3 Khâu trích đặc trưng
Sau khi qua các bước xử lý từ ảnh thơ ban đầu thành ảnh được chuẩn hóa, ảnh được đưa qua khâu trích đặc trưng để tìm các đặc trưng chính, quan trọng để sử dụng cho phân loạị Nói cách khác, khâu này đưa ra một vector đặc trưng đủ để trình bày ảnh mặt.
Trong khâu này với sự trợ giúp của bộ phân loại, các đặc trưng được trích ra từ ảnh mặt được so sánh với từng ảnh mặt trong cơ sở dữ liệu mặt. Sau bước này, ảnh mặt sẽ được phân loại theo yêu cầụ
2.5 Tập ảnh mẫu cho huấn luyện
Tập ảnh mẫu huấn luyện được dùng trong giai đoạn “học” của hệ thống nhận dạng. Các khâu trích đặc trưng và phân loại sẽ điều chỉnh thông số của chúng để đạt được chất lượng nhận dạng tốt nhất.
2.6 Cơ sơ dữ liệu ảnh mặt
Trên tập huấn luyện ảnh các khn mặt để rút trích các đặc trưng và sinh các ảnh riêng (cịn gọi là eigenface) để tìm một khơng gian con (khơng gian khuôn mặt) trong không gian ảnh. Đưa các ảnh riêng vào quá trình ICA để tìm các trọng số mong muốn. Các ảnh khi chiếu vào không gian khn mặt thì khơng bị thay đổi tính chất cơ bản, trong khi chiếu các ảnh khơng có khn mặt thì xuất hiện sự khác nhau cũng khơng ít. Xác định sự có mặt của một khn mặt trong ảnh thơng qua tất cả khoảng cách giữa các vị trí trong ảnh và khơng gian ảnh.