Đại diện cho ảnh khuôn mặt dùng Gabor wavelet

Một phần của tài liệu luận văn NHẬN DẠNG MẶT NGƯỜI VỚI ĐẶC TRƯNG GABOR WAVELET KẾT HỢP ADABOOST (Trang 70 - 74)

Xây dựng thuật giả

3.1.2 Đại diện cho ảnh khuôn mặt dùng Gabor wavelet

trong đó: z = (x,y) là một điểm trong khơng gian hai chiều. Các tham số  và  được định nghĩa lần lượt là hướng và tỉ lệ của nhân Gabor, σ là độ lệch chuẩn của phân phối Gauss, ||.|| là tốn tử tính chuẩn.

Một vectơ sóng k , được xác định như sau :

, i i v v k = k e (3.2) trong đó: kmax k f  =  là tần số của sóng, 8  

 = là hướng của sóng, với kmax là tần số tối đa của sóng, f là hệ số khoảng cách giữa các nhân trong miền tần số. Các Gabor wavelet được tạo ra từ một bộ lọc bằng cách thay đổi các hướng và tỉ lệ của vectơ k , .

Chúng tôi sử dụng 8 hướng khác nhau và 5 tỉ lệ khác nhau để tạo thành 40 bộ lọc Gabor, cụ thể {0,..., 7} và {0,..., 4}. Ngồi ra, các thơng số σ, kmax và

f thường được chọn để xây dựng một Gabor wavelet như sau:  =2 ,

max 2

k = 

, f = 2. Với sự lựa chọn hướng và tỉ lệ như vậy, chúng ta có được tất

cả 40 bộ lọc Gabor để biểu diễn cho ảnh khuôn mặt.

3.1.2 Đại diện cho ảnh khuôn mặt dùng Gabor wavelet

Đại diện Gabor wavelet cho một bức ảnh chính là tích chập của ảnh với một tập hợp các bộ lọc Gabor. Cụ thể, gọi I(z) là giá trị mức xám tại điểm ảnh z =

(x,y), các đặc trưng của ảnh tại các vị trí, hướng và tỉ lệ khác được rút trích bằng

cách tính tích chập của I(z) với một bộ lọc Gabor  , ( )z được xác định như sau:

, ( ) ( ) * , ( )

O  z =I z   z (3.3)

Đại lượng O,(z) là một hàm phức với phần thực là R{O,(z)} và phần ảo là I{O,(z)}. Khi đó, với 8 hướng và 5 tỉ lệ khác nhau, tập hợp

 , ( ) : {0,.., 4}, {0,...7}

D= O  z   chính là đại diện Gabor wavelet cho một điểm ảnh I(z). ảnh I(z).

Giá trị về độ lớn của O,(z) được xác định như sau :

2 2

, ( ) { , ( )} { , ( )}

O  z = R O  z +I O  z (3.4) Đại lượng O , ( )z chính là đặc trưng của ảnh tại vị trí z với hướng và tỉ lệ là  và . Ta gọi O , ( )z là một đặc trưng Gabor của điểm ảnh I(z). Tập hợp tất cả các đặc trưng Gabor của điểm ảnh I(z) với 40 bộ lọc Gabor là:

 , ( ) : {0,.., 4}, {0,...7}

S = O  z    . Một vectơ đặc trưng Gabor đại diện cho toàn bộ bức ảnh I có được bằng cách ghép nối theo dòng tất cả các giá trị

, ( ) , , {0,.., 4}, {0,...7}

O  z  z I   .

Ta gọi G(I) là vectơ đặc trưng Gabor của ảnh I .

G I( )=(O0,0 , O0,1 ,..., O0,7 , O1,0 ,...., O4,7 ) (3.5) Như vậy, với một bức ảnh khuôn mặt bất kỳ, dùng 40 bộ lọc Gabor, ta có Như vậy, với một bức ảnh khuôn mặt bất kỳ, dùng 40 bộ lọc Gabor, ta có thể tìm ra được vectơ đặc trưng Gabor đại diện cho bức ảnh đó, hình 3.1. Vấn đề ta cần quan tâm ở đây chính là số chiều của vectơ đặc trưng này. Với một bức ảnh khn mặt có kích thước là M×N thì số chiều của vectơ đặc trưng Gabor là M×N×40. Nghĩa là vectơ đặc trưng Gabor này co số chiều gấp 40 số chiều của ảnh gốc. Chẳng hạn, một bức ảnh khn mặt người có kích thước 64×64 thì vectơ đặc

trưng Gabor có số chiều là 64×64×40=163840. Ta thấy rằng, số lượng đặc trưng như thế lá q lớn, đồng thời số lượng tốn tử tính tích chập cũng lớn dẫn tới chi phí tính tốn rất cao. Câu hỏi đặt ra là: Làm thế nào để giảm được số chiều của vectơ đặc trưng Gabor nhưng vẫn đảm bảo biểu diễn đầy đủ thông tin cho ảnh khn mặt? Nghĩa là ta cần tìm các đặc trưng thật sự quan trọng trong số lượng các đặc trưng lớn như vậy để đại diện cho bức ảnh và đóng vai trị vào việc phân lớp với độ chính xác cao. Do đó, cần có một phương pháp để chọn lựa các đặc trưng quan trọng trong vectơ đặc trưng Gabor có số chiều lớn để hình thành nên một vectơ đặc trưng mới có số chiều nhỏ hơn. Quá trình chọn lựa như vậy nảy sinh hai vấn đề:

• Thứ nhất: Gabor wavelet nào sẽ được chọn trong tất cả 40 Gabor wavelet được dùng?

• Thứ hai: tại điểm ảnh nào sẽ dùng Gabor wavelet nào tương ứng?

Để giải quyết hai vấn đề trên, chúng tôi là sử dụng phương pháp học AdaBoost. Tương tự như công việc của Viola và Jones trong việc sử dụng AdaBoost và đặc trưng Haar-like để giải quyết bài tốn xác định khn mặt người [20], hai tác giả dùng AdaBoost để chọn lựa các đặc trưng Haar-like quan trọng để tiến hành xác định khuôn mặt. Chúng tôi là sử dụng phương pháp học AdaBoost để chọn ra một tập hợp nhỏ các đặc trưng quan trọng từ vectơ đặc trưng Gabor có số chiều lớn ban đầu để hình thành nên vectơ đặc trưng mới có số chiều nhỏ hơn nhưng đảm bảo vẫn đại diện tốt cho bức ảnh khn mặt vì các đặc trưng được chọn lựa theo AdaBoost là các đặc trưng quan trọng nhất và có lỗi nhận dạng thấp nhất. Ngồi ra, AdaBoost cịn có một lợi thế là q trình chọn lựa đặc trưng và xây dựng nên một phân loại mạnh được thực hiện cùng lúc.

Chúng ta biết rằng, bài toán nhận dạng mặt người là bài toán đa lớp. Tuy nhiên, phương pháp AdaBoost mà chúng tơi đã trình bày ở chương 2 lại chỉ áp dụng cho các bài tốn hai lớp. Do đó, một cách tự nhiên là chúng tôi sẽ chuyển đổi bài toán đa lớp như trên thành bài toán hai lớp. Một phương pháp chuyển đổi là

dùng hai không gian intra-personal và không gian extra-personal được đưa ra bởi Moghaddam, Wahid và Pentland [7, 10, 12, 19, 23].

Hình 3.1 – Đại diện Gabor wavelet cho một bức ảnh khuôn mặt. (a) Phần thực của Gabor wavelet đại diện. (b) Độ lớn của Gabor wavelet đại diện.

Một phần của tài liệu luận văn NHẬN DẠNG MẶT NGƯỜI VỚI ĐẶC TRƯNG GABOR WAVELET KẾT HỢP ADABOOST (Trang 70 - 74)

Tải bản đầy đủ (PDF)

(101 trang)