Cài đặt chương trình thực nghiệm, kết quả và đánh giá
4.2 Cài đặt chương trình thực nghiệm
Chúng tơi cài đặt chương trình ứng dụng bằng Matlab, version 7.0.1.24704 (R14) Service Pack 1. Chúng tơi sử dụng Matlab vì Matlab có những thư viện và các hàm hỗ trợ rất tốt cho việc xử lý ảnh. Chương trình ứng dụng này nhằm kiểm tra xem người cần nhận dạng có trong tập dữ liệu hay khơng? Nếu có sẽ xuất ra ảnh và tên của người đó trong tập dữ liệu, ngược lại sẽ thơng báo người đó khơng có trong tập dữ liệu.
Đối với các ảnh đem huấn luyện, chúng tôi sử dụng 40 bộ lọc Gabor để rút trích đặc trưng cho các ảnh đó. Mỗi vector đặc trưng Gabor của một ảnh có số chiều là 32.32.40 = 40960 (chiều). Mỗi vector như vậy, chúng tôi sẽ ghi chúng ra thành file text để tiện cho việc sử dụng lại sau này, bởi vì sau khi dùng AdaBoost để chọn lựa các đặc trưng quan trọng để biểu diễn lại cho ảnh, ta khơng cần tính tốn lại mà chỉ duyệt tìm vị trí các đặc trưng đó trong các vector đặc trưng Gabor có số chiều là 40960.
Như vậy, chúng tơi có tất cả 120 vector đặc trưng Gabor có số chiều 40960 để đại diện tạm thời cho 120 ảnh đem huấn luyện. Để có thể tiến hành chọn lựa đặc trưng và tìm phân loại mạnh bằng cách dùng AdaBoost chúng ta cần xây dựng nên tập mẫu hai lớp đem huấn luyện.
Số lượng mẫu trong khơng gian IS (mẫu dương tính) mà chúng tơi chọn là 3
40 120
2
=
mẫu . Ta biết rằng số lượng mẫu trong khơng gian ES (mẫu âm tính)
rất lớn so với số lượng mẫu IS cụ thể là 40 3 40 3 7020
2 2
− =
mẫu. Do đó, để
xây dựng nên tập mẫu huấn luyện bằng AdaBoost, chúng tôi tiến hành chọn ngẫu nhiên 1600 mẫu từ 7020 mẫu âm tính trong khơng gian ES. Như vậy, tập mẫu huấn luyện bằng AdaBoost bao gồm 1720 mẫu, trong đó có 120 mẫu dương tính và cịn lại 1600 mẫu âm tính.
Ta biết rằng số lượng đặc trưng quan trọng cần chọn sau khi huấn luyện bằng AdaBoost cũng chính là số vịng lặp T trong q trình huấn luyện. Ở đây, chúng tôi chọn T = 200, nghĩa là ta chỉ cần 200 đặc trưng Gabor để đại diện cho các ảnh trong tập dữ liệu đem huấn luyện và tập dữ liệu đem kiểm tra.