Thu thập và chuẩn hóa tập dữ liệu

Một phần của tài liệu luận văn NHẬN DẠNG MẶT NGƯỜI VỚI ĐẶC TRƯNG GABOR WAVELET KẾT HỢP ADABOOST (Trang 85 - 87)

Cài đặt chương trình thực nghiệm, kết quả và đánh giá

4.1Thu thập và chuẩn hóa tập dữ liệu

Trong luận văn này, hệ thống nhận dạng của chúng tôi là hệ thống nhận dạng tĩnh – tĩnh. Tập dữ liệu ảnh khuôn mặt người mà chúng tôi sử dụng là một phần được lấy từ nguồn ORL của T&T. Các ảnh trong nguồn dữ liệu này có định dạng là “PGM“ và kích thước là 92 x 112 pixel. Chúng tôi chọn ra 200 ảnh khuôn mặt của 40 người, như vậy mỗi người sẽ có 5 ảnh được lưu trong tập dữ liệu.

Nhận xét về tập dữ liệu: các ảnh này chỉ chứa phần đầu của người được chụp, khuôn mặt người được chụp chính diện và ở khoảng giữa của ảnh, mỗi khn mặt đều có đầy đủ các thơng tin đặc trưng như mũi, miệng, cằm, gò má, hai mắt, hai chân mày,... Các ảnh này bao gồm cả hai đối tượng nam và nữ. Một số khn mặt hơi nghiêng với góc quay khơng đáng kể và có biểu cảm trên khuôn mặt khác nhau như: bình thường, vui, buồn, cười,… Một vài đối tượng có đeo kính hoặc có râu. Các ảnh được chụp trong các điều kiện ánh sáng khác nhau. Điều này cho thấy tập dữ liệu mà chúng tôi chọn khá đa dạng….

Để huấn luyện cũng như kiểm tra, chúng tơi tiến hành chuẩn hóa các ảnh trong tập dữ liệu thu thập trên để xây dựng nên tập dữ liệu được sử dụng để tiến hành thử nghiệm trong luận văn này. Q trình chuẩn hóa bao gồm các thao tác sau:

• Chuyển tất cả ảnh về cùng định dạng “JPG” .

• Chuyển tất cả ảnh về thành ảnh xám với giá trị mức xám từ 0- 255.

• Loại bỏ những thành phần dư thừa (chẳng hạn như phần nền sau đối tượng được chụp ), chỉ giữ lại những thông tin quan trọng trên khuôn mặt, nghĩa là ảnh chỉ chứa các đặc trưng quan trọng trên khuôn mặt người như: mắt, mũi, chân mày, miệng, gò má, cầm.

• Vị trí mũi nằm ở trung tâm của ảnh.

• Chuẩn hóa các ảnh về cùng một kích thước là 32x32 pixel.

Như vậy, sau khi chuẩn hóa xong, chúng tơi có được một bộ cơ sở dữ liệu gồm 200 ảnh của 40 người, mỗi người có 5 ảnh, các ảnh có kích thước bằng nhau và chỉ chứa những thành phần đặc trưng trên khuôn mặt. Trong 5 ảnh của một người, chúng tôi chọn ra 3 ảnh để huấn luyện và 2 ảnh để kiểm tra. Vậy tập huấn luyện của chúng tơi sẽ có 120 ảnh và tập kiểm tra sẽ có 80 ảnh.

Hình 4.1 sau đây là một phần của tập dữ liệu của chúng tôi, ba cột ảnh đầu là ảnh đem huấn luyện, hai cột ảnh cuối là ảnh đem kiểm tra.

Một phần của tài liệu luận văn NHẬN DẠNG MẶT NGƯỜI VỚI ĐẶC TRƯNG GABOR WAVELET KẾT HỢP ADABOOST (Trang 85 - 87)