Dữ liệu huấn luyện

Một phần của tài liệu Phát triển khuôn mặt nghiêng trên ảnh và video (Trang 58 - 60)

Trong luận văn này, tôi sử dụng tập ảnh cơ sở dữ liệu nhƣ sau:

 Dữ liệu chứa khuôn mặt:

Dữ liệu chứa khuôn mặt gồm 3198 ảnh khuôn mặt của 41 chủ thể khác nhau đƣợc chụp bằng điện thoại Samsung Omnia i900 5.0Mp và máy ảnh Canon 12MP trong nhiều điều kiện ánh sáng và phông nền khác nhau: dƣới ánh sáng đèn neon, ánh sáng tự nhiên vào các thời điểm khác nhau, các tƣ thế khuôn mặt và cảm xúc khác nhau. Khoảng cách chụp tới chủ thể trong khoảng từ 1- 4m để đảm bảo sự đa dạng về khoảng cách. Trong đó: - 799 ảnh nghiêng trái 30 đến 60 độ - 800 ảnh nghiêng phải 60-90 độ - 799 ảnh nghiêng phải 30-60 độ - 800 ảnh nghiêng trái 60-90 độ Hình 23 Ảnh chụp các chủ thể khác nhau

57

Hình 24 Ảnh trước khi cắt

Hình 25 Ảnh sau khi cắt

Tiếp đến, trong tất cả các mẫu cắt đƣợc sẽ tính tỉ lệ giữa chiều rộng và chiều cao trung bình của tất cả các mẫu, sau đó chuẩn hóa tất cả các mẫu theo tỉ lệ trung bình này. Cuối cùng, chuyển tất cả các mẫu về cùng kích thƣớc để tiến hành huấn luyện.

 Dữ liệu không chứa khuôn mặt:

Dữ liệu không chứa khuôn mặt là dữ liệu không chứa đối tƣợng cần phát hiện. Các ảnh không chứa khuôn mặt đƣợc tải về từ Internet.

http://tutorial-haartraining.googlecode.com/svn/trunk/data/negatives/

Trong cơ sở dữ liệu ảnh này gồm 3024 ảnh xám ở định dạng JPG với kích thƣớc 640x480. Thƣờng số ảnh không chứa khuôn mặt gấp 1.5-2 lần số ảnh chứa khuôn mặt, do đó với mỗi tƣ thế chụp ảnh chứa khuôn mặt ở trên, chúng ta sử dụng 1500 ảnh không chứa khuôn mặt trong cơ sở dữ liệu ảnh trên.

58

Hình 26 Ảnh không chứa khuôn mặt

Một phần của tài liệu Phát triển khuôn mặt nghiêng trên ảnh và video (Trang 58 - 60)