Ảnh huấn luyện không phải khuôn mặt

Một phần của tài liệu Khóa luận tốt nghiệp Tìm hiểu một số phương pháp phát hiện khuôn mặt trong ảnh (Trang 55 - 60)

ADABOOST 2.1.Giới thiệ u

3.3.2.2. Ảnh huấn luyện không phải khuôn mặt

Ta cần nhiều ảnh không khuôn mặt để huấn luyện bộ dò tìm khuôn mặt, vì sựđa dạng của ảnh không khuôn mặt lớn hơn nhiều so với ảnh khuôn mặt. Một lớp ảnh không chứa khuôn mặt là các ảnh phong cảnh chẳng hạn cây, núi, và toà

Trang: 55 nhà. Thu thập tập không khuôn mặt “đặc trưng” là việc khó. Hầu như bất kỳ ảnh nào cũng có thể được xem như là mẫu không khuôn mặt; không gian ảnh không khuôn mặt lớn hơn không gian ảnh khuôn mặt. Tiếp cận thống kê máy học cho rằng ta nên huấn luyện mạng nơ-ron trên cùng phân bố ảnh mà mạng thấy khi chạy. Với bộ dò tìm khuôn mặt, số mẫu khuôn mặt là 15.000 là một số thích hợp. Tuy nhiên, tập đại diện ảnh phong cảnh chứa gần 150,000,000 cửa sổ, và việc huấn luyện trên một cơ sở dữ liệu khuôn mặt có kích thước lớn như vậy là rất khó. Phần tiếp theo mô tả việc huấn luyện trên một cơ sở dữ liệu khuôn mặt này.

™ Phương pháp huấn luyện chủđộng

- Tạo tập khởi tạo các ảnh không khuôn mặt bằng cách tạo 1000 ảnh ngẫu nhiên. Áp dụng các bước tiền xử lý cho mỗi ảnh này.

- Huấn luyện mạng nơ-ron nhân tạo để cho ra 1 với các mẫu khuôn mặt, và -1 với các mẫu không khuôn mặt. Trong lần lặp đầu tiên của vòng lặp, các trọng số mạng được khởi tạo ngẫu nhiên. Sau lần lặp đầu tiên này, ta dùng các trọng sốđược tính qua việc huấn luyện trong lần lặp trước.

- Chạy hệ thống trên ảnh phong cảnh không chứa khuôn mặt. Thu thập các

ảnh con trong đó mạng nhận lầm là khuôn mặt (hoạt hoá đầu ra >0).

- Chọn ngẫu nhiên 250 ảnh con này, áp dụng các bước tiền xử lý, và sau đó thêm chúng vào tập mẫu âm. Sang Bước 2. Thuật toán huấn luyện dùng trong Bước là thuật toán hồi quy lỗi chuẩn. Các nơ-ron dùng hàm kích hoạt dạng tanh, cho đầu ra từ -1 đến 1, do đó ngưỡng 0 với dò tìm là khuôn mặt. Vì ta không huấn luyện với mọi mẫu âm, các đối số xác suất của phần trước không áp dụng cho việc thiết lập ngưỡng dò tìm.

- Vì số mẫu âm lớn hơn nhiều so với số mẫu dương, các bó mẫu huấn luyện chỉ chứa các mẫu âm, sẽ không thích hợp cho việc huấn luyện mạng nơ-ron. Thay vì mỗi bó gồm 100 mẫu dương và âm lấy ngẫu nhiên từ toàn bộ tập huấn luyện, và truyền qua thuật toán hồi quy ngược. Ta chọn các bó huấn luyện có 50% mẫu âm và 50% mẫu dương. Điều này đảm bảo rằng

Trang: 56 ban đầu, khi tập mẫu dương nhiều hơn tập mẫu âm, mạng sẽ học từ cả hai tập.

Hình 3-8: Trong khi huấn luyện, hệ thống đã huấn luyện một phần được áp dụng với các ảnh phong cảnh không chứa khuôn mặt (như bên trái). Bất kỳ vùng nào trong ảnh được dò là khuôn mặt là lỗi, và được thêm vào tập mẫu huấn luyện âm.

Trang: 57

3.4. Quá trình dò tìm khuôn mt

Hình 3-9: Sơ đồ luồng xử lí các bước chính trong vấn đề dò tìmkhuôn mặt Tập mẫu không phải khuôn mặt Tập mẫu khuôn mặt Ảnh thử nghiệm có khuôn mặt Canh biên mẫu khuôn mặt Tiền xử lí tập mẫu học Huấn luyện dò tìm khuôn mặt thẳng Lấy tất cả các cửa sổ cùng với vị trí trên ảnh Tiền xử lí các cửa sổ Xác minh cửa sổ có phải là khuôn mặt hay không Giữ lại vị trí các mẫu là khuôn mặt Kết hợp các khuôn mặt mà vị trí trùng lặp Loại bỏ cửa sổ vì không phải khuôn mặt Các khuôn mặt tại các vị trí khác nhau Sai Đúng

Trang: 58 Mô tả lưu đồ:

- Bước 1: Tiếp nhận ảnh đầu vào có chứa các khuôn mặt.

- Bước 2: Đánh dấu các vị trí có khả năng là các khuôn mặt trên ảnh.

Đây là bước để loại đa số những vị trí không phải là khuôn mặt, chỉ

giữ lại một số ít những vị trí có khả năng là khuôn mặt.

- Bước 3: Thực hiện chuẩn hóa dữ liệu tại những nơi đã đánh dấu ở

bước 2 bằng các phương pháp: cân bằng lược đồ để cải thiện độ sáng và độ tương phản

- Bước 4: Kiểm tra những vị trí đã được chuẩn hóa ở bước 3 có thật sự

là khuôn mặt hay không? Công việc này được thực hiện bởi mạng nơ-ron đã được huấn luyện với nhiều ảnh mẫu là khuôn mặt và không khuôn mặt.

- Bước 5: Đưa ra quyết định đâu là khuôn mặt. Việc làm này được thực hiện bằng việc kết hợp nhiều mạng và một số heuristic đơn giản.

Trang: 59

CHƯƠNG 4: CÀI ĐẶT NG DNG.

4.1. Môi trường TEST

Phần cứng : Một máy tính pentum IV. Card đồ họa 256 MB. Ram 512 MB .

Phần mềm : Ngôn ngữ sử dụng: C# trong bộ visual studio 2005.

Tập ảnh huấn luyện gồm 100 ảnh mặt người và 500 ảnh không là mặt người.

Một phần của tài liệu Khóa luận tốt nghiệp Tìm hiểu một số phương pháp phát hiện khuôn mặt trong ảnh (Trang 55 - 60)

Tải bản đầy đủ (PDF)

(66 trang)