Dùng mạng Nơ-ron

Một phần của tài liệu Phát triển khuôn mặt nghiêng trên ảnh và video (Trang 31 - 33)

Thực tế chứng minh mạng nơ-ron đã rất thành công trong nhiều bài toán nhận dạng ví nhƣ nhận dạng kí tự, nhận dạng đối tƣợng. Việc phát hiện khuôn mặt có thể xem là việc nhận dạng hai lớp mẫu do đó đã có khá nhiều kĩ thuật sử dụng mạng nơ-ron để phát hiện khuôn mặt. Dƣới đây ta xem xét phƣơng pháp khá điển hình:

Rowley [16,17] sử dụng mạng nơ-ron nhiều tầng để học các mẫu khuôn mặt và không phải khuôn mặt từ các ảnh có khuôn mặt và không chứa khuôn mặt. Khác với nhiều phƣơng pháp trƣớc đó, ông dùng nhiều mạng nơ-ron và vài phƣơng pháp phân

30

tách để tăng cƣờng hiệu quả việc phân loại. Cụ thể hơn có thể hiểu hệ thống của ông có thể xem nhƣ gồm 2 thành phần chính:

Tầng thứ nhất: Hệ thống hai mạng nơ-ron. Đầu vào của các mạng nơ-ron là các vùng với kích thƣớc 20x20 điểm đã qua tiền xử lí của ảnh vào, và đầu ra là một giá trị trong khoảng (-1, 1).

Tầng thứ hai: Một mô-đun thực hiện việc đƣa ra quyết định cuối cùng. Kết hợp các kết quả phát hiện từ các mạng nơ-ron, sử dụng các phép toán logic.

Hình 8 Thành phần đầu của hệ thống

Đƣa vào một mẫu cần kiểm tra, kết quả đầu ra của mạng huấn luyện sẽ gần -1 nếu không phải mẫu khuôn mặt và kết quả gần 1 nếu là mẫu khuôn mặt. Và để phát hiện khuôn mặt trong ảnh cần phải áp dụng trên toàn bộ ảnh. Đối với khuôn mặt kích thƣớc lớn hơn 20x20, lặp lại việc lấy mẫu ở các tỉ lệ khác nhau, các mẫu này chia thành các khối: 4 dạng 10x10, 16 dạng 5x5, 6 dạng 6x6 và áp dụng mạng nơ-ron. Thực tế ông dùng tầm 1500 mẫu ảnh với các tỉ lệ, hƣớng, vị trí và mức sáng khác nhau để huấn luyện mạng. Với mỗi ảnh huấn luyện, gán nhãn cho mắt, đỉnh mũi, góc cạnh và tâm miệng để có thể chuẩn hóa về cùng tỉ lệ, vị trí và hƣớng.

Kết quả trong trƣờng hợp dùng kết hợp hai mạng nơ-ron trên cơ sở dữ liệu CMU đạt tỷ lệ 80.5%, số phát hiện thiếu là 33/169 và số phát hiện sai là 67.

Các phƣơng pháp sau này phát triển dựa trên mạng nơ-ron kết hợp các hƣớng tiếp cận khác cũng có rất nhiều. Việc chọn kích thƣớc mẫu học đƣợc cải tiến cho phù hợp

31

với cấu trúc khuôn mặt (kích thƣớc mẫu có thể là 18x27 điểm), các bƣớc tiền xử lí cũng tốt hơn …

Một phần của tài liệu Phát triển khuôn mặt nghiêng trên ảnh và video (Trang 31 - 33)