Xác định các thành phần trên khuôn mặt (2 mắt, mũi, miệng)

Một phần của tài liệu XÂY DỰNG ỨNG DỤNG PHÁT HIỆN MẶT NGƯỜI DỰA TRÊN MÀU DA (Trang 30 - 31)

Để hạn chế vùng tìm kiếm trong ảnh, ảnh có thể được xử lý trước bằng cách cho lọc qua 1 bộ lọc phát hiện màu da. Khi đó, ta chỉ cần tìm các bộ phận mắt, mũi, miệng, trong vùng màu da đó. Nhưng đó không phải là bắt buộc, phương pháp vẫn có thể tìm ra được những bộ phận đó mà không cần phải lọc màu da.

Để phát hiện ra các bộ phận đó, các tác giả dựa trên các khung sóng được lấy ra từ ảnh. Các khung sóng này được lấy ra bằng việc sử dụng 1 cặp bộ lọc thông thấp và thông cao. Áp dụng các bộ lọc đó lên ảnh gốc ta thu được 4 ảnh hệ số sóng là: A (approximation), H (horizontal details), V (vertical details), D (diagonal details). Sau đó tiếp tục áp dụng các bộ lọc đó lên các ảnh A, H, V, D đó, ta thu được các ảnh sóng là: AA, AH, AV, AD,… Áp dụng tiếp các bộ lọc này một lần nữa trên các ảnh sóng ta thu được các ảnh kết quả gọi là các băng (band): AAA, AAH,… Tóm lại, sau quá trình này, ta thu được 1 cây khung sóng 3 mức. Giải pháp này đưa ra khả năng phân tích tín hiệu mạnh. Các độ đo thống kê sẽ được đưa ra từ các ảnh hệ số sóng theo 1 trình tự, để xác định các tính chất của bề mặt của các thành phần khuôn mặt.

Dựa trên nhiều thí nghiệm, các tác giả thấy rằng, băng AHH cung cấp các dấu hiệu chắc chắn cho phát hiện mắt và mồm. Còn các đặc trưng của mũi thì được chứng minh là kém ổn định trong các băng sóng, bởi vì nó nghèo đặc trưng và bị thay đổi mạnh khi điều kiện sáng thay đổi hoặc hướng khuôn mặt thay đổi. Bởi vậy, trong giai đoạn khoanh vùng các bộ phận khuôn mặt, các tác giả không thực hiện xác định vùng của mũi. Các thông tin liên qua đến mũi sẽ được sử dụng trong giai đoạn sau của giải thuật.

Để phát hiện ra các thành phần của khuôn mặt, các tác giả sử dụng 1 cửa sổ quét là 40x40 pixel. Lý do sử dụng cửa sổ quét có kích thước cố định này là: các tác giả hướng tới việc phát hiện ra tất cả các thành phần có kích thước khác nhau này chỉ bằng 1 lần quét. Hình dưới đây minh họa 1 tín hiệu AHH với 1 cửa sổ có tâm nằm trên 1 con mắt:

Hình 1.16: Từ trái sang phải và từ trên xuống: ảnh gốc, băng AHH, tín hiệu AHH của mắt và tín hiệu được lấy ra

Hình thức sóng dọc xác định các tính chất của mắt và cho phép phát hiện ra chúng, trong khi đó, tín hiệu này được giữ lại không đổi theo hướng ngang. Do đó, 1 bộ lọc thông thấp theo hướng ngang được sử dụng để đưa ra tín hiệu 1 chiều, kết hợp với các tính chất theo hướng dọc, như thể hiện trong hình trên. Chỉ các cực trị của tín hiệu mới được sử dụng trong phân lớp. Sự quyết định xem trong ô cửa sổ có phải là mắt hay không dựa vào vector dữ liệu. Thành phần của vector này gồm 3 cực đại và 2 cực tiểu (hình trên). Sau đó vector này sẽ được so sánh với 1 vector mẫu được tạo sẵn (dựa trên 1 tập mẫu) dựa trên khoảng cách Mahalanobis. Nếu khoảng cách tính ra nhỏ hơn 1 giá trị ngưỡng thì nó sẽ được coi là mắt.

Quá trình cũng được thực hiện tương tự với phát hiện mồm.

Một phần của tài liệu XÂY DỰNG ỨNG DỤNG PHÁT HIỆN MẶT NGƯỜI DỰA TRÊN MÀU DA (Trang 30 - 31)