Kết quả thực nghiệm trên cơ sở dữ liệu yaleB

Một phần của tài liệu Đề tài kỹ thuật định danh khuôn mặt dựa vào mẫu nhị phân (Trang 62 - 64)

Cơ sở dữ liệu YaleB [2] chứa 2470 hình ảnh khuôn mặt của 38 người khác nhau với các điều kiện biểu hiện trên khuôn mặt với cấu trúc ánh sáng khác nhau ( có ảnh sáng rõ, sáng mờ hoặc bị che khuất một phần hay một bên của khuôn mặt…). Mỗi người có 65 ảnh khuôn mặt đại diện khác nhau, kích thước mỗi ảnh là 168 x 192 pixel. Trong nghiên cứu này, tôi chọn 30 ảnh khuôn mặt rõ nét nhất của mỗi người để làm dữ liệu mẫu thống kê. Hình 4.7, minh họa 30 ảnh khuôn mặt của một người trên cơ sở dữ liệu YaleB.

Hình 4.7: Minh họa các kiểu biểu hiện khuôn mặt trong cơ sở dữ liệu YaleB. Hình ảnh minh họa cơ sở dữ liệu YaleB sẽ được sử dụng để kiểm chứng đặc trưng thông qua từng thuật toán của các tác giả trong quá trình nghiên cứu và thuật toán RLBP được đề xuất trong nghiên cứu này. Ở đây tôi sử dụng một ảnh mẫu được lấy ra từ 30 ảnh mẫu của cùng một người ở hình 4.7, kết quả hình ảnh đặc trưng khuôn mặt tương ứng với từng thuật toán được minh họa trong hình 4.8.

Trong hình 4.8, thuật toán LBP được sử dụng rút trích đặc trưng với LBP8,1 ( kích thước ma trận 3 x 3 pixel với 8 điểm lân cận), đồng thời cũng xem xét mở rộng thêm lân cận LBP16,1 ( kích thước ma trận 5 x 5 pixel với 16 điểm lân cận) và các thuật toán khác cũng được thực hiện rút trích đặc trưng tương tự. Bên cạnh đó với nghiên cứu này, thuật toán RLBP được đề xuất cũng thực hiện xem xét tương tự với các kích thước 3 x 3 pixel lân cận RLBP8,1, kích thước 5 x 5 pixel lân cận RLBP16,1. Với sự tương quan như thế

47

giúp cho chúng ta có cái nhìn trực quan trong phương pháp rút trích đặc trưng giữa các thuật toán LBP liên quan và thuật toán RLBP được đề xuất bằng hình ảnh với các lân cận 8 bit, 16 bit. Khi đó với kết quảrút trích đặc trưng thu được bằng hình ảnh, chúng ta có thể thấy thuật toán cải tiến được đề xuất trong nghiên cứu này đã loại bỏ được sự ảnh hưởng của ánh sáng, giảm đáng kể sự tác động của nhiễu và thể hiện rõ nét các đặc trưng của khuôn mặt như đường viền, mắt, mũi, miệng, cằm…, từ những đặc điểm đó đã cho thấy sự biểu hiện đặc trưng khá tương đồng với ảnh mẫu ban đầu được xét.

Hình 4.8: Minh họa hình ảnh đặc trưng với các thuật toán liên quan và thuật toán đề xuất RLBP trên cơ sở dữ liệu YaleB.

Để kiểm chứng kết quảđạt được từ hình ảnh rút trích đặc trưng. Trong thực nghiệm trên cơ sở dữ liệu YaleB, với 30 ảnh khuôn mặt của mỗi người được chọn, tôi lấy 15 ảnh của mỗi người làm tập huấn luyện, 15 ảnh còn lại dùng để kiểm tra.Tiếp theo thống kê tìm xác suất giống và khác nhau giữa các ảnh trong quá trình huấn luyện với nhiều kích thước có giá trị đặc trưng khác nhau, tương tự khoảng cách cũng có nhiều giá trị khác nhau nhằm có tỉ lệ tương đồng trong quá trình thống kê để cho ra độ đo chính xác phần trăm (%) cao nhất của từng thuật toán.

48

Dưới đây là kết quả thống kê được xét. Ảnh khuôn mặt được chia ra với kích thước 10 x 10 ( sẽ có 100 pixel với 100 vùng điểm ảnh xám), tiếp đó phân đoạn từng vùng điểm ảnh xám với nhiều kích thước đặc trưng khác nhau ( 10, 20, 30, 40, 50, 60, 70, 80, 90, 100 đoạn), tương ứng với từng phân đoạn như thế sẽ có các vector đặc trưng ( 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000) và được xét thống kê với 2 trường hợp:

Một phần của tài liệu Đề tài kỹ thuật định danh khuôn mặt dựa vào mẫu nhị phân (Trang 62 - 64)