Kết quả thực nghiệm trên cơ sở dữ liệu ORL

Một phần của tài liệu Đề tài kỹ thuật định danh khuôn mặt dựa vào mẫu nhị phân (Trang 54 - 56)

Cơ sở dữ liệu ORL [1] ( Olivetti Research Laboratory) là bộ dữ liệu chuẩn được công bố công khai bởi AT&T. Cơ sở dữ liệu ORL là một tập dữ liệu hình ảnh của 40 người gồm 400 ảnh, mỗi người có 10 ảnh đại diện khác nhau về thời điểm, biểu cảm khuôn mặt ( buồn, vui…), độ sáng và các chi tiết trên khuôn mặt như đeo kính hoặc không đeo kính. Cơ sở dữ liệu ORL được dùng để thử nghiệm với điều kiện thay đổi ( như tỉ lệ, độ sáng, góc chụp), ảnh mẫu có kích thước 100 x 100 pixel. Và 10 ảnh mẫu của một người trong cơ sở dữ liệu ORL được minh họa như hình 4.1.

39

Hình ảnh minh họa cơ sở dữ liệu ORL sẽđược sử dụng để kiểm chứng đặc trưng thông qua từng thuật toán của các tác giả trong quá trình nghiên cứu và thuật toán RLBP được đề xuất trong nghiên cứu này. Ởđây tôi sử dụng một ảnh mẫu được lấy ra từ 10 ảnh mẫu của cùng một người ở hình 4.1, kết quả hình ảnh đặc trưng khuôn mặt nhị phân tương ứng với từng thuật toán được minh họa trong hình 4.2.

Hình 4.2: Minh họa hình ảnhđặc trưng khuôn mặt với các thuật toán liên quan và thuật toán đề xuất RLBP trên cơ sở dữ liệu ORL.

Trong hình 4.2, Thuật toán LBP được sử dụng rút trích đặc trưng với LBP8,1 ( kích thước ma trận 3 x 3 pixel với 8 điểm lân cận), đồng thời cũng xem xét mở rộng thêm lân cận LBP16,1 ( kích thước ma trận 5 x 5 pixel với 16 điểm lân cận và các thuật toán khác cũng được thực hiện rút trích đặc trưng tương tự. Bên cạnh đó với nghiên cứu này, thuật toán RLBP được đề xuất cũng thực hiện xem xét tương tự với các kích thước 3 x 3 pixel lân cận RLBP8,1 và kích thước 5 x 5 pixel lân cận RLBP16,1. Với sự tương quan như thế giúp cho chúng ta có cái nhìn trực quan trong phương pháp rút trích đặc trưng giữa các

40

thuật toán LBP liên quan và thuật toán RLBP được đề xuất bằng hình ảnh với các lân cận 8 bit, 16 bit. Khi đó với kết quả rút trích đặc trưng thu được bằng hình ảnh, chúng ta có thể thấy thuật toán cải tiến được đề xuất trong nghiên cứu này đã loại bỏđược sự ảnh hưởng của ánh sáng, giảm đáng kể sự tác động của nhiễu và thể hiện rõ nét các đặc trưng của khuôn mặt như đường viền, mắt, mũi, miệng, cằm…, từ những đặc điểm đó đã cho thấy sự biểu hiện đặc trưng khá tương đồng với ảnh mẫu ban đầu được xét.

Để kiểm chứng kết quả đạt được từ hình ảnh rút trích đặc trưng. Trong thực nghiệm trên cơ sở dữ liệu ORL, mỗi người có 10 ảnh mẫu, chúng tôi chọn ra 5 ảnh của mỗi người làm tập huấn luyện, 5 ảnh còn lại dùng để kiểm tra. Tiếp theo thống kê tìm xác suất giống và khác nhau giữa các ảnh trong quá trình huấn luyện với nhiều kích thước có giá trị đặc trưng khác nhau, tương tự khoảng cách cũng có nhiều giá trị khác nhau nhằm có tỉ lệ tương đồng trong quá trình thống kê để cho ra độ đo chính xác (%) cao nhất của từng thuật toán.

Dưới đây là kết quả thống kê được xét. Ảnh khuôn mặt được chia ra với kích thước 10 x 10 ( sẽ có 100 pixel với 100 vùng điểm ảnh xám), tiếp đó phân đoạn từng vùng điểm ảnh xám với nhiều kích thước đặc trưng khác nhau ( 10, 20, 30, 40, 50, 60, 70, 80, 90, 100 đoạn), tương ứng với từng phân đoạn như thế sẽ có các vector đặc trưng ( 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000) và được xét thống kê với 2 trường hợp:

Một phần của tài liệu Đề tài kỹ thuật định danh khuôn mặt dựa vào mẫu nhị phân (Trang 54 - 56)

Tải bản đầy đủ (PDF)

(80 trang)