Thống kê vét lân cận cạn

Một phần của tài liệu Đề tài kỹ thuật định danh khuôn mặt dựa vào mẫu nhị phân (Trang 56)

4.2.1.1 Thống kê lân cận 8

Thống kê lân cận 8, ta xét kích thước 3 x 3 pixel với 8 giá trị điểm ảnh xung quanh giá trị điểm ảnh trung tâm như LBP8,1. Sau đây là kết quả độ đo chính xác theo tỉ lệ % đạt được của thuật toán RLBP được đề xuất so với các thuật toán khác được xét với nhiều kích thước đặc trưng phân đoạn khác nhau, như bảng 4.1.

41

Bảng 4.1: Liệt kê độchính xác đạt được của thuật toán RLBP8,1 được đề xuất so với các thuật toán khác trên cơ sở dữ liệu ORL.

Và biểu đồ so sánh kết quảđạt được sau khi thống kê lân cận 8, như hình 4.3.

Hình 4.3: Biểu đồ so sánh Thuật toán RLBP8,1 đề xuất với các thuật toán khác trên cơ sở dữ liệu ORL.

4.2.1.2 Thống kê lân cận 16

Đối với thống kê lân cận 16 không xét lân cận trong ( Lân cận trong là lân cận 8). Ví dụ, Thống kê LBP16,1 không tính LBP8,1 trong trường hợp này. Kết quả độ đo chính xác phần trăm (%) đạt được của thuật toán RLBP16,1 được đề xuất so với các thuật toán khác trên cơ sở dữ liệu ORL, được xét với nhiều kích thước đặc trưng phân đoạn khác nhau, như bảng 4.2.

42

Bảng 4.2: Liệt kê độ đo chính xác (%)đạt được của thuật toán RLBP16,1 được đề xuất so với các thuật toán khác trên cơ sở dữ liệu ORL.

Và biểu đồ so sánh kết quảđạt được sau khi thống kê lân cận 16, như hình 4.4.

Hình 4.4: Biểu đồ so sánh Thuật toán RLBP16,1 đề xuất với các thuật toán khác trên cơ sở dữ liệu ORL.

4.2.1.3 Thống kê vét cạn tổng hợp

Đây là bảng thống kê vét cạn, tổng hợp độ đo chính xác (%) đạt được của thuật toán RLBP8,1, RLBP16,1 được đề xuất với các thuật toán khác, bảng 4.3.

43

Bảng 4.3: Liệt kê tổng hợp độ đo chính xác (%) thống kê vét lân cận cạn.

Và biểu đồ so sánh kết quả đạt được sau khi thống kê độ đo chính xác (%) đạt được của thuật toán RLBP8,1, RLBP16,1 được đề xuất với các thuật toán khác, hình 4.5.

44 4.2.2 Thống kê vét lân cận sâu

4.2.2.1 Thống kê lân cận 16

Đối với thống kê lận cận 16, xét lận cận trong ( là lân cận 8). Sau đó lấy giá trị trung bình của hai lân cận, kết quả đạt được như bảng 4.4.

Ví dụ: d(LBP16,1) = (LBP16,1 + LBP8,1)/2.

Bảng 4.4: Liệt kê độ đo chính xác (%) đạt được của thuật toán RLBP16,1 được đề xuất so với các thuật toán khác trên cơ sở dữ liệu ORL.

Và biểu đồ so sánh kết quảđạt được sau khi thống kê lân cận 16, như hình 4.6.

Hình 4.6: Biểu đồ so sánh Thuật toán RLBP16,1 đề xuất với các thuật toán khác trên cơ sở dữ liệu ORL.

45 4.2.3 Phương pháp thống kê

 Chúng tôi thực hiện thống kê giống và thống kê khác trên toàn bộ cơ sở dữ liệu: Với thống kê giống, dùng 5 ảnh huấn luyện so khớp với 5 ảnh kiểm tra còn lại của chính người đó. Cứ như thế thực hiện thống kê cho hết tất cả 40 người có trong cơ sở dữ liệu, mỗi người sẽ so khớp 5 lần, như vậy sẽ có 200 giá trị thống kê giống đạt được của từng phương pháp.

Với thống kê khác, dùng 5 ảnh huấn luyện của một người so khớp với 5 ảnh kiểm tra của mỗi người. Cứ như thế thực hiện lặp lại cho hết tất cả 40 người có trong cơ sở dữ liệu, mỗi người sẽ so khớp 5 lần, như vậy sẽ có 200 giá trị thống kê khác đạt được của từng phương pháp.

Sau khi có được giá trị thống kê giống và giá trị thống kê khác, chúng tôi cho so sánh nếu giá trị thống kê giống lớn hơn giá trị thống kê khác là 1, ngược lại là 0, thực hiện so sánh tương tự cho hết tổng số lần của thống kê giống và thống kê khác. Có được tổng số lần so sánh đem chia tổng số lần thống kê và nhân với 100 sẽ có được độ đo chính xác phần trăm (%) cho từng phương pháp.

4.2.4 Nhận xét

Xét cả 2 trường hợp thống kê số liệu của thống kê lân cận cạn và thống kê lân cận sâu trên cơ sở dự liệu ORL, thì thuật toán RLBP được đề xuất cho thấy độ chính xác đạt độ đo chính xác (%) có tính ổn định và cao hơn các thuật toán còn lại qua từng kích thước đặc trưng khác nhau cùng với các vùng lận cận khác nhau ( xét thêm vùng lân cận như kích thước 5 x 5 pixel) , mặc dù cũng có một vài thuật toán có độ đo chính xác (%) cao nhưng không ổn định qua từng kích thước đặc trưng phân đoạn trong từng trường hợp khác nhau. Như vậy có thể kết luận rằng với phân đoạn càng lớn thì độ đo chính xác của thuật toán RLBP được đề xuất trong nghiên cứu này càng cao, hơn nữa xét trong hai trường hợp được thực hiện trên cơ sở dữ liệu ORL thì RLBP8,1 đã đạt được kết quả như mong đợi và nhận dạng khuôn mặt có độ chính xác cao 95%.

46

4.3 Kết quả thực nghiệm trên cơ sở dữ liệu yaleB

Cơ sở dữ liệu YaleB [2] chứa 2470 hình ảnh khuôn mặt của 38 người khác nhau với các điều kiện biểu hiện trên khuôn mặt với cấu trúc ánh sáng khác nhau ( có ảnh sáng rõ, sáng mờ hoặc bị che khuất một phần hay một bên của khuôn mặt…). Mỗi người có 65 ảnh khuôn mặt đại diện khác nhau, kích thước mỗi ảnh là 168 x 192 pixel. Trong nghiên cứu này, tôi chọn 30 ảnh khuôn mặt rõ nét nhất của mỗi người để làm dữ liệu mẫu thống kê. Hình 4.7, minh họa 30 ảnh khuôn mặt của một người trên cơ sở dữ liệu YaleB.

Hình 4.7: Minh họa các kiểu biểu hiện khuôn mặt trong cơ sở dữ liệu YaleB. Hình ảnh minh họa cơ sở dữ liệu YaleB sẽ được sử dụng để kiểm chứng đặc trưng thông qua từng thuật toán của các tác giả trong quá trình nghiên cứu và thuật toán RLBP được đề xuất trong nghiên cứu này. Ở đây tôi sử dụng một ảnh mẫu được lấy ra từ 30 ảnh mẫu của cùng một người ở hình 4.7, kết quả hình ảnh đặc trưng khuôn mặt tương ứng với từng thuật toán được minh họa trong hình 4.8.

Trong hình 4.8, thuật toán LBP được sử dụng rút trích đặc trưng với LBP8,1 ( kích thước ma trận 3 x 3 pixel với 8 điểm lân cận), đồng thời cũng xem xét mở rộng thêm lân cận LBP16,1 ( kích thước ma trận 5 x 5 pixel với 16 điểm lân cận) và các thuật toán khác cũng được thực hiện rút trích đặc trưng tương tự. Bên cạnh đó với nghiên cứu này, thuật toán RLBP được đề xuất cũng thực hiện xem xét tương tự với các kích thước 3 x 3 pixel lân cận RLBP8,1, kích thước 5 x 5 pixel lân cận RLBP16,1. Với sự tương quan như thế

47

giúp cho chúng ta có cái nhìn trực quan trong phương pháp rút trích đặc trưng giữa các thuật toán LBP liên quan và thuật toán RLBP được đề xuất bằng hình ảnh với các lân cận 8 bit, 16 bit. Khi đó với kết quảrút trích đặc trưng thu được bằng hình ảnh, chúng ta có thể thấy thuật toán cải tiến được đề xuất trong nghiên cứu này đã loại bỏ được sự ảnh hưởng của ánh sáng, giảm đáng kể sự tác động của nhiễu và thể hiện rõ nét các đặc trưng của khuôn mặt như đường viền, mắt, mũi, miệng, cằm…, từ những đặc điểm đó đã cho thấy sự biểu hiện đặc trưng khá tương đồng với ảnh mẫu ban đầu được xét.

Hình 4.8: Minh họa hình ảnh đặc trưng với các thuật toán liên quan và thuật toán đề xuất RLBP trên cơ sở dữ liệu YaleB.

Để kiểm chứng kết quảđạt được từ hình ảnh rút trích đặc trưng. Trong thực nghiệm trên cơ sở dữ liệu YaleB, với 30 ảnh khuôn mặt của mỗi người được chọn, tôi lấy 15 ảnh của mỗi người làm tập huấn luyện, 15 ảnh còn lại dùng để kiểm tra.Tiếp theo thống kê tìm xác suất giống và khác nhau giữa các ảnh trong quá trình huấn luyện với nhiều kích thước có giá trị đặc trưng khác nhau, tương tự khoảng cách cũng có nhiều giá trị khác nhau nhằm có tỉ lệ tương đồng trong quá trình thống kê để cho ra độ đo chính xác phần trăm (%) cao nhất của từng thuật toán.

48

Dưới đây là kết quả thống kê được xét. Ảnh khuôn mặt được chia ra với kích thước 10 x 10 ( sẽ có 100 pixel với 100 vùng điểm ảnh xám), tiếp đó phân đoạn từng vùng điểm ảnh xám với nhiều kích thước đặc trưng khác nhau ( 10, 20, 30, 40, 50, 60, 70, 80, 90, 100 đoạn), tương ứng với từng phân đoạn như thế sẽ có các vector đặc trưng ( 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000) và được xét thống kê với 2 trường hợp:

4.3.1 Thống kê lân cận cạn

4.3.1.1 Thống kê lận cận 8

Thống kê lân cận 8, ta xét kích thước 3 x 3 pixel với 8 giá trị điểm ảnh xung quanh giá trị điểm ảnh trung tâm như LBP8,1. Sau đây là kết quả độ đo chính xác theo tỉ lệ % đạt được của thuật toán RLBP được đề xuất so với các thuật toán khác được xét với nhiều kích thước đặc trưng phân đoạn khác nhau, như bảng 4.5.

Bảng 4.5: Liệt kê độ chính xác đạt được của thuật toán RLBP8,1 được đề xuất so với các thuật toán khác trên cơ sở dữ liệu YaleB.

49

Hình 4.9: Biểu đồ so sánh Thuật toán RLBP8,1 đề xuất với các thuật toán khác trên cơ sở dữ liệu YaleB.

4.3.1.2 Thống kê lân cận 16

Đối với thống kê lân cận 16 không xét lân cận trong ( Lân cận trong là lân cận 8). Ví dụ, Thống kê LBP16,1 không tính LBP8,1 trong trường hợp này. Kết quả độ đo chính xác phần trăm đạt được của thuật toán RLBP16,1 được đề xuất so với các thuật toán khác trên cơ sở dữ liệu YaleB, được xét với nhiều kích thước đặc trưng phân đoạn khác nhau, như bảng 4.6.

Bảng 4.6: Liệt kê độ đo chính xác (%) đạt được của thuật toán RLBP16,1 được đề xuất so với các thuật toán khác trên cơ sở dữ liệu YaleB.

50

Và biểu đồ so sánh kết quảđạt được sau khi thống kê lân cận 16, như hình 4.10.

Hình 4.10: Biểu đồ so sánh Thuật toán RLBP16,1 đề xuất với các thuật toán khác trên cơ sở dữ liệu YaleB.

4.3.1.3 Thống kê vét cạn tổng hợp

Đây là bảng thống kê vét cạn, tổng hợp độ đo chính xác (%) đạt được của thuật toán RLBP8,1, RLBP16,1 được đề xuất với các thuật toán khác, bảng 4.7.

51

Và biểu đồ so sánh kết quảđạt được sau khi thống kê độ đo chính xác (%)đạt được của thuật toán RLBP8,1, RLBP16,1 được đề xuất với các thuật toán khác, hình 4.11.

Hình 4.11: Biểu đồ so sánh thống kê vét lân cận cạn tổng hợp trên cơ sở dữ liệu YaleB. 4.3.2 Thống kê lân cận sâu

4.3.2.1 Thống kê lân cận 16

Đối với thống kê lận cận 16, xét lận cận trong ( là lân cận 8). Sau đó lấy giá trị trung bình của hai lân cận, kết quả đạt được như bảng 4.8.

Ví dụ: d(LBP16,1) = (LBP16,1 + LBP8,1)/2.

Bảng 4.8: Liệt kê độ đo phần trăm đạt được của thuật toán RLBP16,1 được đề xuất so với các thuật toán khác trên cơ sở dữ liệu YaleB.

52

Và biểu đồ so sánh kết quảđạt được sau khi thống kê lân cận 16, như hình 4.12.

Hình 4.12: Biểu đồ so sánh Thuật toán RLBP16,1 đề xuất với các thuật toán khác trên cơ sở dữ liệu YaleB.

4.3.3 Phương pháp thống kê

 Chúng tôi thực hiện thống kê giống và thống kê khác trên toàn bộ cơ sở dữ liệu: Với thống kê giống, dùng 15 ảnh huấn luyện so khớp với 15 ảnh kiểm tra còn lại của chính người đó. Cứ như thế thực hiện thống kê cho hết tất cả 38 người có trong cơ sở dữ liệu, mỗi người sẽ so khớp 15 lần, như vậy sẽ có 570 giá trị thống kê giống đạt được của từng phương pháp.

Với thống kê khác, dùng 15 ảnh huấn luyện của một người so khớp với 15 ảnh kiểm tra của mỗi người. Cứ như thế thực hiện lặp lại cho hết tất cả 40 người có trong cơ sở dữ liệu, mỗi người sẽ so khớp 15 lần, như vậy sẽ có 570 giá trị thống kê khác đạt được của từng phương pháp.

Sau khi có được giá trị thống kê giống và giá trị thống kê khác, chúng tôi cho so sánh nếu giá trị thống kê giống lớn hơn giá trị thống kê khác là 1, ngược lại là 0, thực hiện so sánh tương tự cho hết tổng số lần của thống kê giống và thống kê khác. Có được tổng số

53

lần so sánh đem chia tổng số lần thống kê và nhân với 100 sẽ có được độđo chính xác phần trăm (%) cho từng phương pháp.

4.3.4 Nhận xét

Xét cả 2 trường hợp thống kê số liệu của thống kê lân cận cạn và thống kê lân cận sâu trên cơ sở dự liệu YaleB, thì thuật toán RLBP được đề xuất cho thấy độ chính xác đạt độ đo chính xác (%)cao hơn các thuật toán còn lại qua từng kích thước đặc trưng khác nhau cùng với các vùng lận cận khác nhau ( xét thêm vùng lân cận như kích thước 5 x 5 pixel). Tuy nhiên xét kích thước 5 x 5 pixel thì RLBP16,1 chưa đạt được kết quả cao tuyệt đối so với các phương pháp khác cùng cùng kích thước tương tự. Như vậy có thể kết luận rằng thuật toán RLBP8,1 được đề xuất trong nghiên cứu này đã đạt được kết quả như mong đợi và nhận dạng khuôn mặt có độ chính xác cao 100%.

4.4 Thời gian thực hiện

Thời gian trung bình thực hiện rút trích đặc trưng trên tổng số ảnh mẫu của từng người, được áp dụng qua từng phương pháp cho từng cơ sở dữ liệu. So sánh thời gian giữa các phương pháp được tính bằng ( mini giây), có thể thấy rằng các phương pháp nhị phân khi rút trích đặc trưng khuôn mặt tiêu tốn rất ít thời gian ( được tính là nhỏ nhất). Các số liệu thời gian được chứng minh trong bảng 4.13.

Bảng 4.9 : So sánh thời gian thực hiện rút trích đặc trưng của các phương pháp trên tổng số ảnh mẫu của một người cho từng cơ sở dữ liệu được tính bằng ( mini giây).

55

CHƯƠNG 5. KT LUN

5.1 Kết quảlàm được

Nhận dạng khuôn mặt là bài toán đặt ra nhiều thách thức cho nhiều nhà nghiên cứu trong việc phát triển, bởi vì khuôn mặt được thu nhận theo nhiều điều kiện và góc độ khác nhau nên chịu ảnh hưởng khá nhiều về sự tác động của ánh sáng , tư thế, biểu cảm và sự che khuất. Chính vì vậy đã có rất nhiều nhà nghiên cứu đưa ra nhiều phương pháp đề xuất khác nhau nhằm giải quyết bài toán đầy phức tạp và thách thức cho nhận dạng khuôn mặt. Trong luận văn này, đã nghiên cứu và tìm hiểu một số công trình nghiên cứu liên quan đã được thực hiện đề xuất trước đây và gần đây trong năm 2017. Dựa vào các nền tảng đã có, trong nghiên cứu này đề xuất phương pháp mẫu nhị phân bền vững ( RLBP) nhằm giảm cường độ điểm ảnh, loại bỏ nhiễu và không bị ảnh hưởng bởi ánh sáng và ít chịu sự tác động của môi trường xung quanh. Qua đó, kết quả thực nghiệm đã thực hiện trên hai bộ dữ liệu ORL [1] và YaleB [2], điều đó chứng minh sự hiệu quả của phương pháp được đề xuất nhằm giải quyết cho bài toán nhận dạng mặt người.

Tuy nhiên, theo hướng mở rộng kích thước 5 x 5 pixel, độ đo chính xác khá cao nhưng không thật sự ổn định trên nhiều cơ sở dữ liệu khác nhau, điều đó đã được thử nghiệm trên hai bộ cơ sở dữ liệu trong luận văn này. Như vậy có thể khẳng định rằng, với phương pháp đề xuất trong luận văn này, xét đặc trưng kích thước 3 x 3 pixel đáp ứng yêu cầu nhận dạng khuôn mặt ổn định và độ đo chính xác cao hơn so với các phương pháp khác cùng kích thước.

5.2 Hướng phát triển

Mục tiêu cho sự phát triển nghiên cứu này, sẽ chú trọng đến sự canh chỉnh độ quay của khuôn mặt, sự che khuất toàn diện nhằm tạo ra ảnh chuẩn và nâng cao hiệu quả nhận

Một phần của tài liệu Đề tài kỹ thuật định danh khuôn mặt dựa vào mẫu nhị phân (Trang 56)

Tải bản đầy đủ (PDF)

(80 trang)