Ảnh hưởng củ ak đến tỷ lệ nhận dạng đúng của phương pháp RLHD trong

Một phần của tài liệu Phương pháp nhận dạng khuôn mặt trong điều kiện đơn mẫu dựa trên độ đo lt mhd (Trang 118)

5 KẾT QUẢ MÔ PHỎNG

5.17 Ảnh hưởng củ ak đến tỷ lệ nhận dạng đúng của phương pháp RLHD trong

các điều kiện góc nhìn khác nhau của khuôn mặt

5.6.3 Nhận dạng khuôn mặt với các cảm xúc khác nhau của khuôn mặt

Trong phần này, tỷ lệ nhận dạng của các phương pháp trong trường hợp khuôn mặt được chụp có các biểu cảm khác nhau như cười hay giận dữ sẽ được khảo sát. 100 ảnh chính diện với khuôn mặt không cảm xúc của 100 người trong tập dữ liệu AR được sử dụng như tập mẫu. Mỗi người trong tập mẫu tương ứng sẽ có 02 ảnh với biểu cảm cười và giận dữ được sử dụng cho 02 tập kiểm tra.

Bảng 5.9 trình bày tỷ lệ nhận dạng khuôn mặt của các phương pháp NMHD và LT- NMHD trong các điều kiện cảm xúc khác nhau của khuôn mặt. Khi khuôn mặt được chụp với các cảm xúc khác nhau sẽ làm giảm tỷ lệ nhận dạng của phương pháp NMHD là 12% và với phương pháp LT-NMHD là 4%. Như vậy có thể thấy rằng phương pháp LT-NMHD cũng cho thấy khả năng bền vững hơn phương pháp NMHD trong điều kiện khuôn mặt được chụp với các cảm xúc khác nhau. Về mặt trung bình, phương pháp LT-NMHD cho kết quả nhận dạng khuôn mặt chính xác cao hơn phương pháp NMHD khoảng 17%. Và đặc biệt, phương pháp LT-NMHD cho kết quả nhận dạng khuôn mặt chính xác cao hơn đến 30% so với phương pháp NMHD trong điều kiện khuôn mặt có cảm xúc cười. Khi có thêm chỉ số về độ tin cậy, phương pháp NMHD vẫn cho kết quả thấp hơn phương pháp LT-NMHD khoảng 5% về mặt trung bình khi nhận dạng khuôn mặt trong điều kiện các cảm xúc khác nhau của khuôn mặt. Như vậy,trong điều kiện nhận dạng khuôn

Hình 5.18: Ảnh hưởng của f đến tỷ lệ nhận dạng đúng của phương pháp LT-LHD trongcác điều kiện góc nhìn khác nhau của khuôn mặt các điều kiện góc nhìn khác nhau của khuôn mặt

Bảng 5.9: Tỷ lệ nhận dạng đúng của các phương pháp NMHD và LT-NMHD với các cảm xúc khác nhau của khuôn mặt

Methods

Test face NMHD NMHD with high confident ratio LT-NMHD

Smiling 40% 63% 70%

Angry 85% 85% 89%

Average 62.5% 74% 79.5%

mặt với các xúc khác nhau của khuôn mặt, việc thay khoảng cách Hausdorff trung bình bằng khoảng cách LT-MHD sẽ làm tăng tỷ lệ nhận dạng khuôn mặt khoảng 5%.

Hình 5.19 mô tả sự ảnh hưởng của tỷ số f đến tỷ lệ nhận dạng khuôn mặt chính xác của phương pháp LT-NMHD trong các điều kiện ảnh chụp khuôn mặt với các cảm xúc khác nhau. Trong điều kiện khuôn mặt có cảm xúc cười, phương pháp LT-NMHD cho kết quả nhận dạng khuôn mặt đạt cực đại là 76% tại vị trí f = 0.8, cao hơn 6% so với tại vị trí f = 0.6, và cao hơn đến 13% so với trường hợp f = 0. Trong điều kiện khuôn mặt có cảm giận dữ, phương pháp LT-NMHD cho kết quả nhận dạng khuôn mặt đạt cực đại là 90% tại vị trí f = 0.7, cao hơn 1% so với tại vị trí f = 0.6, và cao hơn 5% so với trường hợpf = 0. Như vậy việc đổi từ sử dụng khoảng cách Hausdorff trung bình (f = 0) sang sử dụng khoảng cách LT-MHD sẽ làm tăng đáng kể tỷ lệ nhận dạng trong các điều kiện cảm xúc khác nhau của ảnh khuôn mặt.

Hình 5.19: Ảnh hưởng của f đến tỷ lệ nhận dạng đúng của phương pháp LT-NMHDtrong các điều kiện cảm xúc khác nhau của khuôn mặt trong các điều kiện cảm xúc khác nhau của khuôn mặt

Bảng 5.10: Tỷ lệ nhận dạng đúng của các phương pháp LHD, MLHD, RLHD và LT-LHD với các cảm xúc khác nhau của khuôn mặt

Methods

Test face LHD MLHD RLHD LT-LHD

Smiling 79% 74% 83% 82%

Angry 90% 83% 91% 92%

Average 84.5% 78.5% 87% 87%

và LT-LHD được trình bày trong bảng 5.10. Việc khuôn mặt có các cảm xúc khác nhau sẽ làm giảm tỷ lệ nhận dạng của các phương pháp khoảng 7% - 10%. Tỷ lệ nhận dạng cũng bị ảnh hưởng nhiều hơn trong trường hợp khuôn mặt có biểu cảm cười so với biểu cảm giận dữ. Như trong hình 5.20, so với khuôn mặt trong tập mẫu (khuôn mặt không cảm xúc) thì khuôn mặt với biểu cảm giận dữ sẽ có ít sự thay đổi hơn so với khuôn mặt với biểu cảm cười. Vì vậy tỷ lệ nhận dạng chính xác khuôn mặt của các phương pháp trong trường hợp khuôn mặt có biểu cảm giận dữ cũng có kết quả tương đương như việc nhận dạng khuôn mặt trong điều kiện khuôn mặt bình thường. Trong khi đó, với việc khuôn mặt có cảm xúc cười, tỷ lệ nhận dạng khuôn mặt chính xác của các phương pháp sẽ bị giảm khoảng 12% - 15%.

Các kết quả trong bảng 5.10 cho thấy rằng phương pháp LT-LHD và phương pháp RLHD cho kết quả nhận dạng chính xác cao hơn phương pháp LHD khoảng 3% về mặt trung bình. Cụ thể hơn, trong điều kiện khuôn mặt có biểu cảm cười, phương pháp LT-

(a) Không cảm xúc (b) Cười (c) Giận dữ

(d) Không cảm xúc (e) Cười (f) Giận dữ Hình 5.20: Ví dụ về các biểu cảm khác nhau của khuôn mặt

LHD và RLHD cho kết quả nhận dạng chính xác cao hơn phương pháp LHD khoảng 3% - 4%, và trong điều kiện khuôn mặt có biểu cảm giận dữ, phương pháp LT-LHD và RLHD cho kết quả nhận dạng chính xác cao hơn phương pháp LHD khoảng 1% - 2%. Điều này có thể được lý giải như sau. Khi cảm xúc khuôn mặt thay đổi, các đường cạnh sẽ có sự dịch chuyển về vị trí cũng như thay đổi về hướng. Điều này làm cho một đường cạnh tl ∈ Tl là đường cạnh tương ứng của ml

c ∈ Ml

c có thể có hướng rất khác với ml

n ∈ Ml n

nhưng khi khuôn mặt có biểu hiện cảm xúc, đườngtl bị dịch chuyển ra xa ml

c và dịch lại gần ml

n. Điều này sẽ làm cho khoảng cáchh Ml

n, Tl giảm xuống và h Ml

c, Tl tăng lên và dẫn đến nhận dạng nhầm trong phương pháp LHD. Tuy nhiên, trong phương pháp RLHD và LT-LHD, các đường cạnh sẽ tìm kiếm đường tương ứng dựa vào sự tương đồng về hướng, nên đường tl và ml

n cho dù nằm gần nhau nhưng khoảng cách giữa chúng vẫn sẽ rất lớn vì sự khác nhau về hướng. Điều này làm cho khoảng cáchh Ml

n, Tltăng lên và giúp làm tăng tính chính xác trong việc nhận dạng của phương pháp RLHD và LT-LHD. Hình 5.21 mô tả sự ảnh hưởng của hệ sốk đến tỷ lệ nhận dạng chính xác của phương pháp RLHD trong các điều kiện cảm xúc khác nhau của ảnh đầu vào. Các kết quả mô phỏng cho thấy tỷ lệ nhận dạng chính xác của phương pháp RLHD không thay đổi với các giá trị k ≥2. Với giá trị k = 3 được chọn, phương pháp RLHD cho tỷ lệ nhận dạng cao hơn phương pháp LHD khoảng 2.5% về trung bình trong các điều kiện khác nhau về cảm xúc của khuôn mặt.

Hình 5.23 mô tả sự ảnh hưởng của hệ sốk đến tỷ lệ nhận dạng chính xác của phương pháp LT-LHD trong trường hợp ảnh chụp khuôn mặt đầu vào có cảm xúc khác nhau. Kết quả mô phỏng cho thấy tỷ lệ nhận dạng chính xác của phương pháp LT-LHD trong điều kiện khuôn mặt có cảm xúc giận dữ đạt cực đại là 92% tại các giá trị k = 2 và k = 3,

Hình 5.21: Ảnh hưởng củak đến tỷ lệ nhận dạng đúng của phương pháp RLHD trongcác điều kiện cảm xúc khác nhau của khuôn mặt các điều kiện cảm xúc khác nhau của khuôn mặt

giảm 1% cho các trường hợpk≥4. Trong trường hợp nhận dạng khuôn mặt với biểu cảm cười, tỷ lệ nhận dạng chính xác của phương pháp LT-LHD đạt cực đại là 83% tại giá trị k= 2 và giảm 1% so với giá trị cực đại tại các giá trị k ≥3.

Hình 5.23 mô tả sự ảnh hưởng của hệ sốf đến tỷ lệ nhận dạng chính xác của phương pháp LT-LHD trong điều kiện khuôn mặt của ảnh kiểm tra có các cảm xúc khác nhau. Khi giá trị của f giảm xuống, sẽ có nhiều đường cạnh giống nhau được dùng để tính khoảng cách Hausdorff nên trọng số của các cặp đường cạnh sai lệch lớn giữa Ml

c và Tl

sẽ giảm xuống và làm tỷ lệ nhận dạng chính xác tăng lên. Theo kết quả mô phỏng trong hình 5.23, phương pháp LT-LHD sẽ có tỷ lệ nhận dạng chính xác cao nhất là 92%, cho trường hợp khuôn mặt có biểu cảm giận dữ tại giá trị f = 0.4, cao hơn 5% so với tại trường hợp f = 0. Với trường hợp khuôn mặt có biểu cảm cười, phương pháp LT-LHD sẽ có tỷ lệ nhận dạng chính xác cao nhất là 86%, tại giá trị f = 0.1, cao hơn khoảng 4% so với tỷ lệ nhận dạng tại f = 0.4 và cao hơn 1% so với trường hợp tại f = 0. Tỷ lệ nhận dạng chính xác của phương pháp LT-LHD trong các điều kiện cảm xúc khác nhau của khuôn mặt đều đạt giá trị cực đại tại f >0. Điều này cũng đồng nghĩa rằng trong các điều kiện cảm xúc khác nhau của khuôn mặt, tỷ lệ nhận dạng khuôn mặt chính xác sẽ được cải thiện khi ta thay đổi từ sử dụng khoảng cách Hausdorff trung bình sang sử dụng khoảng cách LT-MHD để đo sự khác nhau giữa hai bản đồ cạnh.

Hình 5.22: Ảnh hưởng của k đến tỷ lệ nhận dạng đúng của phương pháp LT-LHD trongcác điều kiện cảm xúc khác nhau của khuôn mặt các điều kiện cảm xúc khác nhau của khuôn mặt

5.7 So sánh tỷ lệ nhận dạng chính xác của phương pháp LT-NMHD và LT-LHD với các phương pháp khác trong điều kiện bài toán SSPP

Như đã đề cập trong phần đầu của nghiên cứu này, việc so sánh các phương pháp với nhau cần đặt trong một điều kiện cụ thể của các ứng dụng mới có thể kết luận phương pháp nào là phù hợp nhất. Việc so sánh tỷ lệ nhận dạng giữa các phương pháp cũng chỉ là một khía cạnh để so sánh giữa các phương pháp với nhau. Tuy nhiên, nghiên cứu này vẫn thực hiện việc so sánh tỷ lệ nhận dạng của các phương pháp đề xuất LT-LHD và LT-NMHD với một số các phương pháp nhận dạng khuôn mặt trong điều kiện SSPP khác đã được đề cập trong chương 2 để có thể đưa ra một đánh giá cho các phương pháp được đề xuất.

Để so sánh về tỷ lệ nhận dạng giữa các phương pháp với nhau, các phương pháp được thực nghiệm trên cùng một tập dữ liệu chuẩn với cùng cách thức tiến hành thí nghiệm và có cùng cách thức đánh giá. Tuy nhiên, trong thực tế, mỗi phương pháp sẽ được các tác giả thực hiện thí nghiệm với một cách thức khác nhau, một bộ dữ liệu khác nhau hay một cách đánh giá khác nhau [9, 10]. Ví dụ với bộ dữ liệu AR cũng là một bộ dữ liệu chuẩn thường được các phương pháp sử dụng để thí nghiệm, tuy nhiên các phương pháp lại sử dụng một cách phân chia tập mẫu và tập kiểm tra khác nhau để hướng đến việc chứng

Hình 5.23: Ảnh hưởng của f đến tỷ lệ nhận dạng đúng của phương pháp LT-LHD trongcác điều kiện cảm xúc khác nhau của khuôn mặt các điều kiện cảm xúc khác nhau của khuôn mặt

minh ưu điểm của phương pháp đó. Vì vậy nên việc so sánh tất cả các phương pháp lại với nhau là một điều không thể.

Trong nghiên cứu này, để có thể so sánh với nhiều nhất có thể các phương pháp với nhau, tập dữ liệu chuẩn ORL sẽ được lựa chọn để tiến hành thí nghiệm. Đây là tập dữ liệu chuẩn được rất nhiều các phương pháp nhận dạng sử dụng để mô phỏng và có cùng cách thức thí nghiệm. Vì vậy sử dụng tập ORL sẽ giúp so sánh một cách công bằng về tỷ lệ nhận dạng của hai phương pháp LT-LHD và LT-NMHD với nhiều nhất có thể các phương pháp khác. Tập dữ liệu khuôn mặt ORL là tập dữ liệu được phát triển bởi trường đại học Cambridge. Tập dữ liệu này bao gồm tổng cộng 400 ảnh kích thước92×112 của 40 người với 10 ảnh cho mỗi người. Đây là tập dữ liệu thường được các phương pháp nhận dạng khuôn mặt sử dụng để kiểm tra tính chính xác trong việc nhận dạng vì các ảnh trong tập dữ liệu này được chụp trong rất nhiều các điều kiện khác nhau của thực tế như ánh sáng khác nhau, cảm xúc khác nhau của khuôn mặt, các chi tiết khác nhau trên khuôn mặt (mang kính/không mang kính), các góc chụp khác nhau của khuôn mặt và các góc xoay khác nhau của bức ảnh. Khác với các tập dữ liệu chuẩn khác, tập dữ liệu khuôn mặt ORL, các cá nhân sẽ có ảnh khuôn mặt theo các mô tuýp khác nhau và không cá nhân nào giống cá nhân nào. Điều này làm cho tập dữ liệu ORL càng khó khăn hơn trong việc nhận dạng và càng giống với các điều kiện trong các ứng dụng thực tế hơn. Tỷ lệ nhận dạng của các phương pháp với tập dữ liệu ORL có thể được xem như là tỷ lệ nhận dạng trung bình của các điều kiện khác nhau của ảnh đầu vào.

Cách thức tiến hành thí nghiệm với tập ORL sẽ giống với các phương pháp khác: một ảnh của mỗi cá nhân trong cơ sở dữ liệu ORL được sử dụng để làm tập mẫu, các ảnh còn lại của mỗi cá nhân sẽ được đưa vào tập kiểm tra. Như vậy, tập kiểm tra sẽ có tổng cộng 360 ảnh. Bảng 5.11 trình bày kết quả so sánh tỷ lệ nhận dạng của phương pháp LT-LHD và LT-NMHD với một số các phương pháp đã được giới thiệu ở phần đầu nghiên cứu. 5.8 Kết luận

Trong chương này, các mô phỏng khảo sát tỷ lệ nhận dạng khuôn mặt trong điều kiện SSPP của hai phương pháp LT-NMHD và LT-LHD với các tập dữ liệu chuẩn đã được thực hiện. Tỷ lệ nhận dạng của phương pháp LT-NMHD đã được so sánh với phương pháp NMHD, tỷ lệ nhận dạng của phương pháp LT-LHD đã được so sánh với các phương pháp LHD, MLHD và RLHD. Các kết quả mô phỏng so sánh đã cho thấy phương pháp LT-NMHD cho kết quả tốt hơn phương pháp NMHD và phương pháp LT-LHD cho kết quả tốt hơn các phương pháp LHD, MLHD và RLHD trong mọi điều kiện khác nhau của ảnh đầu vào. Điều này đã chứng minh sự hiệu quả trong việc cải thiện tỷ lệ nhận dạng khi sử dụng khoảng cách LT-MHD thay vì sử dụng khoảng cách Hausdorff trung bình. Việc sử dụng khoảng cách LT-MHD giúp làm tăng tỷ lệ nhận dạng khoảng 2% - 10% so với việc dùng khoảng cách Hausdorff trung bình, tùy từng phương pháp và điều kiện của ảnh đầu vào. Ngoài ra, với hai phương pháp LT-NMHD và LT-LHD, khoảng cách LT-MHD được dùng để đo khoảng cách cho các loại đặc trưng khác nhau của ảnh khuôn mặt: điểm trội và đường cạnh. Các kết quả cũng cho thấy rằng

với các loại đặc trưng khác nhau, khoảng cách LT-MHD cũng cho thấy sự hiệu quả hơn so với khoảng cách Hausdorff trung bình. Đây là cơ sở để các phương pháp nhận dạng khuôn mặt khác với các đặc trưng khác cũng có thể áp dụng khoảng cách LT-MHD để đo khoảng cách giữa các tập hợp các đặc trưng. Ngoài ra, khi khảo sát ảnh hưởng của tỷ sốf đến tỷ lệ nhận dạng của phương pháp LT-NMHD và LT-LHD, nghiên cứu này cũng chứng minh rằng với tỷ sốf phù hợp, tỷ lệ nhận dạng của các phương pháp LT-NMHD và LT-LHD còn có thể được cải thiện hơn nữa so với các kết quả với các tỷ sốf được chọn từ đầu của các nghiên cứu.

Khi so sánh hai phương pháp LT-NMHD và LT-LHD với một số các phương pháp nhận dạng khuôn mặt trong điều kiện SSPP trong những năm gần đây trong cùng điều kiện mô phỏng, các phương pháp LT-NMHD và LT-LHD cho kết quả khá tốt khi so sánh.

Một phần của tài liệu Phương pháp nhận dạng khuôn mặt trong điều kiện đơn mẫu dựa trên độ đo lt mhd (Trang 118)

Tải bản đầy đủ (PDF)

(178 trang)