5 KẾT QUẢ MÔ PHỎNG
5.3 Khảo sát ảnh hưởng của tỷ số f lên chất lượng của phương pháp LT-LHD
của phương pháp LT-LHD và LT-NMHD
Khoảng cách trực tiếp trong phương pháp LT-NMHD (phương trình (3.5)) và trong phương pháp LT-LHD (phương trình (4.20)) là trung bình có trọng số của (P −K) = (1−f)×P những giá trị lớn nhất trong số các khoảng cách giữa các cặp đặc trưng tương ứng trong hai tập hợp. Như vậy, tỷ sốf là một tỷ số quyết định đến tính chính xác trong việc tính khoảng cách trực tiếp trong cả hai phương pháp LT-NMHD và LT-LHD, và sẽ quyết định tỷ lệ nhận dạng của hai phương pháp LT-NMHD và LT-LHD. Cũng tương tự như với hệ số k, không có lý thuyết đưa ra để chọn được tỷ số f phù hợp cho tất cả các điều kiện khác nhau của ảnh đầu vào. Qua các kết quả mô phỏng, hai phương pháp LT-NMHD và LT-LHD sẽ có tỷ lệ nhận dạng tối ưu trong tại các giá trị khác nhau của f tùy theo điều kiện cụ thể của ảnh đầu vào. Để có cơ sở trong việc chọn tỷ số f, tỷ số f được chọn thông qua thực nghiệm, cụ thể là tỷ số f được chọn dựa vào điều kiện tối ưu tỷ lệ nhận dạng của các phương pháp trong điều kiện bình thường của ảnh đầu vào. 30 cặp ảnh khuôn mặt chính diện trong điều kiện bình thường của 30 người trong tập dữ liệu khuôn mặt của BERN University cùng 99 cặp ảnh khuôn mặt chính diện trong điều kiện bình thường của 99 người trong tập dữ liệu AR sẽ được sử dụng để khảo sát tỷ lệ
Hình 5.5: Ảnh hưởng của k đến tỷ lệ nhận dạng đúng của phương pháp LT-LHDnhận dạng của hai phương pháp LT-NMHD và LT-LHD với các giá trị khác nhau của tỷ nhận dạng của hai phương pháp LT-NMHD và LT-LHD với các giá trị khác nhau của tỷ sốf.
Tiếp theo, sự ảnh hưởng của hệ sốf lên tỷ lệ nhận dạng của các phương pháp sẽ được phân tích. Với phương pháp LT-NMHD, tỷ sốf quyết định số lượng các khoảng cách giữa các cặp điểm trội tương ứng trong hai tập hợp được dùng để tính khoảng cách Hausdorff trực tiếp giữa hai tập hợp. Khi tỷ số f có giá trị quá lớn, một số rất ít các khoảng cách lớn nhất giữa các cặp điểm trội tương ứng được dùng để tính khoảng cách Hausdorff. Số ít các khoảng cách lớn nhất này thường là khoảng cách từ các điểm nhiễu (outlier) trong tập hợp này đến điểm gần nhất của nó trong tập hợp kia. Vì vậy, khi tỷ sốf quá lớn, tỷ lệ nhận dạng chính xác của phương pháp LT-NMHD sẽ phụ thuộc chủ yếu vào các điểm nhiễu và vì thế phương pháp LT-NMHD sẽ có tỷ lệ nhận dạng thấp. Khi tỷ số f giảm xuống, sẽ có thêm nhiều khoảng cách giữa các cặp đường cạnh được dùng để tính khoảng cách Hausdorff, vì thế sẽ giảm đi sự ảnh hưởng của các điểm nhiễu và vì thế giúp tỷ lệ nhận dạng chính xác của phương pháp LT-NMHD tăng lên.
Tuy nhiên, khi giá trị của f quá bé, nghĩa là có quá nhiều các khoảng cách giữa các cặp điểm trội tương ứng được dùng để tính khoảng cách Hausdorff giữa hai tập hợp. Điều này sẽ làm giảm tỷ lệ nhận dạng chính xác của phương pháp LT-NMHD vì lý do như sau. Gọi T là tập hợp các điểm trội của ảnh kiểm tra vàMn là tập hợp các điểm trội của ảnh không tương ứng với ảnh kiểm tra trong cơ sở dữ liệu. VìT vàMn không phải là cặp ảnh tương ứng nên khoảng cách giữa chúng phải lớn. Tuy nhiên khi tỷ sốf quá bé, các cặp
Hình 5.6: Ảnh hưởng của f đến tỷ lệ nhận dạng đúng của phương pháp LT-NMHDđiểm tương ứng có khoảng cách nhỏ giữa hai tập hợp này cũng được dùng để tính khoảng điểm tương ứng có khoảng cách nhỏ giữa hai tập hợp này cũng được dùng để tính khoảng cách Hausdorff giữa hai tập hợp. Điều này làm giảm sự ảnh hưởng của các khoảng cách giữa các cặp điểm tương ứng có giá trị lớn, vốn thể hiện sự khác nhau giữa hai ảnh. Điều này dẫn đến khoảng cách Hausdorff giữa T và Mn giảm xuống và làm tăng tỷ lệ nhận dạng nhầm và qua đó làm giảm tỷ lệ nhận dạng chính xác của phương pháp LT-NMHD. Như vậy tỷ lệ nhận dạng chính xác của phương pháp LT-NMHD được kỳ vọng đạt cực đại tại giá trị f không quá cao hoặc quá thấp và giảm đi ở tại các giá trị f rất lớn hoặc rất nhỏ. Hình 5.6 mô tả sự phụ thuộc của tỷ lệ nhận dạng đúng của phương pháp LT-NMHD với các giá trị khác nhau của tỷ sốf với hai tập dữ liệu BERN và AR. Trong mô phỏng này, các giá trị của f sẽ nằm trong khoảng 0,0.1, ...,0.9. Giá trị f = 1 là vô nghĩa vì khi đó số lượng khoảng cách của cặp điểm trội tương ứng được dùng để tính toán khoảng cách Hausdorff trực tiếp LT-NMHD sẽ làKM = (1−f)P = 0. Như vậy, khoảng cách giữa tất cả các bản đồ cạnh đều là0. Kết quả mô phỏng trong hình 5.6 phù hợp với các phân tích ở trên. Tỷ lệ nhận dạng của phương pháp LT-NMHD đạt giá trị cao nhất tại vị tríf = 0.6 với tập dữ liệu AR và đạt cực đại tại các vị trí f ≤ 0.7 đối với tập dữ liệu BERN. Như vậy, giá trị f = 0.6 sẽ được chọn để thực hiện các mô phỏng khác đối với phương pháp LT-NMHD.
Đặc biệt, với giá trị f = 0 trong phương pháp LT-NMHD, tất cả khoảng cách giữa các cặp điểm trội được dùng để tính khoảng cách trực tiếp giữa hai bản đồ cạnh. Điều này có nghĩa là khoảng cách trực tiếp trong phương pháp LT-NMHD tại vị trí f = 0
chính là khoảng cách Hausdorff trung bình. Hay nói cách khác, phương pháp LT-NMHD tại f = 0 chính là phương pháp NMHD nhưng có thêm tỷ số độ tin cậy được đưa vào phép tính khoảng cách giữa hai tập hợp. Các kết quả mô phỏng tại hình 5.6 cho thấy tỷ lệ nhận dạng của phương pháp LT-NMHD tại vị trí f = 0.6 cao hơn tại vị trí f = 0 là 1%, điều này có nghĩathay khoảng cách Hausdorff trung bình bằng khoảng cách LT-MHD sẽ giúp làm tăng tỷ lệ nhận dạng khoảng 1%.
Trong phương pháp LT-LHD, tỷ sốf cũng được dùng để quyết định số lượng khoảng cách giữa các cặp đường cạnh được sử dụng để tính khoảng cách trực tiếp. Như vậy tỷ sốf cũng quyết định tính chính xác của việc tính khoảng cách trực tiếp và qua đó quyết định tính chính xác của việc nhận dạng của phương pháp LT-LHD. Sự ảnh hưởng của tỷ sốf đến tỷ lệ nhận dạng của phương pháp LT-LHD được phân tích như sau.
Gọi Tl là bản đồ cạnh của ảnh kiểm tra, Ml
c và Ml
n lần lượt tương ứng là bản đồ cạnh của ảnh tương ứng và không tương ứng với ảnh kiểm tra trong cơ sở dữ liệu. Gọi tl, ml c
và ml
n lần lượt tương ứng là một đường cạnh trong Tl, Ml
c và Ml
n. Trong trường hợp f có giá trị cao, chỉ một số ít các đường cạnh có giá trị lml ×mindist ml, Tl lớn nhất được dùng để tính khoảng cách Hausdorff. Những đường cạnh là nhiễu, thường có giá trịlml×mindist ml, Tl lớn nhất và cũng sẽ được dùng để tính khoảng cách Hausdorff. Điều này cũng làm cho khoảng cách Hausdorff trực tiếp h Ml
c, Tl tăng cao và dẫn đến nhận dạng nhầm trong trường hợp f có giá trị lớn.
Khi giá trị củaf giảm dần, sẽ có nhiều đường cạnh trongTl vàMl
c được dùng để tính khoảng cách Hausdorff và những đường này sẽ có khoảng cách giữa chúng là nhỏ. Chính điều này giúp làm giảm ảnh hưởng của các đường nhiễu như để cập ở ngay phía trên, và giúp khoảng cách trực tiếph Ml
c, Tlgiảm xuống. Đồng thời, vìTl vàMl
nlà bản đồ cạnh của cặp ảnh không tương ứng nên khoảng cáchd ml
n, tl thường rất lớn và thậm chí có giá trị làV nếu chúng có sai lệch về hướng lớn. Điều này làm cho khoảng cách Hausdorff trực tiếph Ml
n, Tl là lớn. Như vậy giá trị của f giảm dần sẽ làm tỷ lệ nhận dạng chính xác tăng lên.
Khi giá trị củaf càng tiếp tục giảm, càng nhiều đường cạnh được dùng để tính khoảng cách Hausdorff, điều này làm cho trọng số của những khoảng cáchd ml
n, tlgiảm xuống, càng có thêm những đường cạnh giống nhau giữa Tl và Ml
n được dùng để tính khoảng cách Hausdorff. Vì vậy khoảng cách Hausdorff trực tiếp h Ml
n, Tl sẽ giảm xuống kéo theo làm tăng nhận dạng nhầm và làm giảm tỷ lệ nhận dạng chính xác xuống. Tuy nhiên, khi giá trịf xuống thấp nữa, khi tất cả các đường cạnh trong bản đồ cạnh được đều được dùng để tính khoảng cách, trong trường hợp này, sẽ có những cặp đường cạnh trongTl và Ml
c là khoảng cách giữa chúngd ml c, tl
= 0 sẽ được dùng để tính khoảng cách Hausdorff trực tiếp, làm cho khoảng cách Hausdorffh Ml
c, Tlgiảm xuống và có thể làm tăng tỷ lệ nhận dạng của phương pháp LT-LHD lên lại.
Hình 5.7: Ảnh hưởng của f đến tỷ lệ nhận dạng đúng của phương pháp LT-LHD đại tại giá trị f trung bình và thấp hơn ở tại các giá trị f lớn hoặc nhỏ. Hình 5.7 mô tả sự phụ thuộc của tỷ lệ nhận dạng đúng của phương pháp LT-LHD với các giá trị khác nhau của tỷ số f với hai tập dữ liệu BERN và AR. Trong mô phỏng này, các giá trị được sử dụng của f nằm trong khoảng 0,0.1, ...,0.9. Giá trị f = 1 là vô nghĩa vì khi đó số đường cạnh được dùng để tính toán khoảng cách Hausdorff trực tiếp LT-LHD sẽ là KM = (1−f)P = 0. Như vậy, khoảng cách giữa tất cả các bản đồ cạnh đều là 0. Các kết quả mô phỏng trong hình 5.7 phù hợp với các phân tích ở phía trên. Tỷ lệ nhận dạng đúng của phương pháp LT-LHD đạt giá trị cao nhất tại vị tríf = 0.4với tập dữ liệu AR. Với tập dữ liệu BERN, giá trị của tỷ lệ nhận dạng đúng của phương pháp LT-LHD đạt cực đại tại các vị tríf = 0.3,0.4,0.5. Vì vậy giá trị f = 0.4 sẽ được sử dụng cho các mô phỏng của phương pháp LT-LHD ở phần sau.
Tương tự như phương pháp LT-NMHD, với phương pháp LT-LHD, giá trị f = 0 sẽ chính là phương pháp RLHD, trong đó khoảng cách trực tiếp giữa hai tập hợp chính là khoảng cách Hausdorff trung bình. Các kết quả mô phỏng tại hình 5.7 cho thấy tỷ lệ nhận dạng của phương pháp LT-LHD tại vị tríf = 0.4cao hơn tại vị trí f = 0 là khoảng 4%, điều này có nghĩathay khoảng cách Hausdorff trung bình bằng khoảng cách LT-MHD sẽ giúp làm tăng tỷ lệ nhận dạng khoảng 4%.