Phương pháp xây dựng bộ từ điển về các đặc trưng không lý tưởng của

Một phần của tài liệu Phương pháp nhận dạng khuôn mặt trong điều kiện đơn mẫu dựa trên độ đo lt mhd (Trang 40 - 45)

5 KẾT QUẢ MÔ PHỎNG

2.17Phương pháp xây dựng bộ từ điển về các đặc trưng không lý tưởng của

khuôn mặt [73]

kệt hợp bộ phân loại KNN được huấn luyện dựa trên tập chung sau đó được áp dụng để phân lớp các ảnh trong tập kiểm tra. Phương pháp này cho kết quả nhận dạng khá tốt với tập dữ liệu AR. Phương pháp [76] sử dụng chung một cách thức chọn tập chung và tập mẫu, tập kiểm tra như phương pháp [75]. Trong phương pháp [76], các vector đặc trưng của ảnh khuôn mặt trong điều kiện bình thường được biển diễn thành các trục tọa độ trong không gian đặc trưng. Nhờ vào tập dữ liệu chung, phương pháp [76] học cách ánh xạ các đặc trưng mô tả các điều kiện khác nhau của ảnh đầu vào về gốc tọa độ. Nhờ vậy các điều kiện khác nhau của ảnh đầu vào sẽ không ảnh hưởng đến tính chính xác của việc nhận dạng. Tuy nhiên nhược điểm của phương pháp này là các sự thay đổi khác nhau của ảnh trong tập kiểm tra phải hoàn toàn giống với tập chung.

Các phương pháp nhận dạng khuôn mặt dựa trên một tập dữ liệu chung có ưu điểm là việc các đặc trưng về sự thay đổi trong cùng một lớp có thể được học từ tập dữ liệu chung, sau đó áp dụng ngược lại cho tập mẫu. Tuy nhiên, nhược điểm lớn nhất của nhóm phương pháp này là tỷ lệ nhận dạng phụ thuộc chủ yếu vào việc chọn được tập dữ liệu chung phù hợp. Để tăng tỷ lệ nhận dạng, tập dữ liệu chung phải có cùng những sự thay đổi trong cùng một lớp giống như tập kiểm tra và điều này làm mất đi tính tổng quát của các phương pháp này. Trong thực tế, việc tìm được một tập dữ liệu chung phản ánh được tốt tất cả sự thay đổi của ảnh đầu vào trong các ứng dụng thực tế là một việc không khả thi. Vì vậy tỷ lệ nhận dạng của các phương pháp này trong các ứng dụng thực tế vẫn là một điều chưa kiểm chứng.

2.1.5 Kết luận

Trong phần này, một số các phương pháp nhận dạng khuôn mặt trong điều kiện đơn mẫu được đề xuất trong những năm gần đây cũng như các phân tích về ưu nhược điểm của các phương pháp này đã được giới thiệu. Trong nghiên cứu này, hai phương pháp được đề xuất là LT-LHD và LT-NMHD sẽ được so sánh về tỷ lệ nhận dạng với một số phương pháp được đề cập tại chương này. Tỷ lệ nhận dạng là tiêu chí được lựa chọn để so sánh vì đây là tiêu chí thường được các nghiên cứu dùng để so sánh các phương pháp với nhau. Để có thể so sánh tỷ lệ nhận dạng của các phương pháp một cách công bằng, các phương pháp cần có chung một cách thức tiến hành mô phỏng với cùng một tập dữ liệu chuẩn. Tuy nhiên, mỗi phương pháp lại sử dụng một tập liệu khác nhau hoặc một cách thức tiến hành mô phỏng khác nhau với cùng một tập dữ liệu nhằm hướng đến các mục đích khác nhau như chứng minh tính ổn định trong điều kiện ánh sáng, điều kiện cảm xúc hay tỷ lệ che phủ của khuôn mặt... Như vậy việc so sánh tỷ lệ nhận dạng của tất cả các phương pháp được đề cập trong phần này là một điều không thể. Vì vậy trong nghiên cứu này, một tập dữ liệu chuẩn cũng như một cách thức mô phỏng được nhiều nhất các phương pháp ở trên sử dụng sẽ được lựa chọn để tiến hành mô phỏng.

Tập dữ liệu khuôn mặt để được lựa chọn để tiến hành so sánh tập dữ liệu ORL vì đây là tập dữ liệu chuẩn được rất nhiều các phương pháp sử dụng để mô phỏng và các mô phỏng được tiến hành chung cách thức. Trong tập dữ liệu ORL, mỗi cá nhân sẽ có ảnh chụp trong nhiều điều kiện khác nhau và không giống nhau giữa các cá nhân. Điều này làm cho các vector đặc trưng về sự thay đổi trong từng lớp sẽ khác nhau cho mỗi lớp. Tỷ lệ nhận dạng khuôn mặt đối với tập dữ liệu ORL có thể được xem như là tỷ lệ nhận dạng trung bình của tất cả các điều kiện khác nhau của ảnh khuôn mặt. Một điểm hạn chế khi sử dụng tập dữ liệu ORL để mô phỏng là nó ít được sử dụng bởi các phương pháp nhận dạng khuôn mặt sử dụng một tập dữ liệu chung. Lý do là các phương pháp trong nhóm này thường dùng tập dữ liệu chung và tập kiểm tra có sự giống nhau hoàn toàn về các điều kiện khác nhau của ảnh đầu vào. Trong chương kết quả, tỷ lệ nhận dạng của hai phương pháp LT-NMHD và LT-LHD trên tập dữ liệu ORL sẽ được so sánh với phần lớn các phương pháp được giới thiệu ở phần trên. Việc không thể so sánh với tất cả các phương pháp là một hạn chế của nghiên cứu nhưng việc có thể so sánh với phần lớn các phương pháp cũng là một đánh giá đáng tin cậy.

2.2 Các phương pháp giảm độ phức tạp phép tínhkhoảng cách Hausdorff khoảng cách Hausdorff

2.2.1 Khoảng cách Hausdorff

Cho hai tập hợp điểmA ={a1, a2, ..., aP} và B ={b1, b2, ..., bQ}, khoảng cách Hausdorff giữa hai tập hợp được định nghĩa như sau

H(A, B) = max{h(A, B), h(B, A)} (2.1) trong đó h(A, B) và h(B, A) lần lượt là khoảng cách trực tiếp từ tập A đến tập B và ngược lại. Khoảng cách trực tiếph(A, B) được định nghĩa như sau

h(A, B) = max ai∈A min bj∈Bdist(ai, bj) (2.2) NếuP vàQlần lượt là số phần tử trong hai tập hợp, phép tính khoảng cách Hausdorff trực tiếp như tại phương trình (2.2) sẽ có độ phức tạp làO(P Q). Trong những năm qua, đã có rất nhiều các nghiên cứu với mục tiêu làm giảm độ phức tạp của phép tính này. Dựa vào kiểu dữ liệu của hai tập hợp A và B, các nghiên cứu này có thể được chia thành ba nhóm: 1/ phép tính khoảng cách Hausdorff giữa hai đa giác (polygonal models), 2/ phép tính khoảng cách Hausdorff giữa hai mặt lưới (mesh surfaces) hoặc đường cong (curve) và 3/ phép tính khoảng cách Hausdorff giữa hai tập hợp điểm. Các phương pháp giảm độ phức tạp phép tính khoảng cách Hausdorff trong hai nhóm đầu tiên thường dựa trên các tính chất đặc trưng của kiểu dữ liệu để làm giảm độ phức tạp của phép tính. Tuy nhiên, trong lĩnh vực nhận dạng ảnh hay nhận dạng khuôn mặt, khoảng cách Hausdorff được dùng để đo khoảng cách giữa hai tập hợp các đặc trưng. Các tính chất đặc biệt của đa giác hay mặt lưới không thể áp dụng cho tập hợp các đặc trưng. Vì vậy các phương pháp làm giảm độ phức tạp phép tính khoảng cách Hausdorff trong hai nhóm đầu tiên không thích hợp để áp dụng cho lĩnh vực nhận dạng ảnh hay nhận dạng khuôn mặt.

Các phương pháp nhằm làm độ phức tạp cho phép tính khoảng cách Hausdorff giữa hai tập hợp điểm mang tính tổng quát hơn [77] và có thể áp dụng cho việc giảm độ phức tạp tính toán của phép tính khoảng cách Hausdorff giữa hai tập hợp các đặc trưng. Các phương pháp này cũng có thể được chia thành hai nhóm nhỏ hơn: 1/ Nhóm các phương pháp tính chính xác khoảng cách Hausdorff và 2/ nhóm các phương pháp tính xấp xỉ gần đúng khoảng cách Hausdorff. Các thuật toán về tính xấp xỉ khoảng cách Hausdorff sẽ ưu tiên về việc rút ngắn thời gian tính toán và tìm cách xấp xỉ khoảng cách Hausdorff giữa hai tập hợp một cách hiệu quả. Các nghiên cứu này thường hướng đến các ứng dụng yêu cầu về thời gian thực như [78]. Nhóm còn lại thường hướng đến việc tính toán chính xác khoảng cách Hausdorff giữa hai tập hợp.

Trong các ứng dụng về nhận dạng ảnh hay nhận dạng khuôn mặt, đặc biệt là với các phương pháp nhận dạng khuôn mặt, các phương pháp cần tính toán chính xác khoảng cách Hausdorff giữa hai tập hợp các đặc trưng. Điều này có lý do là vì sự giống nhau giữa các khuôn mặt người, nếu dùng việc xấp xỉ khoảng cách Hausdorff sẽ tạo ra sai số và dẫn đến nhận dạng nhầm rất nhiều. Các phương pháp giảm độ phức tạp của phép tính chính xác khoảng cách Hausdorff sẽ phù hợp hơn cho các phương pháp nhận dạng khuôn mặt. Vì vậy trong phần tiếp theo, chúng tôi sẽ trình bày chi tiết về một số các thuật toán đã được đề xuất nhằm làm giảm độ phức tạp của phép tính chính xác khoảng cách Hausdorff giữa hai tập hợp điểm. Chi tiết về nhóm phương pháp giảm độ phức tạp tính toán của phép tính khoảng cách Hausdorff cho hai đa giác hay hai mặt lưới hoặc các phương pháp giảm độ phức tạp tính toán của phép tính gần đúng khoảng cách Hausdorff cho hai tập hợp điểm có thể được tìm thấy tại các nghiên cứu [79,80].

2.2.2 Các phương pháp dựa trên cấu trúc R-Tree

Papadias [81] đã đề xuất một phương pháp, gọi là Aggregate Nearest Neighbor (ANN) , để tính khoảng cách Hausdorff giữa hai tập hợp điểm dựa trên cấu trúc R-Tree của tập hợp điểm này. Khoảng cách Hausdorff trực tiếp từA đến B được tính như sau

h(A, B) = max ai∈A min bj∈Bdist(ai, bj) = max ai∈Amindist(ai, B) (2.3) Phương pháp do Papadias đề xuất sẽ tối ưu việc tìm kiếm điểm b ∈ B là điểm gần nhất của điểma ∈A. Ta sẽ có AN N(ai, B) =mindist(ai, B). Như vậy AN N(ai, B) có thể được dùng để tính toán khoảng cách trực tiếp khoảng cách Hausdorff từAđếnB như sau

h(A, B) = max

ai∈AAN N(ai, B) (2.4) Bằng cách áp dụng cấu trúc R-Tree cho tập hợp điểm B, phương pháp của Papadias có thể tối ưu được việc tìm AN N(ai, B). Phương pháp của Papadias có thể được mô tả theo giải thuật 1. Trong đó hàm hồi quyRecurAN N(x, RY) có thể được thực hiện theo giải thuật 2. Trong giải thuật 2, hàmdist(x, N)là khoảng cách từ điểmx đến nútN của cây R-Tree. Khoảng cách này là khoảng cách nhỏ nhất có thể có từ điểmx đến các điểm trong nút N. Hay có thể nóidist(x, N) là giới hạn dưới của khoảng cách từxđến tất cả các điểm trong nútN.

Như vậy thay vì từ x phải tính khoảng cách tới tất cả các điểm trong Y, hàm RecurAN N sẽ chỉ lựa chọn những nút mà có khả năng tồn tại những điểmy mà khoảng cách từxtớiycó thể được dùng để cập nhật giá trị củacmin. Trong khi đó những nút mà dist(x, Nj)≥cmin, các điểmy trong nút này sẽ có khoảng cách dist(x, y)≥dist(x, Nj) và không thể dùng để cập nhật giá trị củacmin.

Algorithm 1 : Giải thuật tính AN N(a, B)

1: Inputs: Point a∈A, Point set B

2: Outputs: d=AN N(a, B)

3: RTree RB % Create a R-Tree for set B

4: AN N(a, B)= Recursive Function RecurAN N(a, RootOf (RB))

Algorithm 2 : Giải thuật hồi quy ANN

1: Inputs: x, Node N

2: Outputs: cmin

3: cmin =dist(x, N)

4: if N is not aLeaf N ode then

5: Sorting child nodes Nj of N in list according todist(x, Nj)

6: repeat (adsbygoogle = window.adsbygoogle || []).push({});

7: get next entryNj fromlist

8: if dist(x, Nj)≤cmin then

9: Recursive Function AN N

10: end if

11: until dist(x, Nj)> cminor end of list

12: else

13: for each point yi of N do

14: d=dist(x, yi) 15: if cmin > d then 16: cmin=d 17: end if 18: end for 19: end if

Cho một điểm x và một tập hợp điểm Y = {y1, y2, ..., y12} như trong hình 2.18. Cấu trúc R-Tree RY của tập hợp điểm Y có thể được biểu diễn như tại hình 2.19. Trong hình 2.18, ta thấy cây RY có hai nút N1 chứa các điểm {yi}i=1..6 và nút N2 chứa các điểm{yi}i=7..12. Trong cấu trúc R-Tree, mỗi nút sẽ được bao quanh bằng một đường bao chữ nhật nhỏ nhất (Minimum bounding rectangular - MBR) . Khoảng cách dist(x, N1) là khoảng cách nhỏ nhất từ x đến MBR của N1 và dist(x, N2) là khoảng cách nhỏ nhất từ x đến MBR của N2. Như vậy ta có thể thấy {dist(x, yi)≤dist(x, N1)}i=1..6 và

{dist(x, yi)≤dist(x, N2)}i=7..12.

Khoảng cáchAN N(x, Y)của điểmxvà tậpY như tại hình 2.18 sẽ được tìm như sau:

ˆ Đầu tiên, thuật toán sẽ cho khoảng cách d(x, RootOf(RY)) =∞. Lúc này ta sẽ có cmin =∞.

ˆ RootOf (RY)có 2 nút con làN1 vàN2. Các nút này sẽ được đưa vàolisttheo thứ tự N1, N2vì ta códist(x, N1)< dist(x, N2). Thuật toán sẽ so sánhdist(x, N1)≤cmin nên sẽ thực hiện hàm hồi quy.

Một phần của tài liệu Phương pháp nhận dạng khuôn mặt trong điều kiện đơn mẫu dựa trên độ đo lt mhd (Trang 40 - 45)