So sánh hiệu suất của thuật toán cICA và cICA_MI

Một phần của tài liệu NGHIÊN CỨU THUẬT TOÁN ICA VÀ ỨNG DỤNG ƯỚC LƯỢNG ĐỘ SÂU ẢNH MẶT NGƯỜI (Trang 31 - 37)

Hình 2.12 cho thấy các kết quả thực nghiệm thu được khi sử dụng cICA và cICA_MI. Trong hầu hết các trường hợp, hệ số tương quan thu được khi sử dụng cICA_MI cao hơn giá trị trung bình thu được khi sử dụng cICA và là kết quả tốt nhất đối với một số đối tượng. Do đó, có thể kết luận rằng phương pháp tích hợp mơ hình có thể cải thiện một cách hiệu quả độ chính xác ước tính chiều sâu của phương pháp cICA.

Hình 2. 13. Giá trị độ sâu thực và giá trị độ sâu ước lượng của đặc điểm khn mặt có cơ sở dữ liệu Bosphorus

Hình 2.13 cho thấy giá trị độ sâu thực và giá trị độ sâu ước tính của các điểm đặc trưng trên khn mặt thu được bằng cách sử dụng cICA_MI. Để so sánh, tất cả các giá trị độ sâu hiển thị trong Hình 2.13 được chuẩn hóa thành

khoảng [0, 1]. Giá trị ước lượng độ sâu Mz của 22 điểm đặc trưng được chuẩn

hóa như sau:

Mz'= Mz−min Mz

max Mz−min Mz(2.27)

trong đó Mz' là giá trị độ sâu chuẩn hóa của Mz, và min Mzmax Mz lần lượt là giá trị độ sâu tối thiểu và tối đa. Cần lưu ý rằng quá trình chuẩn hóa chỉ

được sử dụng để hiển thị các giá trị độ sâu Mz, và không được sử dụng trong quy

trình ước lượng giá trị độ sâu hoặc trong việc tính tốn các hệ số tương quan. Có thể thấy từ Hình 2.13 rằng giá trị độ sâu của hầu hết các điểm đặc trưng trên khuôn mặt được ước lượng chính xác và khơng có thơng tin trước nào về các giá trị độ sâu thực được sử dụng trong toàn bộ quy trình ước lượng. Hệ số tương quan thu được bằng cách sử dụng cICA_MI là 0,9124, cao hơn các giá trị trung bình thu được bằng các phương pháp khác khi chỉ sử dụng một hình ảnh khn mặt khơng nhìn trực diện. Do đó, mức độ chính xác của ước lượng độ sâu có thể được cải thiện một cách hiệu quả bằng cách sử dụng phương pháp tích hợp mơ hình được đề xuất khi có nhiều hình ảnh khn mặt xem trực diện hơn. Giá trị ước lượng độ sâu của các điểm đặc trưng có thể được sử dụng trong ước lượng tư thế hoặc nhận dạng khn mặt. Độ chính xác cao hơn trong ước lượng tư thế hoặc nhận dạng khn mặt nói chung có thể đạt được độ chính xác cao hơn của ước lượng độ sâu. Vì phương pháp đề xuất đã được chứng minh là có độ chính xác ước lượng độ sâu cao hơn các phương pháp khác, do đó, nó có thể cung cấp ước lượng độ sâu đáng tin cậy hơn để sử dụng trong ước tính tư thế và nhận dạng khn mặt.

2.4.2.5. Mở rộng

Hình 2.14 cho thấy các hoạt động của cICA khi các mơ hình ở dạng quá đầy đủ và dạng bình thường, tức là, các đầu vào của thuật toán cICA lần lượt là

qQ. Chúng ta có thể thấy rằng thuật tốn có thể đạt được mức độ chính xác

ước lượng độ sâu cao hơn và độ lệch chuẩn nhỏ hơn khi Q được sử dụng làm

đầu vào của thuật tốn cICA. Do đó, việc sử dụng thơng tin bổ sung trước đó từ mơ hình mặt CANDIDE chung để chuyển đổi vấn đề quá mức thành mơ hình ICA bình thường được xác nhận là hiệu quả hơn để ước lượng độ sâu.

Hình 2. 14. So sánh các hoạt động của thuật toán cICA dựa trên mơ hình ICA q mức và bình thường.

Hình 2. 15. So sánh các hệ số tương quan c (MZb, Mzc) và c (Mxfn Mz) cho 30 đối tượng.

Hình 2. 15 cho thấy hệ số tương quan c(Mzb, Mz) của giá trị độ sâu thực và giá trị ước lượng độ sâu thu được bằng thuật toán cICA_MI và hệ số tương quan

c(Mzb,Mzc) giá trị độ sâu thực và giá trị độ sâu của mơ hình CANDIDE. Chúng ta

có thể thấy rằng các giá trị độ sâu ước lượng gần với giá trị độ sâu thực cho hầu hết các đối tượng, so với mơ hình CANDIDE. Do đó, phương pháp trên có thể ước lượng chính xác các giá trị độ sâu của ảnh khn mặt. Tuy nhiên, cũng có thể nhận thấy rằng có một số cải thiện về hiệu suất đối với một số bài tốn. Điều này có thể là do những lý do sau đây. Như thể hiện trong Hình 2.11, hiệu suất

thường trở nên ổn định khi số lần lặp tối đa (Niter) là khoảng 1500. Tuy nhiên,

hiệu suất tối ưu có thể khơng đạt được đối với một số bài toán với số lần lặp này. Hiện tại, vẫn chưa có một tiêu chí hiệu quả để thực hiện việc dừng thực hiện sớm. Mặt khác, phương pháp tích hợp mơ hình được đề xuất tương tự như các phương pháp tích hợp mơ hình khác, chẳng hạn như phương pháp tích hợp bộ phân loại. Hiệu suất có thể được cải thiện đáng kể chỉ khi một số điều kiện được thỏa mãn, ví dụ: đầu ra của các mơ hình khác nhau là đa dạng và bổ sung cho nhau.

Trong thuật toán cICA_MI, thống kê bậc nhất, giá trị trung bình, được sử dụng để tính tốn thống kê kết quả thu được khi có nhiều hình ảnh khn mặt khơng nhìn trực diện.

Hình 2. 16. So sánh các hệ số tương quan thu được bằng cách sử dụng 4 thống kê bậc nhất khác nhau với phương pháp tích hợp mơ hình cho 30 đối tượng.

Hình 2.16 cho thấy kết quả thực nghiệm khi 4 thống kê bậc nhất khác nhau, cụ thể là giá trị trung bình, trung bình, trung bình điều hịa (hmean) và trung bình hình học (gmean), được sử dụng với phương pháp tích hợp mơ hình. Xem xét độ chính xác và tính mạnh mẽ của ước lượng độ sâu, Hình 2.16 cho

thấy rằng phương pháp tích hợp mơ hình có thể đạt được hiệu suất tốt nhất khi giá trị trung bình được sử dụng.

Hình 2. 17. Hệ số tương quan của Đối tượng 1,6, 11,16,21 và 26 thu được bằng cách sử dụng phương pháp tích hợp mơ hình với số lượng mẫu khác nhau

Hình 2.17 cho thấy hệ số tương quan của hệ số phản ứng 1,6, 11,16,21 và 26 thu được bằng cách sử dụng phương pháp tích hợp mơ hình với số lượng hình ảnh đào tạo ngày càng tăng. Nói chung, có thể thấy rằng độ chính xác được cải thiện khi có nhiều hình ảnh hơn được đưa vào ước lượng. Do đó, có thể thu được các kết quả khác nhau bằng cách sử dụng các kết hợp khác nhau của các mẫu khn mặt. Nếu khơng có các giá trị độ sâu thực, rất khó xác định một tiêu chí hiệu quả để tìm ra sự kết hợp tối ưu. Trong các thử nghiệm, tất cả các mẫu đào tạo có sẵn được sử dụng cho thuật tốn cICA_MI.

Cần chỉ ra rằng, để thuận tiện cho việc hiển thị kết quả, chỉ 30 đối tượng đầu tiên, thay vì tất cả đối tượng được hiển thị trong các thí nghiệm trên. Để so sánh kết quả thống kê của tất cả các đối tượng, Bảng 2-2 cho thấy các giá trị

trung bình (μ) và độ lệch chuẩn (σ) của các hệ số tương quan thu được bằng năm

phương pháp cho 105 đối tượng riêng biệt. Vì các giá trị độ sâu trong mơ hình

tham chiếu CANDIDE được sử dụng trong phương pháp đề xuất, nênμσ của

c(Mzb,Mzc) cho tất cả các đối tượng cũng được đưa ra trong Bảng II để thể hiện

mức độ cải thiện. Ngoài ra,μσ ở đầu các lần lặp, tức là, hệ số tương quan

giữa các giá trị độ sâu thực và giá trị độ sâu tương ứng được ước lượng từ tất cả các mẫu của một đối tượng, cũng được đưa ra ở đây để điều tra xem hiệu suất được cải thiện khi tiến hành lặp lại. Có thể thấy từ Bảng II rằng hiệu suất tương tự cũng đạt được đối với FastICA, gICA và SM. Vì giá trị độ sâu của các điểm

đặc trưng trong mơ hình CANDIDE được sử dụng trong FastICA và SM, chúng ta có thể thấy rằng hai phương pháp này có hiệu suất tốt hơn một chút so với

gICA. σ của SM lớn hơn của FastICA và gICA vì thuật tốn di truyền (GA)

được sử dụng trong SM và sự dao động lớn hơn là do việc khởi tạo GA ngẫu nhiên. Trong thuật tốn cICA, tín hiệu tham chiếu này không chỉ được sử dụng trong việc khởi tạo cấu trúc mặt 3-D để ước lượng, mà còn được triển khai cho hàm mục tiêu của mơ hình cICA. Khi có nhiều thơng tin và điều kiện ưu tiên hơn được thực thi, cICA và cICA_MI có độ chính xác ước lượng độ sâu cao hơn và mạnh hơn so với các phương pháp khác. Hơn nữa, so với cICA, giá trị trung bình tăng khoảng 3% đối với cICA_MI. Do đó, phương pháp tích hợp mơ hình được đề xuất có thể cải thiện hơn nữa độ chính xác của ước lượng độ sâu. Ngồi

ra, chúng ta có thể thấy rằng cICA_MI có giá trị trung bình cao hơn c(Mzb,Mzc).

Do đó, giá trị ước lượng độ sâu gần với giá trị độ sâu thực hơn so với mơ hình CANDIDE. Chúng ta cũng có thể thấy rằng hệ số trung bình của cICA_MI khơng lặp lại thấp hơn của cICA_MI. Do đó, hiệu suất có thể được cải thiện hơn nữa cho cICA_MI với nhiều lần lặp hơn. Kết luận, các phương pháp được đề xuất có thể ước lượng độ sâu của ảnh khn mặt chính xác hơn các phương pháp khác.

Bảng 2. 2. Gía trị trung bình μ và độ lệch chuẩn σ thu được bằng 5 phương pháp và hệ số lương quan c(Mzb,Mzc) của 105 đối tượng

μ σ

FastICA 0,4965 0,2251

glCA 0,4048 0,2006

SM 0,4920 0,2620

cICA 0,8396 0,0631

cICA_MI (Không lặp lại) 0,8376 0,0664

clCA_MI 0,8708 0,0599

c(Mzb, Mzc) 0,8375 0,0549

Hai loại thuật toán phổ biến để ước lượng cấu trúc 3-D đã thu hút nhiều nhà nghiên cứu: ước lượng độ sâu của các điểm đặc trưng và tái tạo bề mặt 3-D. Phương pháp được đề xuất thuộc về kiểu cũ, có thể được sử dụng trực tiếp trong cả ước lượng tư thế và nhận dạng khn mặt. Sau khi có được giá trị độ sâu của các điểm đặc trưng liên quan, chúng ta có thể thiết lập mơ hình mặt 3-D dựa trên các điểm đặc trưng. Tư thế có thể được ước lượng thơng qua khoảng cách tương tự giữa các điểm đặc trưng của hình ảnh khn mặt 2-D có liên quan và các điểm chiếu tương ứng của mơ hình khn mặt 3-D, trong đó các tham số tư thế là các tham số cần được tối ưu hóa. Ngồi ra, mơ hình 3-D được xây dựng cũng có thể được sử dụng để nhận dạng khn mặt. Vì chỉ một số điểm tính năng

được chọn được sử dụng trong nhận dạng khn mặt, nên sẽ ít dư thừa hơn. Tái tạo bề mặt 3-D là một phương pháp phù hợp hơn để phục hồi cấu trúc 3-D đầy đủ của khuôn mặt. Giá trị độ sâu của bất kỳ điểm nào có thể được lấy trực tiếp từ bề mặt được tái tạo 3-D hoặc bằng cách sử dụng phương pháp nội suy. Sau khi có được bề mặt 3-D, một số phương pháp trích xuất đối tượng, chẳng hạn như PCA, thường được áp dụng trên đám mây điểm để trích xuất đối tượng. Tính năng được trích xuất sau đó được sử dụng để nhận dạng khn mặt. Nhìn chung, cả hai phương pháp này đều có thể được sử dụng để nhận dạng khn mặt nhưng với các quy trình khác nhau. Việc khai thác tính năng là khơng cần thiết đối với cấu trúc khơng chuyển động. Chúng có thể được chọn để xây dựng mơ hình mặt 3-D cho các ứng dụng và điều kiện thực tế.

Như vậy, một thuật tốn ước lượng độ sâu mới và chính xác cho hình ảnh khn mặt đã được đề xuất dựa trên mơ hình cICA. Việc sử dụng thơng tin trước từ mơ hình mặt 3-D CANDIDE có thể chuyển đổi bài tốn khó ban đầu thành mơ hình ICA bình thường, mơ hình này đã được chứng minh là hiệu quả và chính xác hơn để tái tạo cấu trúc mặt 3-D dựa trên một hoặc nhiều hình ảnh khn mặt. Khi có nhiều hình ảnh khn mặt khơng nhìn trực diện, một phương pháp tích hợp mơ hình được đề xuất, phương pháp này có thể cải thiện hiệu quả độ chính xác và độ mạnh của ước lượng. Đối với phương pháp tích hợp mơ hình, giá trị trung bình thống kê được xác minh là tốt hơn các thống kê bậc nhất khác, chẳng hạn như giá trị trung bình, trung bình điều hịa và trung bình hình học. So với FastICA, gICA và SM, các phương pháp được có độ chính xác ước tính độ sâu cao hơn và độ mạnh mẽ tốt hơn. Kết quả thử nghiệm với cơ sở dữ liệu Bosphorus đã chứng minh tính khả thi và chính xác của các phương pháp trên.

Một phần của tài liệu NGHIÊN CỨU THUẬT TOÁN ICA VÀ ỨNG DỤNG ƯỚC LƯỢNG ĐỘ SÂU ẢNH MẶT NGƯỜI (Trang 31 - 37)

Tải bản đầy đủ (PDF)

(37 trang)