Phương pháp không gian con 35

Một phần của tài liệu So khớp chuỗi ảnh mặt người trên dữ liệu video lớn (Trang 35)

Các tác giả trong [6, 7, 8] lại phát triển phương pháp so khớp ảnh mặt người dựa trên không gian con. Mỗi face track sẽ được biểu diễn bởi một không gian con mở

rộng từ những điểm trong face track đó. Một trong những phương pháp tiêu biểu cho hướng tiếp cận này là phương pháp không gian con chung (Mutual Subspace Method – MSM) được đề xuất bởi Yamaguchi trong [7]. Cho một cơ sở dữ liệu gồm N face tracks, mỗi face track gồm mặt người được biễu diễn bởi các vector . MSM tính toán không gian con cho qua các bước sau:

• Tính toán ma trận cho mỗi face track :

• Tính toán vector riêng và trị riêng của .

• Chọn K vector riêng ứng với K trị riêng lớn nhất dựa trên đánh giá sau:

đánh giá này cho thấy, chúng ta sẽ chọn K vector riêng ứng với K trị riêng nhỏ nhất sao cho tổng các trị riêng này chiếm tới T tổng tất cả các trị riêng. Nói cách khác, chúng ta chỉ chọn những vector riêng đóng vai trò quan trọng nhất để biểu diễn không gian con cho face track. Giá trị ngưỡng T nằm trong khoảng từ [0, 1], khi

T=1 chúng ta sẽ chọn hết tất cả các vector riêng. Những vector riêng được chọn sẽ được dùng làm vector cơ sở trực giao cho không gian con biểu diễn cho face track .

Trong giai đoạn so khớp, khoảng cách giữa face track truy vấn G (được biểu diễn bằng không gian con ) và mỗi face track (được biểu diễn bằng không gian con ) trong cơ sở dữ liệu được tính toán thông qua khoảng cách giữa hai không

gian con. Khoảng cách này được định nghĩa trong [7] là giá trị bình phương cosine của góc chính tắc (canonical angle) nhỏ nhất. Hay nói đơn giản, giá trị này là góc nhỏ nhất giữa hai điểm nằm trên hai không gian con:

Tuy nhiên việc tìm dựa trên công thức trên là quá phức tạp, do đó có thểđược tình toán thông qua việc tìm trị riêng của ma trận X:

ởđây đây lần lượt là vector cơ sở của và , là chiều của không gian con lớn hơn. Bình phương cosine của góc chính tắc nhỏ nhất chính là giá trị riêng lớn nhất của X. Hình 2-13 biểu diễn các face track và góc giữa các face track trong phương pháp MSM.

Hình 2-13: Phương pháp MSM.

Một mở rộng của MSM là phương pháp không gian con chung ràng buộc (Constrained Mutual Subspace Method - CMSM) [8] được đề xuất bởi Kazuhiro Fukui. CMSM cũng tìm một không gian con để biểu diễn cho mỗi face track nhưng khác với MSM, CMSM tìm thêm một không gian con Q có chiều

( ) (gọi là không gian con ràng buộc – constrained subspace) và chiếu vào trong không gian này để tạo ra không gian con . Khi đó, các face track sẽđược biểu diễn bởi các không gian con thay vì như trong phương pháp MSM. Quá trình so khớp trong CMSM hoàn toàn tương tự như trong MSM với khoảng cách bình phương cosine của góc chính tắc được sử dụng. Để tính toán không gian con ràng buộc, CMSM thực hiện như sau:

• Tính toán ma trận tổng các không gian con của tất cả các face track:

• Tìm vector riêng và trị riêng của ma trận H.

• Chọn vector riêng ứng với trị riêng nhỏ nhất làm cơ sở cho không gian ràng buộc Q.

Hình 2-14 cho thấy quá trình biểu diễn face track và tính khoảng cách góc của phương pháp CMSM. Ý tưởng của việc sử dụng không gian con ràng buộc khá giống với ý tưởng của phương pháp LDA ở điểm chiếu các không gian con vào không gian con ràng buộc sẽ làm tăng độ phân biệt giữa các không gian con và giúp tính toán khoảng cách được tốt hơn. Tuy nhiên, CMSM sẽ cần thêm chi phí cho việc tính toán không gian con ràng buộc và chiếu các không gian con vào không gian này.

Hình 2-14: Phương pháp CMSM.

Phương pháp trong [6] tương tự như phương pháp CMSM với một chút khác biệt nhỏ là sử dụng hai không gian con ràng buộc chứ không phải một không gian con ràng buộc như CMSM.

Mặc dù mỗi face track chỉ là một tập điểm nằm trong một vùng giới hạn trong không gian, nhưng các phương pháp không gian con thay vì biểu diễn chính xác tập

điểm lại sử dụng toàn bộ không gian con để đại diện cho mỗi face track. Cách biểu diễn này có vẻ là cách biểu diễn không chặt, tuy nhiên lại cho thấy kết quả tốt [6, 7, 8]. Phương pháp MSM hiện tại vẫn là một trong những phương pháp tiên tiến và thường được sử dụng để so sánh trong các nghiên cứu về so khớp face track.

Một phần của tài liệu So khớp chuỗi ảnh mặt người trên dữ liệu video lớn (Trang 35)