Phương pháp dựa trên tập điểm 30

Một phần của tài liệu So khớp chuỗi ảnh mặt người trên dữ liệu video lớn (Trang 30)

Đây là ý tưởng đơn giản nhất. Mỗi vector biễu diễn ảnh mặt người sẽ là một

điểm trong không gian. Khi đó mỗi face track là tập hợp N điểm. Việc biểu diễn face track sẽ là quá trình chọn những điểm để đại diện cho tập hợp N điểm đó. Phương pháp min-min [3, 4, 5] đơn giản chọn tất cả các điểm để biểu diễn face

track, khi đó khoảng cách giữa hai tập hợp là khoảng cách của hai điểm gần nhau nhất trong hai face track:

ở đây , là hai face track d(x, y) là hàm tính khoảng cách giữa hai điểm (khoảng cách ở đây có thể là khoảng cách Euclidean, L1, HIK v.v….). Hình 2-10

cho thấy ví dụ hai face track (xanh và đỏ), khoảng cách giữa hai face track này là khoảng cách giữa hai điểm gần nhau nhất trong hai face track, điểm A thuộc face track 1 và điểm B thuộc face track 2.

Hình 2-10: Khoảng cách giữa hai face track trong thuật toán min-min.

Một phương pháp khác cũng sử dụng tất cả các điểm để biểu diễn face track là phương pháp avg-min, tuy nhiên khác với min-min, khoảng cách giữa hai face track

được tính là trung bình khoảng cách giữa các cặp điểm giữa hai face track.

Mặc dù phương pháp chọn tất cả các điểm để biểu diễn face track như min-min, avg-min có thể cho kết quả cao, nhưng do phải tính toán trên toàn bộ face track nên

nhưng phương pháp này đòi hỏi chi phí tính toán rất lớn. Một số phương pháp giải quyết điều này bằng cách chỉ chọn một sốđiểm để đại diện cho cả tập hợp. Phương pháp k-Faces [9] chia chuỗi ảnh thành k đoạn, trong mỗi đoạn, sẽ chọn ra một ảnh chính giữa để đại diện cho đoạn đó, vector trung bình của những ảnh đại diện cho mỗi đoạn sẽ được sử dụng để biễu diễn cho face track (Hình 2-11). Như vậy mỗi face track sẽ được đại diện bởi một điểm duy nhất. Khi đó, khoảng cách giữa hai face track đơn giản là khoảng cách giữa hai điểm trong không gian. Trong trường hợp k bằng số lượng ảnh có trong face track, phương pháp này tương đương với việc lấy vector trung bình đểđại diện cho face track. Theo [9], phương pháp này đạt kết quả tốt nhất khi k = 5. Ưu điểm lớn nhất của phương pháp này là khả năng so khớp rất nhanh so với các phương pháp khác.

Hình 2-11: Phương pháp k-Faces với k = 3 (Nguồn [9]).

Một phần của tài liệu So khớp chuỗi ảnh mặt người trên dữ liệu video lớn (Trang 30)