Đối sánh 2 ảnh quay về đối sánh 2 điểm đặc trưng

Một phần của tài liệu (LUẬN văn THẠC sĩ) nhận dạng và định danh khuôn mặt người thời gian thực và sử dụng camera 2d giá rẻ (Trang 53 - 56)

Có 2 vấn đề cần được quan tâm :

Tổ chức tập hợp điểm cho phép tìm kiếm láng giềng một cách hiệu quả Việc đối sánh phải đạt độ chính xác nhất định

Một phương pháp được đề xuất bởi D. Mount cho phép tìm kiếm nhanh các điểm lân cận được sử dụng[4], ANN là viết tắt của Approximative Nearest Neibour.

mang tính xấp xỉ trên kd-tree. Cụ thể là hai điểm trong không gian đặc trưng được coi là giống nhau nếu khoảng cách Euclidean giữa hai điểm là nhỏ nhất và tỉ số giữa khoảng cách gần nhất với khoảng cách gần nhì phải nhỏ hơn 1 ngưỡng cho trước

Giả sử cặp keypoint có bộ mơ tả lần lượt là:

A = (a1, a2, a3, … , a128) và B = (b1, b2, b3, … , b128)

Thì khoảng cách Euclid giữa A và B được tính bằng cơng thức:

( ) √∑ ∑

( )

2.5.7.3 Độ đo tương đồng cho đặc trưng cục bộ bất biến

Một số độ đo tương đồng cho ảnh sử dụng đặc trưng SIFT  Độ đo Cosin: ( ) ( )  Khoảng cách góc: ( ) ( ) ( )  Độ đo Euclide: ( ) √∑ ( )

 Độ đo Jensen-Shannon divergence : ( ) ∑

( )

Với H, H’ là 2 biểu đồ biểu diễn các vector đặc trưng SIFT

2.5.8. Ứng dụng cho nhận dạng đối tượng

Nhận dạng đối tượng được thực hiện trước tiên bởi việc đối sánh từng keypoint độc lập với cơ sở dữ liệu của keypoint chiết xuất từ các hình ảnh huấn luyện. Nhiều đối sánh trong số những đối sánh đầu tiên sẽ là khơng chính xác, do thuộc tính khơng rõ ràng hoặc các thuộc tính phát sinh từ một nền lộn xộn. Do đó, các cụm ít nhất 3 thuộc tính đầu tiên được nhận dạng đúng về một đối tượng và tư

thế của nó, việc đối sánh theo những cụm thuộc tính có xác suất cao hơn nhiều so với các đối sánh đặc điểm riêng biệt. Sau đó, mỗi cụm được kiểm tra bằng cách thực hiện một mơ hình hình học chi tiết và kết quả được sử dụng để xem xét xem đối sánh trên đúng hay sai.

2.5.8.1.So khớp Keypoint

Đối sánh các keypoint tốt nhất được tìm thấy bằng cách xác định điểm lân cận gần nhất với nó trong cơ sở dữ liệu của keypoint từ hình ảnh huấn luyện. Điểm lân cận gần nhất được định nghĩa là các keypoint với khoảng cách Euclide tối thiểu đối với các vector mô tả bất biến như đã được mô tả trong phần sau.

Tuy nhiên, nhiều thuộc tính từ một hình ảnh sẽ khơng có bất kỳ đối sánh nào chính xác trong cơ sở dữ liệu chi phí đào tạo bởi vì nó phát sinh từ nền lộn hoặc khơng được phát hiện trong những hình ảnh huấn luyện. Đó là một cách hữu ích để loại bỏ dễ dàng các thuộc tính mà khơng có bất kỳ đối sánh tốt nào với cơ sở dữ liệu. Một ngưỡng toàn cục về khoảng cách đến các thuộc tính gần nhất là khơng hiệu quả vì có nhiều bộ mơ tả khác nhau về một đối tượng. Biện pháp hiệu quả hơn thu được bằng cách so sánh khoảng cách của những điểm lân cận gần nhất đó với điểm lân cận gần nhất thứ hai. Nếu có nhiều hình ảnh huấn luyện của cùng một đối tượng, ta sẽ định nghĩa điểm lân cận thứ hai từ lân cận gần nhất được biết đến từ một đối tượng khác so với đối tượng đầu, chẳng hạn như bằng cách chỉ sử dụng các hình ảnh có chứa nhiều đối tượng khác nhau. Biện pháp này hoạt động tốt vì các đối sánh chính xác cần phải có số lượng đáng kể những điểm lân cận gần nhất hơn so với đối sánh khơng chính xác để đạt được đối sánh đáng tin cậy. Đối với đối sánh sai, có thể sẽ có một số lượng đối sánh sai khác trong khoảng cách tương tự do chiều cao của không gian đặc trưng.

Một phần của tài liệu (LUẬN văn THẠC sĩ) nhận dạng và định danh khuôn mặt người thời gian thực và sử dụng camera 2d giá rẻ (Trang 53 - 56)

Tải bản đầy đủ (PDF)

(104 trang)