Dùng phương pháp InnerDistance

Một phần của tài liệu (LUẬN văn THẠC sĩ) kiểm tra độ khác biệt của logo dùng kỹ thuật so khớp ảnh (Trang 43 - 48)

5. Phương pháp nghiên cứu

2.1.3. Dùng phương pháp InnerDistance

Trong đó T (·) là ước tính biến đổi TPS ánh xạ các điểm trong Q tới các điểm trong P.

Chi phí xuất hiện (appearance cost):

Sau khi thiết lập các ảnh tương ứng và làm cong vênh một hình ảnh phù hợp với ảnh kia, người ta có thể định nghĩa chi phí xuất hiện là tổng của sự khác biệt độ sáng bình phương trong các cửa sổ Gaussian xung quanh các điểm hình ảnh tương ứng:

(2.19)

Trong đó IP và IQ là hình ảnh mức xám IQ là hình ảnh sau khi cong vênh và G là hàm cửa sổ Gaussian.

2.1.3 Dùng phương pháp Inner Distance [10]

Năm 2007 trong bài báo công bố trên IEEE các tác giả Haibin Ling David W. Jacobs thuộc Đại học Maryland (University of Maryland), Hoa Kỳ đã đưa ra phương pháp so khớp hình dạng Inner Distance.

Tóm tắt: thành phần cấu trúc và articulation có tầm quan trọng cơ bản trong máy tính và thị giác của con người. Các tác giả [10] đã đề xuất sử dụng Inner-Distance để xây dựng các mô tả hình dạng mạnh mẽ để articulation và nắm bắt cấu trúc bộ phận. Khoảng cách bên trong được định nghĩa là chiều dài của con đường ngắn nhất giữa các điểm mốc trong hình dạng hình, đó là articulation không nhạy cảm và hiệu quả hơn trong việc nắm bắt các cấu trúc bộ phận hơn khoảng cách Euclide. Điều này cho thấy rằng Inner-Distance có thể được sử dụng thay thế cho khoảng cách Euclide để xây dựng các mô tả chính xác hơn cho các hình dạng phức tạp, đặc biệt đối với những người có các bộ phận articulation. Ngoài ra, thông tin kết cấu dọc theo con

đường ngắn nhất có thể được sử dụng để cải thiện hơn nữa việc phân loại hình dạng. Với ý tưởng này, các tác giả [10] đã đề xuất ba cách tiếp cận để sử dụng khoảng cách bên trong. Phương pháp đầu tiên kết hợp tỷ lệ Inner-Distance và tỷ lệ đa chiều (MDS) để xây dựng chữ ký bất biến articulation cho hình dạng articulation. Phương pháp thứ hai sử dụng Inner-Distance để xây dựng một bộ mô tả hình dạng mới dựa trên shape contexts. Cái thứ ba mở rộng cái thứ hai bằng cách xem xét thông tin kết cấu dọc theo con đường ngắn nhất. Các phương pháp đề xuất đã được thử nghiệm trên nhiều cơ sở dữ liệu hình dạng bao gồm bộ dữ liệu hình dạng articulation, MPEG7 CE-Shape-1, bóng Kimia, bộ dữ liệu ETH-80, bộ dữ liệu hai lá và bộ dữ liệu hình bóng chuyển động của con người. Trong tất cả các thí nghiệm, các phương pháp của các tác giả đã cho hiệu suất hiệu quả hơn so với các thuật toán khác.

Định nghĩa khoảng cách bên trong: inner-distance được định nghĩa là chiều dài của con đường ngắn nhất trong ranh giới hình dạng, để xây dựng mô tả hình dạng - chúng không vượt qua ranh giới hình dạng. Như vậy dễ dàng nhận thấy rằng khoảng cách bên trong là không nhạy cảm để định hình khớp nối. Ví dụ, trong Hình 1, mặc dù các điểm trên hình (a) và (c) có các phân bố không gian tương tự nhau, chúng khá khác nhau trong cấu trúc bộ phận của chúng. Trên mặt khác, hình dạng (b) và (c) dường như đến từ cùng một loại với các khớp nối khác nhau. Khoảng cách bên trong giữa hai điểm được đánh dấu là khá khác nhau ở (a) và (b), trong khi gần như giống nhau trong (b) và (c). Theo trực giác, ví dụ này cho thấy khoảng cách bên trong không nhạy cảm với khớp nối và nhạy cảm với các cấu trúc bộ phận, một đặc tính mong muốn để so sánh hình dạng phức tạp.

Lưu ý rằng khoảng cách Euclide không có các tính chất này trong ví dụ này. Đó là bởi vì, được định nghĩa là độ dài của đoạn đường giữa các điểm mốc, khoảng

cách Euclide không xem xét liệu đoạn đường có vượt qua ranh giới hình dạng hay không. Trong ví dụ này, rõ ràng là khoảng cách bên trong phản ánh cấu trúc bộ phận

Hình 2.12 Ba đối tượng và inner distance. Các đường đứt nét biểu thị các đường dẫn ngắn nhất trong ranh giới hình dạng kết nối các điểm mốc.

Việc sử dụng khoảng cách bên trong là thay thế cho các biện pháp khoảng cách khác để xây dựng bộ mô tả hình dạng mới là bất biến/không nhạy cảm với khớp nối.

Không giống như khoảng cách đo đạc, khoảng cách bên trong đo chiều dài của con đường ngắn nhất trong ranh giới hình dạng thay vì dọc theo đường viền hình dạng (bề mặt). Các tác giả [10] chỉ ra rằng khoảng cách bên trong là rất nhiều thông tin và không nhạy cảm với khớp nối.

Hình 2.13 Khoảng cách trắc địa trên các hình dạng 2D. Sử dụng khoảng cách trắc địa dọc theo các đường viền, hai hình dạng không thể phân biệt được.

Tính toán inner-distance

Đầu tiên, chúng ta xác định hình dạng O là tập con đóng và kết nối của R2. Cho hình O và hai các điểm x, y ∈ O, khoảng cách trong giữa x, y, ký hiệu là d (x, y; O), được định nghĩa là độ dài của con đường ngắn nhất nối x và y trong O. Một ví dụ được hiển thị trong Hình 2.14.

1) Có thể tồn tại nhiều đường dẫn ngắn nhất giữa các điểm đã cho. Tuy nhiên, đối với hầu hết các trường hợp, đường dẫn là duy nhất. Trong những trường hợp hiếm hoi có nhiều đường dẫn ngắn nhất, chúng ta tùy ý chọn một đường dẫn.

2) Chúng ta quan tâm đến các hình dạng được xác định bởi các ranh giới của chúng, do đó chỉ các điểm biên được sử dụng làm điểm mốc. Ngoài ra, chúng ta sẽ ước tính một hình dạng với một đa giác được hình thành bởi các điểm mốc của chúng.

Hình 2.14. Định nghĩa khoảng cách bên trong. Các đường nét đứt cho thấy đường đi ngắn nhất giữa điểm x và y.

Một cách tự nhiên để tính khoảng cách bên trong là sử dụng thuật toán đường đi ngắn nhất. Công việc này bao gồm hai bước:

1)Xây dựng một biểu đồ với các điểm mẫu. Đầu tiên, mỗi điểm mẫu được coi là một nút trong đồ thị. Sau đó, đối với mỗi cặp điểm mẫu p1 và p2, nếu đoạn thẳng nối p 1 và p 2 nằm hoàn toàn trong đối tượng, một cạnh (edge) giữa p 1 và p 2 được thêm vào biểu đồ với trọng số của nó bằng khoảng cách Euclide || p1 − p2||. Một ví dụ được hiển thị trong Hình 4. Lưu ý 1) Các điểm ranh giới lân cận luôn được kết nối; 2) Khoảng cách bên trong phản ánh sự tồn tại của các lỗ mà không sử dụng các điểm mẫu từ ranh giới lỗ, cho phép các thuật toán quy hoạch động được áp dụng cho các hình có lỗ.

2)Áp dụng thuật toán đường dẫn ngắn nhất vào biểu đồ. Nhiều thuật toán tiêu chuẩn [11] có thể được áp dụng ở đây, trong số đó thuật toán Johnson hoặc Floyd- Warshall có độ phức tạp O (n 3) (n là số điểm mẫu).

Việc tính toán này đã được chỉ ra rằng có thể được tính toán với độ phức tạp thời gian O(n 3) cho n điểm mẫu. Đầu tiên, phải mất thời gian O(n) để kiểm tra xem một đoạn đường giữa hai điểm có nằm trong hình đã cho hay không (bằng cách kiểm

tra các giao điểm giữa đường p1 p2 và tất cả các đoạn đường biên khác, với một số thử nghiệm bổ sung). Kết quả là, độ phức tạp của việc xây dựng đồ thị là của O(n3). Sau khi biểu đồ đã sẵn sàng, thuật toán đường đi ngắn nhất của tất cả các cặp có độ phức tạp là O (n3). Do đó, chi phí tính toán toàn bộ O(n3).

Hình 2.15. Tính toán khoảng cách bên trong. Còn lại, hình dạng với các điểm mốc hình mẫu được lấy mẫu. Ở giữa, đồ thị được xây dựng bằng cách sử dụng các điểm mốc. Phía phải, một chi tiết trên cùng bên phải của biểu đồ. Lưu ý cách khoảng cách bên trong chụp các lỗ.

Lưu ý rằng khi O lồi, khoảng cách bên trong giảm xuống khoảng cách Euclide. Tuy nhiên, điều này không phải lúc nào cũng đúng với các hình dạng không lồi (ví dụ: Hình 1). Điều này cho thấy rằng khoảng cách bên trong bị ảnh hưởng bởi cấu trúc bộ phận mà độ đồng nhất của các đường viền có liên quan chặt chẽ với nhau.

Một phần của tài liệu (LUẬN văn THẠC sĩ) kiểm tra độ khác biệt của logo dùng kỹ thuật so khớp ảnh (Trang 43 - 48)

Tải bản đầy đủ (PDF)

(85 trang)