Bài toán tra cứu ảnh theo nội dung

Một phần của tài liệu (LUẬN văn THẠC sĩ) tra cứu ảnh dựa trên khoảng cách và bài toán tối ưu pareto (Trang 29 - 30)

Việc tìm kiếm ảnh theo nội dung là tính độ tương tự hoặc khoảng cách ảnh. Cơ sở dữ liệu lưu ảnh mẫu bao gồm thông tin và nội dung ảnh nguyên gốc do người sử dụng đưa vào. Dữ liệu trong CBIR được lấy trên cơ sở các nội dung mà nó trích rút bằng cách sử dụng các kĩ thuật trích rút đặc trưng mức thấp bên trong mỗi ảnh (màu sắc, hình dạng, kết cấu, vv…). Các hàm tìm kiếm được xây dựng để tra cứu theo sự quan tâm. Bài toán này sử dụng kết hợp nhiều biểu diễn đặc trưng được miêu tả. Trong xếp hạng các kết quả trả về cho người dùng thông thường sử dụng khoảng cách toàn cục bằng kết hợp tuyến tính khoảng cách cục bộ theo biểu diễn đặc trưng thành phần. Một ảnh được xếp thứ hạng cao hơn nếu và chỉ nếu độ đo khoảng cách toàn cục là nhỏ hơn.

Ví dụ 2.1. Giả sử chúng ta có hai đặc trưng màu (C) và kết cấu (T). Độ đo khoảng cách của ba đối tượng o1, o2, o3 tương ứng với truy vấn Q là

𝐷𝑄(𝐶)(𝑜1) = 0.6, 𝐷𝑄(𝑇)(𝑜1) = 0.3 𝐷𝑄(𝐶)(𝑜2) = 0.5, 𝐷𝑄(𝑇)(𝑜2) = 0.2

𝐷𝑄(𝐶)(𝑜3) = 0.45, 𝐷𝑄(𝑇)(𝑜3) = 0.35

Khoảng cách toàn cục áp dụng kết hợp tuyến tính độ đo khoảng cách thành phần của các đặc trưng màu và kết cấu tương ứng là 𝐷𝑄(𝑜1) = 0.9, 𝐷𝑄(𝑜1) = 0.7, 𝐷𝑄(𝑜1) = 0.8. Dễ dàng xếp hạng độ đo khoảng cách là o2, o3, o1. Khi không kết hợp tuyến tính độ đo khoảng cách toàn cục, xếp hạng dựa vào độ đo khoảng cách thành phần chúng ta chỉ có thể xếp hạng được o1 và o2,

đối tượng o3 không thể so sánh được với hai đối tượng còn lại. Như vậy cách xếp hạng sử dụng tổng toàn bộ độ đo khoảng cách của các thành phần trong kết quả cuối cùng còn nhiều vấn đề cần xem xét và cải tiến.

Một phần của tài liệu (LUẬN văn THẠC sĩ) tra cứu ảnh dựa trên khoảng cách và bài toán tối ưu pareto (Trang 29 - 30)

Tải bản đầy đủ (PDF)

(69 trang)