Có hai nhân tố ảnh hƣởng đến độ chính xác tra cứu trong CBIR nói chung và CBsIR nói riêng, trong đó nhân tố “khoảng cách số” là quan trọng. Khoảng cách số gồm các bƣớc khác nhau của quá trình tra cứu nhƣ: biểu diễn ảnh, đo khoảng cách, chiến lƣợc tìm kiếm. Để cực tiểu “khoảng cách số” này, phƣơng pháp đối sánh cây phân cấp HTM [28] sử dụng đặc trƣng ảnh phù hợp và nén, các hàm khoảng cách chính xác và có độ phức tạp tính toán thấp và các cấu trúc dữ liệu hiệu quả cho tìm kiếm tƣơng tự.
Số hóa bởi Trung tâm Học liệu
Phƣơng pháp HTM gồm có ba thành phần chính:
- Một cấu trúc cây mà mô hình phân hoạch phân cấp của các ảnh thành các lát ảnh sử dụng các đặc trƣng màu.
- Một chuỗi chỉ số biểu diễn cấu trúc cây (cho phép truy cập nhanh trong pha tìm kiếm).
- Một chiến lƣợc tìm kiếm dựa vào các cấu trúc cây của cả ảnh cơ sở dữ liệu và ảnh truy vấn.
Bằng việc sử dụng một cây để phân rã phân cấp một ảnh thành các lát, phƣơng pháp HTM có thể xử lý tất cả các phần của ảnh. Lƣu ý rằng, việc sử dụng một phân rã cố định, phƣơng pháp không dựa vào phân đoạn ảnh (một quá trình thiếu chính xác). Số các lát đƣợc phân hoạch là cố định cũng nhƣ chiến lƣợc phân hoạch đƣợc xác định trƣớc. Cây kết quả là nhỏ cho lƣu trữ và tốc độ nhanh cho tìm kiếm. Thêm nữa, quan hệ cha con trong cấu trúc cây phân cấp phục vụ thuận lợi cho kết hợp các lát thay vì sử dụng các hàm khoảng cách phức tạp khi đối sánh các ảnh trong pha tìm kiếm. Phƣơng pháp lƣu trữ các đặc trƣng ảnh kết hợp với các nút trong cấu trúc cây theo khuôn dạng của một chuỗi chỉ số cho phép truy cập nhanh trong giai đoạn tìm kiếm. Phƣơng pháp cũng xử lý ảnh con truy vấn bằng việc xây dựng một cấu trúc cây theo cùng một cách nhƣ các cây đƣợc xây dựng cho các ảnh cơ sở dữ liệu, loải bỏ các ràng buộc về cỡ với ảnh con truy vấn.Tra cứu các ảnh liên quan đƣợc thực hiện bởi so sánh hiệu quả cấu trúc cây của truy vấn với tất cả các cây con của các ảnh cơ sở dữ liệu. Sau đó khoảng cách giữa các cấu trúc cây có thể đƣợc tính toán hiệu quả để phân hạng các ảnh cơ sở dữ liệu với ảnh truy vấn.