Vogel và Schielle (2004) đưa ra thuật toán rất đơn giản và hiệu quả để tìm kiếm ảnh. Họ chia ảnh ra thành các phần dựa trên lưới (16x16) sau đó mỗi ơ trên lưới sẽ được phân loại thành các khái niệm cơ bản trong ảnh (trời, nước, cây). Các khái niệm sau đó được lập thành lược đồ khái niệm, và quá trình tìm kiếm trở thành so sánh lược đồ khái niệm.
Hình 4.2. Phương pháp sinh ảnh dựa trên lược đồ [3]
Các phương pháp tìm kiếm sau này [6], [7] không dựa trên phân loại thành khái niệm tường minh mà phân loại thành các từ trực quan (visual word) dựa trên phương pháp học không giám sát kmeans. Tuy nhiên, việc hình thành lược đồ cũng tương tự như trên, nghĩa là phân loại các mảnh nhỏ (patch) trong ảnh thành các nhóm và lập lược đồ cho các nhóm trong ảnh.
Đầu vào: ảnh đầu vào I và từ vựng V để phân loại Đầu ra: lược đồ khái niệm H
Bƣớc 1: khởi đầu H(k) = 0, với mỗi điểm vào k trong từ điển V
Bƣớc 2: chia ảnh thành từng mảnh có kích thước cố định, ví dụ 16x16 Bƣớc 3: với mỗi mảnh, ta gán cho một nhãn k dựa trên từng điển V Bƣớc 4: tăng vị trí H(k) trong lược đồ màu
Bƣớc 5: trả về lược đồ
Việc khó khăn nhất là tạo ra từ điển V để mã hóa, đặc biệt khi số lượng ảnh lớn, kmeans sẽ chạy rất chậm khi số lượng các điểm tăng. Chưa kể việc hình thành kim tự tháp không gian và tạo chữ ký từ kim tự tháp là công việc rất tốn kém. Chúng tôi hy vọng phát triển phương pháp đơn giản hơn, dễ triển khai hơn, và vẫn giải quyết được vấn đề thông tin không gian.