Chúng ta đã nói trong các phần trên rằng mơ hình "túi từ" khơng chứa thơng tin khơng gian. Có một số phương pháp cố gắng giới thiệu thông tin không gian vào túi từ. Phương pháp kim tự tháp của tác giả Lazebnick và đồng nghiệp năm 2006 [5] là phương pháp hay được nhắc đến trong lịch sử về việc thêm thông tin không gian vào mơ hình túi từ bằng cách chia ảnh ra thành phần nhỏ theo nhiều mức, hay cịn gọi là mơ hình kim tự tháp.
Phương pháp kim tự tháp khơng gian (spatial pyramid), xem Hình 2.2, được thiết lập bằng cách chia ảnh thành các phần hai, phần tư, và phần tám. Ở
từ nguyên thủy. Khi chúng ta chia ảnh thành 2x2 hay 4 ô, và thành lập lược đồ từ cho mỗi ơ, ta có thể so sánh hai ảnh bằng cách so sánh các ô tương ứng. Do vậy, chúng ta phản ánh được một phần thông tin không gian. Tuy nhiên, chúng ta vẫn giới thiệu một chút tịnh tiến (translation) trong phép so sánh. Ví dụ ảnh mới được thành lập bằng cách dịch ảnh gốc đi một số điểm ảnh, chúng ta vẫn có thể so sánh các điểm tương ứng của các góc phần tư. Khi chúng ta chia cụ thể hơn thành 4x4, chúng ta có thể so sánh chi tiết hơn một chút.
Hình 2.2: Giới thiệu thơng tin khơng gian vào mơ hình túi từ. Chia nhỏ ảnh thành các phần theo nhiều mức khác nhau và so khớp các thành phần tương ứng
là một phương pháp đơn giản để giới thiệu thơng tin khơng gian [5]
Hình 2.3: Biểu diễn hình dạng (shape) của đồ vật dựa trên kim tự tháp không gian [7]
Năm 2007, tác giả Bosch và đồng nghiệp [7] sử dụng phép biểu diễn tương tự để áp dụng vào ảnh tự nhiên, do đó có thể biểu diễn được hình dạng (shape) của đồ vật cần nhận dạng. Khi chúng ta tách cạnh của ảnh, chúng ta sẽ có các ảnh cạnh và khi chúng ta chia các cạnh thành các phần nhỏ và tính lược đồ cho mỗi phần cạnh, xem Hình 2.3, chúng ta sẽ được các lược đồ khác nhau biểu diễn thơng tin hình dạng. Các lược đồ này hữu dụng cho nhận dạng và tìm kiếm.