Fergus và các đồng sự [10] sử dụng tập hợp các thành phần khác nhau của đối tượng và xây dựng đồ thịđể mô hình đối tượng dựa trên mối quan hệ về vị trí giữa
các thành phần cũng như sự hiện diện của các thành phần đối tượng trong ảnh. Ý tưởng này phát triển từ ý tưởng của mô hình mối liên hệ giữa các thành phần (pictorial) được sử dụng trong công trình của Fischler và Elschlager [11] nhưđược minh họa trong Hình 3, điểm khác là cách tiếp cận của Fergus chỉ giữ lại những phần mà cần thiết để có thể phân biệt giữa các lớp đối tượng với nhau, do vậy nó có thể tránh việc mô hình những phần khác nhau có tính toàn cục (tức vấn đề cùng một lớp đối tượng, nhưng các đối tượng lại có nhiều thể hiện khác nhau hay sự đa dạng của thể hiện của cùng một đối tượng), mô hình này còn được gọi là mô hình chòm sao (constellation model).
Hình 3: Mô hình mối liên hệ giữa các thành phần (Pictorial)
Felzenszwalb và các đồng sự [9] đề xuất phương pháp latent-SVM để xây dựng mô hình quyết định cho việc mô hình đối tượng mà sử dụng tập của các phần đối tượng ở nhiều độ phân giải khác nhau dựa trên HoG [5] (deformable part model).
Ngoài ra, xây dựng bộ học dựa trên kernel để đo độ tương đồng của các đối tượng hỗ trợ cho việc phân loại là hướng tiếp cận được nhiều nhà nghiên cứu quan tâm [13][18][34][36]. Nổi bật trong hướng tiếp cận này là mô hình BoF và SPM nhưđã được trình bày trong Chương 3.
Kernel đề xuất – HSMK theo hướng tiếp cận kernel, áp dụng cho bài toán phân loại ảnh. HSMK là sự cải tiến của SPMK để có thể tính toán độ tương đồng giữa