Sự thể hiện của phương pháp phân loại đối tượng phụ thuộc vào chất lượng đầu ra của bước phân đoạn đối tượng. Do các yếu tố về môi trường, chẳng hạn như đối tượng bị che khuất bởi các đối tượng cận cảnh tĩnh (ví dụ như hàng rào hay một cây cột đứng trước camera) hoặc vì một phần đối tượng bị rơi vào cảnh quay, nên hình dạng của vùng phát hiện được không phản ánh đúng bóng thật sự của một đối tượng. Trong những trường hợp như thế, thuật toán phân loại không thể gọi tên được chủng loại đối tượng một cách chính xác. Chẳng hạn như, một phần của chiếc xe rơi vào cảnh quay có thể trông giống như một người, hay một người bị che khuất một phần có thể trông giống như một nhóm người. Vì vậy, chúng tôi dùng một lược đồ đa giả thuyết [29] để tăng độ chính xác trong phương pháp phân loại.
Trong tiến trình này, một hình đồ chủng loại HT được khởi tạo và duy trì cho một đối tượng được phát hiện trong cảnh quay. Kích thước của hình đồ này bằng với số lượng chủng loại đối tượng khác nhau (ví dụ như, 3 trong hệ thống của chúng tôi tượng trưng cho người (H), nhóm người (HG), và xe cộ (V)), còn mỗi bin i của hình đồ này giữ số lần đối tượng O được tìm thấy cho chủng loại Ti (một trong H, HG, V). Hình 2.21 cho thấy một đối tượng mẫu và hình đồ chủng loại của nó cho 3 khung hình khác nhau.
Với sự giúp đỡ của lược đồ đa giả thuyết này, các chủng loại có thể có của một vật có thể được thu thập suốt một thời gian được định nghĩa trước và chúng ta có thể quyết định đúng chủng loại của nó một cách chính xác hơn bằng cách chọn loại bin có giá trị lớn nhất làm chủng loại đối tượng.
Trần Xuân Linh - K11T2 Trang 74 (b)
Hình 2.20: Mẫu phân loại đối tượng
a) đối tượng truy vấn mẫu
b) các vật liệu cơ sở dữ liệu mẫu với các tín hiệu kích thước. Chủng loại của mỗi đối tượng (H: Người, HG: Nhóm người, V: Xe cộ) và khoảng cách (D) giữa đối tượng truy vấn với mỗi đối tượng cơ sở dữ liệu được trình bày bên dưới các đối tượng
Trần Xuân Linh - K11T2 Trang 75
(a) (b)
(c) (d)
(e) (f)
Hình 2.21 Hình đồ chủng loại đối tượng cho một đối tượng mẫu được phát hiện.
((a), (c), (e)) đối tượng được phát hiện
((b), (d), (f)) hình đồ chủng loại đối tượng tương ứng