Để giải quyết độ phức tạp của các cấu trúc trong quá trình theo dõi, mô hình xuất hiện là một giải pháp tốt nhất để áp dụng vào phương pháp đang được trình bày. Trong mô hình này, đối với mỗi track, một mô hình xuất hiện được xây dựng để biểu thị mỗi một đối tượng xuất hiện trong bức ảnh.
Mô hình xuất hiện là một mô hình màu RGB được gắn với một mặt nạ xác suất. MRGB(x) biểu diễn xự xuất hiện của mỗi pixel của một đối tượng. Mặt nạ xác suất Pc(x) ghi lại khả năng của đối tượng được xuất hiện tại pixel đó.
Khi một track mới được tạo ra, một hình chữ nhật được tạo với cùng kích cỡ của hộp bao quanh vùng của foreground. Mô hình được khởi tạo bằng cách sao chép các pixels của track đang hoạt động vào mô hình màu.
Trên các khung hình tiếp theo, mô hình xuất hiện được cập nhật bằng cách trộn các vùng hiện tại của foreground. Mô hình màu được cập nhật bằng cách trộn các pixel của của bức ảnh hiện tại với tất cả các pixel của foreground. Và tất cả các xác suất của mặt nạ có giá trị được tính theo: α = λ = 0.95:
39
MRGB(x,t) = MRGB(x,t-1)α + (1- α)I(x) nếu x thuộc T ; (1) Trong đó T là tập hợp các pixels của foreground.
Pc(x,t) = Pc(x,t-1)λ nếu x không thuộc T; (2) Pc(x,t) = Pc(x,t-1)λ + (1 - λ) nếu x thuộc T; (3) Theo cách trên, một quá trình được cập nhật liên tục của sự xuất hiện của các pixel trong một vùng của foreground và theo với đó là các xác suất được quan sát.
Mô hình xuất hiện có thể cải thiện được vị trí của đối tượng đang được quan sát. Phương pháp Background subtraction có thể không tránh khỏi được nhiễu, và thêm đó mô hình đơn sắc có thể tăng các nhiễu của vị trí của đối tượng. Mô hình xuất hiện có thể tích lũy các thông tin về sự xuất hiện của các pixel của dối tượng và có quan hệ với các bức ảnh để tăng sự chính xác về việc ước lượng vị trí trọng tâm của đối tượng. p(I,x,M) được tối thiểu hóa thông qua việc tìm kiếm vị trí ở một vùng nhỏ và khoảng cách mà được lấy từ vị trí của đối tượng. Quá trình được tiến hành tới các pixel tiếp theo.
(4)
(5) Khi hai tracks xuất hiện trong một vùng đơn, mô hình xuất hiện cho các track được ước lượng để tách riêng các vị trí của đối tượng. Điều này được thể hiện theo hình 3.3:
Sử dụng mô hình sắp xếp đầu tiên, vị trí trung tâm của đối tượng i được dự đoán trước
Khi đối tượng mới xuất hiện, mỗi đối tượng được tương quan với bức ảnh theo vị trí được dự đoán trước, để tìm ra vị trí phù hợp nhất.
Những pixel được đưa ra sẽ không bị nhầm lẫn với các đối tượng khác. Những pixel này sẽ có xác suất khác không được phân loại dựa trên sử dụng bộ phân loại để xem xét mô hình nào phù hợp nhất:
40
Các đối tượng được sắp xếp mà có những pixel bị tranh chấp, chồng lấn được đánh dấu như một khối.
Hình 3.3 Giải pháp cho việc chồng lấn giữa các đối tượng
Các pixel bị chồng lấn đó được gán cho một đối tượng ngoài cùng mà chúng chồng lấn lên nhau.
Các khung hình tiếp theo, các bước vị trí hóa được tiến hành theo thứ tự về chiều sâu, với đối tượng đầu tiên và vừa vặn nhất.
41
Nếu đối tượng được quan sát tách ra ngoài thành hai hộp kín, thì khi đó một track mới được tạo riêng rẽ, cùng với mô hình xuất hiện được khởi tạo và đáp ứng lại vùng diện tích trước đó.