Một đối tượng xuất hiện trong đoạn video có thể được tái hiện bởi một mục quan hệ bao gồm một tập các mô tả không gian – thời gian. Giả sử một đoạn video (video clip - VC) trước hết được tách thành các đoạn qua việc so sánh biểu đồ và dãy các đoạn định danh Si. Với mỗi đoạn, tiến hành theo dõi chuyển động của các đối tượng trong vùng nhận thấy. Sau đó mô hình có thể được mô tả như sau:
a. Với mỗi đoạn Si thuộc VC, 1 i m (giả sử VC gồm m đoạn)
Với mỗi vùng định danh đối tượng oịj trong Si, ghi lại thông tin sau, g = (oid, d_d, {s_t}), trong đó:
oid: định danh của đối tượng được gán bởi hệ thống. d_d: dữ liệu mô tả, ví dụ: kiểu đối tượng, tên…
{s_t}: một tập hợp thứ tự của mô tả không gian – thời gian
- : khoảng thời gian tồn tại của đối tượng (trong khung), = n 1,n0 và nguyên.
- m_v: véc tơ chuyển động gắn với oij trong khoảng thời gian bắt đầu từ
với quãng m_v = (Z1,…, Z 1 1 r ). - Phần tử Zi ( ,1 11 i
i ) của m_v là khối biên tại khung i. Nói cách khác, Zi = (Li, di, ci) (trong đó d: độ sâu, c: trọng tâm) và Li = (widthi, heighti, xi,yi), với là số khung gắn với đối tượng oij trong một khoảng thay thế Si và là khoảng thời gian theo dõi cử động của mọi vật trong một đoạn video.
b. Thực hiện ghép nối giữa các đoạn như sau:
Nếu oid là duy nhất trong các đoạn, đặt các mục g tương ứng vào tập đối tượng
VO của VC, nếu không, biểu thị sự ghép nối như sau:
Nếu gi.oid = gj.oid, khi đó tạo một bản ghi gk, tại gk.oid = gi.oid, ta có
gk.d_d = gi.d_d gj.d_d, gk.{s_t} = gi.{s_t} gj. {s_t}. Đặt gk vào VO. Chú ý rằng với gk. {s_t},
nếu s_tr = (r, I, m_vr), s_tw = (w, w, m_vw), và r + I = w, thì tạo s_tu = (u, u, m_vu),
với u = r,u = I + w, m_vu = m_vv m_vv, đặt s_tw vào gj.{s_t}, xóa s_t và s_twtrong gj.{s_t}.
O4 O4 O3 O7 O6 O2 O5 O1 O1 O1 Segment 1 Segment 2 Hình 4.2: Mô hình dữ liệu mức thấp
Ta minh họa mô hình qua hình 4.2, trong đó trục x biểu thị số khung. Trong một đoạn, nhận biết vùng đối tượng được biểu thị bằng tập hợp khoảng thời gian mà nó xuất hiện. Trong hình 4.2, có hai đoạn, các đối tượng O1, O2, O3 và O4 được xác định trong đoạn một, O1 biến mất trong một số khung và sau đó tái xuất hiện. Hai khoảng thời gian mà O1 xuất hiện được liên hệ bởi quan hệ before. Tương tự như vậy, năm vùng đối tượng được nhận biết trong đoạn hai, nơi có hai đối tượng O1 và
O2 đều xuất hiện ở đoạn một. Có ba lựa chọn để trình diễn cấu trúc dữ liệu cho mô hình đề xuất. Trong lựa chọn thứ nhất, sự xuất hiện của một đối tượng được biểu thị bởi bản ghi (đoạn#, phân đoạn#, oid, *d_d, {, , m_v}). Chú ý là phân đoạn# có thể là một danh sách. Trong lựa chọn thứ hai, mỗi sự xuất hiện của một đối tượng được biểu thị bằng (đoạn#, phân đoạn#, oid, *d_d, , , m_v).
Từ véctơ chuyển động m_v chúng ta có thể tiến hành phân tích chuyển động giữa các đối tượng để chỉ ra được quan hệ chuyển động giữa các đối tượng. Với bất cứ khung nào, vị trí tương quan giữa đối tượng Oi và Oj có thể tính được bằng việc áp dụng quan hệ không gian giữa các phép chiếu xuống mỗi trục tọa độ x,y, và z.
và đồ họa máy tính là không đủ mạnh để xử lý cảnh phức tạp trong thực tế. Tuy nhiên, sự chuẩn hóa trong việc biên soạn các tình huống không gian – thời gian không phụ thuộc vào bất cứ kỹ thuật tách các đặc tính đặc biệt cũng như kỹ thuật tổ chức.