Xét đoạn video quay một khung cảnh , đối tượng video là những thành phần có ý nghĩa đầy đủ trong khung cảnh đó . Mặt phẳng alpha (alpha plane – AR) của một đối tương video được định nghĩa là tập hợp tất cả các điểm thuộc đối tượng đó .
Theo vết đối tượng bao gồm việc theo vết đường biên (boundary) , theo vết những chuyển động cục bộ (local motion) và những biến đổi về cường
độ (độ sáng tối , độ tương phản) của đối tượng .
bộ cũng như những biến đổi về cường độ giờ trở thành việc theo vết lưới hai chiều .
Nhưđã trình bày trong chương 1 , mô hình mà luận văn đề ra là mô hình bán tựđộng . Theo đó , người dùng sẽđảm nhận trách nhiệm chọn frame bắt
đầu , gọi là frame tham chiếu (reference frame) , và trên frame này chọn ra
đối tượng video được quan tâm (tức là xác định mặt phẳng alpha của đối tượng được quan tâm) . Sau đó , trong các frame tiếp theo , việc theo vết đối tượng sẽ được thực hiện hoàn toàn tựđộng .
Tổng quát , tiến trình theo vết đối tượng bao gồm các bước sau :
o Bước 1 : Chọn frame tham chiếu và chọn đối tượng video được quan tâm
o Bước 2 : Tạo lưới tam giác cho đối tượng
o Bước 3 : Ước lượng chuyển động tại các node của lưới
o Bước 4 : Lan truyền lưới
Bước 1 và 2 được thực hiện tại frame tham chiếu , bước 3 và 4 được thực hiện tại mỗi frame tiếp theo .
chiếu (tức chuyển động toàn cục của đối tượng) được mô tả bằng các vectơ
dịch chuyển tại các node ứng với các đỉnh của đa giác (corner node) , còn chuyển động cục bộ bên trong đa giác tham chiếu (bên trong đối tượng)
được mô tả bằng các vectơ dịch chuyển tại các node nằm bên trong đa giác (inner node) . Vectơ chuyển động tại các node được xác định bằng thuật toán so khớp khối (block matching) kết hợp với các chiến lược tìm kiếm .
Tiếp theo , trong phần 3.1 , luận văn sẽ trình bày chi tiết về việc tạo lưới . Trong phần 3.2 , luận văn sẽ trình bày về phương pháp xác định vectơ dịch chuyển của các node lưới . Cuối cùng trong phần 3.3 , luận văn sẽ trình bày phần lan truyền lưới .
3.1 Tạo lưới
Lưới tam giác là lưới mà mỗi phần tử (mắt lưới) là một tam giác . Tạo lưới tam giác cho một đối tượng nghĩa là áp một lưới tam giác lên mặt phẳng alpha của đối tượng đó . Ta chỉ xét dạng lưới tuyến tính , là dạng lưới mà các cạnh thuộc các mắt lưới đều là đường thẳng , không phải là đường cong . Do đó , đường biên của đối tượng cần phải được xấp xỉ bằng một polyline khép kín (đa giác) .
Theo [4] phép tạo lưới tam giác được coi là tối ưu nếu ứng với mỗi tam giác thành viên của lưới vừa tạo , ba đỉnh của tam giác là ba đỉnh gần nhất
đối với các điểm thuộc miền tam giác đó (hình 3.2) . Có hai tiêu chuẩn thường được sử dụng để tối ưu hóa phép tạo lưới tam giác đó :
1. Tiêu chuẩn Max-Min : tam giác thành viên được tạo sao cho cực đại hóa góc nhỏ nhất (hình 3.3)
Hình 3.2 : Phép tạo lưới tam giác tối ưu và không tối ưu
Hình 3.4 : Tiêu chuẩn Vòng tròn
Trong mô hình đề ra , luận văn sử dụng lưới tam giác tối ưu và được thiết kế dựa theo nội dung của đối tượng . Theo [6] , nguyên tắc cơ bản trong việc thiết kế lưới dựa theo nội dung là đặt các node của lưới lên các cạnh có cường độ lớn và định vị sao cho giá trị của hàm DFD (Displaced Frame Difference) tại các mắt lưới là xấp xỉ nhau . Hàm DFD tính tại vị trí (x ,y)
được cho bởi công thức :
DFD(x ,y) = ( IC(x ,y) – IR(x ,y) )P
Thuật toán tạo lưới tổng quát bao gồm những bước sau :
o Bước 0 : Khởi tạo tập node = ∅ , chọn các đỉnh của đa giác tham chiếu đưa vào tập node . Đa giác tham chiếu chính là đường biên bao ngoài của lưới .
o Bước 1 : Gán nhãn “unmarked” cho tất cả các pixel thuộc đối tượng
o Bước 2 : Tính giá trị DFD trung bình cho tất cả các pixel có nhãn “unmarked” ( , ) & ( , ) ( , )p x y AR x y unmarked avg DFD x y DFD K ∈ = ∑
AR là kí hiệu mặt phẳng alpha của đối tượng , K là số lượng pixel có nhãn “unmarked” , p=2
o Bước 3 : Với mỗi pixel được có nhãn “unmarked” , tính giá trị hàm lượng giá :
2
( , ) | ( , ) |