Một số kỹ thuật trích chọn khung hình chính hiện nay

Một phần của tài liệu Nghiên cứu xây dựng hệ thống tìm kiếm video theo nội dung (Trang 82 - 84)

nay

Thông thường các phương pháp coi rằng video đã được phân đoạn thành các đoạn cơ sở (shot) và thuật toán thực hiện trích trọn các khung hình chính trong đoạn cơ sởđó. Có một cách đơn giản là lấy khung hình đầu tiên của mỗi

đoạn cơ sở [22]. Một số cách tiếp cận khác trích chọn khung hình chính sau mỗi một khoảng thời gian xác định trước [24]. Thường thì các khung hình chính được lấy trong các đoạn cơ sở tuy nhiên trong [23] tác giả lấy các khung hình chính sau một khoảng thời gian mà không quan tâm đến biên giới các cảnh. Những cách tiếp cận này không quan tâm đến những thông tin về

thị giác, chúng thường lấy ra một số lượng khung hình chính cố định trong mỗi một đoạn cơ sở. Zhonghua và các cộng sự [25] chỉ sử dụng một khung hình chính để biểu diễn cho một đoạn cơ sở. Khung hình chính được chọn nhờ thuật toán: tất cả các khung hình được tách ra thành hai phần đối tượng và nền. Khung hình có tỉ số giữa đối tượng và nền lớn nhất sẽ được chọn là khung hình chính của đoạn, bởi vì nó được cho rằng khung hình đó chứa

thông tin nhiều nhất vềđoạn đó. Một số cách tiếp cận khác cố gắng nhóm các khung hình chính tương tự nhau (trong mỗi đoạn cơ sở hoặc toàn bộ video) vào thành các nhóm.

Với cách tiếp cận trích chọn khung hình chính động (dynamics) cần dựa vào các thông tin thị giác, vấn đề là lấy và sử dụng các thông tin đó như thế

nào. Một vài cách tiếp cận tính toán sự khác nhau giữa các khung hình (không cần nhất thiết phải liền kề nhau) dựa vào: biểu đồ màu, chuyển động hoặc các thông tin thị giác khác. Khung hình chính được lựa chọn bằng việc phân tích các thông số trên. Zhao và các cộng sự [26] đã phát triển một phương pháp

đơn giản để trích chọn khung hình chính gọi là Simplified Breakpoints. Một khung hình được lựa chọn là khung hình chính nếu biểu đồ màu của nó sai khác với biểu đồ màu của khung hình trước đó vượt quá một ngưỡng xác định trước. Khi số lượng các các khung hình được lựa chọn đạt đến số lượng của các khung hình chính trên một đoạn cơ sở quá quá trình đó dừng lại. Hanjalic và các cộng sự [27] tính toán sự khác nhau giữa các khung hình để xây dựng nên đường cong miêu tả quá trình “phát triển nội dung”. Han và các cộng sự

[28] đưa ra một cách tiếp cận rất đơn giản: các tác giả xây dựng đường cong tích luỹ sự sai khác giữa các khung hình liền nhau, việc lựa chọn khung hình chính được thực hiện bằng cách lấy mẫu đều trên trục sai khác (trục tung) kết quả các khung hình chính được chọn một cách thích nghi trên trục thời gian (trục hoành).

Những cách tiếp cận dựa trên video nén cũng đang được phát triển mạnh do có thể dễ dàng và nhanh chóng lấy được các thông tin qua việc phân tích chuyển động. Nara và các cộng sự [29] đề xuất mạng nơ-ron nhân tạo sử dụng

độ lớn của chuyển động được lấy ra từ video nén theo chuẩn MPEG. Một hệ

thống mờ phân loại độ lớn của chuyển động thành năm loại và những khung hình có độ lớn cao sẽđược chọn làm khung hình chính. Calic [16] lấy các đặc trưng từ các macro-blocks của video nén MPEG để tính sự sai khác giữa các

khung hình. Thuật toán trích chọn khung hình chính được dựa trên việc khảo sát đường bao của đường sai khác giữa các khung hình.

Một phần của tài liệu Nghiên cứu xây dựng hệ thống tìm kiếm video theo nội dung (Trang 82 - 84)

Tải bản đầy đủ (PDF)

(111 trang)