Đối với hướng tiếp cận này, có thể tái sử dụng bất kỳ một phương pháp Watermarking nào đã tồn tại trên ảnh vì video được xem như là một tập các ảnh
độc lập với nhau. Tuy nhiên, việc áp dụng những phương pháp đó trên video cũng là một vấn đề không đơn giản chút nào vì số lượng frame hay ảnh trong video rất lớn, cho nên việc chọn lựa frame nào trong video cho quá trình Watermarking cũng là một vấn đề. Để trả lời cho vấn đề này, thì có hai hướng tiếp cận dựa trên cách chọn frame trong quá trình nhúng: frame-by-frame và frame sequence.
Frame-by-Frame
Đối với nhóm tiếp cận này, thông tin bản quyền được nhúng vào mỗi frame. Tùy thuộc vào chiều dài của Watermark mà một phần hoặc tất cả frame của video tham gia vào quá trình nhúng.
D. E. Lane [10] được xem như là người tiên phong trong hướng tiếp cận này. Năm 1999, ông nghiên cứu lược đồ nhúng vector trên video. Ý tưởng chính của lược đồ này là nhúng chữ ký vào các frame của video gốc. Sau đó, phương pháp này được J. J. Chae [25] cải tiến bằng những vết cắt đa chiều trong miền DCT. Thuật toán dựa trên vector, sử dụng mã lattice và đối sánh khung (texture) để cải tiến hiệu xuất thi hành, cho phép nhúng một số lượng lớn dữ liệu lên mỗi frame của video. Vì kích thước của ảnh gốc tăng lên đăng kể sau khi nhúng, đòi hỏi nhiều băng thông trên đường truyền, cùng với chi phí lớn cho quá trình tái cấu trúc lại ảnh sau nhúng khi dùng các thuật toán giảm chiều như DWT,… Do đó, những phương thức được đề xuất sau này thường sử dụng một tín hiệu Watermark đơn như một chuỗi mã ngẫu nhiên hoặc một ảnh nhị phân và những hạn chế trong lược đồ của D. E. Lane [10] được khắc phục.
Năm 2001, Cappellini và các cộng sự [47] mở rộng lược đồ của A. Piva [6] bằng việc tối ưu hóa trong việc chọn frame đánh dấu. Theo phương pháp này, Watermark được nhúng vào mỗi frame được chọn gồm ba bước: (1) rút trích thành phần luminance X của frame được đánh dấu; (2) mở rộng nó sang 1024×1024 pixel; (3) thay đổi giá trị của những hệ số DFT thuộc tần số giữa của khối mở rộng đó. Trong quá trình nhúng, Cappellini chọn frame đầu tiên của mỗi GOP (Group of Picture) gồm 12 frame để thay đổi và những frame còn lại không đổi. Tỉ lệ frame trên một video thường là 25 frame/giây, do đó có ít nhất 2 frame/giây được đánh dấu và thay đổi. Thuận lợi của phương pháp này là ở khả năng chọn các frame, cách nhúng Watermark vào các frame này, chống lại các tấn công trên ảnh như lọc tuyến tính, lọc phi tuyến, thêm nhiễu, nén JPEG, và biến đổi hình học. Hơn nữa, với các tấn công video như chuyển đổi frame, thay thế frame, cắt frame, nén MPEG-2 với tỉ
lệ bit-rate khác nhau, … thì vẫn rút trích ra được Watermark đúng. Từ phương pháp
đề xuất này, Cappellini chỉ ra rằng họ đã tái sử dụng và ứng dụng thành công hệ
thống Watermarking trên ảnh vào video. Tuy nhiên, lược đồ của Cappellini không vững mạnh với những tấn công loại bỏ hoặc cắt bỏ frame vì những vị trí của frame
được chọn là cốđịnh trong mỗi GOP. Để khắc phục nhược điểm này, L. S. Liu [33] cải tiến bằng cách chọn các frame một cách ngẫu nhiên thay vì cốđịnh.
Trong phương pháp của L. S. Liu [33] , một danh sách các frame được chọn ngẫu nhiên. Sau đó, thành phần luminace của mỗi frame được chọn chia thành những khối 16×16 và biến đổi sang miền DCT. Cuối cùng, Watermark được nhúng vào những hệ số thấp của mỗi khối DCT. Kết quả thực nghiệm chỉ ra rằng, phương pháp này vững mạnh với việc loại bỏ frame, thêm frame, thống kê trung bình, phá vỡ kết cấu của frame, và nén MPEG-2. Mặc dù phương pháp này được xếp vào loại blind Watermarking nhưng nó cần video gốc để rút trích Watermark.
Kỹ thuật thứ hai được sử dụng để khắc phục những yếu điểm của Campellini là Singular Value Decomposition (SVD). Kong và các cộng sự [49] , Di Wu và các cộng sự [15] thi hành kỹ thuật này để chèn thông tin bản quyền vào tất cả frame của video. SVD là một kỹ thuật số học dùng ma trận chéo trong phân tích số học. Có hai
đặc trưng chính của SVD: (1) giá trịđơn (SV) của mỗi ảnh có tính ổn định rất cao; (2) giá trị đơn thể hiện bản chất số học của những thuộc tính của ảnh. Dựa trên những đặc trưng này, nhiều thuật toán Watermarking dựa trên SVD được đề xuất. Tuy nhiên, một vấn đề khó khăn của những phương pháp này đó là sử dụng thông tin nhúng để lấy các Watermark về trong quá trình rút trích. Để giải quyết vấn đề
này, Kong và các cộng sự [49] đề xuất một lược đồ blind Watermarking cho phép xác định Watermark mà không cần thông tin gốc. Ý tưởng chính của phương pháp này là sau khi áp dụng SVD lên toàn bộ frame phủ, lấy về những giá trị đơn và những giá trị đơn nằm ở khoảng giữa sẽđược thay đổi. Kỹ thuật này bền vững với phần lớn với các phép tấn công như MPEG-2, tỉ lệ, shifting, lọc. Tuy nhiên, phương pháp của Kong có độ phức tạp cao. Do đó, phương pháp của Kong không có tính thực tế cao. Theo sau công trình của Kong, Di Wu và các cộng sự [15] đề xuất một phương pháp Watermarking trên video mà dựa trên việc tính toán SVD nhanh để rút trích thông tin bảng quyền mà không cần bất kỳ thông tin nào phụ trợ. Trong hướng tiếp cận này, Di Wu kết hợp DCT và SVD trong quá trình nhúng. Đầu tiên, mỗi block 8×8 của mỗi frame được chọn được chuyển sang miền DCT. Những tần số
thấp của mỗi block được chọn và kết hợp với nhau tạo thành một ma trận A. Sau đó, một SVD nhanh được áp dụng lên ma trận này để rút trích ra những giá trị đơn. Cuối cùng, mối quan hệ của những hệ số lân cận của những băng tần số giữa trong những giá trịđơn được thay đổi. Bên cạnh việc kế thừa những công trình trước đó, lược đồ của Di Wu là bind Watermarking, vững mạnh với nén MPEG-2, một số tấn công hình học đơn giản, và thích hợp cho ứng dụng thực tếđòi hỏi thời gian thực. Hơn nữa, thuật toán SVD nhanh làm cho phương pháp này chạy nhanh hơn.
Trong nhóm này, tất cả hoặc một vài frame được chọn cố định hoặc ngẫu nhiên đểđánh dấu thông tin bản quyền một cách độc lập với nhau. Hơn nữa, có thể
tái sử dụng những phương pháp Watermarking hiệu quả đã tồn tại trên ảnh. Tuy nhiên, những phương pháp trong nhóm này có một số hạn chế như: thông tin nhúng thấp, chi phí tính toán cao, chậm và không thực tế. Hơn nữa, việc thiếu xem xét đến trục thời gian cũng là một lỗ hổng cho những tấn công trung bình, trong khi đó những frame liên tục được tính trung bình để loại bỏ Watermark cũng là một yếu
điểm khác.
Frames sequence
Để khắc phục những yếu điểm cuối cùng của nhóm frame-by-frame, có nhiều phương pháp khác khai thác đặc trưng trên trục thời gian của video. Những phương pháp này được xếp vào nhóm những phương pháp dựa trên chuỗi frame, chúng nhúng tín hiệu Watermark vào miền không gian của dữ liệu video chưa nén hoặc thêm Watermark vào video gốc bằng cách dàn trải ra nhúng vào hơn một frame.
Đối với hướng tiếp cận này, Hartung và các cộng sự [17] là một trong những người tiên phong trong việc xem xét toàn bộ video như một tín hiệu một chiều vào năm 1996. Trong lược đồ của Hartung, quá trình trải phổ được thi hành bằng cách dàn trải tín hiệu Watermark nhị phân lên chuỗi video theo dạng pixel-to-pixel. Giống với những phương pháp Watermark khác dựa trên trải phổ, phương pháp của Hartung cũng có những giới hạn về độ bền vững, tỉ lệ dữ liệu nhúng, mức độ vô hình.
Sau đó, Deguillaume và các cộng sự [16] đề xuất một lược đồ khác dựa trên miền biến đổi 3D, trong đó tín hiệu video gốc được xem như một tín hiệu ba chiều: hai chiều trong không gian và một chiều thời gian. Ý tưởng cơ bản của hướng tiếp cận này là mở rộng những lược đồ Watermarking trên ảnh vững mạnh trong miền hai chiều DFT thành những lược đồ Watermarking trên video ba chiều DFT. Trong lược đồ này, có hai loại thông tin được ẩn: một Watermark và một mẫu (template).
Để nâng cao mức độ an toàn, cả hai được mã hóa bởi cùng một khóa. Thông tin Watermark được mã hóa thành một chuỗi tín hiệu trải phổ được phát sinh bởi M- sequences hoặc Gold Codes, và được nhúng vào giá trị biên độ của miền biến đổi Fourier ba chiều. Mẫu (template) là một dạng lưới dựa trên khóa được nhúng vào biên độ 3-D DFT để xác định và khôi phục lại những hiệu ứng/tấn công thay đổi tỉ
lệ frame hoặc biến đổi hình học trên video. Phương pháp này có thể xác định được những tham số biến đổi hình học cho những frame như cắt, tỉ lệ, tịnh tiến dựa trên quá trình rút trích mẫu (template). Quá trình rút trích Watermark không cần phải biết kích thước cũng như sự đồng bộ của các khối trong quá trình nhúng. Phương pháp này chống lại tấn công nén MPEG, những tấn công dựa trên 3-D DFT và 3-D log-polar-log mapping. Hơn nữa, kết quả thực nghiệm chỉ ra rằng nó đạt được những yêu cầu của tiêu chí an toàn và vô hình. Tuy nhiên, thời gian thi hành cũng là một vấn đề lớn cho lược đồ này vì quá trình 3-D DFT và biến đổi ngược 3-D DFT cho mỗi chuỗi trong quá trình nhúng và rút trích là lớn. Vì vậy, khó thi hành phương pháp này trong thời gian thực.
Để giảm vấn đề về độ phức tạp tính toán của những lược đồ Watermarking trên video, Y. Liu và J. Zhao [52] đề xuất một lược đồ lý thuyết sử dụng 1-D DFT cùng với trục thời gian vào tháng 2-2010. Trong phương pháp của họ, biến đổi 1-D DFT cùng với biến đổi Radon được sử dụng cùng với phương pháp Watermarking dựa trên GOP. Đầu tiên, tín hiệu gốc được chia thành nhiều nhóm ảnh, mỗi nhóm
được biến đổi sang miền tần số 1-D DFT. Sau đó, biến đổi tiếp sang miền Radon và tín hiệu Watermark được nhúng và rút trích trong miền tần số này. Hơn nữa, thuật toán này không thi hành trong miền nén, do đó nó không giới hạn bất kỳ chuẩn nén
cụ thể nào. Kết quả thực nghiệm, chỉ ra rằng thuật toán này bền vững với nén H.264 và tấn công RST (quay, tỉ lệ, tịnh tiến). Mặc dù phương pháp của Y. Liu và J. Zhao khắc phục những nhược điểm của phương pháp trên trục thời gian, nhưng chi phí tính toán lớn. Do đó, những lược đồ Watermarking trên video dựa trên chuỗi frame vẫn là một hướng mở và thu hút nhiều nhà khoa học.