CHƯƠNG II. MỘT SỐ KỸ THUẬT ĐÁNH DẤU ẨN BẢO VỆ BẢN QUYỀN SỐ TRÊN MIỀN KHÔNG GIAN VÀ MIỀN HỆ SỐ BIẾN ĐỔI
II. Đánh dấu ẩn dựa trên miền hệ số biến đổi
4. Đánh dấu ẩn video sử dụng các hệ số biến đổi DCT
Dấu ẩn được tạo ra bằng một tín hiệu nhiễu ngẫu nhiên PN cùng kích thước với tín hiệu video được điều chế với các bit thông tin được truyền đi.
Mỗi bit thông tin được nhúng một cách dư thừa trên nhiều điểm ảnh. Với mỗi frame video nén, frame tín hiệu dấu ẩn tương ứng được biến đổi DCT theo từng khối cơ bản 8x8, và kết quả các hệ số được biến đổi DCT của dấu ẩn được thêm vào các hệ số biến đổi DCT của video, được mã hoá thành dòng bit video. Điều này được thực hiện đối với các frame P,I và B.
Sơ đồ sau thực hiên quá trình đó:
Dòng bit video gốc ...1010110110101101
Thông tin điều khiển
11100100110011
Vec tơ chuyển động
11000101010011010101
Khối biến đổi DCT 8x8
01010101010…...
...1010110110101101111001001100111001010001111100011101010101010…...
Dòng bit video đã được nhúng thông tin
Quá trình nhúng các hệ số đã được biến đổi DCT của dấu ẩn
Hình 2: Nhúng thông tin trong Video sử dụng các hệ số DCT
Ngoài ra quá trình nhúng thông tin còn có thể thực hiện trên các véc tơ chuyển động trong sơ đồ dự đoán bù chuyển động. Các vec tơ bù chuyển động được biến đổi nhỏ theo một cách ngẫu nhiên nào đấy. Các thông tin được nhúng có thể thu lại được một cách trực tiếp từ các vec tơ chuyển động.
Sau quá trình giải nén, dấu ẩn có thể vẫn thu lại được. Sự phức tạp của phương pháp này là không đáng kể.
Dòng bit được phân tích và dấu ẩn được biến đổi DCT.Tuy nhiên, phương pháp này không đòi hỏi quá trình giải nén toàn bộ hay quá trình nén lại. Sơ đồ này thích hợp với tất cả các mô hình nén kết hợp dựa trên quá trình biến đổi DCT, chẳng hạn như MPEG2, MPEG-4 và ITU-T H.263. MPEG4 có thể sử dụng cho quá trình nén các đối tượng được định hình dạng tuỳ ý. Đối với các khối biên không phải hình chữ nhật thì phép biến đổi DCT tương thích với hình dạng(Shape-adaptive DCT hay SA-DCT) được sử dụng thay vì phép biến đổi DCT thông thường. Dấu ẩn được khôi phục từ video được giải nén bởi độ tương quan sử dụng chuỗi nhiễu ngẫu nhiên được dùng trong quá trình tạo ra tín hiệu dấu ẩn được nhúng. Tỉ lệ dữ liệu dấu thông tin điển hình là 50bit/s, tuỳ thuộc vào các yêu cầu về độ bền vững. Các dấu ẩn bền vững trước các thao tác xử lý tín hiệu chuẩn, chống lại các phép biến đổi hình học như dịch chuyển, phóng to, thu nhỏ hay quay ảnh.
a. Nhúng thông tin nhiều mức:
Phương pháp đánh dấu ẩn nhiều mức(multiscale) làm việc trên video dạng chưa nén. Trong bước đầu tiên chuỗi video được đánh dấu được chia đoạn thành các cảnh(scene). Mỗi cảnh được thao tác như một thực thể, một quá trình biến đổi sóng theo thời gian(temporal wavelet) được thực hiện trên mỗi cảnh video, sinh ra các frame thông thấp và thông cao theo thời gian.
Dấu ẩn được nhúng không phải là một thông điệp tuỳ ý mà là mã xác định người sở hữu và được định nghĩa trước từ tập mã. Trong quá trình thiết kế dấu ẩn, một mô hình cảm nhận của mắt người được sử dụng để lợi dụng quá trình che mặt nạ theo thời gian hoặc không gian. Dấu ẩn cũng được thiết kế sử dụng một khoá phụ thuộc vào tín hiệu. Dấu ẩn được nhúng vào trong mỗi thành phần theo thời gian của quá trình biến đổi sóng và các hệ số được đánh dấu ẩn sau đó được biến đổi ngược để thu được chuỗi video được đánh dấu ẩn. Sự thay đổi này khó nhận ra được bởi vì các bit thông tin được nhúng vào trong các thành phần tần số thích hợp. Điều này cho phép dấu ẩn bền vững đối với các phép biến đổi như: trung bình khung hay loại bỏ khung.
Quá trình tách dấu ẩn được thực hiện bởi quá trình kiểm tra giả thuyết(tức là xác định xem liệu có dấu ẩn hay không có dấu ẩn) sử dụng độ tương quan theo một ngưỡng nào đấy. Theo thử nghiệm cho thấy rằng mô hình này có thể chống được nhiễu cộng, quá trình nén Video theo chuẩn MPEG và thậm chí cả quá trình loại bỏ frame. Điều bất tiện của sơ đồ này là độ phức tạp rất cao, bởi vì nó bao gồm quá trình biến đổi sóng và một mô hình cảm nhận của con người trong phép biến đổi DCT.
b. Nhúng thông tin dựa trên cấu trúc nhóm ảnh:
Kỹ thuật nhúng thông tin mã hoá trong cấu trúc nhóm ảnh của video được nén theo chuẩn MPEG-2. Các frame video có thể được mã hoá theo ba cách: frame I được mã hoá theo chuẩn JPEG được dùng làm tham chiếu cho các frame khác, frame P là frame được dự đoán từ frame trước, frame B là frame được dự đoán nội suy hai chiều từ frame trước nó và frame sau nó.
Frame I là các điểm truy cập ngẫu nhiên. Thường thường có một khoảng cách tối đa giữa hai frame I liên tiếp để cho phép truy cập ngẫu nhiên với độ trễ lớn nhất. Loại frame được quy định ở phần header của frame. Tập hợp các frame
được xuất phát từ một frame I gọi là một cấu trúc nhóm ảnh. Một cấu trúc nhóm ảnh có thể là: “IPPP”, “IBBPBBPBBPBB”, “IBBBBBBBB”,
“IPBPBBB”. Thực tế có 2N-1 cấu trúc nhóm ảnh có thể có đối với nhóm ảnh có N frame. Một kích thước nhóm ảnh phổ biến có N=12, vì vậy có thể có 2048 cấu trúc nhóm ảnh khác nhau. Tuy nhiên hầu hết các bộ mã hoá video đều sử dụng một cấu trúc nhóm ảnh có kích thước cố định.
Ý tưởng nhúng thông tin được đưa ra sử dụng cấu trúc nhóm ảnh này.
Sơ đồ đánh dấu thông tin thương sử dụng 6 bit trên một nhóm ảnh có nghĩa là khoảng vài byte trên một giây video. Phương pháp này chỉ có thể sử dụng trong suốt quá trình nén, không thực hiên sau quá trình nén bởi vì lúc đó cấu trúc nhóm ảnh đã cố định. Thông tin được nhúng cũng không thể bền vững đối với quá trình giải nén. Vì thế, quá trình giải nén hay quá trình nén lại đều loại bỏ hoàn toàn thông tin được nhúng.
Như vậy, các phương pháp được đưa ra có giới hạn độ phức tạp từ độ phức tạp thấp đến các sơ đồ có độ phức tạp cao như quá trình biến đổi sóng hay mô hình HVS. Đối với quá trình đánh dấu ẩn trên video dạng nén, dấu ẩn có thể được nhúng vào trong các hệ số biến đổi DCT, trong vec tơ chuyển động hoặc trong các dạng cấu trúc thông tin khác như cấu trúc nhóm ảnh.