1. Trang chủ
  2. » Kỹ Thuật - Công Nghệ

THUẬT TOÁN WATERMARKING CHO VIDEO SỐ NÉN MPEG-2 VÀ ỨNG DỤNG ppsx

9 722 10

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 9
Dung lượng 381,94 KB

Nội dung

Trong bài báo này chúng tôi mô tả một phương pháp hiệu quả cho bảo vệ quyền trí tuệ và bản quyền tác giả cho các dữ liệu video nén MPEG-2, đó là thuật toán Watermarking thực hiện dấu một

Trang 1

THUẬT TOÁN WATERMARKING CHO VIDEO SỐ NÉN MPEG-2 VÀ ỨNG DỤNG

KS ĐẶNG VĂN HIẾU

ThS CHU CÔNG CẨN

Bộ môn Kỹ thuật Thông tin

Trường Đại học Giao thông Vận tải

Tóm tắt: Sự phát triển của internet băng thông rộng đang thúc đẩy mạnh mẽ sự phát

triển của công nghệ đa truyền thông Multimedia Các nguồn dữ liệu multimedia như âm thanh, hình ảnh, văn bản… có thể được truy cập và được phân phối nhanh hơn và rộng hơn

Xu thế này mang lại nhiều lợi ích cho người sở hữu các sản phẩm multimedia, nhưng cũng thách thức quyền sở hữu của chúng ta bởi vì hầu hết các dữ liệu multimedia được phân phối dưới các định dạng không bảo mật Hiện nay, việc sao chép và phân phối lại bất hợp pháp các sản phẩm multimedia đang diễn ra liên tục không có kiểm soát Khi ra pháp luật, để phân xử quyền sở hữu các sản phẩm multimedia là việc không dễ dàng nếu không có một cơ chế có thể đảm bảo tính toàn vẹn chân thực quyền tác giả Trong bài báo này chúng tôi mô tả một phương pháp hiệu quả cho bảo vệ quyền trí tuệ và bản quyền tác giả cho các dữ liệu video nén MPEG-2, đó là thuật toán Watermarking thực hiện dấu một ảnh đơn sắc trên nền video số nén MPEG-2 trong miền DCT Giải pháp Watermarking hiện hay ẩn đều có thể đạt được thông qua việc điều chỉnh một số tham số trong mô hình thuật toán này Cuối cùng hiệu quả của

phương pháp được đánh giá thông qua các kết quả mô phỏng trên máy tính

CT 2

Summary: The growth of the wideband internet has boosted the growth of multimedia

technologies The sources of multimedia data such as audio, video, image, text…are able to be accessed and distributed faster and more widely This trend brings many benefits to the owners of multimedia products, but also many threats to our copyrights because almost all multimedia data has been distributed in insecure formats These days, the illegal duplication and redistribution of multimedia products is taking place continuously without control Legal judgements about copyrights on multimedia products will be not easy if we do not have an effective method of checking the integrity and accuracy of the copyright In this paper, we describe an effective method for the copyright of compressed video data MPEG-2, which is a watermarking algorithm hiding a grey image inside MPEG-2 data in DCT domain Visible watermarkings or invisible watermarkings can be achieved by adjusting some parameters in this model Finally, the effectiveness of this method is evaluated by the results of computer

simulations

I ĐẶT VẤN ĐỀ

MPEG (Moving Picture Expert Group) là một nhánh của ISO (International Standardization Organization) cho nén video/audio và các kỹ thuật liên quan trong các ứng dụng thương mại và công nghiệp Các chuẩn nén nổi tiếng của MPEG là 1, 2,

Trang 2

MPEG-4 Các chuẩn mới như MPEG-9, MPEG-21 vẫn đang được phát triển MPEG-1 được ứng dụng

chính cho phân phối video với các đĩa nén video quang (VCD); MPEG-2 ứng dụng trong truyền

hình độ phân giải cao HDTV quảng bá và phân phối movie/video chất lượng cao trong các đĩa

video số (DVD) MPEG-4 là định dạng video có thể trao đổi luồng chính trên Internet bởi vì

MPEG-4 có tốc độ nén cao và mềm dẻo hơn với tốc độ bit thấp Các kỹ thuật chính liên quan

đến các chuẩn MPEG là chuyển đổi không gian màu và tỷ lệ lấy mẫu màu, dự đoán và bù

chuyển động dựa trên cơ sở khối, biến đổi cosin rời rạc (DCT), quét Zigzag và mã hóa thông tin

entropy

Kỹ thuật Watermarking thực hiện nhúng dữ liệu mở rộng, được gọi là watermark, vào

trong một bản tin Tại phía thu, dữ liệu nhúng này có thể được nhận biết và tách lấy bằng một

phương pháp thích hợp tương ứng Việc phân loại watermarking có thể được xem xét theo nhiều

khía cạnh, cụ thể là: nếu theo cảm nhận của con người thì nó được chia ra loại hiện và loại ẩn

Nếu theo độ mạnh của nó thì có thể chia ra loại mạnh và loại yếu Theo các ứng dụng thì nó có

thể là loại cơ sở nguồn hay đích Theo loại tài liệu thì nó có thể là text, ảnh, âm thanh, video

Theo miền làm việc thì nó có thể là loại miền không gian hay miền tần số Cả watermarking

hiện và ẩn đều có thể được sử dụng cho bảo vệ bản quyền tác giả; thêm vào đó loại ẩn cũng hữu

ích trong các ứng dụng bảo mật như chuyển đổi dấu và truyền thông tin mật Loại watermarking

mạnh có thể làm vô tác dụng các tấn công nhằm loại bỏ watermark Một watermark có thể được

nhúng vào trong text, hình ảnh, âm thanh hay video như dữ liệu thừa Phụ thuộc vào các thuật

toán nhúng mà các watermark có thể được giải tách chính xác như ban đầu hay không

Tất cả các chuẩn quốc tế hiện tại cho nén video như là MPEG-1,2,4, ITU-T H261, H263,

H264 đều là các sơ đồ mã hóa lai [7] Các sơ đồ này dựa trên các nguyên lý của dự đoán bù

chuyển động và mã hóa chuyển đổi trên cơ sở khối Trong phạm vi của bài báo sẽ giới thiệu

chuẩn nén video MPEG-2 (hình 2.1)

Hình 2.1 Mô hình sơ đồ khối bộ mã hóa MPEG-2

Các khung mã hóa Intra (các khung I) được phân chia thành các khối 8x8 pixels Các khối

này tiếp theo được nén sử dụng DCT, lượng tử hóa (Q), quét zig-zag, mã hóa Entropy (sử dụng

kỹ thuật mã hóa có độ dài từ mã thay đổi VLC) Các khung mã hóa Inter (các khung B và P) là

Trang 3

kết quả của bù chuyển động bằng cách trừ đi một dự đoán đã được bù chuyển động Các khung

dư (khung sai số) sau đó được chia thành các khối 8x8 pixel và được nén theo cách giống như với các khối của khung I

Biến đổi cosine rời rạc (DCT)

Biến đổi cosine rời rạc là một công cụ toán học xử lý các tín hiệu như ảnh hay video Nó sẽ chuyển đổi các tín hiệu từ miền không gian sang miền tần số và biến đổi ngược lại từ miền tần

số quay trở lại miền không gian mà không gây tổn hao đến chất lượng Lý do chọn biến đổi cosine cho xử lý ảnh số là: đầu tiên, nó có thể loại bỏ sự tương quan giữa các pixel ảnh trong miền không gian Thứ hai là biến đổi cosine rời rạc yêu cầu ít sự phức tạp tính toán và tài nguyên hơn [1]

Lượng tử hóa các hệ số DCT

Sau khi biến đổi cosine rời rạc, sự tương quan giữa các pixel của một ảnh trong miền không gian đã được giải tương quan thành các tần số rời rạc khác nhau trong miền tần số Do sự cảm nhận thị giác của con người là rất nhạy với hệ số DC và các tần số thấp, một phương pháp lượng tử hóa vô hướng được thiết kế cẩn thận có thể giảm sự dư thừa dữ liệu mà vẫn dữ được tính trung thực của ảnh

Quét zigzag các hệ số DCT

Sau khi biến đổi DCT ta thu được các khối 8x8 biểu diễn cho các hệ số tần số Trong khối

này thì các hệ số tần số thấp sẽ tụm lại ở góc cao phía trái của ma trận DCT Quét zigzag sẽ sắp xếp lại thứ tự của ma trận để các hệ số được sắp xếp theo tần số theo thứ tự tăng dần

CT 2

Mã hóa Entropy

Sau DCT và lượng tử hóa là các thuật toán miền mã Các thuật toán này thường được gọi là

mã hóa Entropy, bao gồm mã hóa Huffman, mã hóa số học…, đây là phương pháp mã hóa không tổn hao Ý tưởng cơ bản của mã hóa Entropy là các biểu tượng thường xuyên xuất hiện

sẽ được mã hóa bằng các bít ngắn, trong khi đó các biểu tượng ít xuất hiện hơn sẽ được mã hóa bằng các bít dài hơn Phương pháp này còn gọi là mã hóa có độ dài từ mã thay đổi (VLC), và một phương pháp cho hiệu quả cao là mã hóa Huffman Điều này sẽ làm cho tốc độ bit của luồng giảm đáng kể

Ước lượng và bù chuyển động

Nén video có thể đạt được với việc lấy mẫu không gian màu, loại bỏ các hệ số DCT tần số cao, lượng tử hóa, mã hóa không tổn hao, dự đoán và bù chuyển động trong miền thời gian Chuẩn MPEG chấp nhận việc dự đoán và bù chuyển động dựa trên khối trong miền không gian Thực tế, dự đoán và bù chuyển động cũng làm việc trong miền DCT vì các biến vị trí trong miền không gian có thể chuyển đổi với các biến tần số trong miền DCT

III THUẬT TOÁN WATERMARKING CHO VIDEO MPEG-2

Ý tưởng chung của Watermarking là nhúng một vài dữ liệu mở rộng vào trong một bản tin

Trang 4

chủ Thông tin nhúng gọi là watermark và dữ liệu chủ gọi là vật mang Các ứng dụng của

Watermarking có thể là bảo vệ bản quyền, nhận thực, ẩn dữ liệu, các thông tin mật…

Watermarking tại miền không gian

Các thuật toán watermarking thế hệ đầu tiên làm việc trong miền không gian bởi vì nó ít

yêu cầu phức tạp và đắt trong xử lý máy tính Một phương pháp trong đó là mã hóa LSB: bit

LSB của byte dữ liệu sẽ được sửa đổi để nhúng các watermark Mã hóa LSB rất dễ bị bẻ vỡ vì

nó chỉ thực hiện che phần LSB của các byte dữ liệu, vì vậy nó nhanh chóng được thay thế bằng

các kỹ thuật khác[8]

Watermarking tại miền DCT

Chúng ta thấy rằng sau khi chuyển đổi miền làm việc từ miền không gian sang miền DCT,

sự tương quan của các pixel không gian sẽ được giải tương quan thành các phần tần số rời rạc

Hệ số DC và tần số thấp của ma trận DCT sẽ quyết định các đặc tính tự nhiên nhất của một ảnh

Sau khi cắt xén các hệ số tần số cao, tính trung thực của ảnh vẫn còn đủ tốt cho sự cảm thụ thị

giác con người thông qua biến đổi ngược IDCT Vì vậy một phương pháp tự nhiên là nhúng một

ma trận các hệ số DCT watermark vào một ma trận các hệ số DCT ảnh trong vùng tần số trung

bình hay thấp hơn để đạt được watermark mạnh (hình 3.1)

Các tần số cao

Các tần số trung bình

cho watermarking

Các tần số thấp

CT 2

Tính chất mạnh của watermarking DCT là nếu một kẻ tấn công cố gắng loại bỏ

watermarking tại các tần số trung bình thì sẽ phá mất đi tính trung thực của ảnh, vì một vài chi

tiết thu nhận là tại các tần số trung bình

Hình 3.1 Nhúng một watermark

ở vùng tần số trung bình

Phương trình nhúng watermark [3, 4, 5, 6, 8]:

(3.1) w

C = αC(i, j) + βW(i, j)

mạnh watermark, các chỉ số này có thể xác định liệu watermark là ẩn hay hiện; C(i,j) là hệ số

DCT ban đầu trước khi watermarking; W(i,j) là hệ số DCT watermark

Watermarking ẩn và watermarking hiện

Watermarking ẩn tại miền DCT cũng có thể thực hiện được với phương trình watermarking

(3.1) Chỉ bằng điều chỉnh các hệ số watermarking α và β [1, 5, 6, 8], watermark có thể trở lên

ẩn hay hiện Watermarking ẩn trong video được ứng dụng rất phổ biến trong video quảng bá Để

Trang 5

thực hiện kỹ thuật này, một ma trận các hệ số 16x16 DCT sẽ được cộng trực tiếp với ma trận các hệ số 16x16 DCT ảnh như phương trình (3.1) [1, 4, 5] (hình 3.2)

Hình 3.2 Nhúng watermark tại ma trận các hệ số 16x16

Không giống như nhúng watermark ở tần số trung bình, hệ số DC và tất cả hệ số AC của

ma trận các hệ số DCT ảnh sẽ bị sửa đổi bởi việc nhúng watermark, vì kỹ thuật watermarking này cho kết quả là cảm nhận hữu hình các watermark đối với hệ thống thị giác con người Có hai lựa chọn để nhúng watermark vào các khung của một đoạn video là thực hiện watermarking trước hay sau khi nén (hình 3.3)

b watermarking trong miền nén (trong khi nén)

Các khung

Luồng bit MPEG

a Watermarking trong miền chưa nén (trước khi nén)

Các khung video

Nén video

Luồng bit MPEG

Hình 3.3 Watermarking trong miền chưa nén và miền nén

Watermarking

CT 2

Để đạt được tính mạnh của nó thì thuật toán nhúng watermark tại miền DCT được lựa chọn (hình 3.4)

Các khung

W

C i, j = αC i, j + βW I,J

DCT

C

C

Các khung đã được nhúng watermark Ảnh

Hình 3.4 Sơ đồ khối phần tử watermarking

IV MÔ PHỎNG THUẬT TOÁN VÀ KẾT QUẢ

Sử dụng công cụ MATLAB/Simulink[9] để mô phỏng các thuật toán và kiến trúc trên cơ

Trang 6

sở tập các khối chức năng Công cụ MATLAB/Simulink hỗ trợ nhiều hàm xử lý ảnh và video,

đó là: DCT/IDCT, SAD cho ước lượng chuyển động, xử lý khối, trễ (bộ đệm) Và một số công

việc phải thực hiện thêm vào là: lượng tử hóa, quét zigzag, mã hóa entropy, watermarking Mô

hình watermarking cho video MPEG-2 được thể hiện ở hình vẽ 4.1

a Cấu trúc khối hệ thống thực hiện thuật toán Watermarking cho video nén MPEG-2

CT 2

b Cấu trúc các khối bên trong bộ mã hóa trong cấu trúc tổng thể (hình a)

Hình 4.1 Mô hình hệ thống sử dụng công cụ Matlab/Simulink

2

1

2

IP

1

3

Quan sát hình vẽ 4.1b thì các khung video được nhúng watermark tại miền DCT (trong

khối watermarking) trước khi được nén Và chỉ có các khối Y là được nhúng watermark vì các

lý do sau:

- Ảnh watermark thường là các ảnh màu trắng đen hay xám, nên nó chỉ tác động vào độ

chói (độ sáng) của ảnh

- Độ chói Y thì nhạy cảm hơn với cảm nhận thị giác của con người, do đó bất cứ sự chỉnh

sửa tác động trái phép nào đều dễ dàng phát hiện vì vậy nó lý tưởng cho bảo vệ bản quyền

Trang 7

- Để tránh quá nhiều dư thừa được cộng vào các khung, watermark không nên được nhúng vào Cb và Cr

Kết quả mô phỏng:

9 Sử dụng đoạn video ‘akiyo.avi’ có độ phân giải 112x176, ảnh đơn sắc Watermark

‘GTVT112x176.tif’ có kích thước 112x176 pixels Tỷ lệ nén đạt được trung bình 13.75 lần tương ứng với kết quả được thể hiện trên hình vẽ 4.2

Hình 4.2 Kết quả mô phỏng khi sử dụng đoạn video ‘akiyo.avi’

và ảnh watermark ‘GTVT112x176.tif’

Sử dụng đoạn video ‘akiyo.avi’ có độ phân giải 112x176, ảnh đơn sắc Watermark

‘GTVT48x80.tif’ có kích thước 48x80 pixels Cùng hệ số α và ß như mô phỏng trên thì tỷ lệ nén đạt được trung bình 12.3 lần tương ứng với kết quả được thể hiện trên hình vẽ 4.3

CT 2

Hình 4.3 Kết quả mô phỏng khi sử dụng đoạn video ‘akiyo.avi’

và ảnh watermark ‘GTVT48x80.tif’

Tỷ số tín hiệu trên nhiễu đỉnh PSNR là một tham số quan trọng để đánh giá video sau mã hóa so với video trước khi mã hóa Quan sát hình vẽ 4.4a ta thấy PSNR tham chiếu cho video gốc và video sau nén MPEG-2 không thực hiện watermarking đạt trung bình là 34,1 và đây là kết quả khá tốt cho nén video Hình 4.4b cho kết quả PSNR giữa video gốc và video sau nén MPEG-2 có thực hiện nhúng watermark ảnh ‘GTVT112x176.tif’ (hình vẽ 4.4b) đạt giá trị trung bình là 22,03 và kết quả này nằm trong giới hạn chất lượng của một bộ nén video tổn hao [10] PSNR giữa video gốc và video sau nén MPEG-2 có nhúng watermark ‘GTVT40x80.tif’ kích thước nhỏ hơn (hình vẽ 4.4c) đạt trung bình là 19,23

Trang 8

0 50 100 150 200 250 300 33.7

33.8 33.9 34 34.1 34.2 34.3 34.4 34.5

CT 2

FRAMES

a PSNR giữa video gốc và video sau nén MPEG-2

khi không thực hiện watermarking

21.94 21.96 21.98 22 22.02 22.04 22.06 22.08 22.1 22.12

FRAMES

18.8 18.9 19 19.1 19.2 19.3 19.4 19.5 19.6 19.7

FRAMES

b PSNR giữa video gốc và video sau nén MPEG-2

có nhúng watermark ‘GTVT112x176.tif’

c PSNR giữa video gốc và video sau nén MPEG-2

có nhúng watermark ‘GTVT40x80.tif’

Hình 4.4 Kết quả tính toán PSNR giữa video gốc với video nén MPEG-2

không thực hiện nhúng Watermark và có thực hiện nhúng watermark với cùng các hệ số α và ß

Trang 9

IV KẾT LUẬN

Vấn đề bảo vệ trí tuệ và quyền tác giả xu hướng ngày càng được quan tâm trên thế giới Kỹ thuật watermarking được nghiên cứu và được ứng dụng trong nhiều các lĩnh vực khác nhau Để watermarking đạt được tính mạnh hơn nữa thì chúng nên được công bố và thảo luận rộng rãi Thuật toán watermarking cho video MPEG-2 giới thiệu trong bài bào này có tính mạnh mẽ và mềm dẻo cao Tùy theo tứng ứng dụng mà có thể lựa chọn là watermarking ẩn hay hiện bằng việc điều chỉnh hai tham số α và ß

Tài liệu tham khảo

[1] Wei Cai, FPGA prototyping of a Watermarking algorithm for MPEG-4, UNIVERSITY OF NORTH

TEXAS, 2007

[2] Mohammed Ghanbari, Standard Codecs: Image Compression to Advanced Video Coding, IEEE

Express, USA, 2003

[3] Saraju P Mohanty, K.R Ramakrishnan, Mohan S Kankanhalli, A DCT Domain Visible

Watermarking Technique for Images, IEEE, 2003

[4] S P Mohanty, K R Ramakrishnan, and M S Kanakanhalli, "An Adaptive DCT Domain Visible

Watermarking Technique for Protection of Publicly Available Images", in Proceedings of the International Conference on MultimediaProcessing and Systems (ICMPS), pp.195-198, 2000

[5] Juan R Hernandez, Martín Amado, Fernando Perez-Gonzalez, DCT-Domain Watermarking

Techniques for Still Images: Detector Performance Analysis and a New Structure, IEEE TRANSACTIONS ON IMAGE PROCESSING, VOL 9, NO 1, JANUARY 2000

[6] Frank Hartung and Bernd Girod, Watermarking of Uncompressed and Compressed Video,

University of Enlangen-Neremburg, Germany, 1998

CT 2

[7] http://www.watermarkingworld.org

[8] Http://www.cosy.sbg.ac.at/~pmeerw/Watermarking

[9] Http://www.mathworks.com

[10] Http://en.wikipedia.org/wiki/Peak_signal-to-noise_ratio♦

Ngày đăng: 10/07/2014, 20:20

HÌNH ẢNH LIÊN QUAN

Hình độ phân giải cao HDTV quảng bá và phân phối movie/video chất lượng cao trong các đĩa - THUẬT TOÁN WATERMARKING CHO VIDEO SỐ NÉN MPEG-2 VÀ ỨNG DỤNG ppsx
nh độ phân giải cao HDTV quảng bá và phân phối movie/video chất lượng cao trong các đĩa (Trang 2)
Hình 3.1. Nhúng một watermark - THUẬT TOÁN WATERMARKING CHO VIDEO SỐ NÉN MPEG-2 VÀ ỨNG DỤNG ppsx
Hình 3.1. Nhúng một watermark (Trang 4)
Hình 3.3. Watermarking trong miền chưa nén và miền nén - THUẬT TOÁN WATERMARKING CHO VIDEO SỐ NÉN MPEG-2 VÀ ỨNG DỤNG ppsx
Hình 3.3. Watermarking trong miền chưa nén và miền nén (Trang 5)
Hình 3.4. Sơ đồ khối phần tử watermarking - THUẬT TOÁN WATERMARKING CHO VIDEO SỐ NÉN MPEG-2 VÀ ỨNG DỤNG ppsx
Hình 3.4. Sơ đồ khối phần tử watermarking (Trang 5)
Hình 3.2. Nhúng watermark tại ma trận các hệ số 16x16 - THUẬT TOÁN WATERMARKING CHO VIDEO SỐ NÉN MPEG-2 VÀ ỨNG DỤNG ppsx
Hình 3.2. Nhúng watermark tại ma trận các hệ số 16x16 (Trang 5)
Hình 4.2. Kết quả mô phỏng khi sử dụng đoạn video ‘akiyo.avi’ - THUẬT TOÁN WATERMARKING CHO VIDEO SỐ NÉN MPEG-2 VÀ ỨNG DỤNG ppsx
Hình 4.2. Kết quả mô phỏng khi sử dụng đoạn video ‘akiyo.avi’ (Trang 7)
Hình 4.3. Kết quả mô phỏng khi sử dụng đoạn video ‘akiyo.avi’ - THUẬT TOÁN WATERMARKING CHO VIDEO SỐ NÉN MPEG-2 VÀ ỨNG DỤNG ppsx
Hình 4.3. Kết quả mô phỏng khi sử dụng đoạn video ‘akiyo.avi’ (Trang 7)
Hình  4.4. Kết quả tính toán PSNR giữa video gốc với video nén MPEG-2 - THUẬT TOÁN WATERMARKING CHO VIDEO SỐ NÉN MPEG-2 VÀ ỨNG DỤNG ppsx
nh 4.4. Kết quả tính toán PSNR giữa video gốc với video nén MPEG-2 (Trang 8)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w