Ngày nay việc bảo vệ bản quyền số ngày càng quan trọng. Một trong những phương pháp phổ biến và đem lại hiệu quả nhất là watermarking. watermarking là một phương pháp đơn giản, nhưng đem lại hiệu quả cao, đặc biệt trong bảo vệ bản quyền ảnh số, video.
Abstract: Nowadays, the copyright protection problem of digital works becomes the urgent and necessary requirement. Therefore, the watermarking technology has been interesting and developing rapid for the recent years and expected to use more. Besides, the Wavelet transform currently shows pre-eminent characteristics and is used in the JPEG2000 compression standard. Based on these approaches, the paper proposes a method of watermarking approach for copyright protection applied to still images in the DWT (Discrete Wavelet Transform) domain, finds out the optimal parameters for embedding and detecting watermarks and estimates its robustness in comparison with the algorithm using the traditional DCT (Discrete Fourier Transform). The paper uses two keys: one for watermark and another for generating embedded multi-bits to reinforce the security. Furthermore, lots of various attacks such as the compression (JPEG and JPEG2000), the filters (average, median, adaptive, sharpening, Gaussian, etc) and the noise are investigated with different type of images. The paper also presents the verification the simulated results on the TMS320C6711 Digital Signal Processor. Keywords: Watermarking, DCT, Wavelets, DWT, JPEG2000 I. TỔNG QUAN WATERMARKING Watermarking là một trong những kỹ thuật giấu dữ liệu hiện đại. Nó được định nghĩa như là quá trình chèn thông tin vào dữ liệu đa phương tiện nhưng bảo đảm không cảm thụ được, nghĩa là chỉ làm thay đổi nhỏ dữ liệu gốc. Thông thường người ta chỉ đề cập đến watermarking số. Đó là một tập các dữ liệu số thứ cấp - gọ i là watermark (mã đánh dấu bản quyền) - được nhúng vào dữ liệu số sơ cấp - gọi là dữ liệu bao phủ (ví dụ như văn bản, hình ảnh, video và audio số, ). Dữ liệu sau quá trình nhúng được gọi là dữ liệu nhúng. Tanaka (1990), Caronni và Tirkel (1993) lần lượt đưa ra những ấn bản đầu tiên về watermarking nhưng chưa nhận được sự quan tâm đúng mức [1]. Mãi đến năm 1995, chủ đề này mới bắt đầu được quan tâm và kể từ đó, watermarking số đã phát triển rất nhanh với nhiều hướng nghiên cứu và phương pháp thực hiện khác nhau. Watermarking được ứng dụng trong nhiều lĩnh vực như bảo vệ quyền sở hữu, điều khiển việc sao chép, xác nhận giấy tờ, hay truyền đạt thông tin khác, … trong đó ứng dụng phổ biến của nó là cung cấp bằng chứng về bản quyền tác giả của các dữ liệu số bằng cách nhúng các thông tin bản quyền [4], [5]. Rõ ràng trong ứng dụng này, thông tin nhúng cần phải bền vững trước các thao tác nhằm loại bỏ chúng. Hình 1. Sơ đồ nhúng watermark. Giải pháp hiệu quả dùng kỹ thuật watermarking cho ứng dụng bảo vệ bản quyền ảnh số An Efficient Watermarking Approach for Copyright Protection Application of Digital Images Lê Tiến Thường, Nguyễn Thanh Tuấn Nhúng watermar k Dữ liệu bao phủ Watermark Dữ liệu nhúng Mã cá nhân /công cộng Hình 2. Sơ đồ khôi phục watermark. Tất cả các phương pháp watermarking đều có chung các khối sau: một hệ thống nhúng watermark và một hệ thống khôi phục watermark. Hình 1 trình bày quá trình nhúng watermark tổng quát. Ngõ vào là watermark, dữ liệu cần nhúng và mã cá nhân hay công cộng. Watermark có thể ở bất kì dạng nào như chữ số, văn bản hay hình ảnh. Khoá có thể được dùng để tăng cường tính bảo mật, nghĩa là ngăn chặn những kẻ không có bản quyền khôi phục hay phá hủy watermark. Các hệ thống thự c tế dùng ít nhất là một khoá, thậm chí kết hợp nhiều khoá. Ngõ ra là dữ liệu đã được watermark. Quá trình khôi phục watermark tổng quát được cho ở Hình 2. Các ngõ vào là dữ liệu đã watermark, khoá và dữ liệu gốc (có thể có hoặc không tuỳ thuộc vào phương pháp). Ngõ ra hoặc là watermark khôi phục được hoặc đại lượng nào đó chỉ ra mối tương quan giữa nó và watermark cho trước ở ngõ vào. Phụ thuộc vào mục đích và ứng dụng mà các yêu cầu củ a hệ thống watermarking được đặt ra. Với các hệ thống thực tế, chúng đòi hỏi các yêu cầu sau: − Tính không cảm thụ: các điều chỉnh gây ra do nhúng watermark phải thấp hơn ngưỡng cảm thụ, nghĩa là các mẫu dùng trong nhúng watermark chỉ được phép thay đổi nhỏ. − Tính bền vững: đây là một yêu cầu nòng cốt của watermarking. − Khôi phục watermark cần hoặc không cần dữ liệu gốc. − Trích watermark hay kiể m chứng sự tồn tại của watermark. − Các khoá và bảo mật watermark. II. CƠ BẢN VỀ PHÉP BIẾN ĐỔI SÓNG CON DÙNG TRONG WATERMARKING Wavelets là các hàm được định nghĩa trong khoảng hữu hạn và có giá trị trung bình bằng 0. Ý tưởng cơ bản của phép biến đổi sóng con là khai triển hàm ƒ(t) bất kỳ như một xếp chồng của các sóng con (wavelets) hay các hàm cơ sở. Các hàm cơ sở này có được từ một wavelet nguyên mẫu gọ i là wavelet mẹ (mother wavelet) bằng cách lấy tỉ lệ và dịch [2]. Trong thực tế tính toán, biến đổi sóng con rời rạc thuận và nghịch (DWT và IDWT) thường được thực hiện bởi phương trình (1) và (2). ∫ +∞ ∞− −− −= dtnbtatfa mm )()(n)(m,DWT 00 *2/ 0f ψ (1) ∑∑ +∞ −∞= +∞ −∞= ><= mn nmnm tftf )( ~ ,)( ,, ψψ (2) trong đó, ψ (t) là hàm wavelet mẹ. Điều kiện ψ (t) là một hàm thông dải đảm bảo sự tồn tại của biến đổi sóng con ngược. Thông thường, người ta chọn a 0 =2 và b 0 =1. Trong nhiều ứng dụng, sơ đồ dùng biến đổi sóng con đã tỏ ra ưu thế so với biến đổi Fourier rời rạc DFT (Discrete Fourier Transform) hay biến đổi cosine rời rạc DCT truyền thống. Do đặc tính đa phân giải, sơ đồ mã hoá Wavelets đặc biệt thích hợp cho các ứng dụng mà tính vô hướng và suy biến đóng vai trò quan trọng. Minh chứng cho điều này là biến đổi sóng con đã được dùng như một tiêu chuẩn trong nén JPEG2000. Ngoài ra, tính đa phân giải của Wavelets còn hữu ích trong việc phân phối thông điệp vào đối tượng bao phủ trong khi vẫn đảm bảo tính bền vững và chất lượng hiển thị. Do đó, watermarking dùng DWT dự báo sự sống còn của watermark sau tác động nén có tổn hao JPEG2000 trong khi vẫn đảm bảo sự suy giảm chất lượng ảnh cho phép. Tổng quát, biến đổi sóng con thực hiện khai triển tần số - không gian đa tỉ lệ củ a một ảnh. Khai triển này tạo ra các hệ số xấp xỉ và các hệ số chi tiết ngang, dọc và chéo. Quá trình khai triển lại tiếp tục với các hệ số xấp xỉ ở các mức phân tích cao hơn. Các hệ số xấp xỉ sau cùng chứa thông tin về băng tần thấp nhất trong khi các hệ số chi tiết chứa Phát hiện watermark Dữ liệu nhúng Watermark Quyết định watermark Mã cá nhân /công cộ ng thông tin về băng tần cao hơn. III. GIẢI THUẬT THỰC HIỆN Dựa trên giải thuật watermarking cho ảnh dạng tường minh, watermark cộng ở miền DCT của Cox [3], bài báo đưa ra một số cải tiến và thực hiện nhúng watermark ở miền DWT theo sơ đồ dưới đây [6], [7]. Watermark được tạo ra từ bộ tạo số giả ngẫu nhiên (PRN) với một khoá bí mật Key. Chiều dài watermark N xác định mức độ tr ải watermark vào dữ liệu. Trong phần lớn trường hợp, chiều dài watermark càng lớn thì độ mạnh watermark đòi hỏi càng nhẹ. Nhưng nói chung, không có chiều dài watermark thích hợp cho tất cả các ảnh. Hình 3. Quá trình nhúng watermark. Hình 4. Quá trình trích watermark. Trong quá trình nhúng watermark, chúng ta thực hiện DWT cho ảnh. Một tập các hệ số lớn nhất (có chiều dài bằng chiều dài watermark) trong băng tần thích hợp được trích ra và cộng với watermark theo biểu thức (3). * C C ' W α += (3) trong đó a là độ mạnh của watermark nhúng. Từ biểu thức (3), quá trình trích watermark được xác định như sau: α C)/-(C W "' = (4) trong đó C’’ là N hệ số DWT lớn nhất của ảnh nhúng sau các tấn công (nếu có). Cũng từ biểu thức (4) có thể thấy rằng các hệ số gốc C cần thiết cho quá trình trích. Do đó, giải thuật này thuộc dạng tường minh. Khi có watermark trích, ta so sánh nó với watermark gốc bằng cách đánh giá hệ số tương quan d. ( ) () () ∑∑∑∑ ==== ∗= N j j N i i N i ji N j WWWWd 1 2 1 2 ' 1 ' 1 (5) Giá trị của d trong tầm -1 tới 1. Giá trị này càng gần 1 nghĩa là mức độ tương quan giữa hai watermark càng tốt. Bằng cách so sánh d với ngưỡng xác định trước, có thể xác định liệu watermark có tồn tại hay không. Bài báo sẽ khảo sát nhằm rút ra ngưỡng tối ưu để đảm bảo tính tin cậy của quá trình nhúng và trích watermark trước các tấn công khác nhau. IV. KẾT QUẢ THỰC HIỆN NGHIÊN CỨU 1. Tối ưu chuỗi watermark Trước hết, bài báo khảo sát vi ệc lựa chọn chuỗi watermark. Đó là chuỗi các số ngẫu nhiên có phân bố đều (uniform) hoặc phân bố chuẩn (normal hay còn gọi là Gauss). Chiều dài của chuỗi watermark trong quá trình khảo sát là 50, 100, 200, 300, 1000 và 10000. Hình 5. Giá trị tương quan của các chuỗi watermark khác nhau. Hình 5 biểu diễn các giá trị tương quan trung bình và tối đa khi khảo sát với 10000 chuỗi watermark Tính tương quan PRN Key X Y’ W’ W d C C’’ DWT Trích DWT X DWT PRN Y α Key W C’ IDWT khác nhau. Khi hai chuỗi watermark giống nhau, giá trị tương quan bằng 1. Khi hai chuỗi watermark khác nhau, giá trị tương quan càng gần 0 càng thể hiện tính ngẫu nhiên của chuỗi watermark. Kết quả ở hình 5 cho thấy chuỗi ngẫu nhiên phân bố chuẩn cho kết quả tốt hơn là phân bố đều và chiều dài watermark càng lớn thì càng tốt. Tuy nhiên, khi chiều dài watermark lớn thì khả năng nhúng nhiều bit sẽ thấp. Từ đó, bài báo đề nghị dùng chuỗi watermark chiều dài 1000 có dạng ngẫ u nhiên phân bố chuẩn trong trường hợp nhúng 1 bit. 2. Tối ưu các thông số miền Wavelets Các thông số tối ưu cần xác định trong phương pháp watermarking miền DWT là họ wavelets, mức phân tích và băng tần nhúng (xấp xỉ hay chi tiết). Như đã trình bày ở phần lý thuyết, quá trình phân tích Wavelets một ảnh tạo ra băng tần xấp xỉ và các băng tần chi tiết (dọc, ngang và chéo). Có thể thấy rằng nếu chỉ dùng đại lượng khách quan MSE (Mean Square Error) hay PSNR (Peak Signal Noise Ratio) để đánh giá thì quá trình watermarking cho kết quả xấp xỉ nhau ở các băng tần nhúng khác nhau. Tuy nhiên, khi xem xét mức độ cảm thụ dùng HVS (Human Visual System) thì watermarking ở băng tần xấp xỉ gây ra mức độ cảm thụ có phần rõ hơn so với ở các băng tần chi tiết. Chính vì vậy, trong nhiều giải thuật khác dùng phép biến đổi sóng con, quá trình nhúng được thực hiện với băng tần chi tiết để đảm bảo mức độ c ảm thụ tốt nhất. Tuy nhiên, nhúng watermark ở băng tần xấp xỉ sẽ bền vững hơn trước những tấn công, nhất là các tấn công nhằm loại bỏ thành phần tần số cao như nén hay lọc nhiễu. Bảng I. Giá trị MSE. DCT 6.3005 DWT xấp xỉ DWT ngang DWT dọc DWT chéo Mức 1 6.2150 6.1344 6.1213 6.1020 Mức 2 6.2099 6.1960 6.2040 6.1978 Mức 3 6.2899 6.2897 6.2900 6.2897 (a) Ảnh gốc (b) Ảnh tách biên (c) Ảnh sai biệt DCT (d) Xấp xỉ, mức 1 (e) Xấp xỉ, mức 3 (f) Chi tiết dọc, mức 3 (g) Chi tiết ngang 3 (h) Chi tiết chéo 3 Hình 6. Mức độ cảm thụ HVS của ảnh nhúng miền DCT và miền DWT ở các băng tần. Bảng II. Giá trị PSNR (dB). DCT 35.30 DWT xấp xỉ DWT ngang DWT dọc DWT chéo Mức 1 35.35 35.41 35.42 35.43 Mức 2 35.36 35.37 35.36 35.36 Mức 3 35.30 35.30 35.30 35.30 Hình 7. Watermarking ở các băng tần khác nhau trước nén JPEG2000. Kết quả ở hình 7 cho thấy việc thực hiện watermarking ở băng tần xấp xỉ làm cho quá trình watermarking trở nên bền vững hơn so với khi thực hiện ở các băng tần chi tiết. Mặt khác, qua đánh giá chủ quan HVS về mức độ cảm thụ thì watermarking ở băng tần xấp xỉ là chấp nhận được. Tiếp theo, bài báo tiến hành xác định họ wavelets tối ưu. Qua kết quả khảo sát trình bày ở hình 8, họ wavelets rbio1.5 cho kết quả tốt nhất trong trường hợp tấn công nén JPEG. Hình 8. Watermarking với các họ wavelets khác nhau trước nén JPEG. Rõ ràng mức phân tích ảnh hưởng trực tiếp đến độ phân giải của biến đổi sóng con. Trong nhiều trường hợp tấn công, việc thực hiện watermarking ở mức phân tích càng cao, nghĩa là độ phân giải càng lớn hứa hẹn cho kết quả bền vững hơn. Tuy nhiên, nếu mức phân tích lớn sẽ làm giảm dung lượng bit thông tin nhúng trong ảnh. Vì vậy, bài báo thực hiện nhúng với mức phân tích bằng 3. Tóm lại, thông số tố i ưu cho việc thực hiện watermarking miền DWT là nhúng ở băng tần xấp xỉ, họ wavelet song trực giao ngược rbio1.5 và với mức phân tích 3. (a) DCT (b) DWT Hình 9. Ảnh sau watermaking. 3. So sánh giải thuật watermarking miền DCT và DWT Trước tiên, xem xét mức độ cảm thụ của ảnh sau watermarking. Kết quả ở hình 9 cho thấy chất lượng ảnh sau watermarking miền DCT và DWT đều chấp nhận được. Kế đến, xem xét ảnh hưởng của các tấn công khác nhau. Hình 10. Giá trị tương quan sau tấn công. Như đã phân tích ở phần trước, quá trình watermarking càng bền vững khi giá trị tương quan của watermark trích và watermark gốc càng gần 1. Kết quả ở hình 10 cho thấy phương pháp watermarking ở miền DWT bền vững hơn nhiều (giá trị tương quan lớn hơn) so với thực hiện ở miền DCT, nhất là trong các tấn công nén JPEG2000, lọc trung bình, lọc Gaussian, lọc sắc nét và co dãn ảnh. Một thông số khác để đánh giá độ tin cậy của hệ thống watermarking là tốc độ lỗi bit BER (Bit Error Rate). Trong quá trình khôi phục watermark, xuất hiện hai loại lỗi: lỗi không phát hiện được và lỗi phát hiện sai. Rõ ràng khi chọn ngưỡng càng nhỏ thì lỗi không phát hiện được sẽ giảm nhưng khi đó lỗi phát hiện sai sẽ tăng và ngược lại. Dựa trên kết quả ở hình 5, do giá trị tương quan lớn nhất giữa hai chuỗi ngẫu nhiên bất kì có chiều dài 1000 xấp xỉ 0.2 nên ngưỡng lựa chọn là 0.2 nhằm đạt đượ c lỗi phát hiện sai là nhỏ nhất. Kết quả ở hình 11 với mức ngưỡng 0.2 cho thấy trong trường hợp nhúng nhiều bit, phương pháp watermarking miền DWT cho xác suất lỗi bit thấp hơn so với phương pháp DCT, nghĩa là bền vững hơn trước những tấn công. Đặc biệt, ngay trong trường hợp kẻ tấn công biết rõ giải thuật và thực hiện tấn công trực tiếp vào vùng nhúng bằng cách nhúng thêm một thông tin khác vào ảnh sau watermarking, đ ây là dạng tấn công giao thức, thì quá trình trích thông tin nhúng ban đầu vẫn thành công ở miền DWT so với miền DCT. Kết quả được trình bày ở hình12 (a) và (b). Hình 11. Đồ thị tốc độ lỗi bit BER. Hình 12. (a) Tấn công giao thức miền DCT. Hình 12. (b) Tấn công giao thức miền DWT. 4. Kiểm chứng đánh giá kết quả trên DSP TMS320C6711 của Texas Instrument. Để kiểm chứng lại các kết quả ở phần mô phỏng ở trên đồng thời nhằm mục đích xem xét khả năng đáp ứng thời gian thực của giải thuật để có thể phát triển giải thuật cho các ứng dụng đòi hỏi thời gian thực, bài báo thực hiện quá trình watermarking trên phần cứng DSP TMS 320C6711 theo lưu đồ ở hình 13. Kết quả khảo sát cho thấy, quá trình mô phòng và kiểm chứng là hoàn toàn phù hợp đồng thời cũng cho thấy tính khả thi của việc dùng phép biến đổi sóng con trong các ứng dụng khác đòi hỏi thời gian thực của kỹ thuật watermarking. V. KẾT LUẬN Tóm lại, qua quá trình khảo sát, có thể kết luận rằng thực hiện watermarking trong miền DWT làm cho hệ thống trở nên mạnh mẽ và bền vững hơn khi so sánh với miền DCT truyền thống trong khi vẫn đảm bảo yêu cầu về mức độ cảm thụ, đặc biệt là trong các tấn công nén JPEG2000, lọc trung bình, lọc Gaussian, lọc sắc nét và co dãn ảnh. Xét về mặt thời gian cũng như độ phứ c tạp thì việc thực hiện watermarking trong miền DWT là hoàn toàn khả thi thông qua việc kiểm chứng thành công trên kit DSP. Điều này mở ra một hướng nghiên cứu dùng phép biến đổi sóng con trong watermarking cho các ứng dụng đòi hỏi thời gian thực như điều khiển và chống sao chép hay xác nhận lấy dấu tay. Ngoài ra, từ kết quả này, có thể tiến hành thực hiện watermarking cho chuỗi dữ liệu video với một số điều ch ỉnh hợp lý để đạt kết quả tốt hơn [8, 9]. Xa hơn, có thể kết hợp thực hiện với dữ liệu audio để watermarking cho dữ liệu media. TÀI LIỆU THAM KHẢO [1] Stefan Katzenbeisser and Fabien A. P. Petitcolas, Information Hiding techniques for steganography and digital watermarking, Security Technologies for the World Wide Web, Rolf Oppliger, 1999. [2] Martin Vetterli and Jelena Kovacevic, Wavelets and Subband Coding, Prentice Hall 1995. ISBN 0−13−097080−8. [3] Ingemar J. Cox, Joe Kilian, Tom Leighton, and Talal G. Shamoon, Cox’s DCT, additive, non-blind Image Watermarking Algorithm, Proceedings of the IEEE International Conf. on Image Processing, ICIP ’97, vol. 6, page 1673-1687, Santa Barbara, California, USA, 1997. [4] Special issue on signal processing for data hiding in digital media and secure content delivery, IEEE Trans on Signal Processing, Vol.51, No.4, ISSN 1053-587X, 04/2003. [5] I. Cox, J. Bloom and M. Miller, Digital Watermarking, San Francisco, CA: Morgan Kaufmann, 2001. [6] Yiwei Wang, John F. Doherty, and Robert E. Van Dyck, A wavelet-based watermarking algorithm for ownership verification of digital image, IEEE Transactions on Image Processing, Vol. 11, No 2, Feb 2002. [7] Chih-Wei Tang and Hsueh-Ming Hang, Fellow, IEEE, A Feature-Based Robust Digital Image Watermarking Scheme, IEEE Transactions on Signal Processing, Vol. 51, No. 4, April 2003. [8] Gerhard C. Langelaar, Iwan Setyawan, and Reginald L. Lagendijk, Watermarking Digital Image and Video Data, IEEE Signal Processing Magazine, Vol. 17, No. 5, September 2000. [9] Nguyễn Thanh Tuấn, Lê Tiến Thường, Dùng biến đổi Wavelets trong watermarking cho ứng dụng bảo vệ bản quyền ảnh số, luận văn cao học Khoá 13 chuyên ngành Vô tuyến điện tử, tr ường Đại học Bách Khoa TP.HCM, tháng 08-2004. Ngày nhận bài 04/10/2004 Hình 13. Lưu đồ kiểm chứng trên DSP. SƠ LƯỢC TÁC GIẢ LÊ TIẾN THƯỜNG Sinh năm 1957 tại TP. Hồ Chí Minh. Đã nhận bằng kỹ sư năm 1981, tiến sĩ năm 1998 tại Đại học Tasmania, Australia ngành Điện tử - Viễn thông, Được phong Phó Giáo sư năm 2002. Hiện công tác tại Khoa Điện - Điện tử, Đại học Bách Khoa TP. HCM. Lĩnh vực nghiên cứu: Xử lý tín hiệu, Thông tin số, xử lý tín hiệu radar, wavelets và ứng d ụng, neural- fuzzy systems. Email: thuongle@hcmut.edu.vn NGUYỄN THANH TUẤN Sinh năm 1979 tại TP.Hồ Chí Minh. Tốt nghiệp Đại học Bách Khoa TP.HCM chuyên ngành Điện tử-Viễn thông năm 2002. Bảo vệ luận án Thạc sĩ ngành Kỹ thuật vô tuyến điện tử tại Đại học Bách Khoa TP.HCM tháng 08 - 2004. Hiện là cán bộ giảng dạy tại Khoa Điện-Điện tử, Đại học Bách Khoa TP.HCM. Lĩnh vực nghiên cứu: Xử lý tín hiệu, Thông tin vô tuyến, Mạch điện tử, Wavelets – Neural – Fuzzy. Email: nguyenthanhtuan@hcmut.edu.vn . khác nhau. Watermarking được ứng dụng trong nhiều lĩnh vực như bảo vệ quyền sở hữu, điều khiển việc sao chép, xác nhận giấy tờ, hay truyền đạt thông tin khác, … trong đó ứng dụng phổ biến. Hình 1. Sơ đồ nhúng watermark. Giải pháp hiệu quả dùng kỹ thuật watermarking cho ứng dụng bảo vệ bản quyền ảnh số An Efficient Watermarking Approach for Copyright Protection Application of. dụng phổ biến của nó là cung cấp bằng chứng về bản quyền tác giả của các dữ liệu số bằng cách nhúng các thông tin bản quyền [4], [5]. Rõ ràng trong ứng dụng này, thông tin nhúng cần phải bền