HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIÊN THÔNG
Trang 2Người hướng dẫn khoa học.TS Vũ Văn Thỏa
Phản biện 1: TS Nguyễn Ngọc Cương
Phản biện 2: TS Nguyễn Khắc Lịch
Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học viện
Công nghệ Bưu chính Viễn thông
Vào lúc: 15 giờ 00 ngày 27 tháng 02 năm 2016
Có thê tìm hiéu luận văn tại:
- Thư viện của Học viện Công nghệ Bưu chính Viễn thông
Trang 3.MỞ ĐẦU
Một trong những van nạn trong kỷ nguyên kỹ thuật số mà chúng ta đang phải đương đầu hiện nay là van nạn vi phạm bản quyền nội dung số Người sở hữu nội dung số càng dé dàng quảng bá sản phẩm của mình thì lại càng khó khăn trong việc bảo vệ quyền và lợi ích hợp pháp của mình đối với các sản pham đó Việc thông tin số dé dàng được nhân bản và phân phối đi dẫn đến yêu cầu cần có những công cụ hữu hiệu về mặt pháp lý cũng như kỹ thuật dé bảo vệ bản quyên Đã có nhiều giải pháp kỹ thuật, trong đó có thủy vân số, ra đời nhằm giải quyết vấn đề này Ảnh số là một trong những nội dung số quan trọng nhất, các nhà nghiên cứu đã đề xuất rất nhiều loại kỹ thuật thủy vân trên ảnh số với các ứng dụng khác nhau Ứng dụng quan trọng và cơ bản nhất của thủy vân số là thủy vân trên ảnh số dé bảo vệ bản quyền ảnh số Trong đó, thủy vân ấn thường được sử dụng vi tính an của thủy vân là một đặc trưng quan trọng trong các ứng dụng giấu tin trên ảnhsố hay đánh dấu bản quyền ảnh số mà vẫn đảm bảo chất lượng ảnh Ngoài việc đảm bảo chất lượng ảnh sau khi đánh dấu thì thủy vân còn phải bền vững trước các tác động từ bên ngoài lên ảnh chang hạn như các phép xử lý ảnh Đối với ảnh số thì việc nén ảnh, đặc biệt là nén JPEG, là phép xử lý ảnh được sử dụng phổ biến.
Tạo thủy vân là một phương pháp nhúng một lượng thông tin nào đó vào trong dữ
liệu đa phương tiện cần được bảo vệ sở hữu và không ảnh hưởng tới chất lượng của sản
phẩm Thủy vân phải tồn tại bền vững với sản phẩm số và không thé loại bỏ bang bat kì những tan công có chủ đích hay không chủ đích nào trừ khi phá hủy sản phẩm.
Luận văn với đề tài “Nghiên cứucông nghệ thủy vân số và ứng dụng trong bảo vệ bản quyền nội dung số“ sẽ tập trung trình bày những kết quả nghiên cứu đã đạt được về thủy vân số, ứng dụng thủy vân số để bảo vệ bản quyền tài liệu điện tử, đặc biệt là ảnh số Luận văn cũng tìm hiểu một số thuật toán thủy vân tiêu biểu và viết ứng dụng giấu tin sử
dụng thuật toán DCT.
Nội dung chính của luận văn bao gồm:
Chương 1: Với tiêu đề “Tổng quan về thủy vân số” , chương nay trình bày khái niệm thủy vân số, lịch sử hình thành và phát triển của thủy vân Chương 1 cũng trình bày về các
đặc tính, phân loại thủy vân cũng như quy trình thực hiện thủy vân và ứng dụng của nó.
Chương 2: “Nghiên cứu các thuật toán thủy vân sé” , tập trung khảo sát một số thuật
toán nhúng thủy vân, nghiên cứu các định dạng ảnh và các thuật toán thủy vân trên ảnh.
Trang 4Chương 3: Cài đặt ứng dụng tạo thủy vân số cho ảnh trên Matlab - cài đặt và chương
trình, thực hiện nhúng và tách thủy vân dưới dạng văn bản và thủy vân dưới dạng ảnh.
Trang 5CHƯƠNG 1: TONG QUAN VE THỦY VAN SO
Chương nay luận văn trình bày khái niệm thủy vân số, lịch sử hình thành và phát triển của thủy vân,các đặc tính của thủy vân số, phân loại thủy vân số và quy trình tạo thủy vân số, các ứng dung của thủy vân sé.
1.1Giới thiệu chung
1.1.1 Khái niệm thủy vân số
Thủy vân số (Digital WaterMaking) là kỹ thuật nhúng “dau ấn số” (Watermark - tin giấu) vào một sản phẩm số như văn bản, hình anh, âm thanh, video mà tin giấu này có thé được phát hiện và tách ra sau đó nhằm chứng thực (đánh dấu, xác thực) nguồn gốc hay
chủ sở hữu của sản phâm số nay[1].
1.1.2 Quá trình hình thành và phát triển
Thuật ngữ thủy vân số được cộng đồng thé giới chấp nhận rộng rãi vào đầu thập niên 1990 Khoảng năm 1995, sự quan tâm đến thủy vân bắt đầu phát triển nhanh Năm 1996, hội thảo về che dấu thông tin lần đầu tiên đưa thủy vân vào phan trình bày nội dung chính.
Vào cuối thập niên 1990, một số công ty đã đưa thủy vân vào thương trường, chăng hạn các nhà phân phối nhạc trên Internet sử dụng Liquid Audio áp dụng công nghệ của
Verance Corporation Trong lĩnh vực thủy vân ảnh, Photoshop đã tích hợp một bộ nhúng vabộ dò thủy vân tên là Digimarc.
Với sự ra đời của thủy vân, thì năm 1990 trở về sau, đã có nhiều nghiên cứu về tấn công cũng như chống tấn công đối với thủy vân Những nghiên cứu này đã thúc đầy quá trình nghiên cứu thủy vân đạt được nhiều kết quả mới.
Thủy vân sử dụng công nghệ trải phổ (spread spectrum) được giới thiệu cùng thời điểm với mô hình tri giác, là một nỗ lực nhằm cân bằng giữa tính bền vững (robustness) và tính tin cậy (fidelity) của thủy vân số Công nghệ trải phố sẽ trải một băng tần hẹp vào một băng tần rộng hơn, do đó tỷ lệ nhiễu trên mỗi tần số trở nên rất nhỏ Phía bên người gửi sẽ tong hợp lại các tín hiệu này, và lúc này nhiễu trở nên lớn Công nghệ trải phô là một hướng đi có nhiều triển vọng của kỹ thuật thủy vân.
Chất lượng tài liệu điện tử sau khi giấu tin phải không được thay đổi nhiều, để cho con người khó có thé nhận ra bang các giác quan thông thường.
Trang 6Thủy vân sô là một lĩnh vực nghiên cứu mới, có nhiêu triên vọng Những năm gân
đây lĩnh vực này có được sự quan tâm đáng ké của các nhà nghiên cứu.
1.2 Các đặc tính và phân loại thủy vân số
1.2.1 Các đặc tinh của thủy vân số
- Tính bảo mật
- Tinh bền vững - Tính ân
- Dam bảo toàn vẹn dir liệu- Tinh hiệu qua
- Tính vô hình
1.2.2 Phân loại thủy vân số
Có rất nhiều phương pháp dé phân loại thủy vân số, dưới đây là một số phương pháp
phân loại phô biên hiện nay
Phân loại theo tính bền vững
e Thủy vân bền vững (Robust watermarking): là các thủy vân nhúng theo phương pháp
rât khó phá hủy Việc tân công thủy vân sô trong trường hợp này sẽ làm giảm châtlượng của thông tin Nói cách khác thì nêu phá hủy thủy vân thì đông thời sẽ phá
hủy đôi tượng mang.
e Thuy vân dễ vỡ (Fragile watermarking): loại này nhằm đảm bảo tính toàn ven cho
nội dung thông tin nên bât kỳ sự thay đôi nào cũng có thê làm cho thủy vân bị hỏng.Phân loại theo khả năng cảm nhận
e Thủy vân ấn (Invisible watermarking): là các thủy vân không thể nhìn thấy được
băng mat thường.
e Thủy vân hiện (Visible watermarking): là thủy vân có thể nhìn thấy được bằng mắt
Phân loại theo hướng tiếp cận
e Theo miền không gian (Spatial domain): là kỹ thuật nhúng thủy vân thực tiếp vào
vùng không gian dữ liệu ảnh.
e Theo miễn tần số (Frepuency domain): là kỹ thuật nhúng thủy vân vào vùng biến đổi
tân sô của dir liệu anh.
1.3 Quy trình thực hiện thủy vân số
e Tao thủy vân
Trang 7e Thủy vân số phô biến là dạng text hoặc dạng ảnh Thủy vân có thể được biến đổi mã hóa trước khi nhúng vào ảnh Thủy vân bao gồm thông tin mật đã được mã hóa cùng
với khóa đã được mã hóa được nhúng vào ảnh mang và gửi cho người nhận.
e_ Nhúng thủy vân số
e Sau khi tạo thủy vân xong, thủy vân được nhúng trực tiếp vào ảnh hay vào miền biến đổi của anh tùy thuộc vào thuật toán mà chúng ta sử dụng.
e Để tách thủy vân ta sử dụng khóa trong quá trình nhúng và anh đã nhúng thủy vân.
Việc tách thủy vân có quy trình ngược lại so với quy trình nhúng Sauk hi tách được
thủy vân, nếu thủy vân bị mã hóa thì chúng ta thực hiện giải mã để thu được thông điệp gốc Sau đó thông điệp sẽ được so sánh với thông điệp cũ đề xác thực.
1.4 Các ứng dụng của thủy vân số
e_ Bảo vệ quyền sở hữu (Copyright Protection): Digital watermark có thé được dung dé bảo vệ quyền sở hữu đối với các sản phẩm tài liệu điện tử (digital media) Nội dung của các tài liệu điện tử này sẽ chứa thêm các thông tin về người sở hữu Khi các
tài liệu điện tử này được sử dụng bat hop phap thi ta co thé dung bộ watermark
detector dé phát hiện.
e Chong sao chép bat hợp pháp (Copy Protection): các sản phâm có chứa digital watermark biểu hiện cho việc sản phâm này không được sao chép, vì nếu sao chép sẽ phạm luật Nhà sản xuất sẽ trang bị cho các phương tiện dung để nhân bản như CD Writer khả năng phát hiện xem tài liệu điện tử có chứa thủy vân hay không, nếu có thì sẽ từ chối sao chép Một số phần mềm cũng có chức năng này Ví dụ như phần mềm xem phim của hang DivX sẽ từ chối chiếu các bộ phim chứa thủy vân.
e_ Theo dõi quá trình sử dụng (Tracking): digital watermarking có thê được dùng dé theo dõi quá trình sử dụng của các tài liệu điện tử Mỗi bản sao của sản phẩm chứa một watermarked duy nhất dùng dé xác định người sử dụng là ai Nếu có sự sao chép bất hợp pháp, ta có thể truy ra người vi phạm nhờ bào watermark được chứa bên
trong tài liệu điện tử.
e Chống giả mạo (Tamper Proofing): digital watermarking có thé được sử dụng dé chống giả mạo Nếu có bat cứ sự thay đôi nào về nội dung của các tài liệu điện tử thì watermark này sẽ bị hủy đi Do đó rất khó làm giả các tài liệu điện tử có chứa
watermark.
Trang 8e_ Theo dõi truyền thông (Broadcast Monitoring): các công ty truyền thông và quảng cáo có thé dùng kỹ thuật digital wartermarking dé quản lý xem có bao nhiêu khách hàng đã dùng dịch vụ cung cấp.
e_ Truyền tin bí mật (Concealed Communication): bởi vì digital watermarking là một dang đặc biệt của che giấu dữ liệu (steganography) nên người ta có thé dùng dé truyền các thông tin bí mật.
1.5 Kết luận chương
Trong chương 1, luận văn đã khảo sát tổng quan về thủy vân số, các đặc tính và phân loại thủy vân số Chương này cũng nghiên cứu quy trình thực hiện thủy vân số và các ứng dụng thực tế của thủy vân số Trên cơ sở các vấn đề nghiên cứu, trong chương 2 luận văn sẽ khảo sát các thuật toán tạo thủy vân SỐ.
Trang 9CHƯƠNG 2: NGHIÊN CỨU CÁC THUẬT TOÁN THỦY VÂN SO
Chương nay luận văn khảo sát một số thuật toán tạo thủy vân số Khảo sát các thuật toán nhúng thủy vân, khảo sát một số phương pháp lựa chọn hệ số nhúng nhằm nâng cao
chất lượng thủy vân; Các thuật toán thủy vân trên ảnh: trên miền DCT, DWT.
2.1 Cơ sở lý thuyết
2.1.1 Các phép biến đổi ảnh
Các phép biến đổi ảnh có thé chia làm hai loại chính, tương ứng với hai loại thủy vân đó là các phép biến đổi dựa vào không gian ảnh và các phép biến đổi trên miền tần số của
- Loc tuyén tinh - Loc phi tuyến
2.1.2 Các toán tử tan số
Phép biến đổi Fourier
Biến đôi Fourier do nhà toán học Joseph Fourier (1768-1830) đưa ra Ông đã chứng minh rang bat cứ một hàm số tuần hoàn nào cũng có thé biến đồi thành tổng vô hạn hoặc
hữu hạn các hàm sin hoặc cos.
Do ảnh số chi là một phan của tin hiệu số và bản chat tín hiệu ảnh số là tín hiệu rời rac do quá trình lay mẫu từ môi trường nên ta sử dụng biến đổi Fourier rời rac (Discrete
Fourier Transform - DFT) trong xử lý ảnh.
Phép biến đổi Cosine rời rac
Phép biến đổi cosine rời rac (Discrete Cosine Transform - DCT) là một phép biến đổi có nhiều ứng dụng trong nén ảnh và đã được sử dụng trong định dạng ảnh JPEG.
Trang 10Phép biến đổi cosine rời rạc (DCT) được Ahmed đưa ra vào năm 1974 Kê từ đó đến nay nó được ứng dụng rộng rãi trong nhiều phương thức mã hóa ảnh khác nhau nhờ hiệu suất gần như tối ưu của nó đối với các ảnh có độ tương quan cao giữa các điểm ảnh lân cận Biến đồi cosine rời rac được sử dụng trong chuẩn nén ảnh JPEG và định dang phim MPEG.
Phép biến đổi cosine một chiều Phép biến đổi sóng con rời rac
Phép biến đổi sóng con rời rac (Discrete Wavelet Tranform - DWT) là một phép biến đổi mới và hứa hẹn có nhiều ứng dụng trong xử lý ảnh số DWT đã được sử dụng trong định
dang ảnh JPEG2000.
Không giống biến đổi Fourier vốn thích hợp với các tín hiệu ổn định, DWT thích hợp cho các tín hiệu không 6n định, có đáp ứng tan số thay đổi theo thời gian.
2.1.3 Các định dạng ảnh
Định dạng ảnh GIF
GIF (Graphics Interchange Format) là một định dang tập tin hình anh bitmap cho các
hình ảnh dùng ít hơn 256 màu sắc khác nhau và các hoạt hình dùng ít hơn 256 màu cho mỗi
khung hình GIF là định dạng nén dữ liệu đặc biệt hữu ích cho việc truyền hình ảnh qua
đường truyền lưu lượng nhỏ Định dạng này được CompuServe cho ra đời vào năm 1987 và nhanh chóng được dùng rộng rãi trên World Wide Web cho đến nay.
Tập tin GIF dùng nén đữ liệu bảo toàn trong đó kích thước tập tin có thé được giảm mà không làm giảm chất lượng hình ảnh, cho những hình anh có ít hơn 256 màu Số lượng tối đa 256 màu làm cho định dạng này không phù hợp cho các hình chụp (thường có nhiều màu sắc) [7], tuy nhiên các kiểu nén dữ liệu bảo toàn cho hình chụp nhiều màu cũng có kích
thước quá lớn đối với truyền dữ liệu trên mạng hiện nay Như vậy, GIF thường được dùng
cho sơ đô, hình vẽ nút bam và các hình ít màu [1].
Định dạng ảnh PNG
PNG (Portable Network Graphics) là một dạng hình ảnh sử dụng phương pháp nén
dữ liệu mới - không làm mất đi đữ liệu gốc PNG được tạo ra nhằm cải thiện và thay thế
định dạng ảnh GIF với một định dạng hình ảnh không đòi hỏi phải có giấy phép sáng chế khi sử dụng PNG được hỗ trợ bởi thư viện tham chiếu libpng, một thư viện nền tảng độc
lập bao gồm các hàm của C đề quản lý các hình ảnh PNG.
Trang 11Những tập tin PNG thường có phần mở rộng là PNG and png và đã được gán kiểu chuẩn MIME là image/png (được công nhận vào ngày 14 tháng 10 năm 1996).
Định dạng ảnh BMP
Trong đồ họa máy vi tính, BMP, còn được biết đến với tên tiếng Anh khác là Windows bitmap, là một định dang tập tin hình ảnh khá phổ biến Các tập tin đồ họa lưu
dưới dạng BMP thường có đuôi là BMP hoặc DIB (Device Independent Bitmap).
Các thuộc tính tiêu biểu của một tập tin ảnh BMP (cũng như file ảnh nói chung) là số bit trên mỗi điểm ảnh (bit per pixel), thường được ký hiệu bởi n Một anh BMP n-bit có 2n màu Giá trị n càng lớn thì ảnh càng có nhiều màu, và càng rõ nét hơn Giá trị tiêu biểu của n là 1 (ảnh đen trắng), 4 (ảnh 16 mau), 8 (ảnh 256 màu), 16 (ảnh 65536 màu) và 24 (ảnh 16 triệu màu) Ảnh BMP 24-bit có chất lượng hình anh trung thực nhất [6].
Cấu trúc tập tin ảnh BMP bao gồm 4 phần:
- Bitmap Header (14 bytes)
- Bitmap Information (40 bytes)
- Color Palette (4*x bytes)- Bitmap Data
Dinh dang anh JPEG
JPEG (Joint Photographic Experts Group) là một trong những phương pháp
nén ảnh hiệu quả, có tỷ lệ nén ảnh tới vài chục lần Tuy nhiên ảnh sau khi giải nén sẽ khác với ảnh ban đầu Chất lượng ảnh bị suy giảm sau khi giải nén Sự suy giảm này tăng dần theo hệ số nén Tuy nhiên sự mất mát thông tin này là có thể chấp nhận được và việc loại bỏ những thông tin không cần thiết được dựa trên những nghiên cứu về hệ nhãn thị của mắt người.
Kỹ thuật nén ảnh JPEG
Một tính chất chung nhất của tất cả các ảnh số đó là tương quan giữa các pixel ở cạnh nhau lớn, điều này dẫn đến dư thừa thông tin dé biểu diễn ảnh Dư thừa thông tin sẽ làm cho việc mã hóa không tối ưu Do đó công việc cần làm để nén ảnh là phải tìm được các biểu
diễn ảnh với tương quan nhỏ nhất dé giảm thiêu độ dư thừa thông tin của ảnh.
2.2 Một số thuật toán thủy vân trên ảnh số
Trang 122.2.1 Thuật toán thủy vân dựa vào các bit có trọng số thấp LSB
Thuật toán này sử dụng các bit có trọng số thấp (Least Significant Bit - LSB) dé giấu
thủy vân.
Các bit có trọng số thấp được hiểu là các bit mà nếu thay đổi giá trị của chúng sẽ ít làm thay đổi đến chất lượng ảnh Ví dụ với ảnh bitmap 256 màu, màu của mỗi điểm ảnh được biểu dién bang 8bit, nếu tat hay déi gia tri thứ 8 cua mã mau thì mã màu chi thay đôi
giá trị có 1 đơn vị nên nhìn chung thì cả bức ảnh không bị ảnh hưởng nhiều Ưu điểm của thuật toán: đơn giản và dung lượng giấu tin cao.
Nhược điểm: kẻ tấn công chỉ cần thay đổi ngẫu nhiên giá trị của các bit có trọng số thấp là thủy vân đã bị phá hủy.
2.2.2Thúy vân ảnh trên miền DCT
Khác với thủy vân dựa trên biến đôi không gian ảnh tương đối dễ bị tan công và phát hiện Năm 1995, Cox đã đưa ra một mô hình khác đó là nhúng thủy vân vào miền tần sé.
Dựa trên mô hình của Cox, năm 1998, Burgett đã áp dụng một thuật toán thủy vân
ảnh dựa vào biến đổi DCT với định dạng JPEG.
Thuật toán của Burgett sẽ chia anh JPEG thành các khối (block) có kích thước 8x8 điểm ảnh Mỗi khối sẽ được biến đổi DCT Thuật toán sẽ chọn ngẫu nhiên các khối dé nhúng thủy van Thủy vân được nhúng trên mỗi khối bằng cách đổi chỗ một cặp hệ số của biến đổi DCT [2][8].
2.2.3Thuật toán thiy vân trên miền DWT
Tương tự như thuật toán thủy vân ảnh trên miền DCT, trong biến đổi DWT, thủy vân
được nhúng vào các dải tân sô cao nhât theo công thức sau: CHF [ij] = CS" [ij] + øA+*[ij] W [iN+j]
ci [ij] = Cết [i,j] + øA"[ij] W [MN+iN+]]
CH [ij] = Co" [ij] + oAHH[i,j] W [2MN+iN+)]
2.2.4Thủy vân dễ vỡ
Thủy vân dễ vỡ (fragile watermark) là một dạng thủy vân đặc biệt Được sử dụng dé đảm bao tính toàn ven thông tin ảnh số Đặc điểm của thủy vân dé vớ là chỉ cần ảnh bị thay đổi thì thủy vân sẽ bị phá hủy Do đó chống lại sự xuyên tạc nội dung của ảnh.