Trong luận văn này, tác giả nghiên cứu và đề xuất các kỹ thuật thủy vân bảo vệ bản quyền ảnh số dựa vào các phép biến đổi rời rạc để tăng cường độ bền vững của thủy vân cũng như đảm bảo
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
Trang 2BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
LUẬN VĂN THẠC SĨ MÁY TÍNH
Người hướng dẫn khoa học: PGS TS Bùi Thế Hồng
HÀ NỘI, 2014
Trang 3LỜI CẢM ƠN
Để hoàn thành luận văn này tôi đã nhận được sự giúp đỡ tận tình của thầy hướng dẫn khoa học, của các thầy cô trường Đại học Sư phạm Hà Nội 2 Tôi xin chân thành cảm ơn các thầy cô trường Đại học Sư phạm Hà Nội 2 đã tạo điều kiện học tập, nghiên cứu và giúp đỡ tôi rất nhiều trong quá trình làm luận văn Đặc biệt tôi xin cảm ơn PGS.TS Bùi Thế Hồng đã tận tình hướng dẫn, chỉ bảo tôi trong suốt quá trình học tập, nghiên cứu đề tài và giúp tôi hoàn thành bản luận văn này
Vĩnh Phúc, ngày 12 tháng 12 năm 2014
Học viên
Hà Thị Lan Hương
Trang 4LỜI CAM ĐOAN
Tôi xin cam đoan đây là kết quả nghiên cứu của tôi dưới sự hướng dẫn khoa học của PGS TS Bùi Thế Hồng
Các số liệu, kết quả nêu trong luận văn là trung thực và chưa từng được
ai công bố trong bất kỳ công trình nào khác
Học viên
Hà Thị Lan Hương
Trang 5MỤC LỤC
MỞ ĐẦU 1
1 Lý do chọn đề tài 1
2 Mục đích nghiên cứu 1
3 Nhiệm vụ nghiên cứu 2
4 Đối tượng và phạm vi nghiên cứu 2
5 Những đóng góp mới của đề tài 2
6 Phương pháp nghiên cứu 2
7 Bố cục của luận văn 3
CHƯƠNG 1 TỔNG QUAN VỀ KỸ THUẬT GIẤU TINVÀ THỦY VÂN TRÊN ẢNH SỐ 4
1.1 Bảo vệ bản quyền ảnh số 4
1.2 Tổng quan về kỹ thuật giấu tin 4
1.3 Tổng quan về ảnh 8
1.3.1 Ảnh 8
1.3.2 Các định dạng ảnh thông dụng 10
1.4 Những yêu cầu cơ bản của hệ thủy vân trên ảnh số 12
1.4.1 Yêu cầu chung 12
1.4.2 Yêu cầu riêng 13
1.5 Những tấn công trên hệ thủy vân 14
1.6 Các ứng dụng của hệ thủy vân 15
1.7 Những khuynh hướng tiếp cận của kỹ thuật thủy vân 17
1.7.1 Hướng tiếp cận dựa trên miền không gian ảnh 17
1.7.2 Hướng tiếp cận sử dụng các phương pháp khảo sát gián tiếp 18
CHƯƠNG 2 KỸ THUẬT THỦY VÂN TRÊN ẢNH SỐ DỰA VÀO CÁC PHÉP BIẾN ĐỔI RỜI RẠC 20
2.1 Một số kỹ thuật bổ trợ cho các kỹ thuật thủy vân số trên ảnh tĩnh 20
Trang 62.1.1 Các phép biến đổi miền không gian ảnh sang miền tần số 20
2.1.2 Kỹ thuật sinh chuỗi giả ngẫu nhiên 24
2.1.3 Các kỹ thuật trải phổ trong truyền thông 25
2.1.4 Các thuật toán kiểm định thủy vân 26
2.2 Các thuật toán thủy vân ảnh số dựa vào các phép biến đổi rời rạc 27
2.2.1 Thủy vân ảnh số dựa vào phép biến đổi Cosine rời rạc 27
2.2.2 Thủy vân ảnh số dựa vào phép biến đổi sóng nhỏ rời rạc 32
2.2.3 Thủy vân ảnh số dựa vào phép biến đổi Fourier rời rạc 36
2.3 Kỹ thuật thủy vân ảnh tĩnh sử dụng kết hợp các phép biến đổi rời rạc 39
2.3.1 Đôi nét về phương pháp kết hợp các phép biến đổi rời rạc 39
2.3.2 Kỹ thuật thủy vân sử dụng phép kết hợp DWT với DCT và hai ma trận số giả ngẫu nhiên vào băng HL 41
CHƯƠNG 3 CÀI ĐẶT CHƯƠNG TRÌNH THỬ NGHIỆM 43
3.1 Các độ đo đánh giá hiệu quả của thủy vân 43
3.1.1 Đánh giá chất lượng của ảnh chủ đã thủy vân 43
3.1.2 Kiểm định chất lượng thủy vân 43
3.2 Kết quả thử nghiệm kỹ thuật thủy vân sử dụng một phép biến đổi 45
3.2.1 Kết quả thử nghiệm kỹ thuật thủy vân sử dụng phép biến đổi DWT 45
3.2.2 Kết quả thử nghiệm kỹ thuật thủy vân sử dụng phép biến đổi DCT 48
3.2.3 So sánh kết quả thử nghiệm kỹ thuật thủy vân sử dụng một phép biến đổi 53
3.3 Kết quả thử nghiệm kỹ thuật thủy vân sử dụng phép kết hợp nhiều phép biến đổi rời rạc 54
3.4 Đánh giá kết quả thử nghiệm 60
KẾT LUẬN VÀ KIẾN NGHỊ 62
TÀI LIỆU THAM KHẢO 63
Trang 7DANH MỤC CÁC CHỮ VIẾT TẮT
DCT Discrete Cosin Transform
DWT Discrete Wavelet Transform
DFT Discrete Fourier Transform
GIF Graphics Interchanger Format
JPEG Joint Photographic Expert Group
LSB Least Significant Bit
RGB Red, Green, Blue
PCX Personal Computer Exchange
LZW Lampel Ziv Welch
Trang 8
DANH MỤC CÁC HÌNH
Hình 1.2 Ví dụ về thuỷ vân hiện (Trên trang Web thư viện số
Ảnh đen trắng sau khi nhúng cùng một lượng thông tin
như ảnh màu, cho chất lượng ảnh kém hơn (xuất hiện
Trang 9để bảo vệ bản quyền cho các bức ảnh số bằng cách tác động trực tiếp lên miền giá trị của các điểm ảnh Các kỹ thuật này thường không đảm bảo được chất lượng của ảnh và không được bền vững trước các tấn công thông thường lên
ảnh Chính vì vậy, tác giả chọn đề tài nghiên cứu “Bảo vệ bản quyền ảnh số
bằng kỹ thuật thủy vân dựa vào các phép biến đổi rời rạc”
Trong luận văn này, tác giả nghiên cứu và đề xuất các kỹ thuật thủy vân bảo vệ bản quyền ảnh số dựa vào các phép biến đổi rời rạc để tăng cường
độ bền vững của thủy vân cũng như đảm bảo được chất lượng của ảnh
2 Mục đích nghiên cứu
Mục tiêu của luận văn là nghiên cứu kỹ thuật thủy vân dựa trên các phép biến đổi rời rạc qua đó phân tích và đánh giá các phương pháp, đưa ra được bài toán áp dụng kỹ thuật thuỷ vân dựa vào các phép biến đổi rời rạc ứng dụng rộng rãi trong thực tiễn
Trang 102
3 Nhiệm vụ nghiên cứu
- Tìm hiểu một số kỹ thuật thuỷ vân bảo vệ bản quyền cho các bức ảnh số
- Nghiên cứu và thử nghiệm các kỹ thuật thuỷ vân ảnh số dựa vào một
số phép biến đổi rời rạc
4 Đối tượng và phạm vi nghiên cứu
- Nghiên cứu, đánh giá kỹ thuật thuỷ vân ảnh số dựa vào các phép biến đổi rời rạc qua đó phát triển và cải tiến các kỹ thuật thủy vân dựa vào phép biến đổi rời rạc
- Các công cụ lập trình và phần mềm dùng để cài đặt các lược đồ nhúng và giải thuỷ vân trên ảnh số
5 Những đóng góp mới của đề tài
- Phát hiện những yêu cầu và thách thức trong thực tế đối với vấn đề kỹ thuật thuỷ vân ảnh số
- Phát triển và cải tiến các kỹ thuật thuỷ vân ảnh số nhằm nâng cao
độ bền vững của thuỷ vân trong ảnh và giảm mức độ ảnh hưởng của thuỷ vân đối với chất lượng của ảnh
- Cài đặt chương trình thử nghiệm thuỷ vân ảnh số dựa vào các phép biến đổi rời rạc
6 Phương pháp nghiên cứu
- Nghiên cứu tổng quan, đánh giá các kỹ thuật thuỷ vân ảnh
- Tìm hiểu và phát hiện các vấn đề trong thực tế, từ đó đưa ra so sánh, đánh giá và các giải pháp khắc phục
- Cài đặt thử nghiệm dựa trên những cải tiến được đưa ra
Trang 113
7 Bố cục của luận văn
Ngoài phần Mở đầu, kết luận và tài liệu tham khảo luận văn gồm 3 chương:
Chương 1: Tổng quan về kỹ thuật giấu tin và thủy vân trên ảnh số Chương 2: Kỹ thuật thủy vân trên ảnh số dựa vào các phép biến đổi rời rạc
Chương 3: Cài đặt chương trình thử nghiệm
Trang 124
CHƯƠNG 1 TỔNG QUAN VỀ KỸ THUẬT GIẤU TIN
VÀ THỦY VÂN TRÊN ẢNH SỐ
1.1 Bảo vệ bản quyền ảnh số
Ngày nay, với sự phát triển của truyền thông và các công cụ hỗ trợ liên quan dẫn đến việc các sản phẩm công nghệ trong đó có ảnh số được truyền tải một cách nhanh chóng và tiện lợi Tuy nhiên, bên cạnh những ưu điểm còn tồn tại những nhược điểm về sự tấn công trên các sản phẩm nhằm thay đổi giá trị sử dụng của chúng Đặc biệt, với các ảnh sự sao chép ngày càng trở nên
dễ dàng thì sự cần thiết của chứng thực bản quyền sở hữu trở thành một vấn
đề cấp thiết Những chủ sở hữu dữ liệu là ảnh số đặt ra yêu cầu cần có một cơ chế xác định cũng như những công cụ hữu ích giúp cho họ có thể bảo vệ tốt quyền sở hữu của mình đối với dữ liệu
Với những yêu cầu trên thì rất nhiều phương pháp đã được đưa ra nhằm giải quyết bài toán Trong đó, thông thường người ta thường chèn thêm các thông tin mang bản quyền tác giả vào trong các ảnh số Nếu có kẻ tấn công sẽ làm hỏng đi ảnh đó hoặc làm thay đổi giá trị của thông tin được nhúng vào
Thông thường, để bảo vệ bản quyền của các dữ liệu thì người chủ sở hữu sẽ đăng ký dữ liệu đó với một cơ quan có thẩm quyền và có khả năng chứng thực quyền sở hữu của họ đối với dữ liệu trên
1.2 Tổng quan về kỹ thuật giấu tin
Steganography có nguồn gốc từ tiếng Hy Lạp và được sử dụng tới ngày nay, nó có nghĩa là “tài liệu được phủ” (covered writing) Các câu chuyện kể
về kỹ thuật giấu thông tin đã có từ rất lâu Những tài liệu tìm thấy ghi chép về
kỹ thuật giấu thông tin sớm nhất thuộc về sử gia Hy Lạp Herodotus (khoảng năm 440 trước Công nguyên) Khi bạo chúa Hy Lạp Histiaeus bị vua Darius
Trang 135
bắt giữ ở Susa vào thế kỷ thứ 5 trước Công nguyên, ông ta đã cố gửi thông báo bí mật cho con rể của mình là Aristagoras ở Miletus Histiaeus đã cạo trọc đầu của một nô lệ tin cậy và xăm một thông báo trên da đầu của người nô lệ
đó Khi tóc của người nô lệ mọc đủ dài, anh ta được gửi tới Miletus
Giấu thông tin là một kỹ thuật nhúng (giấu) một lượng thông tin số nào
đó vào một đối tượng dữ liệu số khác Kỹ thuật giấu thông tin nhằm mục đích đảm bảo an toàn và bảo mật thông tin ở cả hai khía cạnh Một là bảo mật cho
dữ liệu được đem giấu, hai là bảo mật cho chính đối tượng được dùng để giấu tin Điều này dẫn đến hai khuynh hướng chủ yếu của giấu tin:
Khuynh hướng thứ nhất là giấu tin mật (steganography) Khuynh hướng này tập trung vào các kỹ thuật giấu tin sao cho thông tin giấu được nhiều và quan trọng là người khác khó phát hiện dược một đối tượng có bị giấu tin bên trong hay không
Khuynh hướng thứ hai là thủy vân số (watermarking) Khuynh hướng thủy vân số đánh giấu vào đối tượng nhằm khẳng định bản quyền quyền sở hữu hay phát hiện sự xuyên tạc thông tin
Watermarking (thuỷ vân, thuỷ ấn) là kỹ thuật nhúng một biểu tượng vào trong ảnh môi trường để xác định quyền sở hữu ảnh môi trường, chống sự giả mạo và xuyên tạc thông tin
Trong kỹ thuật giấu tin mật, thông tin cần giấu được gọi là thông điệp (message) còn trong kỹ thuật thuỷ vân số thì được gọi là thuỷ vân (watermark) Thuỷ vân có thể là một chuỗi các kí tự, hay một hình ảnh, logo nào đó
Nói đến thuỷ vân số là nói đến kỹ thuật giấu tin nhắm đến những ứng dụng bảo đảm an toàn dữ liệu cho đối tượng được sử dụng để giấu tin như: bảo vệ bản quyền, chống xuyên tạc, nhận thực thông tin, điều khiển sao chép v.v… Có thể thấy rõ là phần ứng dụng của thủy vân rất lớn, mỗi ứng dụng lại
Trang 146
có những yêu cầu riêng và tính chất riêng, do đó các kỹ thuật thuỷ vân cũng
có những tính năng khác biệt tương ứng:
Hình 1.1 Phân loại các kỹ thuật thuỷ vân
Các kỹ thuật thuỷ vân trên Hình 1.1 được phân biệt nhau bởi những đặc trưng, tính chất của từng kỹ thuật và ứng dụng những kỹ thuật đó
Thuỷ vân “dễ vỡ” (fragile) là kỹ thuật nhúng thuỷ vân vào trong ảnh sao cho khi phân bố sản phẩm trong môi trường mở nếu có bất cứ một phép biến đổi nào làm thay đổi đối tượng sản phẩm gốc thì thuỷ vân đã được giấu trong đối tượng sẽ không còn nguyên vẹn như trước khi giấu nữa (dễ vỡ) Thủy vân dễ vỡ yêu cầu thông tin giấu sẽ bị sai lệch nếu có bất kỳ sự thay đổi nào trên dữ liệu chứa Các kỹ thuật thuỷ vân có tính chất này được sử dụng trong các ứng dụng nhận thực thông tin (authentication) và phát hiện xuyên tạc thông tin (tamper detection) Ví dụ như để bảo vệ chống xuyên tạc một ảnh nào đó ta nhúng một thuỷ vân vào trong ảnh và sau đó phân phối, quảng
bá ảnh đó Khi cần kiểm tra lại ảnh ta sử dụng hệ thống đọc thủy vân Nếu không đọc được thuỷ vân hoặc thuỷ vân đã bị sai lệch nhiều so với thuỷ vân ban đầu đã nhúng vào ảnh thì có nghĩa là có thể ảnh đó đã bị thay đổi Cái khó
Robust Copyright marking Thuỷ vân bền vững
Imperceptible Watermarking Thuỷ vân ẩn
Watermarking Thuỷ vân số
Fragile Watermarking Thuỷ vân “dễ vỡ”
Visible Watermarking Thuỷ vân hiện
Trang 15Thuỷ vân bền vững lại được chia thành hai loại là thuỷ vân ẩn và thuỷ vân hiện Thuỷ vân hiện là loại thuỷ vân được hiện ngay trên sản phẩm và người dùng có thể nhìn thấy được giống như các biểu tượng kênh chương trình vô tuyến mà ta thường thấy VTV3, CCTV, TV5… Các thuỷ vân hiện trên ảnh thường dưới dạng chìm, mờ hoặc trong suốt để không gây ảnh hưởng đến chất lượng ảnh gốc Đối với thuỷ vân hiện, thông tin bản quyền hiển thị ngay trên sản phẩm
Hình 1.2 Ví dụ về thuỷ vân hiện (Trên trang Web thư viện số của Mỹ)
Trang 168
Hình 1.3 Ảnh Lena đã được nhúng thuỷ vân là logo ở hình bên phải
Còn đối với thuỷ vân ẩn thì cũng giống như giấu tin, bằng mắt thường không thể nhìn thấy thuỷ vân Đây cũng là nội dung chính được trình bày trong luận văn này Trong vấn đề bảo vệ bản quyền, thuỷ vân ẩn mang tính
“bất ngờ” hơn trong việc phát hiện sản phẩm bị đánh cắp Trong trường hợp này, người chủ sở hữu hợp pháp sẽ chỉ ra bằng chứng là thuỷ vân đã được nhúng trong sản phẩm bị đánh cắp
1.3 Tổng quan về ảnh
Trong các phần đã trình bày ở trên có nhắc đến thủy vân, để có thể xác định thủy vân ảnh được chính xác ta cần tìm hiểu kỹ hơn về các vấn đề liên quan đến ảnh Trong phần này, trình bày một số vấn đề cơ bản của ảnh
1.3.1 Ảnh
Là một tập hợp hữu hạn các điểm ảnh kề nhau Ảnh thường được biểu diễn bằng một ma trận hai chiều, mỗi phần tử của ma trận tương ứng với một điểm ảnh
Ảnh nhị phân (đen trắng): là ảnh có giá trị mức xám của các điểm ảnh được biểu diễn bằng 1 bit (giá trị 0 hoặc 1)
Ảnh xám: giá trị mức xám của các điểm ảnh được biểu diễn bằng 8 bit (giá trị từ 0 đến 255)
Ảnh màu: thông thường, ảnh màu được tạo nên từ 3 ảnh xám đối với màu nền đỏ (RED), xanh lá cây (GREEN), xanh lam (BLUE) Tất cả các màu trong tự nhiêu đều có thể được tổng hợp từ 3 thành phần màu trên theo các tỷ
lệ khác nhau Sự khác nhau giữa giấu thông tin trong ảnh đen trắng và ảnh
màu được thể hiện qua bảng sau:
Trang 179
Thông tin nhúng ít hơn so với ảnh
màu có cùng kích cỡ Thông tin nhúng nhiều hơn
Khả năng bị phát hiện trong ảnh có
nhúng thông tin cao hơn ảnh màu Khả năng bị phát hiện thấp
Độ an toàn thông tin thấp do dễ bị
phát hiện có thông tin chứa bên trong Độ an toàn cao
Các thuật toán thường phức tạp và
không nhiều
Nhiều thuật toán và có nhiều hướng
mở rộng phát triển (như áp dụng giải thuật di truyền)
a) Ảnh 256 màu gốc 227 x 149 b) Ảnh sau khi giấu 100 bit tin
Hình1.4 Ảnh màu sau khi nhúng tin rất khó phát hiện sự thay đổi
a) Ảnh đen trắng gốc 480 x 480 b) Ảnh sau khi nhúng 100 bit tin
Hình 1.5 Ảnh đen trắng sau khi nhúng cùng một lượng thông tin như ảnh màu, cho chất lượng ảnh kém hơn (xuất hiện nhiều chấm đen lạ)
Trang 18Ảnh IMG là ảnh đen trắng, mỗi điểm ảnh được thể hiện bởi 1 bit Toàn
bộ ảnh chỉ gồm các điểm sáng và tối tương ứng với giá trị 1 hoặc 0
Tỉ lệ nén của kiểu định dạng này là khá cao Ảnh IMG được nén theo từng dòng Mỗi dòng bao gồm các gói (Pack) Các dòng giống nhau được nén thành một gói
* Định dạng ảnh: PCX (Personal Computer Exchange)
Định dạng ảnh PCX là một trong những định dạng loại cổ điển nhất
Nó sử dụng phương pháp mã hóa loạt dài RLC để nén dữ liệu ảnh Quá trình nén và giải nén được thực hiện trên từng dòng ảnh Thực tế, phương pháp giải nén PCX kém hiệu quả hơn so với kiểu IMG
Định dạng ảnh PCX thường được dùng để lưu trữ ảnh vì thao tác đơn giản, cho phép nén và giải nén nhanh Tuy nhiên vì cấu trúc của nó cố định, nên trong một số trường hợp nó làm tăng kích thước lưu trữ
* Định dạng ảnh: GIF (Graphics Interchanger Format)
Định dạng ảnh GIF do hãng Computer Incorporated (Mỹ) đề xuất lần đầu tiên vào năm 1990 Với định dạng GIF, khi số màu trong ảnh càng tăng, thì ưu thế của định dạng GIF càng nổi trội Những ưu thế này có được là do GIF tiếp cận các thuật toán LZW (Lampel Ziv Welch) (dựa vào sự lặp lại của một nhóm điểm, người ta xây dựng từ điển lưu các chuỗi ký tự có tần suất lặp lại cao và thay thế bằng từ mã tương ứng mỗi khi gặp lại chúng) Dạng ảnh GIF cho chất lượng cao, độ phân giải đồ họa tốt, cho phép hiển thị trên hầu hết các phần cứng đồ họa
Trang 1911
* Định dạng ảnh: BMP (Bitmap)
Ảnh BMP (Bitmap) được phát triển bởi Microsoft Corporation, được lưu trữ dưới dạng độc lập thiết bị cho phép Windows hiển thị dữ liệu không phụ thuộc vào khung chỉ định màu trên bất kỳ phần cứng nào Tên file mở rộng mặc định của một file ảnh Bitmap là BMP, nét vẽ được thể hiện là các điểm ảnh Qui ước màu đen, trắng tương ứng với các giá trị 0, 1 Ảnh BMP được sử dụng trên Microsoft Windows và các ứng dụng chạy trên Windows
từ version 3.0 trở lên BMP thuộc loại ảnh mảnh
Có rất nhiều định dạng ảnh thuộc kiểu bitmap như BMP, PCX, TIFF, GIF, JPEG, TGA, PNG, PCD…Mỗi file ảnh BMP gồm bốn phần:
Bitmap Header (14 bytes): giúp nhận dạng tập tin bitmap
Bitmap Information (40 bytes): chứa một số thông tin chi tiết giúp hiển thị ảnh
Palette màu (4*x bytes), x là số màu của ảnh: định nghĩa các màu sẽ được sử dụng trong ảnh
Bitmap Data: Chứa dữ liệu ảnh
Đặc điểm nổi bật nhất của định dạng BMP là tập tin ảnh thường không được nén bằng bất kỳ thuật toán nào Khi lưu ảnh, các điểm ảnh được ghi trực tiếp vào tập tin - một điểm ảnh sẽ được mô tả bởi một hay nhiều byte tùy thuộc vào giá trị n của ảnh Do đó, một hình ảnh lưu dưới dạng BMP thường
có kích cỡ rất lớn, gấp nhiều lần so với các ảnh được nén (chẳng hạn GIF, JPEG hay PNG)
* Định dạng ảnh: JPEG (Joint Photographic Expert Group)
Một nhóm các nhà nghiên cứu đã phát minh ra định dạng này, để hiển thị các hình ảnh đầy đủ màu hơn (full-colour) cho định dạng di động, mà kích thước file lại nhỏ hơn Giống như ảnh GIF, JPEG cũng được sử dụng nhiều trên Web
Trang 20Ảnh JPEG không thể làm trong suốt hoặc chuyển động, trong trường hợp này ta sẽ sử dụng định dạng GIF (hoặc định dạng PNG để tạo trong suốt) Tạo ảnh JPEG Fast-Loading:
Giống như với các ảnh GIF, để tạo hình JPEG nhỏ đến mức có thể (tính theo bytes) để website tải nhanh hơn Điều chỉnh chính để thay đổi kích thước file JPEG được gọi là quality, và thường có giá trị từ 0 tới 100%, khi 0% thì chất lượng là thấp nhất (nhưng kích thước file là nhỏ nhất), và 100% thì chất lượng cao nhất (nhưng kích thước file là lớn nhất) 0% chất lượng JPEG sẽ nhìn rất mờ khi so sánh với ảnh gốc Còn 100% chất lượng JPEG thường không phân biệt được so với ảnh gốc
1.4 Những yêu cầu cơ bản của hệ thủy vân trên ảnh số
1.4.1 Yêu cầu chung
Hệ thuỷ vân số trên ảnh số cũng là một hệ giấu tin nên cũng có một số đặc điểm và tính chất giống như giấu tin trong ảnh như:
- Phương tiện chứa là ảnh hai chiều tĩnh
- Thuỷ vân trên ảnh tác động lên dữ liệu ảnh nhưng không làm thay đổi kích thước ảnh
- Kỹ thuật giấu phụ thuộc vào tính chất của hệ thống thị giác con người
- Khi giải tin có thể cần ảnh gốc
Trang 2113
1.4.2 Yêu cầu riêng
Kỹ thuật thuỷ vân số còn có một số đặc trưng phân biệt với kỹ thuật giấu tin mật như sau:
* Thông tin trong ảnh có thể bị biến đổi nếu có bất cứ một biến đổi nào trên ảnh?
Tính chất này có trong kỹ thuật giấu tin mật nhưng đối với kỹ thuật thuỷ vân thì tính chất này chỉ có trong loại thuỷ vân “dễ vỡ” Còn đối với loại thuỷ vân “bền vững” thì lại yêu cầu thông tin trong ảnh chống lại được những phép biến đổi thông thường trên ảnh
* Thuỷ vân ẩn hay thuỷ vân hiện?
Đối với giấu tin mật thì yêu cầu thông điệp đem giấu phải ẩn bên trong ảnh sao cho mắt thường không nhìn thấy được, còn thuỷ vân số thì lại có hai loại là thuỷ vân ẩn và thuỷ vân hiện Thuỷ vân ẩn thì mắt thường không nhìn thấy được, nó được sử dụng với mục đích gài bí mật các thông tin trong ảnh
để xác nhận chủ quyền của bức ảnh Thuỷ vân hiện thì cho phép nhìn thấy thông tin đem nhúng vào, nó được sử dụng cho mục đích công bố công khai
về chủ quyền sở hữu
* Tính chất bền vững
Đây là tính chất quan trọng nhất của hệ thuỷ vân bền vững Nghĩa là hệ thuỷ vân phải chống lại được các phép biến đổi, hay tấn công có chủ đích hoặc không có chủ đích lên thuỷ vân
* Thuỷ vân cái gì?
Thông tin gì được giấu bên trong ảnh?
Thông thường để bảo vệ bản quyền tác giả thì người ta hay nhúng vào trong ảnh một chuỗi ký tự mang những thông tin về tác giả như tên tác giả, tiêu đề, ngày tháng năm,… Tuy nhiên chuỗi ký tự lại bị một hạn chế là mỗi
ký tự được biểu diễn bằng nhiều bit, nếu một bit bị lỗi thì sẽ làm sai cả chuỗi
Trang 22Thông tin nhúng trong ảnh có thể là một chuỗi bit sinh ngẫu nhiên theo một luật phân phối xác suất nào đó, sau đó áp dụng các lí thuyết xác suất thống kê để chứng thực thuỷ vân
Trong các loại thuỷ vân thì thuỷ vân ẩn và bền vững được quan tâm nghiên cứu nhiều hơn vì nó có nhiều ứng dụng lớn Đây cũng là tính chất quan trọng đang được nghiên cứu nhưng đây cũng lại là mấu chốt của sự phức tạp vì hai thuộc tính này mâu thuẫn với nhau Sự mâu thuẫn này được thể hiện
ở chỗ:
+ Để đảm bảo tính chất ẩn thì thủy vân phải được giấu ở những vị trí ít
có ý nghĩa tri giác nhất, ít bị chú ý nhất
+ Để đảm bảo tính chất bền vững thì thuỷ vân phải chịu được những phép xử lý ảnh phổ biến như dịch chuyển ảnh hay nén JPEG Ví dụ, trong phép nén JPEG sẽ loại bỏ ở ảnh những thông tin ít có tính tri giác nhất để làm giảm kích thước của ảnh nhưng vẫn đảm bảo được chất lượng ảnh Khi đó những dữ liệu thuỷ vân nằm trong vùng này sẽ bị mất đi hoặc bị biến đổi sai lệch hoàn toàn Với tính chất phức tạp của yêu cầu cho một hệ thuỷ vân, ta sẽ tìm hiểu những giải pháp kỹ thuật thuỷ vân đã được đưa ra của các nhà khoa học trên thế giới
1.5 Những tấn công trên hệ thủy vân
Phương pháp thủy vân phải chống lại một số phép xử lý ảnh thông thường (ví dụ như lỗi khi ảnh truyền đi, nén ảnh, ) và một số tấn công có chủ
Trang 2315
đích nhằm xuyên tác, phá hoại bức ảnh Trong thực tế thì thủy vân phải cân đối giữa tính bền vững với các tính chất khác như lượng thông tin dấu, tính ẩn… Dựa trên yêu cầu thực tế của ứng dụng, người ta sẽ lựa chọn phương pháp thủy vân thích hợp nhất
Từ những biến đổi có chủ đích hay không có chủ đích đã biết với hệ thủy vân mà ta có thể phân biệt thành hai nhóm xuyên tạc sau: Một là các biến đổi xem như là nhiễu với dữ liệu, hai là làm mất tính đồng bộ để không thể lấy tin ra được Một vài phép biến đổi thường gặp:
- Biến đổi tín hiệu: Làm sắc nét, thay đổi độ tương phản, màu,
- Nhiễu cộng, nhiễu nhân,…
- Lọc tuyến tính
- Nén mất thông tin
- Biến đổi affine cục bộ hoặc toàn cục
- Giảm dữ liệu: Cropping, sửa histogram
- Chuyển mã (gif → Jpeg)
- Chuyển đổi tương tự - số
- Thuỷ vân nhiều lần
Nguyên tắc cơ bản của phương pháp thuỷ vân là đảm bảo đủ tính bền vững sao cho các tấn công không làm cho giá trị thương mại của ảnh gốc bị ảnh hưởng
1.6 Các ứng dụng của hệ thủy vân
* Bảo vệ bản quyền tác giả (Copyright protection)
Đây là ứng dụng cơ bản nhất của kỹ thuật thuỷ vân số, một dạng của phương pháp giấu tin Một thông tin nào đó mang ý nghĩa quyền sở hữu tác giả được nhúng vào trong sản phẩm (ảnh, âm thanh, video ), thuỷ vân đó chỉ
có một mình người chủ sở hữu hợp pháp các sản phẩm đó có và được làm minh chứng cho bản quyền sản phẩm Để bảo vệ các sản phẩm chống lại hành
Trang 2416
vi lấy cắp hoặc làm nhái cần phải có có một kỹ thuật để “dán tem bản quyền” vào sản phẩm này Việc dán tem hay chính là việc nhúng thuỷ vân cần phải đảm bảo không để lại một ảnh hưởng lớn nào đến việc cảm nhận sản phẩm
Yêu cầu kỹ thuật đối với ứng dụng này là thuỷ vân phải tồn tại bền vững cùng với sản phẩm, muốn huỷ bỏ thuỷ vân mà không được phép của người chủ sở hữu thì chỉ còn cách là phá huỷ sản phẩm
* Nhận thực và phát hiện xuyên tạc thông tin (authentication and tamper detection)
Một tập thông tin sẽ được giấu trong sản phẩm, sau đó các thông tin này sẽ được tách ra khỏi sản phẩm và so sánh với thông tin ban đầu Nếu thông tin ban đầu và thông tin thu được sau khi tách có sự khác biệt thì chứng
tỏ sản phẩm đó đã bị thay đổi, xuyên tạc Trong trường hợp này các thuỷ vân thường có dạng ẩn để trách sự tò mò, phát hiện của đối phương, nếu có bị lộ thì khó làm giả hay xuyên tạc thông tin
* Lấy dấu vân tay hay dán nhãn (fingerprinting or labeling)
Thuỷ vân trong những ứng dụng này được sử dụng để nhận diện người gửi hay nhận một thông tin nào đó Ví dụ như các vân khác nhau sẽ được nhúng vào các bản copy khác nhau của thông tin gốc trước khi chuyển cho nhiều người Với những ứng dụng này thì yêu cầu là đảm bảo độ an toàn cao cho các thuỷ vân, tránh bị xoá hoặc thay đổi trong quá trình phân phối
* Kiểm soát sao chép (copy control)
Các thuỷ vân trong các trường hợp này được sử dụng để kiểm soát sao chép không hợp lệ đối với các sản phẩm kỹ thuật số Các thiết bị phát hiện thuỷ vân (ở đây sử dụng phương pháp phát hiện thuỷ vân đã giấu mà không cần thông tin gốc) được gắn sẵn vào trong các hệ thống đọc ghi, tuỳ thuộc vào việc có thuỷ vân hay không để điều khiển (cho phép/cấm) truy cập.Ví dụ như
hệ thống quản lý sao chép DVD đã được ứng dụng ở Nhật Các ứng dụng loại này yêu cầu thuỷ vân phải được bảo đảm an toàn
Trang 2517
* Điều khiển thiết bị (Device control)
Các thiết bị phát hiện thuỷ vân (ở đây sử dụng phương pháp phát hiện thuỷ vân đã giấu mà không cần thông tin gốc) được gắn sẵn vào trong các hệ thống đọc ghi, tùy thuộc vào việc có thủy vân hay không để điều khiển (cho phép/cấm) truy cập Ví dụ như hệ thống quản lí sao chép DVD đã được ứng dụng ở Nhật Nhà sản xuất sẽ trang bị cho các phương tiện dùng để nhân bản (như CD writer…) khả năng phát hiện xem digital media có chứa thủy vân hay không, nếu có thì sẽ từ chối không nhân bản
* Theo dõi quá trình sử dụng (Tracking)
Thủy vân số có thể được dùng để theo dõi quá trình sử dụng của các digital media Mỗi bản sao của sản phẩm được chứa bằng một thủy vân duy nhất dùng để xác định user là ai Nếu có sự nhân bản bất hợp pháp, ta có thể truy ra người vi phạm nhờ vào thủy vân được chứa bên trong các phương tiện này
* Theo dõi truyền thông (Broadcast Monitoring)
Các công ty truyền thông và quảng cáo có thể dùng kỹ thuật thủy vân
số để quản lý xem có bao nhiêu khách hàng đã dùng dịch vụ mà họ cung cấp
* Truyền tin bí mật (Concealed Communication)
Bởi vì thủy vân số là một dạng đặc biệt của việc che dấu dữ liệu (steganography) nên người ta có thể dùng để truyền các thông tin bí mật 1.7 Những khuynh hướng tiếp cận của kỹ thuật thủy vân
Có thể chia các kỹ thuật thuỷ vân theo hai hướng tiếp cận chính:
1.7.1 Hướng tiếp cận dựa trên miền không gian ảnh
Đây là hướng tiếp cận cơ bản và tự nhiên trong số các kỹ thuật thuỷ vân Miền không gian ảnh là miền dữ liệu ảnh gốc Tác động lên miền không gian ảnh chính là tác động lên các điểm ảnh, thay đổi giá trị trực tiếp của điểm ảnh Đây là hướng tiếp cận tự nhiên bởi vì khi nói đến việc giấu tin trong ảnh người ta thường nghĩ ngay đến việc thay đổi giá trị các điểm ảnh nguồn
Trang 2618
Ý tưởng cơ bản của phương pháp thay thế bit ít quan trọng nhất LSB (Least Significant Bit) là chọn ra từ mỗi điểm ảnh các bit có ít ý nghĩa nhất về mặt tri giác để sử dụng cho việc giấu tin Việc bit nào được coi là ít tri giác nhất và bao nhiêu bit có thể được lấy ra để thay thế đều phụ thuộc vào tính chất hệ thống thị giác của con người và nhu cầu về chất lượng ảnh trong các ứng dụng Ví dụ, trong ảnh 24 bit, mỗi màu được biểu diễn bởi 24 bit tương ứng với ba màu RGB, mỗi màu chiếm 1 byte Người ta sử dụng một tính chất của mắt người là sự cảm nhận về màu B (Blue) kém hơn so với hai màu R (Red) và G (Green), chính vì thế bit cuối cùng trong 8 bit biểu diễn màu B của mỗi điểm ảnh thường được chọn để giấu tin Thay đổi bit cuối cùng trong 8 bit biểu diễn màu B chỉ làm cho giá trị biểu diễn màu B tăng hoặc giảm đi 1 đơn vị Do vậy, các bit ít quan trọng nhất trong trường hợp này là bit thứ 24 của mỗi điểm ảnh
Tuy nhiên, phương pháp này cũng có nhiều hạn chế, chẳng hạn như không đảm bảo được tính bền vững của thuỷ vân đối với các thao tác như quay ảnh hoặc nén ảnh JPEG Điều này là dễ hiểu vì các thao tác nói trên cũng loại bỏ hoặc làm sai lệch các bit ít quan trọng nhất
1.7.2 Hướng tiếp cận sử dụng các phương pháp khảo sát gián tiếp
Hướng tiếp cận dựa trên miền không gian ảnh như đã trình bày ở trên là cách tiến hành khảo sát tín hiệu và hệ thống rời rạc một cách trực tiếp trên miền giá trị rời rạc của các điểm ảnh gọi là trên miền biến số độc lập tự nhiên Nhưng trong nhiều trường hợp, cách khảo sát trực tiếp này gặp phải những khó khăn nhất định hoặc rất phức tạp và hiệu quả không cao
Ngoài phương pháp khảo sát trực tiếp, ta có thể dùng nhiều phương
pháp khảo sát gián tiếp khác thông qua các kỹ thuật biến đổi (phương pháp
tiếp cận dựa trên miền tần số của ảnh) Các biến đổi này làm nhiệm vụ
Trang 2719
chuyển miền biến số độc lập sang các miền khác và như vậy tín hiệu và hệ thống rời rạc sẽ được biểu diễn trong các miền mới với các biến số mới
Mỗi cách biến đổi sẽ có những thuận lợi riêng, tùy từng trường hợp mà
sử dụng biến đổi nào Sau khi khảo sát, biến đổi xong các tín hiệu và hệ thống rời rạc trong miền các biến số mới này, nếu cần thiết có thể dùng các biến đổi ngược để đưa chúng về miền biến số độc lập
Phương pháp khảo sát gián tiếp sẽ làm đơn giản rất nhiều các công việc
mà ta gặp phải khi dùng phương pháp khảo sát trực tiếp trong miền biến số độc lập tự nhiên
Trang 282.1.1.1 Phép biến đổi Fourier rời rạc
Phép biến đổi Fourier rời rạc viết tắt là DFT (Discrete Fourier Transform) là một công cụ toán học được dùng để chuyển cách biểu diễn tín hiệu và hệ thống rời rạc hoặc liên tục sang miền tần số rời rạc Thực chất của cách biểu diễn này là lấy từng điểm rời rạc trên vòng tròn đơn vị trong mặt phẳng Z để biểu diễn Việc biểu diễn trong miền tần số rời rạc đặc biệt hiệu quả khi xuất hiện các thuật toán tính toán nhanh DFT ta gọi là phép biến đổi Fourier nhanh FFT(Fast Fourier Transform)
* Định nghĩa phép biến đổi Fourier rời rạc cho tín hiệu hai chiều (ảnh số)
Biến đổi Fourier rời rạc của một ảnh MxN:{u(m,n)} được định nghĩa như sau:
0 1
0
ln
) , ((
N
m N
n
N km
w n m
u Với 0<=l, k<=N-1
Trang 2921
Và biến đổi ngược:
0 1
0
) , (
l
km
w l k v
N Với 0<=m, n<=N-1 2.1.1.2 Phép biến đổi sóng nhỏ rời rạc
Đây là phép biến đổi mới nhất áp dụng cho ảnh số Ý tưởng của DWT (Discrete wavelet transform) cho tín hiệu một chiều như sau: Tín hiệu được chia thành hai phần, phần tần số cao và phần tần số thấp Hầu hết năng lượng được tập trung ở phần góc cạnh hoặc có kết cấu và thuộc thành phần có tần số cao Thành phần có tần số thấp lại được chia thành hai phần có tần số cao và tần số thấp Với các bài toán nén và thủy vân ta chỉ cần áp dụng không quá 5 lần bước phân chia trên Ngoài ra từ các hệ số DWT, ta có thể tạo lại ảnh ban đầu bằng quá trình DWT ngược hay IDWT
Ta có thể mô tả bằng toán học DWT và IDWT như sau:
Các hệ sốf j low0 (k) f j high0 (k) f j low01(k).f j high0 1(k)…f j high (k) được gọi là các hệ
số của tín hiệu F(n), với f j low0 (k) là phần phân giải nhỏ nhất (xấp xỉ) của F(n) và
Trang 30Biến đổi sóng có rất nhiều lợi thế so với các biến đổi khác, đó chính là:
- Biến đổi sóng lăn là một mô tả đa độ phân giải của ảnh Quá trình giải
mã có thể được xử lý tuần tự từ độ phân giải thấp cho đến độ phân giải cao
- Biến đổi DWT gần gũi với hệ thống thị giác người hơn biến đổi DCT
vì vậy, có thể nén với tỉ lệ cao bằng DWT mà sự biến đổi ảnh khó nhận thấy hơn nếu dùng DCT với tỉ lệ tương tự
- Biến đổi sóng tạo ra một cấu trúc được gọi là biểu diễn tỉ lệ không gian (scale-space representation)
2.1.1.3 Phép biến đổi cosin rời rạc
Biến đổi cosin rời rạc viết tắt là DCT (Discrete Cosin Transform) được đưa ra bởi Ahmed và các đồng nghiệp của ông vào năm 1974 Từ đó cho đến nay, nó được sử dụng rất phổ biến trong nhiều kỹ thuật xử lý ảnh số nói riêng
và xử lý tín hiệu số nói chung Trong các kỹ thuật thủy vân ảnh dựa trên phép biến đổi dữ liệu ảnh sang miền tần số cho phép biến đổi DCT cũng được sử dụng nhiều nhất Lý do bởi đây là phép biến đổi DCT đã được dùng trong dạng chuẩn ảnh JPEG Nếu áp dụng DCT thì cũng theo chuẩn của JPEG và do
đó sẽ tránh được mất thủy vân do phép nén JPEG
* Định nghĩa biến đổi cosin rời rạc hai chiều:
Biến đổi DCT hai chiều tổng quát là biến đổi trên khối hai chiều bất kỳ M*N, trong đó các khối kích thước 8x8, 16x16 được sử dụng nhiều nhất Tuy nhiên, chúng ta sẽ tìm hiểu phép biến đổi DCT trên khối 8x8 được sử dụng trong chuẩn nén ảnh JPG
Trang 31) 16
) 1 2 ( cos(
) 16
) 1 2 ( cos(
) , ( 4
) ( ) ( )
,
(
v l u
k l
k X v
u v
u
I(u,v) được gọi là hệ số DCT và là số thực
Còn biến đổi ngược IDCT được định nghĩa như sau:
0
) 16
) 1 2 ( cos(
) 16
) 1 2 ( cos(
) , ( 4
) ( ) ( )
,
(
v l u
k v
u I v u l
1 )
1 )
* Đặc điểm của phép biến đổi DCT trên ảnh hai chiều:
- Thể hiện về đặc tính nội dung về tần số của thông tin ảnh Hệ số góc trên là số lớn đặc trưng cho giá trị trung bình, thành phần một chiều gọi là hệ
số DC, còn các hệ số khác có giá trị nhỏ hơn biểu diễn cho các thành phần tần
số cao theo hướng ngang và theo hướng thẳng đứng gọi là các hệ số AC
Hình 2.1 Ảnh gốc và năng lượng phân bố của ảnh qua phép biến đổi DCT
- Bản thân biến đổi DCT không nén được dữ liệu vì cũng sinh ra 64 hệ số
- Khi biến đổi chi tiết giữa các điểm ảnh càng lớn theo một hướng nào
đó trong khối các điểm ảnh, hướng ngang, hướng thẳng đứng hay theo hướng chéo, thì tương ứng theo các hướng đó, các hệ số biến đổi DCT cũng lớn
Trang 3224
- Tóm lại, DCT làm giảm độ tương quan không gian của thông tin trong khối ảnh Điều đó cho phép biểu diễn thích hợp ở miền DCT có các hệ
số DCT có xu hướng có phần dư thừa ít hơn
- Khối hệ số DCT có thể chia thành 3 miền, miền tần số thấp, chứa các thông tin quan trọng ảnh hưởng đến tri giác, miền tần số giữa và miền tần số cao Các thông tin trong miền tần số cao thường không mang tính tri giác cao, khi nén JPEG thì thường loại bỏ thông tin trong miền này
Hình 2.2 Phân chia 3 miền tần số ảnh của phép biến đổi DCT
(a) Miền tần số thấp, (b) Miền tần số ở giữa, (c) Miền tần số cao
Trong các thuật toán thủy vân, miền hệ số DCT tần số cao thường không được sử dụng do nó thường không bền vững với các phép xử lý ảnh; hoặc nén ảnh JPEG Miền tần số thấp cũng khó được sử dụng do một sự thay đổi dù nhỏ trong miền này cũng dẫn đến chất lượng tri giác của ảnh Vì vậy, miền tần số ở giữa hay được sử dụng nhiều nhất và cũng cho kết quả tốt nhất Trong thuật toán đề xuất cũng sử dụng miền tần số ở giữa
2.1.2 Kỹ thuật sinh chuỗi giả ngẫu nhiên
Như đã trình bày ở phần trên, thủy vân có thể là ảnh, text hay một chuỗi bit được sinh ngẫu nhiên Kỹ thuật sinh chuỗi giả ngẫu nhiên thường được sử dụng để tạo thủy vân dựa trên phương pháp thống kê Tại sao lại là giả ngẫu nhiên (pseudo-random)? Vì không có cách nào để tạo ra các chuỗi
Trang 332.1.3 Các kỹ thuật trải phổ trong truyền thông
Kỹ thuật trải phổ trong truyền thông (spread-spectrum communication)
có thể được mô tả một cách sơ lược như sau:
Từ một máy phát A muốn truyền một thông tin M trên một kênh truyền đến máy thu B, người ta chia thông tin M ra thành n gói thông tin nhỏ {s1,s2,…sn}, trước khi đưa lên kênh truyền dẫn mỗi gói tin nhỏ si được trải phổ bằng một mã trải phổ giả nhiễu Mã trải phổ giả nhiễu này phải được xác định và cung cấp cho bên thu để bên thu nén phổ để lấy tin ra Kết quả của việc trải phổ là phổ của tín hiệu được trải rộng ra gấp hàng trăm lần so với ban đầu và mật độ năng lượng phổ cũng thấp xuống làm cho giống nhiễu Công việc này có một số ích lợi sau đây:
Thứ nhất, thông tin thường có giải tần thấp dễ bị giao thoa với sóng khác
Thứ hai, đảm bảo độ an toàn truyền tin tránh bị các máy thu khác không chủ đích thu được tín hiệu
Thứ ba, trải phổ có tác dụng nhiều người dùng chung một giải băng tần Đến đầu thu, nhờ có mã giả nhiễu, máy thu sẽ thực hiện việc đồng bộ hóa Việc đồng bộ hóa bao gồm hai giai đoạn đó là giai đoạn bắt chuỗi và bám chuỗi để tìm ra đúng pha của mã trải phổ giả ngẫu nhiên Sau khi tìm được đúng mã trải phổ giả ngẫu nhiên thì thực hiện công việc nén phổ để thu được gói thông tin ban đầu Các gói thông tin lại được kết hợp với nhau để thu được thông điệp M
Nếu đặt bài toán giấu tin dưới góc nhìn của truyền thông Các yêu cầu chung nhất đối với thủy vân số đó là thuộc tính ẩn và thuộc tính bến vững,
Trang 3426
nhưng hai thuộc tính này như có một cái gì đó mâu thuẫn nhau Thuộc tính ẩn
có nghĩa là nói đến những tín hiệu thủy vân phải có năng lượng nhỏ để tránh được những tri giác bình thường trong khi đó thuộc tính bền vững lại nói đến các tín hiệu phải đủ lớn để có thể phát hiện ra sự tồn tại của thủy vân và lấy ra được từ nguồn chứa
Ta có thể coi quá trình truyền đối tượng đã được nhúng thủy vân dưới
sự tác động của các tấn công bên ngoài cũng giống như truyền dữ liệu trong môi trường không tin cậy Tiến trình nhúng thủy vân cũng giống như tiến trình mã kênh (chanel coding) Giải mã để lấy thủy vân cũng giống như tiến trình xử lý ở bên nhận thông tin trong một phiên truyền thông
Nhiều kỹ thuật và công cụ để nâng cao truyền thông cũng có thể được
áp dụng để nâng cao độ bền vững của thủy vân Sẽ rất thuận tiện nếu ta sử dụng những lý thuyết truyền thông để áp dụng cho thủy vân số
2.1.4 Các thuật toán kiểm định thủy vân
Đây là kỹ thuật con được sử dụng sau cùng trong kỹ thuật thủy vân Thủy vân được nhúng sau khi giải mã sẽ được so sánh để kiểm định, chứng thực thủy vân Có những thủy vân nhìn thấy được và mang ý nghĩa nhận biết thì công việc trở nên quá đơn giản chẳng hạn như thủy vân là một chuỗi mã ASCII mang thông tin nào đó như tên tác giả, ngày tháng… thì khi giải mã cũng dễ dàng nhận biết thông tin
Tuy nhiên, trong một số trường hợp thì thủy vân là một chuỗi bít nào
đó, thủy vân chuỗi bít mang ý nghĩa thống kê nên nó cũng thường được sử dụng Vậy thì khi đó công việc nhận diện thủy vân sẽ không đơn giản Hoặc ngay cả trong trường hợp thủy vân là những thông tin mang ý nghĩa nhận biết được thì cũng phải có kỹ thuật để kiểm định lượng thủy vân
Trang 3527
2.2 Các thuật toán thủy vân ảnh số dựa vào các phép biến đổi rời rạc 2.2.1 Thủy vân ảnh số dựa vào phép biến đổi Cosine rời rạc
2.2.1.1 Quá trình nhúng thủy vân
Thuật toán dưới đây sẽ sử dụng phương pháp nhúng thuỷ vân trong miền tần số của ảnh, giải tần được sử dụng để chứa tín hiệu thuỷ vân là miền tần số ở giữa của một khối DCT 8x8 Trong đó, các khối DCT 8x8 là những khối ảnh cùng kích thước đã được chọn ra ngẫu nhiên từ ảnh ban đầu và được
áp dụng phép biến đổi cosin rời rạc DCT để chuyển sang miền tần số Mỗi tín hiệu thuỷ vân sẽ được chứa trong một khối
Bước 3: Chọn hai hệ số ở vị trí bất kì trong miền tần số giữa của khối
Ck, gọi hai hệ số đó là Ck[i, j] = Ck[p, q]
Bước 4: Tính độ lệch d = ||Ck[i, j]| - |Ck[p, q]|| mod a Trong đó a là một tham số thỏa mãn a = 2 (2t + 1), với t là một số nguyên dương
Bước 5: Bit bk sẽ được nhúng vào khối Ck sao cho thỏa mãn điều kiện sau:
1 2
t d
t
Nếu bk = 0
Trang 3628
Bước 6: Nếu d < 2t + 1 và bk = 1 thì trong hệ số DCT Ck[i,j] hoặc Ck[p,q]
có giá trị tuyệt đối lớn hơn sẽ bị thay đổi để thỏa d ≥ 2t + 1 theo công thức sau:
Max (|Ck[i, j]|, |Ck[p, q]|) + (INT(0.75a) – d)
Hệ số được chọn sẽ được cộng thêm một lượng là (INT(0.75a) – d) Min (|Ck[i, j]|, |Ck[p, q]|) - (INT(0.75a) + d)
Hệ số được chọn sẽ được trừ đi 1 lượng là (INT(0.75a) + d)
Bước 7: Nếu d ≥ 2t + 1 và bk = 0 thì một trong hai hệ số DCT Ck[i, j] hoặc Ck[p, q] có giá trị tuyệt đối lớn hơn sẽ bị thay đổi để thỏa mãn d < 2t + 1 theo công thức sau:
Max (|Ck[i, j]|, |Ck[p, q]|) - (d - INT(0.75a))
Hệ số được chọn sẽ bị trừ đi một lượng là (d - INT(0.75a)
Min (|Ck[i, j]|, |Ck[p, q]|) + (INT(0.75a) - d)
Hệ số được chọn sẽ được cộng thêm một lượng là (INT(0.75a) - d) Bước 8: Thực hiện phép biến đổi ngược IDCT đối với khối Ck, Bk = IDCT(Ck) Bước 9: Ghép các khối ảnh B’k để được ảnh chứa thủy vân F’
Quá trình nhúng thủy vân được mô tả qua sơ đồ sau:
Các khối đã nhúng thủy vân
Các khối đã biến đổi ngược IDCT
Ảnh đã nhúng thủy vân