Trong hầu hết các ứng dụng, chẳng hạn như bảo vệ bản quyền, tính bảo mật của thông tin nhúng cần phải được bảo đảm, tính hiệu quả của một thuật toán không thể dựa vào giả định là những kẻ tấn công không biết được quá trình nhúng watermark vào tài liệu đa phương tiện được thực hiện như thế nào. Tuy nhiên, giả định đó lại được dùng để đánh giá độ an toàn của các sản phẩm thương mại sử dụng watermarking có giá trị trên thị trường. Với một ứng dụng watermarking, một khi biết được cách làm việc của bộ nhúng và bộ dò, kẻ tấn công sẽ dễ dàng loại bỏ
watermark. Hơn nữa, một số kỹ thuật sử dụng dữ liệu gốc trong quá trình dò tìm và rút trích (thường thì các giải pháp loại này không khả thi trong thực tế).
Đối với các hệ thống đòi hỏi tính an toàn, thì một khóa bảo mật có thể được sử dụng trong quá trình nhúng và trích. Hai mức độ bảo mật có thể được xác định. Với mức độ bảo mật cao nhất, những người sử dụng không được phép không thể đọc, giải mã watermark nhúng cũng như không thể phát hiện dữ liệu có chứa đựng
watermark hay không, và thông tin nhúng không thểđọc được nếu không có khóa bí
mật.
Trong một số sơ đồ có thể ứng dụng nhiều watermark cùng với cả khóa bí
mật (secret key) và khóa công khai (public key). Có thể nối một hoặc một vài public
key với private key và nhúng vào public/private watermark.
2.4.2 Tính không nhìn thấy (Invisibility)
Một trong những điều kiện quan trọng là tính trong suốt hay không nhìn thấy của watermark và đặc tính này độc lập với các mục đích và các ứng dụng khác
nhau. Thành phần lạ xuất hiện trong quá trình xử lý watermarking không những gây
phiền phức không mong muốn mà còn làm suy giảm hay phá hủy các giá trị thương
mại của dữ liệu. Vì vậy, một điều quan trọng là thiết kế watermark khai thác các hiệu quả cảm nhận của mắt người cũng như của tai người để cực đại hóa năng
lượng watermark mà vẫn không vượt quá mức ngưỡng cảm nhận được. Có hai vấn
đề liên quan, một là những đánh giá mức độ biến dạng của dữ liệu và những quá trình xử lý tác động đến dữ liệu nhúng watermark, chẳng hạn như trong kỹ thuật watermarking đối với ảnh, mức độ cảm nhận của watermark sẽ tăng lên khi ảnh
được phóng đại lên.
Vô hình đối với mắt: Những nhà nghiên cứu gần đây đã cố gắng giấu
watermark sao cho nó khó bị phát hiện(không hiển thị trên nền ảnh) và không
ảnh hưởng nhiều đến chất lượng mắt cũng như nội dung dữ liệu chứa. Tuy nhiên, yêu cầu này mâu thuẫn với một số yêu cầu khác, chẳng hạn như tính bền
vững là một yêu cầu quan trọng khi đối đầu với các thao tác tấn công
watermarking, đặc biệt là thuật toán nén có tổn hao. Thông thường, các bit ít có
ý nghĩa đối với mắt người sẽđược ưu tiên dùng để chứa watermark. Để đạt được mục đích này, chúng ta phải khảo sát các tính chất của hệ thống mắt người HVS (đối với ảnh) và hệ thống thính giác con người HAS (đối với âm thanh) trong quá trình nhúng và dò tìm watermark.
Vô hình đối với thống kê: Một cá nhân bất hợp pháp không thể dò tìm watermark bằng các phương pháp thống kê. Ví dụ nhiều tác phẩm kỹ thuật sốđã
được nhúng cùng một watermark sao cho khi thực hiện tấn công dựa trên thống
kê thì không tài nào trích được watermark. Một giải pháp khả thi là sử dụng
watermark phụ thuộc nội dung.
2.4.3 Tính bền vững (Robustness)
Tùy thuộc vào các mục đích ứng dụng của hệ thống, độ bền vững mong muốn ảnh hưởng đến quá trình thiết kế.
Thông thường, một watermark bền vững phải đối đầu được với các phép biến đổi, bao gồm những phép biến đổi tín hiệu phổ biến như phép biến đổi A/D, D/A, nén có tổn hao. Đối với ảnh số và video, watermark phải chống lại được các phép xử lí ảnh phổ biến như phép lọc, co giãn ảnh, cải tiến độ tương phản, xén, quay ảnh, hoặc nén ảnh.
Ví dụ, trong kỹ thuật watermarking dùng cho ảnh, nếu chúng ta cần kỹ thuật bền vững với nén JPEG tỉ lệ cao (loại bỏ trên ảnh những thông tin ít có tính nhìn thấy nhất để làm giảm kích thước của ảnh mà vẫn đảm bảo được chất lượng ảnh) thì việc dùng một kỹ thuật nhúng trong miền biến đổi có hiệu quả hơn là một kỹ thuật nhúng trong miền không gian. Tương tự như vậy, nếu kỹ thuật thích ứng với những biến đổi hình học như là phép xoay, chỉnh kích thước không theo tỉ lệ thì giải thuật thực hiện trong miền không gian phù hợp hơn.
Ngoài ra, người ta còn nhận thấy rằng, tính bền vững chỉ có thểđạt được nếu watermark được đặt ở những vùng có ý nghĩa nhìn thấy nhiều nhất của một bức
ảnh. Tuy nhiên, watermark sẽ khó bị phát hiện nếu như nó được đặt ở những vùng ít có ý nghĩa nhìn thấy nhất. Tính phức tạp của kỹ thuật watermarking thể hiện ở hai tính chất mâu thuẫn lẫn nhau này.
Cần lưu ý rằng, tính bền vững thật sự bao gồm hai vấn đề riêng biệt là: - Watermark phải tồn tại trong dữ liệu dù có xảy ra méo dạng hay không.
- Liệu máy dò tìm watermark có phát hiện ra nó hay không.
[
2.4.4 Khả năng tải thông tin (Payload capacity)
Lượng thông tin có thể chứa trong watermark tùy thuộc vào các ứng dụng
khác nhau. Chẳng hạn, đối với ứng dụng chống sao chép, thông tin watermark chỉ
cần một bit là đủ.
2.4.5 Chứng minh quyền sở hữu thật sự
Để có thể thực hiện quyền sở hữu hợp pháp, cần phải xác định ai là người
nhúng watermark vào dữ liệu trước tiên trong trường hợp có nhiều watermark được
nhúng. Điều này có thể thực hiện thông qua việc đặt ra các trở ngại thiết kế như tính khảđảo của watermark,...
2.4.6 Tính linh hoạt (activity)
Trong các ứng dụng thương mại, chi phí tính toán cho việc nhúng và trích rất quan trọng. Tuy nhiên, trong một sốứng dụng, việc chèn watermark chỉ có thể thực hiện một lần và offline. Do đó, chi phí nhúng có thể không quan trọng bằng chi phí dò, vốn thường phải xảy ra theo thời gian thực. Hơn nữa, chúng ta biết rằng tốc độ
máy tính tăng xấp xỉ gấp đôi sau 18 tháng, những gì được tính toán không thỏa đáng ngày nay có thể nhanh chóng trở thành hiện thực. Người ta mong đợi việc thiết kế
một bộ dò watermark tương thích với mỗi thế hệ máy vi tính. Ví dụ thế hệ thứ nhất của bộ dò có thể có chi phí tính toán rẻ nhưng không đáng tin cậy bằng bộ dò ở thế
hệ tiếp theo (có thể có nhiều tính toán hơn) để xử lý với các vấn đề như các biến dạng hình học.
2.4.7 Khả năng cải tiến và nhúng nhiều watermark
Cần phải cho phép nhúng nhiều watermark khác nhau trong cùng một ảnh sao cho mỗi watermark có thể dò được bởi một người dùng được cấp quyền. Đặc trưng này rất hữu dụng trong các ứng dụng dấu vân tay, trong đó thuộc tính tác quyền được truyền từ người sở hữu tác phẩm đến các tác phẩm khác. Hơn nữa chúng ta có thể ngăn người khác thực hiện watermarking cho một tác phẩm đã được
đóng dấu. Trong một số trường hợp, việc chỉnh sửa hoặc thay đổi một watermark
sau khi nhúng là cần thiết. ví dụ, trong trường hợp các đĩa DVD, một watermark có
thể được dùng để chỉ cho số lượng các bản sao chép được phép. Ngay sau khi việc sao chép được thực hiện, watermark trên đĩa gốc sẽ được thay đổi để giảm số lần cho phép sao chép xuống. Việc chỉnh sửa watermark có thể thực hiện được bằng
cách loại bỏ watermark thứ nhất và sau đó thêm vào một watermark mới hoặc chèn
một watermark thứ hai sao cho cả hai đều có thể đọc được, nhưng chồng lấn lên nhau. Khả năng thứ hai được chọn lựa nhiều hơn bởi vì một watermark mà có thể
xoá được thì hiển nhiên không phải là một watermark bền vững và dễ dàng bị giả
mạo.
2.4.8 Khôi phục watermark cần hay không cần dữ liệu gốc
Kỹ thuật watermarking sử dụng dữ liệu gốc trong quá trình khôi phục làm tăng tính bền vững hơn không chỉ với các loại méo dạng như nhiễu mà còn với các loại méo dạng trong các thao tác xử lý hình học vì nó cho phép phát hiện và đảo
ngược những méo dạng này. Trong nhiều ứng dụng, như giám sát hoặc theo dõi dữ
liệu, thì việc truy xuất dữ liệu gốc là không thể. Trong những ứng dụng khác như ứng dụng watermarking trong video, không thực tế khi dùng dữ liệu gốc bởi vì phải xử lý một lượng dữ liệu lớn.
Trong khi những kỹ thuật watermarking ở những giai đoạn đầu cần dùng dữ
liệu gốc trong quá trình khôi phục thì ngày nay có khuynh hướng xây dựng các kỹ
thuật watermarking không cần dữ liệu gốc khi khôi phục (sử dụng key hoặc chỉ một phần đặc trưng của dữ liệu gốc). Và kỹ thuật này có thể được sử dụng trong nhiều
ứng dụng.
2.4.9 Tính phổ thông
Watermark số nên áp dụng cho cả ba phương tiện truyền thông đang được chú ý là âm thanh, hình ảnh, video. Điều này có khả năng giúp ích trong vấn đề
watermarking cho những sản phẩm truyền thông đa phương tiện. Đặc tính này cũng dẫn tới sự thực thi toàn bộ thuật toán watermarking cho cả âm thanh, hình ảnh, video trên cùng một phần cứng.
2.4.10Tính rõ ràng
Việc phục hồi watermark nên xác minh một cách rõ ràng chủ sở hữu. Watermark không nên cần đến bất kỳ sự phiên dịch nào như tìm cơ sở dữ liệu các bộ mã để phiên dịch watermark nếu bản thân nó không là chuẩn quốc tế.
2.4.11Độ tin cậy trong quá trình dò tìm và rút trích
Ngay cả khi không có các tấn công cũng như các biến dạng tín hiệu, khả
năng không dò được watermark đã nhúng (lỗi phủ định sai) hoặc dò sai watermark
khi mà nó không tồn tại trong thực tế (khẳng định sai) phải rất nhỏ. Thông thường, các thuật toán thống kê cơ bản không có khó khăn gì trong việc đáp ứng những yêu cầu này. Tuy nhiên một khả năng như vậy phải được đưa lên hàng đầu nếu ứng dụng watermarking liên quan đến luật pháp, vì có như vậy mới tạo sự tin cậy chắc chắn cho các phán quyết cuối cùng...
2.4.12Chống lại sự xuyên tạc
Watermark có thể bị tấn công bằng các phép xử lý tín hiệu với ý định duy nhất là loại bỏ watermark. Làm sao để watermark chống lại sự xuyên tạc như thế
cũng là một vấn đề đáng quan tâm. Đây là một số cách có triển vọng để đạt được
điều này:
- Watermark kín: Một watermark kín trong đó bộ giải mã yêu cầu một số
thông tin về tài liệu chưa được watermark hoặc chuỗi nhiễu giả ngẫu nhiên cấu thành watermark vốn chỉđược biết rõ bởi người gửi và người nhận.
- Bộ mã hoá - giải mã bất đồng bộ: Nếu việc loại bỏ watermark yêu cầu đảo
ngược quá trình mã hóa thì chúng ta nên làm cho bộ mã hóa trở nên càng phức tạp
càng tốt, đặc biệt nếu watermark chỉ được áp đặt một lần. Tuy nhiên, nếu những bộ
giải mã phải chạy trong thời gian thực thì quá trình giải mã nên đơn giản hơn quá trình mã hóa.
2.4.13Tính khảđảo của watermark
Mặc dù tính bền vững thường được chỉ ra như một yêu cầu chính cần phải có, nhưng mối quan tâm lớn lại tập trung vào tính khả đảo của watermark. Thuật ngữ khả đảo được dùng với những ý nghĩa khác nhau, nghĩa tự nhiên nhất được
định nghĩa là một watermark gọi là khảđảo nếu các người dùng được cấp quyền có thể xoá nó khỏi tài liệu. Trong nhiều ứng dụng, tính khả đảo này có thể là một đặc trưng mong đợi, bởi vì nó có thể cho phép thay đổi tình trạng của một tài liệu cho trước theo lịch sử của nó mà không cần phải ẩn quá nhiều bit thông tin trong nó.
Tính khả đảo của watermark còn được định nghĩa theo cách khác, đó là khả
năng làm mất hiệu lực thừa nhận quyền sở hữu được hỗ trợ bởi watermarking bằng cách sử dụng kỹ thuật công nghệ đảo để đảo lại quy trình watermarking. Một mô hình watermarking muốn sử dụng thành công trong ứng dụng bảo vệ quyền sở hữu thì phải đáp ứng được tính không khảđảo của watermark. Chúng ta có thể nói rằng một watermark là khả đảo nếu nó có thể tạo ra một watermark ngược (false
watermark) và một tài liệu giả mạo tài liệu gốc sao cho khi nhúng false watermark
vào nó, ta có thể thu được một tài liệu giống hay gần giống với tài liệu gốc đã được
Một số tác giả [20] chỉ ra rằng các mô hình watermarking khả đảo hay tựa khảđảo ít được dùng trong các ứng dụng thực tế.
2.4.14Tối thiểu hóa sự thay đổi các pixel
Khi thực hiện watermark hình ảnh chất lượng cao và các tác phẩm nghệ
thuật, số lượng các pixel cải biến nên là nhỏ nhất.
2.4.15Tối thiểu hóa sự can thiệp của con người
Tùy thuộc vào từng ứng dụng, kỹ thuật watermarking có những yêu cầu khác nhau. Một trong những thách thức của những người nghiên cứu về lĩnh vực này là các yêu cầu trong kỹ thuật này thường mâu thuẫn với nhau. Những yêu cầu liệt kê ở
trên là những yêu cầu thông thường mà hầu hết các ứng dụng thực tế phải đạt được.
Tóm lại, trong một hệ thống watermarking, thường thì các điều kiện này có mối quan hệ với nhau. Nếu như một hệ số được sử dụng nhằm thay đổi mức độ
nhúng thông tin watermark trong dữ liệu nhúng thì hệ số này có tầm quan trọng ảnh
hưởng đến chất lượng dữ liệu sau nhúng cũng như tính bền vững của hệ thống. Cụ
thể, khi hệ số đặc trưng cho mức độ nhúng càng lớn thì hệ thống càng bền vững, những tác động bên ngoài lên ảnh nhúng sẽảnh hưởng xấu đến chất lượng ảnh. Mặt
khác, lượng thông tin nhúng càng nhiều thì thông tin ảnh gốc có thể bị thay đổi nhiều. Trong nhiều trường hợp nhúng nhiều bit cho khả năng đánh giá tốt hơn so với việc nhúng một bit.
Trong thực tế, ba yêu cầu về tính bảo mật, tính bền vững, và tính không nhìn thấy có thể xem như một dạng tam giác, nghĩa là nếu cái này bị biến đổi thì hai cái kia cũng bịảnh hưởng.
Không nhìn thấy
Bảo mật
Chương III: Cơ sở lý thuyết phép biến đổi Wavelets
3.1 Phép biến đổi Fourier kinh điển và những nhược điểm
Từ trước đến nay có nhiều phương pháp phân tích tín hiệu. Được biết đến nhiều nhất là phân tích Fourier, trên cơ sở phân tích một tín hiệu thành tổng của các
hàm sin với các tần số khác nhau. Nói cách khác, phân tích Fourier là kỹ thuật biến
đổi tín hiệu từ miền thời gian sang miền tần số. Với nhiều tín hiệu, phân tích Fourier rất có ích vì nội dung tần số của tín hiệu là rất quan trọng.
Biến đổi Fourier của tín hiệu x(t) và biến đổi Fourier ngược của nó được xác
định bởi biểu thức sau: ∫ ∞ ∞ − − = x t e dt f X( ) ( ) j2πft (3.1) ∫ ∞ ∞ − = X f e dt t x( ) ( ) j2πft (3.2)
Trong đó, x(t)và X(f)được gọi là một cặp biến đổi Fourier: x(t)←→FT X(f)
Hình 3.1: Biến đổi Fourier
Mặc dù có nhiều hiệu quả nhưng phép biến đổi Fourier (nhưlà phân tích các
tín hiệu tuần hoàn, thuận lợi cho các phép chập tín hiệu) vẫn có những hạn chế. Khi biến đổi sang miền tần số, thông tin thời gian đã bị mất. Nếu một thuộc tính tín hiệu
Biến đổi Fourier
không thay đổi nhiều theo thời gian, nó được gọi là tín hiệu tĩnh, thì các nhược điểm trên không có ảnh hưởng quan trọng. Tuy nhiên, nhiều tín hiệu có chứa các thông số động: trôi, nghiêng, biến đổi đột ngột, khởi đầu và kết thúc của các sự kiện. Những
đặc tính này thường là phần quan trọng nhất của tín hiệu, và phân tích Fourier không thích hợp để phát hiện chúng.
3.2Phép biến đổi Fourier thời gian ngắn
Các tín hiệu thường gặp trong thực tế thường là tín hiệu không dừng (ví dụ tín hiệu nhạc, tín hiệu nhiễu, …) thì phân tích Fourier hoàn toàn không mang lại các thông tin hữu ích. Ta xét một ví dụ đơn giản để thấy rõ điều này. Xét trường hợp tín