Định nghĩa
Biến ngẫu nhiên liên tục X có phân phối đều trên đoạn [a,b] nếu X có hàm mật độ được xác định như sau:
𝑓 = { 1 𝑏 − 𝑎 𝑛ế𝑢 𝑥 ∈ [𝑎, 𝑏] 0 𝑛ế𝑢 𝑥 ∉ [𝑎, 𝑏] Kỳ vọng: 𝐸(𝑋) = 𝑎 + 𝑏 2 Phương sai: 𝐷(𝑋) = (𝑏 − 𝑎) 2 12 1.3.3. Phân phối nhị thức Định nghĩa
Biến ngẫu nhiên rời rạc X có phân phối nhị thức với các tham số n, p ( n là số nguyên dương và 0 < p < 1) nếu X có Im(X) = {0,1,2,…,n} và với mọi k ϵ {0,1,2,3,…,n}
𝑃(𝑋 = 𝑘) = 𝐶𝑛𝑘𝑝𝑘(1 − 𝑝)𝑛−𝑘 Ký hiệu: 𝑋 𝐵(𝑛, 𝑝)
1.4. Giấu tin
1.4.1. Khái niệm giấu tin
Giấu tin là kỹ thuật nhúng thông tin vào dữ liệu môi trường, dữ liệu môi trường thường là: văn bản, ảnh, âm thanh, video. Thông tin được nhúng có thể là những thông điệp bí mật cần trao đổi, thông tin về tác giả, hoặc thông tin về sản phẩm đa phương tiện.
Nếu là bảo vệ cho chính đối tượng được giấu tin bên trong. Đây chính là thủy vân số, là lĩnh vực rất đa dạng, có nhiều mục đích và đang được quan tâm, nghiên cứu rất nhiều; tính ứng dụng của nó trong hiện tại rất lớn và đã có nhiều kỹ thuật được đề xuất. Trong trường hợp là bảo mật cho dữ liệu được đem giấu. Chính là giấu tin mật, tập trung vào các kỹ thuật giấu tin sao cho người khác rất vất vả, khó khăn mới phát hiện được đối tượng có chứa thông tin mật bên trong.
Các lược đồ giấu tin trong ảnh có thể được chia thành 2 chủ đề chính. Thứ nhất, gồm những lược đồ giấu tin trên miền không gian ảnh, những lược đồ này thường biến đổi các bít thấp trong giá trị màu của các điểm ảnh. Thứ hai, gồm những lược đồ giấu tin trên miền biến đổi của ảnh, hai phép biến đổi hay được sử dụng là: Phép biến đổi cosine rời rạc (DCT), phép biến đổi sóng con (DWT).
Số lượng lược đồ giấu tin trên ảnh màu, ảnh đa cấp xám nhiều hơn so với ảnh nhị phân. Lý do chủ yếu là việc thay đổi trên ảnh nhị phân dễ bị phát hiện hơn so với ảnh màu và ảnh đa cấp xám. Tuy nhiên, giấu tin trên ảnh nhị phân luôn nhận được sự quan tâm của các nhà nghiên cứu. Bởi ngoài việc ứng dụng trực tiếp trên ảnh nhị phân, những lược đồ này còn là cơ sở để phát triển cho những loại dữ liệu đa phương tiện khác.
Mô hình kỹ thuật giấu tin:
Trong các mô hình kỹ thuật giấu tin được mô tả như trong các hình minh họa 1.8 và 1.9 dưới đây. Theo mô hình 1.8 biểu diễn sơ đồ quá trình giấu tin ta thấy ở đây phương tiện chứa thông tin bao gồm các đối tượng được dùng làm môi trường để giấu tin như các tệp đa phương tiện. Thông tin cần giấu là một lượng thông tin mang ý nghĩa và mục đích nào đó tùy thuộc vào mục đích và yêu cầu của người sử dụng. Thông tin sẽ được giấu vào trong môi trường chứa thông tin nhờ một bộ nhúng thông tin. Bộ nhúng thông tin là những chương trình có chứa các thuật toán để giấu thông tin và được thực hiện với một khóa bí mật giống như các hệ mật mã.
Hình 1.8. Sơ đồ quá trình giấu tin
Sau khi giấu thông tin ta thu được một môi trường đã giấu tin và sẽ được truyền tải, phân phối trên các phương tiện truyền thông khác nhau. Quá trình giải mã tin là một quá trình ngược lại với giấu tin. Sơ đồ giải mã tin chỉ ra trong Hình 1.9.
Hình 1.9.Sơ đồ quá trình giải mã tin giấu
Trong Hình 1.9 đã chỉ ra các nhiệm vụ của quá trình giải mã thông tin đã được giấu. Quá trình giải mã này phải được thực hiện thông qua một bộ giải mã tương ứng với bộ nhúng thông tin và kết hợp với khóa để giải mã tin. Khóa để giải mã tin này có thể giống hay khác với khóa đã nhúng tin. Kết quả thu được bao gồm môi trường gốc và thông tin đã được che giấu. Tùy theo các trường hợp cụ thể, thông tin tách được ra có thể phải cần xử lý, kiểm định và so sánh với thông tin đem giấu ban đầu. Thông qua dữ liệu được tách ra từ môi trường chứa thông tin giấu, người ta có thể biết được trong quá trình truyền tải, phân phát dữ liệu có bị xâm phạm, tấn công hay không.
Đối với các hệ thống giấu thông tin mật này rất quan tâm đến tính an toàn và bảo mật thông tin của dữ liệu cần giấu. Hệ thống giấu tin mật có độ bảo mật cao nếu có độ phức tạp của các thuật toán thám mã khó có thể thực hiện được trên máy tính. Tuy nhiên, cũng có các hệ thống chỉ quan tâm đến số lượng thông tin có thể được che giấu, hay quan tâm đến sự ảnh hưởng của thông tin mật đến các môi trường chứa dữ liệu.
1.4.2. Giấu tin trên miền không gian
Miền không gian của ảnh là miền dữ liệu của ảnh gốc, tác động đến miền không gian ảnh chính là tác động trực tiếp đến các điểm ảnh, làm thay đổi giá trị của điểm ảnh. Đây là xu hướng trực quan được tập trung khai thác trong quá trình thủy vân trong ảnh, khi nói đến việc giấu tin trong ảnh chính là nhằm thay đổi giá trị các điểm ảnh gốc, những bit ít quan trọng của mỗi điểm ảnh đảm bảo cho ảnh được chỉnh sửa giá trị điểm ảnh gần nguyên gốc nhất.
Tuy nhiên, phương pháp này có nhiều nhược điểm, chẳng hạn như tính bền vững không được đảm bảo với dấu thủy vân qua các thao tác biến đổi ảnh như quay chụp ảnh, nén ảnh... các tác tác động đó đôi khi cũng làm sai lệch điểm ảnh dẫn đến các bit ít quan trọng nhất cũng bị thay đổi.
Phương pháp biến đổi dựa trên miền không gian như trình bày ở trên là cách biến đổi tín hiệu và miền giá trị rời rạc của các điểm ảnh được gọi là miền biến số độc lập. Trong thực thế phép biến đổi trực tiếp này gặp phải những khó khăn và hiệu quả không cao.
Ngoài phương pháp biến đổi trực tiếp, có dùng phương pháp biến đổi gián tiếp thông qua các phép biến đổi trực giao làm nhiệm vụ chuyển miền không gian sang miền biến đổi.
1.4.3. Giấu tin trên miền biến đổi
Miền biến đổi hay còn gọi là miền tấn số là miền nhận được khi biển đổi miền ảnh. Đây là kỹ thuật sử dụng phương pháp biến đổi như tính tích phân hay phương pháp đổi hệ tọa độ trong tích đề các. Phương pháp này nhằm chuyển miền không gian sang miền tần số, cụ thể là biến đổi tín hiệu và miền giá trị rời rạc của các điểm ảnh sang miền mới và có biến số mới.
Mỗi phép biến đổi có những thuận lợi và khó khăn riêng, tùy vào trường hợp cụ thể để lựa chọn phép biến đổi nào cho phù hợp. Sau khi biến đổi các tín hiệu và miền giá trị rời rạc trong miền biến số mới này, nếu cần thiết có thể dùng phép biến đổi ngược lại để đưa ảnh về miền biến số độc lập.
Phương pháp biến đổi gián tiếp làm đơn giản rất nhiều các công việc gặp phải khi dùng phương pháp biến đổi trực tiếp trong miền biến số độc lập. Có một số phương pháp biến đổi phổ biến hiện nay như: Fourier, Cosine rời rạc (DCT), Wavelet ... là những phép biến đổi được sử dụng phố biến trong các kỹ thuật xử lý multimedia, đặc biệt trong xử lý ảnh số. Ngoài ra các phép biến đổi này còn dùng nhiều trong lĩnh vực giấu tin, thủy vân số.
1.5. Thủy vân số
1.5.1. Khái niệm
Thủy vân trên ảnh số là kỹ thuật nhúng một lượng thông tin vào một bức ảnh số, các thông tin được nhúng có thể được ẩn hoặc hiện thị phụ thuộc vào kỹ thuật thủy vân cụ thể. Trong kỹ thuật thủy vân số thì thông tin nhúng được gọi là thủy vân. Thủy vân có thể là một chuỗi các ký tự, một hình ảnh, hay một logo nào đó. Có thể chia thủy vân số thành hai nhóm là thủy vân dễ vỡ và thủy vân bền vững.
Thủy vân dễ vỡ là kỹ thuật nhúng thủy vân vào trong ảnh, sao cho nếu có một phép biến đổi nào làm thay đổi ảnh gốc thì thủy vân được giấu trong đó sẽ không còn nguyên vẹn như thủy vân gốc.
Ngược lại, với kỹ thuật thủy vân dễ vỡ là thủy vân bền vững. Các kỹ thuật thủy vân bền vững thường được sử dụng trong các ứng dụng bảo vệ tác quyền. Trong những ứng dụng đó, thủy vân đóng vai trò là thông tin sở hữu của người chủ hợp pháp. Thủy vân được nhúng trong các sản phẩm như một hình thức dán tem bản quyền. Trong thường hợp như thế, thủy vân phải tồn tại bền vững cùng sản phẩm nhằm chống việc tẩy xóa, làm giả hay biến đổi pháp hủy thủy vân. Một yêu cầu lý tưởng đối với thủy vân bền vững làm nếu muốn phá hủy thủy vân thì chỉ có cách duy nhất là phá hủy sản phẩm.
1.5.2. Phân loại
Nói đến thủy vân số là nói đến kỹ thuật giấu tin nhắm đến những ứng dụng nhằm đảm bảo an toàn dữ liệu cho đối tượng được sử dụng để giấu tin như: bảo vệ bản quyền, xác thực thông tin, chống xuyên tạc, điều khiển sao chép,.. ta có thể nhận thấy tính ứng dụng của thủy vân rất là lớn, với mỗi ứng dụng lại có các yêu cầu đặc trưng riêng, do đó các kỹ thuật thủy vân này cũng có những tính năng khác biệt tương ứng.
Trong kỹ thuật thủy vân số thì thông tin nhúng được gọi là thủy vân. Thủy vân có thể là một chuỗi ký tự hay là một tệp hình ảnh, biểu tượng.
Thủy vân trên ảnh số là kỹ thuật nhúng một lượng thông tin số vào một bức ảnh số và thông tin nhúng được gắn liền với bức ảnh chứa và dữ liệu thủy vân có thể được hiển thị hay ẩn là tùy thuộc vào mỗi kỹ thuật thủy vân cụ thể.
Có thể chia các kỹ thuật thủy vân theo các nhóm như hình minh họa như hình 1.10 như sau:
Hình 1.10.Phân loại các kỹ thuật thủy vân.
Các kỹ thuật thủy vân trên hình 1.10 được phân biệt khác nhau bởi những đặc trưng, tính chất của từng kỹ thuật và khía cạnh ứng dụng của những kỹ thuật đó. Trong thực tế, tùy theo mục đích, yêu cầu của bài toán mà ta sẽ chọn kỹ thuật thủy vân phù hợp, tuy nhiên các kỹ thuật này cũng có một số đặc điểm giống nhau.
Với kỹ thuật thủy vân bền vững thường được sử dụng trong bài toán bảo vệ bản quyền. Trong những ứng dụng đó, thủy vân đóng vai trò là thông tin sở hữu của người chủ hợp pháp. Thủy vân được nhúng vào trong các sản phẩm như là hình thức dán tem bản quyền. Trong các trường hợp này thì thủy vân phải tồn tại bền vững cùng với sản phẩm, nhằm chống lại việc tẩy xóa, làm giả hay biến đổi phá hủy thủy vân. Một yêu cầu lý tưởng đối với thủy vân bền vững là nếu muốn loại bỏ thủy vân này thì chỉ còn có cách duy nhất là phá hủy sản phẩm. Thủy vân bền vững lại được chia thành hai loại là thủy vân ẩn và thủy vân hiện. Thủy vân hiện là loại thủy vân được hiện lên ngay trên sản phẩm và người sử dụng có thể nhìn thấy được, ví dụ như các biểu tượng của các đài truyền hình trên các kênh vô tuyến VTV, VTC, HN,… Các thủy vân hiện trên ảnh thường hiển thị dưới dạng chìm, mờ hoặc trong suốt nhằm không gây ảnh hưởng đến chất lượng các sản phẩm ảnh gốc. Đối với thủy vân hiện này thì thông tin bản quyền hiển thị ngay trên sản phẩm; còn đối với thủy vân ẩn thì cũng giống như giấu tin, yêu cầu tính ẩn rất cao, bằng mắt thường không thể nhìn thấy thủy vân. Trong vấn đề bảo vệ bản quyền, thủy vân ẩn mang nhiều tính bất ngờ hơn trong việc phát hiện sản phẩm bị lấy cắp. Trong trường hợp này thì người chủ sở hữu hộ pháp sẽ chỉ ra bằng chứng là thủy vân đã được nhúng vào trong sản phẩm đó.
Thủy vân dễ vỡ là kỹ thuật nhúng thủy vân vào trong ảnh sao cho sản phẩm khi phân phối, truyền tải trong các môi trường nếu có bất kỳ một phép biến đổi nào làm thay đổi sản phẩm gốc thì thủy vân đã được giấu trong đó sẽ không còn nguyên vẹn như thủy vân gốc. Các tính chất của kỹ thuật thủy vân này thường được sử dụng trong các ứng dụng xác thực thông tin và phát hiện thông tin bị xuyên tạc. Đó chính là nguyên nhân vì sao các ứng dụng loại này rất cần đến kỹ thuật thủy vân dễ vỡ. Ví dụ như để bảo vệ chống bị xuyên tạc một ảnh nào đó, người ta nhúng một thủy vân vào đó và sau đó quảng
bá, phân phối đối tượng này. Khi cần kiểm tra lại người ta sử dụng hệ thống đọc thủy vân, nếu không đọc được thủy vân hoặc thủy vân đã bị sai lệch nhiều so với thủy vân ban đầu đã được nhúng vào đối tượng thì có nghĩa là bức ảnh đó đã bị thay đổi, chỉnh sửa.
1.5.3. Các yêu cầu đối với hệ thống thủy vân
Mỗi phương pháp thủy vân đều có những ưu nhược điểm khác nhau. Vì vậy, để đánh giá chất lượng của mỗi phương pháp ta cần xét các tiêu chí sau: tính ẩn, tính bền vững. Dưới đây ta xét các yêu cầu của một hệ thủy vân ẩn:
Tính ẩn (invisible)
Yêu cầu quan trọng nhất đối với thủy vân ẩn là tính ẩn của dấu thủy vân. Điều đó có nghĩa là ảnh thủy vân không thay đổi nhiều so với ảnh gốc và con người không nhận biết được ảnh có chứa thủy vân. Khi nhúng thủy vân chất lượng ảnh thủy vân phải được đảm bảo và không bị phát hiện bởi thị giác của con người.
Tính bền vững (robustness)
Yêu cầu thứ hai là thủy vân phải thực sự bền vững trước các phép tấn công ảnh có chủ đích và không có chủ đích. Các tấn công không có chủ đích với ảnh số như: nén ảnh, lọc nhiễu, lấy mẫu,… còn tấn công có chủ đích là việc tẩy, xóa, làm nhiễu ảnh thủy vân. Yêu cầu này chính là việc đảm bảo sẽ lấy được dấu thủy vân ngay khi ảnh thủy vân bị tấn công bởi các phép nêu trên.
1.5.4. Mô hình thủy vân cơ bản
Hệ thống thủy vân đầy đủ gồm có hai quá trình: nhúng thủy vân và trích thủy vân. Quá trình nhúng thủy vân sẽ thực hiện nhúng dấu thủy vân vào ảnh gốc. Trong quá trình trao đổi thông tin, ảnh thủy vân bị tấn công làm biến đổi. Quá trình trích thủy vân sẽ lấy lại dấu thủy vân từ các ảnh bị tấn công.
Sơ đồ hoạt động của 2 quá trình này như sau:
Quá trình nhúng thủy vân:
Input:
- Ảnh I dùng làm môi trường nhúng. - Dấu thủy vân W.
- Khóa K (có thể có hoặc không).
Output:
- Ảnh I’ là ảnh I đã biến đổi sau khi nhúng W. Quá trình trích thủy vân:
Trích thủy vân là quá trình ngược của nhúng thủy vân với mục đích lấy ra được thông tin đã giấu. Dấu thủy vân sau khi được lấy ra sẽ được so sánh với dấu thủy vân gốc để xác định bản quyền tác giả.
Input:
- Ảnh I dùng làm môi trường nhúng. - Dấu thủy vân W.
- Khóa K (tùy chọn).
Output:
- Ảnh I’ là ảnh I đã biến đổi sau khi nhúng W.
1.5.5. Tấn công thủy vân
Tấn công thủy vân là các phương pháp tác động nhằm thay đổi ảnh thủy vân nhằm xóa bỏ các vết tích dấu thủy vân trong ảnh. Các tấn công này bao gồm cả tấn công có chủ đích và không có chủ đích. Bằng cách sử dụng các phần mềm chỉnh sửa ảnh tiên tiến hiện nay như: Adobe Photoshop, Picasa,…. kẻ tấn công có thể dễ dàng thực hiện các phép biến đổi ảnh. Các tấn công có thể sử dụng nhưng phép biến đổi sau: nén, quay, cắt, làm mờ, biến đổi histogram,…
1.5.6. Đánh giá chất lượng thủy vân
Để đánh giá một hệ thống thủy vân có tốt hay không thông qua một số giá trị độ