Quá trình trích thủy vân

Một phần của tài liệu (LUẬN án TIẾN sĩ) một số kỹ thuật phòng chống giả mạo ảnh số luận án tiến sĩ hệ thống thông tin 62 48 01 04 (Trang 30 - 41)

Thủy vân số có nhiều ứng dụng, nên các phương pháp thủy vân được quan tâm và đã có nhiều lược đồ thủy vân được đề xuất. Các phương pháp thủy vân được chia làm ba loại chính: thủy vân bền vững (robust watermarking), thủy vân dễ vỡ (fragile watermarking), và thủy vân bán dễ vỡ (semi-fragile watermarking).

Thủy vân bền vững: Loại thủy vân này yêu cầu dấu thủy vân phải ít bị biến đổi (bền vững) trước sự tấn công trên sản phẩm chứa dấu thủy vân, hoặc trong trường hợp loại bỏ được dấu thủy vân thì sản phẩm sau khi bị tấn công cũng không còn giá trị sử dụng. Do vậy, những lược đồ thủy vân bền vững thường được ứng

dụng trong bài toán bảo vệ bản quyền. Các phép tấn công phổ biến nhằm loại bỏ dấu thủy vân đối với ảnh số là: nén JPEG, thêm nhiễu, lọc, xoay, cắt xén, làm mờ, thay đổi kích thước, thay đổi cường độ sáng, thay đổi độ tương phản.

Thủy vân dễ vỡ: Khác với thủy vân bền vững, thủy vân dễ vỡ yêu cầu dấu thủy vân phải dễ bị biến đổi trước sự tấn công trên dữ liệu thủy vân. Do vậy, thủy vân dễ vỡ thường được ứng dụng trong bài toán xác thực tính toàn vẹn của ảnh trên các môi trường trao đổi không an toàn.

Thủy vân bán dễ vỡ: là loại thủy vân cân bằng giữa tính bền vững và tính dễ vỡ, nó có tính bền vững trước các biến đổi khách quan (như nén, nhiễu, làm mờ,...) nhưng không thay đổi nội dung và có tính dễ vỡ trước các tấn công có chủ đích (xoay, tịnh tiến, cắt ghép,...) làm thay đổi nội dung ảnh. Trên thực tế trong quá trình trao đổi, sử dụng ảnh số phải chịu một số ảnh hưởng nhất định của môi trường và các chương trình xử lý ảnh, nên để phòng chống giả mạo phải dùng loại thủy vân bán dễ vỡ này.

Ngoài cách phân loại như trên, dựa vào việc dấu thủy vân hiển thị (hiện) hay không hiển thị (ẩn) trên sản phẩm đa phương tiện, người ta còn chia các lược đồ thành thủy vân hiện (visible watermarking) và thủy vân ẩn (invisible watermarking). Trong luận án chỉ tập trung nghiên cứu các lược đồ thủy vân ẩn.

Cũng có thể phân loại theo môi trường nhúng thủy vân như thủy vân trên miền không gian, thủy vân trên miền tần số.

1.2.1.2 Các yêu cầu với lược đồ thủy vân

Tính ẩn: Thứ nhất, thuỷ vân phải ẩn đối với trực giác của con người, tức là con người phải không nhận biết được sự có mặt của thuỷ vân trong ảnh. Điều này cũng có nghĩa là việc dấu thuỷ vân chỉ gây ra sự thay đổi rất nhỏ đối với ảnh, không ảnh hưởng đến chất lượng ảnh.

Tính bền vững: Yêu cầu thứ hai là thuỷ vân phải bền vững, thuỷ vân phải có khả năng tồn tại cao với các tấn công có chủ đích và không có chủ đích. Các tấn

công không có chủ đích đối với ảnh số bao gồm như nén ảnh, lấy mẫu, lọc, chuyển đổi A/D và D/A … còn các tấn công có chủ đích có thể là việc xoá, thay đổi hoặc làm nhiễu thuỷ vân trong ảnh. Để thực hiện được điều này, thuỷ vân phải được dấu trong các vùng quan trọng đối với trực giác. Phương pháp thuỷ vân số phải đảm bảo sao cho việc không thể lấy lại thuỷ vân tương đương với việc ảnh đã bị biến đổi quá nhiều, không còn giá trị về thương mại.

Khả năng mang tin cao: Với yêu cầu này, lượng tin cần thêm vào ảnh phải đủ dùng trong ứng dụng mà không làm thay đổi quá nhiều chất lượng ảnh.

Tuy vậy, việc làm tốt cả ba yêu cầu trên là một điều rất khó. Để dấu thuỷ vân trong ảnh thì ta bắt buộc phải thay đổi dữ liệu ảnh. Ta có thể tăng tính bền vững cho thuỷ vân bằng cách tăng lượng thay đổi ảnh cho mỗi đơn vị tin cần dấu. Nhưng, nếu thay đổi quá nhiều thì tính ẩn không còn được đảm bảo nữa. Còn nếu thay đổi ảnh quá ít thì các yếu tố dùng để xác định thuỷ vân trong ảnh sau các phép tấn công có thể không đủ để xác định thuỷ vân. Nếu thông tin được dấu quá nhiều thì cũng dễ làm thay đổi chất lượng ảnh và làm giảm tính bền vững. Vì vậy, lượng thay đổi ảnh lớn nhất có thể chấp nhận và tính bền vững là hai nhân tố quyết định cho khối lượng tin được dấu trong ảnh.

An ninh: Đây là khả năng chống lại các cuộc tấn công. Nó sẽ là khó khăn để loại bỏ hoặc phá hủy dấu thủy vân mà không có kiến thức của khóa bí mật, ngay cả khi các lược đồ thủy vân được công bố. Đối với lược đồ thủy vân bền vững, bất kỳ nỗ lực để loại bỏ hoặc phá hủy dấu thủy vân sẽ làm suy giảm nghiêm trọng chất lượng của hình ảnh. Đối với các lược đồ dễ vỡ, bán dễ vỡ những nỗ lực như vậy sẽ phá hủy các thông tin xác thực.

1.2.1.3 Ứng dụng của thủy vân

Theo I. Cox và cộng sự [35] thủy vân có rất nhiều ứng dụng trong nhiều lĩnh vực. Tuy nhiên có một số ứng dụng chính sau đây:

Bảo vệ bản quyền: Đây có lẽ là ứng dụng quan trọng nhất của thủy vân số. Các dấu thủy vân được nhúng có thể được phục hồi từ sản phẩm chứa và sử dụng để xác minh quyền sở hữu, hoặc xác thực của sản phẩm chứa. Ứng dụng này đòi hỏi tính bền vững rất cao: các dấu thủy vân phải không bị phá hủy, và trong trường hợp nhiều dấu thủy vân đã được nhúng vào vẫn khẳng định được dấu thủy vân đầu tiên.

Ví dụ: Giả sử, có một thành phẩm dữ liệu dạng đa phương tiện như ảnh, âm thanh, video cần được lưu trên mạng. Việc bảo vệ các sản phẩm chống lại các hành vi lấy cắp hoặc làm nhái cần phải có một kỹ thuật để dán tem bản quyền vào sản phẩm này. Việc dán tem chính là việc “nhúng” thuỷ vân, cần phải đảm bảo không để lại một ảnh hưởng lớn nào đến việc cảm nhận sản phẩm. Yêu cầu kỹ thuật đối với ứng dụng này là thuỷ vân phải tồn tại bền vững cùng với sản phẩm, muốn hủy bỏ thuỷ vân này mà không được phép của người chủ sở hữu thì chỉ có cách là phá huỷ sản phẩm.

Chống sao chép: Các nội dung số có thể mang các dấu thủy vân bao gồm thông tin về sao chép. Các lược đồ này rất hữu ích cho việc phân phối các nội dung số chẳng hạn như các đĩa DVD.

Ví dụ: Như hệ thống quản lý sao chép DVD đã được ứng dụng ở Nhật. Thuỷ vân mang các giá trị chỉ trạng thái cho phép sao chép dữ liệu như “không được sao chép” (copy never) hay “chỉ được sao chép một lần” (copy once), sau khi copy xong, bộ đọc - ghi thuỷ vân sẽ ghi thuỷ vân mới chỉ trạng thái mới lên DVD. Các ứng dụng loại này cũng yêu cầu thuỷ vân phải được đảm bảo an toàn và cũng sử dụng được phương pháp phát hiện thuỷ vân đã giấu mà không cần thông tin gốc.

Xác thực nội dung/phòng chống giả mạo: Mục đích của ứng dụng này là để phát hiện những thay đổi của nội dung số, phòng chống giả mạo. Đối với các ứng dụng xác thực, lược đồ thủy vân dễ vỡ và bán dễ vỡ sẽ được sử dụng, dấu thủy vân sẽ bị phá hủy khi nội dung số bị sửa đổi.

Ví dụ: Một tập các thông tin sẽ được giấu trong phương tiện chứa sau đó được sử dụng để nhận biết xem dữ liệu trên phương tiện gốc đó có bị thay đổi hay không. Các thuỷ vân nên được “ẩn” để tránh sự tò mò của đối phương. Yêu cầu chung đối với dữ liệu này là khả năng giấu được nhiều thông tin và thuỷ vân không cần bền vững trước các phép xử lý trên các đối tượng đã được giấu tin.

1.2.2 Kỹ thuật thụ động

Kỹ thuật điều tra ảnh số thụ động gồm kỹ thuật dựa trên quy luật nội tại và kỹ thuật xáo trộn dự thường [13, 34]. Các kỹ thuật thụ động giúp phát hiện ảnh bị chỉnh sửa mà không cần dấu thủy vân hay chữ ký số được nhúng vào trước đó. Có một số kỹ thuật chính như sau:

1.2.2.1 Kỹ thuật dựa trên Pixel

Bởi vì các pixel là các thành phần cơ bản của ảnh số, nên phân tích các quan hệ ở mức pixel của ảnh sẽ phát hiện ra ảnh giả mạo. Dựa trên pixel thường phát hiện các loại giả mạo các phép nối (Clonning), lấy mẫu lại (Resampling), chia (Spilicing), ảnh thu nhỏ (Thumbnails).

1.2.2.2 Kỹ thuật dựa trên định dạng

Ảnh được lưu trữ dưới nhiều định dạng khác nhau, chẳng hạn như BMP, TIFF, JPEG,… Nên phát hiện ảnh giả mạo dựa trên định dạng cũng rất khả quan. Định dạng phổ biến nhất vẫn là JPEG, có nhiều nghiên cứu phát hiện giả mạo dựa trên các tính chất của quá trình nén JPEG như đầu của tệp JPEG (JPEG Header), tính chất của phép biến đổi cosin rời rạc (DCT), phép lượng tử hóa (JPEG Quantization), nén JPEG hai lần (double JPEG compression),...

1.2.2.3 Kỹ thuật dựa trên thiết bị thu nhận

Các ảnh được thu nhận bằng các máy ảnh, thiết bị thu nhận khác nhau với nhiều chủng loại, nhiều hãng sản xuất. Với mỗi loại, mỗi hãng sản xuất lại có những đặc điểm liên quan đến quá trình thu nhận và xử lý ảnh khác nhau, nên dựa vào

những đặc điểm này cũng có thể phát hiện được ảnh giả mạo. Chẳng hạn như dựa vào màng lọc màu nội suy (Color Filter Array), quang sai màu sắc (Chromatic Aberration), mẫu nhiễu cảm biến (Sensor Noise pattern).

1.2.2.4 Kỹ thuật dựa trên đặc tính vât lý

Kỹ thuật này dựa trên ước lượng các đặc tính vật lý của ảnh sáng môi trường, chẳng hạn như hướng nguồn sáng, sự xung đột của các nguồn sáng, ánh sáng môi trường, các xung đột của bóng, các đối tượng bị ảnh hưởng bởi ánh sáng.

1.2.2.5 Kỹ thuật dựa trên đặc tính hình học

Điểm chính của kỹ thuật là sự phản chiếu của hình ảnh lên mặt phẳng. Kỹ thuật dựa trên các phép biến đổi hình ảnh như phép chiếu, phép đổ bóng để khảo sát sự không đồng nhất của ảnh để phát hiện giả mạo.

1.3 MỘT SỐ PHÉP BIẾN ĐỔI MA TRẬN

Các phương pháp phòng chống và phát hiện giả mạo ảnh sử dụng rất nhiều các phép biến đổi ma trận, đến nay vẫn được tiếp tục nghiên cứu và phát triển, như [13,28,54,55,75,109,110]. Mục tiêu của luận án là nghiên cứu các phép biến đổi ma trận từ đó cải tiến, đề xuất các phương pháp phòng chống và phát hiện giả mạo. Do vậy, trong phần này trình bày một số phép biến đổi ma trận SVD, QR, DCT, DWT, NMF được dùng để xây dựng các phương pháp trong luận án.

1.3.1 Phép phân tích SVD

Mọi ma trận thực Y cấp m×n cho trước luôn luôn có thể phân tích thành tích

của 3 ma trận thực như sau [47]:

T V D U Y Trong đó : U là ma trận trực chuẩn cấp m×m. V là ma trận trực chuẩn cấp n×n.

D là ma trận đường chéo cấp m×n có tính chất: D(1,1)≥D(2,2)≥...≥D(s,s)≥0, với s=min(m,n).

Sau khi biến đổi SVD với ma trận Y thu được ma trận D là ma trận đường

chéo, phần tử D(1,1) có giá trị lớn nhất và có tính ổn định hơn các phần tử khác, nên thường sử dụng phần tử D(1,1) làm đặc trưng đại diện hoặc vị trí nhúng thủy

vân.

1.3.2 Phép phân tích QR

Mọi ma trận thực Y cấp m×n cho trước luôn luôn có thể phân tích thành tích

của 2 ma trận thực như sau [47]:

Y = Q×R

Trong đó:

Q là ma trận trực chuẩn cấp m×m. R là ma trận tam giác trên cấp m×n.

Tương tự như phép biến đổi SVD, sau khi thực hiện biến đổi QR với ma trận Y thu được ma trận R là ma trận có các phần tử ở hàng 1 có giá trị lớn nhất và có tính ổn định hơn các phần tử ở các hàng khác. Nên thường sử dụng các phần tử hàng 1 này làm đặc trưng đại diện hoặc vị trí nhúng thủy vân.

1.3.3 Phép biến đổi cosine rời rạc

Trong ứng dụng, phép biến đổi DCT hai chiều thường áp dụng trên các khối dữ liệu điểm ảnh để nhận được các khối DCT gồm 64 phần tử. Để nâng cao tốc độ thực hiện, biến đổi DCT hai chiều thường được tiếp cận theo phương pháp ma trận. Dưới đây trình bày lần lượt các phép biến đổi DCT 1 chiều, 2 chiều theo

1.3.3.1 Phép biến đổi cosine rời rạc một chiều

Theo [108], biến đổi DCT một chiều ứng với dãy ở miền quan sát để nhận được dãy trong miền tần số tính theo công thức:

trong đó:

Các giá trị được gọi là miền cosine rời rạc (miền DCT), hệ số đầu tiên được gọi là phần tử DC (Direct Current), những hệ số còn lại được gọi là các phần tử AC (Alternative Current).

Khi đó, biến đổi IDCT một chiều tương ứng thực hiện theo công thức:

Theo [108], một trong những tính chất quan trọng của phép biến đổi DCT là sự tập trung năng lượng nghĩa là năng lượng của ảnh sẽ được dồn vào một số phần tử của ma trận sau khi biến đổi (Năng lượng ở đây được hiểu là tổng của bình phương các phần tử ma trận điểm ảnh), đặc biệt đối với những dữ liệu có sự tương quan cao như ảnh, âm thanh và video (Tương quan cao ở đây được hiểu là giá trị điểm ảnh tại một điểm và lân cận của nó có sự chênh lệch nhỏ). Trên miền DCT, năng lượng tập trung vào một số phần tử đầu tiên, đặc biệt là phần tử DC. Các phần tử còn lại thường có giá trị nhỏ (tính theo giá trị tuyệt đối), thường xấp xỉ bằng 0.

Ví dụ, với dãy sau khi biến đổi cosine rời rạc một chiều ta nhận được miền DCT tương ứng:

1.3.3.2 Phép biến đổi cosine rời rạc hai chiều

Phép biến đổi DCT một chiều chỉ phù hợp với kiểu dữ liệu âm thanh. Đối với dữ liệu có quan hệ hai chiều (hàng và cột) như dữ liệu ảnh ta có thể áp dụng hai lần biến đổi DCT một chiều: một lần theo hàng và một lần theo cột, do đó được gọi là biến đổi DCT hai chiều.

Theo [108], phép biến đổi DCT hai chiều ứng với ma trận cấp ở miền quan sát để nhận được ma trận ở miền tần số tính theo công thức:

với và xác định theo công thức:

Khi đó, hệ số đầu tiên được gọi là phần tử DC và các hệ số còn lại là AC. Phép biến đổi IDCT hai chiều ứng với hệ số DCT của ma trận về miền quan sát tính theo công thức:

với .

Theo [108], ma trận cosine rời rạc cấp là ma trận trực chuẩn và được tính theo công thức:

với và .

Khi đó, phép biến đổi DCT hai chiều theo cách tiếp cận ma trận được tính theo công thức:

và biến đổi IDCT hai chiều:

Do là ma trận trực chuẩn nên ma trận chuyển vị cũng chính là ma trận nghịch đảo của . Do vậy, phép biến đổi DCT và IDCT luôn bảo toàn phổ dữ liệu.

1.3.4 Phép biến đổi wavelet rời rạc

Giống như phép biến đổi DCT, phép biến đổi wavelet rời rạc (DWT) [36,84,108] giữ vai trò quan trọng trong lĩnh vực xử lý dữ liệu đa phương tiện và là chuẩn nén ảnh JPEG 2000. Khác với biến đổi DCT, năng lượng của ảnh trên miền DWT tập trung khá đồng đều vào một số phần tử góc trên bên trái. Nhờ vậy, ta có thể áp dụng phép biến đổi DWT nhiều lần (mức) cho một ảnh bằng cách thực hiện liên tiếp phép biến đổi này trên các phần tử góc trên bên trái để đạt được độ tập trung năng lượng theo yêu cầu của ứng dụng.

1.3.4.1 Một số ký hiệu và khái niệm

Dưới đây sẽ ký hiệu Rn

là tập các véc tơ thực cấp n biểu diễn dưới dạng cột,

Rmxn là tập các ma trận thực cấp m×n (m hàng n cột). Với n R

Xm n

R

A , kí hiệu: X(i) là phần tử thứ i của X, A(i) là cột thứ i của A, A[i] là hàng i của A (khi đó

m R i A( ) , T n R i

A[] ), A(i,j) là phần tử ở hàng i cột j của A. Với véc tơ X (hàng hoặc cột), ký hiệu Sum(X) là tổng các phần tử của X. Như vậy đối với ma trận A thì:

Sum(A(i)) là tổng các phần tử trên cột i của A.

Chuẩn ma trận được sử dụng dưới đây là chuẩn Euclid:

m i n j j i A A 1 1 2 ) , ( Năng lượng của ma trận A được hiểu là 2

Một phần của tài liệu (LUẬN án TIẾN sĩ) một số kỹ thuật phòng chống giả mạo ảnh số luận án tiến sĩ hệ thống thông tin 62 48 01 04 (Trang 30 - 41)