Công nghệ thủy vân trên ảnh số

Một phần của tài liệu nghiên cứu và đề xuất phương pháp chống tấn công in-quét trong thủy vân số (Trang 26)

Chƣơng 1 TỔNG QUAN VỀ THỦY VÂN SỐ

1.8. Công nghệ thủy vân trên ảnh số

Công nghệ thủy vân (Watermark) là sử dụng một Dấu thủy vân nhúng vào trong một ảnh gốc (Original Image) để tạo thành ảnh có chứa thủy vân (Watermarked Image). Đơi khi ngƣời ta cịn sử dụng cả khóa mật trong q trình nhúng. Một quá trình phát hiện dấu thủy vân sẽ đƣợc thực hiện nếu nhƣ phát hiện thấy một bản ảnh có quan hệ với ảnh gốc và nếu nhƣ dấu thủy vân nằm trong ảnh cần phát hiện thì nó sẽ đƣợc trích ra nhƣ trạng thái ban đầu.

1.8.1. Dấu thủy vân

Dấu thủy vân có chứa thơng điệp bên trong gồm ba loại nhƣ sau: Một chuỗi các bit nhị phân.

Một ảnh.

Một chuỗi số dấu phẩy động có một đặc tính nào đó.

Ba loại dấu thủy vân này dẫn đến các thuật toán nhúng và phát hiện là khác nhau.

Với dấu thủy vân là một chuỗi bit có dạng mã ASCII hoặc một dạng mã nào đó có thể đƣợc sử dụng để nhúng thông điệp. Các đoạn mã lỗi tƣơng ứng có thể đƣợc sử dụng để tăng khả năng phát hiện ra dấu thủy vân sau khi bị tấn công.

Dấu thủy vân là một ảnh sẽ đƣợc sử dụng vào trong q trình nhúng mà mắt ngƣời khơng nhận biết đƣợc sự tồn tại của dấu thủy vân-Nhúng Invisible. Tại đây khi dấu thủy vân đƣợc trích ra sẽ đƣợc so sánh với dấu thủy vân gốc. Tuy vậy dấu thủy vân là ảnh thƣờng không đƣợc thuận lợi khi sử dụng trong một hệ thống lớn.

Khi dấu thủy vân là một chuỗi số thực mang một đặc tính nào đó thì thơng thƣờng các chuỗi số này đƣợc sử dụng để kiểm tra bởi vì chuỗi số thực bất kì thƣờng có cấu trúc tƣơng tự với nhiễu. Dƣới đây là các biến số đƣợc qui định trong phần thuật tốn đƣợc sử dụng trong q trình thủy vân.

Biến số Ý nghĩa

X×Y Kích thƣớc của ảnh đƣợc nhúng dấu thủy vân. I Ảnh gốc cần đƣợc nhúng dấu thủy vân.

I‘ Ảnh sau khi đã nhúng dấu thủy vân. I‘‘ Ảnh có thể đã đƣợc nhúng dấu thủy vân.

S,N Cặp dấu thủy vân và kích thƣớc của dấu thủy vân. sk Giá trị mà nếu dấu thủy vân của ta là một chuỗi bit. s(x,y) Giá trị mà nếu dấu thủy vân của ta là một ảnh. α Trọng số nhúng.

Bảng 1.1. Bảng giá trị các biến

1.8.2. Quá trình nhúng dấu thủy vân tổng quát.

Các thuật toán chọn các đặc trƣng quan trọng của ảnh gốc sao cho chúng có thể thao tác đƣợc. Phụ thuộc vào loại thuật toán và loại phƣơng tiện, các đặc trƣng là khác nhau, ví dụ với ảnh các đặc trƣng có thể là các hệ số trong miền DCT, độ sáng trong khối 8×8 của miền khơng gian,... Các đặc trƣng đƣợc chọn là các đặc trƣng chính phân biệt các thuật tốn với nhau.

Các đặc trƣng có thể thao tác đƣợc này, ta gọi là vị trí nhúng. Bắt đầu bằng tất cả các vị trí nhúng có thể-tập này nên có số lƣợng phần tử lớn ta sẽ bắt đầu xử lý chọn.

Chọn ngẫu nhiên vị trí nhúng: Trong phƣơng pháp này khóa đƣợc sử dụng

nhƣ là đầu vào của bộ tạo số giả ngẫu nhiên (PRNG). Với các số giả ngẫu nhiên này, ta chọn một tập con từ tập các vị trí nhúng khả dụng của chúng ta. Đây là ý tƣởng của kỹ thuật trải phổ (spread spectrum).

Chọn ví trí nhúng theo chất lượng: Việc tiếp theo là loại bỏ các vị trí nào

Hình 1.3: Sơ đồ nhúng thủy vân tổng quát

Tiền xử lý dấu thủy vân: Dấu thủy vân bản thân nó là đã đƣợc tiền xử lý để

dễ dàng khôi phục từ lỗi. Phƣơng thức đơn giản để thực hiện điều này là lặp mọi bit trong dấu thủy vân cr lần, thừa số cr đƣợc gọi là tốc độ chip. Các phƣơng pháp phức tạp hơn bao gồm mã hóa Hamming hoặc mã hóa Reed Solomon.

Khn dạng của dấu thủy vân: Khuôn dạng của dấu thủy vân đƣợc sử dụng

để phát hiện dịch chuyển, biến đổi hay loại biến đổi hình học nào khác có thể áp dụng đƣợc trên ảnh. Một ví dụ đơn giản về khn dạng cảu dấu thủy vân là dấu thủy vân có thể là các chuỗi bit (0,1). Hoặc một dấu thủy vân có thể là dấu thủy vân chỉ dẫn, khi chúng ta lấy dấu thủy vân ra thì khơng cần đến ảnh gốc.

Nhúng: Dấu thủy vân đƣợc nhúng tại vị trí đã chọn vào trong ảnh gốc.

Kết hợp ảnh đã thủy vân và ảnh gốc: Để cải thiện đặc tính cảm nhận của hệ

thống giác quan con ngƣời với ảnh đã thủy vân. Thông thƣờng, ảnh đã thủy vân I* và ảnh gốc I đƣợc cộng theo từng điểm ảnh (thƣờng là miền không gian) với trọng số cục bộ I’ = I* + (1- ) I.

Kết quả là ảnh đã đánh dấu I‘có tính cảm nhận cao hơn so với ảnh I* ban đầu. Khơng phải mọi thuật tốn đều sử dụng tất cả các bƣớc, nhƣng ta thấy rằng hầu hết các thuật tốn có thể trình bày và thực thi bằng cách sử dụng khung công việc này.

1.8.3. Quá trình phát hiện dấu thủy vân.

Phát hiện dấu thủy vân là quá trình nhận biết và tái tạo lại dấu thủy vân ban đầu sau các phép thao tác với ảnh gốc bằng nhiều phƣơng pháp. Vấn đề ở đây là có thể dấu thủy vân lấy ra khơng có chất lƣợng và tồn tại sai số so với dấu thủy vân gốc vì nhiều nguyên nhân khác nhau. Đƣơng nhiên việc phát hiện dấu thủy vân không chỉ đơn thuần là việc tồn tại hay không tồn tại dấu thủy vân, song nếu dấu thủy vân lấy ra có sự sai khác so với gốc thì kết quả chả khác gì việc chúng ta thu đƣợc một giá trị lửng lơ, dấu thủy vân có tồn tại đấy nhƣng khơng biết nguồn gốc ở đâu. Vì vậy cần phải chú ý không nên công khai các phƣơng thức phát hiện dấu thủy vân vì nếu nắm đƣợc các phƣơng thức đó thì kẻ tấn cơng có thể lợi dụng nó phá hủy dấu thủy vân của chúng ta. Hãy lấy ví dụ là một kịch bản sau:

Kịch bản (Công khai phƣơng pháp phát hiện dấu thủy vân):

Bob công bố bức ảnh I’ của mình lên trên mạng với dấu thủy vân xác thực S trên ảnh I’. Đồng thời Bob đưa ra phương pháp phát hiện dấu thủy vân δ(I’) một cách cơng khai. Khi đó kẻ tấn cơng có thể lợi dụng vào δ(I) để làm hỏng dấu thủy vân mà không cần phá hủy ảnh gốc. Như vậy, điều quan trọng là kẻ tấn công dùng cách nào để lấy dấu thủy vân đó ra. Rất đơn giản, có thể dùng mọi cách để phá hủy dấu thủy vân, cứ khi nào tấn cơng xong thì chỉ việc dùng δ(I) kiểm tra lại là sau phép tấn cơng của mình dấu thủy vân đã bị sai lệch như thế nào và hắn sẽ lựa chọn phương pháp tốt nhất.

Kịch bản trên lí giải tại sao hầu hết thuật tốn đều có sử dụng khóa mật và chỉ khi nào bạn biết đƣợc khóa mật mới có thể lấy ra đƣợc thủy vân dấu bên trong. Do đó, bộ phát hiện có thể cần đến bất cứ thơng tin nào trong số các thông tin sau:

Ảnh gốc. Dấu thủy vân.

Khóa bí mật (nếu có sử dụng).

Nếu q trình phát hiện dấu thủy vân mà khơng cần đến ảnh gốc thì q trình đó chúng ta gọi là ―oblivious‖ hay ―blind‖. Trong trƣờng hợp ngƣợc lại thì quá trình phát hiện của ta đƣợc gọi là ―non-blind‖.

Một số bộ phát hiện chỉ tính tốn xác suất có mặt dấu thủy vân trong ảnh kiểm tra I’’, trong khi bộ phát hiện khác đọc dấu thủy vân, thu đƣợc dấu thủy vân tái tạo

S’’. Bây giờ ta sẽ đánh giá cả hai khả năng có thể này.

Khả năng 1: Chỉ phát hiện dấu thủy vân.

Trong quá trình kiểm tra sự tồn tại của dấu thủy vân thì kết quả có hai giả định sau:

Giả định H0: Chỉ có nhiễu tồn tại.

Giả định H1: dấu thủy vân và nhiễu cùng tồn tại.

Tạp nhiễu ở đây thƣờng là nhiễu GAUSSIAN với trị trung bình khơng và nó thƣờng tồn tại độc lập trong các miền tần số khác nhau. Với các thuật tốn phát hiện khơng dùng ảnh gốc thì bản thân ảnh đã là một loại nhiễu, nó có khn dạng giống nhƣ nhiễu GAUSSIAN vậy.

Khả năng 2: Tách ra dấu thủy vân.

Chi tiết của q trình tách dấu thủy vân đƣợc mơ tả trong mỗi thuật toán. Mỗi khi tính tốn dấu thủy vân tái tạo S’’, có một số phƣơng pháp thơng thƣờng đƣợc sử dụng để so sánh S’’ với S và quyết định xem dấu thủy vân có tồn tại hay khơng.

Phép đo đơn giản cho chuỗi bit là tỉ số lỗi bit (BER). BER bằng 0 nếu khơng có lỗi truyền dấu thủy vân, bằng 1 nếu các bit đều truyền sai hết, và nếu tín hiệu bị loại bỏ hồn tồn. Đặt:

'' '' : 0 : 1 i i i i i s s s s p

Sau đó, tỉ số lỗi bit đƣợc tính tốn nhƣ sau:

N p S

S

BER( , ") i

Ngồi ra một số thuật tốn khác còn sử dụng hệ số tƣơng quan chuẩn với dấu thủy vân là chuỗi bit với trị trung bình khơng.

2 '' 2 // ) '' , ( i i i i s s s s S S NC

Nếu dấu thủy vân là một chuỗi các bit si {-1, 1}, BER của 1 (đảo bit) là tƣơng đƣơng với tƣơng quan bằng -1. Khi đó tỉ số lỗi bình phƣơng nhỏ nhất đƣợc tính tốn nhƣ sau: 2 2 '' ) '' , ( i i i s s s S S LSE

Từ đó chúng ta sẽ tính ra tỉ số biến đổi từ tín hiệu thành nhiễu (SRN) theo công thức sau:

SNR(S,S‘‘) = -10 log10(E(S,S‘‘)).

Với các phép đo này, ngƣỡng t có thể đƣợc sử dụng để quyết định xem nếu dấu thủy vân tồn tại. Ví dụ:

Dấu thủy vân tồn tại nếu NC(S,S‘‘) > tα.

Dấu thủy vân không tồn tại nếu NC(S,S‘‘) tα. Ở đây, tα đƣợc xác định từ hệ thức sau:

(x)dx = α/2. Ở đây, (x) là hàm phân phối Student , có dạng:

(x) = ( Γ(p+1)/2)/( Γ(p/2). Γ(1/2).√p , α là mức sai lầm loại một cho trƣớc,

Còn Γ(p) = dx là hàm Gamma đã đƣợc lập bảng theo giá trị p đã cho.

1.9. Phân tích ảnh hƣởng của q trình in - quét

Nhằm thiết kế thuật toán thủy vân số bền vững sau khi in - qt có thể rút trích chính xác, phần này sẽ mơ tả ngun lý của q trình in qt, phân tích các tấn cơng của quá trình in - quét đối với ảnh kỹ thuật số, đồng thời đƣa ra những đối sách khắc phục thƣờng dùng cho các tấn công chủ yếu gặp phải trong quá trình trên, nghiên cứu nhằm nắm vững mang tính định lƣợng và định tính về tổng thể q trình tấn cơng phức tạp này đối với in - quét, đƣa ra những chuẩn bị cần thiết và kiến thức bối cảnh liên quan về việc thiết kế, nghiên cứu thuật toán thủy vân số chống in - quét. Do model của máy in, máy quét khác nhau và môi trƣờng thực nghiệm khác nhau nên phần này chỉ đề cập đến tính năng chung của máy in và máy quét.

1.9.1. Ảnh hưởng của quá trình in đối với ảnh kỹ thuật số

Cùng với sự tiến bộ không ngừng của khoa học công nghệ thơng tin, máy in hiện nay đều có thể thu đƣợc bản copy ảnh kỹ thuật số có chất lƣợng thị giác tƣơng đối tốt. Thông thƣờng, tấn công của máy in laser đối với ảnh kỹ thuật số lúc in chủ yếu là attack Halftone, tấn công lọc các tần thấp, và tấn cơng hình học.

Đối với hình ảnh số Grayscale, máy in laser áp dụng hiệu ứng Halftone dùng lƣới đen trắng in. Máy in laser thông thƣờng dùng kỹ thuật Halftone làm phƣơng pháp ditering, điểm xuất phát nguyên lý cơ bản là: Đại bộ phận ảnh kỹ thuật số đều có một kết cấu nhất định, trên bất kỳ cục bộ nhỏ nào của hình ảnh, kết cấu thƣờng tƣơng tự nhau, giá trị Grayscale pixel cũng khá gần nhau, hơn nữa thị giác của mắt ngƣời có đặc tính khơng gian tần thấp. Phƣơng pháp ditering lợi dụng một vài đặc tính này, dùng một tổ điểm in đại diện một tổ điểm ảnh tƣơng đồng, đồng thời thông qua một vài tổ điểm này tổng hợp thể hiện hiệu quả Grayscale tổng thể của các điểm ảnh này. Thơng thƣờng hình ảnh tạo ra từ hiệu ứng Halftone phƣơng pháp ditering về đại thể đồng nhất với hình ảnh ban đầu, chi tiết cục bộ thƣờng tồn tại biến dạng. Tình trạng thƣờng gặp là trên hình ảnh xuất hiện Jitter cao tần, đồng thời các nhân tố nhƣ hình dạng của điểm phù hợp Hafttone, khuếch tán chùm tia laser, đặc tính của giấy, độ bóng..v..v.. đều có thể gây ra sự biến đổi của điểm phù hợp Hafttone, thƣờng dẫn đến hình ảnh in mờ, đƣờng biên hình ảnh tăng nhiều. Do đó, sự biến hóa Halftone trong q trình in có ảnh hƣởng khá lớn đối với hình ảnh ban đầu, thay đổi thông tin ban đầu của hình ảnh, gây ra attack Halftone đối với watermarking. Do đa số hiện thực cụ thể của các nhà sản xuất máy in không công khai, cũng khiến việc khắc họa đối với attack này khó định lƣợng, hoặc hạn chế ứng dụng của thuật toán thủy vân số dựa vào thiết bị in cụ thể.

Ngoài ra, máy in laser là thiết bị tần thấp điển hình, phần lớn chi tiết thấp tần của hình ảnh sau khi in (phần tập trung phản ánh thơng tin hình ảnh) đƣợc giữ lại, nhƣng lại làm mất phần lớn chi tiết cao tần của sản phẩm in ấn. Do đó, q trình in vẫn gây ra tấn cơng lọc tần thấp với hình ảnh. Các loại nhiễu và hệ thống điểm đạt đƣợc của bản thân các thiết bị máy in cũng dễ dẫn đến hình ảnh sau khi in bị mờ. Môi trƣờng trong máy in do dễ bị ô nhiễm từ mực in, cộng thêm bụi mạt giấy bên ngồi, mực in khơng đủ….cũng dẫn đến chất lƣợng sản phẩm in thấp. Sự mòn xƣớc trong quá trình sử dụng cũng nhƣ độ nét của hình ảnh bị giảm.

Do sự can thiệp của nhân công thao tác, ngƣời thao tác in thƣờng không thể đặt sản phẩm in vào vị trí dự định của máy in một cách hồn tồn chính xác. Ngƣời

thao tác rất có khả năng lúc đặt giấy in vào máy in bị nghiêng, xoay, cong vênh nhỏ, khiến sản phẩm sau khi in phát sinh cong vênh, nghiêng tƣơng ứng. Cùng với thời gian sử dụng lâu, trên vỏ cứng điện trở mẫn nhiệt sẽ dính mực in và một số tạp chất, ảnh hƣởng đến cảm ứng nhiệt của nó, khiến nhiệt độ đèn gia nhiệt tăng cao, dẫn đến giấy in bị nhăn, hơn nữa cịn gây ra biến dạng hình học đối với hình ảnh sản phẩm in. Có thể thấy q trình in vẫn gây ra tấn cơng hình học đối với hình ảnh kỹ thuật số ban đầu.

Hình 1.4. Sơ đồ kết cấu bên trong máy in laser

Hình 1.4 miêu tả kết cấu bên trong của máy in laser, có thể thấy máy in do khá nhiều linh phụ kiện tạo thành, nếu nghiên cứu từng linh phụ kiện, miêu tả chính xác số học, có độ khó nhất định. Hơn nữa, nếu khơng thể miêu tả số học chính xác ảnh Hình ảnh

ban đầu

RIP

Máy hỗn xung

Hộp mực tonner cảm quang Con lăn hiện ảnh

Con lăn áp lực Bản sao cứng Cơ cấu chấp hành Hệ thống khống chế

Con lăn nạp điện

Con lăn giấy

Con lăn định ảnh Thấu kính F- Hệ thống quang học Nguồn laser Thấu kính mặt trụ Hệ thống chụp ảnh điện tử

hƣởng của các quá trình đối với điểm ảnh hình ảnh, sẽ khơng có ý nghĩa thực tế lớn, mà giá phải trả quá đắt.

RIP là từ viết tắt của cụm từ Raster Image Processing, tạm dịch là quá trình phân điểm ảnh. Đây là một quá trình biến đổi (biên dịch) các dữ liệu hình ảnh, chữ viết thành dạng dữ liệu bitmap, sau đó dữ liệu sẽ đƣợc gửi đến thiết bị in/ghi để điều khiển việc xuất dữ liệu (điều khiển đầu in/ghi hoặc khơng in/ghi lên vật liệu). Nói chung là trƣớc khi in/ghi thì phải RIP cái đã (vì máy in hay ghi nó chỉ hiểu đƣợc dữ liệu bitmap sau khi RIP mà thôi). Quá trình RIP địi hỏi thực hiện rất nhiều giai đoạn, phép tốn phức tạp nên ban đầu nó đƣợc xử lý trên các thiết bị chuyên dụng

Một phần của tài liệu nghiên cứu và đề xuất phương pháp chống tấn công in-quét trong thủy vân số (Trang 26)

Tải bản đầy đủ (PDF)

(82 trang)