Kỹ thuật phân tích cặp mẫu SPA

Một phần của tài liệu (Luận văn thạc sĩ) tìm hiểu một số thuật toán giấu tin mật trong ảnh kỹ thuật số và xây dựng một thuật toán giấu tin mật​ (Trang 38 - 44)

CHƯƠNG I: TỔNG QUAN VỀ KỸ THUẬT GIẤU TIN TRONG ẢNH

CHƯƠNG 2 MỘT SỐ THUẬT TOÁN GIẤU TIN MẬT TRONG ẢNH SỐ

2.2 Kỹ thuật phát hiện ảnh có giấu tin mật

2.2.3 Kỹ thuật phân tích cặp mẫu SPA

Kỹ thuật phân tích cặp mẫu SPA (Sample pair Analysis) do Sorina Dumitrescu et.al đưa ra nhằm phát hiện các giấu tin mật LSB thông qua việc phân tích cặp mẫu.

Khi tỉ lệ giấu tin lớn hơn 3% thì phương pháp này có thể ước lượng độ dài đã giấu với độ chính xác tương đối cao. [12]

Kỹ thuật SPA dựa trên lý thuyết về xích hữu hạn trạng thái. Các trạng thái của xích hữu hạn trạng thái được chọn từ tập hỗn hợp (multisets) các cặp mẫu được gọi là tập hỗn hợp dấu vết (trace multisets). Trước khi giấu tin, các phần tử trong cặp có

quan hệ với nhau theo một độ đo nào đó. Nhưng sau khi giấu tin LSB một cách ngẫu nhiên thì các tập này sẽ thay đổi và nó dẫn đến những thay đổi các quan hệ thống kê.

Giả sử rằng ta có các cặp mẫu liên tiếp nhau s1, s2,…, sN (các chỉ số thể hiện vị trí của một mẫu trên ảnh). Một cặp mẫu là một bộ hai (si, sj) 1 i, j N. Đặt P là tập tất cả các cặp mẫu được lấy ra từ một ảnh. P có thể coi như là một tập hỗn hợp của các bộ hai (u, v), trong đó u và v là các giá trị của hai mẫu. Nếu không có gì ngoại lệ thì bộ hai (u, v) hoặc các phần tử của P luôn tham chiếu đến giá trị của các mẫu khác nhau được lấy ra từ ảnh.

Định nghĩa Dn = {(u,v)  P | |u-v| = n} là một tập con của P chứa cặp mẫu có dạng (u,u+n) hoặc (u+n,u) trong đó n là một số nguyên cố định 0 n  2b-1, b là số bit nhị phân biểu diễn mỗi giá trị mẫu. Hay nói cách khác các cặp mẫu trong Dn sai khác nhau một lượng bằng n. Từ việc giấu tin chỉ ảnh hưởng tới các bit LSB nên ta sử dụng nhiều nhất là (b-1) bit tín hiệu trong việc lựa chọn các tập hỗn hợp đóng này.

Với mỗi số nguyên m, 0  m  2b-1-1 ta định nghĩa tập Cm là tập con của P có chứa các cặp mẫu mà giá trị của nó chỉ sai khác nhau m trong (b-1) bit dầu tiên.

𝐶𝑚 = {(𝑢, 𝑣) ∈ 𝑃⁄𝑢−𝑣2 =𝑚} 𝑣ớ𝑖 0 ≤ 𝑚 ≤ 2𝑏−1− 1.

Xét mối quan hệ giữa Cm và Dn

+ Ta có Cm chứa D2m. Thật vậy, nếu (u, v) là một cặp trong D2m (|u-v| = 2m) thì cả u và v cùng chẵn hoặc cùng lẻ. Bằng việc dịch phải một bít và lấy sai phân trị tuyệt đối ta thu được giá trị |u-v|/2 và do đó cặp (u, v)  Cm.

+ D2m+1 = Cm  Cm+1 hay các cặp mẫu của tập D2m+1 là giao của hai tập Cm và Cm+1. Thật vậy, nếu cặp (u,v)  D2m+1 thì (u,v) có thể có dạng là (2k-2m-1,2k), (2k, 2k-2m-1), (2k-2m, 2k-1) hoặc (2k+1, 2k-2m) với mọi k. Cặp (2k-2m-1, 2k), (2k, 2k- 2m-1) thuộc tập Cm+1 vì bằng phép dịch phải một bit các giá trị 2k và 2k-2m-1 theo thứ tự sẽ là thu được giá trị k và k-(m+1) và như vậy chúng sẽ vẫn sai khác nhau m+1.

Hai cặp (2k-2m, 2k+1) và (2k+1, 2k-2m) thuộc Cm vì bằng phép dịch phải một bit thì giá trị của 2k+1 và 2k-2m theo thứ tự thu được giá trị là k và k-m, vậy chúng vẫn sai khác nhau là m.

Ta phân hạch D2m+1 thành hai tập con X2m+1 và Y2m+1, trong đó

X2m+1 = D2m+1  Cm+1

Y2m+1 = D2m+1  Cm với 0  m  2b-1 và X2b-1=, Y2b-1 = D2b-1

Cả hai tập X2m+1 và Y2m+1 đều là những tập con của P. Tập X2m+1 chứa các cặp (u,v) có dạng (2k-2m-1, 2k) hoặc (2k, 2k-2m-1). Tập Y2m+1 chứa các cặp (u,v) có dạng (2k-2m, 2k +1) hoặc (2k+1, 2k-2m). Những cặp mà trong đó thành phần chẵn lớn hơn sẽ nằm trong tập X2m+1 còn những cặp mà trong đó thành phần lẻ lớn hơn sẽ nằm trong tập Y2m+1 và tất cả các cặp này đều sai khác nhau 2m+1. Với các ảnh có tín hiệu chuẩn, xác suất để một cặp mẫu ở trong tập D2m+1 có các thành phần chẵn lớn hơn hoặc nhỏ hơn là như nhau. Điều đó có nghĩa là với số nguyên m bất kỳ, 0  m  2b-1-2 ta có kỳ vọng toán: E (|X2m+1|) = E (|Y2m+1|)

Để phân tích ảnh hưởng của việc giấu tin LSB trên các cặp mẫu ta xem xét 4 trường hợp có thể xảy ra của việc “lật” bit LSB theo mẫu, gọi mẫu {00, 01, 10, 11}, với 1 biểu thị cho một (hoặc nhiều) mẫu trong một cặp có bị đảo bit, 0 biểu thị cho một (hoặc nhiều) mẫu vẫn giữ nguyên (không bị đảo bit).

Với mỗi m, 0  m  2b-1-1, tập Cm được phân hoạch thành X2m-1, D2m, Y2m+1. Ta thấy Cm là đóng đối với phép giấu nhưng với tập con thành phần X2m-1, D2m, Y2m+1

thì không. Lấy một cặp mẫu (u, v) tùy ý của X2m-1thì (u, v) có thể có dạng (2k-2m+1, 2k) hoặc (2k, 2k-2m+1). Bằng việc chuyển đổi cặp mẫu (u, v) qua mẫu  = 10 ta thu được mẫu (u’, v’) = (2k-2m, 2k) hoặc (u’,v’) = (2k+1, 2k-2m+1). Tương tự, nếu (u, v) được thay đổi thông qua mẫu 01 thì (u’, v’) = (2k-2m+1, 2k+1) hoặc (u’, v’) = (2k, 2k-2m). Rõ ràng X2m và Y2m tạo thành một phân hoạch của D2m.

Như vậy, Cm với 0  m  2b-1-1 có thể phân hoạch thành bốn tập con X2m-1, X2m, Y2m, Y2m+1 được gọi là các tập hỗn hợp dấu vết (trace submultisets) của Cm. Hơn nữa Cm là đóng nhưng 4 tập con là mở đối với các thao tác giấu tin LSB. Điều này giống như một máy trạng thái hữu hạn được mô tả trên hình 2.1

Hình 2.1, có các trạng thái (các nút tròn) chính là các tập con của Cm. Các cung được gắn nhãn  là mẫu chuyển đổi nối từ trạng thái A sang trạng thái B thể hiện bằng bất kỳ cặp mẫu nào trong A sẽ trở thành một cặp mẫu trong B nếu áp dụng

Hình 2.4 Xích hữu hạn trạng thái với các trạng thái là các tập con của Cm (m > 0)

Tập C0 là đóng đối với phép giấu tin LSB và có thể được phân hoạch thành hai tập Y1 và D0. Hình 2.2 mô tả một trạng thái cho C0.

Hình 2.5 Xích hữu hạn trạng thái cho tập C0

Ý nghĩa của các xích hữu hạn trạng thái trong hình 2.1 và hình 2.2 là có thể đo (một cách thống kê) số các tập con trước và sau khi giấu tin bằng cách sử dụng các xác suất của các mẫu thay đổi trong mỗi tập. Hơn nữa, nếu việc giấu tin LSB được làm một cách ngẫu nhiên trong ảnh thì các xác suất là các độ dài của thông điệp ẩn.

X2m-1 X2m

Y2m Y2m+1

00

00

00

00 10

10 01

11 11

D0 Y1

00, 11

01, 10

00, 11

Với mỗi mẫu chuyển đổi   {00, 10, 01, 11} và với bất kỳ tập con A  P, ta định nghĩa xác suất (, A) là xác suất các cặp mẫu của A bị thay đổi theo mẫu .

Đặt p là chiều dài thông điệp bị giấu trong các bit bị chia bởi tổng số các mẫu trong các ảnh. Khi đó hệ số các mẫu đã thay đổi bằng giấu tin LSB là p/2. Giả sử rằng, các bit thông điệp của giấu tin mật LSB được phân bố ngẫu nhiên trong ảnh, ta có

i) (00, P) = (1-p/2)2

ii) (01, P) = (10, P) = p/2(1-p/2) iii) (11, P) = (p/2)2

Đặt A và B là hai tập con của P sao cho A  B. Ta nói rằng tập A là không chệch đối với tập B nếu (,A) = (,B) ứng với mỗi mẫu biến đổi   {00,10,01,11}.

Khi P = B ta nói rằng A không chệch. Nếu tất cả bốn tập con của Cm là không chệch thì ta nói rằng Cm là không chệch.

Thuật toán SPA Ý tưởng:

Input: Ảnh I cần kiểm tra

Output: p: Xác suất giấu tin trong ảnh Cách thực hiện:

Bước 1: Đọc vào ảnh I.

Bước 2: Đọc các giá trị điểm ảnh vào một ma trận A.

Bước 3: Chia ma trận A thành dãy S gồm N mẫu liên tiếp nhau s1, s2, …sN. Mỗi mẫu silà một giá trị điểm ảnh.

Bước 4: Xác định

P = {(si, sj)} với 1  i, j N.

Bước 5: b = độ dài xâu nhị phân biểu diễn mỗi mẫu.

Bước 6: Với số nguyên n cố định, 0 n  2b-1;

Mỗi (u, v)  P nếu |u-v| = n thì Dn = Dn  {(u, v)}.

Bước 7: Với số nguyên m, 0  m  2b-1-1;

Mỗi (u, v)  P nếu |u-v| /2 = m thì Cm = Cm  {(u, v)}.

Bước 8: Xác định các tập sau:

X2b-1=; Y2b-1 = D2b-1 với 0  m  2b-1-2;

X2m+1 = D2m+1  Cm+1;

Y2m+1 = D2m+1  Cm.

Bước 9: Đặt  = {00, 10, 01, 11}.

Bước 10:

Nếu  = 00 hoặc  = 10 thì tập X’2m-1  X’2mchứa các cặp mẫu của tập X2m-1

 X2m bị thay đổi thông qua các mẫu 00 hoặc 10;

Nếu  = 01 hoặc  = 11 thì tập Y’2m+1  Y’2m chứa các cặp mẫu của tập Y2m+1

 Y2m bị thay đổi thông qua các mẫu 01 hoặc 11.

Bước 11: Tính p;

Nếu E {|X2m+1|} = E {|Y2m+1|} thì p được xác định là nghiệm nhỏ hơn của các phương trình sau:

Nếu m = 0

0

| ' X

|

| ' Y 2 |

p

|) ' X

| 2

| ' Y

| 2

| ' D

|

| ' D

| 2 ( 4

p

|) C

|

| C

| 2 (

1 1

1 1

2 0

2 1

0        

Nếu m  1

0

| ' X

|

| ' Y 2 |

p

| ' X

| 2

| ' Y

| 2

| ' D

|

| ' D (|

4

p

|) C

|

| C (|

1 m 2 1

m 2 1

m 2 1

m 2 2

m 2 m

2 2

1 m

m        

 

Một phần của tài liệu (Luận văn thạc sĩ) tìm hiểu một số thuật toán giấu tin mật trong ảnh kỹ thuật số và xây dựng một thuật toán giấu tin mật​ (Trang 38 - 44)

Tải bản đầy đủ (PDF)

(63 trang)