thị RS của một ảnh kiểm tra

Người ta đã tiến hành thực nghiệm và các kết quả thực nghiệm đã chỉ ra rằng các đường R-M và S-M gần như một đường thẳng trong khi các đường RM và SM xấp xỉ đường cong của một đa thức bậc hai (parabol). Cũng bằng thực nghiệm, ước lượng hai giá trị của RM(1/2) và SM(1/2) từ các mẫu thống kê ta thu được RM(1/2) = SM(1/2).

Để không mất thời gian làm thực nghiệm và để việc ước lượng chiều dài thông điệp được đơn giản hơn ta chấp nhận hai giả thiết sau đây. Các giả thiết này đã được người ta tiến hành thực nghiệm để kiểm chứng [26].

(i) Giao điểm của các đường RM và R-M có cùng tọa độ x với giao điểm của SM, S-M.

(ii) RM(1/2) = SM(1/2).

Trên đồ thị RS, số các nhóm R và S ở p/2 và 1-p/2 tạo thành các đường thẳng (hình 3.4), các điểm còn lại và hai giả thiết (i) và (ii) ở trên cung cấp các ràng buộc đầy đủ để xác định duy nhất các parabol và giao điểm của chúng. Sau khi thay đổi tỷ lệ trên trục x để p/2 thành 0 và 100-p/2 thành 1 bằng phép thế tuyến tính xp = (x-p/2)(1- p), tọa độ x của các giao điểm là nghiệm của phương trình sau:

   3  0

2d1d0 xp2  d0d1d1 d0 xp d0d0 

Trong đó các hệ số đã được chỉ ra trong bước 10 của thuật toán. Cuối cùng ta tính ước lượng độ dài thông điệp p như công thức ở bước 12.

* Độ chính xác của độ dài thông điệp đã đƣợc ƣớc lƣợng

Có ba yếu tố chính ảnh hưởng đến độ chính xác của độ dài thông điệp đã được ước lượng đó là: độ lệch ban đầu, mức độ nhiễu hoặc chất lượng của ảnh mang tin và vị trí của các bit thông điệp trên ảnh [26].

Thứ nhất, độ lệch ban đầu: Kỹ thuật RS có thể cho độ dài thông điệp khác 0 nhờ số chẵn các biến ngẫu nhiên trên ảnh gốc. Độ lệch ban đầu khác không có thể là một số dương hoặc âm và nó đặt ra một giới hạn cho độ chính xác có được của phương pháp RS. Người ta đã tiến hành kiểm tra với một cơ sở dữ liệu gồm 331 ảnh đa cấp xám JPEG và thu được một phân phối Gauss có độ lệch chuẩn 0.5%. Số ảnh nhỏ hơn thì phải có số các biến cao hơn trong độ lệch ban đầu vì số lượng các nhóm R và S là nhỏ hơn. Các ảnh trung gian và các ảnh nhiễu có các biến lớn hơn trong các độ lệch ban đầu. Ngược lại, độ lệch lại rất thấp đối với các ảnh JPEG, các ảnh không được nén thu được qua các camera số, qua máy quét và các các ảnh đã qua bộ lọc xử lý ảnh. Các ảnh mầu cũng cho các biến lớn hơn trong độ lệch so với các ảnh đa cấp xám.

Thứ hai, mức độ nhiễu: Với các ảnh có nhiều nhiễu, sự khác biệt giữa số các điểm ảnh R và S trên ảnh ―cover‖ là nhỏ. Do vậy, các đường trên đồ thị RS giao nhau ở một góc nhỏ và độ chính xác của kỹ thuật RS giảm. Đối với ảnh chất lượng thấp, ảnh đã qua nén và các ảnh nhỏ cũng như vậy.

Thứ ba, vị trí các bít thông điệp trên ảnh: Kỹ thuật RS chính xác hơn nếu các bit thông điệp được phân bố một cách rời rạc ngẫu nhiên trên ảnh.

3.3.4 Kỹ thuật phân tích cặp mẫu SPA

3.3.4.1 Khái niệm cơ bản trong kỹ thuật SPA

Kỹ thuật phân tích cặp mẫu SPA (Sample Pair Analysis) do Sorina Dumitrescu et. al. đưa ra nhằm phát hiện các giấu tin mật LSB thông qua việc phân tích cặp mẫu. Khi tỷ lệ giấu tin lớn hơn 3% thì phương pháp này có thể ước lượng độ dài đã giấu với độ chính xác tương đối cao [23, 27, 28].

Kỹ thuật SPA dựa trên lý thuyết về xích hữu hạn trạng thái. Các trạng thái của xích hữu hạn trạng thái được chọn từ tập hỗn hợp (multisets) các cặp mẫu được gọi là

tập hỗn hợp dấu vết (trace multisets). Trước khi giấu tin, các phần tử trong cặp có quan hệ với nhau theo một độ đo nào đó. Nhưng sau khi giấu tin LSB một cách ngẫu nhiên thì các tập này sẽ thay đổi và nó dẫn đến những thay đổi các quan hệ thống kê.

Giả sử rằng ta có các mẫu liên tiếp nhau s1, s2, …, sN (các chỉ số thể hiện vị trí của một mẫu trên ảnh). Một cặp mẫu là một bộ hai (si, sj) 1 i, j  N. Đặt P là tập tất cả

các cặp mẫu được lấy ra từ một ảnh. P có thể coi như là một tập hỗn hợp (multiset) của các bộ hai (u, v), trong đó u và v là các giá trị của hai mẫu. Nếu không có gì ngoại lệ thì bộ hai (u, v) hoặc các phần tử của P luôn tham chiếu đến các giá trị của các mẫu khác nhau được lấy ra từ ảnh.

Định nghĩa Dn = {(u,v)  P | |u-v| = n} là một tập con (submultiset) của P chứa cặp mẫu có dạng (u, u+n) hoặc (u+n, u) trong đó n là một số nguyên cố định 0  n  2b -1, b là số bit nhị phân biểu diễn mỗi giá trị mẫu. Hay nói cách khác, các cặp mẫu trong Dn sai khác nhau một lượng bằng n. Từ việc giấu tin chỉ ảnh hưởng tới các bít LSB nên ta sử dụng nhiều nhất là (b-1) bit tín hiệu trong việc chọn lựa các tập hỗn hợp đóng này.

Với mỗi số nguyên m, 0  m  2b-1 -1 ta định nghĩa tập Cm là tập con (submultiset) của P có chứa các cặp mẫu mà giá trị của nó chỉ sai khác nhau m trong (b-1) bit đầu tiên.

Cm = {(u, v)  P \

v u

= m} với 0  m  2b-1 -1.

Ta xét mối quan hệ giữa Dn và Cm.

Thứ nhất, ta có Cm chứa D2m. Thật vậy, nếu (u, v) là một cặp trong D2m (|u-v| = 2m) thì cả u và v là cùng chẵn hoặc cùng lẻ. Bằng việc dịch phải một bit và lấy sai phân trị tuyệt đối ta thu được giá trị |u-v|/2 và do đó cặp (u, v)  Cm.

Thứ hai, D2m+1 = Cm Cm+1 hay các cặp mẫu của tập D2m+1 là giao của hai tập Cm

và Cm+1. Thật vậy, nếu cặp (u,v)  D2m+1 thì (u,v) có thể có các dạng sau (2k-2m-1, 2k), (2k, 2k-2m-1), (2k-2m, 2k+1) hoặc (2k+1, 2k-2m) với mọi k. Cặp (2k-2m-1, 2k), (2k, 2k-2m-1) thuộc tập Cm+1 vì bằng phép dịch phải một bit các giá trị 2k và 2k-2m-1 theo thứ tự sẽ là thu được giá trị k và k-(m+1) và như vậy chúng sẽ vẫn sai khác nhau m+1. Hai cặp (2k-2m, 2k+1) và (2k+1, 2k-2m) thuộc Cm vì bằng phép dịch phải một bit thì giá trị của 2k+1 và 2k-2m theo thứ tự thu được giá trị là k và k-m, như vậy chúng vẫn sai khác nhau là m.

Ta phân hoạch D2m+1 thành hai tập con X2m+1 và Y2m+1, trong đó X2m+1 = D2m+1 Cm+1 (adsbygoogle = window.adsbygoogle || []).push({});

Y2m+1 = D2m+1 Cm với 0  m  2b-1 -2 và X2b1 . Y2b1 D2b1.

Cả hai tập X2m+1 và Y2m+1 đều là những tập con (submultiset) của P. Tập X2m+1

chứa các cặp (u,v) có dạng (2k-2m-1, 2k) hoặc (2k, 2k-2m-1). Tập Y2m+1 chứa các các cặp (u,v) có dạng (2k-2m, 2k+1) hoặc (2k+1, 2k-2m). Những cặp mà trong đó thành

phần chẵn lớn hơn sẽ nằm trong tập X2m+1 còn những cặp mà trong đó thành phần lẻ lớn hơn sẽ nằm trong tập Y2m+1 và tất cả những cặp này đều sai khác nhau 2m+1. Với các ảnh có tín hiệu chuẩn, xác suất để một cặp mẫu ở trong tập D2m+1 có các thành phần chẵn lớn hơn hoặc nhỏ hơn là như nhau. Điều đó có nghĩa là với số nguyên m bất kỳ, 0  m  2b-1-2 ta có

E(|X2m+1|) = E(|Y2m+1|) (1) Để phân tích ảnh hưởng của việc giấu tin LSB trên các cặp mẫu ta xem xét bốn trường hợp có thể của việc ―lật‖ bit LSB theo mẫu, gọi mẫu  {00, 01, 10, 11} với 1 biểu thị cho một (hoặc nhiều) mẫu trong một cặp có bị đảo bit, 0 biểu thị cho một (hoặc nhiều) mẫu vẫn giữ nguyên (không bị đảo bít).

Với mỗi m, 0  m  2b-1-1, tập Cm được phân hoạch thành X2m-1, D2m, Y2m+1. Rõ ràng Cm là đóng đối với phép giấu nhưng các tập con thành phần X2m-1, D2m, Y2m+1 thì không. Lấy một cặp mẫu (u, v) tùy ý của X2m-1 thì (u, v) có thể có dạng (2k-2m+1, 2k) hoặc (2k, 2k-2m+1). Bằng việc chuyển đổi cặp mẫu (u, v) qua mẫu  =10, ta thu được mẫu (u’, v’) = (2k-2m, 2k) hoặc (u’, v’)=(2k+1, 2k-2m+1). Tương tự như vậy, nếu (u, v) được thay đổi thông qua mẫu 01 thì (u’, v’) = (2k-2m+1, 2k+1) hoặc (u’v’) = (2k, 2k-2m). Rõ ràng X2m và Y2m tạo thành một phân hoạch của D2m.

Như vậy, Cm với 0  m  2b-1-1 có thể được phân hoạch thành bốn tập con X2m-1, X2m, Y2m và Y2m+1 được gọi là các tập con hỗn hợp dấu vết (trace submultisets) của Cm. Hơn nữa Cm là đóng nhưng bốn tập con của nó thì không đóng đối với các thao tác giấu tin LSB. Điều này giống như một máy trạng thái hữu hạn được mô tả trên hình 3.5. Trên hình 3.5 các trạng thái (các nút tròn) chính là các tập con (trace submultise)

của Cm. Các cung được gắn nhãn  là mẫu chuyển đổi nối từ trạng thái A sang trạng thái B thể hiện rằng bất kỳ cặp mẫu nào trong A sẽ trở thành một cặp mẫu trong B nếu áp dụng mẫu chuyển đổi .

Hình 3.5. Xích hữu hạn trạng thái với các trạng thái là các tập con của Cm (m>0).

Tập C0 là đóng đối với phép giấu tin LSB và có thể được phân hoạch thành hai tập Y1 và D0. Hình 3.5 mô tả một máy trạng thái cho C0.

Mục lục