3. Bố cục của luận văn
3.4 Đánh giá độ an toàn của hệ thống
Định nghĩa hình thức về độ an toàn steganography.
Ý tưởng:
Chọn ngẫu nhiên một ảnh cover C với phân bổ xác suất Pc(.). Việc giấu ( nhúng) một tài liệu m nào đó vào C được coi như là một hàm Ek ( ánh xạ) được xác định trong C. Gọi Ps(.) là phân bố xác suất của Ek (c, m, k), đó là một tập hợp các ảnh stego được tạo ra bởi hệ thống steganography nào đó.
Nếu C không phải là ảnh stego thì Ps( C ) = 0. Để tính Ps(.) phân bố xác suất trên không gian khóa K và không gian bản rõ M đã được ấn định trong Đề tài ta giả định, đó là ngôn ngữ tiếng Anh. Sử dụng định nghĩa về Entropy: D(P1‖P2) giữa 2 phân bố xác suất P1 và P2 được xác định trên hệ thống Q là:
D(P1‖P2) =
Nếu P1(.) = PC(.), P2(.) = PS(.), thì đây là đại lượng đo sự khác biệt giữa ảnh cover và ảnh stego tương ứng. Đại lượng D(PC‖PS) càng bé thì sự phân biệt giữa ảnh C và ảnh S càng khó khăn. Nếu D(PC‖PS) = 0 thì ta coi như trong thực hành không thể phân biệt được giữa ảnh C và ảnh S. Sử dụng định nghĩa về Entropy (độ bất định) ta có các khái niệm sau đây:
Định nghĩa 1:
Giả sử Ω là một hệ thống steganography nào đó. Kí hiệu PS là phân bố xác suất của các ảnh stego nhận được qua đường truyền hoặc lưu trên kênh cộng cộng và PC là phân bố xác suất của C. Hệ thống Ω là ε an toàn chống lại các tấn công thụ động nếu: D(PC‖PS) ≤ ε với ε ≥ 0 cho trước.
Trường hợp ε = 0 thì Ω có độ an toàn tuyện đối( hoàn hảo)
Khi D(PC‖PS) = 0 theo bổ đề cơ bản của lý thuyết thông tin [C.rao’s] thì PC = PS, có nghĩa ta không thể phân biệt đâu là ảnh C và đâu là ảnh Stego S.
Định lý 1:
Tồn tại một hệ thống steganography cho độ an toàn hoàn hảo.
Chứng minh:
Giả sử, C là tập hợp tất cả dãy nhị phân có độ dài n, PC có phân bố đều trên C, cho e là thông điệp mật, e C. Người gửi chọn ngẫu nhiên c C và tính S = c , trong đó là phép cộng bit không gian nhớ (XOR). Khi đó rõ ràng PS có phân bố đều trên C. Do đó PS = PC, vi vậy D(PC‖PS) = 0. Quá trình
trích chọn được thực hiện đơn giản là e = s .Thuật toán trên đơn giản nhưng nó không hữu ích vì trong thực tiễn không có một nhà quan sát nào giả sử Alice và Bob trao đổi dãy ngẫu nhiên. Định lý được chứng minh.
Định lý 2:
Cho Ω là một hệ thống Steganography thỏa mãn điều kiện ε – an toàn ( ɛ - secure) chống lại các tấn công bị động, xác suất để kẻ tấn công không phát hiện được sự có mặt của thông điệp trong C. Còn α là xác suất dò tìm sai thông điệp ẩn trong C. Khi đó hệ thức sau đây đúng:
d(α, )= . Đặc biệt nếu thì
Chứng minh:
Để chứng minh định lý, trước hết chúng ta đưa ra một tính chất quan trọng về Entropy. Giả sử Q0 và Q1 là 2 biến ngẫu nhiên được xác định trên tập Q với phân bố xác suất lần lượt là , Còn f là hàm f: Q T.
Trong đó f(C) =
Khi đó,D( PT0 ‖ PT1 ) D( PQ0 ‖ PQ1 ).
Trong đó , lần lượt là hàm phân bố xác suất của biến ngẫu nhiên f(Q0) và f(Q1)
Dựa vào tính chất trên của Entropy ta chứng minh định lý 2 như sau: Trường hợp ảnh cover C không chứa thông điệp mật, các ảnh cover được phân bố theo định luật Pc. Bây giờ chúng ta xét biến ngẫu nhiên f (C)và tính phân bố xác suất của nó là . Trong trường hợp f( C) = 1 kẻ tấn công mắc sai lầm loại 2. Do đó (1) = và vì vậy (0) = 1 - . Nếu ảnh cover không chứa thông điệp mật, các ảnh cover sẽ có phân bố xác suất PS. Chúng ta tính phân bố của của f(S).
Trong trường hợp f(S) = 0 thì kẻ tấn công mắc sai lầm loại I, vì kẻ tấn công ta không phát hiện được một thông điệp nào cả. Vì vậy (0) = và vì
(1) = .
Do đó Entropy D( ‖ ) có thể được biểu diễn dưới dạng:
D( ‖ ) = = (1- ) + = d( , )
Nhưng theo nhận xét trên ta có d( , ) = D( ‖ ) D( ‖ ) . Đó là điều cần chứng minh vì = 0 (với β <1). Sử dụng quy tắc De Lospital, ta có d( , ) = . Do đó nếu = 0
Đối với hệ thống Steganography có an toàn với = 0. Có thể kết luận rằng: với xác suất , các kẻ tấn công bị động khó có thể tìm được thông điệp giấu trong ảnh với xác suất rất cao. Nhưng tương đương với
. Do đó hệ thống được đánh giá là an toàn nếu lấy đủ bé.
Ứng dụng lý thuyết trên để xác định chất lượng của thuật toán đề xuất. Giả sử, chúng ta có một ảnh cover C. Sử dụng thuật toán được đề xuất để giấu thông điệp mật M vào ảnh C và nhận được ảnh kết quả stego S = C(M). Bây giờ ta xác định các hàm phân bố xác suất PC và PS. Các bước tiến hành như sau:
Bước 1: Ta trích chọn các LSB của dữ liệu ảnh C và S bắt đầu từ khởi điểm giấu tin đã quy ước khi thực hiện thuật toán giấu, giả sử ta được dãy sau:
C1: 101010100010011111100010011111 S1: 101010100110011111100010011111 Bước 2: Tính phân bố xác suất của bit 0,1 trên C1 và S1
Phân bố xác suất của bít 1 trên C1 là PC11 = 17/10 = 0.55 Phân bố xác suất của bit 0 trên C1 là PC10 = 13/30 = 0.45.
Phân bố xác suất của bit 1 trên S1 là PS11 = 16/30 = 0.54 Phân bố xác suất bit 0 trên S1 là PS10 = 14/30 = 0.46. Bước 3: tính tổng Ʃ = Ʃqϵ {0,1} PC10(q) log2 (PC10(q)/PS10 (q) )
= (0.45xlog2(0.45/0.46)) + (0.55 x log2(0.55/0.54)) = - 0,0142 + 0,0145 = 0,0003
Bước 4: Theo định lí 1 thì ε = 0 là thuật toán an toàn tuyệt đối. Vậy thuật toán đạt mức an toàn nếu ε ≤ 0,05. Ʃ = 0,0003 < 0,05 vậy thuật toán giấu của ta là an toàn hoàn hảo.