Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 11 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
11
Dung lượng
77,3 KB
Nội dung
Page |1 TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNGTIN LỚP CAO HỌC KHÓA 10 ĐỢT THU HOẠCH MÔNẨNTHÔNGTINTRÊNDỮLIỆUSỐ ĐỀ TÀI Nghiêncứusốkỹthuậtsteganalysisảnh Huỳnh Ngô Văn1 NỘI DUNG Tóm tắt Steganography kỹthuậtẩnthôngtin nhằm mục đích trao đổi thôngtin mật đến đối tượng không muốn đối tượng thứ ba (không mong muốn) phát hay nghi ngờ Steganalysiskỹthuật đối lập với steganography nhằm phát đối tượng có ẩnthôngtin hay không Bài báo giới thiệu tổng quan steganalysissốkỹthuậtnghiêncứu Đối tượng nghiêncứuảnh có định dạng sau: JPG, GIF, PNG, TIF, BMP Từ Khóa: Steganography, steganalysis Steganography, steganalsis nghiêncứu liên qua 1.1 Steganography 1.1.1.Khái niệm Ẩnthôngtinkỹthuật liên lạc mật dựa hình thức ẩnthôngtin quan trọng vào đối tượng khác Ẩnthôngtin có tác dụng: bảo vệ quyền số, hay đối tượng liên lạc mật với kênh thôngtin công cộng mà bị nghi ngờ Lý quyền số mã hóa sau giải mã khó giữ quyền, hay thôngtin mật cần trao đổi bên, sau mã hóa làm cho người khác biết rõ bên có trao đổi thôngtin mật với 1.1.2.Kỹ thuật Học viên cao học khóa 10 đợt - 2015, trường UIT, mã học viên: CH1502043 1|Page 2|Page Kỹthuậtẩnthôngtin bit có trọng số thấp LSB kỹthuật thay bit thôngtin vào bit có trọng số thấp điểm ảnh Ví dụ điểm ảnhản 8bit màu bit cuối (bit thứ 8) gọi bit LSB Do thay đổi giá trị bit không làm ảnh hưởng nhiều đến chất lượng trực quan ảnh Ngoài kỹthuật có sốkỹthuậtẩnthôngtin khác kỹthuật chèn nhiễu SS, kỹthuật điều chỉnh hệ số lượng tử hóa QIM, kỹthuậtẩn thuận nghịch… 1.1.3.Phương pháp đánh giá độ an toàn lược đồ ẩnthông tin: Ký hiệu: C tập tất ảnh gốc M tập thôngtin mật K tập khóa S tập ảnh steganography Một lược đồ ảnhthôngtin cặp với hàm nhúng thông tin, hàm tách thôngtin Hàm nhúng tạo đối tượng S từ C, M, K, hàm tách tách tin M từ S khóa K Giả sử hàm phân bố xác suất C Nếu khóa K M chọn ngẫu nhiên lược đồ ẩnthôngtin ( với hàm phân số xác suất đuoợc hàm phân bố xác suất tương ứng với S Khi theo khái niệm ẩnthôngtinan toàn Cachin [1] ta có định nghĩa sau: Định nghĩa: lược đồ ẩnthôngtin gọi an toàn sai phân Kullback – Leibler hàm mật độ xác suất 0: Khi lược đồ ẩnthôngtin có độ an toàn , số thực dương đủ nhỏ tùy ý cho trước 1.2 Steganalysis 1.2.1.Khái niệm 2|Page Page |3 Steganalysiskỹthuật phát tồn thôngtin nhúng đối tượng 1.2.2.Kỹ thuậtSteganalysis định nghĩa toán phân loại dựa kiểm định giả thuyết thống kê Do steganalysis phát biểu: toán kiểm định giả thuyết đơn (simple hyphthesis), toán kiểm định giả thuyết phức hợp (composite hypothesis) Nếu thôngtin lược đồ ẩnthôngtinkỹthuật phát gọi phát mù (blind steganalysis) Trong trường hợp biết trước thôngtin lược đồ ẩnthôngtin gọi phát có ràng buộc (constraint steganalysis) 1.2.3.Tập liệuảnh thử nghiệm Tập ảnh gốc sử dụng cho thuật toán ẩn phát gồm 2088 ảnh xám với kích thước khác Kỹthuật Blind Steganalysis cho ảnh nhúng LSB 2.1 Trên miền không gian 2.1.1.Phát phân tích “độ lệch chuẩn” Để phân loại ảnh nhúng ảnh gốc LSB trường hợp ta sử dụng định lý sau: Định lý 1:Cho X đại lượng ngẫu nhiên có phân bố chuẩn N( Khi đại lượng ngẫu nhiên Y=(X-)/ có phân bố chuẩn Nn(0,1) Định lý 2: Cho đại lượng ngẫu nhiên, độc lập phân bố chuẩn N( Khi đại lượng ngẫu nhiên có phân bố chuẩn N( Trong thực tế chưa biết nên ta phải ước lượng Có nhiều phương pháp để ước lượng đại lượng phuong pháp thông dụng đơn giản phương pháp hợp lý cực đại Bằng phương pháp ta thay ước lượng ước lượng Ký hiệu: Khi đại lượng ngẫu nhiên: , , phân bố chuẩn Nn(0,1) không phục thuộc mà phụ thuộc vào n 3|Page 4|Page Đặt V= , đại lượng ngẫu nhiên có phân bố chuẩn N n(0,1) nên V có phân bố chuẩn Nn(0,2) Áp dụng định lý giới hạn trung tâm[2], ta có (1) có phân bố chuẩn Nn(0,1) lập thành bảng XII [2] với n=1,2,3… mức ý nghĩa =0,1;0,05… Đại lượng ngẫu nhiên T từ (1) có phân bố chuẩn N n(0,1) tức ta có xác suất P{T hàm mật độ xác suất chuẩn N n(0,1) cho trước n giá trị xác suất sai số loại I với , ta tìm giá trị ngưỡng phương trình sau đây: Sau tìm ngưỡng toán ta áp dụng để phân loại ảnh sau: kiểm tra - Nếu V , kết luậnảnh không nhúng thôngtin - Nếu V , kết luậnảnh có nhúng thôngtin 2.1.2.Phát thống kê bậc tư Định lý 3: Gọi m số lần xuất biến A dãy n phép thử Becouli với xác suất xuất biến A P(A) = p>0 Khi đó, đại lượng ngẫu nhiên có xấp xỉ phân bố chuẩn N(0,1), với q = 1-p Bổ đề 1: Giả sử cho trước dãy nhị phân lấy từ nguồn ngẫu nhiên, độc lập s=,…, Ký hiệu tần suất số “0” “1” xuất dãy (tức Đặt Khi đó, s ngẫu nhiên, độc lập z có phân bố “” bậc tự (với n>=10) Áp dụng bổ đề vào việc phân loại ảnh có nhúng thôngtin LSB cách tính tần suất điểm ảnhảnh cần kiểm tra vevtor C 25x10 Thực tiếp số bước: i Tìm giá trị lớn C 25x10 ký hiệu (() có giá trị lớn hàng C25x10) ii Tính ,, Áp dụng bổ đề 1, ta có có phân bố bậc tự 4|Page Page |5 iii Kết luận, ảnh kiểm tra ảnh không nhúng, ngược lại ảnh kiểm tra ảnh nhúng với xác suất sai số 2.2 Trên miền tần số 2.2.1.Phân tích Ẩnthôngtin miền tần số cosin hay wavelet hình thức ẩnthôngtin LSB hệ số cosin miền tần số hay băng tần cao Theo Provos, kỹthuậtẩnthôngtin LSB hệ số cosin gây cân cặp PoV hệ số cosin[2] Do Provos áp dụng phương pháp thống kê với n bậc tự cho cặp PoV hệ số cosin …, (-8,-7),(-6,-5),(-4,-3),(-2,-1),(2,3),(4,5),(6,7)… 2.2.2.Kỹ thuậtsteganalysisThuật toán áp dụng cho ảnh nhúng LSB miền tần số DCT Đầu vào: Cho tập ảnh JPEG (gồm có ảnh nhúng hệ số cosin ảnh gốc) Đầu ra: Phân loại tập ảnh thành hai tập: ảnh nhúng ảnh không nhúng LSB hệ số cosin Các bước thực hiện: Bước 1: Chọn ảnh I tập ảnh đầu vào, thực bước bước sau quay lại chọn ảnh khác Bước 2: Thống kê tần số hệ số DCT ảnh I vào ma trận (giá trị n xác định từ số hệ số có tần số lớn 0) với tần số hệ số cosin có giá trị i Thực tính với Ta có: T = Bước 3: Chọn =500 (theo tập mẫu thử nghiệm 1200 ảnh Nếu T>thì I lưu vào tập ảnh gốc, ngược lại I lưu vào tập ảnh có nhúng LSB hệ số cosin 5|Page 6|Page Mộtsốkỹthuậtsteganalysis có ràng buộc 3.1 Kỹthuật HKC 3.1.1.Giới thiệu Kỹthuật HKC J.H.Hwang đề xuất năm 2006[3], dựa phương pháp dịch chuyển biểu đồ tần suất sau: chọn điểm Peak điểm có cột tần suất lớn biểu đồ tần suất, sau chọn hai điểm Zero1 Zero2 (các điểm có cột tần suất có giá trị 0) bên trái bên phải điểm Peak Sau thực làm rỗng cột tần suất vị trí Peak+1 Peak-1 Thực nhúng thôngtin vào ảnh theo nguyên tắc: giả sử cần nhúng bit b, quét ảnh theo thứ tự raster điểm ảnh có giá trị Peak-2 Peak+2, kiểm bit b cần nhúng: thôngtin “1” điểm ảnh có giá trị Peak -2 tăng lên 1, nêu điểm ảnh có giá trị Peak+2 giảm “1”, bit thôngtin “0” trì cũ 3.1.2.Kỹ thuật HKC ước lượng thôngtin nhúng ảnh 3.1.2 Kỹthuật Kuo Lin Năm 2008, W.C.Kuo Y.H.Lin đề xuất kỹthuậtsteganalysisảnh có nhúng sử dụng kỹthuật HKC[4] Họ quan sát biểu đồ tần số dựa đỉnh Peak trước sau nhúng thấy giá trị lân cận bên đỉnh peak bị tụt xuống nhúng tin Điểm Peak: (a) chưa nhúng, (b) nhúng, (c) nhúng không đầy dủ họ đưa định lý để xây dựng kỹthuậtsteganalysis đây: Định lý 4: Có năm cặp giá trị liên tiếp , với cặp giá trị điểm Peak Tỉ lệ thay đổi điểm liên tục mối quan hệ láng giềng định nghĩa biểu thức sau: giá trị ngưỡng 6|Page Page |7 Áp dụng định lý này, Kuo Lin đưa thuật toán phát ảnh nhúng sử dụng kỹthuật HKC theo bước sau: i Tìm cặp giá trị điểm peak ( ii Tính tỉ lệ thay đổi mối quan hệ láng giềng sử dụng định lý iii Nếu năm cặp giá trị liên tiếp lân cận thỏa mãn (4.1) (4.2), kết luậnảnh có nhúng, ngược lại ảnh không nhúng 3.1.2 Thử nghiệm kỹthuật HKC ước lượng thôngtin Mặt khác thấy đưa biểu thức đơn giản sử dụng kỹthuật HKC Dựa vào phân tích ví dụ: ảnh gốc ban đầu có biểu đồ tần số hình 3.1: (a)tổng cột giá trị lân cân bên trái cột giá trị lân cận bên phải điểm Peak lớn Peak, với biểu đồ tần sốảnh có nhúng (c) ngược lại Cũng dựa vào mối quan hệ bị thay đổi vùng lân cận mà ước lượng số bit thôngtin nhung ảnh dựa vào Ban đầu để nhúng tin phải dịch chuyển sang , sang , nghĩa làm cho , Sau nhúng bit “1” chuỗi thôngtin làm dịch chuyển phần , sang (theo thuật toán HKC) bit “0” ngầm định nhúng vào điểm ảnh Peak-2 Peak+2 Gọi , số bit “0” bit “1” chuỗi thôngtin M cần nhúng đó: =, , chuỗi thôngtin M đại lượng ngẫu nhiên có phân bố nên xác suất bit “0” xác suất bit “1” xấp xỉ 0.5 (P(0) Vậy độ dài bit thôngtin M nhúng ảnh sử dụng HKC tính theo biểu thức sau: L=2=2 3.2 Kỹthuật DIH 3.2.1 Giới thiệu Kỹthuật DIH nhóm tác giả Lee cộng đề xuất năm 2004[5] Ban đầu nhóm tác giả tính giá trị sai phân điểm ảnh theo công thức d(i,j)=I(i+1,j) - I(I,j) tính biểu đồ tần số cho giá trị sai phân Họ thấy giá trị tần số tập trung phần lớn vào hệ số sai phân có giá trị -2, -1, 0, 1, 2, nhúng thôngtin dựa vào giá trị Để sau nhúng 7|Page 8|Page khôi phục ảnh gốc, họ phải dịch chuyển cột tần số có giá trị sai phân lớn nhỏ -1 để làm rỗng cột tần số có giá trị -2 Sau chuỗi bit thôngtin nhúng vào điểm ảnh mà giá trị sai phân có giá trị -1, bit thôngtin nhúng hệ số sai phân chuyển thành 2, 01 chuyển thành -2, ngược lại giữ nguyên 3.2.2.Thử nghiệm kỹthuật DIH Bằng phương pháp phân tích biểu đồ tần số sai phân ảnh trước sau nhúng phát ước lượng xấp xỉ ảnh có nhúng sử dụng kỹthuật DIH sau: nhúng thôngtin giống vào tập ảnh gốc sử dụng kỹthuật DIH nhận tập ảnh stego (ảnh nhúng) Thực tính toán lại biểu đồ tần số sai phân cặp ảnh (gốc, nhúng) dễ dàng nhận thấy DIH thay đổi tính chất tự nhiên giá trị sai phân Sự thay đổi DIH tạo ra, thay đổi tần sốảnh để nhúng thôngtin Đây vấn đề mấu chốt để phát ảnh nhúng, với biểu thức sau: S(O) Với T ngưỡng để phân loại 3.3 Kỹthuật IWH 3.3.1.Giới thiệu Xuan cộng đề xuất kỹthuật IWH (Integer Waveket Histogram) vào năm 2006[6] Kỹthuật có ý tưởng gần giống kỹthuật DIH, nhiên khác chỗ thay dịch chuyển cột tần số giá trị sai phân họ sử dụng phương pháp dịch chuyển tần số hệ số biến đổi wavelet nguyên Họ thực phép biến đổi wavelet cho miền liệuảnh theo chuẩn biến đổi kỹthuật nén JPEG2000 để bốn tần (LL,LH,LH,HH) Sau họ nhúng thôngtin vào băng tần cao LH,HL,HH nơi cho ảnh hưởng đến ảnh gốc Tính tần số hệ số IWT, cột tần số có giá trị lớn ơn Z (Z số nguyên chọn tùy ý) bị dịch chuyển sang phải, mục đích làm rỗng cột tần số có giá trị Z, thôngtin nhúng vào hệ số có giá trị Z-1 Z Nếu trường hợp số bit cần nhúng lớn số hệ số wavelet có giá trị Z-1, thực tiếp nhúng thôngtin sang hệ số có giá trị (Z+1) giá trị đối xứng qua hệ số 0, việc thực nhúng tương tự, ban đầu phải làm rỗng cột tần số -Z, sau nhúng thôngtin vào hệ số có giá trị -(Z-1) –Z Nếu bit thôngtin tiếp tục nhúng vào hệ số Z-2, nhúng 8|Page Page |9 xong thôngtin Giả sử việc nhúng dừng lại hệ số có giá trị S hệ số bắt đầu nhúng tin T 3.3.2.Kỹ thuật IWH Để công ước lượng nhúng sử dụng kỹthuật IWH, tác giả đưa số phân tích trình nhúng dựa thử nghiệm: Trong thử nghiệm thứ 1, sử dụng ảnh Lena (kích thước 512 x 512 pixel) thôngtin nhúng ảnh nhị phân (128x56 pixel) Tính tần số giá trị wavelet miền băng tần cao (LH,HL,HH) Nhúng thôngtin phương pháp IWH với Peak chọn khởi điểm T=2, nhận điểm dừng S=-2 Thử nghiệm thứ 2, đầu vào trên, nhúng thôngtin chọn T=4, nhận điểm dừng S=3 Thử nghiệm thứ 3, đầu vào tương tự, chọn T=6, nhận S=-5 So sánh khác biệt biểu đồ tần số hệ số wavelet ảnh gốc ảnh nhúng, thấy ảnh điển hình với hệ số IW có giá trị i Trong ảnh nhúng thí nghiệm ta thấy , thí nghiệm thứ có , thí nghiệm thứ Từ tổng quát ước lượng độ dài thôngtin sau: i Khởi tạo độ dài thôngtin L=0, quét toàn tần số với giá trị I (i>=0, i[...]... e | 11 IWH, RVH và thử nghiệm trên những kỹthuật đó để ước lượng xấp xỉ thông tin đã nhúng trong ảnh 5 Tài liệu tham khảo [1] C Cachin(1998), An information – theoretic model for steganography, In D.Aucsmith, editor, Information hiding, 2nd International Worksohp, volume 1525 of LNCS, Springer – Verlag, NewYork, pp.306-318 [2] N Provos and Peter Honeyman (2001), Detecting Steganographic Content on... H Hwang, J W Kim, and J U Choi(2006), A reversible Watermarking Based on Histogram Shifting, IWDW 2006, pp 384-361 [4] Wen-Chung Kuo, Yan-Hung Lin(2008), On the Security of Reversible Data Hiding Based-on Histogram Shift, ICICIC 2008, pp 174-177 [5] K Sullivan, U Madhow, B S Manjunath and S Chandrasekaran (2005), Steganalysis for Markov Cover Data with Applications to Images, Submitted to IEEE Transactions... with Applications to Images, Submitted to IEEE Transactions on Information Forensics and Security [6] G Xuan, Q Yao, C Yang, J Gao, P Chai, Y Q Shi, Z Ni (2006), Lossless Data Hiding Using Histogram Shifting Method Based on Integer Wavelets, Proc 5th Digital watermarking workshop, IWDW 2006, Korea, vol 4283, pp 323-332 [7] P M Kumar, K L Sunmuganathan (2010), A reversible high embedding capacity data ... không làm ảnh hưởng nhiều đến chất lượng trực quan ảnh Ngoài kỹ thuật có số kỹ thuật ẩn thông tin khác kỹ thuật chèn nhiễu SS, kỹ thuật điều chỉnh hệ số lượng tử hóa QIM, kỹ thuật ẩn thuận nghịch…... toàn lược đồ ẩn thông tin: Ký hiệu: C tập tất ảnh gốc M tập thông tin mật K tập khóa S tập ảnh steganography Một lược đồ ảnh thông tin cặp với hàm nhúng thông tin, hàm tách thông tin Hàm nhúng... Kết luận, ảnh kiểm tra ảnh không nhúng, ngược lại ảnh kiểm tra ảnh nhúng với xác suất sai số 2.2 Trên miền tần số 2.2.1.Phân tích Ẩn thông tin miền tần số cosin hay wavelet hình thức ẩn thông tin