Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 62 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
62
Dung lượng
1,94 MB
Nội dung
ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG NGUYỄN THỊ LAN PHƯƠNG NGHIÊN CỨU VÀ XÂY DỰNG CHƯƠNG TRÌNH PHÁT HIỆN ẢNH CÓ GIẤU TIN MẬT BẰNG PHƯƠNG PHÁP PHÂN TÍCH ĐỘ LỆCH CHUẨN LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH THÁI NGUYÊN - 2013 ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG NGUYỄN THỊ LAN PHƯƠNG NGHIÊN CỨU VÀ XÂY DỰNG CHƯƠNG TRÌNH PHÁT HIỆN ẢNH CÓ GIẤU TIN MẬT BẰNG PHƯƠNG PHÁP PHÂN TÍCH ĐỘ LỆCH CHUẨN Chuyên ngành: KHOA HỌC MÁY TÍNH M· sè: 60 48 01 01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Ngêi híng dÉn khoa häc: TS Nguyễn Ngọc Cương THÁI NGUYÊN - 2013 i LỜI CAM ĐOAN Tôi xin cam đoan luận văn kết nghiên cứu tôi, không chép Nội dung luận văn có tham khảo sử dụng tài liệu liên quan, thông tin tài liệu đăng tải tạp trí trang website theo danh mục tài liệu luận văn Tác giả luận văn Nguyễn Thị Lan Phương ii LỜI CẢM ƠN Để hoàn tất luận văn thạc sĩ yêu cầu tập trung, cố gắng độc lập nghiên cứu Bản thân sau năm tháng học tập vất vả nghiên cứu cố gắng để hoàn thành luận văn Tôi ghi nhận đóng góp giúp đỡ nhiệt tình người bên cạnh mình, ủng hộ, hỗ trợ bố mẹ bạn bè giúp có thêm động lực để hoàn thành khóa luận tốt nghiệp, nhân muốn gửi lời cảm ơn tới họ Lời cảm ơn trân trọng muốn dành tới TS Nguyễn Ngọc Cương, hướng dẫn suốt trình làm luận văn, nhờ định hướng thầy giúp tự tin nghiên cứu vấn đề giải toán cách khoa học Tôi xin trân trọng cảm ơn Ban giám hiệu trường đại học công nghệ thông tin, Đại học Thái nguyên, khoa CNTT tạo điều kiện cho học tập làm khóa luận cách thuận lợi Lời cảm ơn sâu sắc muốn gửi tới thầy cô giáo dạy dỗ mở cho thấy chân trời tri thức mới, hướng dẫn cách khám phá làm chủ công nghệ Tôi muốn gửi lời cảm ơn chân thành đến tập thể lớp CHK10D-KHMT qua tháng ngày miệt mài học tập, chia sẻ niềm vui nỗi buồn, động viên qua khó khăn, để vững bước vượt qua vất vả, tâm hoàn thành luận văn Tôi xin trân trọng cảm ơn bố mẹ, người mang tới tất niềm tin, định hướng theo dõi suốt chặng đường đời Nâng đỡ đến bên giây phút khó khăn sống Tuy nhiên thời gian có hạn, nỗ lực cố gắng luận văn khó tránh khỏi thiếu sót Rất mong bảo, góp ý tận tình Quý thầy cô bạn iii MỤC LỤC iv DANH MỤC HÌNH VẼ v DANH MỤC BẢNG BIỂU MỞ ĐẦU Tính cấp thiết đề tài “Giấu thông tin” (Steganography) kỹ thuật giấu thông tin quan trọng vào đối tượng khác Ý tưởng che giấu thông tin có từ hàng ngàn năm trước kỹ thuật dùng chủ yếu quân đội quan tình báo nước Những thập niên gần đây, giấu thông tin nhận quan tâm nhà nghiên cứu với hàng loạt công trình có giá trị Sở dĩ kỹ thuật số bùng nổ, người “số hoá” lĩnh vực phục vụ cho sống đại dẫn đến phiên chép ngày hoàn hảo, kỹ thuật thay thế, sửa đổi tinh vi với lưu thông phân phối mạng liệu đa phương tiện phát sinh nhiều vấn đề vi phạm quyền, phân phối bất hợp pháp, xuyên tạc trái phép… Về nguyên lý, giấu tin liệu đa phương tiện hay liệu ảnh số không khác nhiều, giấu tin ảnh dễ thực hơn, giấu nhiều thông tin hơn, đối tượng số sử dụng phổ biến Internet nay, nên kỹ thuật giấu tin ảnh chiếm tỉ lệ nhiều loại liệu đa phương tiện Thông tin giấu miền không gian miền biến đổi biến đổi tần số (cosine, wavelet, fourier rời rạc) hay biến đổi sai phân (difference image) Phát ảnh có giấu tin (Image Steganalysis) kỹ thuật đối lập với Image Steganography nhằm dò tìm ảnh số có giấu thông tin hay không Đây có ý nghĩa việc nghiên cứu Steganalysis khoa học thực tiễn, là: Thứ nhất, nhằm phục vụ đắc lực cho lĩnh vực an toàn thông tin; Thứ hai, nhằm nâng cấp thúc đẩy phát triển kỹ thuật giấu tin ảnh Với hai mục đích nêu dẫn đến hai hướng nghiên cứu khác Hướng thứ nhất, cố gắng xây dựng thuật toán phát mù (blind steganalysis) cho ảnh có giấu tin sử dụng kỹ thuật giấu Tiêu biểu phương pháp phát phân tích độ lệch chuẩn, phát thống kê χ2 bậc tự do, phát dựa phân tích tỷ lệ xám, phát bằng phương pháp ước lượng thông tin giấu miền LSB… Hướng thứ hai, dựa vào kỹ thuật giấu tin biết, xây dựng thuật toán phát phù hợp (phát có ràng buộc - constraint steganalysis) tức đưa số kỹ thuật phát có ràng buộc cho ảnh có giấu tin với kỹ thuật giấu biết trước Chúng trường hợp riêng kỹ thuật giấu LSB tỉ lệ thay đổi LSB ảnh thường thấp so với lượng thông tin đem giấu (hoặc kích cỡ ảnh) phát kỹ thuật phát mù LSB ảnh thường cho kết không cao Các phương pháp phát tiêu biểu phương pháp phát dựa kỹ thuật giấu HKC, phương pháp phát dựa kỹ thuật giấu thuận nghịch dựa biểu đồ giá trị sai phân DIH (Difference Image Histogram), phương pháp phát dựa kỹ thuật giấu tin IWH RVH Đã có nhiều công trình nghiên cứu công bố giới thành công theo hai hướng Tuy nhiên, kỹ thuật giấu tin đời sau ngày tinh xảo đòi hỏi nhà phát ảnh giấu tin không ngừng tìm phương pháp phát phù hợp bắt kịp với xu hướng phát triển kỹ thuật giấu Đặc biệt với tốc độ phát triển nhanh chóng Internet nhu cầu trao đổi thông tin ảnh ngày lớn mạnh, để đảm bảo an toàn an ninh, quốc phòng hay nhằm hỗ trợ nâng cấp, cải tiến kỹ thuật giấu an toàn toán cấp thiết đặt cho nhà nghiên cứu lĩnh vực an toàn thông tin Mục tiêu phạm vi nghiên cứu - Từ vấn đề trình bày trên, luận văn tập trung nghiên cứu kỹ thuật phát ảnh có giấu tin theo hướng đưa kỹ thuật phát mù cho ảnh có giấu tin LSB miền không gian miền tần số cụ thể tìm hiểu kỹ thuật phát mù cho ảnh có giấu tin LSB phương pháp phân tích độ lệch chuẩn, - Đối tượng ảnh nghiên cứu ảnh dạng BITMAP định dạng: JPG, GIF, PNG, TIF, BMP Nội dung luận văn - Tìm hiểu tổng quan giấu tin ảnh, phát ảnh có giấu tin - Trình bày số kỹ thuật phát mù cho ảnh có giấu tin kỹ thuật phát “độ lệch chuẩn” - Xây dựng thử nghiệm chương trình cho kỹ thuật phát độ lệch chuẩn Cấu trúc luận văn Luận văn gồm ba chương đó: Chương giới thiệu tổng quan giấu tin ảnh, phát ảnh có giấu tin nghiên cứu liên quan Chương Trình bày kỹ thuật phát mù ảnh giấu tin dựa kỹ thuật phân tích độ lệch chuẩn Chương Trình bày việc xây dựng thử nghiệm chương trình Chương TỔNG QUAN VỀ KỸ THUẬT GIẤU TIN TRONG ẢNH Giấu tin lĩnh vực rộng lớn thông tin số cần bảo mật giấu đối tượng liệu số khác gọi môi trường giấu tin Môi trường giấu tin phổ biến giấu tin đa phương tiện giấu tin file ảnh, audio, video ứng dụng rộng rãi giấu tin ảnh số Trong chương này, khóa luận trình bày khái niệm liên quan đến giấu tin nói chung, trình phát triển giấu tin ứng dụng giấu tin 1.1 Một số khái niệm giấu tin 1.1.1 Sơ lược lịch sử giấu tin Giấu tin bắt nguồn từ Hy Lạp, tiếng Hy Lạp gọi Stenography có nghĩa "dòng chữ bị che phủ" Mục đích giấu tin nhúng mẩu tin mật vào môi trường truyền tin bình thường cho người khác phát mẩu tin mật Trong lịch sử, câu chuyện nghệ thuật giấu tin lan truyền từ đời qua đời khác [2] Ví dụ, vào kỉ thứ trước Công Nguyên, Histaiacus cạo trọc đầu nô lệ, xăm lên thông điệp, sau đầu nô lệ mọc tóc trở lại, ông ta phái nô lệ mang thông điệp giấu đầu Ở tiểu vương quốc Ả Rập, thành phố khoa học công nghệ vua Abdulaziz, dự án khởi xướng để dịch thành tiếng Anh văn tiếng Ả Rập cổ dòng chữ bí mật cho viết cách 1200 năm Một vài văn tìm thấy Thổ Nhĩ Kỳ Đức Khoảng 500 năm trước, nhà toán học người Ý tên Jérôme Cardan sáng tạo lại phương thức văn bí mật cổ xưa người Trung Quốc Văn làm sau: tờ giấy làm mặt nạ có nhiều lỗ thủng mà người gửi người nhận biết, mặt nạ đặt tờ giấy trắng người gửi viết thông điệp bí mật qua lỗ thủng mặt nạ sau vứt mặt nạ điền phần lại vào tờ giấy trắng thể tờ giấy toàn thông tin vô thưởng vô phạt (hình 1.1) Hình 1.1: Từ trái qua phải: Mặt nạ, văn bản, thông điệp truyền bí mật văn Ngày nghệ thuật giấu tin nghiên cứu để phục vụ mục đích tích cực bảo vệ quyền, thủy vân số, hay phục vụ giấu thông tin bí mật quân kinh tế Sự phát triển công nghệ thông tin tạo môi trường giấu tin vô tiện lợi phong phú Người ta giấu tin tệp ảnh, 41 Nếu f (FM(G)) = f(G) U = U G; Bước 8: Tính RM = số nhóm R tương ứng với mặt nạ M, M(i) {0, 1} SM = số nhóm S tương ứng với mặt nạ M, M(i) {0, 1} R-M = số nhóm R tương ứng với mặt nạ M, M(i) {-1, 0} S-M = số nhóm S tương ứng với mặt nạ M, M(i) {-1, 0} Bước 9: Nếu |RM| =|SM| p = Ngược lại thực bước đến bước 12 Bước 10: Tính hệ số d0 = RM(p/2) - SM(p/2); d1 = RM(1- P/2) - SM(1- p/2); d-0 = R-M(p /2) - S-M(p/2); d-1 = R-M(1- p/2) - S-M(1- p/2); Bước 11: Tính xp nghiệm phương trình: 2( d1 + d ) x 2p + (d −0 − d −1 − d1 − 3d ) x p + d − d −0 = Bước 12: Tính ước lượng độ dài thông điệp: p= xp xp − b Phân tích thuật toán RS Ban đầu phân hoạch MxN điểm ảnh thành (MxN/n) nhóm nhóm n điểm ảnh độc lập liền kề Thông thường chọn n = (là khối 2x2) Với P tập tất giá trị điểm ảnh Với nhóm G chứa n giá trị điểm ảnh P G = (x1, x2, , xn) Ta phân lớp nhóm G vào ba lớp R, S, U Trước tiên, ta xác định hàm f(G) tổng khoảng cách khác biệt phần tử kề G theo định nghĩa Tiếp theo, với điểm ảnh xi (1≤i ≤n) nhóm G, ta xác định hàm lật bit FM(i)(xi) Giá trị hàm phụ thuộc vào giá trị M(i) tương ứng mặt nạ M Nếu M(i) = FM(i)(xi) = xi điều nghĩa thay đổi bit xi Nếu M(i) = x1 ≥ FM(i)(xi) nhận giá trị xi +1 xi số chẵn, ngược lại nhận giá trị xi -1 x1 số lẻ Nếu M(i) = x i ≥ -1, FM(1)(X1) nhận giá trị x i+1 xi lẻ, ngược lại hàm nhận giá trị xi-1 xi số chẵn 42 Với FM(i)(xi) với 1≤i ≤n có, ta thu được: FM(G) = (FM(x1)FM(2)(x2), FM(n)(xn)) Ở bước tiếp theo, với mặt nạ M = {(M(i)}i=1,2, n với M(i) {-1, 0, 1}, hàm f(G) FM(G) thu bước trước, ta phân lớp nhóm G thành lớp R, S, U theo định nghĩa 3.2.2 Nếu nhóm G thay đổi giá trị phần tử kề sau phép lật bit theo mặt nạ M (tương ứng M = {0}) G U Nếu khác biệt phần tử kề sau phép lật bit nhóm G theo mặt nạ M lớn khác biệt phần tử kề nhóm G ban đầu GR, ngược lại GS Sau phân lớp nhóm G, sử dụng mặt nạ M với phần tử có giá trị không âm (thuộc {0,1}) để lật bit, đếm số nhóm GR, gọi R M, tương tự SM số nhóm G S; sử dụng mặt nạ M với phần tử có giá trị không dương {-1, 0} để lật bit, đếm số nhóm GR, gọi R -M, tương tự S-M số nhóm G∈S Nếu có ảnh chứa tin ẩn (stego) với chiều dài thông điệp ẩn giấu p (phần trăm điểm ảnh) chưa biết Khởi tạo, độ đo số phần tử nhóm R S tương ứng RM(P/2), R-M(P/2), SM(P/2), S-M(P/2) Giả sử thông điệp vecto bit ngẫu nhiên, trung bình nửa điểm ảnh bị lật bít thông qua việc giấu tin, ta lật bít LSB tất điểm ảnh số phần tử nhóm R S R M(1 - p/2), SM(1- p/2), R-M(1p/2), S-M(1- p/2) Người ta tiến hành thực nghiệm kết thực nghiệm đường R-M S-M gần đường thẳng đường R M SM xấp xỉ đường cong đa thức bậc hai (parabol) Cũng thực nghiệm, ước lượng hai giá trị RM(1/2) SM(1/2) từ mẫu thống kê ta thu RM(1/2) = SM(1/2) Đế không thời gian làm thực nghiệm đế việc ước lượng chiều dài thông điệp đơn giản ta chấp nhận hai giả thiết sau Các giả thiết người ta tiến hành thực nghiệm đế kiếm chứng Giao điếm đường RM R-M có tọa độ x với giao điếm S M, S-M RM(1/2) = SM(1/2) Trên đồ thị RS, số nhóm R S p/2 1-p/2 tạo thành đường thẳng điếm lại hai giả thiết (1) (2) cung cấp ràng buộc đầy đủ đế xác định parabol giao điếm chúng Sau thay đổi tỷ lệ trục x đế p/2 thành 100-p/2 thành phép tuyến tính x p 43 = (x-p/2)(1- p), tọa độ x giao điếm nghiệm phương trình sau: 2(d1 + d ) x 2p + (d −0 − d −1 − d1 − 3d ) x p + d − d −0 = Trong hệ số bước 10 thuật toán Cuối ta tính ước lượng độ dài thông điệp p công thức bước 12 Độ xác độ dài thông điệp ước lượng Có ba yếu tố ảnh hưởng đến độ xác độ dài thông điệp ước lượng là: độ lệch ban đầu, mức độ nhiễu chất lượng ảnh mang tin vị trí bit thông điệp ảnh Thứ nhất, độ lệch ban đầu: Kỹ thuật RS cho độ dài thông điệp khác nhờ số chẵn biến ngẫu nhiên ảnh gốc Độ lệch ban đầu khác không số dương âm đặt giới hạn cho độ xác có phương pháp RS Người ta tiến hành kiếm tra với sở liệu gồm 331 ảnh đa cấp xám JPEG thu phân phối Gauss có độ lệch chuẩn 0.5% Số ảnh nhỏ phải có số biến cao độ lệch ban đầu số lượng nhóm R S nhỏ Các ảnh trung gian ảnh nhiễu có biến lớn độ lệch ban đầu Ngược lại, độ lệch lại thấp ảnh JPEG, ảnh không nén thu qua camera số, qua máy quét các ảnh qua lọc xử lý ảnh Các ảnh mầu cho biến lớn độ lệch so với ảnh đa cấp xám Thứ hai, mức độ nhiễu: Với ảnh có nhiều nhiễu, khác biệt số điểm ảnh R S ảnh “cover” nhỏ Do vậy, đường đồ thị RS giao góc nhỏ độ xác kỹ thuật RS giảm Đối với ảnh chất lượng thấp, ảnh qua nén ảnh nhỏ Thứ ba, vị trí bít thông điệp ảnh: Kỹ thuật RS xác bit thông điệp phân bố cách rời rạc ngẫu nhiên ảnh Phát theo thống kê dựa vào thống kê toán để phát thay đổi phân bổ bất thường cấu trúc ảnh kết luận ảnh có giấu tin mật hay không Trong báo hai tác giả Westfeld Pfitzmann ([1]) ví dụ phát theo phương pháp thống kê, hai tác giả phát ảnh số sau giấu thông tin kỹ thuật giấu LSB sinh cặp POVs (Pairs of Values) ảnh Những ảnh phát kỹ thuật thống kê Chi-square 2.4.3 Phát ảnh có giấu tin mật phương pháp phân tích “độ lệch chuẩn” Phân tích khác biệt ảnh gốc ảnh có giấu tin 44 Các kỹ thuật giấu tin tạo POVs xét bị phát tiêu chuẩn Khi bình phương westfeld Pfizmann [1] đề xuất năm 1998 số trường hợp phương pháp hiệu thông tin giấu ngẫu nhiên không liên tục Kỹ thuật Khi bình phương phiên đầu phát thông tin thông tin giấu liên tục từ xuống Bây giờ, giả sử ta có, C2,… Ck k ảnh chưa giấu tin Chúng ta thử thống kê tần số pixel ảnh C1, C2,… Ck kết thống kê ký hiệu x10 x10 vector tương ứng sau: C126 x10 , C 26 C i26 x10 (0 ≤ i ≤ k) với , C 26 k giá trị c imn (0 ≤ m ≤ 25, ≤ n ≤ 9) tần số pixel mn ảnh (ví dụ c i23 =34 nghĩa tần số pixel 23 ảnh C i 34) Sau đó, tập k ảnh giấu lượng thông tin cách ngẫu nhiên vào pixel ảnh ta tập k ảnh kết tương ứng S 1, S2, Sk Tương tự ta thống kê tần số pixel ảnh S1, S2, … Sk ta kết thống kê ký hiệu vector tương ứng x10 x10 S126 x10 , S 26 , S 26 k So sánh hai vector ảnh gốc ảnh có giấu tin, tác giả phát vấn đề quan trọng tổng giá trị hàng C i26 x10 Si26 x10 tương ứng không thay đổi Chỉ có giá trị phần tử hàng thay đổi Trong ảnh gốc hàng vector xuất nhiều điểm đột biến tức giá trị c imn hàng thay đổi khác biệt Trong với ảnh có giấu tin điểm giá trị biến thiên hay giá trị s imn gần Để thử nghiệm vấn đề cho loạt cặp ảnh (C i Si) cách lấy logarit tích c imn , s imn dòng tương ứng cặp ảnh C i Si thấy logarit ảnh giấu tin lớn ảnh chưa giấu tin Còn dòng có giá trị logarit xấp xỉ nghĩa thông tin không giấu giấu thông tin ảnh Trên vấn đề phân tích người ta xây dựng phương pháp phát giấu tin ảnh sau: 2.4.3.1 Thiết lập toán: Cho tập hợp C ảnh (gồm ảnh giấu tin ảnh chưa giấu tin) Hãy tìm cách phân hoạch tập thành tập A B trong hai tập (chẳng hạn A) tập gồm ảnh có chứa thông tin ẩn tập lại (chẳng hạn B) gồm ảnh không chứa thông tin ẩn cho sai số việc phân lớp nhỏ 2.4.3.2 Phương pháp giải: 45 Có hai trường hợp xảy ra: a/ mẫu lấy từ tập hợp tuỳ ý; b/ mẫu lấy từ họ có phân bố xác suất biết Trong phạm vi nghiên cứu luận văn, giả thiết mẫu lấy từ họ có phân bố chuẩn N(a,σ2) với trung bình a phương sai,σ2, có hàm mật độ xác suất: p( x ) = e σ 2π − ( x −a ) 2 σ2 với -∞