CHƯƠNG 1. TỔNG QUAN VỀ KỸ THUẬT GIẤU TIN 41.1 Định nghĩa kỹ thuật giấu tin 41.2 Phân loại kỹ thuật giấu tin 41.2.1 Giấu tin mật 51.2.2 Thủy vân số 51.3 Giấu tin trong Audio 51.4 Giấu tin trong video 61.5 Giấu tin trong ảnh 6CHƯƠNG 2. CẤU TRÚC CỦA MỘT SỐ ẢNH ĐẶC TRƯNG 82.1 Cấu trúc ảnh BMP 82.2 Cấu trúc ảnh PNG 92.3 Ảnh JPEG 10CHƯƠNG 3. KỸ THUẬT GIẤU TIN TRÊN MIỀN BIẾN ĐỔI DCT 123.1 Phép biến đổi cosin rời rạc 133.2 Kỹ thuật nén ảnh dạng chuẩn jpeg dùng biến đổi cosin rời rạc 143.2.1 Mã hoá và giải mã dùng biến đổi DCT 143.2.2 Lượng tử và giải lượng tử 163.2.3 Mã hóa và giải mã jpeg 163.3 Một số kỹ thuật giấu tin trên miền biến đổi DCT 173.3.1 Thuật toán JSteg 173.3.2 Thuật toán OutGuess 0.1 183.3.3 Thuật toán F5 18CHƯƠNG 4. KỸ THUẬT PHÁT HIỆN ẢNH CÓ GIẤU TIN TRÊN MIỀN BIẾN ĐỔI DCT 244.1. Phát hiện tin ẩn giấu (Steganalysis) 244.2. Kỹ thuật phát hiện thống kê 254.3. Kỹ thuật phát hiện F5 274.4 Kết quả thực nghiệm 294.4.1 Kỹ thuật phát hiện thống kê 294.4.2 Kỹ thuật phát hiện F5 30KẾT KUẬN 31TÀI LIỆU THAM KHẢO 32LỜI CẢM ƠNTrước tiên, em xin chân thành Thank cô giáo Thạc sỹ Hồ Thị Hương Thơm đã tận tình hướng dẫn giúp đỡ em trong qúa trình tìm tài liệu, cũng như trong quá trình nghiên cứu, tìm hiểu và xây dựng, triển khai đề tài.Em cũng xin Thank các thầy cô trong tổ bộ môn tin học, phòng đào tạo, và ban giám hiệu Trường Đại học dân lập Hải Phòng đã giảng dạy kiến thức, tạo điều kiện và giúp đỡ em trong quá trình học tập tại trường.Cuối cùng em xin Thank sự chăm sóc của người thân, gia đình, sự động viên, giúp đỡ của bè bạn đã tạo điều kiện giúp em hoàn thành tốt qúa trình nghiên cứu thực tập và thực hiện đề tài.Mặc dù đã cố gắng nghiên cứu, tìm hiểu và hoàn thành báo cáo trong phạm vi và khả năng cho phép song chắc chắn sẽ không tránh khỏi những thiếu sót. Em rất mong nhận được sự thông cảm, góp ý và tận tình chỉ bảo của thầy cô và các bạnGIỚI THIỆUSteganography là một lĩnh vực khoa học và nghệ thuật giấu thông tin trong đa phương tiện. Hệ thống steganography giấu các thông tin mật số vào trong đối tượng số khác mà khó bị phát hiện bằng kỹ thuật thông thường. Trước kia con người sử dụng ẩn các hình xăm hay mực vô hình để truyền thông điệp mật. Ngày nay nhờ có máy tính và công nghệ mạng công việc truyền thông tin mật trở nên dễ dàng và hiệu quả hơn.Về cơ bản, quy trình ẩn thông tin trong hệ thống steganography bắt đầu bằng cách thay đổi các bit dư thừa trong đối tượng mang tin bởi các bit dữ liệu cần giấu (thay đổi các bit này sẽ không làm ảnh hưởng nhiều đến đối tượng ban đầu của vật mang tin) ta sẽ được đối tượng mới có chứa thông tin ẩn thường gọi là Stego.Nhưng trong quá trình truyền các đối tượng stego trong môi trường truyền thông các bit dư thừa có thể bị mất mát do quá trình nén hay bị tác động của một số phép biến đổi hình học nào đó. Do vậy để tránh mất mát có thể xẩy ra người ta thường dùng một số phép biển đổi như DCT (Discrete cosine transform), DWT (Discrete wavelete transform), DFT (Discrete fourier transform) để biến đổi miền dữ liệu của vật mang tin sang miền tần số sau đó giấu dữ liệu trên đó và dùng các phép biến đổi IDCT, IDWT, IDFT để chuyển ngược lại dữ liệu ban đầu.Trong một số lĩnh vực cần kiểm soát các thông tin trong môi trường truyền thông công cộng việc phân loại các đối tượng số là vấn đề rất quan trong. Trong đồ án này giới thiệu một số kỹ thuật phát hiện tin ẩn giấu trong miền biến đổi của ảnh số có sử dụng các kỹ thuật steganography: Jsteg, F5. Các kỹ thuật này sẽ được trình bày chi tiết trong chương 3. Trong chương 4 trình bày các kỹ thuật phát hiện phát hiện ảnh có giấu tin sử dụng các kỹ thuật trong chương 3.CHƯƠNG 1. TỔNG QUAN VỀ KỸ THUẬT GIẤU TIN1.1 Định nghĩa kỹ thuật giấu tin Giấu thông tin là một kỹ thuật nhúng (giấu) một lượng thông tin số nào đó vào trong một đối tượng dữ liệu số khác 5. Yêu cầu cơ bản của giấu tin là đảm bảo tính chất ẩn của thông tin được giấu đồng thời không ảnh hưởng đến chất lượng của dữ liệu gốc. Sự khác biệt giữa mã hoá thông tin và giấu thông tin là: mã hoá làm cho các thông tin hiện rõ là nó có được mã hoá hay không còn giấu thông tin thì người ta sẽ khó biết được là có thông tin giấu bên trong.1.2 Phân loại kỹ thuật giấu tinHình 1.1: Các kỹ thuật trong che giấu thông tin Kỹ thuật giấu tin nhằm mục đích đảm bảo an toàn và bảo mật thông tin ở hai khía cạnh:+ Một là bảo mật cho dữ liệu được đem giấu.+ Hai là bảo mật cho chính đối tượng được dùng để giấu tin. Từ hai khía cạnh khác nhau này dẫn đến hai khuynh hướng kỹ thuật chủ yếu của giấu tin là:1.2.1 Giấu tin mật (Steganography): khuyng hướng này tập trung vào các kỹ thuật giấu tin sao cho thông tin giấu được càng nhiều càng tốt và quan trọng là người khác khó phát hiện được một đối tượng có bị giấu tin bên trong hay không bằng kỹ thuật thông thường.1.2.2 Thủy vân số (Watermarking): đánh giấu vào đối tượng nhằm khẳng định bản quyền sở hữu hay phát hiện xuyên tạc thông tin. Thủy vân số được phân thành 2 loại thủy vân bền vững và thủy vân dễ vỡ. Thuỷ vân bền vững: thường được ứng dụng trong các ứng dụng bảo vệ bản quyền. Thuỷ vân được nhúng trong sản phẩm như một hình thức dán tem bản quyền. Trong trường hợp này, thuỷ vân phải tồn tại bền vững cùng với sản phẩm nhằm chống việc tẩy xoá, làm giả hay biến đổi phá huỷ thuỷ vân.+ Thuỷ vân ẩn: cũng giống như giấu tin, bằng mắt thường không thể nhìn thấy thuỷ vân.+ Thuỷ vân hiện: là loại thuỷ vân được hiện ngay trên sản phẩm và người dùng có thể nhìn thấy được. Thủy vân dễ vỡ: là kỹ thuật nhúng thuỷ vân vào trong ảnh sao cho khi phân bố sản phẩm trong môi trường mở nếu có bất cứ một phép biến đổi nào làm thay đổi đối tượng sản phẩm gốc thì thuỷ vân đã được giấu trong đối tượng sẽ không còn nguyên vẹn như trước khi dấu nữa (dễ vỡ).1.3 Giấu tin trong AudioKỹ thuật giấu thông tin trong audio phụ thuộc vào hệ thống thính giác của con người (HAS – Human Auditory System). HAS cảm nhận được tín hiệu ở dải tần rộng và công suất thay đổi lớn, nhưng lại kém trong việc phát hiện sự khác biệt nhỏ giữa dải tần và công suất. Điều này có nghĩa là các âm thanh to, cao tần có thể che giấu được các âm thanh nhỏ thấp một cách dễ dàng. Kênh truyền tin cũng là một vấn đề. Kênh truyền hay băng thông chậm sẽ ảnh hưởng đến chất lượng thông tin sau khi giấu. Giấu thông tin trong audio yêu cầu rất cao về tính đồng bộ và tính an toàn của thông tin.1.4 Giấu tin trong videoGiấu tin trong video cũng được quan tâm và được phát triển mạnh mẽ cho nhiều ứng dụng như điều khiển truy cập thông tin, nhận thực thông tin và bảo vệ bản quyền tác giả. Ta có thể lấy một ví dụ là hệ thống chương trình trả tiền xem theo video clip các thuật toán trước đây thường cho phép giấu ảnh vào trong video, nhưng gần đây kỹ thuật cho phép giấu cả âm thanh và ảnh vào trong video.1.5 Giấu tin trong ảnhGiấu thông tin trong ảnh hiện nay chiếm tỷ lệ lớn nhất trong các chương trình ứng dụng, các phần mềm, hệ thống giấu tin trong đa phương tiện bởi lượng thông tin trao đổi được trao đổi bằng ảnh là rất lớn, hơn nữa giấu thông tin trong ảnh cũng đóng vai trò hết sức quan trọng đối với hầu hết các ứng dụng bảo vệ an toàn thông tin như: nhận thực thông tin, xác định xuyên tạc thông tin, bảo vệ bản quyền tác giả, điều khiển truy cập, giấu thông tin mật… Chính vì thế mà vấn đề này đã nhận được sự quan tâm rất lớn của các nhà cá nhân, tổ chức, trường đại học, và viện nghiên cứu trên thế giới.Thông tin sẽ được giấu cùng với dữ liệu ảnh nhưng chất lượng ảnh ít thay đổi và chẳng ai biết được đằng sau ảnh đó mang những thông tin có ý nghĩa. Ngày nay, khi ảnh số đã được sử dụng rất phổ biến, thì giấu thông tintrong ảnh đã đem lại rất nhiều những ứng dụng quan trọng trên nhiều lĩnh vực trong đời sống xã hội.Ví dụ như đối với các nước phát triển, chữ kí tay đã được số hoá và lưu trữ sử dụng như là hồ sơ cá nhân của các dịch vụ ngân hàng và tài chính, nó được dùng để nhận thực trong các thẻ tín dụng của người tiêu dùng. Phần mềm WinWord của MicroSoft cũng cho phép người dùng lưu trữ chữ kí trong ảnh nhị phân rồi gắn vào vị trí nào đó trong file văn bản để đảm bảo tính an toàn của thông tin. Tài liệu sau đó được truyền trực tiếp qua máy fax hay lưu truyền trên mạng. Theo đó, việc nhận thực chữ kí, xác thực thông tin đã trở thành một vấn đề cực kì quan trọng khi mà việc ăn cắp thông tin hay xuyên tạc thông tin bởi các tin tặc đang trở thành một vấn nạn đối với bất kì quốc gia nào, tổ chức nào. Thêm vào đó, lại có rất nhiều loại thông tin quan trọng cần được bảo mật như những thông tin về an ninh, thông tin về bảo hiểm hay các thông tin về tài chính, các thông tin này được số hoá và lưu trữ trong hệ thống máy tính hay trên mạng. Chúng rất dễ bị lấy cắp và bị thay đổi bởi các phần mềm chuyên dụng. Việc nhận thực cũng như phát hiện thông tin xuyên tạc đã trở nên vô cùng quan trọng, cấp thiết.Và một đặc điểm của giấu thông tin trong ảnh đó là thông tin được giấu trong ảnh một cách vô hình, nó như là một cách mà truyền thông tin mật cho nhau mà người khác không thể biết được bởi sau khi giấu thông tin thì chất lượng ảnh gần như không thay đổi đặc biệt đối với ảnh mầu hay ảnh xám.
Ket-noi.com kho tài liệu miễn phí MỤC LỤC LỜI CẢM ƠN GIỚI THIỆU .2 CHƯƠNG TỔNG QUAN VỀ KỸ THUẬT GIẤU TIN 1.1 Định nghĩa kỹ thuật giấu tin 1.2 Phân loại kỹ thuật giấu tin 1.3 Giấu tin Audio 1.4 Giấu tin video 1.5 Giấu tin ảnh CHƯƠNG CẤU TRÚC CỦA MỘT SỐ ẢNH ĐẶC TRƯNG 2.1 Cấu trúc ảnh BMP 2.2 Cấu trúc ảnh PNG 2.3 Ảnh JPEG CHƯƠNG KỸ THUẬT GIẤU TIN TRÊN MIỀN BIẾN ĐỔI DCT .12 3.1 Phép biến đổi cosin rời rạc 3.2 Kỹ thuật nén ảnh dạng chuẩn jpeg dùng biến đổi cosin rời rạc 3.2.1 Mã hoá giải mã dùng biến đổi DCT 3.2.2 Lượng tử giải lượng tử 3.2.3 Mã hóa giải mã jpeg 3.3 Một số kỹ thuật giấu tin miền biến đổi DCT 3.3.1 Thuật toán JSteg 3.3.2 Thuật toán OutGuess 0.1 3.3.3 Thuật toán F5 CHƯƠNG KỸ THUẬT PHÁT HIỆN ẢNH CÓ GIẤU TIN TRÊN MIỀN BIẾN ĐỔI DCT 25 4.1 Phát tin ẩn giấu (Steganalysis) 4.2 Kỹ thuật phát thống kê 4.3 Kỹ thuật phát F5 4.4 Kết thực nghiệm 4.4.1 Kỹ thuật phát thống kê 4.4.2 Kỹ thuật phát F5 KẾT KUẬN .31 32 TÀI LIỆU THAM KHẢO 32 LỜI CẢM ƠN Ket-noi.com kho tài liệu miễn phí Trước tiên, em xin chân thành cảm ơn giáo Thạc sỹ Hồ Thị Hương Thơm tận tình hướng dẫn giúp đỡ em qúa trình tìm tài liệu, trình nghiên cứu, tìm hiểu xây dựng, triển khai đề tài Em xin cảm ơn thầy cô tổ môn tin học, phòng đào tạo, ban giám hiệu Trường Đại học dân lập Hải Phòng giảng dạy kiến thức, tạo điều kiện giúp đỡ em trình học tập trường Cuối em xin cảm ơn chăm sóc người thân, gia đình, động viên, giúp đỡ bè bạn tạo điều kiện giúp em hồn thành tốt qúa trình nghiên cứu thực tập thực đề tài Mặc dù cố gắng nghiên cứu, tìm hiểu hồn thành báo cáo phạm vi khả cho phép song chắn khơng tránh khỏi thiếu sót Em mong nhận thơng cảm, góp ý tận tình bảo thầy bạn GIỚI THIỆU Ket-noi.com kho tài liệu miễn phí Steganography lĩnh vực khoa học nghệ thuật giấu thông tin đa phương tiện Hệ thống steganography giấu thông tin mật số vào đối tượng số khác mà khó bị phát kỹ thuật thơng thường Trước người sử dụng ẩn hình xăm mực vơ hình để truyền thơng điệp mật Ngày nhờ có máy tính cơng nghệ mạng cơng việc truyền thông tin mật trở nên dễ dàng hiệu Về bản, quy trình ẩn thơng tin hệ thống steganography bắt đầu cách thay đổi bit dư thừa đối tượng mang tin bit liệu cần giấu (thay đổi bit không làm ảnh hưởng nhiều đến đối tượng ban đầu vật mang tin) ta đối tượng có chứa thơng tin ẩn thường gọi Stego Nhưng trình truyền đối tượng stego môi trường truyền thông bit dư thừa bị mát q trình nén bị tác động số phép biến đổi hình học Do để tránh mát xẩy người ta thường dùng số phép biển đổi DCT (Discrete cosine transform), DWT (Discrete wavelete transform), DFT (Discrete fourier transform) để biến đổi miền liệu vật mang tin sang miền tần số sau giấu liệu dùng phép biến đổi IDCT, IDWT, IDFT để chuyển ngược lại liệu ban đầu Trong số lĩnh vực cần kiểm sốt thơng tin mơi trường truyền thơng cơng cộng việc phân loại đối tượng số vấn đề quan Trong đồ án giới thiệu số kỹ thuật phát tin ẩn giấu miền biến đổi ảnh số có sử dụng kỹ thuật steganography: Jsteg, F5 Các kỹ thuật trình bày chi tiết chương Trong chương trình bày kỹ thuật phát phát ảnh có giấu tin sử dụng kỹ thuật chương CHƯƠNG TỔNG QUAN VỀ KỸ THUẬT GIẤU TIN Ket-noi.com kho tài liệu miễn phí 1.1 Định nghĩa kỹ thuật giấu tin - Giấu thông tin kỹ thuật nhúng (giấu) lượng thông tin số vào đối tượng liệu số khác [5] - Yêu cầu giấu tin đảm bảo tính chất ẩn thơng tin giấu đồng thời không ảnh hưởng đến chất lượng liệu gốc - Sự khác biệt mã hoá thơng tin giấu thơng tin là: mã hố làm cho thơng tin rõ có mã hố hay khơng cịn giấu thơng tin người ta khó biết có thơng tin giấu bên 1.2 Phân loại kỹ thuật giấu tin Infomation hiding Giấu thông tin Linguistic Steganography Giấu tin ngôn ngữ Watermarking Thuỷ vân số Steganography Giấu tin mật Technical Steganography Kỹ thuật giấu tin Robust Copyright marking Thuỷ vân bền vững Imperceptible Watermarking Thuỷ vân ẩn Fragile Watermarking Thuỷ vân “dễ vỡ” Visible Watermarking Thuỷ vân hiển Ket-noi.com kho tài liệu miễn phí Hình 1.1: Các kỹ thuật che giấu thông tin - Kỹ thuật giấu tin nhằm mục đích đảm bảo an tồn bảo mật thơng tin hai khía cạnh: + Một bảo mật cho liệu đem giấu + Hai bảo mật cho đối tượng dùng để giấu tin - Từ hai khía cạnh khác dẫn đến hai khuynh hướng kỹ thuật chủ yếu giấu tin là: 1.2.1 Giấu tin mật (Steganography): khuyng hướng tập trung vào kỹ thuật giấu tin cho thông tin giấu nhiều tốt quan trọng người khác khó phát đối tượng có bị giấu tin bên hay khơng kỹ thuật thông thường 1.2.2 Thủy vân số (Watermarking): đánh giấu vào đối tượng nhằm khẳng định quyền sở hữu hay phát xuyên tạc thông tin Thủy vân số phân thành loại thủy vân bền vững thủy vân dễ vỡ - Thuỷ vân bền vững: thường ứng dụng ứng dụng bảo vệ quyền Thuỷ vân nhúng sản phẩm hình thức dán tem quyền Trong trường hợp này, thuỷ vân phải tồn bền vững với sản phẩm nhằm chống việc tẩy xoá, làm giả hay biến đổi phá huỷ thuỷ vân + Thuỷ vân ẩn: giống giấu tin, mắt thường nhìn thấy thuỷ vân + Thuỷ vân hiện: loại thuỷ vân sản phẩm người dùng nhìn thấy - Thủy vân dễ vỡ: kỹ thuật nhúng thuỷ vân vào ảnh cho phân bố sản phẩm môi trường mở có phép biến đổi Ket-noi.com kho tài liệu miễn phí làm thay đổi đối tượng sản phẩm gốc thuỷ vân giấu đối tượng khơng cịn ngun vẹn trước dấu (dễ vỡ) 1.3 Giấu tin Audio Kỹ thuật giấu thông tin audio phụ thuộc vào hệ thống thính giác người (HAS – Human Auditory System) HAS cảm nhận tín hiệu dải tần rộng công suất thay đổi lớn, lại việc phát khác biệt nhỏ dải tần cơng suất Điều có nghĩa âm to, cao tần che giấu âm nhỏ thấp cách dễ dàng Kênh truyền tin vấn đề Kênh truyền hay băng thông chậm ảnh hưởng đến chất lượng thông tin sau giấu Giấu thông tin audio yêu cầu cao tính đồng tính an tồn thơng tin 1.4 Giấu tin video Giấu tin video quan tâm phát triển mạnh mẽ cho nhiều ứng dụng điều khiển truy cập thông tin, nhận thực thông tin bảo vệ quyền tác giả Ta lấy ví dụ hệ thống chương trình trả tiền xem theo video clip thuật toán trước thường cho phép giấu ảnh vào video, gần kỹ thuật cho phép giấu âm ảnh vào video 1.5 Giấu tin ảnh Giấu thông tin ảnh chiếm tỷ lệ lớn chương trình ứng dụng, phần mềm, hệ thống giấu tin đa phương tiện lượng thông tin trao đổi trao đổi ảnh lớn, giấu thông tin ảnh đóng vai trị quan trọng hầu hết ứng dụng bảo vệ an tồn thơng tin như: nhận thực thông tin, xác định xuyên tạc thông tin, bảo vệ quyền tác giả, điều khiển truy cập, giấu thơng tin mật… Chính mà vấn đề nhận quan tâm lớn nhà cá nhân, tổ chức, trường đại học, viện nghiên cứu giới Ket-noi.com kho tài liệu miễn phí Thơng tin giấu với liệu ảnh chất lượng ảnh thay đổi chẳng biết đằng sau ảnh mang thơng tin có ý nghĩa Ngày nay, ảnh số sử dụng phổ biến, giấu thông tin ảnh đem lại nhiều ứng dụng quan trọng nhiều lĩnh vực đời sống xã hội Ví dụ nước phát triển, chữ kí tay số hố lưu trữ sử dụng hồ sơ cá nhân dịch vụ ngân hàng tài chính, dùng để nhận thực thẻ tín dụng người tiêu dùng Phần mềm WinWord MicroSoft cho phép người dùng lưu trữ chữ kí ảnh nhị phân gắn vào vị trí file văn để đảm bảo tính an tồn thơng tin Tài liệu sau truyền trực tiếp qua máy fax lưu truyền mạng Theo đó, việc nhận thực chữ kí, xác thực thơng tin trở thành vấn đề quan trọng mà việc ăn cắp thông tin hay xuyên tạc thông tin tin tặc trở thành vấn nạn quốc gia nào, tổ chức Thêm vào đó, lại có nhiều loại thông tin quan trọng cần bảo mật thông tin an ninh, thông tin bảo hiểm hay thơng tin tài chính, thơng tin số hoá lưu trữ hệ thống máy tính hay mạng Chúng dễ bị lấy cắp bị thay đổi phần mềm chuyên dụng Việc nhận thực phát thông tin xuyên tạc trở nên vô quan trọng, cấp thiết Và đặc điểm giấu thông tin ảnh thơng tin giấu ảnh cách vơ hình, cách mà truyền thông tin mật cho mà người khác biết sau giấu thơng tin chất lượng ảnh gần không thay đổi đặc biệt ảnh mầu hay ảnh xám Ket-noi.com kho tài liệu miễn phí CHƯƠNG CẤU TRÚC CỦA MỘT SỐ ẢNH ĐẶC TRƯNG 2.1 Cấu trúc ảnh BMP Một file *.BMP chia làm phần chính: BitmapHeader, Palette màu BitmapData + BitmapHeader: Byte thứ Ý nghĩa Giá trị 1-2 Nhận dạng file ‘BM’ hay 19778 3-6 Kích thước file Kiểu long Turbo C 7-10 Dự trữ Thường mang giá trị 11-14 Byte bắt đầu vùng liệu Offset byte bắt đầu vùng liệu 15-18 Số byte cho vùng info byte 19-22 Chiều rộng ảnh BMP Tính pixel 23-26 Chiều cao ảnh BMP Tính pixel 27-28 Số Planes màu Cố định 29-30 Số bit cho pixel Có thể 1, 4, 8, 16, 24 tuỳ theo loại ảnh 31-34 Kiểu nén liệu 0: không nén 1: Nén runlength 8bit/pixel 2: Nén runlength 4bit/pixel 35-38 Kích thước ảnh Tính byte 39-42 Độ phân giải ngang Tính pixel/metter Ket-noi.com kho tài liệu miễn phí 43-46 Độ phân giải dọc 47-50 Số màu sử dụng ảnh 51-54 Số màu sử dụng để Tính pixel/metter hiển thị ảnh + Palette màu: Kích thước vùng Palette màu 4*số màu ảnh Vì Palette màu hình có cấu tạo theo thứ tự Red-Green-Blue, nên đọc palette màu ảnh BMP vào ta phải chuyển đổi lại cho phù hợp Số màu ảnh biết dựa số bit cho pixel cụ thể là: bit/pixel: ảnh 256 màu, 4bit/pixel: ảnh 16 màu, 24bit/pixel ảnh 24 bit màu + BitmapData : Phần kề tiếp sau Palette màu BMP Đây phần chứa giá trị màu điểm ảnh BMP Các điểm ảnh lưu theo thứ tự từ trái qua phải dòng dòng lại lưu theo thứ tự lên Mỗi Byte vùng BitmapData biểu diễn nhiều điểm ảnh tùy theo số bits cho pixel 2.2 Cấu trúc ảnh PNG PNG (từ viết tắt tiếng Anh Portable Network Graphics) dạng hình ảnh sử dụng phương pháp nén liệu - không làm liệu gốc PNG tạo nhằm cải thiện thay định dạng ảnh GIF với định dạng hình ảnh khơng địi hỏi phải có giấy phép sáng chế sử dụng PNG hỗ trợ thư viện tham chiếu libpng, thư viện tảng độc lập bao gồm hàm C để quản lý hình ảnh PNG - Cấu trúc ảnh PNG: + Phần đầu tập tin: Ket-noi.com kho tài liệu miễn phí Một tập tin PNG bao gồm 8-byte (kí hiệu 89 50 4E 47 0D 0A 1A 0A) viết hệ thống có số 16, chứa chữ "PNG" dấu xuống dòng, xếp theo số lượng thành phần, thành phần chứa thơng tin hình ảnh Cấu trúc dựa thành phần thiết kế cho phép định dạng PNG tương thích với phiên cũ sử dụng + Các thành phần tập tin: PNG cấu trúc chuỗi thành phần, thành phần chứa kích thước, kiểu, liệu, mã sửa lỗi CRC Chuỗi gán tên chữ phân biệt chữ hoa chữ thường Sự phân biệt giúp giải mã phát chất chuỗi khơng nhận dạng Với chữ đầu, viết hoa thể chuỗi thiết yếu Chuỗi thiết yếu chứa thông tin cần thiết để đọc tệp giải mã không nhận dạng chuỗi thiết yếu, việc đọc tệp phải hủy 2.3 Ảnh JPEG JPEG viết tắt Joint Photographic Experts Group [5], nhóm nhà nghiên cứu phát minh định dạng để hiển thị hình ảnh đầy đủ màu (full-colour) cho định dạng di động mà kích thước file lại nhỏ Giống ảnh GIF, JPEG sử dụng nhiều Web Lợi ích chúng GIF chúng hiển thị hình ảnh với màu xác true-colour (chúng lên đến 16 triệu màu), điều cho phép chúng sử dụng tốt cho hình ảnh chụp hình ảnh minh họa có số lượng màu lớn Các ảnh JPEG làm suốt chuyển động - trường hợp bạn sử dụng định dạng GIF (hoặc định dạng PNG để tạo suốt) 10 Ket-noi.com kho tài liệu miễn phí qua hệ số DC (DCT=64) hệ số Nếu LSB hệ số DCT không phù hợp với bit thông điệp, giá trị tuyệt đối hệ số giảm Nếu phép trừ dẫn đến bit thông điệp phải nhúng vào hệ số tiếp theo, phía người nhận, thơng điệp lấy hệ số DCT khác Đặc biệt F5 sử dụng ma trận mã hoá (matric encoding) để giảm thiểu số thay đổi cần thiết giấu thơng điệp Với cách thức giảm thiểu tối đa khoảng 50% thay đổi ảnh so với Jsteg Theo miêu tả thuật toán F5 phiên 11, chương trình u cầu thơng tin vào gồm có • Yếu tố chất lượng Q ảnh stego • Ảnh vào ( dạng TIFF, BMP, JPEG, GIF) • Tên tệp đầu • Tệp chứa thơng điệp bí mật • Mật người dùng sử dụng cho tạo giả ngẫu nhiên PRNG • Chú thích chèn vào phần header ảnh (thường độ dài thơng điệp) Matrix encoding có tham số (c,n,k) với c số thay đổi nhóm gồm n hệ số DCT, k số bit nhúng Trong [8] tác giả sử dụng matrix encoding đơn giản (1,2 k1,k), sử dụng hàm băm để đưa k bit áp dụng cho k –1 hệ số Ví dụ, muốn nhúng bit x 1,x2 (k=2) vào nhóm hệ số (22-1=3) a1, a2, a3 thay đổi vị trí Chúng ta bắt gặp trường hợp xẩy sau: 19 Ket-noi.com kho tài liệu miễn phí x1=a1 ⊕ a3, x2= a2 ⊕ a3 ⇒ khơng thay đổi x1≠ a1 ⊕ a3, x2= a2 ⊕ a3 ⇒ thay đổi a1 x1=a1 ⊕ a3, x2≠ a2 ⊕ a3 ⇒ thay đổi a2 x1≠ a1 ⊕ a3, x2≠ a2 ⊕ a3 ⇒ thay đổi a3 Từ ta lấy x1, x2 dựa vào trường hợp Trường hợp tổng quát, có từ mã a với n vị trí bit thay đổi cho k bit thơng điệp mật x Đặt f hàm băm dùng để lấy k bit từ từ mã Matrix encoding giúp tìm thay đổi phù hợp a thành a’ đổi với a x với x=f(a’) cho khoảng cách Hamming d(a,a’) 0, LSB(d)=1–d mod với d < 0) Nếu độ dài thông điệp phù hợp với khả giấu ảnh q trình giấu thành cơng, ngược lại thơng báo lỗi cho biết độ dài lớn ảnh giấu 23 Ket-noi.com kho tài liệu miễn phí để điều chỉnh thông điệp giấu thay đổi ảnh dùng để giấu thơng điệp Thuật tốn giấu F5 24 Ket-noi.com kho tài liệu miễn phí CHƯƠNG KỸ THUẬT PHÁT HIỆN ẢNH CÓ GIẤU TIN TRÊN MIỀN BIẾN ĐỔI DCT 4.1 Phát tin ẩn giấu (Steganalysis) Steganalysis kỹ thuật phát tồn thông tin ẩn giấu multimedia Giống thám mã, mục đích Steganalysis phát thông tin ẩn phá vỡ tính bí mật vật mang tin ẩn Phân tích tin ẩn giấu thường dựa vào yếu tố sau: - Phân tích dựa vào đối tượng mang tin - Phân tích so sánh đặc trưng: So sánh vật mang tin chưa giấu tin với vật mang tin giấu tin, đưa khác biệt chúng - Phân tích dựa vào thơng điệp cần giấu để dị tìm - Phân tích dựa vào thuật toán giấu tin đối tượng giấu biết: Kiểu phân tích phải định đặc trưng đối tượng giấu tin, cơng cụ giấu tin (thuật tốn) sử dụng - Phân tích dựa vào thuật tốn giấu tin, đối tượng gốc đối tượng sau giấu tin Các phương pháp phân tích phân thành nhóm ([7]): - Phân tích trực quan: Thường dựa vào quan sát dùng biểu đồ histogram ảnh gốc ảnh chưa giấu tin để phát khác biệt hai ảnh đưa vấn đề nghi vấn Với phương pháp phân tích thường khó phát với ảnh có độ nhiễu cao kích cỡ lớn - Phân tích theo dạng ảnh: Phương pháp thường dựa vào dạng ảnh bitmap ảnh nén để đoán nhận kỹ thuật giấu hay sử dụng ảnh bitmap thường hay sử dụng giấu miền LSB, ảnh nén thường sử dụng kỹ thuật giấu hệ số biến đổi DCT, DWT, DFT Phương pháp rộng 25 Ket-noi.com kho tài liệu miễn phí - Phân tích theo thống kê: Đây phương pháp sử dụng lý thuyết thống kê thống kê toán sau xác định nghi vấn đặc trưng Phương pháp thường đưa độ tin cậy cao đặc biệt cho ảnh liệu lớn Trong phần trình bày số phương pháp phát ảnh có giấu tin miền LSB thống kê toán học Các phương pháp đưa độ tin cậy cao liệu giấu lớn có số hạn chế cho số ảnh có tỷ lệ nhiễu lớn 4.2 Kỹ thuật phát thống kê χ2 Sử dụng thống kê Chi-Squared kiểm tra ảnh có giấu tin hay khơng giấu miền LSB ảnh Kỹ thuật Jsteg kỹ thuật giấu Outgess giấu tin LSB hệ số DCT ta sử dụng thống kê Chisquare để phát ảnh có giấu tin sử dụng kỹ thuật giấu Jsteg kỹ thuật giấu Outgess sau: Thuật toán thống kê chi-square Input : stego image Output: kết luận có giấu tin hay khơng Các bước thực - Biến đổi miền liệu ảnh sang miền tần số DCT ta thu hệ số DCT - Đặt X vector với xk = tần số xuất hệ số DCT có giá trị tuyệt đối chẵn (giá trị 2k) - Đặt Y vector với yk = tần số xuất hệ số DCT có giá trị tuyệt đối lẻ (giá trị 2k+1) - Khởi tạo giá trị ban đầu X Y Sau POV đếm giá trị hệ số DCT, kiểm tra điền vào X, Y tương ứng 26 Ket-noi.com kho tài liệu miễn phí - Lấy giá trị trung bình xk yk z k = xk + yk - Sau thống kê Chi-Square với n-1 mức tự tính sau: n −1 X n2−1 = ∑ i =0 ( xi − z i ) zi với zi = xi + y i (1) Theo giả thuyết, χ n2−1 nhỏ ảnh giấu tin, xi nhỏ so với zi Và ảnh không giấu tin χ n2−1 lớn, xi lớn so với zi Tính p (giá trị đánh giá xác suất giấu tin) hàm mật độ tích hợp với χ n2−1 giới hạn nó: p = 1- n −1 n −1 Γ( ) χ n2−1 ∫ − u e 2u n −1 −1 du (2) Hình 4.1 : biểu đồ mơ tả phát ảnh có giấu tin sử dụng thống kê Chi-square Đối với ảnh thông tin giấu nhúng liên tục (từ góc trái ảnh) giá trị p gần tới sau rơi xuống thăm 27 Ket-noi.com kho tài liệu miễn phí vùng không giấu Với kỹ thuật độ phát cao mà cịn tính tốn độ dài thông điệp giấu Nếu pixel mang thông điệp chọn ngẫu nhiên chọn liên tục, kỹ thuật hiệu (trừ trường hợp số lượng giấu từ 97% số pixel ảnh trở lên) Westfeld [1] đưa trường hợp tổng quát cách nhóm màu từ màu trung tâm với lân cận chúng sau hợp giá trị chúng sử dụng hàm giống hàm băm Các giá trị kết hợp dùng để kiểm tra chi-square 4.3 Kỹ thuật phát F5 Fridrich nhóm bà đề xuất phương pháp [6] phát ảnh có giấu thơng tin thuật tốn F5 Họ ước lượng histogram ảnh cover từ ảnh stego thống kê khác biệt Kết họ phát nhận tỉ lệ thay đổi β hệ số DCT ảnh có sử dụng giấu F5 Fridrich đồng nghiệp bà phát bước nhúng F5 làm thay đổi hệ số AC Đặt huv(d)=|{F(u,v)| d=|F(u,v)|,u+v ≠ 0}| tổng hệ số AC DCT ảnh cover vị trí (u,v) có giá trị tuyệt đối d Ký hiệu Huv(d) hàm tương ứng cho ảnh stego Nếu F5 thay đổi n hệ số AC, tỉ lệ thay đổi β=n/P với P tổng số hệ số AC Khi F5 thay đổi hệ số giả ngẫu nhiên giá trị histogram ảnh stego Huv(d) < (1-β)huv(d) +βhuv(d+1) với d>0 Huv(0) < huv(0) +βhuv(1) với d=0 Sử dụng giá trị ước lượng để tính tốn tỉ lệ thay đổi β từ histogram ảnh cover Họ phát phù hợp tốt sử dụng d=0 d=1 28 Ket-noi.com kho tài liệu miễn phí giá trị hệ số thay đổi lớn suốt q trình nhúng Điều dẫn đến độ xấp xỉ Giá trị cuối β tính giá trị trung bình β cho tần số (u,v) ∈ {(1,2),(2,1), (2,2)} Giá trị histogram cho ảnh cover khơng biết trước phải ước lượng từ ảnh stego Làm điều cách giải nén ảnh stego sang miền giá trị Ảnh cắt pixel hàng cột phần sau ước lượng histogram từ ảnh nén lại Hình 4.2 : Ảnh cắt pixel hai mặt Bởi nhiều ảnh lưu trữ dạng JPEG Nhúng thông tin dùng kỹ thuật nén sử dụng F5 dẫn đến nén ảnh hai lần dẫn đến xáo trộn thuật toán phát Fridrich đề xuất phương pháp loại bỏ ảnh hưởng nén lần cách ước lượng yếu tố chất lượng sử dụng nén ảnh cover 29 Ket-noi.com kho tài liệu miễn phí Hình 4.3 biểu diễn ví dụ ước lượng histogram tốt so sánh với histogram ảnh gốc Trên biểu đồ biểu diễn dấu thập(+) histogram ảnh cover vị trí(2,1), giá trị histogram ảnh stego dấu (*), giá trị histogram ước lượng hình trịn (o) Hình 4.3 : Giá trị histogram ảnh vị trí (2,1) 4.4 Kết thực nghiệm 4.4.1 Kỹ thuật phát thống kê Độ dài thông điệp (%) Khả Jstego 10 5.5 20 24 30 40 χ2 χ 50 60 ảnh 70 80 90 35.6 63.9 87.4 95.4 100 100 100 100 100 gốc phát Outgess 0 3.5 40 80 95 (%) Dùng kỹ thuật phát thống kê để phát 40 ảnh cấp xám PNG giấu kỹ thuật Jstego, Outgess Dưới bảng kết : Bảng 4.1 Kết phát 40 ảnh png thống kê 4.4.2 Kỹ thuật phát F5 30 Ket-noi.com kho tài liệu miễn phí Dùng kỹ thuật phát F5 để phát 30 ảnh cấp xám Bitmap chuyển từ ảnh gốc chụp máy ảnh kỹ thuật số dùng công cụ Photoshop CS 8.0 giấu kỹ thuật F5 Dưới bảng kết kiểm tra: Ảnh β n 0.106 11846 0.238 21937 0.079 5214 0.273 19490 0.265 21011 0.276 22040 0.248 21276 0.409 25873 0.044 2570 10 0.070 5124 11 0.103 6187 12 0.250 15745 13 0.522 21531 14 0.113 8386 15 0.078 4571 16 0.291 20955 17 0.083 7222 18 0.073 4513 19 0.329 19342 20 0.377 19308 Bảng 4.2 Tỷ lệ giấu β KẾT KUẬN 31 Ket-noi.com kho tài liệu miễn phí Phát thơng tin ẩn giấu liệu đa phương tiện đặc biệt ảnh số vấn đề quan tâm nhiều lĩnh vực Để phát phân biệt ảnh số có mang tin mật hay khơng địi hỏi nhiều yếu tố kỹ thuật phức tạp Trong lĩnh vực thuỷ vân số (watermarking) thường sử dụng kỹ thuật DCT để biến đổi miền liệu ảnh sang miền tần số sau nhúng lượng thơng tin số vào ảnh Vấn đề phát phân loại ảnh số có giấu thơng tin miền biến đổi DCT vấn đề quan tâm Trong đồ án đưa nhìn tổng quan vấn đề giấu tin miền biến đổi DCT phát ảnh có giấu tin miền biến đổi DCT Vì thời gian nghiên cứu có hạn nên chưa xây dựng chương trình phần mềm ngôn ngữ chuyên dụng (như visual C++, C++) thử nghiệm môi trường mô Matlab để kiểm nghiệm Hướng nghiên cứu nghiên cứu tiếp số kỹ thuật phát khác cho ảnh có giấu miền DCT kỹ thuật break Outgess 0.2,… hồn thiện cài đặt đóng gói thành phần mềm chuyên dụng TÀI LIỆU THAM KHẢO 32 Ket-noi.com kho tài liệu miễn phí [1] A Westfeld and A Pfitzmann, “Attacks on Steganographic Systems”, In: LNCS vol.1768, Springer-Verlag, Berlin, pp 61−75, 2000 [2] N Provos, “Defending Against Statistical Steganalysis”, 10th USENIX Security Symposium, Washington, DC, 2001 [3] Andreas Westfeld: High Capacity Despite Better Steganalysis (F5– A Steganographic Algorithm).In: Moskowitz, I.S (eds.): Information Hiding 4th International Workshop Lecture Notes in Computer Science, Vol.2137 Springer-Verlag, Berlin Heidelberg New York (2001) 289– 302 [4] Niesl Provos, Peter Honeyman, Hide and seek: An introduction to steganography, Published by The IEEE computer society, 2003 [5] Nguyễn Xuân Huy, Trần Quốc Dũng, Giáo trình giấu tin thuỷ vân ảnh, Trung tâm thông tin tư liệu, TTKHTN - CN 2003 [6] Jessica Fridrich, Miroslav Goljan, Dorin Hogea, Steganalysis of JPEG Images: Breaking the F5 Algorithm, Pattern Recognition, 2006 ICPR 2006 18th International Conference on Volume 2, Issue , 2006 Page(s):267 – 270 [7] Christy A.Stanley: “Pair of Values and the chi-Squared Attack”, Department of Mattematics, Iowa State University, may-2005 33 ... thơng điệp Thuật tốn giấu F5 24 Ket-noi.com kho tài liệu miễn phí CHƯƠNG KỸ THUẬT PHÁT HIỆN ẢNH CÓ GIẤU TIN TRÊN MIỀN BIẾN ĐỔI DCT 4.1 Phát tin ẩn giấu (Steganalysis) Steganalysis kỹ thuật phát tồn... ảnh số có giấu thơng tin miền biến đổi DCT vấn đề quan tâm Trong đồ án đưa nhìn tổng quan vấn đề giấu tin miền biến đổi DCT phát ảnh có giấu tin miền biến đổi DCT Vì thời gian nghiên cứu có hạn... cho số ảnh có tỷ lệ nhiễu lớn 4.2 Kỹ thuật phát thống kê χ2 Sử dụng thống kê Chi-Squared kiểm tra ảnh có giấu tin hay khơng giấu miền LSB ảnh Kỹ thuật Jsteg kỹ thuật giấu Outgess giấu tin LSB