1. Trang chủ
  2. » Giáo án - Bài giảng

Bài giảng các kĩ thuật giấu tin

136 33 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - ĐỖ XUÂN CHỢ BÀI GIẢNG CÁC KỸ THUẬT GIẤU TIN Hà Nội, tháng 12 năm 2018 MỞ ĐẦU Kỹ thuật giấu tin kỹ thuật đời phát triển từ lâu Nếu trước việc triển khai áp dụng kỹ thuật giấu tin thường sử dụng lĩnh vực quân quốc phòng ngày ứng dụng giấu tin triển khai áp dụng hầu hết lĩnh vực công nghệ đời sống Việc triển khai kỹ thuật giấu tin thực tế mang lại hiệu lớn không lĩnh vực đảm bảo an tồn thơng tin mà cịn nhiều lĩnh vực khác Chính lợi ích to lớn lĩnh vực giấu tin mang lại mà công ty, doanh nghiệp, tổ chức rộng quốc gia có nghiên cứu ứng dụng kỹ thuật giấu tin để phục vụ cho lợi ích Mơn học “Các kỹ thuật giấu tin” môn chuyên ngành thuộc chương trình đào tạo đại học ngành An tồn thơng tin Học Viện Cơng Nghệ Bưu Chính Viễn Thơng Mơn học cung cấp kiến thức liên quan đến lĩnh vực giấu tin bao gồm: tổng quan kỹ thuật giấu tin; số phương pháp giấu tin phát giấu tin môi trường đa phương tiện, văn bản; số ứng dụng kỹ thuật giấu tin triển khai thực tế Bài giảng “Các kỹ thuật giấu tin” biên soạn sở đề cương chi tiết môn học duyệt tổng hợp tài liệu từ nhiều nguồn tin cậy nhằm cung cấp tài liệu phục vụ cho sinh viên nghiên cứu học tập Bài giảng cấu trúc thành chương sau: Chương 1: Tổng quan về kỹ thuật giấu tin Chương cung cấp kiến thức liên quan đến kỹ thuật giấu tin bao gồm: khái niệm, thuật ngữ, phân loại, số ứng dụng bản… Chương 2: Giấu tin ảnh Chương cung cấp kiến thức kỹ thuật giấu tin tách tin ảnh tĩnh Một số phương pháp giấu tin ảnh tĩnh bao gồm: LSB, hoán vị giả ngẫu nhiên, kỹ thuật biến đổi DCT, DWT…Bên cạnh đó, chương giảng cung cấp số phương pháp phát ảnh tĩnh có giấu tin Chương 3: Giấu tin âm Chương trình bày số kiến thức liên quan đến kỹ thuật giấu tin tách tin âm bao gồm: khái niệm, đặc điểm, nguyên tắc giấu tin tách tin, đánh giá ưu điểm nhược điểm kỹ thuật giấu tin Ngoài ra, chương đề cập đến số phương pháp, kỹ thuật phát giấu tin âm Chương 4: Giấu tin video Chương trình bày số kiến thức liên quan đến kỹ thuật giấu tin tách tin video Bên cạnh đó, chương giảng đề cập đến số phương pháp phát tin giấu video Chương 5: Giấu tin văn Trong chương trình bày số kiến thức liên quan đến kỹ thuật giấu tin văn bao gồm: khái niệm, đặc điểm, nguyên tắc giấu tin tách tin, đánh giá ưu điểm nhược điểm kỹ thuật giấu tin Ngoài ra, chương đề cập đến số phương pháp, kỹ thuật phát giấu tin văn MỤC LỤC DANH MỤC CÁC TỪ VIẾT TẮT CHƯƠNG 1: TỔNG QUAN VỀ GIẤU TIN 10 1.1 Tổng quan kỹ thuật giấu tin 10 1.1.1 Một số thuật ngữ khái niệm 10 1.1.2 Một số yêu cầu kỹ thuật giấu tin 11 1.1.3 Lịch sử phát triển .12 1.1.4 Vai trò tầm quan trọng 13 1.2 Phân loại kỹ thuật giấu tin 15 1.2.1 Phân loại theo vật chứa 15 1.2.2 Phân loại theo môi trường giấu tin 16 1.2.3 Phân loại theo cách thức tác động lên vật chứa tin 17 1.2.4 Phân loại theo mục đích sử dụng 17 1.2.5 Phân loại theo theo giao thức 20 1.3 Một số ứng dụng kỹ thuật giấu tin 21 1.3.1 Lấy dấu vân tay (fingerprinting) 21 1.3.2 Xác thực nội dung (content authentication) .22 1.3.3 Kiểm soát chép (copy control) .23 1.3.4 Bảo vệ quyền tác giả (Copyright protection) 25 1.3.5 Một số ứng dụng khác 25 1.4 Câu hỏi ôn tập 25 CHƯƠNG 2: GIẤU TIN TRONG ẢNH 27 2.1 Một số vấn đề giấu tin ảnh 27 2.1.1 Khái niệm yêu cầu kỹ thuật giấu ảnh 27 2.1.2 Một số định dạng ảnh 27 2.1.3 Phân loại kỹ thuật giấu tin ảnh .30 2.2 Phương pháp giấu tin miền không gian 31 2.2.1 Phương pháp thay 31 2.2.2 Phương pháp hoán vị giả ngẫu nhiên .33 2.3 Phương pháp giấu tin miền tần số 36 2.3.1 Phương pháp biến đổi miền tần số DCT 36 2.3.2 Phương pháp biến đổi DWT 44 2.4 Phương pháp phát giấu tin ảnh 55 2.4 Câu hỏi ôn tập 56 CHƯƠNG 3: GIẤU TIN TRONG ÂM THANH 58 3.1 Giới thiệu giấu tin âm 58 3.1.1 Đặc điểm kỹ thuật giấu tin âm .58 3.1.2 Một số định dạng file âm 59 3.1.3 Phân loại số phương pháp giấu tin âm 60 3.2 Phương pháp LSB 61 3.3 Phương pháp mã hóa pha 63 3.3.1 Khái niệm phương pháp mã hóa pha 63 3.3.2 Quy trình giấu tin phương pháp mã hóa pha 64 3.3.3 Đánh giá phương pháp mã hóa pha .67 3.4 Một số phương pháp khác 67 3.4.1 Phương pháp tự đánh dấu 67 3.4.2 Phương pháp trải phổ 70 3.4.3 Phương pháp Echo .80 3.5 Phương pháp phát giấu tin âm 84 3.6 Câu hỏi ôn tập 85 CHƯƠNG 4: GIẤU TIN TRONG VIDEO 87 4.1 Giới thiệu phương pháp giấu tin video 87 4.1.1 Đặc điểm giấu tin video .87 4.1.2 Một số định dạng file video 87 4.1.3 Phân loại kỹ thuật giấu tin video .89 4.2 Phương pháp giấu tin video 90 4.2.1 Phương pháp phát thay đổi khung cảnh 90 4.2.2 Phương pháp mặt phẳng bit 93 4.2.3 Phương pháp giấu miền video nén dựa khác biệt lượng 96 4.2.4 Phương pháp giấu miền nén video chất lượng cao 100 4.2.5 Phương pháp giấu tin miền hệ số 105 4.3 Phương pháp phát giấu tin video 109 4.4 Câu hỏi ôn tập 110 CHƯƠNG 5: GIẤU TIN TRONG VĂN BẢN 112 5.1 Đặc điểm giấu tin văn 112 5.1.1 Giới thiệu chung .112 5.1.2 Một số định dạng văn điển hình .112 5.1.3 Phân loại phương pháp giấu tin văn 114 5.2 Phương pháp dựa định dạng văn 115 5.2.1 Phương pháp sử dụng khoảng trắng .115 5.2.2 Phương pháp dịch chuyển vị trí dòng .118 5.2.3 Phương pháp dịch chuyển vị trí từ 120 5.3 Phương pháp sinh ngẫu nhiên thống kê 120 5.3.1 Phương pháp sử dụng văn phạm phi ngữ cảnh .120 5.3.2 Phương pháp dựa tính phản xạ đối xứng ký tự .124 5.4 Phương pháp sử dụng tính chất ngơn ngữ 129 5.4.1 Phương pháp sử dụng cú pháp 129 5.4.2 Phương pháp sử dụng ngữ nghĩa 130 5.5 Phương pháp phát giấu tin văn 131 5.6 Câu hỏi ôn tập 132 TÀI LIỆU THAM KHẢO 134 DANH MỤC CÁC TỪ VIẾT TẮT Từ viết tắt Thuật ngữ Tiếng Anh Thuật ngữ Tiếng Việt Bit có trọng số thấp LSB Least Significant Bit DCT Discrete Cosine Transformations Chuyển đổi cosin rời rạc DWT Discrete Wavelet Transform Chuyển đổi Wavelet rời rạc DFT - Discrete Fourier Transform Chuyển đổi Fourier rời rạc DC DC-coefficient Hệ số DC AC AC-coefficient Hệ số AC DSSS Direct Sequence Spectrum Spread Trải phổ dãy trực tiếp FHSS Frequency Spectrum Spread Trải phổ nhảy tần MPEG Moving Picture Experts Group Moving Picture Experts Group Human Auditory System Hệ thống thính giác người HAS Hopping DANH MỤC CÁC BẢNG BIỂU TT Bảng Nội dung Trang Bảng 2.1 Bảng 2.2 29 30 Bảng 2.3 Cấu trúc tập tin Bitmap Các giá trị tiêu đề tập tin PNG Mô tả số cờ thông dụng ảnh JPEG [9] Bảng 3.1 Một số phần mềm hỗ trợ giấu tin âm 61 Bảng 4.1 Phân loại bảng Huffman cho thành phần DC 102 Bảng 4.2 Huffman hệ số AC 103 Bảng 5.1 Phân nhóm dựa tính phản xạ đối xứng theo trục ngang 125 Bảng 5.2 126 Phân nhóm dựa tính phản xạ đối xứng theo trục dọc Phân nhóm dựa tính phản xạ đối xứng theo trục ngang trục 126 dọc 130 Mã hóa ký tự Tiếng Việt thành cặp bit Bảng 5.3 Bảng 5.4 31 DANH MỤC CÁC HÌNH VẼ Hình 1.1 Mơ hình chung cho q trình giấu tách tin 10 Hình 1.2 Phân loại kỹ thuật giấu tin 15 Hình 1.3 Phân loại phương pháp thủy vân số 18 Hình 1.4 Ứng dụng giấu tin kiểm sốt chép 24 Hình 2.1 Bit có trọng số thấp LSB 31 Hình 2.2 Sơ đồ nhúng tách tin phương pháp hoán vị giả ngẫu nhiên 34 Hình 2.3 Sơ đồ tổng quan trình giấu tin ảnh sử dụng phương pháp biến đổi DCT 37 Hình 2.4 Thuật tốn zigzac 43 Hình 2.5 Quy trình giấu tin ảnh sử dụng kỹ thuật biến đổi DWT 44 Hình 2.6 Quét theo chiều ngang 45 Hình 2.7 Quét theo chiều dọc 46 Hình 2.8 Hình ảnh gốc so với ảnh biến đổi DWT 46 Hình 2.9 Mơ hình tách tin kỹ thuật DWT 55 Hình 3.1 Ví dụ tín hiệu âm mẫu 59 Hình 3.2 Mô tả phương pháp thay bit thuật tốn LSB 62 Hình 3.3 Giấu tin sử dụng bit LSB 63 Hình 3.4 Kỹ thuật giấu tin âm dựa vào bit MSB bit LSB 63 Hình 3.5 Mô tả chia âm gốc thành segment 65 Hình 3.6 Minh họa đoạn biến đổi DFT 65 Hình 3.7 Tín hiệu giấu pha đoạn 66 Hình 3.8 Ma trận pha tạo 66 Hình 3.9 Pha tạo sau kết hợp cường độ pha cũ 66 Hình 3.10 So sánh pha trước sau giấu tin 67 Hình 3.11 Quy tắc giấu thông tin sử dụng phương pháp điều chỉnh tỉ lệ thời gian 68 Hình 3.12 Ý tưởng trải phổ truyền thống 72 Hình 3.13 Minh họa trải phổ nhảy tần 73 Hình 3.14 Sơ đồ khối hệ thống trải phổ FHSS 74 Hình 3.15 Biểu đồ tần số tần nhanh với FSK 75 Hình 3.16 Minh họa trải phổ dãy trực tiếp 77 Hình 3.17 Sơ đồ khối hệ thống trải phổ DSSS 77 Hình 3.18 Bộ điều chế BPSK 79 Hình 3.19 Các tham số phương pháp mã hóa tiếng vang 81 Hình 3.20 Sơ đồ tổng qt phương pháp mã hóa tiếng vang 82 Hình 3.21 Nhân nhân 82 Hình 3.22 Đầu vào đầu bước 83 Hình 3.23 Ví dụ giấu bit bit 83 Hình 3.24 Kết tiếng vang sử dụng nhân nhân 84 Hình 3.25 Kết hàm trộn 84 Hình 3.26 Phân loại kỹ thuật phát giấu tin âm 85 Hình 4.1 Quy trình giấu tin video dựa kỹ thuật phát chuyển cảnh 91 Hình 4.2 Biểu diễn điểm ảnh bit thành mặt phẳng bit 94 Hình 4.3 Phân loại vùng nhiễu vùng nhiều thông tin 95 Hình 4.4 Quy trình giấu tin video vào mặt phẳng bit 95 Hình 4.5 Sơ đồ tổng quát phương pháp giấu tin miền video nén dựa bằngDEW 97 Hình 4.6 Ví dụ việc chia khối lc 98 Hình 4.7 Q trình tính tốn lượng vùng lc 98 Hình 4.8 Quy trình giấu tin nội dung video MPEG -2 100 Hình 4.9 Quy trình mã hóa entropy thành phần hệ số DC .101 Hình 4.10 Quy trình mã hóa entropy thành phần hệ số AC 102 Hình 4.11 Thay giá trị cho thông tin cần giấu QIM 105 Hình 4.12 Mơ hình tổng qt kỹ thuật giấu tin miền hệ số 106 Hình 4.13 Quy trình giấu tin video kỹ thuật sửa đổi hệ số DC 107 Hình 4.14 Quy trình giấu tin video kỹ thuật sửa đổi hệ số DC AC với hệ số cân độ lệch .108 Hình 5.1 Một số vị trí khoảng trắng lựa chọn để giấu tin 115 CHƯƠNG 1: TỔNG QUAN VỀ GIẤU TIN Chương cung cấp kiến thức liên quan đến kỹ thuật giấu tin bao gồm: khái niệm, thuật ngữ, phân loại, số ứng dụng 1.1 Tổng quan kỹ thuật giấu tin 1.1.1 Một số thuật ngữ khái niệm a) Khái niệm kỹ thuật giấu tin Kỹ thuật giấu thông tin lĩnh vực chuyên nghiên cứu phương pháp, kỹ thuật, thuật tốn nhằm nhúng thơng tin vào đối tượng liệu khác Cũng giống mật mã học, kỹ thuật giấu tin bao gồm nhiều phương pháp, thuật toán kỹ thuật khác Mỗi phương pháp, thuật tốn kỹ thuật có u cầu đầu vào đầu khác Tuy nhiên, hệ thống giấu tin bao gồm thành phần sau (xem hình 1.1) [1] Khơng K Máy dị Vật chứa X Thông tin giấuM Tiền xử lý Tiền mã hóa Có X’ Bộ nhúng thơng tin E S Kênh thông tin S Bộ tách thông tin D Bộ giải mã M M’ Khóa K Hình 1.1 Mơ hình chung cho trình giấu tách tin Các tham số mơ hình {X, M, S, K, E, D} [1]: - X vật chứa - M thông tin cần giấu S vật chứa chứa tin K khóa E nhúng thông tin D tách thông tin - Q trình nhúng thơng tin q trình xử lý 𝐸: 𝑋 × 𝑀 × 𝐾 → 𝑆 - Q trình tách thơng tin q trình xử lý 𝐷: 𝑆 × 𝐾 → 𝑀, 𝑋 b) Các khái niệm mơ hình giấu tách tin 10 kí hiệu khởi đầu Kí hiệu sử dụng thành tố văn tạo sau - Chọn kí hiệu chưa kết thúc văn bản, tìm luật có kí hiệu chưa kết thúc bên trái thay kí hiệu kí hiệu phần bên phải luật - Lặp lại bước văn cịn tồn kí hiệu kết thúc Sau ví dụ CFG dùng để giấu chuỗi 0100110 kí hiệu chưa kết thúc kí hiệu in đậm, kí hiệu kết thúc kí hiệu viết thường Start → adjective noun tense verb adjective → the size | a size size → tiny | small | large | big noun → saw | ladder | truth | boy tense → is | was verb → waiting | standing Kí hiệu chưa kết thúc adjective Luật cho kí hiệu chưa kết thúc có hai lựa chọn tương đương (21) bit ẩn giấu cách chọn lựa chọn bên phải Bit giấu 0, lựa chọn (the size) Kí hiệu kết thúc “the” nối vào văn kí hiệu chưa kết thúc size thay tiếp Từ size có bốn lựa chọn tương đương (22) nên giấu hai bit Hai bit chuỗi cần giấu bit bit 0, nên lựa chọn thứ ba, “large” chọn Kí hiệu chưa kết thúc noun Theo luật, có bốn lựa chọn nên dùng hai bit chuỗi ẩn giấu Ở đây, hai bit bit bit nên “ladder” chọn Sự lựa chọn cho tense “was” (được bit tiếp theo), lựa chọn cho verb “waiting”, bit cuối Sau giấu tin thu câu “the large ladder was waiting” Câu gây nghi ngờ đọc người bình thường lại dễ dàng vượt qua kiểm tra máy tính Bộ mã hóa dễ dàng kết thúc câu (tức sau lựa chọn verb) với dấu chấm câu bắt đầu câu với chữ viết hoa, để tăng tính thực tế cho văn nhân tạo sinh Thuật toán giấu tin: Đầu vào: - Thơng điệp bí mật 122 - Bộ từ điển luật sinh Các bước thực hiện: - Bước 1: Chuyển đổi thơng điệp bí mật sang dạng nhị phân - Bước 2: Sinh chuỗi văn (G):  Nếu G rỗng: xuất “”  Nếu G ký tự kết thúc A: xuất “A”  Nếu G ký tự không kết thúc: với c luật sinh G: bắt đầu sinh chuỗi (c) tất luật sinh duyệt Đầu ra: - Văn nhân tạo chứa thơng điệp bí mật Một CFG lớn với nhiều lựa chọn ẩn nhiều bit tạo câu có ý nghĩa tự nhiên Một CFG khơng rõ ràng câu tạo cách chọn luật theo thứ tự khác Điều thể qua ví dụ sau Start → name action | who does name → Alice | Bob action → is here | was there who → Alice is | Bob was does → here | there Câu “Alice is here” sinh cách thay kí hiệu không kết thúc name action “Alice” “is here”, đồng thời sinh cách thay who does “Alice is” “here” Hiển nhiên, CFG tạo văn giải mã theo cách khác CFG không phù hợp để ẩn giấu thông tin Một CFG dạng Greibach normal form (GNF) kí hiệu chưa kết thúc lựa chọn cuối lựa chọn luật sinh Ví dụ, luật sinh có dạng something → A B | C D thuộc dạng GNF luật sinh dạng “blah → the size sum | a size bell” khơng thuộc dạng GNF Tuy nhiên sửa luật khơng thuộc dạng GNF thành GNF cách thêm luật sau: adjective → the sizesum | a sizebell sizesum → tiny sum | small sum | large sum | big sum sizebell → tiny bell | small bell | large bell | big bell 123 Bộ giải mã sử dụng CFG GNF để phân tích cú pháp, ví dụ sau đây: Start → noun verb noun → Alice | Bob verb → sent mail to | sent email to to → to rel recipient rel → all | some recipient → friends | relatives Để ẩn giấu chuỗi nhị phân 01010, mã hóa chọn “Alice” cho bit (0) “sent email to” cho bit thứ hai (1) Khơng từ giấu thơng tin luật thứ tư áp dụng (bởi khơng có lựa chọn nào) mã hóa sinh kí hiệu kết thúc “to”, sau sử dụng luật sinh cho rel để chọn “all” cho bit thứ ba (0), luật sinh cho recipient để chọn “relatives” cho bit thứ tư (1) Để ẩn bit thứ năm, giải mã bắt đầu câu Câu “Alice sent email to all relatives” dễ dàng giải mã theo thành phần cú pháp câu xác định bit ẩn Nhận xét: Ở ví dụ trên, ẩn giấu bit câu “Alice sent email to all relatives” có độ dài 33 kí tự (bao gồm khoảng trắng) Khả giấu tin ví dụ / (33 * 8) ≈ 0.015 bit ẩn giấu bit văn tạo để giấu tin Phương pháp tăng tính hiệu luật sinh có nhiều lựa chọn phần bên phải Một luật sinh với 2n lựa chọn giấu n bit Nếu lựa chọn từ có chữ (tức 32 bit) có 1024 = 210 lựa chọn luật sinh, 10 bit ẩn giấu 32 bit văn sinh ra, dẫn đến khả giấu tin 10 / 32 = 0.3125 bits/bit (bpb) Phương pháp cài đặt kiểm thử rộng rãi tác giả Peter Wayner So sánh với thuật toán giấu tin khác, phương pháp đánh giá đơn giản có hiệu tốt 5.3.2 Phương pháp dựa tính phản xạ đối xứng ký tự Trong hầu hết thuật tốn giấu tin, thơng điệp bí mật ẩn giấu cách thay đổi cấu trúc văn chứa khả bị nghi ngờ hay mát liệu gõ lại văn theo cấu trúc xác xảy Để tránh xảy khả tăng cường tính bảo mật, thay giấu bit bí mật cách thay đổi cấu trúc văn chứa, phương pháp giấu thơng điệp bí mật cách tạo văn tóm tắt thu thập từ báo hay phương tiện văn thơng tin đại chúng Q trình tạo văn 124 tóm tắt phụ thuộc vào tính phản xạ đối xứng bảng chữ tiếng Anh Dựa vào tính chất này, bảng chữ chia thành khác nhau, đại diện cho cặp bit Để thực điều cần phân tích tính phản xạ đối xứng bảng chữ tiếng Anh phân loại chúng để thể bit Các thuộc tính bit thể tương ứng trình bày sau Error! Reference source not found.: a) Phân loại bảng chữ tiếng Anh theo tính chất phản xạ đối xứng Để phân loại bảng chữ tiếng Anh theo tính phản xạ đối xứng, chọn chiều ngang trục đối xứng phân chia chữ tiếng Anh thành hai nhóm Các chữ sau chia theo chiều ngang, thu hai phần giống hệt nhau, ví dụ chữ ‘B’, ‘H’,… xếp vào nhóm, ngược lại, chữ sau chia theo chiều ngang, thu hai phần khơng giống nhau, ví dụ chữ ‘A’, ‘F’,… xếp vào nhóm cịn lại Tồn phân loại dựa logic trình bày bảng 5.1: Bảng 5.1.Phân nhóm dựa tính phản xạ đối xứng theo trục ngang ID nhóm Chữ nhóm A, F, G, J, L, M, Tính phản xạ đối xứng N, P, Q, R, S, T, không tuân thủ U, V, W, Y, Z Tính phản xạ đối xứng B, C, D, E, H, I, K, tuân thủ O, X Tên nhóm Bit giấu Áp dụng tương tự với trục dọc, thu hai nhóm bảng 5.2: Bảng 5.2 Phân nhóm dựa tính phản xạ đối xứng theo trục dọc ID nhóm Chữ nhóm B, C, D, E, F, G, J, Tính phản xạ đối xứng K, L, N, không tuân thủ P, Q, R, S, Z A, H, I, M, O, T, Tính phản xạ đối xứng U, V, W, tuân thủ X, Y Tên nhóm Bit giấu Kết hợp hai khái niệm mô tả bảng 5.1 bảng 5.2 phân loại bảng chữ tiếng Anh thành bốn nhóm dựa hai chiều ngang chiều dọc chữ Các chữ không đối xứng hai trục, ví dụ chữ ‘F’, chữ ‘G’,… chia vào nhóm Các chữ đối xứng theo trục ngang, ví dụ chữ ‘B’, chữ ‘D’,… chia vào nhóm Các chữ đối xứng theo trục dọc, ví dụ chữ ‘A’, chữ ‘M’ chia vào nhóm Các chữ 125 đối xứng theo hai trục, ví dụ chữ ‘H’, chữ ‘I’ chia vào nhóm Cụ thể, thu bảng 5.3: Bảng 5.3 Phân nhóm dựa tính phản xạ đối xứng theo trục ngang trục dọc Tên nhóm ID nhóm Chữ nhóm Tính phản xạ đối xứng F, G, J, L, N, P, Q, không tuân thủ R, S, Z hai trục Tính phản xạ đối xứng B, C, D, E, K tuân thủ trục ngang Tính phản xạ đối xứng A, M, T, U, V, W, tuân thủ trục dọc Y Tính phản xạ đối xứng H, I, O, X tuân thủ hai trục Bit giấu 00 01 10 11 b) Giấu tin văn sử dụng tính phản xạ đối xứng bảng chữ tiếng Anh Theo phân loại bảng chữ tiếng Anh mô tả bảng 5.3 dựa vào thông điệp bí mật văn phủ lựa chọn để sinh văn tóm tắt có chứa thơng điệp bí mật Văn tóm tắt gồm câu trích từ văn lựa chọn Các câu sử dụng chữ từ làm đại diện cho cặp bit thơng điệp cần ẩn giấu Thuật tốn giấu tin Đầu vào: - Thơng điệp bí mật - Bất kỳ văn ngôn ngữ tiếng Anh Các bước thực hiện: - Bước 1: Biến đổi thơng điệp bí mật thành chuỗi bit nhị phân - Bước 2: Kiểm tra xem tổng độ dài chuối bit chẵn hay lẻ Nếu lẻ, phải thêm bit ‘0’ vào cuối chuỗi bit nhị phân Bây chia chuỗi bit tổng thành cặp bit liên tiếp - Bước 3: Chuyển đổi toàn ký tự văn đầu vào thành chữ viết hoa - Bước 4: Với cặp bit, xem xét chữ từ câu:  Nếu chữ nằm nhóm đại diện cho cặp bit xem xét, chọn câu đưa vào văn chứa  Nếu chữ khơng nằm nhóm đại điện cho cặp bit xem xét, bỏ qua câu chọn câu 126 - Bước 5: Q trình tiếp diễn tồn chuỗi bit thơng điệp bí mật thực thi hết - Bước 6: Văn mã hóa thu tóm tắt văn đầu vào gửi đến người nhận Đầu ra: - Văn chứa thơng điệp bí mật, văn tóm lược văn đầu vào Thuật tốn tách tin: Đầu vào: - Văn chứa thông điệp bí mật (đầu thuật tốn giấu tin) Các bước thực hiện: - Bước 1: Lấy chữ từ câu - Bước 2: Dựa vào bảng 5.3 để lấy cặp bit từ chữ thu đưa file - Bước 3: Chuyển đổi chuổi bit nhị phân thành dạng chữ tương ứng - Bước 4: Tồn thơng điệp dạng chữ thu thơng điệp ẩn giấu Đầu ra: - Thơng điệp bí mật Ví dụ làm rõ quy trình giấu tin sử dụng tính phản xạ đối xứng bảng chữ tiếng Anh: Thông điệp cần giấu chuỗi bit “1100” Văn vật chứa: “Ostrich is a bird Ostrich can fly So many types of birds are there Peacock is our national bird.” Quá trình giấu: Để giấu hai bit đầu 11, xem xét câu “Ostrich is a bird.” Câu bắt đầu chữ ‘O’, thuộc nhóm 4, đại diện cho cặp bit 11 nên câu chọn Tiếp theo, phải giấu cặp bit 00 Câu “Ostrich can fly” bắt đầu chữ ‘O’, thuộc nhóm 4, đại diện cho cặp bit 11, nên bị bỏ qua Tương tự, câu “So many types of birds are there.” bắt đầu chữ ‘S’, thuộc nhóm 2, đại diện cho cặp bit 10, bị bỏ 127 qua Đến câu “Peacock is our national bird.” bắt đầu chữ ‘P’, thuộc nhóm 1, đại diện cho cặp bit 00, lựa chọn Văn chứa tin giấu là: “Ostrich is a bird Peacock is our national bird.” Nhận xét: Đây coi phương pháp giấu tin an toàn, khơng có thay đổi mặt cấu trúc nội dung văn kẻ công phải thực đọc chi tiết câu văn nhận biết văn có bất thường hay khơng c) Giấu tin văn sử dụng tính phản xạ đối xứng bảng chữ tiếng Việt Phương pháp giấu tin dựa tính phản xạ đối xứng ký tự áp dụng cho việc giấu tin văn tiếng Việt Về chất, bảng chữ tiếng Việt hệ Latin với bảng chữ tiến Anh, cải tiến phương pháp để giấu tin cho văn tiếng Việt sau: - Không cần phải kiểm tra mạo từ “A”, “The” phương pháp giấu thông tin Tiếng Anh - Với thông điệp ẩn giấu, phải sử dụng bảng mã Unicode thay cho bảng mã ASCII Tuy nhiên, để tối ưu hóa thơng điệp ẩn giấu, sử dụng bảng mã ASCII để chuyển ký tự thông dụng chữ trùng với bảng chữ tiếng Anh, chữ số, dấu chấm câu,… Các ký tự chuyển sang dạng chuỗi bit có độ dài byte (8-bit) Đối với ký tự đặc biệt riêng bảng chữ tiếng Việt (bao gồm chữ hoa, chữ thường dấu tiếng Việt huyền, sắc, hỏi, ngã, nặng), ví dụ “Á”, “à”, “ê”, “đ”,… dùng phép mã hóa UTF-8 với tùy ký tự thu chuỗi bit có độ dài bytes (16-bit) bytes (24-bits) Do ký tự đặc biệt có độ dài lớn ký tự thuộc bảng mã ASCII nên văn dùng để chứa thông điệp ẩn giấu có kích thước lớn - Với hệ thống đồ để mã hóa cặp bit, phải thêm chữ tiếng Việt, ví dụ “Á”, “À”, “Ă”, “”, “Đ”, “Ê”, “Ô”, “Ư”,… phải bỏ chữ “F”, “J”, bảng chữ tiếng Anh Chi tiết đồ mã hóa ký tự thành cặp bit sau: Bảng 5.4 Mã hóa ký tự Tiếng Việt thành cặp bit 128 Tên nhóm Chữ nhóm Tính đối xứng không tuân thủ hai trục Á, À, Ã, Ả, Ắ, Ằ, Ẵ, Ẳ, Ấ, Ầ, Ẫ, Ẩ, É, È, Ẽ, Ẹ, Ẻ, Ê, Ế, Ề, Ễ, Ể, Í, Ì, Ĩ, Ỉ, G, L, N, Ĩ, Ị, Õ, Ỏ, Ố, Ồ, Ỗ, Ổ, Ơ, Ớ, Ờ, Ỡ, Ợ, Ở, P, Q, R, S, Ú, Ù, Ũ, Ủ, Ư, Ứ, Ừ, Ữ, Ự, Ử, Ý, Ỳ, Ỹ, Ỷ Tính đối xứng tuân thủ trục ngang B, C, D, Đ, E, K 01 Tính đối xứng tuân thủ theo trục dọc A, Ạ, Ă, Ặ, Â, Ậ, Ị, M, Ọ, Ô, T, U, Ụ, V, Y, Ỵ 10 Tính đối xứng tuân thủ hai trục H, I, O, X 11 ID nhóm 5.4 Bit giấu 00 Phương pháp sử dụng tính chất ngơn ngữ 5.4.1 Phương pháp sử dụng cú pháp Phương pháp giấu tin sử dụng cú pháp dựa hai ý tưởng: a) Sử dụng dấu chấm câu cách không rõ ràng Ý tưởng trình sử dụng dấu chấm câu khơng rõ ràng đơn giản dễ bị phát việc sử dụng dấu chấm câu không quán gây ý Một ví dụ ý tưởng sử dụng dấu chấm câu nhập nhằng việc sử dụng cụm từ “Bánh mì, bơ, sữa” sử dụng cụm từ “Bánh mì, bơ sữa.” Cả hai cụm từ mặt cú pháp, thay đổi ln phiên hai hình thức ẩn giấu liệu nhị phân quy ước thành lần xuất cấu trúc (dấu “,” xuất trước chữ “và”) ẩn giấu bit “1”, xuất cấu trúc thứ hai (khơng có dấu “,” trước chữ “và”) ẩn dấu bit “0” Sử dụng phương pháp có ưu điểm khó bị phát nhược điểm hiệu suất giấu tin không cao áp dụng cho cú pháp định b) Sửa đổi văn cho ý nghĩa văn bảo toàn Ý tưởng việc sửa đổi an tồn, lại khó thực thi khả “hiểu” máy tính với ngơn ngữ người hạn chế Việc chỉnh sửa văn mà giữ ý nghĩa văn thủ thuật tinh vi để ẩn giấu thông tin Nghĩa hai cụm từ “Khi học xong, chơi” “con chơi học xong.” tương đương 129 thông tin ẩn giấu dựa vào cú pháp thay đổi Phương pháp giấu thơng tin có hiệu suất thấp phải có điều chỉnh thủ cơng Tuy nhiên phương pháp an tồn khó để máy tính phát thay đổi cú pháp hai cụm từ Kẻ công phải thực đọc tin nhắn cách thủ công xác định cụm từ có liên quan để trích xuất liệu 5.4.2 Phương pháp sử dụng ngữ nghĩa Phương pháp sử dụng ngữ nghĩa phương pháp mà liệu giấu văn cách sử dụng từ đồng nghĩa Ở phương pháp người gửi người nhận sử dụng từ điển trực tuyến định Đây coi tập liệu chứa từ quy ước giải mã đọc từ văn tìm kiếm từ tương ứng từ điển [29] a) Sử dụng từ đồng nghĩa Các giải mã đọc từ văn tìm kiếm từ đồng nghĩa từ điển, từ chẳng hạn “god child”, khơng có từ đồng nghĩa giải mã giả định khơng có liệu giấu Nếu từ “child” đầu vào, xuất từ điển từ đồng nghĩa danh sách (bud, chick, child, kid, minor), sau đó, danh sách xem để che giấu hai bit “child” (là từ thứ danh sách) hiểu ẩn giấu số bit (01 hệ nhị phân) Thuật tốn giấu tin: Đầu vào: - Thơng điệp bí mật - Văn phủ Các bước thực hiện: - Bước 1: Chuyển thông tin mật thành dạng nhị phân - Bước 2: Kiểm tra văn chọn từ xuất nhiều lần - Bước 3: Sử dụng từ điển đặc biệt chọn từ đồng nghĩa để thay cho từ chọn theo quy ước chuỗi nhị phân Đầu ra: - Văn phủ có chứa thơng điệp b) Trích rút câu 130 Một hướng tiếp cận khác phương pháp giấu tin ngữ nghĩa định nghĩa hàm rút câu thành bit liệu Cách làm kiểm tra tính chẵn lẻ mã ASCII tất ký tự câu Trong ứng dụng thực tế phương pháp này, xử lý văn chỉnh sửa sau: - Đầu tiên, xử lý văn nhận thông tin cần giấu chứa chúng chuỗi bit - Bộ xử lý văn nhận ký tự văn thường nhập vào theo chu kỳ, đưa vào hàm xử lý so sánh kết với bit thông tin ẩn giấu - Nếu tính chẵn lẻ tất mã ASCII câu có bit lệch với bit chuỗi bit cần giấu thông tin, xử lý văn từ chối không cho gõ thêm ký tự khác Lựa chọn người dùng phải viết lại câu 5.5 Phương pháp phát giấu tin văn Các phương pháp phát thông tin giấu văn dựa vào đặc điểm phương pháp giấu tin văn Do đặc điểm kỹ thuật giấu tin văn nên phương giấu tin có nhược điểm định Chính thực tế, để phát giấu tin văn người phân tích thường áp dụng số phương pháp sau [1, 2, 31]: - Phát giấu tin dựa vào khoảng trắng: Trong văn bản, thay đổi nhỏ từ khoảng cách dịng khó phát người quan sát bình thường Tuy nhiên, khoảng trống phụ ký tự "vơ hình" dễ dàng tiết lộ cách mở tệp tin trình xử lý văn thơng dụng Văn trơng "bình thường" gõ hình, tệp mở trình xử lý văn bản, dấu cách, tab ký tự khác làm biến dạng trình bày văn - Phát giấu tin dựa vào cú pháp ngữ nghĩa: Với giấu tin ngữ nghĩa cần có hiểu biết câu từ đoạn văn, nghĩa loại văn đó, với loại giấu tin cần phát đoạn viết không mượt, đoạn vơ nghĩa, từ đồng nghĩa, lỗi tả cố tình Về phần phát giấu tin dựa vào hồn tồn vào khả hiểu biết văn người kiểm tra - Phương pháp phát dựa phân tích tính thống kê sử dụng học máy: Phương pháp ban đầu nghiên cứu mơ hình thống kê văn tự nhiên, giấu thông tin văn thay đổi tính văn cách 131 phân tích tính thống kê Văn tự nhiên văn có giấu tin có tính khác sau [31]:  Chiều dài trung bình từ: Theo nguyên tắc Zipf Heaps, độ dài trung bình từ nằm phạm vi định Văn giấu tin thông tin mật giấu vào văn bản, lựa chọn từ ngẫu nhiên, có từ tần số cao văn thông thường chiều dài trung bình từ dài Để tăng che giấu văn giảm mức trung bình chiều dài từ cơng cụ giấu tin làm tăng số lượng từ ngắn tạo văn giấu tin  Tỷ lệ khoảng trắng: Theo nguyên tắc Heap, tỷ lệ khoảng trắng văn xấp xỉ tỷ lệ nghịch với chiều dài từ dấu chấm câu khơng tính Nếu khoảng trắng xuất hai lần nhiều có sở để kết luận văn bất thường Rõ ràng, việc phát làm nâng cao hiệu việc xác định văn chứa thông tin mật sử dụng thuật toán ẩn thay giấu tin đổi số khoảng trắng văn  N từ từ không hợp lệ: Theo lý thuyết TF-IDF, từ có tần số cao bao gồm từ tần số cao hiệu (AFW) từ tần số cao khơng hợp lệ (NFW) AFW từ khóa hợp lệ để thể chủ đề viết, NFW từ khơng có ý nghĩa, chẳng hạn "the", "of", v.v  Phần trăm chữ cái: Trong báo tiếng Anh, số lượng văn nhỏ, việc phân phối chữ văn thay đổi nhiều Như số lượng văn tăng lên, tính ngẫu nhiên chữ tăng, phần trăm chữ gần không thay đổi  Phần trăm chữ đầu: Việc phân phối chữ ban đầu văn tiếng Anh có liên quan đến việc phân phối chữ ban đầu từ điển Vì phân bố chữ ban đầu từ điển khác dẫn đến phân bố ban đầu văn khác Tính ngẫu nhiên văn chứa tin mật văn tự nhiên khác Dựa vào năm trích chọn đặc trưng (thuộc tính) áp dụng vào thuật tốn học máy để phát văn có chưa tin mật 5.6 Câu hỏi ôn tập Câu Hãy trình bày khái niệm giấu tin văn bản? Hãy nêu yêu cầu kỹ thuật giấu tin văn bản? Câu Hãy trình bày phương pháp phân loại giấu tin văn bản? 132 Câu Hãy trình bày quy trình giấu tin văn sử dụng phương pháp khoảng trắng từ Câu Hãy trình bày quy trình giấu tin văn sử dụng phương pháp dịch chuyển dòng? Câu Hãy trình bày quy trình giấu tin văn sử dụng phương pháp dịch chuyển vị trí từ? Câu Hãy trình bày quy trình giấu tin tính phản xạ đối xứng bảng chữ tiếng Anh? Câu Hãy trình bày quy trình giấu tin văn sử dụng phương pháp cú pháp? Câu Hãy trình bày quy trình giấu tin văn sử dụng phương pháp từ đồng nghĩa? Câu Hãy trình bày quy trình giấu tin văn sử dụng phương pháp trích rút câu? Câu 10 Hãy trình bày phương pháp phát giấu tin văn sử dụng kỹ thuật học máy? Câu 11 Hãy trình bày quy trình giấu tin văn sử dụng tính phản xạ đối xứng bảng chữ tiếng Việt? Câu 12 Hãy trình bày quy trình giấu tin văn sử dụng văn phạm phi ngữ cảnh? 133 TÀI LIỆU THAM KHẢO [1] Konakhovich Georgiy Filimonovich; Puzyrenko Alexander Yurievich Computer Steganography Theory and practice "MK-Press", 2006; 288p [2] Fabien A Petitcolas, Stefan Katzenbeisser Information Hiding Techniques for Steganography and Digital Watermarking Boston, London: Artech House, 1999 [3] Nguyễn Xuân Huy, Trần Quốc Dũng, Giáo trình giấu tin thủy vân ảnh, Trung tâm thông tin tư liệu, TTKHTN – CN 2003 [4] Birgit Pfitzmann, Matthias Schunter, “Asymmetric Fingerprinting” International Conference on the Theory and Applications of Cryptographic Techniques EUROCRYPT 1996 Advances in Cryptology — EUROCRYPT ’96 pp 84-95 [5] Ingemar J Cox, Matthew L Miller, Jeffrey A Bloom, Jessica Fridrich, Ton Kalker, Digital Watermarking and Steganography Series Editor Morgan Kaufmann Publishers is an imprint of Elsevier 30 Corporate Drive, Suite 400, Burlington, MA 01803, USA [6] Microsoft Windows Bitmap File Format Summary https://www.prepressure.com/library/file-formats/bmp [Ngày truy cập 22/5/2018] [7] PNG (Portable Network Graphics) Specification, Version 1.2 http://www.libpng.org/pub/png/spec/1.2/PNG-Structure.html [Ngày truy cập 22/5/2018] [8] JPEG File Interchange Format File Format Summary https://www.fileformat.info/format/jpeg/egff.htm [Ngày truy cập 22/5/2018] [9] ITU (1993), Information technology – digital compression and coding ofcontinuoustone still images – requirements and guidelines (ISO/IEC 10918-1: 1993(E)) [10] Shih, Frank Y Digital Watermarking and Steganography: Fundamentals and Techniques (Second Edition) Taylor & Francis, CRC Press, 2017 [11] Unik Lokhande A K Gulve Steganography using Cryptography and Pseudo Random Numbers International Journal of Computer Applications (0975 – 8887) Volume 96– No.19, June 2014 [12] Andrey Sidorenko and Berry Schoenmakers Concrete Security of the Blum-BlumShub Pseudorandom Generator Cryptography and Coding: 10th IMA International Conference, Lecture Notes in Computer Science 3796 (2005) 355{375 SpringerVerlag 134 [13] Po-Yueh Chen and Hung-Ju Lin, “A DWT Based Approach for Image Steganography”, International Journal of Applied Science and Engineering 4, 3: 275290, 2006 [14] Chun-Shien Lu, Multimedia Security: Steganography and Digital Watermarking Techniques for Protection of Intellectual Property, IDEA Group Publishing, 2005 [15] Vijay Kumar, Dinesh Kumar A modified DWT-based image steganography technique Multimedia Tools and Applications An International Journal Springer Science+Business Media, LLC 2017 [16] Sheelu (M Tech (CSE) - Manav Rachna College Of Engineering, Faridabad, India) “Enhancement of Data Hiding Capacity in Audio Steganography”, IOSR Journal of Computer Engineering (IOSR-JCE) e-ISSN: 2278-0661, p- ISSN: 2278-8727Volume 13, Issue Jul - Aug 2013 [17] Pradeep Kumar Singh, R.K.Aggrawal: Enhancement of LSB based Steganography for Hiding Image in Audio, (IJCSE) International Journal on Computer Science and Engineering Vol 02, No 05, 2010, 1652-1658 [18] B.C J Moore: An introduction to the Psychology of Hearing, Academic Press 2001 [19] Đỗ Quốc Trinh, Vũ Thanh Hải: Kĩ thuật trải phổ ứng dụng Học viện kĩ thuật quân 2006 [20] L Boney, A H Tewfik and K N Hamdy, “ Digital Watermarks for Audio signals” IEEE int contf On multimedia Computing and System, Horoshima, Japan, June 1996 [21] I.J.COX, “ Spread Spectrue Watermark for Embedled Signaling” United states Patent 5,848,155, December 1988 Dec [22] Cox I, Miller M & McKellips A (1999) Watermarking as communications with side information Proceedings of he IEEE 87 [23] Malvar H & Florencio D (2003) Improved spread spectrum: Anew modulation technique for robust watermarking [24] Gerrit Cornelis LANGELAAR (2000) Real-time Watermarking Techniques for Compressed Video Data Veenendaal ISBN 90-9013190-6 [25] Tìm hiểu định dạng file video phổ biến https://quantrimang.com/tim-hieu-vecac-dinh-dang-file-video-42612 [Ngày truy cập 30/8/2018] [26] Video Steganography based on Scene Change Detection – J.Mary Jenifer, Dr.S.Raja Ratna PG Scholar, Associate Professor Computer Science and Engineering VV College of Engineering, Tuticorin, India [27] Shuliang Sun A New Information Hiding Method Based on Improved BPCS Steganography Advances in Multimedia Volume 2015, Article ID 698492, p 135 [28] David Salomon Data Privacy and Security Springer, Verlag, 2003 [29] Anandaprova Majumder, Suvamoy Changder A Novel Approach for Text Steganography: Generating Text Summary using Reflection Symmetry International Conference on Computational Intelligence: Modeling Techniques and Applications (CIMTA) 2013 [30] W Bender, D Gruhl, N Morimoto, A Lu Techniques for data hiding IBM Systems Journal, Volume: 35 Issue: 3&4 [31] Chen Zhi-li, Huang Liu-sheng, Yu Zhen-shan, Zhao Xin-xin, Zheng Xue-ling, Effective Linguistic Steganography Detection, Department of Computer Science and Technology, University of Science and Technology of China, National High Performance Computing Center(Hefei), Hefei, Anhui 230027, China [32] Natarajan Meghanathan, Lopamudra Nayak A Review of the Audio and Video Steganalysis Algorithms Proceedings of the 48th Annual Southeast Regional Conference, 2010, Oxford, MS, USA, April 15-17, 2010 136 ... vực giấu tin bao gồm: tổng quan kỹ thuật giấu tin; số phương pháp giấu tin phát giấu tin môi trường đa phương tiện, văn bản; số ứng dụng kỹ thuật giấu tin triển khai thực tế Bài giảng ? ?Các kỹ thuật. .. kỹ thuật giấu tin tương đối phổ biến Với kỹ thuật thông tin giấu vào điểm ảnh Đặc điểm kỹ thuật giấu tin miền không gian ảnh chứa tin khơng bị xử lý trước thực giấu tin Một số thuật toán kỹ thuật. .. chọn giấu tin vào vật chứa lựa chọn ngẫu nhiên 1.2.2 Phân loại theo môi trường giấu tin Theo môi trường đa phương tiện, giấu tin chia thành: - Giấu tin ảnh: Giấu tin ảnh kỹ thuật giấu thơng tin

Ngày đăng: 19/03/2021, 16:44

Xem thêm:

TỪ KHÓA LIÊN QUAN

Mục lục

    DANH MỤC CÁC TỪ VIẾT TẮT

    CHƯƠNG 1: TỔNG QUAN VỀ GIẤU TIN

    1.1. Tổng quan về kỹ thuật giấu tin

    1.1.1. Một số thuật ngữ và khái niệm cơ bản

    1.1.2. Một số yêu cầu đối với kỹ thuật giấu tin

    1.1.3. Lịch sử phát triển

    1.1.4. Vai trò và tầm quan trọng

    1.2. Phân loại các kỹ thuật giấu tin

    1.2.1. Phân loại theo vật chứa

    1.2.2. Phân loại theo môi trường giấu tin

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w