Nối tiếp phần 1, phần 2 của bài giảng tiếp tục trình bày các nội dung về một số kiến thức liên quan đến kỹ thuật giấu tin và tách tin trong âm thanh; Kiến thức liên quan đến kỹ thuật giấu tin và tách tin trong video; Một số kiến thức liên quan đến kỹ thuật giấu tin trong văn bản. Mời các bạn cùng tham khảo để nắm nội dung chi tiết.
HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - ĐỖ XUÂN CHỢ BÀI GIẢNG CÁC KỸ THUẬT GIẤU TIN Hà Nội, tháng 12 năm 2018 CHƯƠNG 3: GIẤU TIN TRONG ÂM THANH Chương trình bày số kiến thức liên quan đến kỹ thuật giấu tin tách tin âm bao gồm: khái niệm, đặc điểm, nguyên tắc giấu tin tách tin, đánh giá ưu điểm nhược điểm kỹ thuật giấu tin Ngoài ra, chương đề cập đến số phương pháp, kỹ thuật phát giấu tin âm 3.1 Giới thiệu giấu tin âm Do môi trường âm có nhiều điểm khác biệt so với môi trường đa phương tiện khác nên kỹ thuật giấu tin âm đòi hỏi yêu cầu phép xử lý khác Chính vậy, phần giới thiệu giấu tin âm thanh, giảng vào làm rõ số vấn đề cần lưu ý trình xử lý giấu tin âm thành 3.1.1 Đặc điểm kỹ thuật giấu tin âm Trong phần 1.2 giảng trình bày khái niệm giấu tin âm Các vật chứa kỹ thuật giấu tin âm file âm đặc trưng tần số, bước sóng, chu kỳ biên độ, vận tốc lan truyền (tốc độ âm thanh) Đặc điểm kỹ thuật giấu tin âm giấu thông tin vào khe hở âm Các khe hở thành phần như: tần số, biên độ, chu kỳ,… âm Các kỹ thuật giấu tin âm lợi dụng vào điểm yếu hệ thống thính giác người (Human Auditory System – HAS) Giấu tin âm kỹ thuật giấu tin đòi hỏi nhiều yêu cầu lượng tin giấu chất lượng giấu hệ thống thính giác người nhạy cảm Chính vậy, với thay đổi mà làm ảnh hưởng đến chất lượng âm bị phát tìm nhanh chóng Tùy theo ứng dụng giấu tin âm mà có yêu cầu kỹ thuật, thuật toán phương pháp giấu tin khác Tuy nhiên, trường hợp tổng quát kỹ thuật giấu tin âm việc phải đảm bảo tính chất kỹ thuật giấu tin cần phải đảm bảo số yêu cầu môi trường âm như: Thông tin giấu phải tồn trải qua phép biến đổi hay hình thức cơng cố ý hay vơ tình Thơng tin giấu cần tồn vẹn hình thức tác động lên vật chứa (đối với kỹ thuật nhúng thủy vân số âm thanh) Một số vấn đề cần lưu ý kỹ thuật giấu tin âm thanh: -Tần số mẫu: Để đưa âm vào ứng dụng giấu tin, cần xác định biên độ dao động sóng âm vào thời điểm khác Cơng việc gọi trích/lấy mẫu Với giây phát âm thanh, trích lấy số mẫu biên độ đưa vào liệu, số gọi 58 tần số trích mẫu (sample rate) Tần số cho biết biên độ rung giây sóng âm Thí dụ, tần số mẫu 44,1 kHz giây tín hiệu nhận bị cắt thành 44100 lát -Độ dày bit: Để lưu lại dạng số, mẫu biểu diễn lượng bit liệu định đó, gọi BitDepth Với tập tin WAV thường 16 bits BitDepth lớn âm lấy mẫu xác người nghe thấy sắc nét, trung thực Giả sử, lấy mẫu với tần số 44,1kHz (44100 lần/giây), 16 bit (tương đương với chất lượng CD) phút âm tiêu tốn tới 10MB ổ cứng - Kích thước mẫu trích: Cơng thức kích thước mẫu trích (được tính byte) sau: LengthOfSample = Channels * AudioSampleSize / - Âm số: mẫu lấy theo phương pháp lượng tử hóa, chuyển đổi giá trị mẫu (liên tục thành giá trị rời rạc) Hình 3.1 Ví dụ tín hiệu âm mẫu 3.1.2 Một số định dạng file âm Có thể phân loại định dạng file âm thành số định dạng sau [15]: - WAV (.wav): kiểu định dạng đại diện cho âm kỹ thuật số Windows PCs - AIFF (aif) AU (.au): AIFF kiểu định dạng âm đại diện cho Macintosh, AU kiểu định dạng đại diện cho hệ thống Sun - RealAudio (.ra): hệ thống sử dụng đại diện cho luồng âm hình ảnh Internet - MIDI (.mid): ghi tắt Music Instrument Digital Interface, chuẩn đại diện cho thông tin âm nhạc chuyển giao phương tiện điện tử máy tính 59 - QuickTime (.qt): sử dụng để định dạng đa phương tiện từ máy tính Apple, hỗ trợ luồng âm luồng hình ảnh Một số sản phẩm phát triển ứng dụng cho lĩnh vực giấu tin âm sau (xem bảng 3.1): Bảng 3.1 Một số phần mềm hỗ trợ giấu tin âm Tên phần mềm giấu Định dạng file âm Mã nguồn phần mềm Info Stego mp3 Trong hệ điều hành ScramDisk wav Trong hệ điều hành MP3Stego mp3 Mã nguồn mở StegoWav wav Mã nguồn mở Hide4PGP mp3, voc Mã nguồn mở Invisible Secrets wav Thương mại Steganos wav, voc Thương mại 3.1.3 Phân loại số phương pháp giấu tin âm Kỹ thuật giấu tin âm ứng dụng nhiều thực tế Có nhiều phương pháp kỹ thuật khác sử dụng để giấu thông tin vào âm Tiếp theo, giảng trình bày số hướng để phân loại kỹ thuật giấu tin âm [1, 2] a) Phân loại theo kỹ thuật giấu tin Phương pháp phân loại theo kỹ thuật giấu tin dựa vào đặc tính tính chất kỹ thuật sử dụng để giấu tin âm Theo tiêu trí này, kỹ thuật giấu tin âm chia làm số kỹ thuật sau: - Kỹ thuật LSB; - Kỹ thuật trải phổ; - Kỹ thuật mã hóa pha; - Kỹ thuật tiếng vang; - Kỹ thuật tự đánh dấu b) Phân loại theo đặc điểm tín hiệu gốc Đối với cách phân loại này, chuyên gia phân thành loại chính: 60 - Giao thoa tín hiệu gốc: Các phương pháp thuộc nhóm cần đến tín hiệu gốc muốn rút trích thơng tin Tuy nhiên, ứng dụng thực tế nhóm phương pháp lại tỏ khơng hiệu phải cần gấp đôi nhớ để lưu trữ thông tin, cần đến gấp đơi lượng băng thơng cho q trình rút trích thơng tin Vì vậy, nhóm phương pháp nghiên cứu phát triển Trong số trường hợp đặc biệt nhóm phương pháp lại tỏ hiệu việc chứng thực quyền Một số thuật tốn nhóm như: Mã hóa pha; Điều chế pha - Khơng giao thoa tín hiệu gốc: Các phương pháp thuộc nhóm muốn trích xuất thơng tin giấu âm khơng cần đến tín hiệu gốc hay thơng tin khác (trừ khóa mật có) Nhóm phương pháp cần đến nửa nhớ lưu trữ nửa băng thơng để rút trích so với nhóm phương pháp cần tín hiệu gốc Một số thuật tốn nhóm như: • Các phương pháp trải phổ • Các phương pháp tập đơi • Các phương pháp sử dụng • Các phương pháp tự đánh dấu Trên giảng liệt kê số thuật toán phương pháp, kỹ thuật giấu tin âm khác Tiếp theo, để giúp người đọc hiểu thuật toán kỹ thuật giấu tin âm thanh, giảng vào mô tả chi tiết cách thức tiến hành giấu tin tách tin số kỹ thuật giấu tin âm phổ biến Một số thuật tốn khác khơng mơ tả giảng tham khảo số tài liệu [1, 2] 3.2 Phương pháp LSB Cách thay LSB cách đơn giản để nhúng thông tin vào tệp âm kỹ thuật số Phương pháp LSB cho phép lượng lớn liệu nhúng, tốc độ truyền liệu nhanh Chi tiết phương pháp thay LSB trình bày chương (kỹ thuật giấu tin ảnh) Điểm cần lưu ý phương pháp LSB âm thông tin giấu vào file âm Để thực điều người giấu tin cần thực thao tác sau: Bước 1: Đọc file âm gốc Chia âm gốc thành segmen Thông thường, người giấu tin chia file âm segmen dựa độ dài bit thông tin cần giấu Sau segmen vector giá trị tín hiệu, lưu vào mảng chiều để thực giấu tin Bước 2: Chuyển đổi thơng tin cần giấu sang dạng nhị phân, tính độ dài bit thông tin lưu vào L 61 Bước 3: Chọn k số bit LSB tín hiệu âm giấu cho phù hợp Bước 4: Chia chuỗi bit thông điệp thành chuỗi có độ dài k bit Trong đó, chuỗi thay vào k bit LSB L k tín hiệu âm để giấu đủ L bit thông điệp Bước 5: Thực giấu L bit tính vào segmen Để tăng độ an tồn cho kỹ thuật này, sử dụng sinh số ngẫu nhiên để sinh vị trí mẫu chọn giấu khơng phải mẫu liên tục Bộ sinh số sử dụng khóa bí mật phần tử khởi tạo sinh số Khóa sử dụng trình giấu tin giải tin Bước 6: Lưu lại tệp âm kết F’ thông tin giấu âm gốc thông tin cần giấu âm chứa thơng tin Hình 3.2 Mơ tả phương pháp thay bit thuật tốn LSB Hình 3.2 thể pháp thay LSB với trường hợp thay bit LSB Trong thực tế có số hướng tiếp cận khác nhằm nâng cao chất lượng giấu tin kỹ thuật LSB Ví dụ phương pháp sử dụng bit LSB thay bit LSB đơn lẻ phương pháp kết hợp bít quan trọng (MSB -Most Significant Bit) LSB Chi tiết phương pháp trình bày số báo [16, 17] Hình 3.3 3.4 mơ tả quy trình giấu tin sử dụng bit LSB bit MSB 62 File âm với tin giấu “HEY” LSB Bit nhị phân tin giấu “HEY” Hình 3.3 Giấu tin sử dụng bit LSB Tín hiệu âm gốc Thơng tin mật cần giấu Tín hiệu âm chứa thơng tin Hình 3.4 Kỹ thuật giấu tin âm dựa vào bit MSB bit LSB 3.3 Phương pháp mã hóa pha 3.3.1 Khái niệm phương pháp mã hóa pha Mã hóa pha âm hoạt động cách thay pha đoạn âm ban đầu với pha mã hóa liệu Phương pháp mã hóa pha dựa vào tính chất thành phần pha không gây ảnh hưởng đến hệ thống thính giác người nhiễu Như giới thiệu HAS trên, HAS nhạy cảm miền thời gian nên dễ phát thay đổi nhỏ Nhưng Moore chứng minh HAS lại nhạy cảm với thay đổi pha đặc tính khai thác hệ thống nén âm số [14, 18] Ý tưởng phương pháp 63 chia chuỗi âm gốc thành khối nhúng toàn liệu vào phổ pha khối (xem hình 3.5) Việc giấu tin thực cách điều chỉnh pha phổ pha liệu [14] 3.3.2 Quy trình giấu tin phương pháp mã hóa pha Trong mã hóa pha, liệu coi dịch pha (phase shift) phổ pha tín hiệu sóng mang Xét tín hiệu sóng mang c, c chia thành N phần nhỏ phần tử ci(n) có chiều dài l(m) Lúc áp dụng biến đổi Fourier có: - Độ lớn tín hiệu tính cơng thức: Ai k ReF ci k ImF ci k - Ma trận độ lớn pha có phần tử tính theo cơng thức: i k arctan ImF ci k ReF ci k Trong đó: 𝑅𝑒 Là phần thực 𝐼𝑚 Là phần ảo t: thời gian Hình 3.5 Phân tích thành phần liệu âm 64 Bước 1: Dữ liệu âm gốc có chiều dài N chia thành segment có chiều dài chiều dài với thông tin cần giấu I I t t Hình 3.5 Mơ tả chia âm gốc thành segment Bước 2: Mỗi đoạn segment biến đổi Fourier DFT với ma trận độ lớn phase j k ma trận độ lớn tín hiệu với j k 0k N An 1, j N 1 𝜑n 𝜔 𝜔 Hình 3.6 Minh họa đoạn biến đổi DFT Bước 3: Tính độ lệch pha đoạn kề công thức sau: j k j 1 k j k j , k Đây trình tính khác biệt ma trận pha với ma trận xung quanh để tính mức độ chênh lệch Việc tính tốn đảm bảo khác biệt pha không lớn sau tiến hành biến đổi Bước 4: Điều chỉnh pha Giá trị xác pha đoạn thay đổi mối liên hệ khác segment liên tiếp phải đảm bảo Việc điều chỉnh pha đoạn đầu áp dụng dựa công thức: message bit = Phase_new = message bit = Khi thơng tin giấu phép giấu vector pha đoạn 65 𝜑0′ 𝜔 Hình 3.7 Tín hiệu giấu pha đoạn Bước 5: Tiến hành tạo ma trận pha thỏa mãn để chỉnh lại độ chênh lệch tính bước Tạo ma trận pha thỏa mãn điều kiện: ' ' j, k j 1 k j k j 1 k 𝜑1′ 𝜔 Hình 3.8 Ma trận pha tạo Trong thực tế ln tìm cặp 𝜑′ 𝑗+1 [𝜔𝑘 ] 𝜑′ 𝑗 [𝜔𝑘 ] thỏa mãn công thức Fourier rời rạc có tính đầy đủ (với N >0 , vectơ phức N chiều có DFT IDFT đồng thời DFT IDFT vectơ phức nhiều chiều) So sánh hình 3.7 hình 3.8 thấy ma trận pha tạo có thay đổi so với ma trận pha ban đầu Bước 6: Kết hợp với cường độ pha tín hiệu cũ sau giấu thơng tin Mục đích bước tái tạo lại ma trận pha đoạn kề Pha pha kề trước cộng với độ lệch pha tính I t Hình 3.9 Pha tạo sau kết hợp cường độ pha cũ Bước 7: Thực ghép segment lại DFT ngược để tạo lại liệu âm Để nhận tin giấu kỹ thuật này, người nhận phải biết độ dài segment, sau thực DFT để nhận tin 66 kí hiệu khởi đầu Kí hiệu sử dụng thành tố văn tạo sau - Chọn kí hiệu chưa kết thúc văn bản, tìm luật có kí hiệu chưa kết thúc bên trái thay kí hiệu kí hiệu phần bên phải luật - Lặp lại bước văn cịn tồn kí hiệu kết thúc Sau ví dụ CFG dùng để giấu chuỗi 0100110 kí hiệu chưa kết thúc kí hiệu in đậm, kí hiệu kết thúc kí hiệu viết thường Start → adjective noun tense verb adjective → the size | a size size → tiny | small | large | big noun → saw | ladder | truth | boy tense → is | was verb → waiting | standing Kí hiệu chưa kết thúc adjective Luật cho kí hiệu chưa kết thúc có hai lựa chọn tương đương (21) bit ẩn giấu cách chọn lựa chọn bên phải Bit giấu 0, lựa chọn (the size) Kí hiệu kết thúc “the” nối vào văn cịn kí hiệu chưa kết thúc size thay tiếp Từ size có bốn lựa chọn tương đương (22) nên giấu hai bit Hai bit chuỗi cần giấu bit bit 0, nên lựa chọn thứ ba, “large” chọn Kí hiệu chưa kết thúc noun Theo luật, có bốn lựa chọn nên dùng hai bit chuỗi ẩn giấu Ở đây, hai bit bit bit nên “ladder” chọn Sự lựa chọn cho tense “was” (được bit tiếp theo), lựa chọn cho verb “waiting”, bit cuối Sau giấu tin thu câu “the large ladder was waiting” Câu gây nghi ngờ đọc người bình thường lại dễ dàng vượt qua kiểm tra máy tính Bộ mã hóa dễ dàng kết thúc câu (tức sau lựa chọn verb) với dấu chấm câu bắt đầu câu với chữ viết hoa, để tăng tính thực tế cho văn nhân tạo sinh Thuật toán giấu tin: Đầu vào: - Thơng điệp bí mật 122 - Bộ từ điển luật sinh Các bước thực hiện: - Bước 1: Chuyển đổi thơng điệp bí mật sang dạng nhị phân - Bước 2: Sinh chuỗi văn (G): Nếu G rỗng: xuất “” Nếu G ký tự kết thúc A: xuất “A” Nếu G ký tự không kết thúc: với c luật sinh G: bắt đầu sinh chuỗi (c) tất luật sinh duyệt Đầu ra: - Văn nhân tạo chứa thơng điệp bí mật Một CFG lớn với nhiều lựa chọn ẩn nhiều bit tạo câu có ý nghĩa tự nhiên Một CFG không rõ ràng câu tạo cách chọn luật theo thứ tự khác Điều thể qua ví dụ sau Start → name action | who does name → Alice | Bob action → is here | was there who → Alice is | Bob was does → here | there Câu “Alice is here” sinh cách thay kí hiệu không kết thúc name action “Alice” “is here”, đồng thời sinh cách thay who does “Alice is” “here” Hiển nhiên, CFG tạo văn giải mã theo cách khác CFG không phù hợp để ẩn giấu thông tin Một CFG dạng Greibach normal form (GNF) kí hiệu chưa kết thúc lựa chọn cuối lựa chọn luật sinh Ví dụ, luật sinh có dạng something → A B | C D thuộc dạng GNF luật sinh dạng “blah → the size sum | a size bell” khơng thuộc dạng GNF Tuy nhiên sửa luật khơng thuộc dạng GNF thành GNF cách thêm luật sau: adjective → the sizesum | a sizebell sizesum → tiny sum | small sum | large sum | big sum sizebell → tiny bell | small bell | large bell | big bell 123 Bộ giải mã sử dụng CFG GNF để phân tích cú pháp, ví dụ sau đây: Start → noun verb noun → Alice | Bob verb → sent mail to | sent email to to → to rel recipient rel → all | some recipient → friends | relatives Để ẩn giấu chuỗi nhị phân 01010, mã hóa chọn “Alice” cho bit (0) “sent email to” cho bit thứ hai (1) Khơng từ giấu thông tin luật thứ tư áp dụng (bởi khơng có lựa chọn nào) mã hóa sinh kí hiệu kết thúc “to”, sau sử dụng luật sinh cho rel để chọn “all” cho bit thứ ba (0), luật sinh cho recipient để chọn “relatives” cho bit thứ tư (1) Để ẩn bit thứ năm, giải mã bắt đầu câu Câu “Alice sent email to all relatives” dễ dàng giải mã theo thành phần cú pháp câu xác định bit ẩn Nhận xét: Ở ví dụ trên, ẩn giấu bit câu “Alice sent email to all relatives” có độ dài 33 kí tự (bao gồm khoảng trắng) Khả giấu tin ví dụ / (33 * 8) ≈ 0.015 bit ẩn giấu bit văn tạo để giấu tin Phương pháp tăng tính hiệu luật sinh có nhiều lựa chọn phần bên phải Một luật sinh với 2n lựa chọn giấu n bit Nếu lựa chọn từ có chữ (tức 32 bit) có 1024 = 210 lựa chọn luật sinh, 10 bit ẩn giấu 32 bit văn sinh ra, dẫn đến khả giấu tin 10 / 32 = 0.3125 bits/bit (bpb) Phương pháp cài đặt kiểm thử rộng rãi tác giả Peter Wayner So sánh với thuật toán giấu tin khác, phương pháp đánh giá đơn giản có hiệu tốt 5.3.2 Phương pháp dựa tính phản xạ đối xứng ký tự Trong hầu hết thuật tốn giấu tin, thơng điệp bí mật ẩn giấu cách thay đổi cấu trúc văn chứa khả bị nghi ngờ hay mát liệu gõ lại văn theo cấu trúc xác xảy Để tránh xảy khả tăng cường tính bảo mật, thay giấu bit bí mật cách thay đổi cấu trúc văn chứa, phương pháp giấu thông điệp bí mật cách tạo văn tóm tắt thu thập từ báo hay phương tiện văn thông tin đại chúng Quá trình tạo văn 124 tóm tắt phụ thuộc vào tính phản xạ đối xứng bảng chữ tiếng Anh Dựa vào tính chất này, bảng chữ chia thành khác nhau, đại diện cho cặp bit Để thực điều cần phân tích tính phản xạ đối xứng bảng chữ tiếng Anh phân loại chúng để thể bit Các thuộc tính bit thể tương ứng trình bày sau Error! Reference source not found.: a) Phân loại bảng chữ tiếng Anh theo tính chất phản xạ đối xứng Để phân loại bảng chữ tiếng Anh theo tính phản xạ đối xứng, chọn chiều ngang trục đối xứng phân chia chữ tiếng Anh thành hai nhóm Các chữ sau chia theo chiều ngang, thu hai phần giống hệt nhau, ví dụ chữ ‘B’, ‘H’,… xếp vào nhóm, ngược lại, chữ sau chia theo chiều ngang, thu hai phần khơng giống nhau, ví dụ chữ ‘A’, ‘F’,… xếp vào nhóm cịn lại Tồn phân loại dựa logic trình bày bảng 5.1: Bảng 5.1.Phân nhóm dựa tính phản xạ đối xứng theo trục ngang ID nhóm Chữ nhóm A, F, G, J, L, M, Tính phản xạ đối xứng N, P, Q, R, S, T, không tuân thủ U, V, W, Y, Z Tính phản xạ đối xứng B, C, D, E, H, I, K, tuân thủ O, X Tên nhóm Bit giấu Áp dụng tương tự với trục dọc, thu hai nhóm bảng 5.2: Bảng 5.2 Phân nhóm dựa tính phản xạ đối xứng theo trục dọc ID nhóm Chữ nhóm B, C, D, E, F, G, J, Tính phản xạ đối xứng K, L, N, không tuân thủ P, Q, R, S, Z A, H, I, M, O, T, Tính phản xạ đối xứng U, V, W, tuân thủ X, Y Tên nhóm Bit giấu Kết hợp hai khái niệm mô tả bảng 5.1 bảng 5.2 phân loại bảng chữ tiếng Anh thành bốn nhóm dựa hai chiều ngang chiều dọc chữ Các chữ khơng đối xứng hai trục, ví dụ chữ ‘F’, chữ ‘G’,… chia vào nhóm Các chữ đối xứng theo trục ngang, ví dụ chữ ‘B’, chữ ‘D’,… chia vào nhóm Các chữ đối xứng theo trục dọc, ví dụ chữ ‘A’, chữ ‘M’ chia vào nhóm Các chữ 125 đối xứng theo hai trục, ví dụ chữ ‘H’, chữ ‘I’ chia vào nhóm Cụ thể, thu bảng 5.3: Bảng 5.3 Phân nhóm dựa tính phản xạ đối xứng theo trục ngang trục dọc Tên nhóm ID nhóm Chữ nhóm Tính phản xạ đối xứng F, G, J, L, N, P, Q, không tuân thủ R, S, Z hai trục Tính phản xạ đối xứng B, C, D, E, K tuân thủ trục ngang Tính phản xạ đối xứng A, M, T, U, V, W, tuân thủ trục dọc Y Tính phản xạ đối xứng H, I, O, X tuân thủ hai trục Bit giấu 00 01 10 11 b) Giấu tin văn sử dụng tính phản xạ đối xứng bảng chữ tiếng Anh Theo phân loại bảng chữ tiếng Anh mô tả bảng 5.3 dựa vào thông điệp bí mật văn phủ lựa chọn để sinh văn tóm tắt có chứa thơng điệp bí mật Văn tóm tắt gồm câu trích từ văn lựa chọn Các câu sử dụng chữ từ làm đại diện cho cặp bit thơng điệp cần ẩn giấu Thuật tốn giấu tin Đầu vào: - Thơng điệp bí mật - Bất kỳ văn ngôn ngữ tiếng Anh Các bước thực hiện: - Bước 1: Biến đổi thơng điệp bí mật thành chuỗi bit nhị phân - Bước 2: Kiểm tra xem tổng độ dài chuối bit chẵn hay lẻ Nếu lẻ, phải thêm bit ‘0’ vào cuối chuỗi bit nhị phân Bây chia chuỗi bit tổng thành cặp bit liên tiếp - Bước 3: Chuyển đổi toàn ký tự văn đầu vào thành chữ viết hoa - Bước 4: Với cặp bit, xem xét chữ từ câu: Nếu chữ nằm nhóm đại diện cho cặp bit xem xét, chọn câu đưa vào văn chứa Nếu chữ khơng nằm nhóm đại điện cho cặp bit xem xét, bỏ qua câu chọn câu 126 - Bước 5: Quá trình tiếp diễn tồn chuỗi bit thơng điệp bí mật thực thi hết - Bước 6: Văn mã hóa thu tóm tắt văn đầu vào gửi đến người nhận Đầu ra: - Văn chứa thơng điệp bí mật, văn tóm lược văn đầu vào Thuật tốn tách tin: Đầu vào: - Văn chứa thơng điệp bí mật (đầu thuật tốn giấu tin) Các bước thực hiện: - Bước 1: Lấy chữ từ câu - Bước 2: Dựa vào bảng 5.3 để lấy cặp bit từ chữ thu đưa file - Bước 3: Chuyển đổi chuổi bit nhị phân thành dạng chữ tương ứng - Bước 4: Tồn thơng điệp dạng chữ thu thơng điệp ẩn giấu Đầu ra: - Thơng điệp bí mật Ví dụ làm rõ quy trình giấu tin sử dụng tính phản xạ đối xứng bảng chữ tiếng Anh: Thông điệp cần giấu chuỗi bit “1100” Văn vật chứa: “Ostrich is a bird Ostrich can fly So many types of birds are there Peacock is our national bird.” Quá trình giấu: Để giấu hai bit đầu 11, xem xét câu “Ostrich is a bird.” Câu bắt đầu chữ ‘O’, thuộc nhóm 4, đại diện cho cặp bit 11 nên câu chọn Tiếp theo, phải giấu cặp bit 00 Câu “Ostrich can fly” bắt đầu chữ ‘O’, thuộc nhóm 4, đại diện cho cặp bit 11, nên bị bỏ qua Tương tự, câu “So many types of birds are there.” bắt đầu chữ ‘S’, thuộc nhóm 2, đại diện cho cặp bit 10, bị bỏ 127 qua Đến câu “Peacock is our national bird.” bắt đầu chữ ‘P’, thuộc nhóm 1, đại diện cho cặp bit 00, lựa chọn Văn chứa tin giấu là: “Ostrich is a bird Peacock is our national bird.” Nhận xét: Đây coi phương pháp giấu tin an tồn, khơng có thay đổi mặt cấu trúc nội dung văn kẻ công phải thực đọc chi tiết câu văn nhận biết văn có bất thường hay khơng c) Giấu tin văn sử dụng tính phản xạ đối xứng bảng chữ tiếng Việt Phương pháp giấu tin dựa tính phản xạ đối xứng ký tự áp dụng cho việc giấu tin văn tiếng Việt Về chất, bảng chữ tiếng Việt hệ Latin với bảng chữ tiến Anh, cải tiến phương pháp để giấu tin cho văn tiếng Việt sau: - Không cần phải kiểm tra mạo từ “A”, “The” phương pháp giấu thông tin Tiếng Anh - Với thông điệp ẩn giấu, phải sử dụng bảng mã Unicode thay cho bảng mã ASCII Tuy nhiên, để tối ưu hóa thơng điệp ẩn giấu, sử dụng bảng mã ASCII để chuyển ký tự thông dụng chữ trùng với bảng chữ tiếng Anh, chữ số, dấu chấm câu,… Các ký tự chuyển sang dạng chuỗi bit có độ dài byte (8-bit) Đối với ký tự đặc biệt riêng bảng chữ tiếng Việt (bao gồm chữ hoa, chữ thường dấu tiếng Việt huyền, sắc, hỏi, ngã, nặng), ví dụ “Á”, “à”, “ê”, “đ”,… dùng phép mã hóa UTF-8 với tùy ký tự thu chuỗi bit có độ dài bytes (16-bit) bytes (24-bits) Do ký tự đặc biệt có độ dài lớn ký tự thuộc bảng mã ASCII nên văn dùng để chứa thông điệp ẩn giấu có kích thước lớn - Với hệ thống đồ để mã hóa cặp bit, phải thêm chữ tiếng Việt, ví dụ “Á”, “À”, “Ă”, “”, “Đ”, “Ê”, “Ô”, “Ư”,… phải bỏ chữ “F”, “J”, bảng chữ tiếng Anh Chi tiết đồ mã hóa ký tự thành cặp bit sau: Bảng 5.4 Mã hóa ký tự Tiếng Việt thành cặp bit 128 Tên nhóm Chữ nhóm Tính đối xứng không tuân thủ hai trục Á, À, Ã, Ả, Ắ, Ằ, Ẵ, Ẳ, Ấ, Ầ, Ẫ, Ẩ, É, È, Ẽ, Ẹ, Ẻ, Ê, Ế, Ề, Ễ, Ể, Í, Ì, Ĩ, Ỉ, G, L, N, Ĩ, Ò, Õ, Ỏ, Ố, Ồ, Ỗ, Ổ, Ơ, Ớ, Ờ, Ỡ, Ợ, Ở, P, Q, R, S, Ú, Ù, Ũ, Ủ, Ư, Ứ, Ừ, Ữ, Ự, Ử, Ý, Ỳ, Ỹ, Ỷ Tính đối xứng tuân thủ trục ngang B, C, D, Đ, E, K 01 Tính đối xứng tuân thủ theo trục dọc A, Ạ, Ă, Ặ, Â, Ậ, Ị, M, Ọ, Ô, T, U, Ụ, V, Y, Ỵ 10 Tính đối xứng tuân thủ hai trục H, I, O, X 11 ID nhóm 5.4 Bit giấu 00 Phương pháp sử dụng tính chất ngơn ngữ 5.4.1 Phương pháp sử dụng cú pháp Phương pháp giấu tin sử dụng cú pháp dựa hai ý tưởng: a) Sử dụng dấu chấm câu cách không rõ ràng Ý tưởng q trình sử dụng dấu chấm câu khơng rõ ràng đơn giản dễ bị phát việc sử dụng dấu chấm câu khơng quán gây ý Một ví dụ ý tưởng sử dụng dấu chấm câu nhập nhằng việc sử dụng cụm từ “Bánh mì, bơ, sữa” sử dụng cụm từ “Bánh mì, bơ sữa.” Cả hai cụm từ mặt cú pháp, thay đổi luân phiên hai hình thức ẩn giấu liệu nhị phân quy ước thành lần xuất cấu trúc (dấu “,” xuất trước chữ “và”) ẩn giấu bit “1”, xuất cấu trúc thứ hai (khơng có dấu “,” trước chữ “và”) ẩn dấu bit “0” Sử dụng phương pháp có ưu điểm khó bị phát nhược điểm hiệu suất giấu tin không cao áp dụng cho cú pháp định b) Sửa đổi văn cho ý nghĩa văn bảo toàn Ý tưởng việc sửa đổi an tồn, lại khó thực thi khả “hiểu” máy tính với ngơn ngữ người hạn chế Việc chỉnh sửa văn mà giữ ý nghĩa văn thủ thuật tinh vi để ẩn giấu thông tin Nghĩa hai cụm từ “Khi học xong, chơi” “con chơi học xong.” tương đương 129 thông tin ẩn giấu dựa vào cú pháp thay đổi Phương pháp giấu thơng tin có hiệu suất thấp phải có điều chỉnh thủ công Tuy nhiên phương pháp an tồn khó để máy tính phát thay đổi cú pháp hai cụm từ Kẻ công phải thực đọc tin nhắn cách thủ công xác định cụm từ có liên quan để trích xuất liệu 5.4.2 Phương pháp sử dụng ngữ nghĩa Phương pháp sử dụng ngữ nghĩa phương pháp mà liệu giấu văn cách sử dụng từ đồng nghĩa Ở phương pháp người gửi người nhận sử dụng từ điển trực tuyến định Đây coi tập liệu chứa từ quy ước giải mã đọc từ văn tìm kiếm từ tương ứng từ điển [29] a) Sử dụng từ đồng nghĩa Các giải mã đọc từ văn tìm kiếm từ đồng nghĩa từ điển, từ chẳng hạn “god child”, khơng có từ đồng nghĩa giải mã giả định khơng có liệu giấu Nếu từ “child” đầu vào, xuất từ điển từ đồng nghĩa danh sách (bud, chick, child, kid, minor), sau đó, danh sách xem để che giấu hai bit “child” (là từ thứ danh sách) hiểu ẩn giấu số bit (01 hệ nhị phân) Thuật tốn giấu tin: Đầu vào: - Thơng điệp bí mật - Văn phủ Các bước thực hiện: - Bước 1: Chuyển thông tin mật thành dạng nhị phân - Bước 2: Kiểm tra văn chọn từ xuất nhiều lần - Bước 3: Sử dụng từ điển đặc biệt chọn từ đồng nghĩa để thay cho từ chọn theo quy ước chuỗi nhị phân Đầu ra: - Văn phủ có chứa thơng điệp b) Trích rút câu 130 Một hướng tiếp cận khác phương pháp giấu tin ngữ nghĩa định nghĩa hàm rút câu thành bit liệu Cách làm kiểm tra tính chẵn lẻ mã ASCII tất ký tự câu Trong ứng dụng thực tế phương pháp này, xử lý văn chỉnh sửa sau: - Đầu tiên, xử lý văn nhận thông tin cần giấu chứa chúng chuỗi bit - Bộ xử lý văn nhận ký tự văn thường nhập vào theo chu kỳ, đưa vào hàm xử lý so sánh kết với bit thông tin ẩn giấu - Nếu tính chẵn lẻ tất mã ASCII câu có bit lệch với bit chuỗi bit cần giấu thông tin, xử lý văn từ chối không cho gõ thêm ký tự khác Lựa chọn người dùng phải viết lại câu 5.5 Phương pháp phát giấu tin văn Các phương pháp phát thông tin giấu văn dựa vào đặc điểm phương pháp giấu tin văn Do đặc điểm kỹ thuật giấu tin văn nên phương giấu tin có nhược điểm định Chính thực tế, để phát giấu tin văn người phân tích thường áp dụng số phương pháp sau [1, 2, 31]: - Phát giấu tin dựa vào khoảng trắng: Trong văn bản, thay đổi nhỏ từ khoảng cách dịng khó phát người quan sát bình thường Tuy nhiên, khoảng trống phụ ký tự "vô hình" dễ dàng tiết lộ cách mở tệp tin trình xử lý văn thơng dụng Văn trơng "bình thường" gõ hình, tệp mở trình xử lý văn bản, dấu cách, tab ký tự khác làm biến dạng trình bày văn - Phát giấu tin dựa vào cú pháp ngữ nghĩa: Với giấu tin ngữ nghĩa cần có hiểu biết câu từ đoạn văn, nghĩa loại văn đó, với loại giấu tin cần phát đoạn viết không mượt, đoạn vô nghĩa, từ đồng nghĩa, lỗi tả cố tình Về phần phát giấu tin dựa vào hồn tồn vào khả hiểu biết văn người kiểm tra - Phương pháp phát dựa phân tích tính thống kê sử dụng học máy: Phương pháp ban đầu nghiên cứu mơ hình thống kê văn tự nhiên, giấu thơng tin văn thay đổi tính văn cách 131 phân tích tính thống kê Văn tự nhiên văn có giấu tin có tính khác sau [31]: Chiều dài trung bình từ: Theo nguyên tắc Zipf Heaps, độ dài trung bình từ nằm phạm vi định Văn giấu tin thông tin mật giấu vào văn bản, lựa chọn từ ngẫu nhiên, có từ tần số cao văn thông thường chiều dài trung bình từ dài Để tăng che giấu văn giảm mức trung bình chiều dài từ cơng cụ giấu tin làm tăng số lượng từ ngắn tạo văn giấu tin Tỷ lệ khoảng trắng: Theo nguyên tắc Heap, tỷ lệ khoảng trắng văn xấp xỉ tỷ lệ nghịch với chiều dài từ dấu chấm câu khơng tính Nếu khoảng trắng xuất hai lần nhiều có sở để kết luận văn bất thường Rõ ràng, việc phát làm nâng cao hiệu việc xác định văn chứa thông tin mật sử dụng thuật toán ẩn thay giấu tin đổi số khoảng trắng văn N từ từ không hợp lệ: Theo lý thuyết TF-IDF, từ có tần số cao bao gồm từ tần số cao hiệu (AFW) từ tần số cao khơng hợp lệ (NFW) AFW từ khóa hợp lệ để thể chủ đề viết, NFW từ khơng có ý nghĩa, chẳng hạn "the", "of", v.v Phần trăm chữ cái: Trong báo tiếng Anh, số lượng văn nhỏ, việc phân phối chữ văn thay đổi nhiều Như số lượng văn tăng lên, tính ngẫu nhiên chữ tăng, phần trăm chữ gần không thay đổi Phần trăm chữ đầu: Việc phân phối chữ ban đầu văn tiếng Anh có liên quan đến việc phân phối chữ ban đầu từ điển Vì phân bố chữ ban đầu từ điển khác dẫn đến phân bố ban đầu văn khác Tính ngẫu nhiên văn chứa tin mật văn tự nhiên khác Dựa vào năm trích chọn đặc trưng (thuộc tính) áp dụng vào thuật tốn học máy để phát văn có chưa tin mật 5.6 Câu hỏi ôn tập Câu Hãy trình bày khái niệm giấu tin văn bản? Hãy nêu yêu cầu kỹ thuật giấu tin văn bản? Câu Hãy trình bày phương pháp phân loại giấu tin văn bản? 132 Câu Hãy trình bày quy trình giấu tin văn sử dụng phương pháp khoảng trắng từ Câu Hãy trình bày quy trình giấu tin văn sử dụng phương pháp dịch chuyển dịng? Câu Hãy trình bày quy trình giấu tin văn sử dụng phương pháp dịch chuyển vị trí từ? Câu Hãy trình bày quy trình giấu tin tính phản xạ đối xứng bảng chữ tiếng Anh? Câu Hãy trình bày quy trình giấu tin văn sử dụng phương pháp cú pháp? Câu Hãy trình bày quy trình giấu tin văn sử dụng phương pháp từ đồng nghĩa? Câu Hãy trình bày quy trình giấu tin văn sử dụng phương pháp trích rút câu? Câu 10 Hãy trình bày phương pháp phát giấu tin văn sử dụng kỹ thuật học máy? Câu 11 Hãy trình bày quy trình giấu tin văn sử dụng tính phản xạ đối xứng bảng chữ tiếng Việt? Câu 12 Hãy trình bày quy trình giấu tin văn sử dụng văn phạm phi ngữ cảnh? 133 TÀI LIỆU THAM KHẢO [1] Konakhovich Georgiy Filimonovich; Puzyrenko Alexander Yurievich Computer Steganography Theory and practice "MK-Press", 2006; 288p [2] Fabien A Petitcolas, Stefan Katzenbeisser Information Hiding Techniques for Steganography and Digital Watermarking Boston, London: Artech House, 1999 [3] Nguyễn Xuân Huy, Trần Quốc Dũng, Giáo trình giấu tin thủy vân ảnh, Trung tâm thông tin tư liệu, TTKHTN – CN 2003 [4] Birgit Pfitzmann, Matthias Schunter, “Asymmetric Fingerprinting” International Conference on the Theory and Applications of Cryptographic Techniques EUROCRYPT 1996 Advances in Cryptology — EUROCRYPT ’96 pp 84-95 [5] Ingemar J Cox, Matthew L Miller, Jeffrey A Bloom, Jessica Fridrich, Ton Kalker, Digital Watermarking and Steganography Series Editor Morgan Kaufmann Publishers is an imprint of Elsevier 30 Corporate Drive, Suite 400, Burlington, MA 01803, USA [6] Microsoft Windows Bitmap File Format Summary https://www.prepressure.com/library/file-formats/bmp [Ngày truy cập 22/5/2018] [7] PNG (Portable Network Graphics) Specification, Version 1.2 http://www.libpng.org/pub/png/spec/1.2/PNG-Structure.html [Ngày truy cập 22/5/2018] [8] JPEG File Interchange Format File Format Summary https://www.fileformat.info/format/jpeg/egff.htm [Ngày truy cập 22/5/2018] [9] ITU (1993), Information technology – digital compression and coding ofcontinuoustone still images – requirements and guidelines (ISO/IEC 10918-1: 1993(E)) [10] Shih, Frank Y Digital Watermarking and Steganography: Fundamentals and Techniques (Second Edition) Taylor & Francis, CRC Press, 2017 [11] Unik Lokhande A K Gulve Steganography using Cryptography and Pseudo Random Numbers International Journal of Computer Applications (0975 – 8887) Volume 96– No.19, June 2014 [12] Andrey Sidorenko and Berry Schoenmakers Concrete Security of the Blum-BlumShub Pseudorandom Generator Cryptography and Coding: 10th IMA International Conference, Lecture Notes in Computer Science 3796 (2005) 355{375 SpringerVerlag 134 [13] Po-Yueh Chen and Hung-Ju Lin, “A DWT Based Approach for Image Steganography”, International Journal of Applied Science and Engineering 4, 3: 275290, 2006 [14] Chun-Shien Lu, Multimedia Security: Steganography and Digital Watermarking Techniques for Protection of Intellectual Property, IDEA Group Publishing, 2005 [15] Vijay Kumar, Dinesh Kumar A modified DWT-based image steganography technique Multimedia Tools and Applications An International Journal Springer Science+Business Media, LLC 2017 [16] Sheelu (M Tech (CSE) - Manav Rachna College Of Engineering, Faridabad, India) “Enhancement of Data Hiding Capacity in Audio Steganography”, IOSR Journal of Computer Engineering (IOSR-JCE) e-ISSN: 2278-0661, p- ISSN: 2278-8727Volume 13, Issue Jul - Aug 2013 [17] Pradeep Kumar Singh, R.K.Aggrawal: Enhancement of LSB based Steganography for Hiding Image in Audio, (IJCSE) International Journal on Computer Science and Engineering Vol 02, No 05, 2010, 1652-1658 [18] B.C J Moore: An introduction to the Psychology of Hearing, Academic Press 2001 [19] Đỗ Quốc Trinh, Vũ Thanh Hải: Kĩ thuật trải phổ ứng dụng Học viện kĩ thuật quân 2006 [20] L Boney, A H Tewfik and K N Hamdy, “ Digital Watermarks for Audio signals” IEEE int contf On multimedia Computing and System, Horoshima, Japan, June 1996 [21] I.J.COX, “ Spread Spectrue Watermark for Embedled Signaling” United states Patent 5,848,155, December 1988 Dec [22] Cox I, Miller M & McKellips A (1999) Watermarking as communications with side information Proceedings of he IEEE 87 [23] Malvar H & Florencio D (2003) Improved spread spectrum: Anew modulation technique for robust watermarking [24] Gerrit Cornelis LANGELAAR (2000) Real-time Watermarking Techniques for Compressed Video Data Veenendaal ISBN 90-9013190-6 [25] Tìm hiểu định dạng file video phổ biến https://quantrimang.com/tim-hieu-vecac-dinh-dang-file-video-42612 [Ngày truy cập 30/8/2018] [26] Video Steganography based on Scene Change Detection – J.Mary Jenifer, Dr.S.Raja Ratna PG Scholar, Associate Professor Computer Science and Engineering VV College of Engineering, Tuticorin, India [27] Shuliang Sun A New Information Hiding Method Based on Improved BPCS Steganography Advances in Multimedia Volume 2015, Article ID 698492, p 135 [28] David Salomon Data Privacy and Security Springer, Verlag, 2003 [29] Anandaprova Majumder, Suvamoy Changder A Novel Approach for Text Steganography: Generating Text Summary using Reflection Symmetry International Conference on Computational Intelligence: Modeling Techniques and Applications (CIMTA) 2013 [30] W Bender, D Gruhl, N Morimoto, A Lu Techniques for data hiding IBM Systems Journal, Volume: 35 Issue: 3&4 [31] Chen Zhi-li, Huang Liu-sheng, Yu Zhen-shan, Zhao Xin-xin, Zheng Xue-ling, Effective Linguistic Steganography Detection, Department of Computer Science and Technology, University of Science and Technology of China, National High Performance Computing Center(Hefei), Hefei, Anhui 230027, China [32] Natarajan Meghanathan, Lopamudra Nayak A Review of the Audio and Video Steganalysis Algorithms Proceedings of the 48th Annual Southeast Regional Conference, 2010, Oxford, MS, USA, April 15-17, 2010 136 ... chia làm số kỹ thuật sau: - Kỹ thuật LSB; - Kỹ thuật trải phổ; - Kỹ thuật mã hóa pha; - Kỹ thuật tiếng vang; - Kỹ thuật tự đánh dấu b) Phân loại theo đặc điểm tín hiệu gốc Đối với cách phân loại... liệu [1, 14, 24 ] phân loại kỹ thuật giấu tin video thành số kỹ thuật sau: a) Phân loại giấu tin video theo kỹ thuật giấu - Giấu thông tin miền hệ số - Giấu thông tin mặt phẳng bit - Giấu thông... người đọc hiểu thuật toán kỹ thuật giấu tin âm thanh, giảng vào mô tả chi tiết cách thức tiến hành giấu tin tách tin số kỹ thuật giấu tin âm phổ biến Một số thuật tốn khác khơng mơ tả giảng tham