1. Trang chủ
  2. » Công Nghệ Thông Tin

Double secure algorithm for text steganography

28 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

Trang 1

BAN C Y U CHÍNH PHƠ YẾU CHÍNH PHỦ ẾU CHÍNH PHỦ Ủ

H C VI N KỸ THU T M T MÃỌC VIỆN KỸ THUẬT MẬT MÃỆN KỸ THUẬT MẬT MÃẬT MẬT MÃẬT MẬT MÃ

Chuyên ngành: An toàn thông tin

Sinh viên th c hi nực hiệnện :Gi ng viên:ảng viên:

Hà N i, 2/2021ội, 2/2021

Trang 2

M C L CỤC LỤCỤC LỤC

Danh mục các từ viết tắt ii

Chương 1 Thuật toán bảo mật kép trong ẩn mã VĂn bản (DSTS) 2

Trang 3

DANH M C CÁC T VI T T TỤC LỤCỪ VIẾT TẮTẾT TẮTẮT

Từviếttắt

Trang 4

CHƯƠNG 1 NG 1 THU T TOÁN B O M T KÉP TRONG N MÃ VĂNẬT MẬT MÃẢO MẬT KÉP CHO ẨN MÃ TRONG VĂN BẢNẬT MẬT MÃẨN MÃ TRONG VĂN BẢN

B N (DSTS)ẢO MẬT KÉP CHO ẨN MÃ TRONG VĂN BẢN

Steganography là một kỹ thuật che giấu sự tồn tại của thông tin bí mật ngoại trừngười gửi và người nhận Các nhà nghiên cứu đã sử dụng các thuật toán khác nhautrong lĩnh vực Steganography để cung cấp thông tin liên lạc an toàn thông quamạng, nhưng vẫn có khả năng phá vỡ bảo mật Hầu hết các thuật toán đang sửdụng một lớp bảo mật Bài báo này giới thiệu một thuật toán bảo mật kép có hailớp bảo mật bằng cách kết hợp các tính năng tốt nhất của thuật toán mã hóa hìnhdạng bảng chữ cái viết hoa và ẩn dữ liệu trong các đoạn văn

1.1.Tổng quan

Steganography là một nghệ thuật chuyển đổi thông tin liên lạc mà ngay cả nhữngkẻ xâm nhập cũng không thể nghi ngờ về sự tồn tại của thông điệp bí mật, ngoạitrừ người gửi và người nhận dự định Mật mã học và mật mã học là một phânngành của bảo mật thông tin đóng một vai trò quan trọng trong giao tiếp bí mật.Trong mật mã, ý nghĩa của thông tin bị thay đổi; dữ liệu được thay đổi thành cácmã mật mã mà một người không thể đọc ra được Có một mặt trái của mật mã; nóđược áp dụng trực tiếp cho Văn bản, trong khi Steganography được áp dụng thôngqua một đối tượng vô tội được gọi là cover message Hầu hết các tác phẩmsteganography được thực hiện trên hình ảnh, video clip, âm nhạc, âm thanh và vănbản Thuật toán ẩn văn bản là loại khó khăn nhất trong Steganography; điều nàychủ yếu là do sự thiếu hụt tương đối của thông tin dư thừa trong một tệp văn bản.Để tránh bị giới truyền thông tiết lộ các giấy tờ của chính phủ, Margaret Thatcher,cựu Thủ tướng Anh, đã viết một số khoảng trắng trong các giấy tờ chính thức liênquan đến từng bộ trưởng trong nội các để phát hiện người giữ hồ sơ

Tuy nhiên, các tài liệu văn bản vẫn quan trọng kể từ khi chúng xuất hiện trong lĩnhvực kỹ thuật số Ngoài ra, tin nhắn văn bản mang ít bộ nhớ hơn và hoạt độngnhanh hơn để đáp ứng kênh liên lạc kỹ thuật số Hầu hết các tài liệu dựa trên vănbản hiện có chú ý đến việc đạt được khả năng ẩn cao hơn là tính mạnh mẽ và tính

iii

Trang 5

không dễ nhận thấy của thông điệp ẩn Tuy nhiên, các kỹ thuật hiện có có sự đánhđổi giữa khả năng che giấu cao và khả năng không nhạy cảm; nếu một kỹ thuật đạtđược thành công một đặc điểm, thì kỹ thuật đó sẽ tự động thiếu các đặc điểm khác.Do đó, bài báo này giới thiệu một thuật toán bảo mật kép bằng cách kết hợp cáctính năng tốt nhất của các thuật toán Mã hóa hình dạng bảng chữ cái viết hoa vàẨn dữ liệu trong các đoạn văn Thuật toán mới khắc phục được những hạn chế củanó vì thuật toán CASE có một vấn đề bảo mật mà nếu một số người hiểu được khảnăng áp dụng của nó, nó có thể dễ dàng bị bắt Dữ liệu ẩn trong các đoạn văn cũngsử dụng mã hóa không chuẩn cho nội dung ẩn văn bản Do đó, sự kết hợp của cảhai khắc phục được những hạn chế của chúng.

1.2.Các khái niệm liên quan

1.2.1 Steganography và phân loạiSteganography là một kỹ thuật che giấu sự tồn tại của thông tin hoặc tin nhắn mộtcách bí mật ngoại trừ người gửi và người nhận Nó che đậy các thông điệp bí mậttrong tệp bổ sung mà chỉ người nhận mới xác định được sự hiện diện của thông tin.Steganography được áp dụng thông qua một đối tượng vô tội được gọi là vật chephủ (ví dụ: văn bản, hình ảnh, âm thanh hoặc video) Hình1 cho thấy các loạiSteganography

iv

Trang 6

Hình 1: Phân loại SteganographyKỹ thuật ẩn hình ảnh là một kỹ thuật khác để che giấu dữ liệu bí mật trong hìnhảnh dưới dạng nhiễu, điều này rất khó nhận ra bằng mắt, tuy nhiên, việc sử dụngmột hình ảnh tương tự để nhúng các thông điệp khác nhau sẽ tạo ra sự nghi ngờcho tin tặc

Ẩn mã trong âm thanh là một loại khác của Steganography trong đó thông điệp bímật được ẩn trong các tệp âm thanh, ẩn dữ liệu vào lớp phủ âm thanh với tạp âmhỗn hợp ở tần số không thể nghe được đối với tai người MP3 hoặc WAV có thểđược sử dụng làm định dạng bìa âm thanh Có các kỹ thuật khác nhau được sửdụng cho kỹ thuật Steganography âm thanh, chẳng hạn như LSB (Bit có ý nghĩa ítnhất) Tuy nhiên, phương pháp này được coi là độ bền đối với tiếng ồn thấp; do đó,nó trở nên kém an toàn hơn ngay cả đối với các cuộc tấn công đơn giản

v

Trang 7

Tương tự, kỹ thuật ẩn mã trong video đang che giấu thông tin bí mật trong cácvideo kỹ thuật số bằng cách sử dụng các kỹ thuật khác nhau như phương pháp ít bitnhất Hơn nữa, phương pháp này ít phức tạp hơn và thông tin bí mật có thể bị pháhủy dễ dàng bằng một số chuyển đổi tệp Do đó, kém an toàn và dễ bị phá vỡ.Hình 2 cho thấy ý tưởng cơ bản của Steganography

Hình 2: Ý tưởng cơ bản của ẩn mã (Steganography)Thuật toán ẩn mã trong tệp văn bản sử dụng các thuật toán khác nhau để ẩnthông tin như thay đổi định dạng văn bản, sử dụng thứ tự tùy ý của văn bản, biếnthể về kích thước màu sắc và từ vựng chính tả cho mục đích gửi Dữ liệu có thểđược ẩn trong tất cả hoặc một số ký tự của từ, trên mỗi dòng hoặc tất cả các câu dữliệu văn bản Tương tự, kỹ thuật ẩn mã trong video sử dụng video như một phươngtiện cung cấp thông tin bí mật Nhưng việc che giấu văn bản dưới định dạng âmthanh, video hoặc các định dạng khác là không phù hợp do nhiều vấn đề kỹ thuật.Kỹ thuật ẩn mã trong văn bản là phương pháp mạnh mẽ nhất liên quan đến bộ nhớít hơn và nhanh hơn so với Steganography video, âm thanh và mạng Ẩn thôngđiệp bí mật trong văn bản không thể để xảy ra sự khác biệt, vì vậy việc thay đổicấu trúc của văn bản tạo ra một công việc quan trọng và phức tạp nhất; đồng thời,tin nhắn văn bản mang ít bộ nhớ hơn và hoạt động nhanh hơn so với các phươngpháp in mật mã khác Steganography văn bản kỹ thuật số đã được chia thành bốn

vi

Trang 8

loại chính; dựa trên kỹ thuật hoặc định dạng, ngôn ngữ, ngẫu nhiên, và thống kê vàcác kỹ thuật khác Dưới đây hình 3 cho thấy các loại ẩn văn bản Kỹ thuật hoặcđịnh dạng / tính năng phương pháp ẩn dữ liệu ẩn dữ liệu bí mật bằng cách thay đổiđịnh dạng vật lý của thư như sử dụng thêm khoảng trắng hoặc ký tự tab, viết saichính tả, thay đổi kiểu phông chữ, v.v Máy tính có thể xác định việc sử dụngkhoảng trắng và sai chính tả để che giấu thông tin bí mật trong khi người đọc cóthể nhận ra nó Đồng thời, việc thay đổi kích thước phông chữ của tài liệu được coinhư một văn bản tiêu chuẩn bằng máy tính, trong khi con người có thể phân biệttrực tiếp những thay đổi này Nếu ai đó định dạng lại văn bản, thì thông tin có thểbị biến mất Phương pháp dựa trên định dạng chứa kỹ thuật mã hóa tính năng và kỹthuật không gian mở

Sự sắp xếp có liên quan đến sự xuất hiện có thể thay đổi của văn bản Có thểthực hiện nhiều hành động như thay đổi phông chữ của văn bản và thay đổi vị tríký tự tương tự, thay đổi quy trình khoảng trắng hoặc lỗi chính tả của văn bản, thayđổi chiều rộng hoặc chiều dài của văn bản hoặc áp dụng các dấu chấm câu

Kỹ thuật ẩn văn bản được tạo ngẫu nhiên và thống kê tạo ra một ký tự ngẫunhiên hoặc văn bản trên bìa chuỗi từ để vượt qua các cuộc tấn công văn bản rõràng đã biết Chuỗi ký tự ngẫu nhiên đang ẩn dữ liệu bí mật với mọi người, ngoạitrừ người nhận Cấu trúc thống kê về độ dài từ và tần suất chữ cái tạo ra các từtrông giống như từ thật Nhưng sự ngẫu nhiên khiến nó trở thành những từ ngữ vônghĩa, tạo ra những nghi ngờ trong tâm trí người đọc rất dễ bị tấn công

Tương tự, trong Steganography ngôn ngữ, sự sắp xếp ngôn ngữ của văn bảncó tác dụng che giấu dữ liệu bí mật Phương pháp này sử dụng các loại ngôn ngữcủa văn bản cải tiến để che giấu thông tin bí mật Cấu trúc cú pháp của tài liệu cóthể được sử dụng để che giấu dữ liệu bí mật

vii

Trang 9

Hình 3: Các loại ẩn văn bản (text steganography)Một cách tiếp cận khác là mã hóa dịch chuyển dòng Để che dấu văn bảnthuần túy với dịch chuyển dòng xuống, ẩn số 0 và dịch chuyển dòng lên trên, ẩn 1.dịch chuyển lên hoặc xuống đối với 1 và không có dịch chuyển đối với 0 Nhập lạivăn bản hoặc phép đo OCR có thể phá hủy ẩn dịch chuyển dòng Lợi ích cốt lõicủa các thuật toán dịch chuyển là sự đơn giản trong việc thực thi Ở khía cạnhngược lại, tỷ lệ thông tin được che giấu là tương phản rất nhỏ so với các kỹ thuật inẩn văn bản khác.

Tương tự, trong kỹ thuật ẩn chuyển từ, dữ liệu cá nhân được che giấu bằngcách tăng độ dài của từ ở bên trái hoặc bên phải Kỹ thuật này hiếm khi có thể nhìnthấy hơn so với sự dịch chuyển dòng vì nó tạo ra sự lừa dối rằng văn bản là hợp lý.Nhưng một máy OCR đọc hoặc gõ lại có thể phá hủy dữ liệu bí mật

Hơn nữa, trong phương pháp cú pháp, các dấu câu như dấu phẩy (,), dấuchấm hết (.) Ẩn 1 hoặc 0 Phương pháp này tuyệt vời nhưng dễ dàng nhắm mụctiêu cho tin tặc vì chúng biết về các kỹ thuật như vậy nếu kẻ xâm nhập có kiến thứctiếng Anh tốt và đánh dấu một vị trí chính xác trong các tài liệu

Mật mã (Cryptography)Cách viết mà thông tin hiển thị cho mọi người nhưng khó đoán được gọi làmật mã Mật mã học có thể được tách thành các lớp con Mật mã khóa đối xứng làmột khóa chia sẻ tiêu chuẩn có thể được sử dụng cho các kỹ thuật văn bản mã hóavà giải mã Thiết lập một khóa riêng biệt cho mọi máy thu là một nhiệm vụ khókhăn trong phương pháp này; cùng một khóa sẽ được sử dụng giữa người gửi và

viii

Trang 10

người nhận Trong khi mật mã khóa không đối xứng, các cặp khóa công khai vàkhóa riêng được sử dụng Một khóa hoạt động cho các thuật toán mã hóa trong khimột khóa khác hoạt động để giải mã Các lược đồ mật mã có lợi cho tính bảo mật,xác thực, tính toàn vẹn và kiểm soát truy cập Phương pháp thay thế là kỹ thuậtthông thường trong đó bản mã thay thế văn bản thuần túy Nhưng phương pháp đórất dễ bị tấn công và ngày nay, các phương pháp mạnh mẽ được thiết lập dựa trêncác quy trình tính toán phức tạp đang được thực hiện như RSA, v.v Hình 4 chothấy quy trình cơ bản của mật mã

Hình 4: Quy trình cơ bản của mật mã

ix

Trang 11

Double Secure algorithm for Text Steganography

1.3.Phương pháp luận

Các nhà nghiên cứu Steganography sử dụng một cách tiếp cận bảo mậtduy nhất, tức là mã hóa tin nhắn, tạo khóa và sau đó ẩn trong văn bản của nhàcung cấp dịch vụ Phần này trình bày một thuật toán bảo mật hai lớp để che giấudữ liệu bí mật trong trình mang văn bản Tên thuật toán này là Double SecureText Steganography (DSTS)

Lớp bảo mật đầu tiên là mã hóa Thuật toán này đầu tiên chuyển đổi từngký tự của thông điệp bí mật thành một số nhị phân 8bit và sau đó thay thế ký tựthông điệp bí mật bằng một ký tự ASCII của số 8bit đó Các nhà nghiên cứu đãcải tiến thuật toán lấy mật mã dựa trên CASE Thuật toán CASE không thể phânbiệt giữa 10000000 và 10001000 ở vị trí bit thứ 4 cho các chữ số và ký hiệuđược hiển thị từ bảng 1,2,3,4 DSTS bắt đầu lập chỉ mục từ 2 để loại bỏ vấn đềtừ điển trong thuật toán CASE cho các chữ số và ký hiệu Phần còn lại của thủtục gần giống như bit đầu tiên (thứ 0) trong số 8bit hiển thị một nhóm ký tự Sốkhông (0) ở bit đầu tiên hiển thị bảng chữ cái trong khi 1 biểu thị một chữ sốhoặc ký hiệu Ba bit tiếp theo (1, 2 và 3) đại diện cho số nhóm Bit thứ tư trongsố 8bit đại diện cho chữ cái, 1 cho chữ hoa, trong khi 0 cho chữ thường Bảng 5,6 và 7 sau đây trình bày Định dạng mã hóa của bảng chữ cái, chữ số và ký hiệu,giống như một CASE

Bảng 1 Mã hóa 8bit trường hợp chữ số cho 10000000

Bảng 2 Mã hóa 8bit trường hợp kí hiệu cho 10000000

Trang 10

Trang 12

Double Secure algorithm for Text Steganography

Bảng 3 Mã hóa 8bit trường hợp chữ số cho 10001000

Hình 4 Mã hóa 8bit trường hợp kí hiệu cho 10001000

Bảng 5 Định dạng mã hóa 8bit trong trường hợp bảng chữ cái

Bảng 6 Định dạng mã hóa 8bit trong trường hợp chữ số

Bảng 7 Định dạng mã hóa 8bit trong trường hợp kí hiệuCác nhà nghiên cứu đã sử dụng cùng một chiến lược để nhóm các bảngchữ cái như thuật toán CASE

Trong lớp bảo mật thứ hai, sửa đổi thuật toán thứ 3 của Monika Agarwal,ẩn dữ liệu trong đoạn văn và thêm một lớp mã hóa bổ sung để bảo mật kép Nhưtrong thời kỳ hiện đại này, thiết bị phần cứng đã có những tiến bộ vượt bậc Vì

Trang 11

Trang 13

Double Secure algorithm for Text Steganography

vậy, xử lý và bộ nhớ không phải là một vấn đề quan trọng nữa, mà khía cạnhquan trọng nhất là bảo mật Vì vậy, kiến trúc mới của phương pháp được đề xuấtnhư sau trong hình 5

Hình 5 Mô hình đề xuất về lớp bảo mật képKhối đầu tiên là chức năng nén, nén dữ liệu bí mật Khối thứ 2 là hàmđược mã hóa, hàm này chứa dữ liệu nén bằng khóa đệm một lần Khối thứ 3 làmột chức năng ẩn, ẩn dữ liệu được nén và tạo khóa stego; sau đó, văn bản stegovà các khóa được gửi đến mạng Khối thứ 4 là một thủ tục tìm kiếm để hiện vănbản stego bằng khóa stego Khối thứ 5 là một chức năng giải mã giải mã dữ liệubằng khóa encipher Khối thứ 6 là một chức năng giải nén cung cấp dữ liệu gốc

Thuật toán này đã thông qua sơ đồ của khóa One Time-Pad và Ẩn dữ liệutrong các đoạn của Monika.Thuật toán được đề xuất bổ sung thêm các lớp mãhóa và giải mã thông điệp bí mật bằng cách sử dụng thuật toán CASE Thuậttoán này sử dụng bất kỳ văn bản tiếng Anh nào làm tệp bìa, được lấy từ bất kỳnguồn nào, chẳng hạn như sách, tạp chí hoặc báo

Trang 12

Trang 14

Double Secure algorithm for Text Steganography

Trang 13

Trang 15

Double Secure algorithm for Text Steganography

CHƯƠNG 1 NG 2 TH NGHI MỬ NGHIỆMỆN KỸ THUẬT MẬT MÃ

2.1.Chạy thử nghiệm

Các nhà nghiên cứu kiểm tra dữ liệu bí mật, "try" được ẩn trong văn bảncủa nhà cung cấp dịch vụ Sau khi mã hóa, dữ liệu bí mật là "5S" và thông điệpđược bao bọc "ğð:." Hình 6 trình bày văn bản bìa và Hình 7 trình bày tệp vănbản stego Có thể nhận ra rằng hai tài liệu giống hệt nhau trong khi có độ bảomật gấp đôi

Trang 14

Trang 16

Double Secure algorithm for Text Steganography

phương pháp tiếp cận ẩn văn bản khác Hình 8 cho thấy các thư mục đầu ra hệthống bên dưới

Hình 8 Thư mục đầu ra hệ thống

2.3.Trung bình và độ lệch chuẩn

So sánh tốc độ thuật toán được đề xuất trung bình và độ lệch chuẩn vớinhững người nhấn mạnh Hình 9 sau đây cho thấy rằng mặc dù thuật toán đượcđề xuất mới có bảo mật gấp đôi, giá trị trung bình của nó hơi cao, tức là 225.8 μssmicro giây, nhưng độ lệch chuẩn thấp

Trang 15

Trang 17

Double Secure algorithm for Text Steganography

Hình 9 So sánh trung bình và độ lệch chuẩn của tốc độ của các thuật toán khác nhau

2.4.Dung lượng

Dung lượng là lượng dữ liệu bí mật trong văn bản của nhà cung cấp dịchvụ Mối quan hệ dung lượng là phép chia số lượng byte bị che trên kích thướcvăn bản bìa tính bằng byte

Hình 10 cho thấy công suất phần trăm, gần như bằng 1% Điều rõ ràng làkhi bảo mật được tăng lên, thì số lượng byte thông điệp được mã hóa vàencipher sẽ tăng lên Do đó, công suất của nó bị giảm Nhưng mục tiêu, tính bảomật cao hơn được duy trì

Trang 16

Trang 18

Double Secure algorithm for Text Steganography

Hình 10 Công suất

2.5.Tính tương tự

Tính tương tự của thuật toán đã được kiểm tra bằng cách sử dụng Winkler, công cụ này đo lường mức độ tương tự giữa văn bản bìa và văn bảnstego Điểm số Jaro, là một khoảng cách tương tự Điểm số Jaro được tính là:

Jaro-Trang 17

Ngày đăng: 20/09/2024, 16:38

w