Phát hiện giấu tin trong chữ ký - Nghiên cứu về kỹ- 123docz.net

Các phƣơng pháp giấu tin mật và các tác động lên hình ảnh cũng nhƣ các phƣơng tiện truyền tin kỹ thuật số khác nhau có thể làm cho mắt thƣờng không nhận thấy. Tuy nhiên việc che giấu thông tin trong bất kỳ phƣơng tin truyền tin kỹ thuật số nào sử dụng giấu tin mật đều đòi hỏi sự thay đổi các thuộc tính, tính chất của phƣơng

tiện truyền tin. Các đặc tính khác thƣờng hoặc các mẫu có thể đóng vai trò nhƣ là dấu hiệu nhận biết sự tồn tại của thông tin mật đƣợc nhúng trong ảnh. Kỹ thuật mô tả trong [12] dựa trên các kỹ thuật tấn công dựa trên chữ ký để phát hiện sự hiện diện của các thông tin mật giấu trong ảnh. Jpegx chèn dữ liệu tin mật vào cuối file JPEG và thêm một chữ ký cố định của chƣơng trình trƣớc các tin mật này. Sự hiện diện của chữ ký này thể hiện rằng hình ảnh có chứa một thông điệp bí mật đƣợc nhúng sử dụng Jpegx.

3.3.2 Phát hiện giấu tin dựa trên thống kê cụ thể

Các kỹ thuật giấu tin mật nhúng thông điệp bí mật trong hình ảnh, điều này gây ra sự thay đổi trong các số liệu thống kê của hình ảnh. Phát hiện giấu tin dựa trên thống kê sẽ phân tích các số liệu thống kê nằm bên dƣới hình ảnh để phát hiện các thông tin bí mật đƣợc nhúng. Kỹ thuật phát hiện giấu tin dựa trên thống kê đƣợc coi là mạnh hơn so với phát hiện giấu tin dựa trên chữ ký vì kỹ thuật toán học sẽ phát hiện tốt hơn so với sử dụng thị giác. Phát hiện giấu tin mật dựa trên thống kê có thể đƣợc phân loại dựa trên kỹ thuật giấu dữ liệu gồm có trong miền không gian hoặc biến đổi miền.

3.3.2.1 Kỹ thuật phát hiện giấu tin miền không gian

3.3.2.1.1 Tấn công Chisquare

Việc tấn công dựa trên thống kê lần đầu tiên đƣợc đề xuất bởi Westfeld và Pfitzmann. Cách tiếp cận này cụ thể sử dụng cho LSB nhúng và dựa trên việc phân tích thống kê thứ tự đầu tiên mạnh hơn là kiểm tra trực quan bằng mắt. Kỹ thuật xác định các cặp giá trị (POVs) bao gồm các giá trị pixel, hệ số DCT lƣợng tử hoặc chỉ số bảng màu mà có đƣợc ánh xạ tới một số khác trên LSB flipping. Sau khi nhúng tin mật, tổng số cặp giá trị POV sẽ vẫn giống nhau. Khái niệm này của cặp giá trị phụ thuộc đƣợc khai thác để thiết kế một thử nghiệm Chisquare thống kê để phát hiện các thông tin bị giấu [13]. Kết quả báo cáo cho thấy phƣơng pháp này đáng tin cậy trong việc phát hiện các thông tin giấu tuần tự. Sau đó phƣơng pháp trên đƣợc phát triển tổng quát hơn giúp phát hiện thông tin giấu rải rác ngẫu nhiên [14].

3.3.2.1.2 RQP (Raw quick pair)

Một phƣơng pháp khác phát hiện giấu tin mật cho kỹ thuật nhúng tin LSB trong ảnh màu 24-bit là Raw Quick Pair đƣợc đề xuất bởi Fridrich [15]. Phƣơng pháp này dựa trên phân tích các cặp chặt chẽ của màu sắc tạo ra bởi LSB nhúng. Nó chỉ ra rằng tỉ lệ màu sắc gần với tổng số màu sắc độc nhất tăng đáng kể khi một tin nhắn có chiều dài đƣợc chọn đƣợc nhúng vào trong ảnh bìa hơn là trong một hình ảnh đã giấu tin. Sự khác biệt này giúp ta phân biệt đƣợc ảnh bìa và ảnh đã giấu tin cho trƣờng hợp giấu tin

LSB. Phƣơng pháp này hoạt động đáng tin cậy với điều kiện số lƣợng màu sắc độc nhất trong ảnh bìa là ít hơn 30% số lƣợng điểm ảnh. Theo báo cáo phƣơng pháp có tỉ lệ phát hiện cao hơn so với phƣơng pháp đƣợc đƣa ra bởi Westfeld và Pfitzmann nhƣng không thể áp dụng cho ảnh màu xám.

3.3.2.1.3 Kỹ thuật phát hiện giấu tin RS

Một kỹ thuật phát hiện giấu tin phức tạp hơn: RS (Regular and Singular group) đƣợc trình bày bởi Fridrich [16] để phát hiện giấu tin LSB nhúng trong ảnh màu và ảnh xám. Kỹ thuật này sử dụng số liệu thống kê kép nhạy cảm xuất phát từ mối tƣơng quan của không gian trong hình ảnh. Các hình ảnh đƣợc chia thành các nhóm tách rời có hình dạng cố định. Trong mỗi nhóm, nhiễu đƣợc đo bằng giá trị tuyệt đối trung bình của sự khác biệt giữa các điểm ảnh lân cận.

Mỗi nhóm đƣợc phân loại là "bình thƣờng" hoặc "đặc biệt" tùy thuộc vào việc các nhiễu điểm ảnh trong nhóm đƣợc tăng lên hay sau khi lật LSB của một tập hơn cố định các điểm ảnh trong nhóm sử dụng một mặt nạ. Việc phân loại đƣợc lặp lại cho loại kép của việc lật.

Phân tích lý thuyết và thực nghiệm cho thấy rằng tỷ lệ của nhóm bình thƣờng và nhóm đặc biệt hình thành các đƣờng cong bậc hai với số lƣợng tin nhắn đƣợc nhúng sử dụng phƣơng pháp LSB.

3.3.2.2 Kỹ thuật phát hiện giấu tin biến đổi miền

3.3.2.2.1 Phương pháp thống kê Chi-square

Zhang và Ping đã đề xuất kỹ thuật tấn công JSteg tuần tự và ngẫn nhiên trên ảnh JPEG. Kỹ thuật này đƣợc thực hiện dựa trên các mô hình thống kê của các hệ số DCT. Quan sát thấy rằng các hệ số DCT lƣợng tử hóa các hình ảnh JPEG phân phối đối xứng quanh 0 trong các hình ảnh sạch. Các hình ảnh sau khi giấu tin đƣợc thay đổi khi có thông điệp đƣợc nhúng tuần tự hoặc ngẫn nhiên. Kỹ thuật thống kê Chi-square sẽ tính toán một bất đẳng thức để đánh giá sự có mặt của thông điệp nhúng trong ảnh bị giấu tin. Tỉ lệ nhúng cũng đƣợc tính toán. Kỹ thuật này đơn giản và rất hiệu quả [17].

3.3.2.2.2 Tấn công phân tích biểu đồ Histogram

Tấn công phân tích biểu đồ Histogram hoạt động trên ảnh JPEG tuần tự và ngẫu nhiên, nhƣ JSteg hay Outguess 0.1. Nó có hiệu quả khi ƣớc lƣợng độ dài của thông điệp đƣợc nhúng trong ảnh dựa trên sự mất mát của biểu đồ đối xứng sau khi nhúng. X. Yu đề xuất một phƣơng pháp phát hiện giấu tin mạnh mẽ hơn [18]. Trong kỹ thuật này,

các biểu đồ histogram của ảnh gốc của các hệ số DCT đƣợc ƣớc lƣợng từ biểu đồ hình ảnh sau khi giấu tin.

3.3.2.2.3 Kỹ thuật hiệu chỉnh

Fridrich đề xuất một phƣơng pháp phát hiện giấu tin dựa trên việc kết hợp các khái niệm về hiệu chỉnh cho hình ảnh JPEG [19]. Việc phân tích DCT và miền không gian các thuộc tính nhƣ hệ số biểu đồ DCT tổng quát, biểu đồ kép histogram, ma trận đồng xảy ra đƣợc thực hiện đầu tiên và thứ hai. Dựa trên thực tế rằng các hình ảnh JPEG có một cấu trúc khối 8x8 và đƣợc hình thành bởi các hệ số DCT lƣợng tử có xu hƣớng vững chắc đến biến dạng nhỏ nhƣ nén và nhúng, chúng ta có thể ƣớc lƣợng ảnh gốc. Nhƣ vậy bằng cách nén và giải nén hình ảnh với cấu trúc khối khác nhau, chúng ta có thể ƣớc lƣợng ảnh gốc. Điều này đƣợc thực hiện bằng cách áp dụng các kỹ thuật hiệu chỉnh sau đây vào hình ảnh bị nhúng tin:

- Giải nén hình ảnh bị nhúng tin sử dụng bảng lƣợng tử của nó.

- Cắt hình ảnh bị nhúng tin đã bị giải nén theo 4 pixel, hoặc là hàng, cột hoặc ở các cạnh.

- Nén ảnh đã đƣợc cắt bằng cách sử dụng cùng bảng lƣợng tử.

3.4 Kỹ thuật phát hiện giấu tin tổng quát

Kỹ thuật phát hiện giấu tin cụ thể mang lại những quyết định chính xác khi kiểm tra trên các ảnh giấu tin sử dụng phƣơng pháp đó. Tuy nhiên các kỹ thuật này có thể thất bại khi sử dụng một phƣơng pháp giấu tin khác. Do đó kỹ thuật giấu tin mù hay kỹ thuật giấu tổng quát có thể khắc phục đƣợc những thiếu sót của việc sử dụng các kỹ thuật giấu tin cụ thể. Phát hiện giấu tin tổng quát có thể xem nhƣ là mô hình phân loại kiểu hai lớp để phân loại các hình ảnh thử nghiệm nhƣ ảnh gốc hay ảnh giấu tin. Nói chung việc phân loại bao gồm hai phần: rút trích các đặc trƣng và mô hình phân loại. Các đặc trƣng tốt nhất cho việc phát hiện giấu tin cần phải bao gồm thông tin về việc thay đổi phát sinh bởi các dữ liệu ẩn chứ không phải bởi các nội dung của hình ảnh. Khảo sát dựa trên các tính năng khác nhau đƣợc đƣa ra dƣới đây.

3.4.1 Đặc trƣng markov

Một phƣơng pháp phát hiện giấu tin đề xuất bởi Shi và Chen [20] sử dụng ma trận chuyển đổi thực nghiệm Markov để nắm bắt cả nội khối và liên kết khối phụ thuộc giữa các khối hệ số DCT trong hình ảnh JPEG. Các đặc trƣng đƣợc trích xuất từ ma trận chuyển đổi thực nghiệm bằng kỹ thuật ngƣỡng. Những tính năng đƣợc đánh giá bằng máy hỗ trợ vector SVM. Zou, Shi và Xuan đã trích xuất các đặc trƣng markov từ

hình ảnh dự đoán lỗi. Các điểm ảnh đƣợc dự đoán với các điểm ảnh lân cận nó. Các lỗi dự báo thu đƣợc bằng cách trừ đi các giá trị dự đoán từ các giá trị điểm ảnh và sau đó lấy ngƣỡng với một giá trị ngƣỡng xác định trƣớc. Đối với phân loại đặc trƣng, SVM tuyến tính và không tuyến tính đƣợc sử dụng để phân loại. Các SVM không tuyến tính hoạt động tốt hơn SVM tuyến tính cho việc đƣa ra đặc trƣng tốt hơn. Các đặc trƣng Markov dựa trên ảnh JPEG gốc nắm bắt đƣợc đặc điểm của sự phân bố hệ số DCT trong khi đặc trƣng Markov dựa trên sự khác nhau và khác nhau giữa các hệ số lân cận. Theo tác giả, việc sử dụng cả ba tính năng Markov giúp cải thiện hiệu suất của hệ thống phát hiện giấu tin. RBFNN (Radial Basis Neural network) đƣợc sử dụng nhƣ một bộ phân loại. Các kết quả thử nghiệm trong bài báo cho thấy khả năng khái quát cho cơ sở dữ liệu hình ảnh khác nhau của phƣơng pháp đề xuất lớn hơn các phƣơng pháp của Fridrich, Shi và Chen.

3.4.2 Metric chất lƣợng hình ảnh

Memom và các cộng sự đã chứng minh rằng các sơ đồ giấu tin để lại các giấu vết thống kê có thể đƣợc khai thác để phát hiện với sự trợ giúp của các số liệu liên quan tới chất lợng hình ảnh và phân tích hồi quy đa biến. Khoảng cách trong không gian đặc trƣng giữa ảnh không rõ ràng và hình ảnh tham chiếu là khác nhau hơn so với khoảng cách giữa một hình ảnh rõ ràng và tham chiếu của nó. Khoảng 26 metric chất lƣợng hình ảnh đƣợc sử dụng nhƣ là các tập hợp các đặc trƣng. Kỹ thuật ANOVA đƣợc sử dụng để phân biệt đặc trƣng về chất lƣợng tốt nhất.

3.4.3 Đặc trƣng sóng biến đổi wavelet

Minh và Martin đã rút trích hệ số sóng wavelet trong mỗi dải phổ con của biến đổi wavelet và mô hình hóa chúng nhƣ là một phân bố tổng quát Gause (generalized Gaussian Distribution - GGD) với hai tham số là hình dạng và quy mô độ lớn. Những tham số này là thƣớc đo tốt cho các đặc trƣng của hình ảnh và đƣợc sử dụng để phân biệt giữa các hình ảnh đƣợc giấu tin và hình ảnh gốc. Mạng Nơ ron sẽ đƣợc học thông qua các thông số để có đƣợc những đặc tính vốn có của hình ảnh gốc và hình ảnh đƣợc giấu tin. Kỹ thuật phát hiện giấu tin tổng quá của Farid đề xuất sử dụng một cách tiếp cận khác để rút trích đặc trƣng từ ảnh xám. Quá trình phân tích dựa trên bộ lọc bộ lọc gƣơng vuông góc tách rời (separable quadrature mirror filters - QMFs). Một mô hình thống kê đƣợc xây dựng trong đó gồm có trung bình, phƣơng sai, độ nhọn, góc nghiêng của các hệ số dải phổ con và thống kê lỗi từ một dự báo tuyến tính tối ƣu của độ lớn hệ số. Một phân tích tuyến tính Fisher đƣợc sử dụng để phân biệt giữa hình ảnh bị ảnh hƣởng và hình ảnh bị pha trộn. Sau đó có những mở rộng trong các mô hình thống kê

số liệu đầu tiên và cao hơn trong thống kê wavelet màu sắc. Một máy vector hỗ trợ một lớp (OC-SVM) đƣợc sử dụng để phát hiện các thông điệp bí mật trong ảnh kỹ thuật số. Dựa trên phƣơng pháp phân tích wavelet sử dụng QMF thì Gireesh và Jithin đã trích xuất đƣợc các đặc trƣng từ mô hình thống kê đặc trƣng của tất cả ba kênh màu của ảnh là đỏ, xanh lá cây và xanh da trời. Kết quả thu đƣợc là 108 đặc trƣng có thể nhận đƣợc và tác giả sử dụng việc phân loại đặc trƣng bằng máy vector hỗ trợ SVM.

3.4.4 Ma trận đồng thời xuất hiện

Kodovsky thiết kế đặc trƣng 7850 chiều đƣợc tính toán từ các ma trận đồng thời xuất hiện của các cặp hệ số DCT và đƣợc gọi là đặc trƣng CF*. Khi cả nội khối và liên kết khối phụ thuộc đại diện cho các đặc trƣng, phƣơng pháp phát hiện giấu tin có hiệu quả trong việc phát hiện các dữ liệu ẩn trong ảnh JPEG. Một cơ chế phân loại đƣợc trình bày để giải quyết các vấn đề mà trong đó các phân loại tuyến tính Fisher độc lập (FLD) đƣợc huấn luyện trong những không gian con đặc trƣng ngẫu nhiên với kích thƣớc nhỏ và quyết định cuối cùng trên môi trƣờng nghi ngờ sẽ đƣợc thực hiện bằng cách trộn các quyết định độc lập FLD với chiến lƣợc biểu quyết đa số. Bằng cách này, cả hai thực hiện phân loại tốt và phức tạp tính toán thỏa đáng đƣợc đảm bảo. Nghiên cứu của Fengyong và Xinpeng Zhang gồm hai phần: rút trích đặc trƣng và bộ phân loại tổ hợp Bayes. Các đặc trƣng đƣợc trích xuất trong hai phần: một phần tạo ra tự các ma trận hệ số đồng thời xảy ra, đó là 7850 đặc trƣng đề xuất bởi Kodovsky trong khi một phần khác có nguồn gốc từ các ma trận đồng thời xảy ra của sự khác biệt hệ số.

3.4.5 Đặc trƣng Histogram

Kodovsky đề xuất rằng việc phát hiện sự có mặt của tin mật đƣợc giấu trong ảnh JPEG bằng cách sử dụng một đặc điểm của ảnh sau khi giấu tin đều đƣợc nén JPEG trƣớc đó. Sự khác biệt giữa ảnh sau khi giấu tin và ƣớc lợng của ảnh trƣớc khi giấu đƣợc tính toán. Ảnh gốc thu lại đƣợc bằng cách nén lại với một bảng lƣợng tử JPEG đƣợc tính ra từ các ảnh sau khi giấu tin. Việc nén lại đƣợc mô tả bằng một vector đặc trƣng 65 chiều đƣợc hình thành nhƣ là biểu đồ của các khối với một số lƣợng nhất định các điểm ảnh không phù hợp. Các phân loại tổ hợp đƣợc xây dựng để đánh giá độ chính xác phát hiện cho một tỷ lệ cố định sự thay đổi đƣợc nhúng vào ảnh, tỉ lệ phát hiện lỗi cảnh báo liên tục cho sự thay đổi tỉ lệ không rõ ràng. Các phƣơng pháp tiếp cận cung cấp cả những phát hiện chính xác đáng kể hơn ngay cả đối với sự thay đổi rất nhỏ. Kỹ thuật này đòi hỏi phải có một ƣớc tính chính xác của các thông số nén JPEG. Deng Qian-lan đề xuất một vector đặc trƣng là 18 biểu đồ 2-D histogram thu đƣợc từ

một hình ảnh màu sắc nhất định, 9 biểu đồ histogram 2-D là kề nhau của hình ảnh khác biệt ba hƣớng và 9 biểu đồ khác là những biểu đồ 2-D giữa các sai khác hình ảnh của ba mặt phẳng màu. Sau đó họ tính toán các DFT 2-D dẫn đến một tập hợp 54 đặc trƣng. Máy vector hỗ trợ với RBF kernel đƣợc áp dụng để phân loại.