Các kỹ thuật nhúng tin thƣờng thay đổi các bit ít quan trọng trong ảnh để không làm thay đổi ảnh quá nhiều. Các cặp giá trị của bit ít quan trọng này đƣợc gọi là PoVs (pair of value). Nếu các bit này đƣợc phân bố đều thì tần số xuất hiện của các giá trị mỗi PoV bằng nhau. Hình 8 thể hiện tần số của màu sắc ảnh trƣớc và sau khi nhúng tin.
Bảng màu gốc
Bảng màu sau khi sắp xếp
Sắp xếp quay lại Màu sắc theo giá trị steganographic
Bảng màu sau
thay thế Sắp xếp
29
Hình 8: Tần số xuất hiện của ảnh trƣớc khi giấu tin (trái) và ảnh sau khi giấu tin (phải)
Ý tƣởng của phƣơng pháp này là thống kê để so sánh phân bố tần suất lý thuyết mong muốn trong các ảnh sau khi giấu tin với một số mẫu trong môi trƣờng quan sát.
Điều quan trọng là làm thế nào ta có đƣợc tần số lý thuyết mong muốn. Tần số này không đƣợc lấy từ các mẫu ngẫu nhiên vì các mẫu ngẫu nhiên có khả năng đã bị thay đổi bởi việc nhúng thông tin vào trong ảnh. Về mặt lý thuyết, tần số là trung bình cộng của hai tần số trong một PoV. Các đƣờng nét đứt trong hình 6 nối các giá trị trung bình cộng với nhau. Do khi nhúng chỉ thay đổi các bit ít quan trọng nên nó không thay đổi tổng của hai tần số với này. Các số đếm lấy từ giá trị tần số lẻ sẽ đƣợc chuyển sang các tần số tƣơng ứng và ngƣợc lại. Nhƣ vậy tổng số vẫn không thay đổi nên giá trị trung bình số học là nhƣ nhau cho một PoV trong cả ảnh gốc và ảnh sau khi giấu tin. Thực tế này giúp ta lấy đƣợc các phân bố tần số lý thuyết mong muốn từ các mẫu ngẫu nhiên.
Mức độ tƣơng tự của phân phối mẫu quan sát và phân bố tần số lý thuyết mong muốn là một biện pháp của xác suất. Mức độ tƣơng tự đƣợc xác định bằng cách thử nghiệm Chi-square ở ví dụ dƣới. Thí nghiệm này hoạt động trên một ánh xạ các quan sát vào các phân loại khác nhau. Các bƣớc thực hiện nhƣ sau:
1. Chúng ta giả sử rằng có k phân loại và chúng ta có một mẫu ngẫu nghiên các
quan sát. Mỗi quan sát phải rơi vào một và chỉ một loại phân loại. Các phân loại tất cả chỉ là bảng màu. Màu sắc trong đó đƣợc đặt bằng với chỉ số trong các bảng đƣợc sắp xếp. Nếu không có hạn chế tổng quát, chúng ta tập trung vào các giá trị lẻ của PoVs.
30
Tối thiểu tần số lý thuyết mong muốn phải lớn hơn 4. Chúng ta cần thống nhất các phân loại để giữ đƣợc điều kiện này.
2. Các tần số lý thuyết mong muốn trong phân loại i sau khi nhúng một thông điệp giống nhau là:
3. Các tần số xuất hiện đo đƣợc trong mẫu ngẫu nhiên là:
4. Thống kê là:
Với k - 1 độ tự do
5. p là xắc suất của thống kê với điều kiện là các phân phối và bằng nhau.
Nó đƣợc tính bằng cách tổng hợp các hàm mật độ: