Đổi chỗ (Swapping)

Một phần của tài liệu Ứng dụng lý thuyết giàn giao trong khai thác dữ liệu (Trang 39)

Là việc đổi chỗ các giá trị giữa các mẫu tin với nhau trong cơ sở dữ liệu. Phương pháp này được giới thiệu đầu tiên vào năm 1980.

Ví dụ:

Bảng 1.1. Giấu dữ liệu bằng phương pháp đổi chỗ

 Tuổi Thu nhập  Tuổi Thu nhập  Tuổi Thu nhập 1 21 20000 1 21 15000 1 24 15000 2 24 30000 2 24 30000 2 21 30000 3 35 30000 3 35 30000 3 36 30000 4 36 25000 4 36 55000 4 35 55000 5 45 55000 5 45 25000 5 50 25000 6 50 15000 6 50 20000 6 45 20000 (a) (b) (c)

a) Dữ liệu nguyên thủy.

b) Dữ liệu sau khi đổi chỗ ngẫu nhiên trên trường Thu nhập, xảy ra trên các cặp mẫu tin 1 và 6, 2 và 3, 4 và 5.

c) Dữ liệu sau khi đổi chỗ ngẫu nhiên trên trường Tuổi, xảy ra trên các cặp mẫu tin 1 và 2, 3 và 4, 5 và 6.

Một số nhận xét:

- Xác suất một lần đổi chỗ giấu được thông tin của một mẫu tin tỉ lệ nghịch với tần suất giá trị đó xuất hiện trên mẫu tin. Điều này có thể chấp nhận được trên dữ liệu có kích thước lớn. Một giá trị thu nhập xuất hiện thường xuyên trên file sẽ khó xác định là ứng với giá trị của mẫu tin nào so với một giá trị thu nhập xuất hiện trên file với tần suất thấp.

- Việc đổi chỗ ngẫu nhiên trên các trường khác nhau có thể xảy ra trên các mẫu tin khác nhau.

- Các lần đổi chỗ diễn ra một cách độc lập, trên các trường khác nhau và có thể giấu được thông tin chính xác của từng mẫu tin.

- Theo khuyến cáo, nên thực hiện đổi chỗ trên các trường nhạy cảm, ví dụ như Thu nhập, Tuổi,…

Một phần của tài liệu Ứng dụng lý thuyết giàn giao trong khai thác dữ liệu (Trang 39)