Không giống như các lược đồ thủy vân được trình bày ở trên nhúng trên thuộc tính số, lược đồ bảo vệ bản quyền trong [17], [18] là dựa ttên kiểu dữ liệu phân loại. Quá trình nhúng thủy vân bắt đầu với một bảng dữ liệu với tối
thiểu một thuộc tính kiểu phân loại Ả (được thủy vân số), một thủy vấn số W M
và một tập các khóa bí mật Ị K I, K2) và các tham số khác (E xác định phàn
trăm của các bản ghi để đánh dấu). Dùng khóa chính К và khóa bí mật K J và
tham số E, nó đưa ra một tập các bản ghi “đầy”, được dùng để mã hóa đánh
dấu. Quá trình lựa chọn bản ghi “đầy” là giống thuật toán AHK. Giả sử cơ sở
dữ liệu có Î] bản ghi, khi đó tập các bản ghi đày chứa khoảng Î J/Е bằng cách
triển khai mã điều chỉnh lỗi (ECC). Thuật toán đánh dấu sinh một giá trị bí mật của số lượng bít được yêu cầu để biểu diễn tất cả các giá trị phân loại có thể
cho thuộc tính A phụ thuộc khóa chính và K I, và khi đó, bít ít ý nghĩa của nó
gán một giá ttị liên quan tới một vị trí tương ứng (ngẫu nhiên, phụ thuộc khóa
chính và K2) trong dữ liệu W M_D A T A. Dãy ngẫu nhiên của hàm băm
Н(Т{(К),К2) bảo đảm, ữên trung bình, một lượng lớn các bít chính ữong dữ
liệu W M_D A T A sẽ được nhúng tại vị trí bít ý nghĩa của nó. Dùng hai khóa khác
nhau К] và K2 đảm bảo không có tương quan giữa các bản ghi được lựa chọn
cho nhúng (được lựa chọn bởi K Ỉ) và các vị trí giá trị bít tương ứng trong
W M_D A T A (được lựa chọn bởi fc2)- Họ cũng đề nghị thực hiện nhúng dựa ữên
các thuộc tính đa phân loại bằng cách không chỉ xem xét sự kết họp giữa khóa
chính và thuộc tính phân loại A nhưng tất cả được kết họp giữa khóa chính và
các thuộc tính phân loại để tăng độ bền vững của lược đồ. Mặc dù lược đồ này là bền vững để chống lại các loại tấn công (các tấn công ngẫu nhiên), tuy nhiên, lược đồ không phù họp cho các cơ sở dữ liệu quan hệ mà càn cập nhật nhiều, vì nó rất đắt để nhúng thủy vân vào các cơ sở dữ liệu quan hệ được cập nhật. Mặc dù chỉ một phần nhỏ của các bản ghi được chọn bị ảnh hưởng bỏi nhúng thủy vân, các thay đổi của các thuộc tính phân loại (thay đổi từ “red” tới “blue”) ừong các ứng dụng có thể quá ý nghĩa để có thể chấp nhận. Kỹ thuật thủy vân này được áp dụng để xử lý dữ liệu y học trong kiểu cấu trúc phân tầng [Bertino et al., 2005].
I.3.I.3. Kỹ thuật thủy vân dựa trên các thuộc tính đa từ không số
Ali và Ashraf [18] đề xuất một lược đồ thủy vân dựa trên ảnh nhị phân ẩn trong các không gian của các thuộc tính đa từ không số của các tập con của các bản ghi, thay YÌ thuộc tính số tại mức bít. Kỹ thuật này phân chia vào m
xâu, mỗi xâu chứa N bít. Nói theo cách khác, cơ sở dữ liệu cũng được phân
chia thành các tập con không giao nhau, mỗi tập chứa M bản ghi, M xâu ngắn
của ảnh thủy vân được nhúng vào mỗi tập con M bản ghi. Nhúng được thực
hiện như sau: giả sử biểu diễn số nguyên của xâu ngắn thứ Ỉ là D Ị. Một không
gian thực được tạo ra sau D Ị từ của không số được lựa chọn trước, thuộc tính
đa từ của bản ghi thứ Ỉ trong tập con. Giai đoạn trích rút đếm số lượng các
không gian đơn xuất hiện trước khi hai không gian chỉ ra ước lượng số thực của xâu nhị phân ngắn được nhúng. Do vậy thuật toán được đề xuất nhúng thủy vân giống nhau cho tất cả các tập con không giao nhau của cơ sở dữ liệu, nó chống lại xóa tập con, thêm tập con, thay đổi tập con và tấn công lựa chọn tập con. Ưu điểm khác cho thủy vân dựa ừên không gian đó là tồn tại dung lượng bít lớn cho ẩn thủy vân có thể nhúng thuận tiện của các thủy vân nhỏ. Tuy nhiên, nó có thể chịu tổn thất từ tấn công di chuyển thủy vân nếu Mallory thay
thế tất cả các không gian đôi giữa hai từ (nếu tồn tại) bằng cách không gian đơn cho tất cả các bản ghi trong cơ sở dữ liệu quan hệ.