Trong mục này trình bày các kỹ thuật sử dụng trong các lược đồ thủy vân để bảo vệ bản quyền cơ sở dữ liệu quan hệ bao gồm: Kỹ thuật thuỷ vân sử dụng các bit ít ý nghĩa nhất (LSB); Kỹ thuật thuỷ vân sử dụng các bit ý nghĩa nhất (MSB); Kỹ thuật thủy vân dựa vào các phép hoán vị; Thủy vân dựa vào việc chèn thêm ảnh nhị phân.
a. Thủy vân dựa trên các bit ít ý nghĩa nhất (LSB)
Các lược đồ thủy vân dựa trên các bit ít ý nghĩa nhất (LSB - Least Significant Bit) đề xuất trong các bài báo [7], [8], [9] sau đó được các tác giả phát triển thêm [21], [32], [55]. Lược đồ thủy vân áp dụng cho cơ sở dữ liệu quan hệ có dữ liệu kiểu số. Tư tưởng chính của kỹ thuật này là sử dụng các bit ít ý nghĩa nhất (LSB) để thủy vân cho cơ sở dữ liệu quan hệ chứa các thuộc tính kiểu số chấp nhận được những thay đổi nhỏ mà không làm ảnh hưởng tới ý nghĩa của dữ liệu. Kỹ thuật này sử dụng các bit ít ý nghĩa nhất của các bộ trong cơ sở dữ liệu quan hệ để xây dựng ra thủy vân nhúng cho toàn bộ cơ sở dữ liệu. Đồng thời, sử dụng mức ý nghĩa để phát hiện thủy vân đã được nhúng vào trong cơ sở dữ liệu.
Ưu điểm của kỹ thuật này là:
- Kỹ thuật tương đối đơn giản và áp dụng được cho các cơ sở dữ liệu chứa các thuộc tính kiểu số chấp nhận thay đổi nhỏ.
- Là một trong những kỹ thuật đầu tiên cho việc bảo vệ bản quyền cơ sở dữ liệu quan hệ.
- Khả năng phát hiện mù và chi phí thấp khi xác minh quyền sở hữu các dữ liệu.
Nhược điểm của kỹ thuật này là:
- Nếu giá trị dữ liệu nhận giá trị null (rỗng) nhưng vẫn thủy vân.
- Miền ứng dụng hẹp (chỉ áp dụng cho cơ sở dữ liệu có chứa các thuộc tính kiểu số).
- Cơ sở dữ liệu bị sửa đổi không còn là dữ liệu gốc ban đầu. - Việc xác định mức ý nghĩa của phép thử phức tạp.
Do đó, đối với lược đồ thủy vân này cần có những cải tiến về kỹ thuật thủy vân để khắc phục các nhược điểm đã nêu trên.
b. Thủy vân dựa vào bit ý nghĩa nhất (MSB)
Lược đồ thủy vân dựa vào bit ý nghĩa nhất (MSB - Most Significant Bit) được đề xuất bởi Li, Y. và Deng, R. H [34]. Lược đồ thủy vân áp dụng cho cơ sở dữ liệu quan hệ có dữ liệu kiểu số. Ý tưởng của kỹ thuật này là xây dựng một quan hệ mới
rw là một bản sao của quan hệ gốc r có cùng các thuộc tính. Trong đó, thuộc tính khóa chính của quan hệ rw trùng với thuộc tính khóa chính của quan hệ r và các
thuộc tính còn lại chỉ chứa các giá trị 0 hoặc 1 là bit MSB của giá trị các thuộc tính
trong quan hệ r. Quan hệ rw được xây dựng dựa trên các bit ý nghĩa nhất của quan
hệ gốc r.
Quá trình nhúng sử dụng khóa thủy vân cùng với quan hệ gốc r nhằm sinh ra một quan hệ tương ứng rw chỉ chứa các giá trị 0 hoặc 1 như nói ở trên. Sau quá
trình nhúng thủy vân, quan hệ rw, khóa thủy vân và mức ý nghĩa sẽ được đăng kí quyền sở hữu bởi một bên thứ ba có thẩm quyền.
Khi có nghi ngờ cơ sở dữ liệu bị sao chép, các dữ liệu được đăng kí sẽ được sử dụng để chứng minh bản quyền cơ sở dữ liệu.
Ưu điểm của kỹ thuật này là:
- Thủy vân sử dụng bit MSB để ngăn cản các cuộc tấn công sửa đổi dữ liệu.
Khi khóa thủy vân K, thủy vân W và thuật toán được công khai, ai cũng có thể xác
định được vị trí của những MSB.
- Bất kỳ sửa đổi MSB nào trong dữ liệu có thể dễ dàng bị phát hiện trong giai đoạn kiểm tra.
- Không làm thay đổi giá trị của dữ liệu.
- Được sử dụng để bảo vệ bản quyền công khai.
Nhược điểm của kỹ thuật này là:
- Việc thay đổi của các bit khác MSB trong dữ liệu có thể không được phát hiện.
- Miền ứng dụng hẹp do chỉ áp dụng cho các cơ sở dữ liệu quan hệ với thuộc tính có kiểu dữ liệu số.
- Việc đăng kí quyền sở hữu tốn kém. - Việc xác định mức ý nghĩa phức tạp.
c. Thủy vân dựa vào các phép hoán vị
Để giải quyết bài toán thủy vân cơ sở dữ liệu quan hệ khi những thay đổi trong các thuộc tính có thể gây ra phiền phức, các tác giả Ersin Uzun và Bryan Stephenson [18] đã phát triển một kỹ thuật thủy vân đơn giản nhưng hiệu quả dựa vào việc hoán vị giá trị các thuộc tính. Ý tưởng của kỹ thuật này là hoán đổi vị trí giá trị của một số thuộc tính trong một vài bộ của cơ sở dữ liệu với nhau thỏa mãn một khoảng cách được xây dựng. Sử dụng số lượng các giá trị bị hoán đổi để kiểm
soát sự sai khác của cơ sở dữ liệu nằm trong một giới hạn mà cơ sở dữ liệu có thể chấp nhận được.
Ưu điểm của kỹ thuật này là:
- Có thể áp dụng cho nhiều loại dữ liệu nhưng sử dụng tốt nhất cho dữ liệu kiểu số.
- Kỹ thuật này là cải tiến một số nhược điểm của hai kỹ thuật LSB và MSB. - Không làm thay đổi giá trị của dữ liệu.
Nhược điểm của kỹ thuật này là:
- Cơ sở dữ liệu vẫn bị sửa đổi tuy chỉ ở một số lượng bộ nhất định và được kiểm soát bởi khoảng cách;
- Chưa xây dựng được hàm khoảng cách;
- Việc cân đối giữa khả năng nhận nhầm và đoán sai phụ thuộc vào mức ý nghĩa và tỉ lệ hoán vị khó xác định.
Đây là một hướng có thể phát triển tiếp để khắc phục nhược điểm của kỹ thuật này.
d. Thủy vân dựa vào việc chèn thêm ảnh nhị phân
Trong [10], [37] các tác giả đã đưa ra một lược đồ thủy vân cơ sở dữ liệu quan hệ để bảo vệ bản quyền bằng cách chèn thêm một bức ảnh nhị phân vào thuộc tính văn bản chứa nhiều từ.
Ý tưởng chính của kỹ thuật này [10] xuất phát từ việc nhúng bức ảnh nhị phân đó vào một thuộc tính kiểu văn bản có chứa nhiều từ. Các điểm ảnh của ảnh nhị
phân sẽ được phân đoạn thành M xâu nhị phân ngắn có độ dài N. Các xâu nhị phân
này sẽ được đổi sang dạng thập phân để nhúng vào thuộc tính kiểu văn bản có chứa nhiều từ của các bộ đã được chọn của quan hệ. Các từ trong các thuộc tính kiểu văn bản được viết cách nhau đúng một dấu cách. Việc nhúng thủy vân được
thực hiện rất đơn giản. Giả sử giá trị thập phân của xâu nhị phân thứ j là dj thì để thủy vân giá trị này vào thuộc tính văn bản, chỉ việc thêm một dấu cách vào sau từ
thứ dj+1 của xâu văn bản này, các khoảng cách còn lại của xâu vẫn giữ nguyên. Để làm được điều đó cần phải chọn ảnh nhị phân phù hợp với các quan hệ cần thủy vân. Thuật toán sẽ nhúng thủy vân vào từng nhóm, với cách chia đơn giản mỗi
Ưu điểm của kỹ thuật này là:
- Dùng để bảo vệ bản quyền cơ sở dữ liệu có dữ liệu kiểu văn bản. - Quan hệ sau nhúng không ảnh hưởng đến giá trị sử dụng của dữ liệu.
Nhược điểm của kỹ thuật này là:
- Cách chia nhóm tuần tự không phụ thuộc vào bất kỳ một tham số nào nên một kẻ tấn công có thể dễ dàng phát hiện ra các nhóm và phát hiện ra ảnh đã nhúng.
- Kích thước của ảnh nhị phân nhỏ.
- Đòi hỏi thuộc tính văn bản chứa nhiều từ phải chứa rất nhiều từ.