Phát triển lược đồ thủy vân dựa vào bit ý nghĩa nhất (MSB)

Một phần của tài liệu Luận án tiến sĩ toán học KỸ THUẬT THỦY VÂN CƠ SỞ DỮ LIỆU QUAN HỆ (Trang 50 - 52)

Có một số kỹ thuật thủy vân được phát triển để bảo vệ bản quyền các cơ sở dữ liệu quan hệ [7], [44]. Có một điểm chung của các kỹ thuật này là chúng đều dựa vào một khóa thủy vân trong thuật toán nhúng thủy vân và phát hiện thủy vân. Nhờ vào khóa này, chủ sở hữu chứng minh chủ quyền của mình đối với sản phẩm.

Một điểm chung nữa là quá trình thủy vân có thể làm dữ liệu bị sai lệch. Trong đó, có một số kỹ thuật thay đổi các giá trị thuộc tính [7], [41] và một số kỹ thuật khác lại hoán vị các giá trị thuộc tính [15], [18]. Những sai lệch này chỉ được

60 65 70 75 80 85 90 95 100 0 5 10 15 20 25 30 35 40 45 50 α (%) Tỷ lệ thay đổi bộ (%) ảnh IOIT ảnh Smiley

thực hiện trong giới hạn cho phép sao cho giá trị sử dụng của dữ liệu đối với các ứng dụng nhất định không bị ảnh hưởng và thủy vân vẫn có thể tìm lại được ngay cả khi có những tấn công làm thay đổi giá trị thuộc tính hay thêm hoặc xóa một số bộ.

Hai đặc điểm nêu trên có thể ảnh hưởng tới khả năng ứng dụng của các kỹ thuật thủy vân cơ sở dữ liệu quan hệ. Thứ nhất, cách tiếp cận dựa vào khóa thủy vân là không phù hợp cho việc chứng minh trước công chúng (ví dụ trước tòa án). Để chứng minh bản quyền của dữ liệu đáng ngờ, người chủ sở hữu phải tiết lộ khóa thủy vân của mình ra công chúng để phát hiện thủy vân. Sau khi đã sử dụng một lần, khóa này không còn bí mật nữa.

Với khóa này, một người sử dụng không bản quyền có thể vô hiệu hóa việc phát hiện thủy vân gốc bằng cách gỡ bỏ thủy vân gốc khỏi dữ liệu được bảo vệ hoặc thêm một thủy vân giả vào dữ liệu không được thủy vân.

Thứ hai là, những sai lệch được đưa vào trong quá trình thủy vân có thể ảnh hưởng đến giá trị sử dụng của dữ liệu. Ngay cả khi có thể ấn định một số kiểu ràng buộc nhất định để hạn chế sai sót (ví dụ như các giá trị trung bình và các phương sai của những thuộc tính được thủy vân) trước hoặc trong khi thủy vân thì cũng rất khó, thậm chí không thể đảm bảo có thể lượng hóa được tất cả các ràng buộc.

Trong bài báo [34], các tác giả đã đưa ra một lược đồ thủy vân cơ sở dữ liệu được sử dụng để bảo vệ bản quyền bằng cách kiểm chứng công khai và không đưa vào bất kỳ một sự sai lệch nào đối với dữ liệu. Lược đồ thủy vân này được áp dụng cho các cơ sở dữ liệu quan hệ có dữ liệu kiểu số và mọi thay đổi trên bit MSB của giá trị các thuộc tính là không chấp nhận được. Ý tưởng của kỹ thuật này là xuất phát từ cơ sở dữ liệu quan hệ cần bảo vệ, sinh ra một quan hệ thủy vân có cùng khóa chính, còn các giá trị của các thuộc tính khác là bit ý nghĩa nhất (MSB - Most Significat Bit) của giá trị thuộc tính tương ứng của quan hệ gốc. Sau đó, hai quan hệ này sẽ được đăng ký với một tổ chức có chức năng bảo hộ bản quyền sản phẩm.

Lược đồ thủy vân đề xuất chỉ áp dụng đối với cơ sở dữ liệu quan hệ có dữ liệu kiểu số. Dựa vào lược đồ thủy vân của Y. Li và R. H. Deng [34] luận án đưa ra lược đồ thủy vân cải tiến, lược đồ thủy vân này không có một ràng buộc nào về các kiểu dữ liệu của thuộc tính được sử dụng để thuỷ vân.

Trong các mục sau, luận án sẽ trình bày lược đồ thủy vân cải tiến với cách lấy các bit MSB của các kiểu dữ liệu. Quá trình chứng minh bản quyền công khai khi có tranh chấp bằng bản chứng thực được thực hiện hoàn toàn giống như lược đồ đề xuất [34]. Phân tích về độ bền vững của lược đồ cải tiến và việc cân đối giữa tính bền vững và các chi phí cho việc thực hiện lược đồ. Cuối cùng, tiến hành thử nghiệm và đánh giá các kết quả thu được.

Cho r là một quan hệ thuộc lược đồ R(P, A1,..., A), trong đó P là thuộc tính khóa chính; A1 ,..., A là các thuộc tính đều có thể được chọn để thuỷ vân. Gọi là

số các bộ trong quan hệ r. Với mỗi thuộc tính của một bộ sẽ được biểu diễn dưới

dạng nhị phân chuẩn, bit MSB của nó có thể được sử dụng để làm thuỷ vân. Giả sử là mọi thay đổi thực hiện trên bit MSB của giá trị thuộc tính sẽ dẫn đến một sai sót không thể chấp nhận được đối với giá trị sử dụng của dữ liệu.

Các thuộc tính để thủy vân có thể nhận bất kỳ một kiểu dữ liệu nào. Lược đồ thủy vân cải tiến sẽ xét đến bốn kiểu dữ liệu thường dùng đó là: kiểu số, kiểu ký tự, kiểu Boolean và kiểu datetime. Các thuộc tính đều được thể hiện dưới dạng các xâu bit trong hệ thống máy tính.

Một phần của tài liệu Luận án tiến sĩ toán học KỸ THUẬT THỦY VÂN CƠ SỞ DỮ LIỆU QUAN HỆ (Trang 50 - 52)