Kỹ thuật thủy vân làm thay đổi dữ liệu trong CSDL quan hệ

Một phần của tài liệu Bảo vệ sự toàn vẹn của cơ sở dữ liệu quan hệ bằng kỹ thuật thủy vân (Trang 23 - 31)

CHƯƠNG 1: TỔNG QUAN VỀ KỸ THUẬT THỦY VÂN

1.3. Kỹ thuật thủy vân cho các cơ sở dữ liệu quan hệ

1.3.1. Kỹ thuật thủy vân làm thay đổi dữ liệu trong CSDL quan hệ

Các kỹ thuật thủy vân số thuộc loại này, trong giai đoạn nhúng thủy vân vào các cơ sở dữ liệu quan hệ thì sẽ làm thay đổi dữ liệu và mức độ thay đổi đƣợc tạo ra trong cơ sở dữ liệu là chấp nhận đƣợc và không tạo ra dữ liệu vô nghĩa. Các kỹ thuật thủy vân thuộc loại này có thể đƣợc thực hiện trên các giá trị thuộc tính có những kiểu dữ liệu khác nhau nhƣ kiểu số (numeric), kiểu xâu (string),… tại mức bít hoặc mức ký tự hoặc mức cao hơn (nhƣ là mức thuộc tính hoặc mức bản ghi).

15

1.3.1.1. Kỹ thuật thủy vân dựa trên thuộc tính kiểu dữ liệu số a, Ảnh như là thông tin thủy vân

Wang et al. [8] miêu tả một lƣợc đồ thủy vân số dựa trên ảnh ở đây thay vì ảnh gốc nhúng thủy vân, một ảnh đƣợc chộn dựa trên biến đổi Arnold với hệ số chộn d đƣợc dùng. Vì biến đổi Arnold của một ảnh có tính chu kỳ P, kết quả đƣợc lấy trong giai đoạn trích rút có thể đƣợc khôi phục từ định dạng chộn tới gốc sau đó lặp (P-d). Trong giai đoạn nhúng, ảnh gốc của kích thước NxN đầu tiên đƣợc chuyển vào ảnh chộn khi đó đƣợc biểu diễn bởi một xâu nhị phân bs của độ dài L = NxN. Thứ hai, tất cả các bản ghi trong cơ sở dữ liệu quan hệ đƣợc nhóm vào L nhóm. Giá trị băm đƣợc tính dùng khóa chính của bản ghi, khóa bí mật và thứ tự của ảnh, xác định nhóm trong mỗi bản ghi thuộc. Cuối cùng, bit thứ i của bs là đƣợc nhúng vào vị trí bít đƣợc chọn của giá trị thuộc tính cho các bản ghi đó trong nhóm thứ i mà thỏa mãn tiêu chuẩn riêng nào đó. Giai đoạn dò dùng kỹ thuật theo số đông. Tuy nhiên, bảo mật của lƣợc đồ không chỉ phụ thuộc vào khóa bảo mật mà còn phụ thuộc hệ số trộn d và thứ tự của ảnh N.

Trong nhúng ảnh đƣợc trộn, kỹ thuật thủy vân trong [10] nhúng ảnh gốc bằng cách, đầu tiên chuyển đổi nó thành dãy bít (EMC, Encrypted Mark Code), và sau đó bằng cách cho phép các bước thuật toán giống như trong [8].

Chỉ có hai điểm khác đó là (i) kỹ thuật chèn thủy vân số trong [8] cho rằng thuộc tính phải đƣợc cố định để đánh dấu cho tất cả các bản ghi trong khi đó [10] không nhƣ thế, và (ii) trong khi lựa chọn các vị trí bít, thứ tự của ảnh là không đƣợc xem xét trong [10]. Cuối cùng, sau khi nhúng, [10] kiểm tra khả năng dùng của dữ liệu. Nếu chấp nhận thì thay đổi, ngƣợc lại quay lại.

Lƣợc đồ thủy vân số khác để nhúng ảnh định dạng BMP đã đƣợc trình bày trong [11]. Trong giai đoạn nhúng thủy vân số, ảnh BMP đƣợc phân chia thành hai phần: phần dữ liệu header và phần dữ liệu ảnh. Một phương pháp

16

hiệu chỉnh lỗi của mã BCH (Bose-Chaudhuri-Hocquenhem) là đƣợc sử dụng giải mã phần dữ liệu ảnh trong thủy vân số. Dựa trên giá trị ID của bản ghi đƣợc tính từ hàm băm với tham số khóa chính của bản ghi và dữ liệu header của ảnh BMP, tất cả các bản ghi đƣợc gắn tới các tập con phân biệt k, ở đây k là độ dài của thủy vân. Cuối cùng, mỗi k bít của thủy vân đƣợc sử dụng để đánh dấu mỗi k tập con của các bản ghi. Trong khi đánh dấu, các vị trí bít ít ý nghĩa đƣợc chọn trong các thuộc tính đƣợc chọn của các bản ghi cụ thể thỏa mãn một chuẩn riêng đƣợc thay đổi. Lựa chọn của các vị trí bít phụ thuộc vào hàm HASH hoặc MAC với tham số dữ liệu header của ảnh BMP, khóa chính của bản ghi và tham số khác nhƣ số lƣợng các bít ít ý nghĩa trong giá trị thuộc tính. Qua quan sát thấy rằng các vị trí bít đƣợc lựa chọn không là một tập các bít thủy vân trực tiếp, tập các bít mặt nạ đƣợc tính toán từ hai giá trị hàm băm và bít thủy vân.

Lược đồ thủy vân vỡ dựa trên ảnh trong [12] hướng tới duy trì tính toàn vẹn của cơ sở dữ liệu và dùng hồi qui vector hỗ trợ (SVR) để huấn luyện các thuộc tính tương quan cao để tạo ra hàm dự đoán SVR cho thủy vân nhúng vào các thuộc tính số. Lƣợc đồ này bao gồm ba giai đoạn: (i) Giai đoạn huấn luyện: Lựa chọn các bản ghi huấn luyện và lấy hàm dự đoán SVR đƣợc huấn luyện; (ii) Giai đoạn nhúng thủy vân: Tất cả các bản ghi trong cơ sở dữ liệu quan hệ là đƣợc sử dụng để nhúng thủy vân ảnh ở đây số lƣợng các bít thủy vân đƣợc thiết kế bằng số lƣợng các bản ghi. Mỗi giá trị thuộc tính số Ci của bản ghi ti thứ i dƣợc dự đoán dùng hàm dự đoán SVR kết quả là Cif(ti). Dựa trên bít thủy vân bi thứ i (đƣợc lấy sau khi chuyển đổi ảnh vào luồng bít), giá trị của Ci đƣợc thay đổi bằng cách Ci 1 hoặcCi 1; (iii) Dò giả mạo:

Hàm dự đoán SVR đƣợc huấn luyện đƣợc sử dụng để sinh giá trị đƣợc dự đoán cho mỗi bản ghi và đƣợc so sánh với giá trị đƣợc lấy ra trong cơ sở dữ liệu. Sự khác nhau giữa hai giá trị đó xác định thông tin thủy vân và có thể

17

đảm bảo cơ sở dữ liệu đƣợc giả mạo hay không giả mạo. Tuy nhiên, hạn chế của lƣợc đồ này đó là nó có thể xác định sự thay đổi chỉ xảy ra trong tập thuộc tính đối tượng. Lược đồ này làm việc tốt trong trường hợp các bản ghi trong bảng dữ liệu là độc lập nhưng có sự tương quan cao giữa các thuộc tính.

b. Ngôn ngữ như là thông tin thủy vân

Wang et al. [13] đề xuất dùng ngôn ngữ của người sở hữu để sinh thủy vân duy nhất. Thủy vân từ ngôn ngữ bao gồm các bước sau: Nén dữ liệu ngôn ngữ để đƣa vào thủy vân, cải thiện dữ liệu ngôn ngữ để loại bỏ nhiễu trong miền tần số, chuyển đổi dữ liệu ngôn ngữ vào luồng bít và cuối cùng tạo ra thủy vân bằng cách dùng thông điệp bản quyền của người sở hữu và kết quả đƣợc chuyển dữ liệu ngôn ngữ. Nhúng thủy vân đƣợc thực hiện ở mức bít bằng cách cho phép các bước thuật toán giống như trong kỹ thuật dựa trên ảnh của [14].

c. Thông tin thủy vân dựa trên thuật toán di truyền

Các tác giả trong [13] đề xuất kỹ thuật dựa trên thuật toán di truyền để tạo ra thông tin thủy vân, tập trung trên vấn đề tối ưu. Họ đưa ra các bước thuật toán giống nhƣ trong [10].

d. Các đặc tính nội dung như là thông tin thủy vân

Các lƣợc đồ thủy vân trong [14], [15] là đƣợc thực hiện dựa trên nội dung của chính cơ sở dữ liệu.

Trong [14], giai đoạn nhúng thủy vân trích rút vài bít, đƣợc gọi là đặc tính cục bộ, từ đặc tính của thuộc tính A1 của bản ghi t và nhúng các bít đó vào trong thuộc tính thủy vân A2 của bản ghi giống nhau. Lựa chọn các bản ghi phụ thuộc vào giá trị ngẫu nhiên đƣợc sinh (giữa 0 và 1) là nhỏ hơn sự cân đối đƣợc nhúng  của các cơ sở dữ liệu quan hệ và yêu cầu not Null của giá trị thuộc tính đặc tính. Trong giai đoạn dò thủy vân, bằng cách cho phép thủ

18

tục tương tự, đặc tính cục bộ của thuộc tính đặc tính được trích rút và được so sánh chống lại các bít cuối cùng của thuộc tính thủy vân.

Trong [15], các tác giả đƣa ra một lƣợc đồ thủy vân vỡ có thể xác thực tính toán vẹn của cơ sở dữ liệu quan hệ. Trong lƣợc đồ đƣa ra, tất cả các bản ghi trong cơ sở dữ liệu quan hệ đầu tiên là đƣợc phân chia bảo mật thành các nhóm và đƣợc sắp xếp. Trong mỗi nhóm, có hai loại thủy vân đƣợc nhúng:

thủy vân thuộc tính W1 bao gồm  thủy vân độ dài  và thủy vân bản ghi W2

bao gồm  thủy vân độ dài  , ở đây  và  là số lƣợng các thuộc tính trong một bản ghi và số lượng trung bình của các bản ghi trong mỗi nhóm tương ứng. W1 và W2 đƣợc tạo bằng cách trích rút dãy bít từ giá trị hàm băm. Đối với thủy vân thuộc tính W1, giá trị hàm băm đƣợc tạo liên quan tới mã xác thực thông điệp và cùng thuộc tính của tất cả các bản ghi trong các cùng nhóm, trong khi đối với thủy vân bản ghi W2, nó đƣợc hình thành từ cùng mã xác thực thông điệp và tất cả các thuộc tính của cùng bản ghi. Qua quan sát thấy rằng, trong giai đoạn nhúng và dò thủy vân, chúng bỏ các bít ít ý nghĩa của tất cả các thuộc tính của kiểu số ngoại trừ khóa chính khi tính các giá trị hàm băm. Thủy vân thuộc tính đƣợc nhúng ở mức LSB, trong khi đó thủy vân bản ghi đƣợc nhúng tại mức kế tiếp LSB. Theo cách này, các thủy vân đƣợc nhúng thực sự hình thành một lưới thủy vân giúp để dò, định vị và xác định rõ sự thay đổi.

e. Mô hình đám mây như là thông tin thủy vân

Lƣợc đồ thủy vân đám mây trong [16] đƣợc dựa trên mô hình đám mây với ba đặc tính: Giá trị kỳ vọng (Ex), Entropy (En) và Hyper Entropy (He).

Trong giai đoạn tạo thủy vân, nó dùng thuật toán sinh đám mây phía trước để sinh các giọt mây từ đám mây và các giọt đám mây đó đƣợc nhúng vào trong các cơ sở dữ liệu nhƣ là thủy vân, trong khi đó thuật toán dò thủy vân dùng

19

thuật toán sinh đám mây phía sau để trích rút đám mây với các tham số Ex, En và He từ các giọt đám mây đƣợc nhúng, và cuối cùng, một thuật toán đám mây tương tự được sử dụng để xác thực các đám mây tương tự nhau hay không tương tự nhau. Lược đồ này không rõ ràng vì vậy nó yêu cầu cơ sở dữ liệu quan hệ gốc trong giai đoạn xác thực.

1.3.1.2. Kỹ thuật thủy vân dựa trên thuộc tính kiểu dữ liệu phân loại Không giống nhƣ các lƣợc đồ thủy vân đƣợc trình bày ở trên nhúng trên thuộc tính số, lƣợc đồ bảo vệ bản quyền trong [17], [18] là dựa trên kiểu dữ liệu phân loại. Quá trình nhúng thủy vân bắt đầu với một bảng dữ liệu với tối thiểu một thuộc tính kiểu phân loại A (đƣợc thủy vân số), một thủy vấn số wm và một tập các khóa bí mật (k1, k2) và các tham số khác (e xác định phần trăm của các bản ghi để đánh dấu). Dùng khóa chính K và khóa bí mật k1 và tham số e, nó đƣa ra một tập các bản ghi “đầy”, đƣợc dùng để mã hóa đánh dấu.

Quá trình lựa chọn bản ghi “đầy” là giống thuật toán AHK. Giả sử cơ sở dữ liệu có  bản ghi, khi đó tập các bản ghi đầy chứa khoảng  e bằng cách triển khai mã điều chỉnh lỗi (ECC). Thuật toán đánh dấu sinh một giá trị bí mật của số lƣợng bít đƣợc yêu cầu để biểu diễn tất cả các giá trị phân loại có thể cho thuộc tính A phụ thuộc khóa chính và k1, và khi đó, bít ít ý nghĩa của nó gán một giá trị liên quan tới một vị trí tương ứng (ngẫu nhiên, phụ thuộc khóa chính và k2) trong dữ liệu wm_data. Dãy ngẫu nhiên của hàm băm

T(k),k2

H i bảo đảm, trên trung bình, một lƣợng lớn các bít chính trong dữ liệu wm_data sẽ đƣợc nhúng tại vị trí bít ý nghĩa của nó. Dùng hai khóa khác nhau k1k2 đảm bảo không có tương quan giữa các bản ghi được lựa chọn cho nhúng (được lựa chọn bởi k1) và các vị trí giá trị bít tương ứng trong wm_data (đƣợc lựa chọn bởi k2). Họ cũng đề nghị thực hiện nhúng dựa trên các thuộc tính đa phân loại bằng cách không chỉ xem xét sự kết hợp giữa khóa chính và thuộc tính phân loại A nhƣng tất cả đƣợc kết hợp giữa khóa chính và

20

các thuộc tính phân loại để tăng độ bền vững của lƣợc đồ. Mặc dù lƣợc đồ này là bền vững để chống lại các loại tấn công (các tấn công ngẫu nhiên), tuy nhiên, lƣợc đồ không phù hợp cho các cơ sở dữ liệu quan hệ mà cần cập nhật nhiều, vì nó rất đắt để nhúng thủy vân vào các cơ sở dữ liệu quan hệ đƣợc cập nhật. Mặc dù chỉ một phần nhỏ của các bản ghi được chọn bị ảnh hưởng bởi nhúng thủy vân, các thay đổi của các thuộc tính phân loại (thay đổi từ “red”

tới “blue”) trong các ứng dụng có thể quá ý nghĩa để có thể chấp nhận. Kỹ thuật thủy vân này đƣợc áp dụng để xử lý dữ liệu y học trong kiểu cấu trúc phân tầng [Bertino et al., 2005].

1.3.1.3. Kỹ thuật thủy vân dựa trên các thuộc tính đa từ không số

Ali và Ashraf [18] đề xuất một lƣợc đồ thủy vân dựa trên ảnh nhị phân ẩn trong các không gian của các thuộc tính đa từ không số của các tập con của các bản ghi, thay vì thuộc tính số tại mức bít. Kỹ thuật này phân chia vào m xâu, mỗi xâu chứa n bít. Nói theo cách khác, cơ sở dữ liệu cũng đƣợc phân chia thành các tập con không giao nhau, mỗi tập chứa m bản ghi, m xâu ngắn của ảnh thủy vân đƣợc nhúng vào mỗi tập con m bản ghi. Nhúng đƣợc thực hiện nhƣ sau: giả sử biểu diễn số nguyên của xâu ngắn thứ idi. Một không gian thực được tạo ra sau di từ của không số được lựa chọn trước, thuộc tính đa từ của bản ghi thứ i trong tập con. Giai đoạn trích rút đếm số lƣợng các không gian đơn xuất hiện trước khi hai không gian chỉ ra ước lượng số thực của xâu nhị phân ngắn đƣợc nhúng. Do vậy thuật toán đƣợc đề xuất nhúng thủy vân giống nhau cho tất cả các tập con không giao nhau của cơ sở dữ liệu, nó chống lại xóa tập con, thêm tập con, thay đổi tập con và tấn công lựa chọn tập con. Ƣu điểm khác cho thủy vân dựa trên không gian đó là tồn tại dung lƣợng bít lớn cho ẩn thủy vân có thể nhúng thuận tiện của các thủy vân nhỏ.

Tuy nhiên, nó có thể chịu tổn thất từ tấn công di chuyển thủy vân nếu Mallory

21

thay thế tất cả các không gian đôi giữa hai từ (nếu tồn tại) bằng cách không gian đơn cho tất cả các bản ghi trong cơ sở dữ liệu quan hệ.

1.3.1.4. Kỹ thuật thủy vân dựa trên thêm bản ghi hoặc thêm thuộc tính a. Các bản ghi giả mạo như là thông tin thủy vân

Kỹ thuật này trong [19] hướng tới tạo các bản ghi giả và chèn chúng vào trong cơ sở dữ liệu. Thuật toán tạo bản ghi giả chọn cẩn thận các thuộc tính khóa ứng viên và mức nhạy của các thuộc tính không phải ứng viên. Ông đã dùng xác suất mẫu Bernoulli pi cho thuộc tính không ứng viên Ai thứ i để quyết định giá trị giả mạo của nó có thể dƣợc lựa chọn không đồng nhất hoặc nhƣ là giá trị với tần xuất xảy ra cao trong tập các giá trị tồn tại của Ai trong cơ sở dữ liệu quan hệ. Không giống nhƣ các thuật toán khác, thuật toán dò thủy vân này không là thuật toán ngƣợc với thuật toán sinh thủy vân và thuật toán chèn là theo xác suất trong tự nhiên. Thuật toán dò thủy vân kiểm tra xem các bản ghi giả mạo đƣợc thêm trong giai đoạn chèn thủy vân, tồn tại hoặc đã đƣợc thay đổi. Nó kiểm tra nó thông qua khóa chính. Khi nó tìm thấy một cái phù hợp, dò đã thành công. Dò sẽ thất bại cho cơ sở dữ liệu đƣợc nhúng thủy vân khi tất cả các bản ghi giả mạo đƣợc xóa bằng cách xóa biến . Số lƣợng các bản ghi giả mạo đƣợc chèn là đƣợc quyết định bởi chính cơ sở dữ liệu. Tuy nhiên, giai đoạn chèn thủy vân phải đƣợc xem xét nhƣ là thực tế mà các giá trị của các bản ghi giả mạo đánh dấu sẽ không làm ảnh hưởng đến chất lƣợng dữ liệu trong cơ sở dữ liệu và sẽ không tác động vào các kết quả truy vấn. Một ƣu điểm của lƣợc đồ này đó là quyền sở hữu có thể đƣợc xác định công khai hơn các lƣợc đồ khác cho tới khi tất cả các bản ghi giả mạo đƣợc hiển thị và lƣợc đồ thực hiện không chịu sự tác động từ cập nhật lớn.

b. Thuộc tính ảo như là thông tin thủy vân

Thay vì các bản ghi giả mạo đƣợc thêm, tác giả trong [20] đƣợc đề xuất kỹ thuật thủy vân khác bằng cách thêm một thuộc tính ảo trong cơ sở dữ liệu quan hệ sẽ đƣợc sử dụng nhƣ là tổng kiểm tra ngang hàng chứa thủy vân của tất cả các

Một phần của tài liệu Bảo vệ sự toàn vẹn của cơ sở dữ liệu quan hệ bằng kỹ thuật thủy vân (Trang 23 - 31)

Tải bản đầy đủ (PDF)

(58 trang)