1. Trang chủ
  2. » Trung học cơ sở - phổ thông

Thủy văn cơ sở dữ liệu quan hệ

5 15 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Nội dung

Trong báo cáo này, chúng tôi trình bày một kết quả nghiên cứu về kỹ thuật thủy vân sử dụng các bit ít ý nghĩa nhất (LSB) của một số giá trị thuộc tính và tiến hành thử nghiệm, đá[r]

(1)

52(4): 56 - 59 Tạp chí KHOA HỌC & CÔNG NGHỆ

4 - 2009

1

THỦY VÂN CƠ SỞ DỮ LIỆU QUAN HỆ

Bùi Thế Hồng, Nguyễn Thị Thu Hằng (Viện Cơng nghệ Thơng tin) Lưu Thị Bích Hương (Đại học Sư Phạm Hà Nội 2)

Tóm tắt

Trong báo cáo này, chúng tơi trình bày kết nghiên cứu kỹ thuật thủy vân hiệu sử dụng bit ý nghĩa (LSB) số giá trị thuộc tính tiến hành thử nghiệm, đánh giá thuật toán cài đặt số phép tốn cập nhật cơng thơng thường sở liệu Các kết thử nghiệm cho thấy, thuật toán thủy vân sở liệu dựa vào LSB bền vững công thêm bớt không bền vững công sửa đổi giá trị thuộc tính

I Giới thiệu

Bảo vệ quyền, nhận thực thông tin, nhận dạng đặc trưng liệu quan hệ nhu cầu cấp thiết thách thức kỹ thuật thuỷ vân sở liệu quan hệ Việc quản lý quyền liệu quan hệ thuỷ vân trở thành chủ đề quan trọng nghiên cứu sở liệu Thuỷ vân liệu quan hệ có thách thức kỹ thuật đáng kể có ứng dụng thực tế có ý nghĩa xứng đáng quan tâm thích đáng từ phía cộng đồng người nghiên cứu sở liệu

Trong báo cáo này, chúng tơi trình bày kết nghiên cứu kỹ thuật thủy vân sử dụng bit ý nghĩa (LSB) số giá trị thuộc tính tiến hành thử nghiệm, đánh giá thuật toán cài đặt số công thông thường sở liệu

II Kỹ thuật thuỷ vân sử dụng bít ý nghĩa nhất

Các bít ý nghĩa (LSB – Least Significant Bits) bít bên phải chuỗi bít Ví dụ, chuỗi bít 1110 bít ý nghĩa 0, với số bít ý nghĩa số bít ý nghĩa chuỗi bít 1000101 101

Kỹ thuật LSB đánh dấu thuộc tính kiểu số giả thiết thuộc tính đánh dấu chấp nhận thay đổi nhỏ số giá trị thay đổi nhỏ không lộ rõ Tất thuộc tính số quan hệ khơng thiết phải đánh dấu Người chủ

dữ liệu định thuộc tính phù hợp cho việc đánh dấu

Việc đánh dấu tức chọn bộ, thuộc tính giá trị tương ứng với bộ, thuộc tínhđó Sau đó, ta thay đổi bít ý nghĩa giá trị Những thay đổi tạo thành thuỷ vân

Ý tưởng kỹ thuật đảm bảo số vị trí bít số thuộc tính số có chứa giá trị định Các bộ, thuộc tính bộ, vị trí bít thuộc tính giá trị bít định phải xác định cách xác logic kiểm sốt khố bí mật K chủ nhân quan hệ Mẫu bít hình thành thuỷ vân Chỉ chủ nhân khoá bí mật tìm lại thuỷ vân với xác suất cao

1.Mơ hình thuỷ vân

Giả sử có quan hệ R với lược đồ R(P, A0 ,

, Av-1), P thuộc tính khố chính, A0 ,

, Av-1

thuộc tính chọn để thuỷ vân Chúng thuộc tính kiểu số giá trị chúng có tính chất thay đổi

bít ý nghĩa chúng không cảm nhận Ký hiệu r.Ai giá trị thuộc tính Ai

trong

r

R

(2)

52(4): 56 - 59 Tạp chí KHOA HỌC & CÔNG NGHỆ

4 - 2009

2

Hình 1: Mơ hình thuỷ vân sử dụng bít ý nghĩa

2 Thuật tốn nhúng thuỷ vân

Hình 2: Các ký hiệu dùng kỹ thuật LSB

2.1 Mã chứng thực thông điệp

Mã chứng thực thông điệp (MAC – Message Authenticated Code) hàm băm chiều phụ thuộc vào khoá

Hàm băm chiều H hàm thao tác thông điệp đầu vào có độ dài tuỳ ý M trả lại giá trị băm có độ dài cố định h, tức h = H(M) Hàm có thêm đặc điểm sau:

Với M cho, dễ dàng tính h Với h cho, khó tính M để H(M) = h

Với M cho, khó tìm thông điệp khác M0 để H(M) = H(M0)

MD5 SHA hai lựa chọn tốt cho H Cho F MAC dùng để ngẫu nhiên hố giá trị thuộc tính khố r.P r trả lại giá trị nguyên miền rộng F gieo giống với khố bí mật K người chủ liệu biết Ta sử dụng hàm MAC coi an toàn sau:

F(r.P) = H(K o H(K o r.P)) đó: o biểu diễn phép ghép

2.2 Thuật tốn

Input: Khố bí mật K có chủ sở liệu biết, tham số

,

,

chủ sở liệu xác định

Output: Bộ liệu thuỷ vân Với

r

R

1 (F(r.P) mod

= = 0) // đánh dấu i = F(r.P) mod

//đánh dấu thuộc tính Ai

3 j = F(r.P) mod

// đánh dấu bít thứ j r.Ai = mark(r.P, r.Ai , j)

5 mark(primary_key pk, number v, bit_index j) trả lạinumber

6 first_hash = H( K o pk) (first_hash mod = = 0)

8 đặt bít ý nghĩa thứ j v 0, ngược lại

10 đặt bít ý nghĩa thứ j v trả lại v

Dòng cho biết xét có chọn để đánh dấu khơng Với chọn, dịng

Ký hiệu Mơ tả

Số quan hệ

Số thuộc tính quan hệ sẵn sàng để đánh dấu

Số bit ý nghĩa sẵn sàng để đánh dấu thuộc tính

1

Tỷ lệ đánh dấu

Số đánh dấu

Mức ý nghĩa phép thử để phát thủy vân

Số lượng tối thiểu đánh dấu cách đắn cần thiết để phát thuỷ vân

Khố bí mật, K

Nhúng thuỷ vân

Dữ liệu, R

Dữ liệu thuỷ vân, RW

Thuỷ vân phát Kênh

công

Dữ liệu bị

tấn công , R’W

(3)

52(4): 56 - 59 Tạp chí KHOA HỌC & CÔNG NGHỆ

4 - 2009

3

xác định thuộc tính đánh dấu số

thuộc tính ứng cử viên Đối với thuộc tính chọn, dịng xác định vị trí bít số

bít ý nghĩa đánh dấu

Thủ tục mark đặt bít chọn tuỳ thuộc vào giá trị hàm băm thu từ dòng Kết dòng (dòng 11) giữ nguyên giá trị thuộc tính giảm (tăng lên) Tức là, việc thuỷ vân đơn giản làm giảm số giá trị thuộc tính lại làm tăng số giá trị khác giữ nguyên số không đổi

Các sở liệu thường cho phép thuộc tính chấp nhận giá trị null Nếu trình đánh dấu mà gặp phải giá trị null thuộc tính chọn khơng đánh dấu giá trị giữ nguyên trạng

2.3 Thuật toán phát thuỷ vân

Giả sử người chủ liệu nghi ngờ quan hệ S tên cơng đưa ăn cắp từ quan hệ gốc R Tập bộ, thuộc tính S tập R Ta giả sử tên công khơng bỏ thuộc tính khố thay đổi giá trị khố khố chứa thơng tin có giá trị việc thay đổi làm giảm ý nghĩa sử dụng sở liệu theo quan điểm người dùng

Input: Các tham số K,

,

,

có giá trị nhúng thuỷ vân,

mức ý nghĩa phép thử người phát chọn trước

Output: Thuỷ vân phát totalcount = matchcount = Với s  S

3 nếu(F(s.P) mod

= = 0) // đánh dấu

4 i = F(s.P) mod

// thuộc tính Ai đánh

dấu

5 j = F(s.P) mod

// bít thứ j đánh dấu totalcount = totalcount + 1

7 matchcount = matchcount + match(s.P, s.Ai, j)

8

= threshold(totalcount,

)

9 nếu(matchcount 

) thì nghi ngờ bị ăn cắp

10 match(primary_key pk, number v, bit_index j) trả lại sốnguyên

11 first_hash = H(K o pk) 12 (first_hash mod = = 0)

13 trả lại bít ý nghĩa thứ j v 0, ngược lại trả lại

14 ngược lại

15 trả lại bít ý nghĩa thứ j v 1, ngược lại trả lại

Thuật toán phát thuỷ vân mang tính xác suất với phép thử ngẫu nhiên Dòng xác định liệu s xét có phải đánh dấu lúc nhúng thuỷ vân hay khơng Dịng xác định thuộc tính vị trí bít phải đánh dấu Sau đó, trình match so sánh giá trị bít với giá trị bít phải đặt cho bít nhúng thuỷ vân Như vậy, dòng thứ ta biết có thử (totalcount) có số chứa giá trị mong đợi (matchcount) Về mặt xác suất có lượng tối thiểu định có chứa bít trùng với bít đánh dấu Giá trị matchcount so sánh với số đếm tối thiểu tính từ hàm ngưỡng phép thử thành công mức ý nghĩa

chọn Kỹ thuật phân tích, đánh giá xác suất nhị thức tích lũy - Xác suất nhị thức tích luỹ:

Các phép thử độc lập lặp lặp lại gọi phép thử Bernoulli có hai kết phép thử xác suất chúng suốt trình thử

Cho

b

(

k

;

n

,

p

)

xác suất mà

n

phép thử Bernoulli với xác suất thành công

p

xác suất thất bại

q

1

p

k lần thành công nk lần thất bại

k n k

q p k n p n k

b  

      ) , ;

( (1)

)! ( ! ! k n k n k n        

0

k

n

(2) Ký hiệu số lần thành công

n

lần thử Sn Xác suất để có k lần thành cơng

n

lần thử, gọi xác suất nhị thức tích luỹ, tính sau:

   n k i

n k b i n p S

P (; , ) (3) Để ngắn gọn, ta định nghĩa:

)

,

;

(

k

n

p

B

:=

n k i p n i

(4)

52(4): 56 - 59 Tạp chí KHOA HỌC & CÔNG NGHỆ

4 - 2009

4

Giả sử chạy thuật toán phát thuỷ

vân, totalcount =

Điều có nghĩa chủ liệu xem xét

bít quan sát số bít mà giá trị chúng trùng với giá trị gán thuật toán nhúng

Xác suất để có

bít

bít ngẫu nhiên - với đặc điểm bít với xác suất nhau, độc lập với bít khác – trùng với giá trị gán B(

;

, 1/2) Nói cách khác, xác suất để

bít trùng khớp với hội ngang B(

;

, 1/2) Do đó,

thủ tục con:

Subroutine threshold(

,

) return count trả lại

nhỏ cho B(

;

, 1/2)

= min { t : B( t ;

, 1/2 )

}

III Thử nghiệm kết luận Chúng tiến hành cài đặt kỹ thuật LSB với quan hệ sở liệu thử nghiệm gồm 150 12 thuộc tính Chẳng hạn, chọn số bít ý nghĩa 1, số thuộc tính sẵn sàng để đánh dấu 12, tham số điều khiển xác định số cần đánh dấu 10 kết thu có 18 đánh dấu Khi chưa có cơng gì, thuật tốn phát cho ta kết matchcount = totalcount = 18

Khi thêm số liệu vào kết thu matchcount = totalcount =

18 thử với mức ý nghĩa

khác

cho ta ngưỡng

sau:

= 0.1

= 13 < matchcount

= 0.01

= 15 < matchcount

= 0.001

= 16 < matchcount

= 0.0001

= 17 < matchcount

Khi thay đổi số giá trị thuộc tính thì: matchcount = 14 < totalcount = 18, và với

= 0.1

= 13 < matchcount, với

= 0.01

= 15 > matchcount

Với cơng thêm khơng có thay đổi đáng kể tới liệu thủy vân Cịn với cơng thay đổi có ảnh hưởng đáng kể tới liệu nhúng làm thủy vân Như vậy, kỹ thuật LSB bền vững công thêm (bớt) công thay đổi Chúng dự định tiếp tục nghiên cứu, tìm kỹ thuật thủy vân bền vững tiến

hành cài đặt chúng liệu thực để áp dụng vào thực tiễn

Tài liệu tham khảo

[1] Phạm Hữu Khang, Đoàn Thiện Ngân, Hoàng Đức Hải, “C# 2005 Lập trình bản”, NXB Lao động xã hội (2006)

[2] R Agrawal, J Kiernan, “Watermarking Relational Databases” in Proceedings of the 28th

VLDB Conference, Hong Kong, China, 2002

[3].R Agrawal, P J Haas, and J Kiernan “Watermarking relational data: framework, algorithms and analysis*” The VLDB Journal (2003)

(5)

52(4): - 12 Tạp chí KHOA HỌC & CÔNG NGHỆ

4 - 2009

5

Summary

Ngày đăng: 01/04/2021, 12:19

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w