1. Trang chủ
  2. » Khoa Học Tự Nhiên

Bảo vệ sự toàn vẹn của cơ sở dữ liệu quan hệ bằng kỹ thuật thủy vân

9 10 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Nội dung

Bài viết đề xuất một lược đồ thủy vân dùng để bảo vệ sự toàn vẹn cho cơ sở dữ liệu quan hệ. Trong lược đồ này, thủy vân được tạo ra từ các thuộc tính trong cơ sở dữ liệu và được nhúng vào một số thuộc tính của cơ sở dữ liệu quan hệ.

Trường Đại học Vinh Tạp chí khoa học, Tập 50 - Số 1A/2021, tr 21-29 BẢO VỆ SỰ TOÀN VẸN CỦA CƠ SỞ DỮ LIỆU QUAN HỆ BẰNG KỸ THUẬT THỦY VÂN Lưu Thị Bích Hương Viện Cơng nghệ thơng tin, Trường Đại học Sư phạm Hà Nội Ngày nhận 21/01/2021, ngày nhận đăng 05/3/2021 Tóm tắt: Bài báo đề xuất lược đồ thủy vân dùng để bảo vệ toàn vẹn cho sở liệu quan hệ Trong lược đồ này, thủy vân tạo từ thuộc tính sở liệu nhúng vào số thuộc tính sở liệu quan hệ Cơ sở liệu quan hệ sau nhúng thủy vân giá trị sử dụng thuộc tính khơng thay đổi Bài báo chứng minh tính đắn lược đồ thủy vân đề xuất Từ khóa: Tồn vẹn liệu; thủy vân; sở liệu Mở đầu Trong thời đại cách mạng công nghệ 4.0, kỹ thuật số ngày trở nên phố biến vai trò quan trọng sống Theo báo cáo Digital 2020 (kỹ thuật số 2020) toàn cầu We are social, Việt Nam có 96,9 triệu dân, số lượng thuê bao di động 145,8 triệu thuê bao chiếm tỷ lệ 150% so với tổng dân số nước, số lượng người dùng internet 68,17 triệu người, chiếm tỷ lệ 70% số dân, số lượng người dùng mạng xã hội 65 triệu người chiếm tỷ lệ 67% số dân Điều cho thấy phần đông người dân Việt Nam tiếp cận với điện thoại di động thông minh khơng người sử dụng 2-3 điện thoại lúc để phục vụ cho sống Việc người ngày phụ thuộc vào Internet hoạt động hàng ngày, việc quảng bá sản phẩm, thương hiệu theo hình thức trực tuyến điều mà doanh nghiệp hay tổ chức cần thực Qua thống kê cho thấy số người dùng mạng xã hội tăng nhanh công cụ truyền thông phổ biến hầu hết tất doanh nghiệp, tổ chức Việt Nam Giống quy luật tự nhiên, tốt đẹp ln kèm theo mặt trái Thơng tin, liệu dễ tìm thấy đồng nghĩa với dễ bị ăn cắp quyền, truy cập trái phép, nhiều nguồn đưa thơng tin sai lệch, tính đắn thơng tin… Vì vậy, vấn đề bảo vệ toàn vẹn sở liệu vấn đề nóng xã hội quan tâm nhiều Hiện nay, có nhiều nghiên cứu thủy vân để bảo vệ toàn vẹn liệu, nghiên cứu thủy vân với liệu ảnh số 0, nghiên cứu thủy vân sở liệu quan hệ với thuộc tính số [2, 3, 8] hay nghiên cứu thủy vân sở liệu với thuộc tính khơng phải kiểu số [4, 6, 7] Với nghiên cứu này, đề xuất lược đồ thủy vân sở liệu quan hệ với thuộc tính kiểu số kiểu số Trong lược đồ này, thủy vân tạo dựa vào thuộc tính nhúng vào sở liệu Trong phần chúng tơi trình bày số định nghĩa Phần lược đồ thủy vân, phần trình bày tư tưởng lược đồ thủy vân sở liệu quan hệ, thuật toán nhúng thủy vân, thuật toán phát thủy vân xác minh tồn vẹn Phần chứng minh tính đắn lược đồ thủy vân đề xuất Phần cuối kết luận Email: luuthibichhuong@hpu2.edu.vn 21 Lưu Thị Bích Hương / Bảo vệ tồn vẹn sở liệu quan hệ kỹ thuật thủy vân Định nghĩa Trong lược đồ quan hệ, có số thuộc tính có ý nghĩa quan trọng số thuộc tính khác có ảnh hưởng khơng lớn đến giá trị sử dụng ý nghĩa thực tế Sau đưa hai định nghĩa để làm rõ loại thuộc tính Định nghĩa 1: Thuộc tính có tác động cao Một thuộc tính gọi thuộc tính tác động cao thuộc tính có tác động cao thuộc tính có ảnh hưởng cao hay cịn gọi thuộc tính có ý nghĩa quan trọng thay đổi giá trị thuộc tính giá trị đặc trưng chúng bị thay đổi theo Định nghĩa 2: Thuộc tính có tác động thấp Một thuộc tính gọi thuộc tính tác động thấp thuộc tính có tác động thấp thuộc tính có ảnh hưởng thấp hay cịn gọi thuộc tính khơng có ý nghĩa quan trọng có thay đổi nhỏ giá trị thuộc tính có ảnh hưởng khơng lớn đến giá trị sử dụng giá trị ý nghĩa thực tế thuộc tính Ví dụ, lược đồ quan hệ nhân thuộc tính ghi số chứng minh thư, họ tên, năm sinh, giới tính, ngày tăng lương thuộc tính quan trọng, có ảnh hưởng lớn đương Các thuộc tính q qn, nơi sinh có ảnh hưởng khơng lớn đương Thơng thường thuộc tính tác động thấp thuộc tính khơng phải kiểu số Lược đồ thủy vân Như trình bày, có nhiều báo tập trung nghiên cứu kỹ thuật thủy vân sở liệu quan hệ có thuộc tính kiểu số [2, 3, 8], số tác giả nghiên cứu thủy vân sở liệu quan hệ có thuộc tính khơng phải kiểu số [4, 5] có báo nghiên cứu thủy vân sở liệu với liệu phân loại Trong 0, lược đồ thủy vân sử dụng cho liệu số Ý tưởng lược đồ dựa vào tất thuộc tính khơng phải số để tính khóa bí mật, sau dùng khóa bí mật để nhúng vào thuộc tính tác động thấp Trong lược đồ để lộ thuật tốn nhúng thủy vân sở liệu quạn hệ khơng cịn đảm bảo Trong 0, lược đồ thủy vân sử dụng cho liệu số Ý tưởng lược đồ dựa vào ràng buộc ngữ nghĩa thuộc tính văn để thủy vân Việc xác định ngữ nghĩa giá trị khó thực tiếng việt Trong 0, lược đồ thủy vân sử dụng cho liệu phân loại Điểm mấu chốt kỹ thuật việc đổi thứ tự sở liệu Tuy nhiên, lược đồ có tính an tồn chưa cao việc đổi thứ tự thực cặp định trước Lược đồ thủy vân đề xuất sử dụng cho sở liệu quan hệ có thuộc tính số thuộc tính khơng số Tư tưởng lược đồ tính giá trị tất thuộc tính, sau lấy giá trị kết hợp với khóa thủy vân cho trước để xác định thủy vân nhúng vào thuộc tính khơng phải số tác động thấp Lược đồ thủy vân thiết kế để bảo vệ toàn vẹn cho quan hệ thuộc lược đồ quan hệ có dạng: R(H1, H2,…,Hm, L1, L2, , Ln) 22 Trường Đại học Vinh Tạp chí khoa học, Tập 50 - Số 1A/2021, tr 21-29 Trong đó, m thuộc tính H1, H2,…, Hm, thuộc tính tác động cao cịn L1, L2, , Ln n thuộc tính tác động thấp Khơng tính tổng qt, giả sử lược đồ quan hệ quan hệ có  bộ, K khóa thủy vân Lược đồ thủy vân có sử dụng số ký hiệu liệt kê Bảng Bảng 1: Các ký hiệu sử dụng lược đồ thủy vân Ký hiệu R r ri ri.Lj  K n m Ý nghĩa Lược đồ quan hệ Quan hệ thuộc lược đồ R Bộ thứ i quan hệ r Giá trị thuộc tính Lj thuộc ri Số quan hệ r Khóa thủy vân Số thuộc tính tác động thấp Số thuộc tính tác động cao Lược đồ thủy vân đề xuất dùng để bảo vệ toàn vẹn cho sở liệu quan hệ thực dựa vào hai thuật toán: - Thuật toán nhúng thủy vân vào quan hệ - Thuật toán phát thủy vân xác minh tồn vẹn 3.1 Thuật tốn nhúng thủy vân Ý tưởng thuật toán nhúng thủy vân bao gồm bước sau: - Sinh thủy vân từ lược đồ sở liệu quan hệ R - Với quan hệ r  R, chia  r thành g nhóm - Mỗi nhóm Gi sinh xác định ký tự thủy vân nhúng vào thuộc tính tác động thấp vị trí nhóm 3.1.1 Sinh thủy vân - Tìm thủy vân từ quan hệ cách dựa vào khóa thủy vân, thuộc tính sở quan hệ - Đối với m thuộc tính tác động cao, tính tổng mã Unicode tồn thuộc tính ký hiệu là: AH =  i j{ASCII ri.Hj,  i  ;1  j  m} - Đối với n thuộc tính tác động thấp, tính tổng mã Unicode tất theo thuộc tính ALj =  i{ASCII ri.Lj,  i  } - Xây dựng ma trận đặt tên D bao gồm hàng n cột với thành phần Di1, Di2, (với i = 1, 2, …, n) tính sau: Di1 = AH + ALi Di2 = ALi - Xây dựng ma trận thủy vân W cách nhân ma trận D với ma trận chuyển vị T D Ma trận W thu ma trận vng kích thước  với giá trị đường chéo e1, e2, Đây giá trị đặc trưng ma trận 23 Lưu Thị Bích Hương / Bảo vệ tồn vẹn sở liệu quan hệ kỹ thuật thủy vân - Điểm khác lược đồ đề xuất dùng hàm băm giá trị ej sau ghép với khóa thủy vân K Chuyển giá trị băm thành ký tự thủy vân Wj theo công thức: Wj = ATOC (HASH (ej, K) MOD 224 + 32), j = 1, Trong ATOC() hàm chuyển mã ASCII thành ký tự tương ứng Sở dĩ phải cộng thêm 32 31 ký tự bảng mã ASCII ký tự không in Khóa K bí mật đối xứng, người chủ sở liệu biết dùng trình nhúng thủy vân phát thủy vân Hàm băm sử dụng để đảm bảo có thay đổi xảy sở liệu ký tự thủy vân Wj thay đổi theo Đây điều mong muốn lược đồ thủy vân dùng để bảo vệ toàn vẹn sở liệu quan hệ Procedure SinhTV(R, K) Input: R, K Output: W AH = for i = to ω for j = to m AH = AH + ASCII ri.Hj end for end for for j = to n ALj = for i = to ω 10 ALj = ALj + ASCII ri.Lj 11 end for 12 end for 13 for i = to n // Xây dựng ma trận D L H 14 Di1 = A i + A 15 Di2 = AL i 16 end for 17 W = D*DT // Sinh ký tự thủy vân 18 for j = to 19 Wj = ATOC(HASH(ej, K) MOD 224) + 32) 20 end for 21 Sắp thứ tự Wj 22 return W //Ký tự thủy vân 3.1.2 Chia nhóm quan hệ Cho quan hệ r thuộc R với  liệu, việc phân chia  quan hệ r thành g nhóm dựa vào khóa khóa thủy vân K Cách phân chia làm tăng tính ngẫu nhiên chọn phân vào nhóm riêng rẽ Tính ngẫu nhiên có độ bảo mật cao đảm bảo hàm băm mật mã H() Mục đích việc phân chia nhằm tăng khả bền vững thuỷ vân trước công phát giả mạo có Với số lượng nhóm g, khóa thủy vân K chủ sở hữu sở liệu quan hệ biết, việc phân chia quan hệ vào nhóm G k (k= 0, 1, …, g - 1) thực thủ tục ChiaNhom() sau: 24 Trường Đại học Vinh Tạp chí khoa học, Tập 50 - Số 1A/2021, tr 21-29 Procedure ChiaNhom(r, K, g) for k = to g-1 // khởi tạo số nhóm qk = Gk =  end for for i= to ω k = H(K  ri.P)mod g Gk = Gk ∪ {ri} qk = qk + // qk số nhóm Gk end for 3.1.3 Nhúng thủy vân vào thuộc tính tác động thấp Đầu tiên, tiến hành lựa chọn để nhúng thủy vân nhóm Gj quan hệ r: t = CODE(W(j mod 2)+1) mod qj Trong qj số nhóm Gj, hàm CODE hàm chuyển ký tự thành mã Unicode tương ứng Sau đó, tiến hành xác định thuộc tính vị trí nhúng để nhúng ký tự thủy vân chọn Trong lược đồ thủy vân có sử dụng thủ tục nhúng thủy vân vào thuộc tính tác động thấp nhóm, thủ tục xây dựng sau: Procedure NhungTV(Gj, W) // Chọn thứ t Gj để nhúng t = CODE(W(j mod 2)+1) mod qj //Xác định thuộc tính nhúng e = t mod n vtrinhung = Converter(H(K))%length(rt.Le) Chèn W(j mod 2)+1 vào rt.Le vtrinhung 3.1.4 Nhúng thủy vân vào sở liệu quan hệ Thuật toán 3.1: Nhúng thủy vân Input: - Lược đồ R(H1, H2,…,Hm, L1, L2, , Ln) Trong H1, H2,…, Hm thuộc tính có tác động cao, cịn L1, L2, , Ln thuộc tính có tác động thấp - Khóa thủy vân K, số nhóm g Output: Lược đồ R nhúng thủy vân W = SinhTV (R,K) for ri R ChiaNhom(ri,K,g) for j = to g-1 NhungTV(Gj, W) end for End for 25 Lưu Thị Bích Hương / Bảo vệ tồn vẹn sở liệu quan hệ kỹ thuật thủy vân 3.2 Phát thủy vân xác minh toàn vẹn Quan hệ r thuộc R sau nhúng thủy vân lưu thơng bình thường mơi trường cơng cộng Khi có nghi ngờ xuyên tạc hay giả mạo quan hệ này, người chủ sở hữu quan hệ tiến hành xác minh thuật toán phát thủy vân Giả sử r’ quan hệ thuộc lược đồ R Cần kiểm tra xem r’ có phải giả mạo quan hệ r thủy vân hay khơng Thuật tốn phát thủy vân xác minh toàn vẹn chia làm phần bản: - Thực qui trình sinh thủy vân r’ giống thực r thuật toán nhúng thủy vân Gọi ký tự sinh từ r’ Wj với j = 1, - Theo qui tắc nhúng thủy vân vào thuộc tính tác động thấp thuật tốn 3.1.2, trích ký tự nhúng gọi ký tự W’j với j = 1, - So sánh ký tự W’ với cá ký tự W với Nếu chúng trùng khớp R’ R khơng bị sửa đổi Nếu ngược lại kết luận R’ R bị sửa đổi Thuật toán 3.2 Phát thủy vân Input: - Lược đồ R(H1, H2,…, Hm, L1, L2, , Ln), H1, H2,…, Hm thuộc tính có tác động cao, cịn L1, L2, , Ln thuộc tính có tác động thấp - Khóa thủy vân K, số nhóm g Output: Lược đồ R toàn vẹn bị sửa đổi W = SinhTV(R’,K) For ri R’ ChiaNhom(ri,K,g) for j = to g-1 NhungTV(Gj, W) W’j= substring(r’t.Le, vtrinhung,1) end for Sắp thứ tự W’ If W W’ then 10 return “Lược đồ bị sửa đổi” 11 end if 12 End for Giả sử có trung bình p ký tự thuộc tính có m + n thuộc tính Khi đó, việc tính tổng ký tự có tốn khoảng p(m + n) đơn vị thời gian Vậy thời gian tính tốn cho lược đồ thủy vân ωp(m + n) đơn vị thời gian hay độ phức tạp O(ωp(m + n)) Tính đắn Để chứng minh tính đắn lược đồ đề xuất chúng tơi đưa định lý sau: Định lý 4.1: Lược đồ quan hệ R có thuộc tính tác động cao thuộc tính tác động thấp nhúng thủy vân thuật toán 3.1 26 Trường Đại học Vinh Tạp chí khoa học, Tập 50 - Số 1A/2021, tr 21-29 Chứng minh: Trong thuật toán 3.1, tìm thủy vân từ quan hệ cách dựa vào khóa thủy vân, thuộc tính có tác động cao thuộc tính có tác động thấp Sau đó, nhúng thủy vân vào thuộc tính có tác động thấp Do để chứng minh định lý 4.1 ta cần phải tìm ma trận thủy vân W cách nhúng thủy vân W vào thuộc tính tác động thấp Thật vậy: - Đối với m thuộc tính có tác động cao, tính tổng mã ASCII tồn thuộc tính, cụ thể là: AH =  i j{ASCII ri.Hj,  i  ;  j  m} - Đối với n thuộc tính có tác động thấp, tính tổng mã ASCII thuộc tính, cụ thể là: ALj =  i {ASCII ri.Lj,  i  } - Ma trận D bao gồm hàng n cột với thành phần Di1, Di2 (với i = 1, 2,…, n) tính sau: Di1 = AH + ALi Di2 = ALi  W = D x DT (1) - Ma trận W có giá trị đường chéo e1, e2 - Dùng hàm băm giá trị ej sau ghép với khóa thủy vân K Chuyển giá trị băm thành ký tự thủy vân Wj theo công thức: Wj = ATOC (HASH (ej, K) MOD 224 + 32); j = 1, - Tiến hành lựa chọn ký tự để nhúng vào thuộc tính: - Nếu n  2, w*i = Wi ( i= 1, 2, , n) - Nếu n >2, w*i = W(i MOD 2)+1 (i = 1, 2, , n) - Xác định vị trí nhúng thuộc tính cách sử dụng hàm băm với khóa K (2) Từ (1) (2) ta có điều phải chứng minh Định lý 4.2: Thuật tốn 3.2 xác định toàn vẹn lược đồ quan hệ R lược đồ quan hệ R không bị sửa đổi Chứng minh: Để chứng minh định lý ta chứng minh Wj W’j trùng khớp Thật : - Dựa vào m thuộc tính tác động cao n thuộc tính tác động thấp tính ma trận D bao gồm hàng n cột với thành phần Di1, Di2 (với i = 1, 2, …, n) với: Di1 = AH + ALi Di2 = ALi Trong AH, ALi tổng mã ASCII thuộc tính tác động cao thuộc tính tác động thấp  Wj (j = 1, 2) (1) - Theo thuật tốn 3.2, ta có: W’i = substring (r’j.Li, j MOD (length (r’j.Li) - 1),1) Hay W’i lấy chuỗi gồm ký tự từ r’j.Li  bit thủy vân W’j (j = 1, 2) (2) 27 Lưu Thị Bích Hương / Bảo vệ toàn vẹn sở liệu quan hệ kỹ thuật thủy vân - Mặt khác, theo giả thiết quan hệ r không bị sửa đổi nên  r’j.Li trùng với rj.Li (3) Từ (1), (2) (3)  Wj trùng với W’j  Điều phải chứng minh Kết luận Lược đồ thủy vân đề xuất nhằm bảo vệ toàn vẹn cho sở liệu quan hệ có thuộc tính số thuộc tính khơng số có ưu điểm sau: - Bền vững: Các giá trị đặc trưng lược đồ nhúng thuộc tính có tác động thấp khắp nơi quan hệ Vì khó để gỡ bỏ hết ký tự thủy vân nhúng - Nhạy cảm: Mọi thay đổi quan hệ lược đồ ảnh hưởng đến ký tự thủy vân sinh điều có nghĩa ta phát thay đổi quan hệ không nhúng thủy vân lên - Phát mù: Q trình xác minh tồn vẹn lược đồ khơng địi hỏi lược đồ gốc thủy vân gốc - Không hiện: Thủy vân nhúng ký tự có đặc tính khơng hình dạng (rỗng) khơng chiếm chỗ Nhược điểm lược đồ việc sử dụng ký tự không chiếm chỗ khơng hình chèn ký tự vào vị trí thuộc tính tác động thấp khiến cho việc khôi phục liệu gốc trở lên khó khăn Lời cảm ơn: Nghiên cứu tài trợ Trường Đại học Sư phạm Hà Nội qua Đề tài có mã số HPU2.CS-2021.03 TÀI LIỆU THAM KHẢO [1] Phuoc Hung Vo, Thai Son Nguyen, Van Thanh Huynh, Thanh C Vo, Thanh Nghi Do, Secure and Robust Watermarking Scheme in Frequency Domain Using Chaotic Logistic Map Encoding, Advanced Computational Methods for Knowledge Engineering, Springer, 2019 [2] Chitla Arathi, “Literature Survey on Distortion based Watermarking Techniques for Databases,” International Journal of Computer Science & Communication Networks, Vol 2(4), pp 456-463 [3] Al-Haj, A and Odeh, A., “Robust and blind watermarking of relational database systems,” Journal of Computer Science, 4: 1024-1029, 2008 [4] Bedi R., Thengade A., Wadhai V., “A New Watermarking Approach for Non Numeric Relational Database,” International Journal of Computer Applications (0975 - 8887), Vol 13, No 7, pp 37-40, 2011 [5] Javier Franco Contreras and Gouenou Coatrieux, “Protection of Relational Databases by Means of Watermarking: Recent Advances and Challenges,” Advances in Security in Computing and Communications, 2017 DOI: 10.5772/intechopen.68412 28 Trường Đại học Vinh Tạp chí khoa học, Tập 50 - Số 1A/2021, tr 21-29 [6] Murugan R, Jaseena K U, John T Abraham, “An Invisible Watermarking Technique for Integrity and Right Protection of Relational Databases,” International Journal of Applied Engineering Research, Vol 12, No 24 (2017), pp 15754-15758 [7] Yingjiu Li, Huiping Guo, Sushil Jajodia, Tamper Detection and Localization for Categorical Data Using Fragile Watermarks, DRM '04: Proceedings of the 4th ACM workshop on Digital rights management New York, NY, USA: ACM (2004), pp 73-82 [8] Shuguang Yuan, J Yu, Peisong Shen, C Chen, Verify a Valid Message in Single Tuple: A Watermarking Technique for Relational Database, Computer Science, DASFAA, 2020 SUMMARY PROTECTING THE INTEGRITY OF RELATIONAL DATABASE BY WATERMARKING TECHNIQUE Luu Thi Bich Huong The Institute for Information Technology, Hanoi Pedagogical University Received on 21/01/2021, accepted for publication on 05/3/2021 The paper proposed a watermarked scheme used to protect integrity for relational databases In this schema, watermark is created from attributes in the database and embedded in some properties of the relational database After embedding the watermarkin relational database, the use value of the attributes does not change The paper proves the correctness of the proposed watermarked scheme Keywords: Data integrity; watermark; relation database 29 ... bảo vệ toàn vẹn cho sở liệu quan hệ thực dựa vào hai thuật toán: - Thuật toán nhúng thủy vân vào quan hệ - Thuật toán phát thủy vân xác minh tồn vẹn 3.1 Thuật tốn nhúng thủy vân Ý tưởng thuật. .. cứu kỹ thuật thủy vân sở liệu quan hệ có thuộc tính kiểu số [2, 3, 8], số tác giả nghiên cứu thủy vân sở liệu quan hệ có thuộc tính khơng phải kiểu số [4, 5] có báo nghiên cứu thủy vân sở liệu. .. liệu quan hệ kỹ thuật thủy vân 3.2 Phát thủy vân xác minh toàn vẹn Quan hệ r thuộc R sau nhúng thủy vân lưu thơng bình thường mơi trường cơng cộng Khi có nghi ngờ xuyên tạc hay giả mạo quan hệ

Ngày đăng: 29/06/2021, 12:42

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w