Bài viết trình bày mô hình dữ liệu dạng khối được xem là mở rộng của mô hình dữ liệu quan hệ. Phụ thuộc hàm là một loại ràng buộc dữ liệu giữa các thuộc tính trong một cơ sở dữ liệu quan hệ, góp phần vào việc đảm bảo tính nhất quán của dữ liệu, loại bỏ bớt dữ liệu dư thừa.
TẠP CHÍ KHOA HỌC − SỐ 8/2016 57 ĐỘ ĐO PHỤ THUỘC H M XẤP XỈ TRONG CƠ SỞ DỮ LIỆU MÔ HINH HINH DANG DANG KHỐI Nguyễn Minh Huy1( ), Nguyễn Năng Hưng 1, Nguyễn Năng Anh Đức2 Trường Đại học Thủ Hà Nội Trường Đại học Sư phạm Hà Nội Tóm tắt tắt: Trong báo cáo này, chúng tơi trình bày mơ hình liệu dạng khối ñược xem mở rộng mơ hình liệu quan hệ Phụ thuộc hàm loại ràng buộc liệu thuộc tính sở liệu quan hệ, góp phần vào việc đảm bảo tính qn liệu, loại bỏ bớt liệu dư thừa Phụ thuộc hàm mơ hình liệu dạng khối tính chất ñược quan tâm nghiên cứu Trong bào trình bày phương pháp xây dựng độ đo phụ thuộc xấp xỉ mơ hình liệu dạng khối Với hai tập thuộc tính X Y thuộc khối R, độ đo xây dựng dựa việc tính tốn ñộ ño xấp xỉ từ lát cắt (giá trị ñộ ño xấp xỉ nằm khoảng từ ñến 1) lấy giá trị lớn ñộ ño ñó Giá trị ñộ ño xấp xỉ phụ thuộc hàm khối R nằm khoảng [0-1] Một phụ thuộc hàm xấp xỉ khối có độ ño tất phụ thuộc hàm xấp xỉ lát cắt phụ thuộc hàm(kinh ñiển) Từ khoá: khoá Phụ thuộc hàm, Khai phá liệu, Phụ thuộc hàm xấp xỉ, Mơ hình liệu quan hệ, Mơ hình liệu dạng khối GIỚI THIỆU Cơ sở liệu lĩnh vực quan trọng công nghệ thông tin Cơ sở liệu nghiên cứu, ứng dụng thành cơng nhiều lĩnh vực ñem lại hiệu kinh tế cao cho đời sống xã hội Đã có nhiều báo nghiên cứu sở liệu mơ hình sở liệu Có mơ hình thường sử dụng: mơ hình phân cấp, mơ hình mạng mơ hình quan hệ Trong đó, mơ hình quan hệ quan tâm Do quan hệ có cấu trúc phẳng (tuyến tính) nên mơ hình chưa đủ đáp ứng ứng dụng phức tạp, sở liệu có cấu trúc phi tuyến… Do việc mở rộng mơ hình liệu quan hệ thành mơ hình liệu dạng khối nhằm mở khả quản lí liệu, ñáp ứng nhu cầu thực tế tốt [2] (1) Nhận ngày 23.8.2016; gửi phản biện duyệt ñăng ngày 15.9.2016 Liên hệ tác giả: Nguyễn Minh Huy; Email: nmhuy@daihocthudo.edu.vn TRƯỜNG ĐẠI HỌC THỦ ĐÔ H 58 NỘI Phụ thuộc hàm (Functional Dependency) loại ràng buộc liệu thuộc tính sở liệu quan hệ, góp phần vào việc đảm bảo tính quán liệu, loại bỏ bớt liệu dư thừa Phụ thuộc hàm thể tính chất ngữ nghĩa thuộc tính tồn tập liệu ñộc lập với mơ hình quan hệ Nghiên cứu phụ thuộc hàm hướng quan trọng thiết kế sở liệu quan hệ ñã ñạt ñược nhiều thành tựu [11, 12, 13, 20]; bên cạnh đó, nghiên cứu phụ thuộc hàm mơ hình liệu dạng khối [2] có kết [2, 5] ñể tăng cường khả ñảm bảo ngữ nghĩa, góp phần hồn chỉnh thêm mơ hình liệu dạng khối n Cho lược ñồ khối R = (id; A1,A2 , An), r(R) khối R, X, Y ⊆ ∪ id ( i ) , i =1 X → Y kí hiệu phụ thuộc hàm Một khối r thoả X → Y , với t1, t ∈ R cho t1(X) = t2(X) t1 (Y) = t(Y) Từ định nghĩa phụ thuộc hàm trên, ta nhận thấy: tồn t1, t ∈ r cho t1(X) = t2(X) t1 (Y) = t(Y), kết luận r không thoả phụ thuộc hàm X → Y (hay phụ thuộc hàm X → Y khơng r) Trong thực hành, ñiều tỏ chặt cứng nhắc ta hình dung quan hệ r có hàng nghìn bộ, có vài vi phạm phụ thuộc hàm X → Y có số liệu bị sai lệch ngoại lệ Do việc mở rộng khái niệm phụ thuộc hàm (kinh ñiển) thành phụ thuộc hàm xấp xỉ (trong mơ hình liệu quan hệ, mơ hình liệu dạng khối) theo cách thức, nghĩa ñó nhu cầu tất yếu tự nhiên Các phụ thuộc hàm xấp xỉ khai phá từ mơ hình sở liệu quan hệ, mơ hình liệu dạng khối mẫu quan trọng, tri thức có giá trị cấu trúc liệu MƠ HÌNH DỮ LIỆU DẠNG KHỐI 2.1 Khối, lược đồ khối Khái niệm tốn học làm tảng cho mơ hình sở liệu dạng khối (gọi tắt mơ hình khối) khối hiểu theo nghĩa lí thuyết tập hợp Khối ñịnh nghĩa sau: Định nghĩa 2.1: Gọi R = (id; A1, A2, An) hữu hạn phần tử, id tập số hữu hạn khác rỗng, Ai (i=1,n) thuộc tính Mỗi thuộc tính Ai (i=1,n) có miền giá trị tương ứng dom(Ai) Một khối r tập R, kí hiệu r(R) gồm số hữu hạn phần tử mà phần tử họ ánh xạ từ tập số id ñến miền trị thuộc tính Ai, (i=1,n) Nói cách khác: t ∈ r ( R) ⇔ t = {ti: id dom(Ai)} i =1,n TẠP CHÍ KHOA HỌC − SỐ 8/2016 59 Ta kí hiệu khối r(R) r (id; A1, A2, An), kí hiệu đơn giản r Khi khối r(R) gọi có lược đồ khối R Như lược ñồ khối R ta xây dựng nhiều khối khác Ví dụ 2.1: Ta xây dựng khối nhân viên (kí hiệu NV(R)) (hình 1) để quản lí nhân viên quan sau: Cho lược ñồ khối R = (id; A1, A2, A3, A4), đó: id = {1/2009, 2/2009, 3/2009 , 12/2009,và thuộc tính A1 = ma (mã), A2 = ten (tên), A3 = luong (lương), A4 = trinh_do (trình độ) Với khối NV(R) hình 1, ta thấy gồm phần tử: t1, t2, t3 Hình Biểu diễn khối nhân viên NV(R) Khi ta có: Lương nhân viên t1 thời ñiểm tháng 1/2009 là: t1(1/2009,luong) = 200 ● Tên cán t2 vào tháng 2/2009 là: t2(2/2009,ten) = 'B' ● Trình độ cán t3 vào tháng 2/2009 là: t3(2/2009,trinh_do) = ‘CD’ ● Mã số cán t3 vào tháng 3/2009 là: t3(3/2009,ma) = 'C01' 2.2 Lát cắt Cho R = (id; A1, A2, An), r(R) khối R Với x ∈ id ta kí hiệu r(Rx) khối với Rx = ({x}; A1, A2, An) cho: tx ∈ r(Rx) ⇔ tx = {tix = ti }i =1,n với t ∈ r(R), x t = {ti: id Ở ñây tix(x) = ti(x) với i=1,…n dom(Ai)} i =1,n TRƯỜNG ĐẠI HỌC THỦ ĐƠ H 60 NỘI Khi r(Rx) ñược gọi lát cắt khối r(R) điểm x Ví dụ 2.2: Với khối NV(R) cho trên, R = (id; A1, A2, A3, A4) Trong đó: id = {1/2009, 2/2009, 3/2009 , 12/2009} A1 = ma, A2 = ten, A3 = luong, A4 = trinh_do Nếu x = 2/2009 ∈ id lát cắt r(R2/ 2009) có dạng sau: r(R2/2009): ma ten luong trinh_do A01 A 350 ThS A02 B 300 DH A03 C 250 CD PHỤ THUỘC HÀM XẤP XỈ TRONG MƠ HÌNH DỮ LIỆU DẠNG KHỐI 3.1 Phụ thuộc hàm mơ hình liệu dạng khối Sau đây, đơn giản ta sử dụng kí hiệu: x(i) = (x; Ai); id(i) = {x(i) | x ∈ id} Ta gọi x(i) (x ∈ id, i = n) thuộc tính số lược đồ khối R = (id; A1, A2, An) Định nghĩa 3.1 Cho lược ñồ khối R = (id; A1, A2, An), r(R) khối R, n X, Y ⊆ ∪ id ( i ) , X → Y kí hiệu phụ thuộc hàm Một khối r thoả X → Y với i =1 t1, t ∈ R cho t1(X) = t2(X) t1(Y) = t2(Y) 3.2 Phụ thuộc hàm ñược suy diễn từ tập phụ thuộc hàm F Cho lược ñồ khối R = (id; A1, A2, An), F tập phụ thuộc hàm R X → Y n phụ thuộc hàm với X, Y ⊆ ∪ id ( i ) Nói X → Y ñược suy diễn logic từ F i =1 với khối r xác ñịnh R thoả phụ thuộc hàm F thoả X → Y Kí hiệu là: F│= X → Y 3.3 Các tính chất phụ thuộc hàm khối Cho lược ñồ khối R = (id, A1, A2,… An), r(R) khối bất kì, F tập phụ n thuộc hàm X,Y, Z, W ⊆ ∪ id (i ) , ta có số tính chất phụ thuộc hàm i=1 sau: TẠP CHÍ KHOA HỌC − SỐ 8/2016 F1) Nếu Y 61 X X → Y (tính phản xạ) F2) Nếu X → Y XW → YW (tính gia tăng) F3) Nếu X → Y, Y → Z X → Z (tính bắc cầu) F4) Nếu X → Y, YZ → W XZ → W (tính tựa bắc cầu) F5) Nếu X → Y, Z → W XZ →YW (cộng tính đầy đủ) F6) Nếu X → Y XZ→Y (tính mở rộng vế trái) F7) Nếu X → Y, X → Z X → YZ (cộng tính vế phải) F8) Nếu X → YZ X → Y (bộ phận vế phải) F9) Nếu X → YZ, Z → WV X → YZW (tính tích luỹ) Khái niệm phụ thuộc hàm mơ hình liệu khối, khối r thoả X → Y ñúng với t1, t2 ∈ r cho t1(X) = t2(X) t1(Y) = t2(Y) Điều thực hành tỏ cứng ngắt phụ thuộc hàm X → Y khối liệu R= (id, A1, A2,… An) vi phạm vài sai lệch ngoại lệ Do việc mở rộng phụ thuộc hàm mơ hình liệu khối thành phụ thuộc hàm xấp xỉ mơ hình liệu khối điều tất yếu Nói cách khác phụ thuộc hàm mơ hình liệu khối ñúng tập khối r(R), tức khối r’(R) nhận ñược cách loại bỏ ñi số phần tử khối r(R) Có thể xem phụ thuộc hàm xấp xỉ mơ hình liệu khối mở rộng phụ thuộc hàm xấp xỉ mơ hình liệu quan hệ Cho R = (id; A1, A2,… An), r khối R, , X → Y kí hiệu phụ thuộc hàm Giả sử r thoả phụ thuộc hàm X → Y Khi id = {x} thì: r trở thành quan hệ r(id;A1,A2,… An) Phụ thuộc hàm X → Y trở thành phụ thuộc hàm mơ hình liệu quan hệ 3.4 Phụ thuộc hàm xấp xỉ mơ hình liệu quan hệ Định nghĩa 3.2: Cho U tập thuộc tính, R(U) lược ñồ quan hệ U Cho X,Y, ⊆ U Khi đó, Y gọi phụ thuộc hàm xấp xỉ vào X lược ñồ R(U) với mức độ α ∈ [0,1] kí hiệu X ≈α Y , dựa số tối thiểu hàng cần loại bỏ khỏi r ñể phụ thuộc X ≈α Y thành X → Y ñược xác ñịnh sau: = Định nghĩa 3.3: Cho U tập thuộc tính, R(U) lược đồ quan hệ U Cho X , Y ⊆ U , Độ ño lỗi phụ thuộc hàm xấp xỉ X ≈α Y ñược xác ñịnh sau: TRƯỜNG ĐẠI HỌC THỦ ĐÔ H 62 Từ đó: X → Y NỘI ứng với ngưỡng lỗi α ∈ [0,1] g3 ( X → Y ) ≤ α X → Y phụ thuộc hàm g3 = Một số tính chất: − Tính chất 1: Cho r quan hệ tập thuộc tính R Một phụ thuộc hàm r phụ thuộc hàm xấp xỉ loại với mức tuỳ ý (0 δ