Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 26 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
26
Dung lượng
399,69 KB
Nội dung
HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - TRẦN VĂN SẢN NGHIÊN CỨU, SO SÁNH CÁC PHƯƠNG PHÁP PHÂN RÃ, DỊCH CHUYỂN SƠ ĐỒ QUAN HỆ Chuyên ngành: KHOA HỌC MÁY TÍNH Mã số: : 60.48.01 TĨM TẮT LUẬN VĂN THẠC SỸ KĨ THUẬT HÀ NỘI – 2012 Luận văn hồn thành tại: HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG Người hướng dẫn khoa học : PGS-TS Nguyễn Bá Tường Phản biện 1: PGS-TS Đặng Văn Chuyết Phản biện 2: PGS-TS Đỗ Năng Toàn Luận văn bảo vệ trước Hội đồng chấm luận văn thạc sĩ Học viện Cơng nghệ Bưu Viễn thơng Vào lúc: 10h10 ngày.20 tháng 01 năm 2013 Có thể tìm hiểu luận văn tại: - Thư viện Học viện Cơng nghệ Bưu Viễn thơng i MỞ ĐẦU i.1 Giới thiệu đề tài Trong quản lý sở liệu (CSDL), phụ thuộc liệu hiểu mệnh đề mô tả ràng buộc mà liệu phải đáp ứng thực tế Nhờ có mô tả phụ thuộc mà hệ quản trị sở liệu quản lý tốt chất lượng liệu Lý thuyết phụ thuộc liệu đóng vai trị quan trọng việc mơ tả giới thực, phản ánh ngữ nghĩa liệu sở liệu Phụ thuộc liệu Codd, tác giả mơ hình liệu quan hệ đặt móng từ năm 70 với khái niệm phụ thuộc hàm Sau loạt tác giả khác tiếp tục phát triển dạng phụ thuộc bậc cao, phụ thuộc mờ xây dựng hệ tiên đề cho lớp phụ thuộc tức đặt sở lý thuyết phụ thuộc liệu Một điều tự nhiên từ ngày đầu phát triển lý thuyết thiết kế sở liệu, logic chọn ngôn ngữ hữu hiệu để đặc tả phụ thuộc liệu, đó, số loại hình phụ thuộc liệu đa dạng đề xuất phát triển sau này, phụ thuộc logic luôn trọng tâm ý nhóm nghiên cứu Đề tài tập trung vào tìm hiểu nghiên cứu khái niệm phép phân rã, phép dịch chuyển sơ đồ quan hệ, đưa chúng dạng thu gọn nhận biểu diễn quan trọng cho bao đóng, khóa phản khố Các kết thu sử dụng trình thiết kế sở liệu Một nhận xét tự nhiên kích thước sơ đồ quan hệ nhỏ thuật tốn phát huy hiệu Một số hướng nghiên cứu tinh giản sơ đồ sở liệu thực thông qua phép biến đổi tương đương, chẳng hạn đưa tập phụ thuộc hàm dạng thu gọn thu gọn tự nhiên, dạng không dư, dạng tối ưu … công bố Để giải vấn đề ta dùng phép “phân rã”, tức tách sơ đồ quan hệ thành sơ đồ quan hệ với mong muốn sơ đồ quan hệ đạt dạng chuẩn cao sơ đồ quan hệ ban đầu Như giảm (hay khơng cịn) thơng tin bị dư thừa quan hệ Mục đích phép phân rã nhằm loại bỏ file liệu dư thừa loại bỏ dị thường: không quán, dị thường thêm dịng, dị thường xóa dịng quan hệ, thực phép cập nhật (sửa, thêm, xóa) Trong phép dịch chuyển sơ đồ quan hệ Bản chất kỹ thuật loại bỏ khỏi sơ đồ quan hệ ban đầu số thuộc tính khơng quan trọng theo nghĩa chúng không làm ảnh hưởng đến kết tính tốn đối tượng quan tâm bao đóng, khóa, Mặc dù sơ đồ quan hệ thu qua phép thu gọn không tương đương với sơ đồ quan hệ ban đầu, ta thu đối tượng cần tìm phép toán đơn giản loại bỏ thêm số thuộc tính Điều lý thú sau loại bỏ số thuộc tính số phụ thuộc hàm loại bỏ theo, chúng trở thành phụ thuộc hàm tầm thường (có vế trái chứa phải) mang thơng tin tiền định (đó phụ thuộc hàm dạng Ø→X) i.2 Nội dung đề tài, vấn đề cần giải Mục tiêu luận văn tìm hiểu kỹ thuật thu gọn sơ đồ quan hệ dựa “phương pháp phân rã sơ đồ quan hệ” “phương pháp dịch chuyển sơ đồ quan hệ” - Sử dụng số thuật ngữ dịch chuyển, phân rã, chiếu sơ đồ quan hệ để làm sáng tỏ khái niệm thu gọn sơ đồ quan hệ nội dung luận văn Vấn đề cần quan tâm phân rã, dịch chuyển SĐQH có đảm bảo tái thiết sơ đồ quan hệ hay khơng, q trình phân rã, dịch chuyển có làm thơng tin khơng? Các đối tượng phân rã, dịch chuyển sơ đồ quan hệ W thông qua phép phân rã, dịch chuyển sơ đồ quan hệ theo tập thuộc tính U Khảo sát phụ thuộc phép phân rã, dịch chuyển thơng qua tính chất tập thuộc tính U Khảo sát hai dạng biểu diễn khóa lược đồ quan hệ qua phép phân rã, dịch chuyển Xây dựng hệ trình minh họa mơ kết thực tế đánh giá kết lý thuyết i.3 Phương pháp nghiên cứu Tiếp cận chủ yếu để giải vấn đề đặt phạm vi đề tài tiên đề hóa Các hệ tiên đề xây dựng sở hệ suy dẫn hình thức với tính chất đối tượng sở mối liên hệ chúng Cơ sở toán học hệ tiên đề định lý tính xác đáng đầy đủ với định lý điều kiện cần đủ cho hệ tiên đề tương đương Tiếp cận hình thức vận dụng chủ yếu phương pháp cấu trúc toán học rời rạc (bao gồm logic hình thức), kết hợp với phương pháp đối sánh, mơ hình hóa, tối ưu quy hoạch rời rạc Kết hợp chặt chẽ lý thuyết thực hành, sử dụng phát triển phần mềm nói chung phần mềm tốn học nói riêng để kiểm định thể kết lý thuyết i.4 Phạm vi ứng dụng Các kết thu vận dụng cho quy trình thiết kế sở liệu dùng hệ thống thông tin, cụ thể là: Bảo tồn phụ thuộc hàm, khơng mát thông tin, loại bỏ dư thừa liệu Đây tiêu chuẩn hệ thống thông tin Với CSDL lớn phức tạp có nhiều thuộc tính, phải dùng phương pháp biến đổi SĐQH để đưa chúng dạng tối ưu, đáp ứng tiêu chuẩn Về lý thuyết, luận văn tập trung vào kết sau đây: - Khái niệm sở lý thuyết mơ hình quan hệ - Khái niệm phép phân rã sơ đồ quan hệ - Khái niệm phép dịch chuyển sơ đồ quan hệ - Phát biểu chứng minh phương pháp phân rã dọc sơ đồ quan hệ, phân rã có nối khơng tổn thất, phân rã bảo tồn phụ thuộc, phân rã thành dạng chuyển BCNF - Phát biểu chứng minh cơng thức tính bao đóng qua phép dịch chuyển lược đồ quan hệ, - Phân tích thuật tốn Chase kiểm tra việc phân rã có nối khơng tổn thất khơng, kiểm tra phân rã có bảo tồn phụ thuộc khơng, thuật tốn phân rã thành dạng chuẩn BCNF - Phân tích thuật tốn dịch chuyển SĐQH, Về thực hành luận văn cài đặt chương trình ứng dụng nhằm mục đích mơ kết nghiên cứu học viên Nội dung : Chương CƠ SỞ LÝ THUYẾT CỦA MƠ HÌNH QUAN HỆ Chương Giới thiệu mơ hình liệu quan hệ mơ hình sử dụng rộng rãi đời sống xã hội tổ chức, quan, xí nghiệp tính tính trực quan, kiến trúc đơn giản có sở tốn học chặt chẽ Mơ hình quan hệ biểu thị liệu CSDL tập quan hệ, coi bảng giá trị gồm hàng cột Mỗi hàng bảng tập giá trị có liên quan với nhau, giá trị biểu thị kiện tương ứng với thực thể hay mối quan hệ giới thực Trong chương nêu số khái niệm quan hệ sở quan hệ 1.1.Khái niệm quan hệ Cho U={A1,A2, ,An} tập hữu hạn, khơng rỗng thuộc tính Mỗi thuộc tính Ai có miền giá trị D(Ai) 1.2 Các phép toán đại số quan hệ Trên quan hệ ta thực phép toán tập hợp hợp, giao, hiệu, phép tốn người ta thường gọi phép toán đại số quan hệ, 1.2.1 Phép hợp 1.2.1 Phép giao 1.2.3 Phép trừ 1.2.3 Phép chiếu 1.2.5 Tích Descartes 1.2.6 Phép chọn 1.2.7 Phép chia 11 1.3.4.Tính tương đương tập phụ thuộc hàm Gọi F G hai tập phụ thuộc hàm Ta nói F G tương đương F+=G+ Ký hiệu F G 1.3.5 Các tập phụ thuộc hàm tối thiểu Một tập phụ thuộc hàm tối thiểu thoả mãn điều kiện sau : Mỗi vế phải phụ thuộc hàm F có thuộc tính Khơng tồn phụ thuộc hàm X→A thuộc F tập thực Z X mà F+=(F{X→A}{Z→A})+ Không tồn phụ thuộc hàm X→A thuộc F mà F+={F-{X→A}}+ 1.3.6 Bao đóng Bao đóng F+của tập phụ thuộc hàm F, cho lược đồ U = {A1, A2, An} F tập phụ thuộc hàm U Định nghĩa: Bao đóng tập phụ thuộc hàm F 12 Bao đóng tập phụ thuộc hàm F ký hiệu F + tập tất phụ thuộc hàm f suy dẫn từ tập F dựa vào luật hệ tiên đề Armstrong Vậy F + = {f: F = f} với F = f ký hiệu F suy dẫn f 1.4 Khoá khố chính, khố ngoại Trong thuộc tính phụ thuộc hàm có thuộc tính đóng vai trị “xác định” thuộc tính khác “khóa” 1.4.1.Định nghĩa : Khố (key) tối tiểu Tập thuộc tính K U gọi khoá tối tiểu W = thoả mãn hai điều kiện: (1) K+ = U (2) B K: (K-{B})+ U (hay K U) Vậy tập K U gọi khóa tối tiểu sơ đồ quan hệ W = K tập tối tiểu kéo theo U 1.4.2.Định nghĩa : Khoá quan hệ R K U gọi khoá R nếu: 13 Mọi cặp ti tj khác R ta ln có ti.K tj.K K tối thiểu 1.4.3.Định nghĩa : Khố chính-khố ngoại Khố quan hệ R khoá R chọn làm khố Khố ngoại quan hệ R trường liệu đóng vai trị khố quan hệ khác 1.5 Các dạng chuẩn sơ đồ quan hệ Trong quản lý, xử lý hệ sở liệu thường phải đưa CSDL dạng đơn giản nhất, cơng kềnh nhất, tốn nhớ nhất, xử lý nhanh có tính đặc thù Để thực mục đích phải tiến hành chuẩn hóa hệ CSDL 1.5.1 Dạng chuẩn – 1NF (First Normal Form) 1.5.2 Dạng chuẩn – 2NF (Second Normal Form) 1.5.3 Dạng chuẩn – 3NF (Third Normal Form) 1.5.4 Dạng chuẩn Boyce Codd – BCNF 14 Một quan hệ chuẩn hóa quan hệ miền giá trị thuộc tính chứa giá trị nguyên tố tức giá trị không phân chia nữa, miền giá trị gọi miền giá trị đơn trị Các lớp dạng chuẩn sơ đồ quan hệ có quan hệ lồng nhau, lớp sau nằm lớp trước Nghĩa ta có 1NF 2NF 3NF BCNF Lồng thực sự, nghĩa lớp sau nằm gọn lớp trước 1NF 2NF 3N FBCN F 4N F Hình 1.1: Sơ đồ biểu thị mối liên hệ lớp chuẩn 15 Chương CÁC PHƯƠNG PHÁP PHÂN RÃ SƠ ĐỒ QUAN HỆ Chương giới thiệu phép “phân rã sơ đồ quan hệ”, tức tách sơ đồ quan hệ thành sơ đồ quan hệ với mong muốn sơ đồ quan hệ đạt dạng chuẩn cao sơ đồ quan hệ ban đầu Các đối tượng phân rã sơ đồ quan hệ W= U={A1, A2, , An} tập hữu hạn khơng rỗng thuộc tính, F tập phụ thuộc hàm U Phân rã W thực chất phân rã U kéo theo phân rã F 2.1 Phân rã dọc sơ sơ đồ quan hệ W= Định nghĩa : Phân rã dọc W = phân chia W = thành W1 = , W2 = , .,Wk=, ký hiệu: W| ->{W1, W2, , Wk} Fi Ui(F+) U = k Ui i 1 2.2.Các phương pháp phân rã dọc sơ đồ quan hệ 16 2.2.1 Phân rã W= có nối khơng tổn thất Định nghĩa : Phép phân rã W| ->{W1, W2, , Wk} gọi phép phân rã có nối khơng tổn thất quan hệ R U ln có đẳng thức: R = R1|>{W1, W2, , Wk}; Wi = < Ui, k Fi> ; Ri = R[Ui] Fi πUi(F+) U = Ui phân i 1 k rã W Đặt G = Fi i 1 2.2.3 Phân rã thành dạng chuẩn BCNF Định nghĩa : Phép phân rã W | -> {W1,W2 , ,Wk}; Wi = ; Ri = R[Ui] Fi Ui(F+) k U= Ui phân rã W thành BCNF i 1 sơ đồ Wi = BCNF 2.2.4 Phân rã tổng hợp 17 Phân rã tổng hợp phân rã thành BCNF, bảo toàn phụ thuộc, có nối khơng tổn thất Định nghĩa: Cho W=; W| ->{W1, W2, , Wk}; Wi = ; Fi =Ui(F+) phân rã W thành BCNF bảo tồn phụ thuộc, có nối khơng tổn thất phép phân rã thỏa mãn điều kiện Chương PHÉP DỊCH CHUYỂN, PHÉP CHIẾU SƠ ĐỒ QUAN HỆ, NHẬN XÉT, SO SÁNH PHƯƠNG PHÁP PHÂN RÃ VÀ DỊCH CHUYỂN SƠ ĐỒ QUAN HỆ Chương trình bày kỹ thuật thu gọn sơ đồ quan hệ (SĐQH) gọi phép dịch chuyển sơ đồ quan hệ Bản chất kỹ thuật loại bỏ khỏi SĐQH ban đầu số thuộc tính khơng quan trọng theo nghĩa chúng không làm ảnh hưởng đến kết tính tốn đối tượng quan tâm bao đóng, khóa, phản khóa Mặc dù SĐQH thu qua phép dịch 18 chuyển không tương đương với SĐQH ban đầu, ta thu đối tượng cần tìm phép tốn đơn giản loại bỏ thêm số thuộc tính Điều lý thú sau loại bỏ số thuộc tính số PTH loại bỏ theo chúng trở thành PTH tầm thường (có vế trái chứa phải) mang thông tin tiền định (đó PTH dạng Ø→X) Các phép dịch chuyển SĐQH phát triển cho lớp phụ thuộc logic phụ thuộc hàm cho ta số kết lý thú biểu diễn bao đóng, khóa, phản khóa số dấu hiệu cần đủ để nhận biết đặc trưng tương quan đối tượng nói 3.1 Phép dịch chuyển sơ đồ quan hệ 3.1.1 Định nghĩa Cho hai sơ đồ quan hệ W1 = , W2 = tập thuộc tính M U Ta nói sơ đồ quan hệ W2 nhận từ sơ đồ quan hệ W1 qua phép dịch chuyển theo tập thuộc tính M, sau loại bỏ xuất thuộc tính M sơ đồ W1 thu sơ đồ W2 19 Nếu sau thực phép dịch chuyển theo M cho SĐQH W1 ta thu SĐQH W2 ta viết W2 = W1\M Thao tác loại bỏ M thực sơ đồ W1 = để thu sơ đồ W2= sau: Tính V = U\M có độ phức tạp O(n) với n số lượng thuộc tính U Mỗi PTH XY F ta tạo PTH X\MY\M cho G Thủ tục ký hiệu G=F\M Tính F\M địi hỏi độ phức tạp O(mn) với m số lượng PTH F Như W2=W1\M = thực với độ phức tạp O(mn), tức tuyến tính theo chiều dài liệu vào (của SĐQH W1) Sau thực thủ tục G = F\M nếu: G chứa PTH tầm thường (dạng XY, X Y) ta loại PTH khỏi G G chứa PTH trùng lặp ta bớt PTH 3.1.2 Thuật toán dịch chuyển sơ đồ quan hệ 20 3.1.3 Bổ đề siêu khoá phép dịch chuyển SĐQH Bổ đề : Bổ đề siêu khóa phép dịch chuyển SĐQH Cho hai SĐQH W1 = , W2 = XU Biết W2=W1\X Khi đó: i) Nếu M siêu khóa W1 M\X siêu khố W2 ii) Nếu Z siêu khố W2 ZX siêu khố W1 Nói riêng XUo Z siêu khố W2 Z siêu khố W1 3.1.4 Dịch chuyển sơ đồ quan hệ dạng cân 3.1.4.1 Định nghĩa sơ đồ cân SĐQH W = gọi cân tập PTH F W thoả tính chất sau: Hợp vế trái, vế phải PTH F tập thuộc tính U: LS(F) = RS(F) = U 21 F không chứa PTH tầm thường, tức PTH có vế trái chứa vế phải: X,YU: XY (XYF) Cả hai vế trái phải PTH F rời (không giao nhau): f F: LS(f)RS(f) = Các vế trái PTH F khác đôi một: f, g F: LS(f) = LS(g) f = g Trong đó: LS(F): Tập thuộc tính xuất vế trái RS(F): Tập thuộc tính xuất vế phải Cụ thể là: LS ( F ) LS ( f ) RS ( F ) RS ( f ) f F f F Nhóm tính chất 2-4 cho biết F có dạng thu gọn tự nhiên Như SĐQH cân tập PTH có dạng thu gọn tự nhiên thuộc tính xuất lần vế trái, lần vế phải 3.1.5: Phép dịch chuyển sơ đồ quan hệ đến tập M 3.1.5.1: Định nghĩa phần bù tập thuộc tính M 22 Cho SĐQH W = , M U Tập U\M gọi phần bù M ta ký hiệu M Vậy M = U\M Giả sử ta có tập thuộc tính U = U1 U2 U1 U2 = U1 bù U2 U2 bù U1 3.1.5.2: Định nghĩa phép dịch chuyển SĐQH đến tập M Cho hai SĐQH W1 = , W2 = tập thuộc tính M U Ta nói SĐQH W2 nhận từ SĐQH W1 qua phép dịch chuyển W1 đến tập thuộc tính M, sau loại bỏ xuất thuộc tính M = U\M lược đồ W1 thu lược đồ W2 Vậy W2 = W1 - M 3.2: Phép chiếu sơ đồ quan hệ Cho SĐQH W = tập thuộc tính M U 3.2.1: Định nghĩa phép chiếu tập phụ thuộc hàm F lên tập thuộc tính M Phép chiếu tập phụ thuộc hàm F lên tập thuộc tính M, ký hiệu ΠM(F) phép loại bỏ thuộc tính khơng thuộc M tập phụ thuộc hàm F 23 3.2.2 : Định nghĩa phép chiếu SĐQH W = lên tập thuộc tính M Cho SĐQH W = tập thuộc tính M U Phép chiếu W lên tập thuộc tính M, ký hiệu ΠM(W) phép đưa W W= Vậy ΠM(W) = 3.2.3 Các phép chiếu sơ đồ quan hệ 3.2.3.1 Phép chiếu hợp lệ Định nghĩa : Phép chiếu hợp lệ Phép chiếu W lên tập thuộc tính M, tức ΠM(W) = < M, ΠM(F)> gọi hợp lệ tập phụ thuộc hàm ΠM(F) thỏa mãn tập thuộc tính M 3.2.3.2 Phép chiếu khơng hợp lệ Định nghĩa : Phép chiếu không hợp lệ Phép chiếu W lên tập thuộc tính M, tức ΠM(W) = gọi không hợp lệ tập phụ thuộc hàm ΠM(F) khơng thỏa mãn tập thuộc tính M 3.3 Nhận xét, so sánh phương pháp phân rã dịch chuyển SĐQH 24 3.3.1 Một vài nhận xét phương pháp phân rã: Khi phân rã SĐQH ta nên phân rã thành sơ đồ con? sơ đồ nên lấy thuộc tính nào? phụ thuộc hàm tốt? Đây vấn đề lý thuyết mà em chưa tìm câu trả lời chắn 3.32 Một vài nhận xét phương pháp dịch chuyển: Đối với phép dịch chuyển M, để ứng dụng phép dịch chuyển ta nên lấy tập M nào? Vì sau phép dịch chuyển M SĐQH W1 ta nhận SĐQH W2 W2 có PTH kiểu X Đây dạng PTH em khơng hiểu Dạng PTH có thực tế không? Tuy nhiên theo yêu cầu Thầy hướng dẫn nội dung luận văn em “Nghiên cứu, so sánh phương pháp dịch chuyển phân rã sơ đồ quan hệ” Sau ta có bảng nhận xét so sánh sau: Bảng 3.1 Bảng so sánh phương pháp dịch chuyển phân rã SĐQH Bảo Bảo toàn Số sơ đồ toàn phụ thuộc tập hàm F thuộc Có nối Các PTH Fi sau thực không sau thực thực hiện phép tổn thất phép phép tốn có tốn có nghĩa 2NF tốn có là BCNF tốn tính U Phân rã Có tổng qt Phân rã có nối khơng tổn Có Sơ đồ sau khơng? Khơng bắt buộc Khơng bắt buộc Nhiều Nhiều Khơng Có bắt buộc Có Có Sơ đồ sau Phép Phép tốn thực thực tốn có ý có ý nghĩa phép phép tốn có nghĩa lý thực tiễn thuyết khơng? Sơ đồ sau 3NF không? Không bắt Không bắt Không bắt buộc buộc buộc Không bắt Không bắt Không bắt buộc buộc buộc Không bắt Không bắt Không bắt buộc buộc buộc Có Có Có Khơng bắt Khơng bắt Khơng bắt buộc buộc buộc Có Có Có Có Có Có Có Có Có Có thất Phân rã bảo tồn phụ Có Có Nhiều Khơng Có bắt buộc thuộc Phân rã thành Có Khơng bắt buộc Nhiều Khơng Có bắt buộc chuẩn BCNF Có thể khơng Phép dịch chuyển Khơng Khơng Khơng Ví dụ X ... kỹ thuật thu gọn sơ đồ quan hệ dựa ? ?phương pháp phân rã sơ đồ quan hệ? ?? ? ?phương pháp dịch chuyển sơ đồ quan hệ? ?? - Sử dụng số thuật ngữ dịch chuyển, phân rã, chiếu sơ đồ quan hệ để làm sáng tỏ... Sơ đồ biểu thị mối liên hệ lớp chuẩn 15 Chương CÁC PHƯƠNG PHÁP PHÂN RÃ SƠ ĐỒ QUAN HỆ Chương giới thiệu phép ? ?phân rã sơ đồ quan hệ? ??, tức tách sơ đồ quan hệ thành sơ đồ quan hệ với mong muốn sơ. .. em ? ?Nghiên cứu, so sánh phương pháp dịch chuyển phân rã sơ đồ quan hệ? ?? Sau ta có bảng nhận xét so sánh sau: Bảng 3.1 Bảng so sánh phương pháp dịch chuyển phân rã SĐQH Bảo Bảo toàn Số sơ đồ toàn