1. Trang chủ
  2. » Công Nghệ Thông Tin

Bài giảng môn học Cơ sở dữ liệu - Chương 7: Phụ thuộc hàm và chuẩn hóa cơ sở dữ liệu

59 15 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 59
Dung lượng 2,34 MB

Nội dung

Bài giảng Cơ sở dữ liệu: Chương 7 - Phụ thuộc hàm và chuẩn hóa cơ sở dữ liệu cung cấp cho các bạn những kiến thức về nguyên tắc thiết kế các lược đồ quan hệ; phụ thuộc hàm; các dạng hàm chuẩn; một số thuật toán chuẩn hóa. Bài giảng phục vụ cho các bạn chuyên ngành Công nghệ thông tin và những bạn quan tâm tới lĩnh vực này.

Chương Phụ thuộc hàm Chuẩn hóa sở liệu Nội dung trình bày  Nguyên tắc thiết kế lược đồ quan hệ  Phụ thuộc hàm  Các dạng chuẩn  Một số thuật toán chuẩn hóa Ngun tắc thiết kế  Nhìn lại vấn đề thiết kế csdl • Dựa trực quan người thiết kế • Thiếu tiêu chuẩn hình thức để đánh giá  Đánh giá chất lượng thiết kế • • • • Ngữ nghĩa thuộc tính Giảm giá trị thừa Giảm giá trị null Không để xuất khơng có thực Ngữ nghĩa thuộc tính (1) NHANVIEN Ten MaNV f.k NgSinh DChi f.k DUAN TrPhong Ten MaPhong p.k PHONGBAN Ten MaPB MaDA p.k Diadiem p.k p.k TRUSO_PHONG f.k f.k MaPB Truso f.k THAMGIA f.k f.k MaNV MaDA p.k SoGio PhongQly Ngữ nghĩa thuộc tính (2) NHANVIEN_PHONGBAN TenNV MaNV NgSinh f.k DChi MaPB TenPB TrPhong p.k NHANVIEN_DUAN MaNV MaDA f.k Gio TenNV TenDA Diadiem p.k  Ý nghĩa thuộc tính dễ hiểu lược đồ thiết kế tốt  Tránh tổ hợp thuộc tính nhiều kiểu thực thể vào lược đồ Thông tin thừa (1) NHANVIEN Ten Hung MaNV NgSinh DChi MaPhong 123456789 09/01/1965 … 333445555 08/12/195 … Vuong 99988777 19/01/1968 … Nghia PHONGBAN Ten MaPB Nghien cuu TrPhong 333445555 NHANVIEN_PHONGBAN TenNV MaNV NgSinh DChi MaPB TenPB TrPhong Hung 123456789 09/10/1965 … Nghien cuu 333445555 Nghia 333445555 08/12/196 5 Nghien cuu 333445555 Dữ liệu bị trùng lặp Thông tin thừa (2)  Dị thường thêm NHANVIEN_PHONGBAN TenNV Nghia MaNV NgSinh DChi MaPB TenPB TrPhong Nghien cuu 333445555 Hung 333445555 08/12/196 … 123456789 09/10/1965 … null null Nghien cuu 99988777 Hanh 987654321 null null chinh  Dị thường xóa NHANVIEN_PHONGBAN TenNV Nghia Hung MaNV NgSinh DChi 333445555 08/12/196 … 123456789 09/10/1965 … MaPB TenPB TrPhong Nghien cuu 333445555 Nghien cuu 333445555 Thông tin thừa (3)  Dị thường sửa NHANVIEN_PHONGBAN TenNV Nghia Hung MaNV NgSinh DChi 333445555 08/12/196 … 123456789 09/10/1965 … MaPB TenPB TrPhong Nghien cuu 123456789 333445555 Nghien cuu 123456789 333445555  Tránh xảy dị thường cập nhật liệu  Có thể vi phạm nguyên tắc để tăng hiệu truy vấn liệu Khi dị thường cần ghi cẩn thận Giá trị null  Nếu nhiều thuộc tính lược đồ nhận giá trị null • Lãng phí khơng gian lưu trữ • Khó khăn thực phép tốn kết • Khó khăn sử dụng hàm tập hợp  Tránh lưu trữ thuộc tính nhận nhiều giá trị null Phát sinh khơng có thực (1) NHANVIEN_DUAN MaNV MaDA Gio TenNV TenDA Diadiem 123456789 32.5 Hung San pham X Tan Binh 123456789 7.5 Hung San pham Y Thu Duc 333445555 10 Nghia San pham Y Thu Duc NHANVIEN_DIADIEM TenNV Diadiem p.k NHANVIEN_DUAN1 MaNV MaDA SoGio TenDA Diadiem p.k Dạng chuẩn Boyce - Codd (2) R11 A B C D a a a b b a b b R111 Trùng lặp liệu R112 A C D D B a 1 a b b a b Dạng chuẩn Boyce - Codd (3) R112 R111 A FD1 C D B D FD5 lược đồ thuộc dạng chuẩn BC  Nhận xét • Mọi lược đồ quan hệ thuộc dạng chuẩn BC thuộc dạng chuẩn • Dạng chuẩn BC đơn giản chặt chẽ dạng chuẩn • Mục tiêu q trình chuẩn hóa đưa lược đồ quan hệ dạng chuẩn BC Thiết kế Top-Down  Các bước thực • Thiết kế lược đồ mức khái niệm với mơ hình liệu cấp cao (EER) • Chuyển lược đồ khái niệm thành tập hợp quan hệ • Với quan hệ xác định tập PTH • Áp dụng quy tắc chuẩn hóa để loại bỏ PTH phận bắt cầu quan hệ Nội dung trình bày  Nguyên tắc thiết kế lược đồ quan hệ  Phụ thuộc hàm  Các dạng chuẩn  Một số thuật tốn chuẩn hóa Phân rã lược đồ quan hệ  Lược đồ quan hệ chung R(A1, …, An) • Tập hợp tất thuộc tính thực thể  Xác định tập PTH F R  Phân rã • Sử dụng thuật tốn chuẩn hóa để tách R thành tập lược đồ D = {R1, …, Rm}  u cầu • Bảo tồn thuộc tính • Các lược đồ Ri phải dạng chuẩn Boyce-Codd Phân rã bảo toàn PTH (1)  Tính chất bảo tồn PTH • Xét lược đồ R tập PTH F Giả sử R phân rã thành D = {R1, …, Rm} - Đặt πRi(F) = {X → Y ∈ F+ : X ∪ Y ⊂ Ri} - D gọi phân rã bảo toàn phụ thuộc hàm F (πR1(F) ∪ … ∪ πRm(F))+ = F+  Ví dụ R111 R11 A FD1 B C D A C FD1 FD2 R112 FD5 B FD5 D D Phân rã bảo toàn PTH (2) R11 R111 A B C D α β 2 β γ 3 α δ A C D β R112 D B 2 α γ 3 β δ α β A B C D α β … … … … α β Thêm (4, β, 4) vào R111 (4, α) vào R112 trạng thái csdl khơng thỏa PTH FD2 Phân rã bảo toàn PTH (3)  Định lý 7.1 • Tồn phân rã bảo toàn PTH D = {R1, …, Rm} lược đồ R tập PTH F cho Ri dạng chuẩn  Thuật tốn 7.4 • Nhập: R(U), U = {A1, …, An} tập PTH F • Xuất: D = {R1, …, Rm}, Ri dạng chuẩn • B1: - Tìm phủ tối thiểu G F • B2: - Với X → Ai ∈ G, xây dựng lược đồ Ri(Ui), Ui = X ∪ {Aj} Khóa Ri X Phân rã bảo tồn PTH (4) • B3: - Giả sử xong B2 ta có lược đồ R1, …, Rm Nếu U1 ∪ … ∪ Um ≠ U xây dựng thêm lược đồ Rm+1(Um+1), Um+1 = U - (U1 ∪ … ∪ Um) Khóa Rm+1 Um+1 • B4: - Xuất lược đồ Ri Ví dụ phân rã bảo tồn PTH (1)  Cho • R(ABCDEFG) • F = {B → A, D → C, D → EB, DF → G}  Tách dạng chuẩn 3, bảo tồn PTH • B1: - Phủ tối thiểu G = {B → A, D → C, D → B, D → E, DF → G} • B2: R(ABCDEFG) R1(BA) R(DC) • B3: - Xuất D = {R1, R2, R3} R(DB) R2(DBCE) R(DE) R3(DFG) Ví dụ phân rã bảo tồn PTH (2)  Cho • R(ABCDEFGHI) • F = {B → A, D → C, D → EB, DF → G}  Tách dạng chuẩn 3, bảo tồn PTH • B1: - Phủ tối thiểu G = {B → A, D → C, D → B, D → E, DF → G} • B2: R(ABCDEFG) R1(BA) R2(DBCE) R3(DFG) • B3: - Vì U1 ∪ U2 ∪ U3 = {ABCDEFG} nên đặt R4(HI) • B4: - D = {R1, R2, R3, R4} Phân rã không thông tin (1)  Tính chất khơng thơng tin • Xét lược đồ R tập PTH F Giả sử R phân rã thành D = {R 1, …, Rm} - D gọi phân rã không thông tin F với trạng thái r ∈ R (πR1(r) * … * πRm(r)) = r  Định lý 7.2 • Phân rã D = {R1(U1), R2(U2)} R(U) không thông tin tập PTH F nếu: - (U1 ∩ U2) → (U1 – U2) ∈ F+, - (U1 ∩ U2) → (U2 – U1) ∈ F+  Định lý 7.3 • Nếu phân rã D = {R1, …, Rm} R không thông tin F phân rã Di = {Q1, …, Qk} Ri không thông tin πRi(F) D’ = {R1, …, Ri-1, Q1, …, Qk, Ri+1, …, Rm} R không thông tin Phân rã không thông tin (2)  Thuật tốn 7.5 • Nhập: R(U), U = {A1, …, An} tập PTH F • Xuất: D = {R1, …, Rm}, Ri dạng chuẩn Boyce-Codd • B1: - D = {R}; • B2: - Nếu có lược đồ Q(UQ) ∈ D không dạng chuẩn BC + Tìm X → Y ∈ πQ(F) làm Q vi phạm điều kiện BC + D = (D - {Q}) ∪ Q1(UQ1) ∪ Q2(UQ2) với UQ1 = UQ - Y UQ2 = X ∪ Y + Quay lại B2 - Ngược lại, chuyển sang B3 • B3: - Xuất D Ví dụ phân rã khơng thơng tin (1)  Cho: • R(ABCDEFG) • F = {B → A, D → C, D → EB, DF → G}  Tách dạng chuẩn BC, không thông tin R(ABCDEFG) F, KR = DF B →A {B → A}, KR1 = B R1(BA) R2(BCDEFG) {D → C, D → EB, DF → G}, KR2 = DF D → BCE {D → C, D → EB}, KR3 = D R3(DBCE) R4(DFG) {DF → G}, KR4 = DF Ví dụ phân rã không thông tin (2) R(ABCDEFG) F, KR = DF D → BCE {D → BCE}, KR1 = D R2(ADFG) {D → A, DF → G}, KR2 = DF R1(DBCE) D →A {D → A}, KR3 = D R3(DA) R4(DFG) {DF → G}, KR4 = DF ...  Phụ thuộc hàm  Các dạng chuẩn  Một số thuật tốn chuẩn hóa Chuẩn hóa lược đồ CSDL  Chuẩn hóa gì?  Các dạng chuẩn gì?  Các dạng chuẩn • Dạng (1 Normal Form - 1NF) • Dạng (2 Normal Form -. .. quan hệ thuộc dạng chuẩn • Dạng chuẩn dẫn đến trùng lặp liệu Do gây dị thường cập nhật liệu Dạng chuẩn theo khóa (1)  Lược đồ quan hệ R gọi thuộc dạng chuẩn thuộc tính khơng khóa R phụ thuộc. .. lặp liệu • Dạng chuẩn dạng chuẩn tối thiểu thiết kế CSDL Dạng chuẩn tổng quát  Lược đồ quan hệ R gọi thuộc dạng chuẩn thuộc tính khơng khóa R phụ thuộc đầy đủ vào khóa R  Cho R(ABCDEF) có khóa

Ngày đăng: 20/05/2021, 04:11

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN