Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 25 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
25
Dung lượng
421 KB
Nội dung
1 Chương6Chương6ChuẩnhóaChuẩnhóa (Normalization) (Normalization) 1 2 Khái niệm “Chuẩn hóa” • Chuẩnhóa được xem như là một công cụ dùng trong các pp thiết kế CSDL – Chuẩnhóa được thực hiện sau khi thiết kế CSDL dùng mô hình ER • Là quá trình đánh giá và chỉnh sửa cấu trúc bảng để giảm thiểu dư thừa dữ liệu – Dư thừa dữ liệu có khả năng làm cho dữ liệu không nhất quán (mâu thuẫn dữ liệu) • Các dạng chuẩn 1NF, 2NF, 3NF, BCNF 3 Bảng chưa chuẩnhóa Bảng chưa chuẩnhóa • Bảng không ở dạng chuẩn 1 ( hay chưa chuẩn hóa) nếu nó chứa một hoặc nhiều nhóm giá trị lặp • Nhóm giá trị lặp(Repeating group) 3 PROJ_NUM PROJ_NAME EMP_NUM EMP_NAME 15 Evergreen 103, 101, 105 June E. Arbough, John G. News, Alice K. Johnson 18 Amber Wave 114, 118, 104 Annelise Jones, James J. Frommer, Anne K. Ramoras Nhóm giá trị lặp 4 Dạng chuẩn 1 (1NF) Dạng chuẩn 1 (1NF) • Lược đồ quan hệ R ở dạng chuẩn 1 _ First Normal Form, First Normal Form, nếu – Có khóa chính, và – Không có nhóm lặp lại 4 PROJ_NUM PROJ_NAME EMP_NUM EMP_NAME 15 Evergreen 103 June E. Arbough 15 Evergreen 101 John G. News 15 Evergreen 105 Alice K. Johnson 18 Amber Wave 114 Annelise Jones 18 Amber Wave 118 James J. Frommer 18 Amber Wave 104 Anne K. Ramoras 5 Dạng chuẩn 2 (2NF) • Lược đồ quan hệ R(U,F) ở dạng chuẩn 2 khi : – Bảng ở dạng chuẩn 1, và – Mọi thuộc tính không khóa đều phụ thuộc đầy đủ vào mọi khóa của R • Nhận xét : Nếu R chỉ có các khóa gồm một thuộc tính thì đương nhiên R ở dạng chuẩn 2 • Phụ thuộc hàm đầy đủ _ Full functional dependency Full functional dependency – XA là phụ thuộc hàm đầy đủ ⇔ ∃ Y ⊂ X , YA – Ngược lại : XA là phụ thuộc hàm không đầy đủ 6 Dạng chuẩn 2 (2NF) • Lược đồ sau không đạt 2NF Q(PROJ_NUM, EMP_NUM, PROJ_NAME, EMP_NAME) với tập F = { f1: PROJ_NUM, EMP_NUM PROJ_NAME, EMP_NAME f2: EMP_NUM EMP_NAME f3: PROJ_NUM PROJ_NAME } Gọi : f1 là phụ thuộc hàm không đầy đủ f2, f3 là phụ thuộc riêng phần_ partial FD 7 Dạng chuẩn 3 (3NF ) Dạng chuẩn 3 (3NF ) • Định nghĩa 1: Lược đồ quan hệ R ở 3NF đối với tập phụ thuộc hàm F nếu: – R ở dạng 2NF, và – Mọi thuộc tính không khóa đều không phụ thuộc bắc cầu vào khóa chính của R • Định nghĩa 2: Lược đồ quan hệ R ở 3NF đối với tập phụ thuộc hàm F nếu: – R ở dạng chuẩn 1, và ∀ X->A với A ∉X thì X là 1 siêu khoá của R hoặc A là 1 thuộc tính khoá 7 8 Dạng chuẩn 3 (3NF ) Dạng chuẩn 3 (3NF ) • Lược đồ sau không đạt 3NF Q( EMP_NUM, EMP_NAME, JOB_CLASS, CHG_HOUR ) với tập F = { f1 : EMP_NUM EMP_NAME,JOB_CLASS,CHG_HOUR f2 : JOB_CLASS CHG_HOUR } => f2 là phụ thuộc hàm bắc cầu (transitive dependency) 9 Dạng chuẩn BCNF • BCNF được xem là trường hợp đặc biệt của 3NF • Lược đồ quan hệ R(U,F), được gọi là đạt BCNF nếu mọi X →A ∈ F , A∉X thì X là một siêu khóa của R • Lược đồ quan hệ sau không đạt BCNF R( Proj_name, Emp_name, Assign_hours ) với 2 phụ thuộc hàm f1: Proj_name, Emp_name Assign_hours f2: Assign_hours Emp_num 10 Dạng chuẩn _ nhận xét • Các qui tắc xác định các dạng chuẩn đều dựa vào khóa • Dạng chuẩn 2NF tốt hơn 1NF; 3NF tốt hơn 2NF, … – Mỗi dạng chuẩn đưa ra các điều kiện bổ sung cho dạng chuẩn thấp hơn nó 1NF 2NF 3NF BCNF [...]... EMP_NUM Đạt BCNF 16 16 Chuẩnhóa và Thiết kế CSDL • Chuẩnhóa được xem như một phương pháp thiết kế CSDL độc lập – Có 2 cách tiếp cận : tổng hợp và phân rã • Với phần lớn các mục tiêu thiết kế DB : 3NF là dạng chuẩn cao cần đạt tới trong q trình chuẩnhóa – Dạng chuẩn cao nhất khơng phải ln ln là mục tiêu cần đạt tới – Giảm dạng chuẩn 17 Chuẩnhóa LDQH bằng Phân rã • Q trình chuẩnhóa LDQH là q trình... 12 Ví dụ về chuẩnhóa Chuyển đổi sang dạng chuẩn 2 Loại bỏ các phụ thuộc hàm riêng phần và tạo thêm các Lược đồ quan hệ mới tương ứng 13 Ví dụ về chuẩnhóa Chuyển đổi sang dạng chuẩn 3 • Loại bỏ các phụ thuộc bắc cầu trong lđqh và tạo ra các lđqh mới tương ứng 14 Lược đồ CSDL kết quả Sau q trình chuẩnhóa Q, ta thu được một lược đồ CSDL đạt 3NF 15 Ví dụ về chuẩnhóa Chuyển đổi sang dạng chuẩn BCNF •...Q trình chuẩnhóa lược đồ CSDL • Thực hiện chuẩnhóa từng lược đồ quan hệ – Là q trình biến đổi dạng chuẩn của một lược đồ quan hệ từ thấp nhất tới dạng chuẩn cao nhất – Phân tách một LĐQH dần dần thành nhiều LĐQH mới dựa trên việc nhận diện các phụ thuộc hàm • Dạng chuẩn của một lược đồ CSDL bằng dạng chuẩn của lược đồ quan hệ cao nhất 11 Ví dụ về chuẩnhóa Xét R(U,F) đạt dạng chuẩn 1 R ( PROJ_NUM,... thiểu • Áp dụng thuật tốn trên Q được phân rã thành các lược đồ con Q1(CT) Q2(HRC) Q3(THR) Q4(CSG) Q5(HSR) • Khóa của Q là HS ∀ ⇒Q1,Q2,Q3,Q4,Q5 chính la ket qua phân rã 24 Tóm tắt Tồn tại nhiều phụ thuộc hàm trong một LĐQH Dư thừa dữ liệu Chuẩnhóa LĐQH Các dạng chuẩn 1NF, 2NF, 3NF, BCNF Chuẩnhóa bằng Phân rã 25 ... thuộc hàm X → A ∈ Ftt thì XA là một lược đồ cần tìm – Nếu có một lược đồ con chứa khóa K của Q thì kết thúc thuật tốn Ngược lại tạo một lược đồ con K 23 Thuật tốn phân rã thành 3NF bảo tồn thơng tin , bảo tồn phụ thuộc hàm Ví dụ: cho lược đồ Q(CTHRSG),F={C→T,HR→C,TH→R,CS→G,HS→R} Hãy phân rã Q thành các lược đồ con đạt dạng chuẩn 3 vừa bảo tồn thơng tin vừa bảo tồn phụ thuộc hàm? Giải: • F = Ftt = {C→T,HR→C,TH→R,CS→G,HS→R}... cao nhất khơng phải ln ln là mục tiêu cần đạt tới – Giảm dạng chuẩn 17 Chuẩnhóa LDQH bằng Phân rã • Q trình chuẩnhóa LDQH là q trình phân rã LDQH ban đầu thành một số LDQH con – Các LDQH con đạt dạng chuẩn cao hơn => giảm dư thừa dữ liệu • Về mặt lý thuyết, q trình phân rã phải đảm bảo 2 u cầu – Bảo tồn thơng tin – Bảo tồn phụ thuộc hàm • Thuật tốn phân rã thành BC (hay 3NF) bảo tồn thơng tin và bảo