Thiết kế CSDL mức quan niệmDẫn nhập Những mục tiêu chính● Dạng chuẩn● Cấu trúc CSDL tương đương● 2 cách tiếp cận để thiết kế CSDLThiết kế CSDL mức quan niệm– Biến đổi đầu vào thành 1 cấu trúc CSDL quan niệm “tốt” hơn, “phù hợp” hơn với các yêu cầu của môi trường ứng dụng
Thiết kế CSDL mức quan niệm Trình bày: Nguyễn Đăng Khoa Nội dung ● Dẫn nhập - Những mục tiêu chính ● Dạng chuẩn ● Cấu trúc CSDL tương đương ● 2 cách tiếp cận để thiết kế CSDL Dẫn nhập ● Đầu vào: kết quả của giai đoạn phân tích nhu cầu, có thể là – Sơ phác cấu trúc CSDL (bằng 1 mô hình dữ liệu: mô hình quan hệ, thực thể kết hợp, …) gồm các quan hệ con Q' 1 , Q' 2 , … Q' 3 và các phụ thuộc dữ liệu định nghĩa trên mỗi quan hệ con: D' 1 , D' 2 , …, D' m C 0 ' = {<Q 1 ', D' 1 >, <Q 2 ', D' 2 >,…<Q m ', D' m > } (a) – 1 sơ phác tổng thể bao gồm 1 quan hệ duy nhất Q 0 và 1 tập các phụ thuộc D 0 C 0 = <Q 0 , D 0 > (b) Dẫn nhập ● Thiết kế CSDL mức quan niệm – Biến đổi đầu vào thành 1 cấu trúc CSDL quan niệm “tốt” hơn, “phù hợp” hơn với các yêu cầu của môi trường ứng dụng – Dựa trên 1 số tiêu chuẩn thiết kế C 0 ' = <Q' i , D' i > C 0 = <Q 0 , D 0 > Thiết kế CSDL mức quan niệm C = <Q j , D j > Giả thuyết quan hệ phổ quát ● Là nền tảng của các nghiên cứu về mô hình quan hệ và phụ thuộc dữ liệu ứng dụng vào việc thiết kế CSDL ● Khái niệm quan hệ phổ quát – Mỗi môi trường ứng dụng đều có thể được mô hình hóa bằng 1 quan hệ duy nhất, gọi là quan hệ phổ quát, ký hiệu U – Quan hệ phổ quát tập trung tất cả các thuộc tính của môi trường ứng dụng Giả thuyết quan hệ phổ quát ● Nếu cấu trúc sơ phác CSDL là C 0 ' (trường hợp a), ngầm hiểu quan hệ phổ quát U như sau: – U chứa tất cả các thuộc tính của quan hệ con Q' i – Mỗi quan hệ con Q' i là kết quả của phép chiếu của U lên Q' i + : ∀i, Q' i = U[Q' i + ] ● Nếu cấu trúc sơ phác là C 0 (trường hợp b), khái niệm quan hệ phổ quát đã ngầm được sử dụng Giả thuyết quan hệ phổ quát ● Hệ quả i. Mỗi 1 thuộc tính có 1 ý nghĩa duy nhất. Dù thuộc tính này hiện diện trong quan hệ con hay quan hệ phổ quát, ý nghĩa của nó vẫn như nhau ii. Giữa 2 thuộc tính chỉ có 1 mối kết hợp mang ý nghĩa duy nhất Ví dụ 3.1 ● Cho môi trường ứng dụng với 3 quan hệ con như sau ĐẶT_HÀNG (Mã_ĐH, Ngày), ℱ ĐH = {Mã_ĐH → Ngày} THỐNG_KÊ_HÀNG_GIAO (Mã_HG, Ngày, Lượng) ℱ TKHG = {Mã_HG, Ngày → Lượng} CHI_TIẾT_ĐẶT_HÀNG (Mã_ĐH, Mã_HG, Lượng) ℱ CTĐH = {Mã_ĐH, Mã_HG → Lượng} Ví dụ 3.1 ● Các thuộc tính Ngày và Lượng có ý nghĩa khác nhau trong các quan hệ khác nhau ● Gây ra tình trạng nhập nhằng về ngữ nghĩa, dẫn đến kết quả sai trong quá trình thiết kế lại cấu trúc CSDL khi áp dụng luật dẫn cho phụ thuộc dữ liệu trên toàn cục – Từ (Mã_ĐH → Ngày) và (Mã_HG, Ngày → Lượng) ta suy dẫn được PTH (Mã_HG, Mã_ĐH → Lượng), dù PTH này không đúng trên thực tế Ví dụ 3.1 ● Phải đặt tên lại cho các thuộc tính – Ngày trong ĐẶT_HÀNG thành Ngày_ĐH – Ngày trong THỐNG_KÊ_HÀNG_GIAO thành Ngày_TK – [...]... tiêu thiết kế ● Hai tiêu chuẩn quan trọng cần đạt được trong quá trình thiết kế CSDL mức quan niệm – Cấu trúc CSDL kết quả (đầu ra của giai đoạn thiết kế mức quan niệm) cần đạt dạng chuẩn cao nhất – Cấu trúc CSDL kết quả phải tương đương với cấu trúc ban đầu Các mục tiêu thiết kế ● Tiêu chuẩn về dạng chuẩn – – ● Giảm tối đa sự trùng lắp thông tin, từ đó tránh được một số bất tiện khi cập nhật CSDL. .. ● Cho quan hệ NHÂN_VIÊN (Mã_NV, Tên_NV, Ngày) Ý nghĩa mối kết hợp giữa Mã_NV và Ngày: Ngày sinh của nhân viên ⇒ Mối kết hợp này là duy nhất: nếu cần thêm thông tin về ngày tuyển dụng, ta phải dùng thêm 1 thuộc tính Ngày_TD, không thể thêm 1 ý nghĩa khác cho mối kết hợp giữa Mã_NV và Ngày Cơ chế kiểm tra PTH ● ● ● PTH: 1 loại ràng buộc toàn vẹn quan trọng trong CSDL quan hệ Cần chọn cấu trúc CSDL sao... chuẩn tương đương: – Đảm bảo các thông tin trong quan hệ phổ quát sẽ được tìm thấy đầy đủ trong CSDL của cấu trúc kết quả Các mục tiêu thiết kế ● Một CSDL thỏa mãn tiêu chuẩn về dạng chuẩn và tính tương đương đảm bảo cho việc khai thác nó được thuận lợi trên cả ba phương diện: – Truy vấn: tiêu chuẩn tương đương đảm bảo các thông tin được truy xuất từ CSDL là những thông tin đã được phân tích – Cập nhật:... chuẩn đều hướng đến mục tiêu là kiểm tra RBTV dạng phụ thuộc dữ liệu được thuận lợi Nội dung ● Dẫn nhập - Những mục tiêu chính ● Dạng chuẩn ● Cấu trúc CSDL tương đương ● 2 cách tiếp cận để thiết kế CSDL Quan hệ được chuẩn hóa ● ● Trước khi Codd đề nghị khái niệm dạng chuẩn (1970), công nghệ lưu trữ dữ liệu khuyến khích cấu trúc dữ liệu phân cấp, trong đó có nhiều trường lặp Ví dụ 3.3 DANH_SÁCH_LỚP (TênLớp,... 7 11B2 005 Toán 10 11B2 005 Hóa 8 … Dạng chuẩn 1 ● ● Các quan hệ trong cấu trúc CSDL được chuẩn hóa như trên gọi là quan hệ ở dạng chuẩn 1 Dạng chuẩn 1 – Một quan hệ ở dạng chuẩn 1 không có các trường lặp và các trường kép, còn được gọi là cấu trúc phẳng Dạng chuẩn 1 ● Cấu trúc chuẩn hóa cho phép truy vấn chỉ dựa trên ngữ nghĩa của CSDL, không dựa vào cách thức lưu trữ thông tin – Ví dụ: Cho biết... chuẩn 1 - Ví dụ ● Ví dụ 3.4 – 1 thể hiện của quan hệ LỊCH_COI_THI GV_CT G P M GV Nguyễn Văn A 2 8:00 – 10:00 101 Giải thuật X Nguyễn Thị B 2 10:00 – 12:00 101 CSDL Y Trần Văn C 2 10:00 – 12:00 101 CSDL Y Lê Thị D – N 2 8:00 – 10:00 103 Giải thuật X Nhận xét về sự trùng lắp thông tin và những bất tiện khi thêm/xóa/cập nhật? Dạng chuẩn 1 - Kết luận ● Cần tách nhỏ quan hệ theo các tiêu chuẩn nghiêm ngặt hơn... quan hệ Cần chọn cấu trúc CSDL sao cho việc kiểm tra PTH hiệu quả nhất Xem xét – Cơ chế kiểm tra PTH nào được hệ quản trị CSDL hỗ trợ – Thời điểm cần kiểm tra PTH trong quá trình khai thác CSDL? Cơ chế khóa ● Cho 1 quan hệ Q, 1 khóa K của Q Cơ chế khóa là cơ chế có sẵn của Hệ quản trị CSDL nhằm đảm bảo: – ● ● ∀q, q' ∈ Q sao cho q ≠ q', q.K ≠ q'.K Hệ thống chỉ mục với giá trị duy nhất là 1 ví dụ của cơ... tối đa 30 học sinh) Quan hệ được chuẩn hóa ● Ví dụ 3.3 DANH_SÁCH_LỚP (TênLớp, SỉSố, (TênHS, (Điểm)*15)*30) ● Hình sau minh họa dữ liệu của quan hệ DANH_SÁCH_LỚP TênLớp SỉSố TênHS_ 1 Điểm_ 11 Điểm_ 12 Điểm_115 TênHS_2 Điểm_21 11A1 30 Nguyễn Văn A 8 9 3 Trần Văn B 7 11A2 28 Lê Thị C 3 8 Quan hệ được chuẩn hóa ● E.F Codd đề nghị cấu trúc lưu trữ chuẩn hóa, theo đó, cấu trúc CSDL trong ví dụ 3.3... 2 10:00 – 12:00 101 CSDL Y Trần Văn C 2 10:00 – 12:00 101 2 10:00 – 12:00 101 CSDL Y Lê Thị D 2 8:00 – 10:00 103 2 8:00 – 10:00 X M 103 Giải thuật GV X Dạng chuẩn 3 (DC3) - Khái niệm bổ sung ● Thuộc tính phụ thuộc bắc cầu vào một tập thuộc tính – A phụ thuộc bắc cầu vào X nếu có 4 điều kiện sau: i ∃ X→Y ∈ ℱ+ ii Y → A ∈ ℱ+ iii.Y → X ∉ ℱ+ iv.A ∉ (X ∪ Y) Dạng chuẩn 3 (DC3) - Khái niệm bổ sung ● Ví dụ... tự qua tất cả các bộ trong TQ) Hợp lệ hóa tình trạng 1 quan hệ ● Cho 1 quan hệ Q(ABC) với khóa là A, và các PTH được định nghĩa trên Q ℱ = {B → C, A → BC} Cho 1 tình trạng của Q B C b1 c1 a2 b2 c2 a3 b3 c3 a4 ● A a1 ● b2 c1 Tình trạng của Q được hợp lệ hóa đối với các PTH định nghĩa trên Q nếu TQ thỏa tất cả các PTH này Hợp lệ hóa tình trạng 1 quan hệ ● Kiểm tra B → C, đảm bảo: ∀q, q’ ∈ Q, nếu q.B . Thêm) Các mục tiêu thiết kế ● Hai tiêu chuẩn quan trọng cần đạt được trong quá trình thiết kế CSDL mức quan niệm – Cấu trúc CSDL kết quả (đầu ra của giai đoạn thiết kế mức quan niệm) cần đạt dạng. thể bao gồm 1 quan hệ duy nhất Q 0 và 1 tập các phụ thuộc D 0 C 0 = <Q 0 , D 0 > (b) Dẫn nhập ● Thiết kế CSDL mức quan niệm – Biến đổi đầu vào thành 1 cấu trúc CSDL quan niệm “tốt” hơn,. Thiết kế CSDL mức quan niệm Trình bày: Nguyễn Đăng Khoa Nội dung ● Dẫn nhập - Những mục tiêu chính ● Dạng chuẩn ● Cấu trúc CSDL tương đương ● 2 cách tiếp cận để thiết kế CSDL Dẫn