Bài giảng Cơ sở dữ liệu phân bố: Chương 4 - Th.S Lê Thị Minh Nguyện

27 46 0
Bài giảng Cơ sở dữ liệu phân bố: Chương 4 - Th.S Lê Thị Minh Nguyện

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Chương 4 trình bày về thiết kế cơ sở dữ liệu phân bố. Các nội dung chính trong chương này gồm có: Các bước thiết kế CSDL phân bố, mục tiêu của thiết kế CSDL phân bố, các cách tiếp cận thiết kế CSDL, thiết kế phân mãnh ngang, thiết kế phân mãnh ngang chính, thiết kế phân mãnh ngang dẫn xuất, thiết kế phân mãnh dọc. Mời các bạn tham khảo.

07/05/14 TRƯỜNG CAO ĐẰNG CƠNG NGHỆ THƠNG TIN TP.HỒ CHÍ MINH CHƯƠNG IV THIẾT KẾ CƠ SỞ DỮ LIỆU PHÂN BỐ Giảng Viên: Th.S Lê Thị Minh Nguyện Email: nguyenltm@hotmail.com NỘI DUNG Các bước thiết kế CSDL phân bố Mục tiêu thiết kế CSDL phân bố Các cách tiếp cận thiết kế CSDL Thiết kế phân mãnh ngang Thiết kế phân mãnh ngang Thiết kế phân mãnh ngang dẫn xuất Thiết kế phân mãnh dọc 07/05/14 Các bước thiết kế CSDL phân bố Thiết kế CSDL tập trung  Thiết kế lược đồ ý niệm  Thiết kế CSDL vật lý Thiết kế CSDL phân bố  Thiết kế lược đồ toàn cục  Thiết kế phân mãnh  Thiết kế định vị mãnh  Thiết kế CSDL vật lý cục Các bước thiết kế CSDL phân bố Thiết kế CSDL phân tán: Cần phải hiểu biết thật xác yêu cầu ứng dụng, ứng dụng quan trọng Cần quan tâm đến  Nơi chạy ứng dụng  Tần suất chạy ứng dụng  Số lượng, loại phân tán truy xuất 07/05/14 Các bước thiết kế CSDL phân bố NỘI DUNG Các bước thiết kế CSDL phân bố Mục tiêu thiết kế CSDL phân bố Các cách tiếp cận thiết kế CSDL Thiết kế phân mãnh ngang Thiết kế phân mãnh ngang Thiết kế phân mãnh ngang dẫn xuất Thiết kế phân mãnh dọc 07/05/14 Mục tiêu thiết kế CSDL PB Tính cục xử lý - processing locality  Phân tán liệu để cực đại hóa cục xử lý – đặt liệu gần ứng dụng sử dụng liệu tốt  Một quan hệ khơng đơn vị phân tán  Tính cục xử lý dựa vào tham chiếu cục tham chiếu từ xa Tính sẵn sàng độ tin cậy  Tính sẵn sàng  Độ tin cậy Mục tiêu thiết kế CSDL PB Điều phối tải làm việc  Cực đại hóa mức độ song song ứng dụng  Điều phối tải làm việc ảnh hưởng ngược lại với tính cục xử lý  Tính đồng thời nội truy vấn Chi phí lưu trữ khả lưu trữ có sẵn  Khả lưu trữ có sẵn nơi  Chi phí lưu trữ liệu khơng đáng kể so với chi phí CPU, nhập/xuất truyền thông ứng dụng 07/05/14 NỘI DUNG Các bước thiết kế CSDL phân bố Mục tiêu thiết kế CSDL phân bố Các cách tiếp cận thiết kế CSDL Thiết kế phân mãnh ngang Thiết kế phân mãnh ngang Thiết kế phân mãnh ngang dẫn xuất Thiết kế phân mãnh dọc Các cách tiếp cận thiết kế CSDL Thiết kế từ xuống – Top-down design  Thiết kế lược đồ toàn cục  Thiết kế phân mảnh CSDL  Định vị mảnh nơi  Thiết kế liệu vật lý đặt nơi 10 07/05/14 Cách tiếp cận từ xuống 11 Cách tiếp cận từ lên Thiết kế từ lên – Bottom-up design  Chọn mơ hình CSDL chung để mơ tả lược đồ toàn cục CSDL  Chuyển đổi lược đồ cục thành mơ hình liệu chung  Tích hợp lược đồ cục thành lược đồ toàn cục chung 12 07/05/14 NỘI DUNG Các bước thiết kế CSDL phân bố Mục tiêu thiết kế CSDL phân bố Các cách tiếp cận thiết kế CSDL Thiết kế phân mãnh ngang Thiết kế phân mãnh ngang Thiết kế phân mãnh ngang dẫn xuất Thiết kế phân mãnh dọc 13 Thiết kế phân mãnh ngang Một mảnh tập hợp gồm quan hệ Phân mảnh ngang phân chia quan hệ dựa vào vị từ định tính định nghĩa quan hệ Phân mảnh ngang dẫn xuất phân chia quan hệ dựa vào vị từ định tính định nghĩa quan hệ khác 14 07/05/14 Thiết kế phân mãnh ngang Thông tin CSDL  Trong lược đồ ý niệm toàn cục, quan hệ kết nối với  Trong mơ hình liên kết thực thể (ER model) • Quan hệ chủ quan hệ nguồn • Quan hệ phận quan hệ đích • Các hàm OWNER(L) MEMBER(L) 15 Thiết kế phân mãnh ngang Biểu diễn mối liên kết quan hệ dùng đường liên kết 16 07/05/14 Thiết kế phân mãnh ngang Thông tin ứng dụng (application)  Các vị từ sử dụng truy vấn  Chỉ phân tích ứng dụng quan trọng để xác định vị từ  Giả sử phân mảnh ngang quan hệ R(A1,A2,…,An), với Ai thuộc tính định nghĩa miền Di: Chúng ta có định nghĩa sau đây: 17 Thiết kế phân mãnh ngang Thông tin ứng dụng (application)  Vị từ đơn giản (simple predicate) pj định nghĩa R có dạng Aiθ value  θ phép so sánh =, #, , ≥  value chọn từ miền giá trị Ai (value € Di) Ký hiệu Pr tập hợp vị từ đơn giản định nghĩa quan hệ R Các phần tử Pr ký hiệu pj 18 07/05/14 Thiết kế phân mãnh ngang Thông tin ứng dụng (application)  Vị từ giao tối thiểu (minterm predicate) mj tập vị từ đơn giản Pr={p1, p2,…, pm} tổ hợp giao tất vị từ xuất Pr (ở dạng thông thường dạng phủ định) cho mj không bị mâu thuẫn mj = ᴧp*i, ≤ i ≤ m Với p*i ={ pi | ¬pi} mj ≠ false  Gọi tập vị từ giao tối thiểu: M={m1, m2,…, mz} 19 Thiết kế phân mãnh ngang Thông tin ứng dụng (application)  Độ chọn giao tối thiểu sel(mj) (mintern selectivity) – số quan hệ truy xuất truy vấn tương ứng với vị từ giao tối thiểu cho trước  Tần số truy xuất acc(q ) (access frequency) – tần số ứng dụng truy xuất liệu Q={q , q , , q } tập hợp truy vấn, acc(q ) cho biết tần số truy vấn i q i 20 10 07/05/14 Thiết kế phân mãnh ngang Một vị từ đơn giản pi gọi thích hợp (relevant) tập Pr, tồn hai vị từ giao tối thiểu mi mj Pr mà biểu thức chúng khác pi (mi chứa pi, mj chứa ¬pj) tồn ứng dụng tham chiếu khác đến mảnh fi fj (tương ứng với mi mj) 25 Thiết kế phân mãnh ngang Một tập vị từ đơn giản Pr gọi đầy đủ (complete) thuộc mảnh giao tối thiểu định nghĩa theo Pr, ứng dụng tham chiếu đến hai với xác suất Một tập vị từ đơn giản Pr gọi tối thiểu (minimal) tất vị từ vị từ thích hợp 26 13 07/05/14 Thiết kế phân mãnh ngang 27 Thiết kế phân mãnh ngang Pr = (p1, p2,…, pm) – tập vị từ đơn giản Để cho Pr biểu diễn phân mảnh đắn hiệu Pr phải đầy đủ tối thiểu 28 14 07/05/14 Thiết kế phân mãnh ngang EMP(EMPNUM,NAME,SAL,TAX,MGRNUM,DEPTNUM,JOB) DOM(DEPTNUM)={1,2} Ứng dụng quan trọng:  Thông tin thành viên nhân viên dự án  Dữ liệu nhân viên người lập trình 29 Thiết kế phân mãnh ngang Q: Qui tắc tính đầy đủ tối thiểu: Một quan hệ mảnh phân mảnh "thành hai phần chúng truy xuất khác ứng dụng“ Xét thuât tóan COM_MIN 30 15 07/05/14 Thiết kế phân mãnh ngang 31 Thiết kế phân mãnh ngang 32 16 07/05/14 Ví dụ P1={SAL>35000} SAL>35000: thích hợp P1 P2={SAL>35000, DEPTNUM=1} DEPTNUM=1: thích hợp với P2 P3={SAL>35000, DEPTNUM=1, JOB=‘P’} JOB=‘P’: thích hợp với P3 SAL>35000: khơng thích hợp P1  P4={DEPTNUM=1, JOB=‘P’} Đầy đủ tối thiểu 33 NỘI DUNG Các bước thiết kế CSDL phân bố Mục tiêu thiết kế CSDL phân bố Các cách tiếp cận thiết kế CSDL Thiết kế phân mãnh ngang Thiết kế phân mãnh ngang Thiết kế phân mãnh ngang dẫn xuất Thiết kế phân mãnh dọc 34 17 07/05/14 Thiết kế phân mãnh ngang dẫn xuất Phân mảnh ngang dẫn xuất định nghĩa quan hệ phận đường liên kết theo phép chọn quan hệ chủ đường liên kết Đường liên kết quan hệ chủ quan hệ phận định nghĩa phép kết Một phép kết thực phép nửa kết 35 Thiết kế phân mãnh ngang dẫn xuất Xét đường liên kết L với owner(L) = S member(L) = R, mảnh ngang dẫn xuất định nghĩa sau n – số lượng lớn mảnh định nghĩa R Si= σFI (S), với Fi cơng thức dùng để định nghĩa mảnh ngang Si F – điều kiện nửa kết 36 18 07/05/14 Thiết kế phân mãnh ngang dẫn xuất Để thực phân mảnh ngang dẫn xuất cần có  Tập mảnh quan hệ chủ  Quan hệ phận  Tập vị từ kết quan hệ chủ quan hệ phận 37 Thiết kế phân mãnh ngang dẫn xuất Phép kết phân bố (distributed join) phép kết quan hệ phân mảnh ngang Có thể suy diễn để xác định số phép kết phần Phép kết phân tán biểu diễn đồ thị kết (join graph) 38 19 07/05/14 Thiết kế phân mãnh ngang dẫn xuất Đồ thị kết gọi hồn tồn (total) chứa tất cạnh có mảnh R S Đồ thị kết gọi suy giảm (reduced) khơng có số cạnh mảnh R S  Đồ thị kết suy giảm phân hoạch (partitioned)  Đồ thị kết suy giảm đơn giản (simple) 39 Thiết kế phân mãnh ngang dẫn xuất Đồ thị kết suy giảm phân hoạch – bao gồm hai nhiều đồ thị cạnh chúng Đồ thị kết suy giảm đơn giản – phân hoạch đồ thị có cạnh 40 20 07/05/14 Thiết kế phân mãnh ngang dẫn xuất Đồ thị kết đơn giản Đồ thị kết Đồ thị kết phân hoạch 41 Thiết kế phân mãnh ngang dẫn xuất Có thể có nhiều đường liên kết đến quan hệ R có nhiều cách phân mảnh ngang dẫn xuất cho R dựa tiêu chuẩn:  Sự phân mảnh có đặc điểm kết tốt  Sự phân mảnh sử dụng nhiều ứng dụng 42 21 07/05/14 NỘI DUNG Các bước thiết kế CSDL phân bố Mục tiêu thiết kế CSDL phân bố Các cách tiếp cận thiết kế CSDL Thiết kế phân mãnh ngang Thiết kế phân mãnh ngang Thiết kế phân mãnh ngang dẫn xuất Thiết kế phân mãnh dọc 43 Phân mãnh dọc Phân mảnh tách biệt (Vertical partitioning fragmentation): tập thuộc tính khơng giao Phân mảnh nhóm gom tụ (Vertical clustering fragmentation): tập thuộc tính giao  Lưu ý có nhân bản, khơng nên cập nhật thường xuyên thuộc tính bị phủ lấp Phân mảnh tối ưu (Optimal fragmentation)  Tạo lược đồ phân mảnh, tối thiểu hóa thời gian thực ứng dụng 44 22 07/05/14 Phân mãnh dọc Cách tiếp cận phân tách (split approach)  QH toàn cục tách để tạo mảnh dựa cách phân mảnh có lợi dựa truy suất applications Cách tiếp cận gom nhóm (grouping approach)  Thuộc tính kết hợp dần để tạo mảnh Gắn attribute cho mảnh sau kết hợp thỏa tiêu chuẩn 45 Phân mãnh dọc Tự lực/ái lực/lực hút (affinity)  Là số đo lực hút thuộc tính  Chỉ mức độ liên đới thuộc tính Các khái niệm  Tập vấn tin người dùng (ứng dụng): Q=(qi q);  Quan hệ R(Ai n)  Giá trị sử dụng thuộc tính qi với Aj: use(qi,Aj)=0/1 46 23 07/05/14 Phân mãnh dọc Xét quan hệ:  PROJ(Pno, pname,budget,loc)  q1: Select budget from PROJ where pno=value  q2: Select pname,budget from PROJ  q3: Select pname from PROJ where loc =value  q4: Select sum(budget) from PROJ where loc=value  Đặt: PROJ(A1,A2,A3,A4) 47 Phân mãnh dọc Ma trận sử dụng thuộc tính: 48 24 07/05/14 Phân mãnh dọc Tập ứng dụng q Q  Q(A,B) = {q € Q: use(q,A)=use(q,B)=1} Số đo lực hút/ái lực Ai, Aj R với Q: Trong đó:  refl(q): số truy xuất đến thuộc tính (Ai,Aj) cho ứng dụng q vị trí Rl  Accl(q): số đo tần số truy xuất q đến Ai,Aj vị trí l 49 Kiểm tra Cho quan hệ toàn cục:  NV(MaNV, Hoten, MaNQL, Phong, Luong, Diachi)  DA(MaDA, TenDA, Diadiem, KP)  Phancong(MaNV,MaDA) Các quan hệ phân đoạn sau: 50 25 07/05/14 Kiểm tra  NV1(MaNV, Hoten,MaNQL, Diachi, Phong): Gồm nhân viên có lương 5tr USD trở lên  NV2(MaNV, Hoten,MaNQL, Diachi, Phong): Gồm nhân viên có lương 5tr USD  NV3(MaNV, Hoten, Lương): Gồm nhân viên có lương 5tr USD trở lên  NV4(MaNV, Hoten, Lương): Gồm nhân viên có lương 5tr USD  DA1: Danh sách dự án TP.HCM có KP từ tỉ trở lên;  DA2: Danh sách dự án TP.HCM có KP tỉ;  DA3: Danh sách dự án tỉnh thành khác có KP từ 500 tr trở lên;  DA4: Danh sách dự án tỉnh thành khác có KP 500 tr; 51  Quan hệ Phân công phân mãnh theo Dự án Kiểm tra Vì nguyên nhân giả định, nhân viên có MaNV NV01005 vi phạm kỷ luật Quyết định phạt hành thành lập trừ lương tháng 2tr., thuyên chuyển công tác nhân viên làm bảo vệ dự án Đồng Nai rút kinh phí dự án nhân viên cơng tác 100tr đồng đưa vào ngân sách cty Viết truy vấn xử lý trường hợp (mức suốt định vị liệu) 52 26 07/05/14 53 27 ... kế phân mãnh ngang dẫn xuất Đồ thị kết suy giảm phân hoạch – bao gồm hai nhiều đồ thị khơng có cạnh chúng Đồ thị kết suy giảm đơn giản – phân hoạch đồ thị có cạnh 40 20 07/05/ 14 Thiết kế phân. .. from PROJ where loc =value  q4: Select sum(budget) from PROJ where loc=value  Đặt: PROJ(A1,A2,A3,A4) 47 Phân mãnh dọc Ma trận sử dụng thuộc tính: 48 24 07/05/ 14 Phân mãnh dọc Tập ứng dụng q... 07/05/ 14 Thiết kế phân mãnh ngang 27 Thiết kế phân mãnh ngang Pr = (p1, p2,…, pm) – tập vị từ đơn giản Để cho Pr biểu diễn phân mảnh đắn hiệu Pr phải đầy đủ tối thiểu 28 14 07/05/ 14 Thiết kế phân

Ngày đăng: 11/05/2021, 01:32

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan