Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 46 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
46
Dung lượng
1,64 MB
Nội dung
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG CƠ SỞ DỮ LIỆU PHÂN TÁN THIẾT KẾ CƠ SỞ DỮ LIỆU PHÂN TÁN Ts. Phan Thị Hà Nội dung Phương pháp phân mảnh ngang Phân mảnh ngang dẫn xuất Phân mảnh dọc Phương pháp phân mảnh hỗn hợp Cấp phát mô hình cấp phát Phân mảng ngang Phân mảnh ngang việc tách ngang quan hệ toàn cục thành nhiều nhiều mảnh. Mỗi mảnh quan hệ khả hợp, chứa số quan hệ tách biệt nhau. Phân mảnh ngang thực chất phép chọn quan hệ thỏa mãn biểu thức điều kiện cho trước. Có hai phương pháp phân mảnh ngang: • Phân mảnh ngang nguyên thủy: Là phân mảnh ngang thực vị từ quan hệ. • Phân mảnh ngang dẫn xuất: Là phân mảnh quan hệ dựa vị từ quan hệ khác. Thông tin Phân mảnh ngang Thông tin CSDL bao gồm tập quan hệ, mối quan hệ, tập thuộc tính tập phụ thuộc hàm Thông tin ứng dụng gồm câu truy vấn quan hệ, vị trí truy vấn…. (Ko)Thông tin mạng máy tính, cấu trúc, băng thông… (Ko)Thông tin hệ thống máy tính, nhớ lưu trữ… Yêu cầu thông tin mạng thông tin hệ thống máy tính sử dụng mô hình cấp phát, không sử dụng thuật toán phân mảnh liệu Phân mảnh ngang: Dựa thông tin CSDL Thông tin CSDL: Là thông tin mối quan hệ - một, - nhiều nhiều - nhiều quan hệ (bảng), liên kết đường nối (Link) có hướng, kết nối Thông tin vđịnh lượng cần thiết sở dl lực lượng quan hệ PAY R, ký hiệu |R| Card(R) TITLE, SAL • • Mối quan hệ - nhiều trỏ từ quan hệ PAY đến quan hệ EMP đuờng nối L1 Mối quan hệ nhiều - nhiều trỏ từ quan hệ EMP PROJ đến quan hệ ASG hai đuờng nối L2 L3. EMP L1 ENO, ENAME, TITLE PROJ PNO, PNAME, BUDGET, LOC L2 ASG L3 ENO, PNOE, RESP, DUR Phân mảnh ngang: Dựa thông tin ứng dụng Thông tin ứng dụng: Thông tin định lượng vàThông tin định tính Thông tin dịnh lượng: chủ yếu sử dụng mô hình cấp phát ( ko sử dụng đây) Thông tin định tính bản: hướng dẫn hoạt động phân mảnh . a) Vị từ đơn giản Ký hiệu: pj: Ai θ “value”, Trong đó: Ai thuộc tính R(A1, A2, ,An), “Value” giá trị Ai Ký hiệu Pr tập tất vị từ đơn giản định nghĩa quan hệ R: Pr = {p1, p2, , pm}. Phân mảnh ngang: Dựa thông tin ứng dụng b). Vị từ hội sơ cấp Pr = {p1, p2, , pm} tập vị từ đơn giản Trong đó, p*k = pk .Như vậy, vị từ đơn giản xuất vị từ hội sơ cấp dạng tự nhiên dạng phủ định nó. Phân mảnh ngang: Dựa thông tin ứng dụng Ví dụ: p1: p2: p3: p4: p5: p6: TITLE = “Elect.Eng” TITLE = “Syst. Anal” TITLE = “Mech. Eng” TITLE = “Programmer” SAL ≤ 30000 SAL > 30000 PAY Phân mảnh ngang: Dựa thông tin ứng dụng Sau số vị từ hội m 1: TITLE = “Elect.Eng” ^ SAL ≤ 30000 m 2: TITLE = “Elect.Eng” ^ SAL > 30000 m 3: ¬(TITLE = “Elect.Eng”) ^ SAL ≤ 30000 m 4: ¬(TITLE = “Elect.Eng”) ^ SAL > 30000 m 5: TITLE = “Programmer” ^ SAL ≤ 30000 m 6: TITLE = “Programmer” ^ SAL > 30000 Trên số vị từu hội đc tạo từ tập vị từ sở trên, Các vị từ đc viết đơn giản hóa hội. Định nghĩa hội đòi hỏi vị từ dạng tự nhiên phủ định nó, m1 viết Phân mảnh ngang: Dựa thông tin ứng dụng Ký hiệu Độ tuyển hội sơ cấp (Minterm Selectivity): số quan hệ kết chọn theo vị từ hội sơ cấp cho trước. Ký hiệu sel(m).Ví dụ, sel(m1)=0. Sel(m2)=1. Tần số ứng dụng người dùng truy nhập liệu. Nếu Q = {q1, q2, … , qk} tập truy vấn, tần số truy nhập truy vấn qi khoảng thời gian cho, ký hiệu acc(qi) Tần số truy nhập hội sơ cấp hội sơ cấp m, ký hiệu acc(m). 10 Một số nhận xét phân mảnh ngang nguyên thủy Bốn vị từ hội sơ cấp sau tính theo Pr: Các vị từ hội sơ cấp m1 m4 mâu thuẫn với phép liên quan tương đương I bị loại khỏi M. Để thực bước ta áp dụng thuật toán phân mảnh ngang nguyên thủy. 31 Thuật toán PHORIZONTAL 32 Ví dụ phân mảnh ngang nguyên thủy - PAY Giả sử có ứng dụng kiểm tra thông tin lương xác định số lương tăng quan hệ PAY. Gs thông tin nhân viên đc lưu trữ vị trí • Vị trí thứ nhất: • Vị trí thứ hai: =>Câu truy vấn thực hai vị trí. Tập vị từ đơn giản sử dụng để phân hoạch quan hệ PAY là: p1: p2: 33 Ví dụ phân mảnh ngang nguyên thủy – PAY =>Từ tập vị từ đơn giản khởi đầu Pr = {p1, p2}. =>Áp dụng COM_MIN với i=1 làm giá trị khởi đầu tạo Pr’={p1} đầy đủ cực tiểu p2 (f1 mảnh hội sơ cấp tạo ứng với p1) theo quy tắc. =>Các vị từ hội sơ cấp sau phần tử M: Khi đó, hai mảnh F = {PAY1, PAY2} theo M là: 34 Ví dụ phân mảnh ngang nguyên thủy – PROJ Giả sử có hai ứng dụng quan hệ PROJ Ứng dụng 1: Tên kinh phí dự án ba vùng thực dự án. SELECT FROM WHERE PNAME, BUDGET PROJ LOC = Value Các vị từ đơn giản sử dụng cho ứng dụng là: p1: LOC = “Montreal” p2: LOC = “New York” p3: LOC = “Paris” . 35 Ví dụ phân mảnh ngang nguyên thủy – PROJ Ứng dụng 2: Liên quan đến dự án có kinh phí nhỏ 200000$ quản lý vị trí dự án có kinh phí lớn 200000 quản lý vị trí thứ hai. Vì vậy, vị từ đơn giản sử dụng để phân mảnh ứng dụng thứ hai là: Sử dụng thuật toán COM_MIN kiểm tra tập Pr’ = {p1, p2, p3, p4, p5} đầy đủ cực tiểu. 36 Các phép kéo theo p1,p2,p3,p4,p5 Ví dụ phân mảnh ngang nguyên thủy – PROJ Tập M vị từ hội sơ cấp tạo M dựa Pr’ sau: Kết phân mảnh ngang sở PROJ tạo sáu mảnh FPROJ = {PROJ1, PROJ2, PROJ3, PROJ4, PROJ5, PROJ6} theo vị từ hội sơ cấp M. 38 Ví dụ phân mảnh ngang nguyên thủy – PROJ Các mảnh PROJ2, PROJ5 rỗng. 39 Phân mảnh ngang dẫn xuất PAY Phân mảnh ngang dẫn xuất việc phân mảnh quan hệ theo kết nối (Equijoin) kết nối nửa (Semijoin) đến quan hệ khác sở liệu. Việc định chọn phân mảnh tối ưu cần dựa hai tiêu chuẩn sau: 1. Phân mảnh có đặc tính kết nối tốt 2. Phân mảnh sử dụng cho nhiều ứng dụng TITLE, SAL EMP L1 ENO, ENAME, TITLE PROJ PNO, PNAME, BUDGET, LOC L2 L3 ASG ENO, PNOE, RESP, DUR 40 Phân mảnh ngang dẫn xuất Ví dụ: Phân mảnh dẫn xuất quan hệ EMP theo quan hệ PAY. Nhóm người tham gia dự án thành hai nhóm theo lương 41 Phân mảnh ngang dẫn xuất Ví dụ: Phân mảnh dẫn xuất quan hệ ASG theo quan hệ PROJ EMP Xét quan hệ ASG có hai ứng dụng nó: Ứng dụng 1: Danh sách kỹ sư làm việc dự án chỗ. Ứng dụng thực vị trí (thí dụ ba vị trí) 42 Phân mảnh ngang dẫn xuất Phân mảnh dẫn xuất ASG theo mảnh PROJ1, PROJ2 PROJ3 sau: Ứng dụng 2: Tại vị trí quản lý nhân viên, yêu cầu thông tin kinh phí thời gian thực dự án nhân viên. 43 Phân mảnh ngang dẫn xuất Phân mảnh dẫn xuất ASG theo EMP1 EMP2 sau: 44 Phân mảnh ngang dẫn xuất Nhận xét Phân mảnh dẫn xuất xảy dây chuyền, quan hệ phân mảnh hệ phân mảnh cho quan hệ khác, đến lượt lại làm cho quan hệ khác phải phân mảnh (như dây chuyền PAYEMP-ASG). Một quan hệ có nhiều cách phân mảnh. Chọn lựa lược đồ phân mảnh cho tối ưu phụ thuộc vào ứng dụng cấp phát. 45 KIỂM TRA Cho quan hệ QLSV(MA, HT, QQ,NS,GT, DT, TB) Trong MA: Mã sinh viên; HT: Họ tên sinh viên, QQ: Quê quán; NS: Năm sinh; GT: Giới tính; DT: Dân tộc; TB: Điểm trung binh. 1) Tập vị từ đơn giản có tính đầy đủ tính cực tiểu 2) Tập vị từ hội sơ cấp M 3) Phân mảnh ngang sở tập vị từ hội sơ cấp 46 [...]... thì Pr' Pr' – pk F F – fk Bài 2: Thiêt kế Cơ sở dữ liệu phân tán 26 TS HÀ HẢI NAM KHOA CÔNG NGHỆ THÔNG TIN 1 Thuật toán COM_MIN 27 Một số nhận xét về phân mảnh ngang nguyên thủy Tìm tập các vị từ đơn giản đầy đủ và cực tiểu là bước đầu tiên trong thiết kế phân mảnh ngang nguyên thủy Thuật toán bắt đầu bằng cách tìm một vị từ có liên đới và phân hoạch quan hệ đã cho Vòng lặp do-until thêm... kế Cơ sở dữ liệu phân tán 25 TS HÀ HẢI NAM KHOA CÔNG NGHỆ THÔNG TIN 1 Thuật toán COM_MIN (2) Khởi tạo : www.ptit.edu.v n Tìm một pi Pr sao cho pi phân chia R theo luật 1 Thiết lập Pr' = pi ; Pr Pr – pi ; F fi Lặp lại việc thêm các vị từ vào Pr’ cho đến khi hoàn thành Tìm một pj Pr sao cho pj phân chia một mảnh fk nào đó được định nghĩa theo vị từ minterm trên Pr' theo luật 1 Thiết. . .Phân mảnh ngang cơ sở Phân mảnh ngang cơ sở được định nghĩa bằng phép chọn trên quan hệ toàn R: i=1 n ; trong đó mi là vị từ hội sơ cấp fi được gọi là mảnh hội sơ cấp (Minterm Fragment) Một tập M các vị từ hội sơ cấp, số lượng phân mảnh ngang của quan hệ R bằng số lượng các vị từ hội sơ cấp 11 Phân mảnh ngang cơ sở Ví dụ: Giả sử tập các vị từ hội sơ cấp:... Thiêt kế Cơ sở dữ liệu phân tán 13 TS HÀ HẢI NAM KHOA CÔNG NGHỆ THÔNG TIN 1 Tính đầy đủ của vị từ đơn giản Pr là đầy đủ khi và chỉ khi xác suất truy nhập của mỗi ứng dụng đến bộ bất kỳ của mảnh hội sơ cấp bất kỳ được định nghĩa theo Pr là như nhau Vị từ đầy đủ sẽ đảm bảo cho các mảnh sơ cấp nhất quán về mặt logic Đồng nhất về mặt thống kê theo cách ứng dụng truy nhập Vì vậy, một tập vị từ đầy đủ là cơ. .. Khi đó quan hệ PROJ được phân rã thành các mảnh ngang như sau: PROJ1 = σ BUDGET≤200000(PROJ) PROJ2 = σ 200000 < BUDGET ≤ 400000 (PROJ) PROJ3 = σ400000 < BUDGET ≤ 600000 (PROJ) PROJ4 = σ600000 < BUDGET (PROJ) 12 Phân mảnh ngang cơ sở- Thuật toán www.ptit.edu.v n Cho trước: Quan hệ R, tập các vị từ đơn giản Pr Đầu ra: Tập các mảnh của R = {R1, R2,…,Rw} tuân theo các luật phân mảnh Điều kiện: ... truy nhập Vì vậy, một tập vị từ đầy đủ là cơ sở cho việc phân mảnh ngang cơ sở 14 VD(1) Cho 1 quan hệ EMP UD1: Giả sử ứng dụng AP1 truy vấn vào quan hệ EMP để tìm kiếm những nhân viên làm viecj ở in Los Angeles (LA), Tập vị từ đơn giản là Pr = {p1: Loc= “LA”} Tập vị từ hội là {m1: Loc = “LA”, m2: Loc“LA”}”, vậy tập Pr là cực tiểu và đầy đủ , các mảnh được phân ra: Fragment F1: Create table LA_EMPS... cho Vòng lặp do-until thêm các vị từ vào Pr’, đảm bảo Pr’ có tính cực tiểu tại mỗi bước Bước tiếp theo của thiết kế phân mảnh ngang nguyên thủy là tìm tập các vị từ hội sơ cấp được định nghĩa trên các vị từ trong Pr' Các vị từ hội sơ cấp xác định các mảnh cho cấp phát 28 Một số nhận xét về phân mảnh ngang nguyên thủy Tuy nhiên, các vị từ hội sơ cấp có thể rất lớn, tỷ lệ hàm mũ theo số lượng các... mảnh “được phân hoạch thành ít nhất hai phần và chúng được truy nhập khác nhau bởi ít nhất một ứng dụng” Mảnh fi được phân hoạch theo vị từ sơ cấp ước là fi của Pr’ qui 24 Tóm tắt Giải thuật COM_MIN (1) Đầu vào: Một quan hệ R và một tập các vị từ www.ptit.edu.v n đơn giản Pr Đầu ra: Một tập đầy đủ và tối thiểu các vị từ đơn giản Pr' cho Pr Luật 1: Một quan hệ hoặc một mảnh được phân chia thành... statistically homogeneous Tính cực tiểu của vị từ đơn giản Nếu một vị từ ảnh hưởng đến cách phân mảnh được thực hiện (vd: gây ra việc mảnh f được phân thành các mảnh fi và fj) thì có ít nhất một ứng dụng truy cập fi và fj một cách khác nhau Nói cách khác, vị từ đơn giản phải liên quan đến quyết định phân mảnh Nếu tất cả các vị từ của một tập Pr là liên quan, Pr là tối thiểu card(f) là lực lượng... sẽ áp dụng thuật toán phân mảnh ngang nguyên thủy 31 Thuật toán PHORIZONTAL 32 Ví dụ về phân mảnh ngang nguyên thủy - PAY Giả sử có một ứng dụng kiểm tra thông tin lương và xác định số lương sẽ tăng trên quan hệ PAY Gs thông tin các nhân viên đc lưu trữ tại 2 vị trí • Vị trí thứ nhất: • Vị trí thứ hai: =>Câu truy vấn sẽ thực hiện trên cả hai vị trí Tập vị từ đơn giản sử dụng để phân hoạch quan hệ PAY . CƠ SỞ DỮ LIỆU PHÂN TÁN THIẾT KẾ CƠ SỞ DỮ LIỆU PHÂN TÁN Ts. Phan Thị Hà HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG Nội dung Phương pháp phân mảnh ngang Phân mảnh ngang. Điều kiện: Pr phải đầy đủ Pr phải tối thiểu www.ptit.edu.v n Bài 2: Thiêt kế Cơ sở dữ liệu phân tán 13 TS. HÀ HẢI NAM KHOA CÔNG NGHỆ THÔNG TIN 1 Tính đầy đủ của vị từ đơn giản. acc(qi) Tần số truy nhập hội sơ cấp hội sơ cấp m, ký hiệu là acc(m). 10 Phân mảnh ngang cơ sở Phân mảnh ngang cơ sở được định nghĩa bằng phép chọn trên quan hệ toàn R: i=1 n ; trong đó