Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 51 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
51
Dung lượng
1,18 MB
Nội dung
CHƯƠNG II: THIẾT KẾ CSDL PHÂN TÁN CHƯƠNG II: THIẾT KẾ CSDL PHÂN TÁN 2.1 Những vấn đề thiết kế 2.2 Phân mảnh sở liệu phân tán 2.3 Định vị sở liệu phân tán Khung thiết kế csdl phân tán • Các định hướng cho phân tích hệ thống phân tán – Mức chia sẻ: không chia sẻ, chia sẻ liệu, chia sẻ liệu+chương trình – Hành vi mẫu truy nhập: tĩnh , động – Mức nhận biết hành vi mẫu truy nhập: thông tin, thông tin phân chia, thông tin đầy đủ Thiết kế csdl phân tán nên xem xét khung tổng quát Các chiến lược thiết kế • Các tiếp cận top-down – Thiết kế hệ thống từ ban đầu – Các hệ thống • Cách tiếp cận bottom-up – Csdl tồn số site – Các csdl nên nối kết để giải nhiệm vụ chung Các chiến lược thiết kế • Chiến lược thiết kế top-down Các chiến lược thiết kế (…) • Chiến lược thiết kế bottom-up Các chiến lược thiết kế • Thiết kế phân tán phần trọng tâm thiết kế hệ qtcsdl phân tán ( nhiệm vụ truyền thống khác cho csdl) – Mục tiêu : thiết kế lược đồ quan niệm cục bộ(LCS) cách phân tán thực thể (quan hệ) qua site – Hai khía cạnh: • Phân mảnh: Quan hệ chia thành quan hệ phân tán • Định vị nhân bản: • Mỗi phân mảnh lưu site với phân tán tối ưu • Bản phân mảnh trì vài site • Tập trung chủ yếu khía cạnh Các chiến lược thiết kế • Những vấn đề thiết kế: – Tại phân mảnh? – Phân mảnh nào? – Phân mảnh? – Kiểm tra tính đắn nào? – Định vị nào? CHƯƠNG II: THIẾT KẾ CSDL PHÂN TÁN 2.1 Những vấn đề thiết kế 2.2 Phân mảnh sở liệu phân tán 2.3 Định vị sở liệu phân tán Phân mảnh • • • Đơn vị phù hợp cho phân tán? Phân mảnh hay quan hệ? Các quan hệ đơn vị cho phân tán: – Nêu quan hệ không nhân bản, ta đạt dung lượng từ xa lớn – Nếu quan hệ nhân bản, ta có quan hệ không cần thiết nhân bản, gây nhiều vấn đề vận hành cập nhật lãng phí không gian đĩa – Phải có giải pháp tốt truy vấn cần liệu quan hệ liệu site dùng liệu Các phân mảnh đơn vị cho phân tán: – Các khung ứng dụng thường tập quan hệ – Vị trí truy nhập ứng dụng định nghĩa tập quan hệ – Cho phép giao dịch vận hành tương tranh chúng truy nhập phần khác quan hệ – Vận hành song song truy vấn đơn(tương tranh truy vấn) – Điều khiển liệu ngữ nghĩa(đảm bảo tính toàn vẹn) khó 10 37 CHƯƠNG II: THIẾT KẾ CSDL PHÂN TÁN 2.1 Những vấn đề thiết kế 2.2 Phân mảnh sở liệu phân tán 2.3 Định vị sở liệu phân tán 38 Định vị phân mảnh • Bài toán định vị phân mảnh: Xét - Các phân mảnh F={F1,F2, ,Fn} - Các site S={S1,S2, ,Sm} - Các ứng dụng Q={q1,q2, ,ql} Tìm phân bố tối ưu F S • Tính tối ưu - Giá tối ưu – Truyền thông+ Lưu trữ xử lý(đọc cập nhật) – Giá thời gian(thường sử dụng) - Hiệu năng: Thời gian đáp ứng hay thông lượng - Các ràng buộc: Trên site (lưu trữ xử lý) 39 Định vị phân mảnh • Các thông tin yêu cầu – Thông tin csdl • Phép chọn phân mảnh • Kích thước phân mảnh – Các thông tin ứng dụng • RRij: Số truy nhập đọc truy vấn qi phân mảnh Fj • URij: Số truy nhập cập nhật truy vấn q i phân mảnh Fj • uij: ma trận thị truy vấn cập nhật phân mảnh • site khởi động truy vấn - Thông tin site • USCk: giá đơn vị lưu trữ liệu site k • LPCk: giá xử lý đơn vị liệu site k • • Thông tin mạng: Giá truyền thông khung site Kích thước khung 40 Định vị phân mảnh • Mô hình định vị nhằm – Tối thiểu hóa giá thành tổng cộng lưu trữ xử lý – Giải nghiêm ngặt thời gian đáp ứng • Dạng chung: min( giá thành tổng cộng) – quan tâm đến • Ràng buộc thời gian đáp ứng • Ràng buộc lưu trữ • Ràng buộc xử lý • Các biến định xij xij / phân mảnh Fi lưu site Sj \ khác 41 Định vị phân mảnh • Giá thành tổng cộng hai thành phần: lưu trữ xử lý truy vấn: – Giá lưu trữ phân mảnh Fi lưu site Sj * USCk: giá đơn vị lưu trữ liệu site k – Giá xử lý truy vấn cho truy vấn qi gồm thành phần : Giá xử lý (PC) giá truyền thông (TC) 42 Định vị phân mảnh • Giá xử lý gồm thành phần: – giá truy nhập(AC), Giá ràng buộc toàn vẹn(IE) giá điều khiển tương tranh(CC) – Giá truy nhập: LPCk: giá xử lý đơn vị liệu site k – Giá toàn vẹn tương tranh: tính toán tương tự phụ thuộc ràng buộc đặc tả • Chú ý : ACi giả thiết xử lý truy vấn dẫn đến phân rã thành tập truy vấn con, làm việc phân mảnh – Mô hình đơn giản – Chưa quan tâm đên phép toán hay giải thuật khác 43 Định vị phân mảnh • Giá truyền thông gồm thành phần : – Giá xử lý cập nhật(TCU) giá xử lý đoc(TCR) – Giá cập nhật: Thông báo site có nhân bản+ thông báo xác nhận *(giá thông điệp cập nhật+giá xác nhận) – Giá đọc: Gửi yêu cầu đọc đến site có phân mảnh cần thiết + xác nhận từ site đến site khởi thủy *(giá yêu cầu đọc+ giá gửi lại kết quả) 44 Định vị phân mảnh • Mô hình ràng buộc – Ràng buộc thời gian đáp ứng cho truy vấn qi thời gian vận hành qi ≤ max thời gian đáp ứng cho phép cho qi – Ràng buộc lưu trữ site Sk yêu cầu dung lượng Fj Sk ≤ dung lượng Sk – Ràng buộc xử lý cho site Sk tải xử lý qi tai site Sk ≤ dung lượng xử lý Sk 45 Định vị phân mảnh • Các phương pháp giải – Mô hình/bài toán định vị có độ khó NP – Các giải pháp phạm vi sử dụng lại – Sử dụng phép heuristic khác để giảm nhỏ không gian tìm kiếm • Giả thiết phân chia xác định giá : toán rút tìm cách phân chia vị trí tối ưu cho quan hệ • Chưa xét đến nhân 46 • • • • KẾT LUẬN Thiết kế phân tán định vị trí phần liệu chương trình ngang qua site mạng Hai cách tiếp cận: top-down bottom-up Thiết kế chi tiết với vấn đề : phân mảnh định vị(nhân bản) liệu: – phân mảnh ngang xác định qua phép chọn σp(R): Viết lại truy vấn cho site phép tuyển chuẩn tìm tập đầy đủ tối thiểu tuyển chuẩn để xác định phân mảnh – phân mảnh dọc qua phép chiếu Πp Tính toán ma trận lực thuộc : tính nhó thuộc tính tương(R) tự với – Phân mảnh hỗn hợp tổ hợp cách Định vị/Nhân liệu – Kiểu nhân bản: không nhân bản, nhân riêng phần, nhân đầy đủ – Định vị/Nhân tối ưu mô hàm giá tập ràng buộc – Tính phức tạp toán có độ khó NP 47 – Sử dụng phép heuristic để giảm nhỏ tính phức tạp BÀI TẬP Giả sử cty vận tải có CSDL gồm thuộc tính MT(mã tuyến đường), TT(tên tuyến đường),D(Độ dài tuyến đường), MX(mã xe),LX(Loại xe) SL(Số lượng xe hoạt động tuyến) Hãy xây dựng phép tách phân mảnh dọc CSDL thành quan hệ có dạng chuẩn 3NF với kết nối không tổn thất thông tin bảo toàn phụ thuộc Xét quan hệ PAY cho vị từ đơn giản sau: P1: SAL=300) PAY1=PROJ(SAL[...]... 21 lớn hơn, nhỏ hơn hay bằng 20 0000 Phân mảnh ngang • Ta thực hiện phân mảnh ngang Cho {t1, t2, t3}, {t4, t5}, và {t2, t3, t4, t5} là các kết quả truy vấn Các bộ này sẽ được phân mảnh theo cách sau: 22 Phân mảnh dọc • Mục tiêu của phân mảnh dọc là phân chia quan hệ thành các quan hệ nhỏ hơn sao cho nhiều ứng dụng sẽ chỉ chạy trên một phân mảnh • phân mảnh dọc một quan hệ tạo ra các phân mảnh R1,R2,... dọc • Không kết nối: Nếu quan hệ R được phân rã thành các mảnh R1,R2, ,Rn và hạng mục dữ liệu di xuất hiện trong phân mảnh Rj thì di sẽ không xuất hiện trong bất kỳ phân mảnh Rk nào khác (k ≠ j) trừ thuộc tính khóa sơ cấp cho phân mảnh dọc ) – Với phân mảnh ngang, hạng mục dữ liệu là một bộ 16 – Với phân mảnh dọc , hạng mục dữ liệu là một thuộc tính Phân mảnh ngang • Trực giác phía sau phân mảnh ngang:... Dọc: phân chia quan hệ theo các thuộc tính của nó – Hỗn hợp/lai: tổ hợp phân mảnh ngang và phân mảnh dọc 12 Phân mảnh • Ví dụ Dữ liệu Biểu đồ E-R 13 Phân mảnh • Phân mảnh ngang của quan hệ PROJ – PROJ1: các dự án với ngân sách nhỏ hơn 20 00000 – PROJ2: các dự án với ngân sách >= 20 0000 14 Phân mảnh • Ví dụ: phân mảnh dọc của quan hệ PROJ – PROJ1: thông tin về ngân sách dự án – PROJ2: thông tin về tên... để phân mảnh quan hệ sẽ là: (LOC =′ Montreal′) ∧ (BUDGET ≤ 20 0000) (LOC =′ Montreal′) ∧ (BUDGET > 20 0000) (LOC =′ NewY ork′) ∧ (BUDGET ≤ 20 0000) (LOC =′ NewY ork′) ∧ (BUDGET > 20 0000) (LOC =′ Paris′) ∧ (BUDGET ≤ 20 0000) (LOC =′ Paris′) ∧ (BUDGET > 20 0000) 20 Phân mảnh ngang – Có thể chia PROJ2 thành hai phân mảnh PROJ2 = σ LOC=′NY ′ ∧ BUDGET ... cho phép cho qi – Ràng buộc lưu trữ site Sk yêu cầu dung lượng Fj Sk ≤ dung lượng Sk – Ràng buộc xử lý cho site Sk tải xử lý qi tai site Sk ≤ dung lượng xử lý Sk 45 Định vị phân mảnh • Các phương... EMP.ENO,EMP.ENAME,ASG.PNO, ASG.RESP FROM EMP,ASG WHERE EMP.ENO=ASG.ENO AND DUR=24 truy xuất ứng dụng q1 vị trí với tần số 10 20 Và SELECT ENO,DUR FROM ASG truy xuất ứng dụng q2 vị trí với tần số 20 10 a)... tán? Phân mảnh hay quan hệ? Các quan hệ đơn vị cho phân tán: – Nêu quan hệ không nhân bản, ta đạt dung lượng từ xa lớn – Nếu quan hệ nhân bản, ta có quan hệ không cần thiết nhân bản, gây nhiều vấn