1. Trang chủ
  2. » Thể loại khác

Chuong 3 - Distributed Database

116 237 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 116
Dung lượng 1,84 MB

Nội dung

Chương Distributed Database TS Nguyễn Đình Thuân 3.1 Giới thiệu CSDLPT * Thiết kế hệ thống thông tin có CSDL phân tán bao gồm: - Phân tán chọn vị tri đặt liệu; - Các chương trình ứng dụng điểm; - Thiết kế tổ chức khai thác hệ thống mạng * Định nghĩa 1: Cơ sở liệu (CSDL) phân tán tập hợp liệu, mà mặt logic tập hợp thuộc hệ thống, mặt vật lý liệu phân tán vị trí khác mạng máy tính 3.1 Giới thiệu CSDLPT Sự phân tán liệu (data distribution): liệu phải phân tán nhiều nơi Sự tương quan luận lý (logical correlation): liệu nơi sử dụng chung để giải vấn đề Ví dụ: - Một ngân hàng có ba chi nhánh vị trí địa lý khác - Tại chi nhánh có máy tính sở liệu tài khoản, tạo thành nơi (site) sở liệu phân tán - Các máy tính kết nối với thơng qua mạng máy tính truyền thơng - Một khách hàng gửi tiền rút tiền chi nhánh 3.1 Giới thiệu CSDLPT Định nghĩa 2: Cơ sở liệu phân tán tập hợp liệu phân tán máy tính khác mạng máy tính Mỗi nơi mạng máy tính có khả xử lý tự trị thực ứng dụng cục Mỗi nơi tham gia thực ứng dụng toàn cục, mà nơi yêu cầu truy xuất liệu nhiều nơi cách dùng hệ thống truyền thông - Sự phân tán liệu (data distribution): liệu phải phân tán nhiều nơi - Ứng dụng cục (local application): ứng dụng chạy hoàn thành nơi sử dụng liệu cục nơi - Ứng dụng toàn cục (hoặc ứng dụng phân tán) (global application / distributed application): ứng dụng chạy hoàn thành sử dụng liệu hai nơi 3.1 Giới thiệu CSDLPT Cơ sở liệu Cơ sở liệu Terminal T T Máy tính Chi nhánh Máy tính T T T Chi nhánh Mạng truyền thông Chi nhánh T T T Máy tính Cơ sở liệu 3.1 Giới thiệu CSDLPT Trung tâm máy tính Chi nhánh T T T Cơ sở liệu Cơ sở liệu Máy tính Máy tính Chi nhánh T T T Mạng cục Chi nhánh T T T Máy tính Cơ sở liệu Cơ sở liệu phân tán mạng cục 3.1 Giới thiệu CSDLPT Trung tâm máy tính Chi nhánh T T T Cơ sở liệu Cơ sở liệu Cơ sở liệu Máy tính phía sau Máy tính phía sau Máy tính phía sau Chi nhánh T T T Mạng cục Máy tính ứng dụng (phía trước) Chi nhánh T T T Hệ thống đa xử lý (multiprocessor system) 3.1 Giới thiệu CSDLPT Hệ quản trị sở liệu phân tán (DDBMSs) Chức năng: - Hỗ trợ việc tạo bảo trì sở liệu phân tán - Có thành phần tương tự hệ quản trị sở liệu tập trung - Các thành phần hỗ trợ việc chuyển tải liệu đến trạm ngược lại Thành phần DDBMS: - Quản trị liệu (Database management): DB - Truyền thông liệu (Data Communication): DC - Từ điển liệu (Data Dictionary): DD dùng để mô tả thông tin phân tán liệu mạng - Cơ sở liệu phân tán (Distributed Database): DDB 3.1 Giới thiệu CSDLPT` T T T Local database DB DC DDB DD Site Site DD Local database DB T DDB DC T T Các thành phần DDBMS thương mại 3.1 Giới thiệu CSDLPT So sánh csdl phân tán csdl tập trung Nhận xét: CSDL phân tán không đơn giản thực phân tán CSDL tập trung, chúng cho phép thiết kế đặc trưng khác với CSDL tập trung Các đặc điểm tiêu biểu CSDL truyền thống: • điều khiển tập trung • độc lập liệu • giảm dư thừa • biệt lập bảo mật liệu 10 3.11 Xử lý truy vấn môi trường phân tán Luật 2: Ri Rj =φ ∀x∈Ri, ∀y∈Rj : ¬ (pi(x)∧pj(y)) Trong Ri, Rj xác định theo vị từ pi, pj thuộc tính Nhận xét: • Việc xác định phép nối vơ ích thực cách xem xét vị từ mảnh • Truy vấn rút gọn tốt đơn giản truy vấn ban đầu • Một thuận lợi truy vấn rút gọn phép nối thực song song 102 3.11 Xử lý truy vấn mơi trường phân tán Ví dụ: dụ Giả sử quan hệ E phân mảnh thành mảnh E1=σMANV ≤ ”E3” (E) E2=σ”E3”< MANV ≤ ”E6”(E) E3=σMANV > ”E6”(E) Quan hệ G phân làm hai mảnh: G1=σMANV≤ ”E3”(G) G2=σMANV>”E3”(G) Nhận xét: xét • E1 G1 định nghĩa vị từ • Vị từ định nghĩa G2 hợp định nghĩa vị từ E2 E3 Xét truy vấn SELECT * FROM E, G WHERE E.MANV=G.MANV 103 3.11 Xử lý truy vấn môi trường phân tán E1=σMANV ≤ ”E3” (E) G1=σMANV≤ ”E3”(G) E E2=σ”E3”< MANV ≤ ”E6” (E) E3=σMANV > ”E6”(E) G2=σMANV>”E3”(G) G = (E1∪E2∪E3) (G1∪G2) = (E1 G1)∪(E1 G2)∪(E2 G1)∪(E2 G2)∪(E3 G1)∪(E3 G2) = (E1 G1) ∪ (E2 G2)∪ (E3 G2) ∪ MANV ∪ ∪ E1 E2 E3 G1 MANV G2 E1 G1 MANV E2 G2 MANV E3 G2 (b) Truy vấn rút gọn (a) Truy vấn ban đầu Hình 4.8: Sự rút gọn phân mảnh ngang với phép nối 104 3.11 Xử lý truy vấn môi trường phân tán Rút gọn phân mảnh dọc • Chức việc phân mảnh dọc tách quan hệ dựa vào thuộc tính phép chiếu • Vì phép tốn xây dựng lại phân mảnh dọc nối, nên chương trình định vị quan hệ phân mảnh dọc nối mảnh vùng thuộc tính chung Ví dụ: Quan hệ E phân mảnh dọc thành E1, E2, với thuộc tính khố MANV lặp lại sau: E1 = Π MANV,TENNV(E) E2 = ΠMANV,CHUCVU(E) Chương trình định vị là: E = E1 MANV E2 • Các truy vấn phân mảnh dọc rút gọn cách xác định quan hệ trung gian vô ích loại bỏ chứa chúng • Các phép chiếu phân mảnh dọc khơng có thuộc tính chung với thuộc tính chiếu (ngoại trừ khóa 105 quan hệ) vơ ích, quan hệ khác rỗng 3.11 Xử lý truy vấn môi trường phân tán Luật 3: ΠD,K(Ri) vơ ích D∩A’=φ Trong đó, quan hệ R xác định A={A1, ,An}; R = ΠA’(R), A’⊆A , K khoá quan hệ, K⊂A, D tập thuộc tính chiếu, D ⊂ A Ví dụ: Với quan hệ E phân mảnh dọc sau: E1 = Π MANV,TENNV(E) E2 = ΠMANV,CHUCVU(E) Π TENNV Π TENNV Xét truy vấn SQL: MANV SELECT FROM TENNV E E1 E2 (a) Truy vấn ban đầu E1 (b) Truy vấn rút gọn Hình 4.9: Rút gọn việc phân mảnh dọc Nhận xét: phép chiếu E2 vơ ích TENNV khơng có E2, nên phép chiếu cần gán vào E1 106 3.11 Xử lý truy vấn môi trường phân tán Rút gọn theo phân mảnh gián tiếp • Sự phân mảnh ngang gián tiếp cách tách hai quan hệ để việc xử lý nối phép chọn phép nối • Nếu quan hệ R phụ thuộc vào phân mảnh ngang gián tiếp nhờ quan hệ S, mảnh R S, mà có giá trị thuộc tính nối định vị trạm Ngồi ra, S phân mảnh tùy thuộc vào vị từ chọn • Khi R đặt tuỳ theo S, phân mảnh gián tiếp nên sử dụng mối quan hệ nhiều từ S→R (i.e với S phù hợp với n R, Nhưng với R phù hợp với S) • Truy vấn phân mảnh gián tiếp rút gọn được, vị từ phân mảnh mâu thuẫn phép nối đưa quan hệ rỗng • Chương trình định vị quan hệ phân mảnh ngang gián tiếp hợp mảnh 107 3.11 Xử lý truy vấn môi trường phân tán Ví dụ: Cho mối quan hệ nhiều từ E đến G, quan hệ G (MANV, MADA, NHIEMVU, THOIGIAN) phân mảnh gián luật sau: G1 = G G2 = G MANV E1 MANV E2 Trong E phân mảnh ngang sau: E1= σCHUCVU=”Lập trình”(E) E2= σCHUCVU≠ ”Lập trình”(E) Chương trình định vị cho quan hệ phân mảnh gián tiếp hợp mảnh G=G1∪G2 Để rút gọn truy vấn phân mảnh gián tiếp này, phép nối đưa quan hệ rỗng vị từ phân mảnh mâu thuẫn Ví dụ vị từ G1 E2 mâu thuẫn nhau, nên G1 E2 =φ 108 G1 = G MANV E1 E1= σ CHUCVU=”Lập trình”(E) G2 = G MANV E2 E2= σ CHUCVU≠ ”Lập trình”(E) Ví dụ: Xét truy vấn SELECT * FROM E, G WHERE G.MANV=E.MANV AND CHUCVU=”KS khí” MANV σ ∪ G1 MANV CHUCVU=”KS khí” ∪ G2 (a) Truy vấn ban đầu E1 G1 E2 σ ∪ G2 CHUCVU=”KS khí” E2 (b) Truy vấn sau đẩy phép chọn xuống 109 Chú ý: (G1 ∪ G2 ) σ CHUCVU=”ks khí”(E2) = (G1 σ CHUCVU=”ks khí”(E2)) ∪ (G2 σ CHUCVU=”ks khí”(E2)) ∪ MANV MANV σ G1 σ CHUCVU=”KS khí” E2 G2 MANV σ CHUCVU=”KS khí” E2 (c) Truy vấn sau đẩy phép hợp lên G2 CHUCVU=”KS khí” E2 (d) Truy vấn rút gọn Hình 4.10: Rút gọn phân mảnh gián tiếp Nhận xét: xét • Truy vấn ban đầu mảnh E1, E2, G1 G2 tương ứng hình 4.10a • Bằng cách đẩy phép chọn xuống mảnh E1 E2, truy vấn rút gọn hình 4.10b • Phân phối phép nối với phép hợp, thu hình 4.10c • Cây bên trái đưa quan hệ rỗng, nên rút gọn có 110 3.11 Xử lý truy vấn môi trường phân tán Rút gọn theo phân mảnh hỗn hợp • Sự phân mảnh hỗn hợp kết hợp phân dọc phân mảnh ngang • Mục đích phân mảnh hỗn hợp hỗ trợ truy vấn liên quan đến phép chiếu, phép chọn phép nối • Chương trình định vị cho quan hệ phân mảnh hỗn hợp phép hợp phép nối mảnh Ví dụ: Xét quan hệ E phân mảnh hỗn hợp sau: E1=σMANV ≤ ”E4”(ΠMANV,TENNV(E)), E2=σMANV > ”E4”(Π MANV,TENNV(E)) E3=Π MANV,CHUCVU(E) Chương trình định vị là: E = (E1 ∪ E2) MANV E3 111 3.11 Xử lý truy vấn môi trường phân tán Các truy vấn mảnh hỗn hợp rút gọn cách kết hợp luật sử dụng phân mảnh ngang nguyên thủy, phân mảnh dọc, phân mảnh ngang gián tiếp, tương ứng sau: 1.Loại bỏ quan hệ rỗng sinh mâu thuẫn phép chọn phân mảnh ngang 2.Loại bỏ quan hệ vơ ích sinh phép chiếu phân mảnh dọc 3.Phân phối phép nối với phép hợp để tách loại bỏ phép nối vơ ích 112 Ví dụ: dụ E1=σMANV ≤ ”E4” (ΠMANV,TENNV(E)), E2=σMANV > ”E4”(Π MANV,TENNV(E)) E3=Π MANV,CHUCVU(E) SELECT FROM WHERE π TENNV E MANV=”E5” TENNV π TENNV σ MANV=”E5” σ MANV=”E5” ∪ E2 E1 E2 E3 (a) Truy vấn ban đầu (b) Truy vấn rút gọn Hình 4.11: Rút gọn phân mảnh hỗn hợp 113 114 115 Chương Distributed Database TS Nguyễn Đình Thuân 116 ... - Quản trị liệu (Database management): DB - Truyền thông liệu (Data Communication): DC - Từ điển liệu (Data Dictionary): DD dùng để mô tả thông tin phân tán liệu mạng - Cơ sở liệu phân tán (Distributed. .. đoạn quan hệ tổng thể trạm tạo ảnh vật lý 21 3. 2 Kiến trúc sở liệu phân tán R R 1 R1 R2 R21 R12 R22 R1 (Trạm ) R2 (Trạm ) R3 R 23 R4 R 3 R3 (Trạm ) R 43 Quan hệ tổng thể Các đoạn Hình ảnh vật lý... phân tán (Distributed Database) : DDB 3. 1 Giới thiệu CSDLPT` T T T Local database DB DC DDB DD Site Site DD Local database DB T DDB DC T T Các thành phần DDBMS thương mại 3. 1 Giới thiệu CSDLPT

Ngày đăng: 09/12/2017, 11:27

TỪ KHÓA LIÊN QUAN

w