1. Trang chủ
  2. » Thể loại khác

Chuong 3 - Distributed Database

116 237 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Cấu trúc

  • PowerPoint Presentation

  • Slide 2

  • Slide 3

  • Slide 4

  • Slide 5

  • Slide 6

  • Slide 7

  • Slide 8

  • Slide 9

  • Slide 10

  • Slide 11

  • Slide 12

  • Slide 13

  • Slide 14

  • Slide 15

  • Kiến trúc CSDL phân tán

  • 3.2 KIẾN TRÚC CƠ BẢN CỦA CSDL PHÂN TÁN

  • 3.2 Kiến trúc cơ bản của một cơ sở dữ liệu phân tán

  • Slide 19

  • Slide 20

  • Slide 21

  • Slide 22

  • 3.3 CÁC ĐẶC ĐIỂM CHÍNH CỦA HỆ PHÂN TÁN

  • Slide 24

  • Slide 25

  • Slide 26

  • Slide 27

  • Slide 28

  • Slide 29

  • 3.4 TRONG SUỐT PHÂN TÁN

  • Slide 31

  • Slide 32

  • Slide 33

  • Slide 34

  • Slide 35

  • 3.5 Phân biệt CSDL phân tán và CSDL song song

  • Slide 37

  • 3.6 Lợi ích của CSDLPT

  • Slide 39

  • Slide 40

  • 3.7 PHƯƠNG PHÁP THIẾT KẾ CSDL PHÂN TÁN

  • Slide 42

  • Slide 43

  • Slide 44

  • Slide 45

  • Slide 46

  • Slide 47

  • Slide 48

  • 3.8 PHÂN MẢNH DỮ LIỆU

  • 3.8.1 Phân mảnh ngang (horizontal fragmentation)

  • 3.8.2 Phân mảnh dọc (vertical fragmentation)

  • 3.8.3 Phân mảnh kết hợp (hybrid fragmentation)

  • Slide 53

  • Cơ sở dữ liệu của một công ty máy tính

  • Ví dụ về phân mảnh dữ liệu

  • Slide 56

  • 3.8.4 Bản sao (replication) và cấp phát (allocation)

  • 3.9 Cấp phát tài nguyên trong hệ phân tán

  • Slide 59

  • Slide 60

  • Slide 61

  • Slide 62

  • Slide 63

  • Slide 64

  • Slide 65

  • Slide 66

  • Slide 67

  • Slide 68

  • Slide 69

  • Slide 70

  • Slide 71

  • Slide 72

  • 3.11 Xử lý truy vấn trong môi trường phân tán

  • Slide 74

  • Slide 75

  • Slide 76

  • Slide 77

  • Slide 78

  • Slide 79

  • Slide 80

  • Slide 81

  • Slide 82

  • Slide 83

  • Slide 84

  • Slide 85

  • Slide 86

  • Slide 87

  • Slide 88

  • Slide 89

  • Slide 90

  • Slide 91

  • Slide 92

  • Slide 93

  • Slide 94

  • Slide 95

  • Slide 96

  • Slide 97

  • Slide 98

  • Slide 99

  • Slide 100

  • Slide 101

  • Slide 102

  • Slide 103

  • Slide 104

  • Slide 105

  • Slide 106

  • Slide 107

  • Slide 108

  • Slide 109

  • Slide 110

  • Slide 111

  • Slide 112

  • Slide 113

  • Slide 114

  • Slide 115

  • Slide 116

Nội dung

Chương Distributed Database TS Nguyễn Đình Thuân 3.1 Giới thiệu CSDLPT * Thiết kế hệ thống thông tin có CSDL phân tán bao gồm: - Phân tán chọn vị tri đặt liệu; - Các chương trình ứng dụng điểm; - Thiết kế tổ chức khai thác hệ thống mạng * Định nghĩa 1: Cơ sở liệu (CSDL) phân tán tập hợp liệu, mà mặt logic tập hợp thuộc hệ thống, mặt vật lý liệu phân tán vị trí khác mạng máy tính 3.1 Giới thiệu CSDLPT Sự phân tán liệu (data distribution): liệu phải phân tán nhiều nơi Sự tương quan luận lý (logical correlation): liệu nơi sử dụng chung để giải vấn đề Ví dụ: - Một ngân hàng có ba chi nhánh vị trí địa lý khác - Tại chi nhánh có máy tính sở liệu tài khoản, tạo thành nơi (site) sở liệu phân tán - Các máy tính kết nối với thơng qua mạng máy tính truyền thơng - Một khách hàng gửi tiền rút tiền chi nhánh 3.1 Giới thiệu CSDLPT Định nghĩa 2: Cơ sở liệu phân tán tập hợp liệu phân tán máy tính khác mạng máy tính Mỗi nơi mạng máy tính có khả xử lý tự trị thực ứng dụng cục Mỗi nơi tham gia thực ứng dụng toàn cục, mà nơi yêu cầu truy xuất liệu nhiều nơi cách dùng hệ thống truyền thông - Sự phân tán liệu (data distribution): liệu phải phân tán nhiều nơi - Ứng dụng cục (local application): ứng dụng chạy hoàn thành nơi sử dụng liệu cục nơi - Ứng dụng toàn cục (hoặc ứng dụng phân tán) (global application / distributed application): ứng dụng chạy hoàn thành sử dụng liệu hai nơi 3.1 Giới thiệu CSDLPT Cơ sở liệu Cơ sở liệu Terminal T T Máy tính Chi nhánh Máy tính T T T Chi nhánh Mạng truyền thông Chi nhánh T T T Máy tính Cơ sở liệu 3.1 Giới thiệu CSDLPT Trung tâm máy tính Chi nhánh T T T Cơ sở liệu Cơ sở liệu Máy tính Máy tính Chi nhánh T T T Mạng cục Chi nhánh T T T Máy tính Cơ sở liệu Cơ sở liệu phân tán mạng cục 3.1 Giới thiệu CSDLPT Trung tâm máy tính Chi nhánh T T T Cơ sở liệu Cơ sở liệu Cơ sở liệu Máy tính phía sau Máy tính phía sau Máy tính phía sau Chi nhánh T T T Mạng cục Máy tính ứng dụng (phía trước) Chi nhánh T T T Hệ thống đa xử lý (multiprocessor system) 3.1 Giới thiệu CSDLPT Hệ quản trị sở liệu phân tán (DDBMSs) Chức năng: - Hỗ trợ việc tạo bảo trì sở liệu phân tán - Có thành phần tương tự hệ quản trị sở liệu tập trung - Các thành phần hỗ trợ việc chuyển tải liệu đến trạm ngược lại Thành phần DDBMS: - Quản trị liệu (Database management): DB - Truyền thông liệu (Data Communication): DC - Từ điển liệu (Data Dictionary): DD dùng để mô tả thông tin phân tán liệu mạng - Cơ sở liệu phân tán (Distributed Database): DDB 3.1 Giới thiệu CSDLPT` T T T Local database DB DC DDB DD Site Site DD Local database DB T DDB DC T T Các thành phần DDBMS thương mại 3.1 Giới thiệu CSDLPT So sánh csdl phân tán csdl tập trung Nhận xét: CSDL phân tán không đơn giản thực phân tán CSDL tập trung, chúng cho phép thiết kế đặc trưng khác với CSDL tập trung Các đặc điểm tiêu biểu CSDL truyền thống: • điều khiển tập trung • độc lập liệu • giảm dư thừa • biệt lập bảo mật liệu 10 3.11 Xử lý truy vấn môi trường phân tán Luật 2: Ri Rj =φ ∀x∈Ri, ∀y∈Rj : ¬ (pi(x)∧pj(y)) Trong Ri, Rj xác định theo vị từ pi, pj thuộc tính Nhận xét: • Việc xác định phép nối vơ ích thực cách xem xét vị từ mảnh • Truy vấn rút gọn tốt đơn giản truy vấn ban đầu • Một thuận lợi truy vấn rút gọn phép nối thực song song 102 3.11 Xử lý truy vấn mơi trường phân tán Ví dụ: dụ Giả sử quan hệ E phân mảnh thành mảnh E1=σMANV ≤ ”E3” (E) E2=σ”E3”< MANV ≤ ”E6”(E) E3=σMANV > ”E6”(E) Quan hệ G phân làm hai mảnh: G1=σMANV≤ ”E3”(G) G2=σMANV>”E3”(G) Nhận xét: xét • E1 G1 định nghĩa vị từ • Vị từ định nghĩa G2 hợp định nghĩa vị từ E2 E3 Xét truy vấn SELECT * FROM E, G WHERE E.MANV=G.MANV 103 3.11 Xử lý truy vấn môi trường phân tán E1=σMANV ≤ ”E3” (E) G1=σMANV≤ ”E3”(G) E E2=σ”E3”< MANV ≤ ”E6” (E) E3=σMANV > ”E6”(E) G2=σMANV>”E3”(G) G = (E1∪E2∪E3) (G1∪G2) = (E1 G1)∪(E1 G2)∪(E2 G1)∪(E2 G2)∪(E3 G1)∪(E3 G2) = (E1 G1) ∪ (E2 G2)∪ (E3 G2) ∪ MANV ∪ ∪ E1 E2 E3 G1 MANV G2 E1 G1 MANV E2 G2 MANV E3 G2 (b) Truy vấn rút gọn (a) Truy vấn ban đầu Hình 4.8: Sự rút gọn phân mảnh ngang với phép nối 104 3.11 Xử lý truy vấn môi trường phân tán Rút gọn phân mảnh dọc • Chức việc phân mảnh dọc tách quan hệ dựa vào thuộc tính phép chiếu • Vì phép tốn xây dựng lại phân mảnh dọc nối, nên chương trình định vị quan hệ phân mảnh dọc nối mảnh vùng thuộc tính chung Ví dụ: Quan hệ E phân mảnh dọc thành E1, E2, với thuộc tính khố MANV lặp lại sau: E1 = Π MANV,TENNV(E) E2 = ΠMANV,CHUCVU(E) Chương trình định vị là: E = E1 MANV E2 • Các truy vấn phân mảnh dọc rút gọn cách xác định quan hệ trung gian vô ích loại bỏ chứa chúng • Các phép chiếu phân mảnh dọc khơng có thuộc tính chung với thuộc tính chiếu (ngoại trừ khóa 105 quan hệ) vơ ích, quan hệ khác rỗng 3.11 Xử lý truy vấn môi trường phân tán Luật 3: ΠD,K(Ri) vơ ích D∩A’=φ Trong đó, quan hệ R xác định A={A1, ,An}; R = ΠA’(R), A’⊆A , K khoá quan hệ, K⊂A, D tập thuộc tính chiếu, D ⊂ A Ví dụ: Với quan hệ E phân mảnh dọc sau: E1 = Π MANV,TENNV(E) E2 = ΠMANV,CHUCVU(E) Π TENNV Π TENNV Xét truy vấn SQL: MANV SELECT FROM TENNV E E1 E2 (a) Truy vấn ban đầu E1 (b) Truy vấn rút gọn Hình 4.9: Rút gọn việc phân mảnh dọc Nhận xét: phép chiếu E2 vơ ích TENNV khơng có E2, nên phép chiếu cần gán vào E1 106 3.11 Xử lý truy vấn môi trường phân tán Rút gọn theo phân mảnh gián tiếp • Sự phân mảnh ngang gián tiếp cách tách hai quan hệ để việc xử lý nối phép chọn phép nối • Nếu quan hệ R phụ thuộc vào phân mảnh ngang gián tiếp nhờ quan hệ S, mảnh R S, mà có giá trị thuộc tính nối định vị trạm Ngồi ra, S phân mảnh tùy thuộc vào vị từ chọn • Khi R đặt tuỳ theo S, phân mảnh gián tiếp nên sử dụng mối quan hệ nhiều từ S→R (i.e với S phù hợp với n R, Nhưng với R phù hợp với S) • Truy vấn phân mảnh gián tiếp rút gọn được, vị từ phân mảnh mâu thuẫn phép nối đưa quan hệ rỗng • Chương trình định vị quan hệ phân mảnh ngang gián tiếp hợp mảnh 107 3.11 Xử lý truy vấn môi trường phân tán Ví dụ: Cho mối quan hệ nhiều từ E đến G, quan hệ G (MANV, MADA, NHIEMVU, THOIGIAN) phân mảnh gián luật sau: G1 = G G2 = G MANV E1 MANV E2 Trong E phân mảnh ngang sau: E1= σCHUCVU=”Lập trình”(E) E2= σCHUCVU≠ ”Lập trình”(E) Chương trình định vị cho quan hệ phân mảnh gián tiếp hợp mảnh G=G1∪G2 Để rút gọn truy vấn phân mảnh gián tiếp này, phép nối đưa quan hệ rỗng vị từ phân mảnh mâu thuẫn Ví dụ vị từ G1 E2 mâu thuẫn nhau, nên G1 E2 =φ 108 G1 = G MANV E1 E1= σ CHUCVU=”Lập trình”(E) G2 = G MANV E2 E2= σ CHUCVU≠ ”Lập trình”(E) Ví dụ: Xét truy vấn SELECT * FROM E, G WHERE G.MANV=E.MANV AND CHUCVU=”KS khí” MANV σ ∪ G1 MANV CHUCVU=”KS khí” ∪ G2 (a) Truy vấn ban đầu E1 G1 E2 σ ∪ G2 CHUCVU=”KS khí” E2 (b) Truy vấn sau đẩy phép chọn xuống 109 Chú ý: (G1 ∪ G2 ) σ CHUCVU=”ks khí”(E2) = (G1 σ CHUCVU=”ks khí”(E2)) ∪ (G2 σ CHUCVU=”ks khí”(E2)) ∪ MANV MANV σ G1 σ CHUCVU=”KS khí” E2 G2 MANV σ CHUCVU=”KS khí” E2 (c) Truy vấn sau đẩy phép hợp lên G2 CHUCVU=”KS khí” E2 (d) Truy vấn rút gọn Hình 4.10: Rút gọn phân mảnh gián tiếp Nhận xét: xét • Truy vấn ban đầu mảnh E1, E2, G1 G2 tương ứng hình 4.10a • Bằng cách đẩy phép chọn xuống mảnh E1 E2, truy vấn rút gọn hình 4.10b • Phân phối phép nối với phép hợp, thu hình 4.10c • Cây bên trái đưa quan hệ rỗng, nên rút gọn có 110 3.11 Xử lý truy vấn môi trường phân tán Rút gọn theo phân mảnh hỗn hợp • Sự phân mảnh hỗn hợp kết hợp phân dọc phân mảnh ngang • Mục đích phân mảnh hỗn hợp hỗ trợ truy vấn liên quan đến phép chiếu, phép chọn phép nối • Chương trình định vị cho quan hệ phân mảnh hỗn hợp phép hợp phép nối mảnh Ví dụ: Xét quan hệ E phân mảnh hỗn hợp sau: E1=σMANV ≤ ”E4”(ΠMANV,TENNV(E)), E2=σMANV > ”E4”(Π MANV,TENNV(E)) E3=Π MANV,CHUCVU(E) Chương trình định vị là: E = (E1 ∪ E2) MANV E3 111 3.11 Xử lý truy vấn môi trường phân tán Các truy vấn mảnh hỗn hợp rút gọn cách kết hợp luật sử dụng phân mảnh ngang nguyên thủy, phân mảnh dọc, phân mảnh ngang gián tiếp, tương ứng sau: 1.Loại bỏ quan hệ rỗng sinh mâu thuẫn phép chọn phân mảnh ngang 2.Loại bỏ quan hệ vơ ích sinh phép chiếu phân mảnh dọc 3.Phân phối phép nối với phép hợp để tách loại bỏ phép nối vơ ích 112 Ví dụ: dụ E1=σMANV ≤ ”E4” (ΠMANV,TENNV(E)), E2=σMANV > ”E4”(Π MANV,TENNV(E)) E3=Π MANV,CHUCVU(E) SELECT FROM WHERE π TENNV E MANV=”E5” TENNV π TENNV σ MANV=”E5” σ MANV=”E5” ∪ E2 E1 E2 E3 (a) Truy vấn ban đầu (b) Truy vấn rút gọn Hình 4.11: Rút gọn phân mảnh hỗn hợp 113 114 115 Chương Distributed Database TS Nguyễn Đình Thuân 116 ... - Quản trị liệu (Database management): DB - Truyền thông liệu (Data Communication): DC - Từ điển liệu (Data Dictionary): DD dùng để mô tả thông tin phân tán liệu mạng - Cơ sở liệu phân tán (Distributed. .. đoạn quan hệ tổng thể trạm tạo ảnh vật lý 21 3. 2 Kiến trúc sở liệu phân tán R R 1 R1 R2 R21 R12 R22 R1 (Trạm ) R2 (Trạm ) R3 R 23 R4 R 3 R3 (Trạm ) R 43 Quan hệ tổng thể Các đoạn Hình ảnh vật lý... phân tán (Distributed Database) : DDB 3. 1 Giới thiệu CSDLPT` T T T Local database DB DC DDB DD Site Site DD Local database DB T DDB DC T T Các thành phần DDBMS thương mại 3. 1 Giới thiệu CSDLPT

Ngày đăng: 09/12/2017, 11:27

TỪ KHÓA LIÊN QUAN

w