1. Trang chủ
  2. » Thể loại khác

Bài giảng Cơ sở dữ liệu phân tán - Chương 2_ Nguyên lý hệ cơ sở dữ liệu phân tán - Tài Liệu

84 8 0
Tài liệu được quét OCR, nội dung có thể không chính xác

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

Trang 1

CHƯƠNG II: NGUYÊN LÝ HỆ CSDL PHÂN TÁN

e DAC TRUNG TRONG SUOT CUA CSDL-PT _ (Distributed Database Transparency Features) _

e Cho phép người sử dụng cảm tưởng như

CSDL chỉ cho mình họ

e Các đặc trưng bao gồm:

-_ Trong suốt phân tan (Distribution transparency) — Trong suét giao tac.(Transaction transparency) — Trong suét Idi (Failure transparency)

Trang 2

TRONG SUOT PHAN TAN

Ce

Cho phép quản lý 1 CSDL bố trí vật lý tản mạn như

1 CSDL tập trung

trong suốt phân mảnh (fragmerfation tranparency) trong suốt định vi (/ocation tranparency)

trong suốt anh xa cuc b6 (Local mapping

tranparency)

Trang 3

TONG KET CAC DAC TRUNG TS

TABLE 10.2 A SUMMARY OF TRANSPARENCY FEATURES

FRAUMENI NAME |I0CIIONNAME | THỊN THÍ DBM9 9UPPORIS | HH Of DIBTRIBUTIÚN IMNSMNINO

Local mapping

lọ No Location transparency Medium

Trang 4

PHAN MANH DU’ LIEU

C————— e Phan manh (fragmentation) DL la viéc chia

các quan hệ trong 1 CSDL thành các quan

hệ nhỏ hơn (các mảnh : fragment) e Lý do phân mảnh:

- Tạo CSDL cho các site trên mạng

Trang 5

THIET KE CSDL-PT Se Tiép can Top-down : - C6 DB - Làm thế nào đề phân chia dữ liệu và định vị vào các sites

Tiép can Bottom-up :

- Nhiéu-database (cé kha nang-kh6ng thuan nhat, tu tri, )

Trang 7

CAC TIEU CHUAN PHAN MANH OOOO

e_ Điều kién day du: (Completeness condition)

- Néu quan hệ R duoc phan thanh cac manh R1, R2,.«, Rn, thi mỗi mục dữ liệu cĩ trong R phải cĩ mặt trong 1 hoặc nhiều mảnh Ri

e_ Điêu kiện kién thiét (Reconstruction condition):

-Nĩ phải cĩ khả năng kiến thiết lại mỗi một quan hệ tồn cục từ

các phân mảnh của nĩ

e_ Điêu kiện phân tách được -(Disjointness condition) :

-Nếu quan hệ E được phân mảnh ngang thành các mảnh R1, R2, „n và mục dữ liệu tj năm trong mảnh Rị, thì nĩ sẽ khơng nằm trong một mảnh Rk (k<>|) Nếu quan hệ phân rã dọc các thuộc

Trang 9

CAC LOAI PHAN MANH

Ss

e Phân mảnh theo hàng ngang của một quan hệ R là

tách quan hệ R theo cách mà mỗi n_bộ của:R cĩ

mặt trong 1 hay nhiều quan hệ thành phân

(Cụ thé la chia quan hệ R thành các tập cĩn

R1,R2, ,Rn Mỗi tập con chứa một sốn_ bộ của R Cĩ thê khơi phục R bằng phép hợp các Ri Ví dụ sự

phân chia số liệu các khách hàng giao dịch của một

Trang 10

CAC LOAI PHAN MANH

Ss

e Phân mảnh theo chiều dọc của quan hệ R là tách lược đồ của quan hệ R thành các lược đồ cớ số cột nhỏ hơn ( Phân mảnh theo chiêu dọc thực ra là

thực hiện phép chiếu quan hệ R lên tập các thuộc

tính của các quan hé Ri

— Ri =I (thuéc tinh Ai) (R)

Trang 12

# NM Loc Sai E 5| Joe | Sa) 10 @MMMMMMMM:::©, 25 8 | Tom |Sa|15 AE

# NM Loc Sal #\NM Loc Sal

Trang 18

THE HIEN CAC TIEU CHUAN CUA PHAN MANH NGANG

Co

R => Fe=fF,, Fp, ., Fy}

e Tinh day dt (Completeness)

- Mọi bộ teR, 3 F,eF ma teF,

e Tinh tach biet (Disjointness)

~ VteFi, “4S Fj mateFj ij

Trang 19

Làm thể nào kiểm tra tinh day du và tính tach biét?

AB

Trang 20

Lam thé nao dé co duoc tinh day

đủ và tinh tách biệt?

CO 7 77 |

(2) “Tự động” sinh các mảnh

với những đặc tính :

ePhân mảnh ngang được định nghĩa bởi các lệnh (với) ving® Select

Trang 21

Vi du:

CO j

e Phát biểu các truy vẫn dựa vào các vị từ “đơn giản”

A<10, A>5, Loc = SA, Loc = SB

Trang 22

5<A<10 6i so’ cap (I) Cac vi PEST : em? 9 ˆ

(4) A<10 A A>5 A Loc=SaA A ~Ttroe=©cs>——

(4) A<10 A A>5 /A “t+ceoe=e>+>^A LoC7=GSnp

RAS hr — “TT ằằằẶ==-“>——

Trang 23

Các vi từ hội sơ cấp (HH)

CO 7 77 |

Lee) t — Ầ ø — Sẻ

Trang 24

Các mảnh cuỗi cùng: F2 B<A<1l0A lo@SA — F3; 5<A<10 A Loc=Ss Fe A<5 A Loc=Sa F7, A<5 A Loc=SsB

Fio A>10 A LOC=SA

Trang 25

Chu ý: Loại bỏ các phân mảnh phụ

thuộc vào ngữ nghĩa:

Ví dụ : nêu LOC cĩ thể z Sa, z Sa,

chúng ta cân thêm các phân mảnh

F4 5<A<10 A Loc#Saakoc 4SB Fs A<5 A Loc# San Loc # SB

Trang 26

Tại sao sử dụng thuật tốn vị từ hoi so cap (minterm)?

6950

e Phải chứng minh tập các phân mảnh là: - Đây đủ

Trang 27

Tổng kết

AB e Cho các vị từ đơn giản Pr= { p1, p2, pn}

Trang 28

Những vi từ đơn giản nào nên

Trang 29

Tro lai vi du:

Trang 30

Ba chon lua:

CT (1)Pr={} Fi ={E}

(2) Pr = {LOC=Sa, LOC=Sb}

Fo={ © loc=saE, O loc=Sb E }

(3) Pr = {LOC=Sa, LOC=Sb; Sal<10}

F3={ Oloc=Sa « sal<10 E, Oloc=Sa a sal>10 E,

Trang 37

Định nghĩa khơng hình thức

4953

Trang 38

Trở lại ví dụ:

4

Day du ?

(1) Pr={ } No

(2) Pr = {LOC=Sa, LOC=Sb} Yes

(3) Pr = {LOC=Sa, LOC=Sb, Sal<10} Yes

Pr(2) là tập con của Pr(3),

Do đĩ Pr(3) khơng là tối thiểu

Trang 39

Phân mảnh ngang suy dẫn ra (chủ) E(ENO, NAME, SAL, LOC) J(ENO, DESCRIPTION., ) E => F={ E:1, E2} by LOC Truy van: Quan hé mét - nhiéu (thành viên)

Cho biết tên nhân viên,

Trang 41

E1 J1 †# NM Loc Sal E2 # NM Loc Sal 5 Joe Sa 10 | Sally Sb 25 8 Tom Sa 15 12 | Fred Sb 15 ee ii (at Sa) (at Sb) # Des # Des

5_ | workon 347 hw J2| 7 goto moon

5 build table 12 rest

Trang 42

Phân mảnh ngang suy dẫn

.- ữGGŨỤĨ.//J

R,F ={Fi, Fa, Fn} ree the la

Ụ cơ sở hay suy dẫn

S, D = {Di, Da, .Dn} ở đây Dr=Si< Fi

Qui ước : R là chủ

Trang 43

- Kiem tra tính đây đủ và tách biệt

của phân mảnh suy dân 6 Vi du: Phat biéu J la: # Des 33 build chair « Nhưng #= 33 khơng thuộc E1 và cũng khơng thuộc E2!

Những bộ J sẽ khơng thuộc J1 cũng như khơng thuộc 12

Phân mảnh khơng đày đủ

Trang 50

Tinh chat: R[IT]=> Ri[TI

(1)Tính đầy đủ

U Ti=T

Trang 54

(3) Tính kiến thiết:Kết nỗi khơng mất thơng tin

TmHăaa ẫẽa.a

<4 Ri=E

all i

® Một cách đề kết nối khơng mất thơng tin: Mọi phân mảnh đều chứa khĩa,

Key c I¡ for all i

Trang 56

Ái Lực thuộc tính (Attribute affinity)

Co

e Xét lược đơ quan hệ R(A¿, As, ,A,.)

e Các ứng dụng Q(q:, q›, ,q )

e Use (qi, Aj) = 1, nếu Aj được gi tham chiêu

0, trong trường hợp ngược lại

Trang 57

Ái Lực thuộc tính (Attribute affinity)

e Vi du * Ma trận mẫu về giá trị sử dụng thuộc tinh

Trang 58

Ái Lực thuộc tính (Attribute affinity) acc

e Giá trị sử dụng thuộc tính khơng đủ cơ sở

cho việc phân mảnh: chúng khơng biếu thị

độ lớn của tần số ứng dụng

e SỐ đo lực hút (affinity) của:2 thuộc tính Ai, Aj ký hiệu aff(Ai, Aj) biểu thị chocầu nối (bond)

giữa 2 thuộc tính, dựa vào sự truy xuất của

Trang 59

Ái Lực thuộc tính (Attribute affinity)

e Tamer Ơzsu nêu cơng thức đề đo ái lực của 2 thuộc tính Ai, AI:

e Gọi k là sỗ mảnh của quan hệ R R =R;R;Ra R,

e Q = {q1,q2, ,qm)} : tập các ứng dụng trên E e OQ(A,B) là tập các ứng dụng q của Q mà:

Trang 60

Ái Lực thuộc tính (Attribute affinity) e Ai luc gitra 2 thuéc tinh Ai va Aj của quan hệ R và tập.ứng

dung Q được định nghĩa:

e Aff(Ai, Aj) = > > ref(q)acc,(q)

qeQ(Ai, Aj) le R,

ref(q) : số truy xuất đến các thuộc tính (Ai, Aj) cho mỗi ứng

dung q tai vi tri R,

acc(q) : tần số truy xuất ứng dụng q đến cac thuuoc tinh Ai,Aj

Trang 61

Ái Lực thuộc tính (Attribute affinity) acc

e Ví dụ : Xét lại ví dụ *, giả sử refi(q) =1 cho tật cả q

và S¡,, và sơ mảnh là 3 Tân sơ ứng dụng cho mọi

cặp thuộc tính là:

Trang 64

Thuật tốn năng lượng nỗi BEA (Bond Energy Algorithm) e Tac gia : Hofer & Severance, 1975 va Navathe et al, 1984 e Y nghĩa: - Xác định các nhĩm thuộc tính - Độ phức tạp O(n2)

- Khơng làm thay đổi kết quả tụ nhĩm

Trang 65

Thuật tốn năng lượng nỗi BEA (Bond

Energy Algorithm) CO

e AM=) } aff(A, A) [aff(A, A, +) + aff(A,, i=1 J=†

Với aff(Ao, A)= aff(A,, Ao) = aff(A,,.4; A) =

aff(A,, A,.,) =0, cho moi i, j

Trang 66

Thuật tốn năng lượng nỗi BEA (Bond

Energy Algorithm)

e Hàm cực đại hĩa chỉ xét những lân cận gân nhất, vì thế các giá trị lớn được nhĩm lại với nhau, các

giá trị nhỏ được nhĩm lại với nhau Ma trận ái lực

thuộc tính AA co tinh đối xứng nên SỐ đo ái lực cĩ thé rut gon:

e AM = aff(A,, A,) [aff(A,, A, ,) + aff(A,,A 4)]

Trang 67

Thuật tốn năng lượng nỗi BEA (Bond

Energy Algorithm)

e Quá trình sinh ma trận ái lực gồm 3 bước:

e 1 Khởi gán: Đặt và cơ định 1 trong các cột của AA

vào trong CA Cột 1 được chọn

e 2 Thực hiện lặp: Lấây lần lượt 1.trong n-i-cột cịn lại

(¡ là số cột đã được đặt vào CA) và thử đặt vào i+1 vị

tri con lai trong ma tran CA Chon dat sao cho AM là

lớn nhất Lặp đến hết các cột

e Sắp thứ tự hàng: Khi thứ tự cột đã xác định, các

hàng cũng cần đặt lại để các vị trí tương đối của

Trang 68

Thuật tốn năng lượng nỗi BEA (Bond

Energy Algorithm)

e Mot vi du tinh toan cho thuat toan BEA

Trang 72

Allocation

CO 7 7 7 |

Example: E(#,NM,LOC,SAL) => F1 = Oloc=sa E ; F2 = Oloc=sb E

Qa: select where loc=Sa

Trang 73

Các vẫn đề thảo luận

CO

e Cac truy van bắt đầu từ đâu e Chi phí truyền thơng là gì?

kích thước kết quả,quan hệ, :

Trang 74

Các vẫn đề khác

Co C77777 7 7 7 |

e Chiến lược xử lý truy vân?

- Các kết nối thực hiện như thế nào?

Trang 75

Vì sao tiên hành lặp các phân

mãn so

e Chi phí của việc cập nhật các bản sao?

Trang 77

Mơ hình đơn giản Ce | Phân mảnh đơn F Các Site S., S„ Các bién X,, ., X,, Xj = |0 if F khơng lưu trử tai Sj 1 if F luu tr Sj Tổng chỉ phí = Chi phí đọc+ Chi phí ghi+ Chi phí lưu trữ

Xác định các giá tri cho Xj, 1 <j <m,

Trang 78

Chi phí đọc 6 mM Chi phi đọc= 2 [tix MIN Ci] I= J

i: site cd yéu cau

ti: số lượng tin doc tai Si

Cị: - Chỉ phí lẫy tin truy xuất phân mảnh F tại

Trang 79

Chi phí ghi = DE 77 ` S Xj ui Ciij i: site cé yéu cau j: SIte được cập nhật

Xi: 10 nếu F khơng lưu trữ tại Š¡ 1 nêu F lưu trữ tại-Sị

u¡: lượng tin ghi tại S¡

Trang 80

Chi phí lưu trữ: m » Xi di i=1

Xi: (0 nếu F khơng lưu trữ tai Sj 1nếu F lưu trữ tại-S¡

Ngày đăng: 05/01/2017, 16:48

TỪ KHÓA LIÊN QUAN