CHƯƠNG II: NGUYÊN LÝ HỆ CSDL PHÂN TÁN
e DAC TRUNG TRONG SUOT CUA CSDL-PT _ (Distributed Database Transparency Features) _
e Cho phép người sử dụng cảm tưởng như
CSDL chỉ cho mình họ
e Các đặc trưng bao gồm:
-_ Trong suốt phân tan (Distribution transparency) — Trong suét giao tac.(Transaction transparency) — Trong suét Idi (Failure transparency)
Trang 2TRONG SUOT PHAN TAN
Ce
Cho phép quản lý 1 CSDL bố trí vật lý tản mạn như
1 CSDL tập trung
trong suốt phân mảnh (fragmerfation tranparency) trong suốt định vi (/ocation tranparency)
trong suốt anh xa cuc b6 (Local mapping
tranparency)
Trang 3TONG KET CAC DAC TRUNG TS
TABLE 10.2 A SUMMARY OF TRANSPARENCY FEATURES
FRAUMENI NAME |I0CIIONNAME | THỊN THÍ DBM9 9UPPORIS | HH Of DIBTRIBUTIÚN IMNSMNINO
Local mapping
lọ No Location transparency Medium
Trang 4PHAN MANH DU’ LIEU
C————— e Phan manh (fragmentation) DL la viéc chia
các quan hệ trong 1 CSDL thành các quan
hệ nhỏ hơn (các mảnh : fragment) e Lý do phân mảnh:
- Tạo CSDL cho các site trên mạng
Trang 5THIET KE CSDL-PT Se Tiép can Top-down : - C6 DB - Làm thế nào đề phân chia dữ liệu và định vị vào các sites
Tiép can Bottom-up :
- Nhiéu-database (cé kha nang-kh6ng thuan nhat, tu tri, )
Trang 7CAC TIEU CHUAN PHAN MANH OOOO
e_ Điều kién day du: (Completeness condition)
- Néu quan hệ R duoc phan thanh cac manh R1, R2,.«, Rn, thi mỗi mục dữ liệu cĩ trong R phải cĩ mặt trong 1 hoặc nhiều mảnh Ri
e_ Điêu kiện kién thiét (Reconstruction condition):
-Nĩ phải cĩ khả năng kiến thiết lại mỗi một quan hệ tồn cục từ
các phân mảnh của nĩ
e_ Điêu kiện phân tách được -(Disjointness condition) :
-Nếu quan hệ E được phân mảnh ngang thành các mảnh R1, R2, „n và mục dữ liệu tj năm trong mảnh Rị, thì nĩ sẽ khơng nằm trong một mảnh Rk (k<>|) Nếu quan hệ phân rã dọc các thuộc
Trang 9CAC LOAI PHAN MANH
Ss
e Phân mảnh theo hàng ngang của một quan hệ R là
tách quan hệ R theo cách mà mỗi n_bộ của:R cĩ
mặt trong 1 hay nhiều quan hệ thành phân
(Cụ thé la chia quan hệ R thành các tập cĩn
R1,R2, ,Rn Mỗi tập con chứa một sốn_ bộ của R Cĩ thê khơi phục R bằng phép hợp các Ri Ví dụ sự
phân chia số liệu các khách hàng giao dịch của một
Trang 10CAC LOAI PHAN MANH
Ss
e Phân mảnh theo chiều dọc của quan hệ R là tách lược đồ của quan hệ R thành các lược đồ cớ số cột nhỏ hơn ( Phân mảnh theo chiêu dọc thực ra là
thực hiện phép chiếu quan hệ R lên tập các thuộc
tính của các quan hé Ri
— Ri =I (thuéc tinh Ai) (R)
Trang 12# NM Loc Sai E 5| Joe | Sa) 10 @MMMMMMMM:::©, 25 8 | Tom |Sa|15 AE
# NM Loc Sal #\NM Loc Sal
Trang 18THE HIEN CAC TIEU CHUAN CUA PHAN MANH NGANG
Co
R => Fe=fF,, Fp, ., Fy}
e Tinh day dt (Completeness)
- Mọi bộ teR, 3 F,eF ma teF,
e Tinh tach biet (Disjointness)
~ VteFi, “4S Fj mateFj ij
Trang 19Làm thể nào kiểm tra tinh day du và tính tach biét?
AB
Trang 20Lam thé nao dé co duoc tinh day
đủ và tinh tách biệt?
CO 7 77 |
(2) “Tự động” sinh các mảnh
với những đặc tính :
ePhân mảnh ngang được định nghĩa bởi các lệnh (với) ving® Select
Trang 21Vi du:
CO j
e Phát biểu các truy vẫn dựa vào các vị từ “đơn giản”
A<10, A>5, Loc = SA, Loc = SB
Trang 225<A<10 6i so’ cap (I) Cac vi PEST : em? 9 ˆ
(4) A<10 A A>5 A Loc=SaA A ~Ttroe=©cs>——
(4) A<10 A A>5 /A “t+ceoe=e>+>^A LoC7=GSnp
RAS hr — “TT ằằằẶ==-“>——
Trang 23Các vi từ hội sơ cấp (HH)
CO 7 77 |
Lee) t — Ầ ø — Sẻ
Trang 24Các mảnh cuỗi cùng: F2 B<A<1l0A lo@SA — F3; 5<A<10 A Loc=Ss Fe A<5 A Loc=Sa F7, A<5 A Loc=SsB
Fio A>10 A LOC=SA
Trang 25Chu ý: Loại bỏ các phân mảnh phụ
thuộc vào ngữ nghĩa:
Ví dụ : nêu LOC cĩ thể z Sa, z Sa,
chúng ta cân thêm các phân mảnh
F4 5<A<10 A Loc#Saakoc 4SB Fs A<5 A Loc# San Loc # SB
Trang 26Tại sao sử dụng thuật tốn vị từ hoi so cap (minterm)?
6950
e Phải chứng minh tập các phân mảnh là: - Đây đủ
Trang 27Tổng kết
AB e Cho các vị từ đơn giản Pr= { p1, p2, pn}
Trang 28Những vi từ đơn giản nào nên
Trang 29Tro lai vi du:
Trang 30Ba chon lua:
CT (1)Pr={} Fi ={E}
(2) Pr = {LOC=Sa, LOC=Sb}
Fo={ © loc=saE, O loc=Sb E }
(3) Pr = {LOC=Sa, LOC=Sb; Sal<10}
F3={ Oloc=Sa « sal<10 E, Oloc=Sa a sal>10 E,
Trang 37Định nghĩa khơng hình thức
4953
Trang 38Trở lại ví dụ:
4
Day du ?
(1) Pr={ } No
(2) Pr = {LOC=Sa, LOC=Sb} Yes
(3) Pr = {LOC=Sa, LOC=Sb, Sal<10} Yes
Pr(2) là tập con của Pr(3),
Do đĩ Pr(3) khơng là tối thiểu
Trang 39Phân mảnh ngang suy dẫn ra (chủ) E(ENO, NAME, SAL, LOC) J(ENO, DESCRIPTION., ) E => F={ E:1, E2} by LOC Truy van: Quan hé mét - nhiéu (thành viên)
Cho biết tên nhân viên,
Trang 41E1 J1 †# NM Loc Sal E2 # NM Loc Sal 5 Joe Sa 10 | Sally Sb 25 8 Tom Sa 15 12 | Fred Sb 15 ee ii (at Sa) (at Sb) # Des # Des
5_ | workon 347 hw J2| 7 goto moon
5 build table 12 rest
Trang 42Phân mảnh ngang suy dẫn
.- ữGGŨỤĨ.//J
R,F ={Fi, Fa, Fn} ree the la
Ụ cơ sở hay suy dẫn
S, D = {Di, Da, .Dn} ở đây Dr=Si< Fi
Qui ước : R là chủ
Trang 43- Kiem tra tính đây đủ và tách biệt
của phân mảnh suy dân 6 Vi du: Phat biéu J la: # Des 33 build chair « Nhưng #= 33 khơng thuộc E1 và cũng khơng thuộc E2!
Những bộ J sẽ khơng thuộc J1 cũng như khơng thuộc 12
Phân mảnh khơng đày đủ
Trang 50Tinh chat: R[IT]=> Ri[TI
(1)Tính đầy đủ
U Ti=T
Trang 54(3) Tính kiến thiết:Kết nỗi khơng mất thơng tin
TmHăaa ẫẽa.a
<4 Ri=E
all i
® Một cách đề kết nối khơng mất thơng tin: Mọi phân mảnh đều chứa khĩa,
Key c I¡ for all i
Trang 56Ái Lực thuộc tính (Attribute affinity)
Co
e Xét lược đơ quan hệ R(A¿, As, ,A,.)
e Các ứng dụng Q(q:, q›, ,q )
e Use (qi, Aj) = 1, nếu Aj được gi tham chiêu
0, trong trường hợp ngược lại
Trang 57Ái Lực thuộc tính (Attribute affinity)
e Vi du * Ma trận mẫu về giá trị sử dụng thuộc tinh
Trang 58Ái Lực thuộc tính (Attribute affinity) acc
e Giá trị sử dụng thuộc tính khơng đủ cơ sở
cho việc phân mảnh: chúng khơng biếu thị
độ lớn của tần số ứng dụng
e SỐ đo lực hút (affinity) của:2 thuộc tính Ai, Aj ký hiệu aff(Ai, Aj) biểu thị chocầu nối (bond)
giữa 2 thuộc tính, dựa vào sự truy xuất của
Trang 59Ái Lực thuộc tính (Attribute affinity)
e Tamer Ơzsu nêu cơng thức đề đo ái lực của 2 thuộc tính Ai, AI:
e Gọi k là sỗ mảnh của quan hệ R R =R;R;Ra R,
e Q = {q1,q2, ,qm)} : tập các ứng dụng trên E e OQ(A,B) là tập các ứng dụng q của Q mà:
Trang 60Ái Lực thuộc tính (Attribute affinity) e Ai luc gitra 2 thuéc tinh Ai va Aj của quan hệ R và tập.ứng
dung Q được định nghĩa:
e Aff(Ai, Aj) = > > ref(q)acc,(q)
qeQ(Ai, Aj) le R,
ref(q) : số truy xuất đến các thuộc tính (Ai, Aj) cho mỗi ứng
dung q tai vi tri R,
acc(q) : tần số truy xuất ứng dụng q đến cac thuuoc tinh Ai,Aj
Trang 61Ái Lực thuộc tính (Attribute affinity) acc
e Ví dụ : Xét lại ví dụ *, giả sử refi(q) =1 cho tật cả q
và S¡,, và sơ mảnh là 3 Tân sơ ứng dụng cho mọi
cặp thuộc tính là:
Trang 64Thuật tốn năng lượng nỗi BEA (Bond Energy Algorithm) e Tac gia : Hofer & Severance, 1975 va Navathe et al, 1984 e Y nghĩa: - Xác định các nhĩm thuộc tính - Độ phức tạp O(n2)
- Khơng làm thay đổi kết quả tụ nhĩm
Trang 65Thuật tốn năng lượng nỗi BEA (Bond
Energy Algorithm) CO
e AM=) } aff(A, A) [aff(A, A, +) + aff(A,, i=1 J=†
Với aff(Ao, A)= aff(A,, Ao) = aff(A,,.4; A) =
aff(A,, A,.,) =0, cho moi i, j
Trang 66Thuật tốn năng lượng nỗi BEA (Bond
Energy Algorithm)
e Hàm cực đại hĩa chỉ xét những lân cận gân nhất, vì thế các giá trị lớn được nhĩm lại với nhau, các
giá trị nhỏ được nhĩm lại với nhau Ma trận ái lực
thuộc tính AA co tinh đối xứng nên SỐ đo ái lực cĩ thé rut gon:
e AM = aff(A,, A,) [aff(A,, A, ,) + aff(A,,A 4)]
Trang 67Thuật tốn năng lượng nỗi BEA (Bond
Energy Algorithm)
e Quá trình sinh ma trận ái lực gồm 3 bước:
e 1 Khởi gán: Đặt và cơ định 1 trong các cột của AA
vào trong CA Cột 1 được chọn
e 2 Thực hiện lặp: Lấây lần lượt 1.trong n-i-cột cịn lại
(¡ là số cột đã được đặt vào CA) và thử đặt vào i+1 vị
tri con lai trong ma tran CA Chon dat sao cho AM là
lớn nhất Lặp đến hết các cột
e Sắp thứ tự hàng: Khi thứ tự cột đã xác định, các
hàng cũng cần đặt lại để các vị trí tương đối của
Trang 68Thuật tốn năng lượng nỗi BEA (Bond
Energy Algorithm)
e Mot vi du tinh toan cho thuat toan BEA
Trang 72Allocation
CO 7 7 7 |
Example: E(#,NM,LOC,SAL) => F1 = Oloc=sa E ; F2 = Oloc=sb E
Qa: select where loc=Sa
Trang 73Các vẫn đề thảo luận
CO
e Cac truy van bắt đầu từ đâu e Chi phí truyền thơng là gì?
kích thước kết quả,quan hệ, :
Trang 74Các vẫn đề khác
Co C77777 7 7 7 |
e Chiến lược xử lý truy vân?
- Các kết nối thực hiện như thế nào?
Trang 75Vì sao tiên hành lặp các phân
mãn so
e Chi phí của việc cập nhật các bản sao?
Trang 77Mơ hình đơn giản Ce | Phân mảnh đơn F Các Site S., S„ Các bién X,, ., X,, Xj = |0 if F khơng lưu trử tai Sj 1 if F luu tr Sj Tổng chỉ phí = Chi phí đọc+ Chi phí ghi+ Chi phí lưu trữ
Xác định các giá tri cho Xj, 1 <j <m,
Trang 78Chi phí đọc 6 mM Chi phi đọc= 2 [tix MIN Ci] I= J
i: site cd yéu cau
ti: số lượng tin doc tai Si
Cị: - Chỉ phí lẫy tin truy xuất phân mảnh F tại
Trang 79Chi phí ghi = DE 77 ` S Xj ui Ciij i: site cé yéu cau j: SIte được cập nhật
Xi: 10 nếu F khơng lưu trữ tại Š¡ 1 nêu F lưu trữ tại-Sị
u¡: lượng tin ghi tại S¡
Trang 80Chi phí lưu trữ: m » Xi di i=1
Xi: (0 nếu F khơng lưu trữ tai Sj 1nếu F lưu trữ tại-S¡