Cơ sở dữ liệu phân tán
Đề tài:Phân mảnh dọc và hỗn hợp
Trường Đại học Công nghiệp Thực phẩm
Trang 4Khái quát về phân mảnh dữ liệu
Phân mảnh (fragmentation) dữ liệu là việc chia các quan hệ trong một cơ sở dữ liệu (CSDL) thành các quan hệ nhỏ hơn hay còn gọi là các mảnh (fragment)
3/23/20224
Trang 5Khái quát về phân mảnh dữ liệu
Vị trí của phân mảnh trong thiết kế các hệ cơ sở dữ liệu phân tán
53/23/2022
Trang 6Khái quát về phân mảnh dữ liệu
Các kiểu phân mảnh dữ liệu:• Phân mảnh ngang
• Phân mảnh dọc
• Phân mảnh kiểu kết hợp
Các thông tin yêu cầu cho phân mảnh:
• Thông tin về cơ sở dữ liệu gồm tập các quan hệ, tập các phụ thuộc.
• Thông tin về các ứng dụng gồm các câu truy vấn trên các quan hệ.
Trang 7Khái quát về phân mảnh
dữ liệu
Lý do phân mảnh dữ liệu:
• Xuất phát từ đặc điểm của CSDL tập trung, cách thức truy cập vào các CSDL tập trung Đặc điểm và yêu cầu của ứng dụng truy vấn.• Tăng mức độ hoạt động đồng thời và tăng
lưu lượng hoạt động của hệ thống.Một số hạn chế:
• Tăng chi phí truy xuất dữ liệu đến các mảnh và tăng chi phí kết nối các mảnh.
• Việc kiểm soát ngữ nghĩa, bảo đảm tính độc lập dữ liệu, toàn vẹn dữ liệu sẽ gặp khó khăn hơn.
Trang 8Phân mảnh dọc
Trang 10Có hai kiểu phân mảnh dọc :Phân mảnh dọc dư thừa và
phân mảnh dọc không dư thừa.
Trang 11Ví dụ 2 : Xét quan hệ toàn cục nhân viên (EMP) mô tả mã nhân viên (MANV), tên nhân viên (TENNV), lương (LUONG), thuế thu nhập (THUE), nhà quản lý (NQL) và phòng ban họ làm việc (PHONGBAN) như sau :
EMP(MANV, TENNV, LUONG, THUE, NQL, PHONGBAN)
Quan hệ toàn cục này được phân mảnh dọc dư thừa (thuộc tính TENNV ) như sau :EMP1 = Π MANV, TENNV, NQL, PHONGBAN (EMP)
EMP2 = Π MANV, TENNV ,LUONG, THUE (EMP)
Trang 12Phân mảnh dọc không dư thừa redundant fragmentation):
(non-Phân mảnh dọc không dư thừa là các phân mảnh dọc không chứa thuộc tính chung không khóa nào cả.
Trang 13Ví dụ 3 : Quan hệ toàn cục :
EMP(MANV, TENNV, LUONG, THUE, NQL, PHONGBAN)
Quan hệ toàn cục này được phân mảnh dọc không dư thừa (thuộc tính ) như sau :EMP1 = Π MANV, TENNV, NQL, PHONGBAN (EMP)
EMP2 = Π MANV, LUONG, THUE (EMP)
Phân mảnh này phản ánh lương và thuế của các nhân viên được quan lý riêng Việc táithiết lại quan hệ EMP có thể nhận được từ :
EMP = EMP1 JNN EMP2 (với JNN là phép kết nối tự nhiên hai quan hệ).
Vì MANV là khóa của quan hệ EMP Nói chung, việc chứa khóa của quan hệ toàncục vào mỗi mảnh là cách tốt nhất để bảo đảm cho tính tái thiết.
Từ đó chúng ta thấy sự phân mảnh cũng thỏa tính đầy đủ và tính tách biệt.
Trang 14• Tính đầy đủ:bất kì thuộc tính nào trong quan hệ R đều có thể tìm thấy trong mỗi mảnh con.
Trang 15Phân mảnh dọc• Tính tách biệt:
Trang 16Thông tin cần thiết của phân mảnh dọc
• Ma trận giá trị sử dụng thuộc tính:
Xét: Q={q1,q2, ,qq} :tập các câu truy vấnR(A1,A2,…,An):quan hệ toàn cục
:Ma trận thuộc tính sử dụng.Với i=1,…,q và j= 1,…,n
A use q A
Trang 17Thông tin cần thiết của phân mảnh dọc
Ví dụ 4: Xét 4 câu truy vấn sau đối với quan hệ BRANCH
q1: Tìm vốn của chi nhánh theo mã chi nhánh
SELECT VON
FROM BRANCHWHERE MACN=Value
q2: Tìm tên chi nhánh và vốn của tất cả các chi nhánh
SELECT TENCN, VONFROM BRANCH
q3: Tìm tên chi nhánh theo tên địa điểm
SELECT TENCNFROM BRANCH
WHERE DDIEM=Value
Trang 18Thông tin cần thiết của phân mảnh dọc
1 0 1 00 1 1 00 1 0 10 0 1 1
Thông tin cần thiết của phân mảnh dọc
Ma trận lực hút :Với:
Trang 20Thông tin cần thiết của phân mảnh dọc
Trang 21Thông tin cần thiết của phân mảnh dọc
Ta có được ma trận lực hút thuộc tính như sau:
35 0 35 00 75 5 7035 5 42 2
0 70 2 72
AAAA
Trang 22Phân mảnh hỗn hợp
Trong thực tế, hầu hết các trường hợp phân mảnh ngang hay phân mảnh dọc đơn giản của CSDL không thoả mãn yêu cầu người sử dụng Thường CSDL được phân mảnh dọc sau đó phân mảnh ngang, tạo ra sự phân chia theo cấu trúc cây (hình dưới) Chiến lược phân mảnh này gọi là phân đoạn lai, hay phân mảnh trộn, hay phân mảnh lồng.
R11R12R21 R22 R23Phân đoạn hỗn hợp
Trang 23Trong ví dụ (hình trên), nó được phân hoạch
thành 2 mảnh dọc Như vậy, kết quả phân hoạch quan hệ PROJ là một tập mảnh ngang, trong đó mỗi một mảnh lại được tiếp tục phân chia thành 2 mảnh dọc.
R11R12 R21 R22 R23Tái xây dựng phân đoạn hỗn hợp
Trang 27Tính đúng đắn của phân mảnh hỗn hợp được đảm bảo, vì chiến lược phân mảnh này dựa theo phân mảnh ngang và phân mảnh dọc, đảm bảo tính đúng đắn như đã trình bày Để khôi phục quan hệ toàn cục trong trường hợp phân mảnh hỗn hợp, có thể bắt đầu từ các node lá của cây phân hoạch và dịch chuyển lên bằng cách thực hiện các phép kết nối và phép hợp Phân mảnh hỗn hợp đầy đủ nếu các mảnh lá và các mảnh trung gian là đầy đủ Tương tự, có thể kiểm tra tính tách biệt của chiến lược phân mảnh hỗn hợp Tính tách biệt được đảm bảo khi các mảnh lá và mảnh trung gian cũng tách biệt.
Trang 29Bài thuyết trình đến đây là kết thúcCảm ơn các bạn đã lắng nghe.