Rút gọn phân mảnh dẫn xuất

Một phần của tài liệu Đề tài nghiên cứu một số vấn đề về truy vấn và tối ưu hóa truy vấn cơ sở dữ liệu phân tán trong hệ thống thông tin (Trang 42 - 43)

2. Định vị dữ liệu phân tán

2.3Rút gọn phân mảnh dẫn xuất

Phép kết nối thường xuyên xảy ra và có chi phí cao. Tối ưu hóa bằng phân mảnh ngang nguyên thủy khi các quan hệ nối được phân mảnh theo các thuộc tính nối. Trong trường hợp này nối của haiquan hệ được cài đặt như hợp của các nối từng phần. Tuy nhiên phương pháp này ngăn cản không cho một trong các quan hệ phân mảnh theo một phép chọn trên một thuộc tính khác. Phân mảnh ngang dẫn xuất phân phối hai quan hệ, cải thiện khả năng xử lý các điểm giao nhau giữa các phép chọn và phép kết nối. Nếu quan hệ R phân mảnh dẫn xuất theo quan hệ S, các mảnh của R và S có giá trị như nha ở thuộc tính kết nối sẽ nằm cùng vị trí. Quan hệ S có thể phân mảnh theo một vị từ được chọn.

Vì các bộ của quan hệ R được đặt tùy chọn theo các bộ của S, để cho đơn giản, giả sử chỉ xét phân mảnh dẫn xuất chỉ được sử dụng cho mối liên hệ 1-n, trong đó một bộ của S tương ứng với n bộ của R và 1 bộ của R chỉ khớp đúng với 1 bộ của S.

Ví dụ: Cho mối quan hệ 1-n EMP  ASG. Giả sử ASG được phân mảnh gián tiếp theo các qui tắc sau:

2 1 1 ASG = ASG2 ASG = ASG EMP EMP ENO ENO  

Trong đó, EMP1 =σTITLE="Programmer"(EMP)và EMP2=σTITLE≠"Programmer"(EMP)

Chương trình cục bộ hóa cho quan hệ phân mảnh ngang là: ASG=ASG1  ASG2

Các câu truy vấn trên các mảnh dẫn xuất có thể được rút gọn bằng cách phân phối các nối trên các phép hợp và áp dụng quy tắc 2. Vì quy tắc phân mảnh chỉ rõ các bộ sẽ khớp với nhau, một số nối sinh ra quan hệ rỗng, các vị từ phân mảnh có mâu thuẫn. Ví dụ như các vị từ của ASG1 và EMP2có mâu thuẫn vì vậyASG1EMP2 = 

Xét câu truy vấn sau: SELECT ENAME FROM EMP, ASG

WHERE EMP.ENO=ASG.ENO AND TITLE= “Mech, Eng”

Câu truy vấn gốc được thao tác trên các mảnh EMP1, EMP2, ASG1, ASG2 như hình a bên dưới). Thực hiện phép chọn trên các mảnh EMP1, EMP2, vì vị từ chọn mâu thuẫn trên mảnh EMP1 nên kết quả câu truy vấn rút gọn thu được như hình b. Nhằm xác định các vị từ kết nối mâu thuẫn, cần phải phân phối các nối trên các hợp. Kết quả là cây hình c. Cây con bên trái nối 2 mảnh ASG1 và EMP2 với các lượng từ hóa mâu thuẫn bởi các vị từ chọn TITLE= “Programmar” trong ASG1 và TITLE≠ “Programmar” trong EMP2. Vì vậy có thể loại bỏ cây bên trái và thu được kết quả câu

43

truy vấn rút gọn được chỉ ra trong hình d. Ví dụn này minh họa giá trị phân mảnh trong việc cải thiện hiệu năng của các câu truy vấn phân tán.

(a)Câu truy vấn gốc

(b)Câu truy vấn sau khi đẩy phép chọn xuống

(c)Truy vấn sau khi đẩy các phép hợp xuống

(d)Câu truy vấn đã rút gọn sau khi loại cây con bên trái Hình 16: Rút gọn phân mảnh dẫn xuất

Một phần của tài liệu Đề tài nghiên cứu một số vấn đề về truy vấn và tối ưu hóa truy vấn cơ sở dữ liệu phân tán trong hệ thống thông tin (Trang 42 - 43)