.23 Truy vấn mẫu và số liệu thống kờ

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Nghiên cứu một số khía cạnh lý thuyết trong mô hình CSDL quan hệ Luận văn ThS. Công nghệ thông tin 1 01 10 (Trang 106 - 109)

- Giai đoạn chọn trạm thực hiện: Ta chọn trạm cú chi phớ nhỏ nhất, tức là trạm chứa nhiều dữ liệu nhất để thực hiện. Cụ thể, sau khi cặp nhật số liệu thống kờ lượng dữ liệu được lưu tại cỏc trạm như sau:

Trạm 1: size(R1) =560, Trạm 2: size(R2)=1152, Trạm 3: size(R3)=4200 Như vậy trạm 3 sẽ được chọn là trạm thực hiện.

- Giai đoạn tối ưu hoỏ sau: khụng loại bỏ được nửa kết nối nào nữa vỡ tất cả cỏc

R1 R2 R3

R1.A = R2.A R2.B = R3.B

Chiến lược được chọn như sau: + Gửi R2 R1 R3 đến trạm 3 + Gửi R1 R2 đến trạm 3

+ Tớnh toỏn kết quả cuối cựng tại trạm 3

Cỏc thuật toỏn AHY (Apers-Hevner-Yao)

Thuật toỏn AHY [Apers et al., 1983] sử dụng cỏc phộp nửa kết nối để tối thiểu tổng chi phớ của cõu truy vấn hoặc thời gian đỏp ứng. Phương phỏp này dựa trờn cỏc thuật toỏn tối ưu chỉ cú thể ỏp dụng cho cỏc cõu truy vấn đơn. Ở đõy một cõu truy vấn đơn là một truy vấn mà sau khi định vị dữ liệu mỗi quan hệ chỉ chứa một thuộc tớnh kết nối chung.

Một truy vấn tổng quỏt, mỗi quan hệ chứa nhiều thuộc tớnh kết nối sẽ được phõn tớch thành cỏc cõu truy vấn đơn, để cú thể ỏp dụng bởi một trong cỏc thuật toỏn tối ưu của AHY. Hàm mục tiờu của thuật toỏn tối ưu cõu truy vấn tổng quỏt là tối thiểu chi phớ truyền, bỏ qua chi phớ xử lý cục bộ. Với đầu vào là một đồ thị truy vấn và số liệu thống kờ của cỏc quan hệ.

Thuật toỏn này đầu tiờn xử lý truy vấn bằng cỏch ỏp dụng cỏc phộp toỏn cục bộ, sau đú tỏch cõu truy vấn thành cỏc cõu truy vấn đơn, tiếp theo dựng cỏc phộp nửa kết nối để thực hiện cỏc chiến lược tối ưu, cuối cựng tớch hợp cỏc chiến lược riờng rẽ thành một chiến lược thực thi duy nhất.

Như vậy, tất cả cỏc quan hệ tham gia truy vấn đầu tiờn được rỳt gọn bởi cỏc phộp nửa kết nối, sau đú được gửi tới một trạm tổng hợp/kết quả duy nhất, tại đú sẽ tớnh kết quả của cõu truy vấn. Để đơn giản, thuật toỏn giả sử rằng tất cả cỏc quan hệ của cõu truy vấn được lưu trờn cỏc trạm khỏc nhau. Tuy nhiờn thuật toỏn cú thể được mở rộng cho trường hợp cú nhiều hơn một quan hệ trờn một trạm.

Trong phần này sẽ trỡnh bày hai thuật toỏn dựng cho cõu truy vấn đơn là: SERIAL (tối thiểu tổng chi phớ) và PARALLEL (tối thiểu thời gian đỏp ứng). Tiếp theo là thuật toỏn tổng quỏt GENERAL sử dụng cả hai thuật toỏn trờn cho cỏc cõu truy vấn tổng quỏt.

Thuật toỏn này cố gắng thực hiện chuyển cỏc quan hệ nhỏ tới trạm cú chứa quan hệ lớn hơn bằng cỏch sắp thứ tự truyền theo kớch thước quan hệ tăng dần. Giả sử rằng:

size(R1)  size(R2)  ...  size(Rn) với Ri được lưu trữ tại trạm i

Thuật toỏn xột hai lịch trỡnh truyền khỏc nhau. Ký hiệu Ti là kết quả tạm thời của Ri Ri-1, nếu trạm tổng hợp/kết quả chứa Rr :

Lịch trỡnh 1: R1  trạm 2 T2 = (R2 R1)  trạm 3 ... Tr-1 = (Rr-1 Tr-2)  trạm r Tr = (Rr Tr-1)  trạm (r +1) ... (Rn Tn-1)  trạm r (r là trạm chứa kết quả) Lịch trỡnh 2: R1  trạm 2 T2 = (R2 R1)  trạm 3 ... Tr-1 = (Rr-1 Tr-2)  trạm r Tr+1 = (Rr+1 Tr-1)  trạm (r +2) ... Tn = (Rr Tn-1)  trạm r (r là trạm chứa kết quả) (Rn Tn)

Thuật toỏn SERIAL

INPUT: SQG đồ thị cõu truy vấn đơn OUTPUT: Lịch trỡnh thực hiện

Begin

Thứ tự cỏc quan hệ trong SQG là size(R1)  size(R2)  ...  size(Rn) If khụng cú Ri tại trạm kết quả then

ES  (R1 R2  ...  Rn  trạm kết quả)

Else begin

ES1 (R1 R2 ...  Ri ...  Rn  Ri)

ES  ES2 Else ES  ES1 End-if End-if End.

Vớ dụ: Xột đồ thị cõu truy vấn đơn và số liệu thống kờ như hỡnh 2.24

Thuộc tớnh SFSJ Size( attribute )

R1.A 0.3 100

R2.A 1.0 300

R3.A 0.7 200

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Nghiên cứu một số khía cạnh lý thuyết trong mô hình CSDL quan hệ Luận văn ThS. Công nghệ thông tin 1 01 10 (Trang 106 - 109)

Tải bản đầy đủ (PDF)

(131 trang)