Cỏc thống kờ dữ liệu

Một phần của tài liệu CHƯƠNG IV - XỬ LÝ TRUY VẤN TRONG CSDL PHÂN TÁN (Trang 63 - 66)

2. Cụng thức chung cho sự xỏc định tổng chi phớ: Tổng chi phí: tổng của tất cả các chi phí C CPU, CI/O CMSG

4.4.2Cỏc thống kờ dữ liệu

•Yếu tố chớnh ảnh hưởng đến hiệu suất của một chiến lược thực thi là kớch thước của cỏc quan hệ trung gian sinh ra trong quỏ trỡnh thực hiện.

•Khi phộp toỏn tiếp theo đặt tại một trạm khỏc, quan hệ trung gian phải được truyền trờn mạng.

•Do đú để tối thiểu hoỏ khối lượng dữ liệu truyền đi, điều quan tõm đầu tiờn là đỏnh giỏ kớch thước kết quả trung gian của cỏc phộp toỏn đại số quan hệ.

•Đỏnh giỏ này dựa trờn cỏc thụng tin thống kờ về cỏc quan hệ cơ sở và cỏc cụng thức ước tớnh lực lượng của kết quả cỏc phộp toỏn quan hệ.

64

Mục đớch của thống kờ dữ liệu:

•Xỏc định kớch thước của cỏc quan hệ trung gian sinh ra trong quỏ trỡnh thực hiện cõu truy vấn

•Xỏc định chi phớ truyền thụng cho cỏc đại lượng trung gian

Một số ký hiệu

Cho quan hệ R xỏc định trờn tập thuộc tớnh A={A1, ..., An}. R được phõn mảnh thành R1, R2, ..., Rr.

length(Ai): độ dài (byte) của thuộc tớnh Ai ,Ai∈R,

card(πAi(Rj): lực lượng của phộp chiếu của mảnh Rj lờn thuộc tớnh Ai (số giỏ trị phõn biệt trờn thuộc tớnh Ai) .

max(Ai): giỏ trị cực đại của thuộc tớnh Ai trong Dom(Ai)

min(Ai): giỏ trị cực tiểu của thuộc tớnh Ai trong Dom(Ai)

card(dom(Ai)): lực lượng của thuộc tớnh Ai

card(Ri)): số cỏc bộ trong mảnh Ri

65

4.4 Tối ưu hoỏ truy vấn trong CSDL phõn tỏn

Ngoài ra, dữ liệu thống kờ cũng bao gồm hệ số chọn của phộp nối (SFJ) đối với một số cặp đại số quan hệ, hệ số SFJ

của quan hệ R và S là một số thực giữa 0 và 1, được xỏc định bởi:

SFJ = card(R S)

card(R)*card(S)

•Hệ số SFJ nhỏ thỡ phộp nối cú tớnh chọn tốt, ngược lại cú tớnh chọn tồi.

•Cỏc thống kờ này cú lợi để đỏnh giỏ kớch thước của quan hệ trung gian.

•Kớch thước một quan hệ trung gian R được xỏc định bởi

size(R) = card(R)*length(R). Trong đú,

+ length(R) là độ dài (số byte) của mỗi bộ trong R, được tớnh theo độ dài cỏc thuộc tớnh của nú,

+ card(R) là số cỏc bộ của R được tớnh theo cụng thức ở phần tiếp theo.

66

4.4 Tối ưu hoỏ truy vấn trong CSDL phõn tỏn

(adsbygoogle = window.adsbygoogle || []).push({});

Một phần của tài liệu CHƯƠNG IV - XỬ LÝ TRUY VẤN TRONG CSDL PHÂN TÁN (Trang 63 - 66)