1. Cụng thức chung cho sự xỏc định thời gian trả lờ
4.2 Cỏc thống kờ dữ liệu
•Yếu tố chớnh ảnh hưởng đến hiệu suất của một chiến lược thực thi là kớch thước của cỏc quan hệ trung gian sinh ra trong quỏ trỡnh thực hiện.
•Khi phộp toỏn tiếp theo đặt tại một trạm khỏc, quan hệ trung gian phải được truyền trờn mạng.
•Do đú để tối thiểu hoỏ khối lượng dữ liệu truyền đi, điều quan tõm đầu tiờn là đỏnh giỏ kớch thước kết quả trung gian của cỏc phộp toỏn đại số quan hệ.
•Đỏnh giỏ này dựa trờn cỏc thụng tin thống kờ về cỏc quan hệ cơ sở và cỏc cụng thức ước tớnh lực lượng của kết quả cỏc phộp toỏn quan hệ.
4. TỐI ƯU HểA TRUY VẤN TRONG CSDL PHÂN TÁN
68
Mục đớch của thống kờ dữ liệu:
•Xỏc định kớch thước của cỏc quan hệ trung gian sinh ra trong quỏ trỡnh thực hiện cõu truy vấn
•Xỏc định chi phớ truyền thụng cho cỏc đại lượng trung gian
Một số ký hiệu
Cho quan hệ R xỏc định trờn tập thuộc tớnh A={A1, ..., An}. R được phõn mảnh thành R1, R2, ..., Rr.
•length(Ai): độ dài (byte) của thuộc tớnh Ai ,Ai∈A,
•card(πAi(Rj): lực lượng của phộp chiếu của mảnh Rj lờn thuộc tớnh Ai (số giỏ trị phõn biệt trờn thuộc tớnh Ai) .
•max(Ai): giỏ trị cực đại của thuộc tớnh Ai trong Dom(Ai)
•min(Ai): giỏ trị cực tiểu của thuộc tớnh Ai trong Dom(Ai)
•card(dom(Ai)): lực lượng của thuộc tớnh Ai
•card(Ri)): số cỏc bộ trong mảnh Ri
4. TỐI ƯU HểA TRUY VẤN TRONG CSDL PHÂN TÁN
69
4. TỐI ƯU HểA TRUY VẤN TRONG CSDL PHÂN TÁN
4. TỐI ƯU HểA TRUY VẤN TRONG CSDL PHÂN TÁN Ngoài ra, dữ liệu thống kờ cũng bao gồm hệ số chọn của
phộp nối (SFJ) đối với một số cặp đại số quan hệ, hệ số SFJ
của quan hệ R và S là một số thực giữa 0 và 1, được xỏc định bởi:
SFJ = card(R S) card(R)*card(S)
•Hệ số SFJ nhỏ thỡ phộp nối cú tớnh chọn tốt, ngược lại cú tớnh chọn tồi.
•Cỏc thống kờ này cú lợi để đỏnh giỏ kớch thước của quan hệ trung gian.
•Kớch thước một quan hệ trung gian R được xỏc định bởi
size(R) = card(R)*length(R). Trong đú,
+ length(R) là độ dài (số byte) của mỗi bộ trong R, được tớnh theo độ dài cỏc thuộc tớnh của nú,
+ card(R) là số cỏc bộ của R được tớnh theo cụng thức ở phần tiếp theo.
70
4. TỐI ƯU HểA TRUY VẤN TRONG CSDL PHÂN TÁN
4. TỐI ƯU HểA TRUY VẤN TRONG CSDL PHÂN TÁN