Tối ưu hóa truy vấn phân tán

Câu truy vấn thu được từ quá trình phân rã và cục bộ hóa dữ liệu có thể cho thực hiện bằng cách đưa thêm vào các yếu tố truyền tin (communication primitive) một cách có hệ thống. Việc hoán vị thứ tự các phép toán trong câu truy vấn có thểđưa ra nhiều chiến lược truy vấn. Việc tìm ra một cách sắp xếp tối ưu các phép toán cho một câu truy vấn là nhiệm vụ của bộ tối ưu hóa (optimizer). Chọn một chiến lược tối ưu là một bài toán NP-hard theo số lượng quan hệ [Ibaraki and Kameda, 1984]. Vì thế nhiệm vụ của bộ tối ưu hóa là tìm

trọng hơn là tránh được những chiến lược tồi.

Với đầu vào là câu truy vấn đã được phân rã, cục bộ hóa nhiệm vụ của bộ tối ưu hóa tìm ra được một chiến lược thực thi câu truy vấn (QEP) đã tối ưu, gồm các câu truy vấn đại số quan hệ được đặc tả theo các mảnh, và các phép toán truyền dữ liệu, hỗ trợ cho việc thực thi câu truy vấn qua các trạm.

Việc chọn lựa chiến lược tối ưu nói chung là việc tìm cách tiên đoán được chi phí thực thi và giảm thiểu hàm chi phí.

Nguyên liệu chính của bộ tối ưu hóa dùng để tính chi phí là các số liệu thống kê của các mảnh, các công thức đánh giá lực lượng của các quan hệ trung gian được tạo ra. Ở phần này chúng ta tập trung chủ yếu vào vấn đề sắp xếp thứ tự các phép toán nối vì lý do nó là bài toán đã hiểu rõ, và các câu truy vấn có chứa phép nối, chọn, chiếu được xem là loại truy vấn hay gặp. Chúng ta cũng xem xét, thảo luận xem phép nối nửa có tác dụng như thế nào trong việc xử lý các nối.

Thuật toán phân mảnh và nhân bản [7]

Thuật toán qui hoạch băm [7]