Tối ưu truy vấn toàn cục

Một phần của tài liệu Nghiên cứu tối ưu truy vấn trong cơ sở dữ liệu phân tán (Trang 48)

đại số trên các mảnh. Mục đích của tối ưu truy vấn là tìm một chiến lược thực hiện cho truy vấn gần với tối ưu.

Tối ưu truy vấn bao gồm việc tìm thứ tự “tốt nhất” của các phép toán trong truy vấn mảnh, bao gồm các phép toán truyền thông, tối thiểu hàm chi phí. Hàm chi phí, thường được định nghĩa theo đơn vị thời gian, liên quan đến các tài nguyên tính toán như không gian đĩa, các thao tác vào/ra đĩa, không gian bộ nhớ đệm, chi phí CPU, chi phí truyền thông. Để đơn giản hóa, tối ưu truy vấn toàn cục thưởng bỏ qua chi phí xử lý cục bộ vì chi phí truyền thông là nhân tố có ý nghĩa nhất. Điều này là có hiệu quả đối với các mạng diện rộng, ở đó băng thông có hạn làm cho sự truyền thông tốn kém hơn nhiều so với xử lý cục bộ. Việc xác định chi phí thực hiện trước khi thực hiện truy vấn (tức là tối ưu tĩnh) là dựa trên các thống kê mảnh và các công thức để ước lượng lực lượng của các kết quả trung gian của các phép toán quan hệ. Vì vậy các quyết định tối ưu phụ thuộc vào các thống kê sẵn có trên các mảnh.

Một khía cạnh quan trọng của tối ưu truy vấn là thứ tự nối, bởi vì việc giao hoán của các phép nối bên trong truy vấn có thể dẫn đến việc cải thiện chi phí truy vấn. Một kỹ thuật cơ bản để tối ưu một dãy các phép nối phân tán là thông qua phép toán nửa nối. Giá trị chính của nửa nối trong một hệ phân tán là làm giảm kích thước của các toán hạng nối và sau đó là chi phí truyền thông. Tuy nhiên, nhiều kỹ thuật mới xem xét chi phí xử lý cục bộ (địa phương) cũng như chi phí truyền thông không sử dụng các nửa nối bởi vì chúng có thể làm tăng chi phí xử lý cục bộ. Dữ liệu ra của tầng tối ưu truy vấn là một truy vấn đại số tối ưu với các phép toán truyền thông bao hàm trên các mảnh[13, 15].

Một phần của tài liệu Nghiên cứu tối ưu truy vấn trong cơ sở dữ liệu phân tán (Trang 48)

Tải bản đầy đủ (PDF)

(71 trang)