Tối ƣu hóa giai đoạn JOQR

Một phần của tài liệu mô hình tối ưu hóa truy vấn hai pha trong cơ sở dữ liệu và ứng dụng (Trang 40 - 41)

4. Những nội dung nghiên cứu chính

2.2.Tối ƣu hóa giai đoạn JOQR

Quá trình thực hiện tối ƣu câu truy vấn trong cơ sở dữ liệu song song bằng mô hình tối ƣu hóa truy vấn hai pha:

Pha đầu: Sắp xếp lại thứ tự các phép nối và biểu diễn lại câu truy vấn Pha thứ hai: Chuyển cây truy vấn tiền xử lý thành phƣơng án thi hành song song.

Pha đầu tiên, sẽ tập trung vào việc khai thác các tính chất vật lý của các toán hạng, nhƣ đã phân chia dữ liệu cho các nút dựa trên một thuộc tính của quan hệ vào; xác định các phƣơng pháp tốt nhất để tính toán các toản tử; xác định thứ tự các phép nối trong cây toán tử;...

Trong hầu hết các phƣơng pháp tìm kiếm lời giải tối ƣu cho câu truy vấn bằng cách tiếp cận hai pha thì ở pha đầu tiên thƣờng đƣợc áp dụng những kết quả trong xử lý tuần tự. Chúng ta sẽ giải quyết bài toán trong pha đầu tiên này bằng các mô hình và thuật toán có để ý đến khía cạnh song song. Do đó, thay vì tìm phƣơng án tốt nhất để thực hiện tuần tự, các thuật toán trình bày ở đây lại tìm kiếm phƣơng án để thi hành song song.

Trƣớc tiên, chúng ta bắt đầu bài toán cực tiểu hóa chi phí truyền thông bằng một mô hình đơn giản, trong đó chỉ quan tâm đến chi phí truyền thông phát sinh do việc phân mảnh ngang lại dữ liệu trên các bộ xử lý. Bằng cách

Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn

tiếp cận bài toán tô màu cho cây, trong đó mỗi màu tƣợng trƣng cho một phân mảnh ngang dữ liệu trên mỗi nút của cây, chúng ta sẽ xây dựng các thuật toán tô màu cây truy vấn nhằm xác định chiến lƣợc thực hiện tối ƣu cây truy vấn. Sau đó, chúng ta sẽ bàn đến hai mở rộng cho mô hình này.

- Thứ nhất, mở rộng các màu, với giả thiết rằng một màu đại diện cho một tính chất vật lý nào đó (chẳng hạn, dữ liệu đƣợc sắp xếp, các chỉ mục,...) đƣợc các chiến lƣợc sử dụng để tính toán các toán tử.

- Thứ hai, chọn lựa phƣơng pháp cài đặt cho mỗi phép toán. Bởi vì mỗi phép toán có thể có nhiều phƣơng pháp cài đặt khác nhau nên nếu sử dụng phƣơng pháp hợp lý sẽ thu đƣợc kết quả tốt hơn.

Một phần của tài liệu mô hình tối ưu hóa truy vấn hai pha trong cơ sở dữ liệu và ứng dụng (Trang 40 - 41)