Thứ tự kết nối trên các truy vấn đoạn

3. Tối ưu hóa các truy vấn phân tán

3.2 Thứ tự kết nối trên các truy vấn đoạn

Thứ tự kết nối có vai trò quan trọng trong việc tối ưu hoá câu truy vấn tập trung. Thứ tự kết nối trong môi trường phân tán còn quan trọng hơn vì các phép kết nối giữa các đoạn có thể làm tăng chi phí truyền thông. Có hai cách tiếp cận cơ bản để sắp thứ tự các phép kết nối trong các câu truy vấn đoạn.

- Cố gắng tối ưu thứ tự của các phép kết nối một cách trực tiếp

- Thay các phép kết nối bởi kết hợp các phép bán kết nốiđể cực tiểu hóa các chi phí truyền thông

Thứ tự kết nối:

Một số thuật toán tối ưu hoá thứ tự của các phép kết nối một cách trực tiếp không sử dụng phép bán kết nối. Thuật toán INGRES phân tán và R* là đại diện cho lớp này. Một số các giả thiết:

- Câu truy vấn được định vị và biểu diễn trên các đoạn, ta không cần phân biệt giữa các đoạn của cùng một quan hệ và các đoạn của các quan hệ khác.

- Dùng thuật ngữ quan hệ để chỉ một đoạn lưu trữ tại một trạm cụ thể. - Bỏ qua chi phí xử lý địa phương.

- Chỉ xét các câu truy vấn kết nối mà các toán hạng quan hệ được lưu tại các trạm khác nhau.

- Bỏ qua chi phí truyền dữ liệu tại trạm kết quả.

Vấn đề truyền toán hạng trong phép kết nối đơn, hiển nhiên là gửi quan hệ nhỏ hơn tớitrạm của quan hệ lớn hơn, có hai khả năng như hình sau:

Trường hợp có hơn hai quan hệ kết nối, cũng như trường hợp một kết nối đơn, mục đích của thuật toán thứ tự kết nối là truyền các toán hạng nhỏ hơn. Vấn đề khó khăn ở đây là các phép kết nối có thể giảm hoặc tăng kích thước của các kết quả kết nối. Một giải pháp được sử dụng là đánh giá chi phí truyền thông của tất cả các chiến lược và chọn ra chiến lược tốt nhất. Tuy nhiên số các chiến lược tăng nhanh khi số các quan hệ tăng nên thường dùng phương pháp tìm kiếm gần đúng(heuristic) để loại trừ một số trườnghợp xấu.

4. Tối ưu hóa các truy vấn phân tán

Tối ưu hóa các truy vấn phân tán được thực hiện thống qua các giải thuật tối ưu hóa. Các giải thuật này có thể phân thành 4 hướng tiếp cận chính bao gồm: hướng tiếp cận sử dụng phép toán bán kết nối (semijoin), hướng tiếp cận tĩnh (static approach), hướng tiếp cận động (dynamic approach) và hướng tiếp cận kết hợp (hybrid approach).

Trong phần này, tác giả sẽ đi sâu trình bày 3 giải thuật chính đại diện cho ba hướng tiếp cận đầu tiên. Hướng tiếp cận cuối cùng là xuy hướng trong đó các giải thuật của ba hướng tiếp cận đầu tiên được sử dụng kết hợp nhằm mục tiêu tăng độ tối ưu và thường gắn với một thiết kế CSDLPT cụ thể.

Thứ tự kết nối trên các truy vấn đoạn

Rút gọn phân mảnh ngang nguyên thủy

Rút gọn phân mảnh dọc