5. Các kết quả dự kiến đạt đƣợc
3.3.2. Các mục tiêu của xử lý câu truy vấn
Mục tiêu của xử lý câu truy vấn trong môi trường phân tán là biến đổi một câu truy vấn bậc cao trên một cơ sở dữ liệu phân tán thành một chiến lược thực thi hiệu quả được biểu diễn trong ngôn ngữ bậc thấp trên các cơ sở dữ liệu địa phương. Một khía cạnh quan trọng của xử lý câu truy vấn là tối ưu hoá câu truy vấn. Vì nhiều chiến lược thực thi là biến đổi đúng đắn cùng một câu truy vấn bậc cao, nên chỉ giữ lại một chiến lược tối ưu theo một nghĩa nào đó (ví dụ sự tiêu thụ tài nguyên).
Độ đo của sự tiêu thụ tài nguyên là tổng chi phí xử lý câu truy vấn (total cost) bằng tổng thời gian xử lý các phép toán của câu truy vấn tại các trạm khác nhau và chi phí truyền thông giữa các trạm. Thời gian trả lời câu truy vấn (response time) là thời gian thực hiện câu truy vấn. Vì các phép toán có thể được thực hiện song song tại các trạm khác nhau, nên thời gian trả lời của một câu truy vấn có thể ít hơn đáng kể tổng chi phí của nó.
Trong một hệ cơ sở dữ liệu phân tán, tổng chi phí được tối thiểu bao gồm CPU, I/O, các chi phí truyền thông. Chi phí CPU được tính khi thực hiện các phép toán trên dữ liệu trong bộ nhớ chính. Chi phí I/O là thời gian cần thiết để trao đổi dữ liệu giữa các trạm tham gia trong sự thực hiện của câu truy vấn (gồm thời gian xử lý thông báo và truyền dữ liệu trên mạng).
Trong hệ quản trị CSDL tập trung quan tâm đến chi phí I/O và CPU, còn trong CSDL phân tán thì chi phí truyền thông được coi trọng nhất. Chi phí truyền thông đắt hơn chi phí xử lý địa phương, nên mục đích của tối ưu hoá truy vấn phân tán nói chung là tối thiểu chi phí truyền thông nhờ các xử lý địa phương.