Theo Nguyễn Văn Huân, Phạm Việt Bình [7], có hai phương pháp tối ưu hóa cơ bản được sử dụng trong các bộ xử lý vấn tin: Phương pháp biến đổi đại số và chiến lược ước lượng chi phí.
Phương pháp biến đổi đại số đơn giản hóa các câu vấn tin nhờ các phép biến đổi đại số nhằm hạ thấp chi phí trả lời câu vấn tin, độc lập với dữ liệu thực và cấu trúc vật lý của dữ liệu.
Nhiệm vụ chính của thể xử lý vấn tin quan hệ là biến đổi câu vấn tin cấp cao thành một câu vấn tin tương đương ở cấp thấp hơn được diễn đạt bằng đại số quan hệ. Câu vấn tin cấp thấp thực sự sẽ cài đặt chiến lược thực thi vấn tin. Việc biến đổi này phải đạt được cả tính đúng đắn lẫn tính hiệu quả. Một biến đổi được xem là đúng đắn nếu câu vấn tin cấp thấp có cùng ngữ nghĩa với câu vấn tin gốc, nghĩa là cả hai cùng cho ra một kết quả.
Một câu vấn tin có thể có nhiều cách biến đổi tương đương thành đại số quan hệ. Bởi vì mỗi chiến lược thực thi tương đương đều sử dụng tài nguyên máy tính rất khác
nhau, khó khăn chính là chọn ra được một chiến lược hạ thấp tối đa việc tiêu dùng tài nguyên.
Xét các quan hệ sau: Sinh viên (Mã SV, họ tên, …, mã lớp); Điểm (Mã SV, mã môn học, lần thi, điểm); Và một câu vấn tin đơn giản sau: “Cho biết họ tên của các sinh viên phải học lại các học phần”
Biểu thức vấn tin bằng phép tính quan hệ theo cú pháp của SQL là:
SELECT họ tên
FROM Sinh viên, Điểm
WHERE (Sinh viên.Mã SV=Điểm.Mã SV) AND (lần thi=3)
Hai biểu thức tương đương trong đại số quan hệ do biến đổi chính xác từ câu vấn tin trên là: họ tên(lần thi=3 Sinh viên.Mã SV=Điểm.Mã SV (Sinh viên x Điểm)) và họ tên(Sinhviên|><|MãSV(lần thi=3 (Điểm)))
Hiển nhiên là trong câu vấn tin thứ hai, tránh sử dụng tích Descartes, vì thế nên có chi phí thời gian và sử dụng tài nguyên ít hơn.
Trong trường hợp cơ sở dữ liệu tập trung, việc chuyển đổi câu truy vấn sang các phép đại số quan hệ được tiến hành một cách thuận lợi. Trong môi trường phân tán, các phép đại số quan hệ không đủ để mô tả các giải pháp thực hiện. Nó phải được cung cấp thêm các thao tác để chuyển đổi dữ liệu giữa các vị trí. Việc lựa chọn thứ tự các thao tác đại số quan hệ, bộ xử lý truy vấn cũng phải lựa chọn các vị trí tốt nhất để xử lý dữ liệu và đường truyền thông mà dữ liệu sẽ lưu chuyển. Việc này sẽ làm tăng số các giải pháp lựa chọn cần lựa chọn trong số đó một giải pháp thực hiện. Vì vậy việc xử lý truy vấn phân tán càng trở nên khó khăn hơn.