Trong suốt ánh xạ cục bộ (Local Mapping Transparency): Là một đặc tính quan trọng trong một hệ thống DDBMS không đồng nhất. Ứng dụng tham chiếu đến các đối tượng có các tên độc lập từ các hệ thống cục bộvàđược sử dụng như một hệ thống đồng nhất.
1.9 Vấn đề xử lý truy vấn trong CSDL phân tán
Nhiệm vụ chính của bộ xử lý truy vấn quan hệ là biến đổi câu truy vấn cấp cao thành một câu truy vấn tương đương ở cấp thấp hơn được diễn đạt bằng đại số quan hệ. Câu truy vấn cấp thấp sẽ thực sự cài đặt để thực thi các chiến lược truy vấn. Việc biến đổi này phải đạt được cả tính đúng đắn lẫn tính hiệu quả. Một biến đổi được xem là đúng đắn nếu câu truy vấn cấp thấp có cùng ngữ nghĩa với câu truy vấn gốc, nghĩa là cả hai cùng cho ra một kết quả. Một câu truy vấn có thể có nhiều cách biến đổi tương đương thành đại số quan hệ. Bởi vì mỗi chiến lược thực thi tương đương đều sử dụng tài nguyên máy tính rất khác nhau, khó khăn chính là chọn ra được một chiến lược hạ thấp tối đa việc tiêu dùng tài nguyên [10].
Ví dụ 1.8. Xét hai quan hệ trên CSDL Banking:
TAIKHOAN(SoTaiKhoan, TenChiNhanh, SoDu) NGUOIGUI(TenNguoiGui, SoTaiKhoan)
và câu truy vấn đơn giản: “Tìm tên của những người gửi có tài khoản ở chi
nhánh là Hillside”.
Câu truy vấn SQL tương ứng sẽ là: SELECT TenNguoiGui DDBMS TAIKHOAN 1 TAIKHOAN2 TAIKHOAN2 Trạm 1 Trạm 2 Trạm 3
FROM NGUOIGUI G, TAIKHOAN T
WHERE G.SoTaiKhoan = T. SoTaiKhoan AND T.TenChiNhanh = 'Hillside' Biếu thức đại số quan hệ tương đương như sau:
Π ℎ ℎ ℎ ′ ′Λ . ℎ . ℎ (NGUOIGUI × TAIK OAN ) (1) và Π (NGUOIGUI ⊳⊲ ℎ ( ℎ ℎ ℎ ′ ′( ))) (2)
Rõ ràng biểu thức thứ hai tránh được một phép tích Đề các giữa NGUOIGUI và TAIKHOAN, như vậy sẽ tốn ít tài nguyên hơn so với việc lựa chọn biểu thức thứ nhất, có nghĩa là phép biến đổi này sẽ được giữ lại.
Trong ngữ cảnh CDSL tập trung, chiến lược thực thi truy vấn có thể được diễn tả chính xác bằng một mở rộng của đại số quan hệ. Nhiệm vụ chính của bộ xử lý truy vấn tập trung là đối với một câu truy vấn đã cho, nó phải chọn ra được một câu đại số quan hệ tốt nhất trong số những câu tương đương. Bởi vì đây là bài toán phức tạp về mặt tính toán khi số lượng các quan hệ khá lớn, nên nói chung nó thường được rút lại ở yêu cầu là chọn được một lời giải gần tối ưu.
Trong các hệ phân tán, đại số quan hệ không đủ để diễn tả các chiến lược thực thi vì nó được cung cấp thêm các phép toán trao đổi dữ liệu giữa các trạm. Bên cạnh việc chọn thứ tự cho các phép toán đại số quan hệ, bộ xử lý truy vấn phân tán cũng phải chọn các trạm tốt nhất để xử lý dữ liệu, và có thể cả cách biến đổi dữ liệu. Kết quả là không gian lời giải các chiến lược thực thi tăng lên, làm cho việc xử lý truy vấn phân tán tăng lên rất nhiều.
Ví dụ 1.9: Chúng ta giả sử rằng các quan hệ NGUOIGUI và TAIKHOAN được
phân mảnh ngang như sau:
NGUOIGUI1 = σ i “ −25 ”(NGUOIGUI) (lưu tại trạm 1) NGUOIGUI2 = σ i > “ −25 ”(NGUOIGUI) (lưu tại trạm 2) TAIKHOAN1 = σ i “ −25 ”(TAIK OAN ) (lưutại trạm 3) TAIKHOAN2 = σ i > “ −25 ”(TAIK OAN ) (lưu tại trạm 4) Chiến lược chuyển đổi thứ nhất được biểu diễn trong hình sau:
Trạm 5