Giải pháp B

Một phần của tài liệu (LUẬN văn THẠC sĩ) tối ưu hóa cơ sở dữ liệu phân tán 04 (Trang 36 - 38)

trí i đến vị trí j. Ví dụ trong chiến lược A, tại vị trí 1, sau khi thực hiện phép chọn trên quan hệ PC1 thỏa mãn biểu thức Nhiệm vụ = “Quản lý”, kết quả PC’1 sẽ được truyền từ vị trí 1 sang vị trí 3 để tham gia phép kết nối với quan hệ NV1.

Hai giải pháp A và B thực hiện truy vấn là tương đương. Trong đó:

- Giải pháp A: Sử dụng hai quan hệ PC và NV được phân mảnh theo cùng một cách để thực hiện lựa chọn và kết nối các thao tác một cách song song các phép chọn và kết nối.

- Giải pháp B: Tập trung tất cả các dữ liệu trong toán hạng tại vị trí kết quả trước khi xử lý truy vấn.

Để có thể đánh giá chi phí nguồn tài nguyên của hai giải pháp trên, ta ký hiệu: - Chi phí để thao tác truy xuất nội bộ là một đơn vị, ký hiệu là tupacc. - Chi phí để truyền nội bộ là 10 đơn vị, ký hiệu là tuptrans

- Giả sử lực lượng của quan hệ NV và PC là 500 và 1000 bản ghi. - Giả sử có 40 quản lý trong quan hệ PC.

Khi đó, tổng chi phí của giải pháp A là:

1.Tạo ra PC’ bằng cách chọn trên PC cần (20+20)* tupacc = 40 2. Truyền PC’ đến vị trí của NV cần (20+20)*tuptrans = 400 3. Tạo NV’ bằng cách nối PC’ và NV’ cần (20+20)*tupacc*2 = 80 4. Truyền NV’ đến vị trí nhận kết quả cần (20+20)*tuptrans = 400

Tổng chi phí 920

Tổng chi phí cho giải pháp B có thể được tính như sau:

1. Truyền NV đến vị trí 5 cần 500*tuptrans = 5.000

2. truyền PC đến vị trí 5 cần 1000*tuptrans = 10.000

3. Tạo ra PC’ bằng cách chọn trên PC cần 1000*tupacc = 1.000 4. Nối NVvà PC cần 500*40*tupacc = 20.000

Tổng chi phí là 36.000

Như vậy, chi phí để thực hiện giải pháp A thấp hơn chi phí thực hiện giải pháp B. Tối ưu hóa truy vấn là một vấn đề quan trọng trong việc xử lý truy vấn. Có nhiều phép biến đổi một truy vấn mức cao trên CSDL phân tán thành nhiều giải pháp thực hiện dưới dạng ngôn ngữ mức thấp, nhưng trong đó chỉ có một giải pháp thực hiện có hiệu quả, tối ưu về chi phí sử dụng tài nguyên mạng, bao gồm chi phí sử dụng bộ nhớ, thời gian xử lý và thời gian truyền dữ liệu.

Việc đánh giá chi phí sử dụng tài nguyên mạng có thể theo tổng thời gian xử lý các thao tác truy vấn tại các vị trí khác nhau và việc truyền dữ liệu giữa các vị trí [9] hoặc đánh giá theo chỉ số thời gian trả lời truy vấn. Các thao tác có thể được thực hiện đồng thời song song tại các vị trí khác nhau, vì vậy thời gian đáp ứng có thể nhỏ hơn tổng chi phí. Chi phí truyền thông là một trong các nhân tố quan trọng và được quan tâm trong CSDL phân tán.

2.2. Quá trình xử lý truy vấn

Quá trình xử lý truy vấn bao gồm 4 tầng: Phân rã truy vấn, cục bộ hóa dữ liệu, tối ưu hóa toàn cục và tối ưu hóa cục bộ (xem Hình 2.3) [12].

Phân rã truy vấn và cục bộ hóa dữ liệu tương ứng với việc viết lại truy vấn. Chức năng của ba tầng đầu tiên được thực hiện tại một vị trí tập trung và sử dụng các thông tin toàn cục, còn chức năng của tầng thứ 4 được thực hiện ở vị trí cục bộ.

Một phần của tài liệu (LUẬN văn THẠC sĩ) tối ưu hóa cơ sở dữ liệu phân tán 04 (Trang 36 - 38)

Tải bản đầy đủ (PDF)

(79 trang)