Tổng quan về tối ưu hóa câu hỏ

Một phần của tài liệu Tài liệu học tập Cơ sở dữ liệu: Phần 2 - Trường ĐH Kinh tế kỹ thuật công nghiệp (Trang 37 - 39)

TỐI ƯU HÓA CÂU HỎI TRUY VẤN

4.2. Tổng quan về tối ưu hóa câu hỏ

Xét cơ sở dữ liệu quản lý mạng cáp gồm các quan hệ sau: a. Thông tin về các tuyến cáp: TUYEN (T#, TC, DAI). b. Thông tin về các loại cáp: CAP (M#, MC, GIA, NSX).

c. Thông tin về các loại cáp đã được lắp đặt: L_DAT (T#, M#, SL, NG)

Trong đó:

T# ký hiệu mã tuyến TC Tên gọi tuyến cáp, DAI Độ dài tuyến cáp M# Mã cáp

MC Tên gọi cáp GIA Đơn giá.

NSX Nước sản xuất SL Số lượng cáp lắp đặt. NG Ngày lắp đặt cáp.

Để có được cách nhin tổng quát của việc tối ưu hoá câu hỏi, xét ví dụ sau:

liệt kê tên tất cảcác tuyến cáp có lắp đặt cáp Việt nam.

Biểu thức đại số quan hệ và cây đại số quan hệ được biểu diễn như sau : 1.TTC ( σ MC# =’Việt nam’ (TUYEN X L_DAT) X CAP))

KHOA CNTT – TRƯỜNG ĐẠI HỌC KINH TẾ KỸ THUẬT CÔNG NGHIỆP

Biểu thức trên mô tả quá trình thực hiện câu hỏi như sau: Trước hết, biểu thức tạo ra quan hệ TUYEN X L_DAT X CAP trung gian, bằng cách kết nối tự nhiên hoặc thực hiện tích Đề các các quan hệ TUYEN, L_DAT và CAP với một số lượng bản ghi bằng tích số lượng các bản ghi và các thuộc tính bao gồm các thuộc tính của 3 quan hệ trên. Như vậy sau bước này, quan hệ tạm có lực lượng khá lớn và chiều dài của một bản ghi cũng không phải là nhỏ, nếu kích cỡ các quan hệ nguồn lớn. Tuy nhiên kết quả câu hỏi chỉ quan tâm đến thuộc tính tên tuyến cáp TTC và các bộ dữ liệu có tên loại cáp trùng với “Việt nam”.

Như vậy sau khi tính tích Đề các, hệ thống sẽ thực hiện các phép chọn và phép chiếu để đưa ra quan hệ kết quả. Trong cách biểu diễn này, số lượng các phép toán thực hiện tương đối lớn, chi phí thời gian quá cao và chi phí lưu trữ tốn kém.

Chú ý rằng, câu hỏi chỉ quan tâm đến các bộ dữ liệu cáp “Việt nam”. Thông tin này được chứa trong các quan hệ L_DAT, và CAP (trong nhật ký lắp đặt là mã các loại cáp Việt nam và trong danh mục là chuỗi “Việt nam”).

Như vậy có thể thực hiện các phép chọn trong các quan hệ L_DAT và CAP. Kết quả trung gian các phép chọn sẽ làm giảm đáng kể số lượng các bản ghi, kích cỡ của quan hệ của phép kết nôi tự nhiên của 2 thành phần trung gian trên với quan hệ TUYEN. Càng dễ dàng khi thực hiện phép chiếu trên thuộc tính tên tuyến cáp TTC. Có thể biến đổi biểu thức đại số ban đầu tối ưu hơn, bằng cách thực hiện các phép chiếu và chọn, tiếp sau mới thực hiện phép kết nối. Kết quả biến đổi như sau:

TTC (σ MC# =’Việt nam’ (L_DAT) X (σ MC# =’Việt nam’( CAP ) X TUYEN)) Biểu thức này tương đương như biểu thức đại số ban đầu, nhưng nó tạo ra các quan hệ trung gian có kích cỡ nhỏ hơn nhiều so với kích cỡ của TUYEN X L_DAT X CAP.

KHOA CNTT – TRƯỜNG ĐẠI HỌC KINH TẾ KỸ THUẬT CÔNG NGHIỆP

Cây đại số được tối ưu hóa

Như vậy, biến đổi một biểu thức đại số quan hệ về một biểu thức đại số quan hệ tương đương tối ưu theo nghĩa sẽ cho cùng một kết quả nhưng với chi phí thời gian thực hiện và sử dụng bộ nhớ ít hơn rất nhiều.

Một phần của tài liệu Tài liệu học tập Cơ sở dữ liệu: Phần 2 - Trường ĐH Kinh tế kỹ thuật công nghiệp (Trang 37 - 39)

Tải bản đầy đủ (PDF)

(80 trang)