Tổng quan về tối ưu hóa câu hỏi

Một phần của tài liệu Đề cương bài giảng môn cơ sở dữ liệu (Trang 74 - 76)

1. Định nghĩa các thuật ngữ: cơ sở dữ liệu, hệ quản trị cơ sở dữ liệu, hệ cơ sở dữ

8.2Tổng quan về tối ưu hóa câu hỏi

Xét cơ sở dữ liệu quản lý mạng cáp gồm các quan hệ sau:

 Thông tin bề các loại cáp: CAP (M#, MC, GIA, NSX).

 Thông tin về các loại cáp đãđược lắp đặt: L_DAT (T#, M#, SL, NG) Trong đó:

T# kí hiệu mã tuyến TC tên gọi tuyến cáp DAI độ dài tuyến cáp M# mã cáp

MC tên gọi cáp GIA đơn giá

NSX nước sản xuất SL số lượng cáp láp đặt NG ngày lắp đặt

Để có đượccách nhìn tổng quát của việc tối ưu hóa câu hỏi, xét ví dụ sau:liệt

kê tất cả các tuyến cáp lắp đặt ở Việt nam.

Biểu thức đại số quan hệ và cây đại số quan hệ được biểudiễn như sau:

TTC( MC#’Viet nam’(TUYEN X L_DAT) X CAP))

TTC

MC#= ‘Viet nam’

X

X

CAP

Biểu thúc quan hệ trên mô tả quá trình thực hiện câu hỏi như sau: Trước hết, biểu thức tạo ra quan hệ TUYEN X L_DAT X CAP trung gian, bằng cách kết nối tự nhiên hoặc thục hiện tích đề các quan hệ TUYEN, L_DAT và CAP với một số lượng bản ghi tích số lượng các bản ghi và các thuộc tính bao gồm các thuộc tính của 3 quan hệ trên. Như vậy sau bước này, quan hệ tạm có lực lượng khá lớn và chiều dài của một bản ghi cũng không phải là nhỏ, nếu kích cỡ các quan hệ của nguồn lớn. Tuy nhiên kết quả câu hỏi chỉ quan tâm đế thuộc tính trên tuyến cáp TTC và các bộ dữ liệu có tên loại cáp trùng với “Viet nam”. Như vậy sau khi tính tích đề các, hệ thống sẽ thực hiện phép chọn và phép chiếu để đưa ra quan hệ kết quả. Trong cách biểu diễn này,số lượng các phép toán thực hiện là tương đối lớn, chi phí thời gian quá cao và chi phí lưu trữ tốn kém.

Chú ý rằng, câu hỏi chỉ quan tâm đến các bộ dữ liệu cáp “Viet nam”. Thông tin nàyđược chứa trong các quan hệ L_DAT, và CAP(trong nhật kí lắp đặt là mã các loại cáp Viet nam và trong danh mục là chuỗi “Viet nam”). Như vậy

L_DAT TUYEN

có thể thực hiện các phép chọn trong các quan hệ L_DAT và CAP. Kết quả trung gian các phép chọn sẽ làm giảm đáng kể số lượng các bản ghi,kích cỡ của quan hệ của phép kết nối tự nhiên của hai thành phần trung gian trên với quan hệ TUYEN. Càng dễ dàng khi thực hiện phép chiếu trên thuộc tính trên tuyến cáp TTC. Có thể biến đổi biểu thức đại số ban đầu tối ưu hơn,bằng cách thực hiện các phép chiếu và chọn, tiếp sau mới thực hiện phép kết nối.Kết quả biến đổi như sau:

πTTC(σMC# =’Việt nam’ (L_DAT) X (σMC# =’Việt nam’( CAP ) X TUYEN)) Biểu thức này tương đương như biểu thức đại số ban đầu, nhưng nó tạo ra các quan hệ trung gian có kích cỡ nhỏ hơn nhiều so với kích cỡ của TUYENX L_DAT XCAP

TTC

X

X TUYEN

MC#= ‘Viet nam’ MC#= ‘Viet nam’

L_DAT CAP

Như vậy biến đổi một biểu thức đại số quan hệ về một biểu thức đại số quan hệ tương đương tối ưu theo nghĩa sẽ cho cùng một kết quả nhưng với chi phí thời gian thực hiện và sử dụng bộ nhớ ít hơn rất nhiều.

Một phần của tài liệu Đề cương bài giảng môn cơ sở dữ liệu (Trang 74 - 76)