Thông tin danh mục sử dụng trong các hàm giá

Một phần của tài liệu Xử lý truy vấn và quản lý giao tác trong cơ sở dữ liệu (Trang 41 - 42)

Để ƣớc lƣợng giá của các chiến lƣợc thực thi khác nhau, cần theo dõi bất kỳ thông tin nào cần thiết cho các hàm giá. Thông tin này có thể đƣợc lƣu trong danh mục DBMS và đƣợc truy nhập bởi bộ tối ƣu truy vấn. Đầu tiên, cần phải biết kích thƣớc của từng file. Với một file toàn bộ các bản ghi là cùng kiểu, số các bản ghi (r), kích thƣớc trung bình của bản ghi (R) và số các khối (b) là cần thiết. Nhân tố khối (bfr) với một file cũng có thể rất cần. Và cũng phải theo dõi phƣơng pháp truy cập chính và các thuộc tính truy cập chính với từng file. Thông tin còn đƣợc lƣu trên các chỉ số thứ cấp và các thuộc tính chỉ số. Số mức (x) của mỗi chỉ số có nhiều mức (chính, phụ hoặc cụm) cần thiết cho hàm giá, hàm này ƣớc lƣợng số lần truy cập khối xảy ra trong khi thực hiện truy vấn. Trong một số hàm giá cần đến chỉ số mức đầu tiên (bl1).

Tham số quan trọng khác là số các giá trị phân biệt (d) của một thuộc tính và độ chọn lọc của nó (sl), độ chọn lọc là phần của các bản ghi thoả mãn một điều kiện bằng trên một thuộc tính. Điều này cho phép ƣớc lƣợng các yếu tố chọn (s=sl *r) của một thuộc tính, nó là mức trung bình các bản ghi sẽ thoả mãn điều kiện chọn bằng trên thuộc tính đó. Với một thuộc tính khoá thì d=r, sl=l/r và s=1. Với một thuộc tính không khoá, giả sử các giá trị phân biệt d đƣợc phân bổ đều giữa các bản ghi, chúng ta ƣớc lƣợng sl=(1/d) và do đó s=(r/d) [6, 8].

Thông tin nhƣ số mức chỉ số dễ dàng duy trì bởi vì nó không thƣờng xuyên thay đổi. Tuy nhiên các thông tin khác có thể thay đổi thƣờng xuyên; ví dụ, số các bản ghi r trong một file thay đổi mỗi khi một bản ghi đƣợc chèn vào hoặc đƣợc xoá đi. Bộ tối ƣu truy vấn sẽ cần nhƣng không hoàn toàn cần

thiết giá trị tức thời của các tham số này cho việc sử dụng ƣớc lƣợng giá của các chiến lƣợc thực thi.

Một phần của tài liệu Xử lý truy vấn và quản lý giao tác trong cơ sở dữ liệu (Trang 41 - 42)