3.1 Ứng dụng lý thuyết đồ thị trong tối ưu hóa truy xuất CSDL để thực hiện phép
3.1.1 Sử dụng chỉ mục để thực hiện phép nố i
Việc sử dụng chỉ mục rất có ích cho việc thực hiện nối, dù với chỉ mục dữ liệu có dồn cụm hay không. Việc chỉ mục dồn cụm cho phép các bộ có thể được tìm về theo một thứ tự đã được sắp xếp, trong khi đó mỗi trang dữ liệu chỉ phải truy xuất nhiều nhất là một lần. Mặt khác nếu dữ liệu không được dồn cụm bởi chỉ mục thì số lần truy xuất trang cũng được cực tiểu hóa khi chúng ta có đủ lượng bộ nhớ đệm chính cần thiết. Do vậy ở đây chúng ta cần có sự dung hòa giữa độ lớn của bộ nhớ đệm cần thiết để thực hiện nối và số lần truy xuất trang.
Bằng việc sử dụng chỉ mục nối của hai quan hệ chúng ta có thể xác định danh sách các cặp con trỏ trỏ tới các bộđược nối với nhau. Một con trỏ bao gồm số hiệu của trang và offset trong trang. Như vậy với mỗi cặp con trỏ chúng ta có thể xác định được cặp trang tương ứng cần được truy xuất.
Ở phần tiếp theo, mô hình đồ thị được xây dựng trên cơ sở các cặp này sẽ được trình bày. Mục đích của việc này là nhằm xác định dãy truy xuất trang (tức là, tương
đương với việc duyệt đồ thị) để tối ưu kích thước bộ nhớđệm đối lại với lượng truy xuất lại trang dữ liệu. Thí dụ trong Hình 3.1 chúng ta xác định lượng bộ nhớ đệm cần thiết cho hai dãy truy xuất trang, mỗi trang được truy xuất nhiều nhất một lần. Theo cách đó chúng ta tìm về một trang tại một thời điểm và lưu trữ các bộ tham gia vào nối của chúng vào bộ nhớ đệm để nhằm tránh việc truy cập lại trang. Việc tìm về các trang trong Hình 3.1, với trình tự truy xuất như trong Hình 3.2a, yêu cầu lưu trữ trong vùng nhớ đệm nhiều nhất là 2 bộ. Còn với dãy truy xuất như trong Hình 3.2b thì chỉ lưu trữ nhiều nhất là 1 bộ.
Hình 3. 1 Quan hệ với các bộ tham gia nối