Đồ thị kết nối trang được định nghĩa là một đồ thị vô hướng G(N,E,w), trong đó N là tập hữu hạn các nút, E là tập hữu hạn các cạnh, w là hàm trọng số trên các cạnh. Bộ nhớ đệm cần thiết được định nghĩa là giá trị lát cắt của đồ thị G, và một lát cắt của đồ thị G được định nghĩa là hai tập nút rời nhau A, B sao cho A∪B = N. Giá trị của lát cắt chính là tổng trọng số trên các cạnh nối từ các nút của A tới các nút trong B.
Mệnh đề 1. Giá trị của một lát cắt biểu diễn lượng bộ nhớ đệm cần thiết khi tất cả các nút của một tập con được tìm về [9].
Trong Hình 3.6 hai tập con của lát cắt là {1,2} và {3,4,5}, cho giá trị của lát cắt là 14, tức là sẽ có nhiều bộ cần phải được lưu trữ trong bộ nhớ mỗi khi các trang 1,2 hoặc các trang 3,4,5 được tìm về.
Mệnh đề 2. Lát cắt có giá trị lớn nhất sẽ cho cận trên nhỏ nhất của kích thước bộ nhớ đệm. Có ít nhất một dãy truy xuất trang cần bộ nhớđệm có dung lượng như vậy [9].
Chứng minh. Chúng ta chia tập các nút thành 2 tập con rời nhau sao cho có được giá trị lát cắt của đồ thị là lớn nhất. Theo mệnh đề 1 thì giá trị này chính là kích thước của bộ nhớ đệm cần thiết khi các nút của một tập con được tìm về. Không có một dãy truy xuất trang nào cần bộ nhớđệm nhiều hơn giá trị này, do không có giá trị lát cắt nào lớn hơn nó.
Giải thuật để tính toán giá trị lát cắt lớn nhất được trình bày trong [12]. Bài toán tìm lát cắt có giá trị lớn nhất là bài toán NP-Hard như vậy bài toán tìm giá trị cận trên của kích thước bộ nhớđệm cũng là NP-Hard.
Khi xét miền nối có giá trị lặp thì đồ thị kết nối trang sẽ là đồ thị có hướng. Trọng số của cung chính là số các bộ từ trang “đuôi mũi tên” được nối với các bộ trong trang “đầu mũi tên”. Mỗi cung sẽ có một đối tác song song theo chiều ngược lại. Giá trị của lát cắt lớn nhất cũng là giá trị cận trên của kích thước bộ nhớ đệm. Lát cắt cũng được định nghĩa như trong trường hợp vô hướng, nhưng giá trị lát cắt chỉ bao gồm những cung có “đuôi” ở bên trái và “mũi” ở bên phải, và tất nhiên bài toán này cũng là NP-Hard.
3.1.4 Các Heuristic để làm giảm lượng bộ nhớđệm cần thiết.
Bộ nhớ đệm với kích thước là giá trị cận trên được đưa ra ở phần trước sẽ đảm bảo lượng bộ nhớđệm cần thiết cho bất kỳ một dãy truy xuất trang nào. Chúng ta có thể làm giảm đáng kể lượng bộ nhớ này bằng các heuristic. Ở phần này hai heuristic sử dụng cách chọn ngẫu nhiên sẽđược đưa ra để làm giảm lượng bộ nhớ cần thiết.
Heuristic 1.
Bước 1. Chọn một nút chưa được tìm về trong đồ thị kết nối trang. Dừng khi tất cả các nút đã được tìm về
Bước 2. Tìm về trang được chọn. Thực hiện nối với các bộ tương ứng trong bộ nhớ đệm. Lưu trữ các bộ nối của trang này có các bộ nối chưa được tìm về. Các trang chứa các bộ nối này được đưa vào danh sách tìm về(fetch list)
Bước 3. Chọn ngẫu nhiên bất kỳ một trang từdanh sách tìm về và quay lại
Bước 2. Nếu danh sách rỗng (có nghĩa là một tập trang đã được tìm vềđầy đủ) thì quay lại Bước 1
Heuristic 2.
Bước 1. Chọn một nút chưa được tìm về trong đồ thị kết nối trang. Dừng khi tất cả các nút được tìm về
Bước 2. Tìm về trang được chọn. Thực hiện nối với các bộ tương ứng trong bộ nhớ đệm. Lưu trữ các bộ nối của trang này có các bộ nối chưa được tìm về. Các trang chứa các bộ nối này được đưa vào danh sách tìm về(fetch list).
Bước 3. Chọn một trang từdanh sách tìm về, sao cho nó có số bộ ít nhất được nối với các trang chưa được tìm về, và quay lại Bước 2. Nếu danh sách rỗng thì quay lại Bước 1.
Thí nghiệm được tiến hành để đo kích thước bộ nhớ đệm tương ứng với 2 heuristic này. Kết quả được đưa ra trong Hình 3.7. Giải thuật nối được mô phỏng bởi một chương trình máy tính. Giá trị thuộc tính nối được giả thiết phân bố đều và không
lặp. Tuy nhiên chúng tôi tin rằng kết quả thu được cũng tương tự ngay cả khi có giá trị lặp. Kích thước bộ nhớđệm (số các bộ) Hệ số chọn Heuristic 1 Heuristic 2 0.0001 1 1 0.001 1 1 0.01 10 4 0.03 469 207 0.05 1230 472