Là phƣơng pháp tìm kiếm mà giá trị của một thuộc tính dao động trong một khoảng nào đó. Khi tìm kiếm thông tin, ngƣời dùng thƣờng không biết chính xác thông tin hoặc chỉ biết một phần thông tin hoặc muốn tìm thông tin trong một giới hạn nào đó. Khi đó, sử dụng phƣơng pháp tìm kiếm theo khoảng là phù hợp. Ví dụ ngƣời dùng muốn tìm kiếm hàng ăn trong một vùng địa lý (các khu phố), tìm kiếm thông tin về một sự việc trong một khoảng thời gian hoặc tìm kiếm địa chỉ của một số cửa hàng bán hàng tạp hóa trong một vùng không gian địa lý.
Nhƣ ở hình 2.15, minh hoạ một số yêu cầu tìm kiếm theo khoảng nhƣ yêu cầu tìm trong một khoảng giá trị thỏa mãn bất đẳng thức hoặc tìm kiếm trong một phạm vi nhƣ hình tròn, hình vuông.... Phƣơng pháp này thực chất là tìm kiếm thông tin thoả mãn một hệ bất đẳng thức. Một số nghiên cứu đã có về giải pháp tìm kiếm thông tin theo khoảng nhƣ [2], [3], [7].
Hình 2.12. Minh hoạ yêu cầu tìm kiếm theo khoảng
Tìm kiếm theo khoảng trên các hệ thống tập trung rất đơn giản. Hệ thống chỉ cần duyệt tất cả các bản ghi theo chỉ mục để lấy ra các bản ghi thoả mãn thuộc tính có giá trị theo khoảng yêu cầu.
Tuy nhiên để tìm kiếm theo khoảng trên mạng ngang hàng có cấu trúc là khó vì mạng ngang hàng có cấu trúc chỉ hỗ trợ tìm kiếm chính xác. Tức là chỉ có những thông tin chính xác thì mới có thể tìm đƣợc trên mạng ngang hàng có cấu trúc mà không thể tìm đƣợc các thông tin trong phạm vi 1 khoảng nào đó. Vì vậy, cần có cách thức cải tiến vè lƣu trữ và tìm kiếm dữ liệu để thực hiện việc tìm kiếm theo khoảng.
CHƢƠNG 3. MỘT SỐ GIẢI PHÁP TÌM KIẾM THÔNG TIN THEO GIÁ TRỊ THUỘC TÍNH TRÊN MẠNG NGANG HÀNG CÓ CẤU TRÖC
Trong Chƣơng 2, luận văn đã trình mày một số phƣơng pháp tìm kiếm thông tin trên mạng ngang hàng có cấu trúc nhƣ: tìm kiếm theo khoảng, tìm kiếm theo các thuộc tính/giá trị, tìm kiếm gần đúng, … Trong đó, tìm kiếm theo cặp thuộc tính - giá trị đƣợc sử dụng phổ biến trong việc tìm kiếm thông tin trên hệ thống mạng ngang hàng có cấu trúc bởi tính thực tiễn của nó. Hiện tại có nhiều giải pháp tìm kiếm thông tin sử dụng phƣơng pháp tìm kiếm theo cặp thuộc tính - giá trị. Trong chƣơng này, luận văn sẽ tập trung tìm hiểu các giải pháp tìm kiếm theo cặp thuộc tính/giá trị đã đƣợc đƣa ra trong những năm gần đây nhƣ: INS/Twine [9], Content Discovery System (CDS) [8], D-AVTree [4], D-AVTree+, …. Khi trình bày các giải pháp, luận văn thống nhất sử dụng các thuật ngữ nhƣ tên tài nguyên, truy vấn, thông điệp truy vấn, … để đảm bảo tính đồng bộ, thống nhất.
Các giải pháp tìm kiếm thông tin đƣợc trình bày theo các nội dung nhƣ: mô tả tài nguyên, truy vấn, phân bổ tài nguyên, giải quyết truy vấn.
3.1. GIẢI PHÁP INS/TWINE