Tìm kiếm theo thuộc tính – giá trị

Một phần của tài liệu Đánh giá các phương pháp tìm kiếm thông tin trong hệ thống mạng ngang hàng có cấu trúc (Trang 26)

Đây là phƣơng pháp đƣợc đề xuất dựa trên cách thức tìm kiếm thực tế của ngƣời dùng đó là các từ khóa ngƣời dùng hay sử dụng chủ yếu để tìm kiếm là các cặp thuộc tính – giá trị. Phƣơng pháp tìm kiếm này sử dụng các cặp thuộc tính – giá trị (attribute - value) để tìm kiếm thông tin. Trong thực tế, chẳng hạn ngƣời dùng muốn tìm cuốn sách “Quản trị mạng” của nhà xuất bản “Giao thông vận tải”, thì ta có thể coi: “Tên sách - Quản trị mạng” và “Nhà xuất bản - Giao thông vận tải” là 2 cặp thuộc tính giá trị, trong đó, Tên sách và Nhà xuất bản là 2 thuộc tính và 2 giá trị tƣơng ứng với nó là Quản trị mạng và Giao thông vận tải.

Theo kết một số quả thống kê, một từ khoá tìm kiếm mà ngƣời dùng sử dụng trung bình gồm có 2,53 từ và có tới 71,5% các truy vấn tìm kiếm bao gồm hai hoặc nhiều hơn các từ khoá. Do từ khoá tìm kiếm thƣờng là cặp thuộc tính – giá trị nên tìm kiếm theo phƣơng pháp này có thể tìm đƣợc hầu hết các thông tin mà ngƣời dùng mong muốn.

Theo phƣơng pháp tìm kiếm này, nội dung thông tin sẽ đƣợc biểu diễn thành một tập các cặp thuộc tính – giá trị. Việc tìm kiếm thông tin cũng sẽ dựa trên các cặp cặp

thuộc tính – giá trị, trong yêu cầu tìm kiếm sẽ có chứa một tập các cặp thuộc tính – giá trị cần truy vấn. Kết quả trả về sẽ chứa danh sách các bản ghi có các cặp thuộc tính – giá trị thoả mãn truy vấn. Việc phân bổ thông tin có thể dựa vào một trong số các cặp thuộc tính để phân bổ hoặc với một thông tin có n cặp thuộc tính – giá trị có thể sẽ phải phân bổ thông tin này ra n nút để khi tìm kiếm có thể tìm đƣợc thông tin đã phân bổ này.

Hình 2.11. Ví dụ một tài nguyên đƣợc biểu diễn dƣới dạng cặp thuộc tính giá trị. Một số giải pháp tìm kiếm theo cặp thuộc tính - giá trị tiêu biểu nhƣ: D- AVTree, CDS (Content discovery System), INS/Twine.

Một phần của tài liệu Đánh giá các phương pháp tìm kiếm thông tin trong hệ thống mạng ngang hàng có cấu trúc (Trang 26)

Tải bản đầy đủ (PDF)

(70 trang)