2.1. Vấn đề truy tìm thơng tin
2.1.4. Đánh giá một hệ thống tìm kiếm thông tin
Hiệu quả của một hệ truy tìm thơng tin có thể được đánh giá theo các tiêu chuẩn sau [2]:
Để đánh giá hiệu quả truy tìm của hệ thống, người ta sử dụng đến hai độ đo cơ
của người dùng với các tài liệu mà hệ thống tìm thấy. Cho S là tập các tài liệu được tìm thấy (liên quan theo hệ thống). Cho U là tập các tài liệu liên quan theo đánh giá của người dùng. Khi đó, độ chính xác và độ bao phủ sẽ được định nghĩa như sau:
Độ chính xác: là sự tương ứng giữa số tài liệu mà hệ thống tìm thấy có liên quan
đến câu truy vấn theo người dùng trên tổng số các tài liệu tìm thấy của hệ thống.
Độ chính xác S U
S
∩ =
Độ chính xác 100% nghĩa là tất cả các tài liệu mà hệ thống tìm thấy điều liên
quan đến câu truy vấn theo người dùng.
Độ bao phủ: là sự tương quan giữa số tài liệu hệ thống tìm thấy được đánh giá là
liên quan theo người dùng trên tổng số các tài liệu có liên quan theo người dùng.
Độ bao phủ S U
U
∩ =
Độ bao phủ là 100% có nghĩa là hệ thống tìm thấy tất cả các tài liệu liên quan.
Thơng thường, khó đáp ứng được cả hai độ đo này cùng một lúc. Một hệ thống
muốn tăng độ chính xác thường sẽ phải giảm độ bao phủ và ngược lại.
Hiệu quả thực thi của hệ thống(Execution efficiency) được đo bởi thời gian
thực hiện thủ tục tìm kiếm các văn bản liên quan đến câu truy vấn được cho.
Hiệu quả lưu trữ được đo bởi dung lượng bộ nhớ cần thiết để lưu trữ dữ liệu (cả
bộ nhớ ngoài lưu trữ dữ liệu chỉ mục và bộ nhớ RAM khi hệ thống thực thi).