Lý do để tiến hành đánh giá các hệ thống truy xuất thông tin

Một phần của tài liệu Luận văn: Nghiên cứu và đánh giá các hệ truy xuất thông tin ppt (Trang 59 - 60)

5.1. Lý do để tiến hành đánh giá các h thng truy xut thông tin tin

Khi nhu cầu truy xuất thông tin phát triển, có rất nhiều mô hình, thuật toán, hệ thống truy xuất thông tin ra đời. Do đó, việc đánh giá các mô hình, thuật toán, hệ thống truy xuất thông tin là điều bắt buộc phải làm.

Chúng ta so sánh một hệ thống (có thể là một hệ thống mới) với các hệ

thống khác đã tồn tại về phương diện: tính hiệu quả, chi phí, thời gian, tốc độ

xử lý…Hệ thống truy xuất thông tin thường thực hiện hai quá trình: quá trình lập chỉ mục và quá trình tìm kiếm. Mỗi một quá trình sẽ có nhiều phương pháp để thực hiện, đánh giá hệ thống cũng có thể dùng để xác định tính tối ưu của các phương pháp trên.

Lý do khác để tiến hành đánh giá là để so sánh các thành phần của hệ

thống. Do hệ thống gồm nhiều thành phần, đánh giá hệ thống để xác định cách mỗi thành phần của hệ thống thực thi để khi có sự thay đổi một thành phần bởi một thành phần khác thì sự thay đổi đó ảnh hưởng đến hệ thống như

thế nào, từđó ta có thể quyết định có nên thay đổi thành phần đó không.

Đánh giá để tìm kiếm thành phần nào là tốt nhất cho hàm xếp thứ tự

(dot-product, cosine…); thành phần nào là tốt nhất cho lựa chọn thuật ngữ

(loại bỏ stopword, phương pháp lấy gốc từ stemming…); thành phần nào là

tốt nhất trong lựa chọn phương pháp đánh giá thuật ngữ (term weighting) như

So sánh để biết người sử dụng cần danh sách các tài liệu trả về (ranked list) dài cỡ bao nhiêu để họ có thể nhìn dễ dàng nhất. Đánh giá để biết hệ thống nào thật sự tốt, người dùng có thể tin tưởng kết quả trả vềđược.

Một phần của tài liệu Luận văn: Nghiên cứu và đánh giá các hệ truy xuất thông tin ppt (Trang 59 - 60)