Đánh giá hệ thống truy hồ

Một phần của tài liệu Tiểu luận BIỂU DIỄN CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG (Trang 25)

Nhiều phương pháp đo đã được phát triển để đánh giá các mô hình truy hồi. Tuy nhiên, không có phương pháp nào hoàn toàn đạt yêu cầu, bởi vì việc đánh giá hiệu năng hệ thông truy hồi thì phụ thuộc vào người dùng và nhiều yếu tố khác, trong khi kết quả của các phương pháp đo này chỉ là một giá trị đơn lẻ.

Hai độ đo cơ bản và phổ biến nhất là độ chính xác và độ bao phủ. Cho một truy vấn q và tập các tài liệu thích hợp với nó là R. Cho A (tập trả lời) là tập các tài liệu được trả về theo truy vấn q bởi hệ thống, và cho Ra là tập giao nhau giữa R và A, tức là các tài liệu thích hợp có trong tập trả lời. Độ chính xác và độ bao phủ được xác định như sau:

• Độ bao phủ - tỷ lệ số tài liệu thích hợp được truy hồi : • Độ chính xác - tỷ lệ số tài liệu được truy hồi là thích hợp:

Độ chính xác và độ bao phủ cho một truy vấn

Giá trị của độ chính xác và bao phủ là giữa 0 và 1. Giá trị càng cao thì càng tốt. Độ chính xác và bao phủ là các phép đo dựa trên tập hợp. Chúng đánh giá chất lượng của tập tài liệu truy hồi không có thứ tự. Để đánh giá một danh sách được xếp hạng, biểu đồ độ chính xác – bao phủ được sử dụng. Và thông

thường, người ta tính độ chính xác tại 11 mức bao phủ. Mỗi điểm trển biểu đồ (độ bao phủ - chính xác) được xác định bằng cách tính độ chính xác tại một giá trị độ bao phủ cắt ngang. Với các giá trị độ bao phủ còn lại, độ chính xác bị nội suy theo:

Ví dụ

Giả sử tập các tài liệu thích hợp cho truy vấn q là Rq = {d3, d5, d9, d25, d39, d44, d56, d71, d89, d123}, và xếp hạng đưa ra bởi hệ thống là:

Một phần của tài liệu Tiểu luận BIỂU DIỄN CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG (Trang 25)

Tải bản đầy đủ (DOCX)

(66 trang)
w