: trọng số được gán cho mỗi quan hệ tính trên cặp keyphrase k i-1, ki xidf(k) có cùng ý nghĩa với idf(k) nhưng trả về giá trị trong khoảng [0,1] và
NHẬN XÉT VÀ ĐÁNH GIÁ
Tìm kiếm cơ bản theo từ khóa
Ưu điểm:
Đơn giản, dễ hiểu, dễ cài đặt và sử dụng.
Hỗ trợ tốt chức năng tìm chính xác theo từ khóa mà không cần hiểu nghĩa của từ.
Xếp hạng tài liệu trả về dựa trên độ tương đồng giữa câu truy vấn và mỗi tài liệu. Xử lý được các biến thể về hình thái học của từ.
Hỗ trợ tìm kiếm nâng cao theo từ khóa bằng cách sử dụng các bộ lọc để khoanh vùng giới hạn không gian tìm kiếm.
Nhược điểm:
Mối quan hệ ngữ nghĩa giữa các từ không được xét đến
Khó khăn cho người dùng khi đặc tả đúng từ khóa cho vấn đề tìm kiếm
Kết quả trả về không phải lúc nào cũng thỏa mãn yêu cầu tìm kiếm của người dùng: số
tài liệu hữu ích trả về thấp, không tìm thấy tài liệu liên quan khi được mô tả bởi từ đồng nghĩa, gần nghĩa
NHẬN XÉT VÀ ĐÁNH GIÁ
Tìm kiếm theo ngữ nghĩa
Ưu điểm:
Kết quả trả về là danh sách tài liệu có liên quan được sắp hạng theo mức độ liên quan với từ khóa
Độ chính xác và độ bao phủ cao (cao hơn so với tìm theo từ khóa)
Xử lý tốt các biến thể về ngôn ngữ học của từ: hình thái học, từ vựng học (xử lý gần nghĩa/đồng nghĩa, có liên quan)
Tìm thấy dữ liệu liên quan khác từ đó mở rộng vấn đề ngoài kết quả tìm kiếm: đề xuất từ khóa liên quan, bộ lọc trong kết quả theo thời gian, vùng miền, định dạng, loại hình tài liệu và độ phổ biến, lọc nâng cao theo danh mục các chủ đề hẹp hơn
Nhược điểm:
Thử nghiệm trên những truy vấn đơn giản (chưa xử lý truy vấn bằng ngôn ngữ tự
nhiên)
47
5. KẾT LUẬN
1.`Mô hình cơ sở tài liệu có ngữ nghĩa (Semantic Document Base_SDB) trong đó tích hợp các thành phần:
• Mô hình ontology mô tả tri thức của lĩnh vực.
• Mô hình lưu trữ theo hệ thống thư mục có qui chuẩn
• Mô hình lớp CSDL của kho tài liệu
• Mô hình lớp semantic-quản lý ngữ nghĩa (mô hình đồ thị biểu diễn tài liệu).