II. XÂY DỰNG ỨNG DỤNG
2.4.Đánh chỉ mục, tìm kiếm và xếp hạng
Có nhiều phương pháp để truy vấn một cơ sở tri thức ngữ nghĩa và truy hồi kết quả. Có 4 cách truy vấn cơ bản: truy vấn dựa trên từ khóa, dựa trên ngôn ngữ tự nhiên, dựa trên view, và dựa trên form. Truy vấn bằng ngôn ngữ tự nhiên, hiện đang còn nhiều nghiên cứu. Do đó, ở đây ta chọn truy vấn dựa trên từ khóa cho phép người dùng thoải mái khi thực hiện truy vấn. Các cách khác mặc dù chúng cho phép truy vấn chính xác hơn, nhưng yêu cầu tương tác với người dùng nhiều hơn, đồng thời phụ thuộc vào quy mô của lĩnh vực truy vấn đó.
Trong các tìm kiếm dựa trên từ khóa truyền thống, các tài liệu được đánh chỉ mục thường chứa các đoạn văn bản thô gắn với tài liệu đó. Lucene dễ dàng xử lý các chỉ mục như vậy và xếp hạng mặc định của nó thường sẽ cho ra kết quả tốt. Tuy nhiên, với các chỉ mục phức tạp nên được xử lý cẩn thận. Để lợi dụng được các ưu điểm của ontology, ta cần phải thay đổi một chút về cơ chế xếp hạng và truy vấn của Lucene. Trước tiên nhất, ta tăng xếp hạng của các trường chứa các thông tin được rút trích và suy diễn ra để nhấn mạnh tầm quan trọng của chúng. Thứ hai, các trường này được xếp hạng theo độ quan trọng của chúng. Ví dụ, khi tìm kiếm với từ khóa “hải sản” sẽ có nhiều quán ăn, nhà hàng, khách sạn có hải sản, nhưng với trường tên địa điểm được ưu tiên hơn thì các địa điểm có tên chứa cụm từ “hải sản” sẽ được trả về trước tiên.