5.1 Kết luận:
Trong đồ án, chúng tôi đã trình bày khái niệm và các thành phần cơ bản của một hệ thống tìm kiếm thông tin; trình bày cơ sở lý thuyết của tìm kiếm văn bản theo từ khóa và tìm kiếm dựa trên vị trí; xây dựng hệ thống tìm kiếm tài liệu về lĩnh vực du lịch dựa trên thư viện mã nguồn mở Lucene. Cụ thể:
Chúng tôi đã sử dụng cấu trúc chỉ mục lai để kết hợp lập chỉ mục từ khóa và lập chỉ mục vị trí. Đồng thời đề xuất một giải thuật để có thể xếp hạng các văn bản tìm được dựa trên độ tương tự về từ khóa và độ tương tự về không gian. Chúng tôi cũng trình bày ba mô hình tìm kiếm dựa trên cấu trúc chỉ mục này.
Trong phần thực nghiệm, chúng tôi xây dựng và thử nghiệm hệ thống trên Lucene. Kết quả cho thấy thời gian thực hiện của cả ba mô hình này xấp xỉ nhau, tuy nhiên kết quả và độ chính xác của tập tài liệu trả về là khác nhau, tùy thuộc vào từng cách tiếp cận.
5.2 Hướng phát triển của đồ án:
Chúng tôi muốn xây dựng hệ thống tìm kiếm hoàn thiện hơn trong tương lai. Thứ nhất là về giao diện, chúng tôi sẽ kết hợp hai từ truy vấn (từ khóa, vị trí) như hệ thống hiện tại thành một truy vấn duy nhất để thuận tiện hơn cho người sử dụng. Thêm vào đó, chúng tôi cũng xây dựng giao diện tìm kiếm mà các kết quả được thể hiện trên bản đồ để người dùng có thể quan sát một cách trực quan hơn kết quả tìm kiếm.
Thứ hai, chúng tôi muốn cải thiện cấu trúc chỉ mục cũng như thuật toán xếp hạng để có thể giảm thời gian tính toán xếp hạng các tài liệu, cũng như thứ tự của các kết quả trả về sẽ chính xác hơn.
29
TÀI LIỆU THAM KHẢO
1. Christopher D, Manning, Prabhakar Raghavan, Hinrich Schütze (2009), An Introduction to Information Retrieval, Cambridge University Press, Cambridge, England.
2. Michael McCandless, Erik Hatcher, Otis Gospodnetić (2009), Lucene in Action Second Edition, Manning Publications Co.
3. Zhou, Yinghua, Hybrid index structures for location-based web search, CIKM, 2005.
4. Local Lucene Geographical Search:
http://www.nsshutdown.com/projects/lucene/whitepaper/locallucene_v2.html last visited May 2013.
5. Lucene.NET tutorials and examples:
http://www.dotlucene.net/30648/lucene-net-api-search-demo last visited May
2013.
6. Huỳnh Đức Việt, Võ Duy Thanh, Võ Trung Hùng, Nghiên cứu ứng dụng mã
nguồn mở Lucene để xây dựng phần mềm tìm kiếm thông tin trên văn bản,
Tạp chí khoa học và công nghệ, Đại học Đà Nẵng – Số 4(39).2010
7. Thư viện mã nguồn mở Lucene.NET: http://lucenenet.apache.org/ last visited May 2013.