4.3 Kết luận
Chương này đã trình bày kết quả cài đặt và đánh giá thử nghiệm với tập dữ liệu cụ thể cho các phương pháp: Cosine, Cosine Short Segments, Dice, Jaccard, Matching, Overlap. Kết quả xếp hạng trả về đã được thể hiện trực quan qua ứng dụng tìm kiếm. Kết quả thực nghiệm cho thấy phương pháp xếp hạng áp dụng n-gram có kết quả mong muốn trả về là tốt hơn.
KẾT LUẬN
Nội dung luận văn trình bày một số kết quả nghiên cứu đạt được sau đây: Nghiên cứu được cách thức hoạt động của hệ thống truy tìm thông tin nói chung và nghiên cứu được các phương pháp xếp hạng: Cosine, Cosine Short Segments, Dice, Jaccard, Matching, Overlap áp dụng trong lĩnh vực thống kê y tế.
Cài đặt thử nghiệm các phương pháp trên bộ dữ liệu thực tế về danh mục chẩn đoán bệnh tật quốc tế, đánh giá, so sánh các phương pháp để chọn ra được phương pháp nào thực sự tốt hơn. Kết quả khi sử dụng n-gram kết hợp phương pháp xếp hạng, n-gram cho kết quả chính xác hơn.
Ứng dụng của luận văn hoàn toàn có thể sử dụng với các bộ dữ liệu khác ngoài bộ dữ liệu danh mục chẩn đoán bệnh tật quốc tế mà luận văn đã sử dụng trong phần thực nghiệm.
TÀI LIỆU THAM KHẢO Tiếng Việt
1. PGS.TS. Đặng Văn Đức (2004-2008), Bài giảng Cơ sở dữ liệu đa phương tiện.
Tiếng Anh
2. Zdravko Markov, Daniel T. Laroso, Data Mining the Web: Uncovering Patterns in Web Content, Structure, and Usage.
3. Teufel (2006, To Appear): Chapter An Overview of evaluation methods n TREC Ad-hoc Information Retrieval and TREC Question Answering. In: L.
Dybkjaer, H. Hemsen, W. Minker (Eds.) Evaluation of Text and Speech Systems. Springer, Dordrecht, The Netherlands.
4. Sahami, M., and Heilman, T. 2006. A web-base kernel function for
measuring the similarity of Short text snippets. In Proc. of WWW '06.
5. Metzler, D.; Dumais, S.; and Meek, C. 2007. Similarity measures for short
segments of text. In Proc. of ECIR-07.
6. Metzler, D., Bernstein , Y., Croft, W.B., Moffat, A., and Zobel, J. Similarity
measures for tracking information flow. In Proceedings of CIKM '05.
7. Christopher D. Manning, Prabhakar Raghavan, Hinrich Schütze.
Introduction to Information Retrieval. Cambridge University Press, 2008.
Internet