KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

Một phần của tài liệu Khoá luận tốt nghiệp phương pháp phân tích ngữ nghĩa tiềm ẩn tìm kiếm văn bản tiếng anh dựa trên nội dung (Trang 66 - 68)

Phương pháp phân tích ngữ nghĩa tiềm ẩn tìm kiếm văn bản tiếng anh dựa trên nội dung là một phương pháp rất hiệu quả cho mục đích khai phá dữ liệu cũng như tìm kiếm văn bản vì nó đã phần nào giả quyết được vấn đề tìm kiếm văn bản phù họp với nội dung. Sau quá trình tìm hiểu và nghiên cứu phương pháp phân tích ngữ nghĩa tiềm ẩntìm kiếm văn bản tiếng anh dựa trên nội dung khóa luận đã đạt được những kết quả sau:

- Hiểu được phương pháp LSA trong tìm kiếm văn bản.

- Hiểu được các bước tiền xử lý ừong việc xử lý văn bản.

- Hiểu và sử dụng được thư viện MaứiNet.Numerics choviệc phân tích SVD.

- Xây dựng được cơ sở dữ liệu văn bản tiếng anh.

- Cài đặt ứng dụng cho phép truy vấn tài liệu dựa vào các từ khóa do người dùng cung cấp.

- Đánh giá được ưu, nhược điểm của ứng dụng tìm kiếm văn bản.

Hướng phát triển của khóa luận: Trong tương lai tiếp tục hoàn thiện

chương trình tìm kiếm văn bản bằng phương pháp LSA để có thể đưa ứng dụng vào thực tế. Xây dựng chương trình tìm kiếm văn bản trên nhiều loại ngôn ngữ khác nhau. Tìm hiểu các kỹ thuật tìm kiếm nâng cao dựa trên cơ sở nội dung đối

với tìm kiếm tài liệu văn bản. Đánh giá khả năng tìm kiếm các

mô hình trên các dữ liệu cụ thể.

Do điều kiện thời gian có hạn mà lĩnh vực nghiên cứu lại tương đối rộng nên khóa luận sẽ không tránh khỏi những thiếu sót. Kính mong các thầy, cô giáo chỉ bảo, giúp đỡ.

+q(l,3) +cl(l,2,3

, *2 giao diện +c3(2,4,5,8)

*1 con người *5 hệ thống

Một phần của tài liệu Khoá luận tốt nghiệp phương pháp phân tích ngữ nghĩa tiềm ẩn tìm kiếm văn bản tiếng anh dựa trên nội dung (Trang 66 - 68)