Nhận xét, đánh giá

Một phần của tài liệu Ứng dụng trích rút thông tin vào xây dựng hệ thống hỏi đáp từ tập dữ liệu dạng văn bản (Trang 70 - 73)

6. Trích xuất câu trả lời:

7.3 Nhận xét, đánh giá

Ƣu điểm :

- Hệ thống hoạt động khá tốt, trả lời khá chính xác đƣợc nhiều câu hỏi dƣới cách diễn đạt đa dạng của ngôn ngữ tự nhiên. Độ tin cậy của câu trả lời tƣơng đối cao.

- Linh hoạt trong chính tả viết hoa viết thƣờng của câu hỏi.

- Hệ thống dễ dàng đƣợc cải thiện chất lƣợng nhờ việc làm giàu cơ sở dữ liệu và mẫu quan hệ.

- Việc mở rộng thêm về các quan hệ, hoặc rộng hơn là các lĩnh vực hƣớng tới của hệ thống cũng khá đơn giản.

Nhƣợc điểm :

- Hệ thống chỉ hiệu quả với những câu hỏi 2 ngôi : đặc điểm của phƣơng pháp mẫu quan hệ.

- Không trả lời đƣợc khi không có dữ liệu trong cơ sở dữ liệu: Hƣớng khắc phục đề xuất là tìm một phƣơng pháp tìm kiếm thông tin trực tiếp trên internet để lấy câu trả lời.

Hiện tại hệ thống sử dụng bảng log để lƣu những câu hỏi mà ngƣời dùng nhập vào nhƣng hệ thống không đƣa ra đƣợc câu trả lời. Dựa vào danh sách câu hỏi này ta có thể cải thiện thêm cho hệ thống.

69

KẾT LUẬN

Nhu cầu xây dựng một hệ thống hỏi đáp tự động cho ngôn ngữ tiếng Việt ngày càng trở nên cấp thiết nhằm khai thác các dữ liệu web hiệu quả hơn. Các phƣơng pháp đƣợc sử dụng cho việc xây dựng hệ thống hỏi đáp rất đa dạng. Vì thế, vấn đề xác định phƣơng pháp xử lý phù hợp với ngôn ngữ ngữ tiếng Việt là một phần quan trọng trong quá trình xây dựng một hệ thống hỏi đáp tự động.

Với việc tìm hiểu và tiếp cận các kiến thức về xử lí ngôn ngữ tự nhiên nói chung và hệ thống hỏi đáp tự động nói riêng, em đã chọn và xây dựng hệ thống hỏi đáp chữa bệnh cho trẻ em và sử dụng phƣơng pháp mẫu quan hệ cho việc phân tích câu hỏi.

Trong quá trình nghiên cứu và xây dựng luận văn tốt nghiệp, em đã đạt được các kết quả sau:

-Trình bày một cách khái quát nhất về hệ thống hỏi đáp tự động.

- Nghiên cứu các kỷ thuật phân tích câu hỏi theo ngôn ngữ tự nhiên để xây dựng hệ thống hỏi đáp tự động nhƣ: việc xác định loại câu hỏi, xử lý câu hỏi, trích xuất câu trả lời, các phƣơng pháp xử lý câu hỏi...

- Nghiên cứu các kỷ thuật trích rút thông tin mối quan hệ ngữ nghĩa. Từ đó chọn kỷ thuật trích rút phù hợp để xây dựng hệ thống ứng dụng.

- Đồng thời khoá luận đã đƣa ra mô hình cho hệ thốngh ỏi đáp tiếng Việt sử dụng phƣơng pháp trích rút mẫu quan hệ ngữ nghĩa trong kho văn bản tiếng Việt để trả lời những câu hỏi trong lĩnh vực liên quan đến chữa bệnh cho trẻ em.

Do thời gian và kiến thức hạn chế, một số kết quả nghiên cứu luận văn còn chưa đạt được như ý:

- Bộ dữ liệu trích rút đƣợc còn thiếu, tập mẫu xây dựng còn chƣa đƣợc nhiều. Khó khăn trong việc này là không có cơ sở đánh giá độ đầy đủ của dữ liệu liên quan đến bệnh thƣờng gặp ở trẻ em

- Mong muốn mở rộng thêm với một số quan hệ khác nhƣ : loại bệnh – chế độ dinh dƣỡng, ...

70

Các hướng nghiên cứu và phát triển tiếp theo là:

- Tiến hành thực nghiệm với nhiều thuật toán học khác để tìm ra thuật toán phù hợp nhất với phân lớp câu hỏi tiếng Việt. Tìm ra thuật toán để đánh giá độ tƣơng đồng của tập mẫu đƣợc chính xác hơn.

- Xây dựng phần mềm liên kết với Internet để có thể cảnh báo tới những ngƣời làm cha làm mẹ biết đƣợc ổ dịch bệnh nào đang bùng phát để có cách phòng tránh kịp thời. Đồng thời hoàn thiện hệ thống để có thể đáp ứng nhu cầu thực tế của ngƣời dùng.

71

TÀI LIỆU THAM KHẢO

1. Askjeeves: http://askjeeves.com/, last visited Sept. 2016

2. Anh Kim Nguyen, Huong Thanh Le (2008), Natural Language Interface Construction using Semantic Grammars, The 10th Pacific Rim International Conference on Artificial Intelligence (PRICAI), Hanoi, Vietnam.

3. Brin, S. (1998), Extracting patterns and relations from the world wide web. WebDB Workshop at 6th International Conference on Extending Database Technology, EDBT ’98.

4. Cam Tu Nguyen, Xuan Hieu Phan and Thu Trang Nguyen (2010), JVnTextPro: A Java-based Vietnamese Text Processing Tool. http://jvntextpro.sourceforge.net/. 5. Eric Brill, Susan Dumais and Michele Banko (2002), An Analysis of the

AskMSR Question-Answering System, In Proceedings of Conference on Empirical Methods in Natural Language Processing (EMNLP).

6. Giuseppe Attardi, Antonio Cisternino, Francesco Formica, Maria Simi, Alessandro Tommasi (2001), PiQASso: Pisa Question Answering System, In Proceedings of TREC 2001.

7. Luiz Augusto Sangoi Pizzato (2004) Using a Trie-based Structure for Question Analysis, in Proceedings of ALTW 2004, page 25-31. Sydney, Australia, Macquarie University, ASSTA.

8. McKeown, K.R (1985) Text generation: using discourse strategies and focus constraints to generate natural language text, Cambridge University Press. 9. Chu Anh Minh (2009), Bài toán trích xuất từ khoá cho trang web áp dụng

phƣơng pháp phân tích thẻ html và đồ thị web, khóa luận tốt nghiệp đại học chính qui ngành CNTT, Đại học Công nghệ.

10. Nguyễn Đức Vinh (2009) Phân tích câu hỏi trong hệ thống hỏi đáp tiếng Việt, khóa luận tốt nghiệp đại học chính qui ngành CNTT, Đại học Công nghệ.

Một phần của tài liệu Ứng dụng trích rút thông tin vào xây dựng hệ thống hỏi đáp từ tập dữ liệu dạng văn bản (Trang 70 - 73)

Tải bản đầy đủ (PDF)

(73 trang)