CHƯƠNG 4 : THIẾT KẾ VÀ XÂY DỰNG GIAO DIỆN CHO CHATBOT
4.2 Một số thư viện Python hỗ trợ luận văn
4.2.3 Thư viện NLU
4.2.3.1 Giới thiệu
NLTK là một nền tảng hàng đầu để xây dựng các chương trình Python để làm việc với dữ liệu ngơn ngữ của con người. Nó cung cấp các giao diện dễ sử dụng cho hơn 50 tài nguyên ngữ liệu và từ vựng như Mạng từ, cùng với một bộ thư viện xử lý văn bản để phân loại, mã hóa, tạo gốc, gắn thẻ, phân tích cú pháp và lập luận ngữ nghĩa, trình bao bọc cho các thư viện NLP cơng nghiệp, và một diễn đàn thảo luận tích cực .
Nhờ hướng dẫn thực hành giới thiệu các nguyên tắc cơ bản về lập trình cùng với các chủ đề trong ngơn ngữ học tính tốn, cùng với tài liệu API tồn diện, NLTK phù hợp với các nhà ngôn ngữ học, kỹ sư, sinh viên, nhà giáo dục, nhà nghiên cứu và người dùng trong ngành. NLTK có sẵn cho Windows, Mac OS X và Linux. Hơn hết, NLTK là một dự án miễn phí, mã nguồn mở, hướng tới cộng đồng.
NLTK đã được gọi là “một công cụ tuyệt vời để giảng dạy và làm việc trong ngơn ngữ học tính tốn sử dụng Python” và “một thư viện tuyệt vời để chơi với ngôn ngữ tự nhiên.”
SVTH: LÊ TRUNG KIÊN 68 Xử lý ngôn ngữ tự nhiên với Python cung cấp giới thiệu thực tế về lập trình để xử lý ngơn ngữ. Được viết bởi những người tạo ra NLTK, nó hướng dẫn người đọc các nguyên tắc cơ bản của việc viết chương trình Python, làm việc với kho ngữ liệu, phân loại văn bản, phân tích cấu trúc ngơn ngữ và hơn thế nữa. Phiên bản trực tuyến của cuốn sách đã được cập nhật cho Python 3 và NLTK 3.
Thực hiện lệnh sau để cài đặt thư viện: pip install nltk
Một số chức năng chính của NLTK:
- Mã hóa và gắn thẻ một số văn bản - Xác định các thực thể được đặt tên: