Mục lục
Danh mục các ký hiệu và chữ viết tắt
Danh mục các bảng
Danh mục các hình vẽ, đồ thị
MỞ ĐẦU
Chương 1. GIỚI THIỆU
1.1. Hệ thống hỏi đáp tự động
1.1.1. Giới thiệu
1.1.2. Một số vấn đề cần quan tâm
1.1.3. Kiến trúc hệ thống
1.2. Bài toán phân lớp câu hỏi
1.2.1. Giới thiệu
1.2.2. Taxonomy câu hỏi
1.3. Mục tiêu của luận văn
Chương 2. CƠ SỞ LÝ THUYẾT
2.1. Các loại đặc trưng của câu hỏi
2.1.1. Đặc trưng từ vựng
2.1.2. Đặc trưng cú pháp
2.1.3. Đặc trưng ngữ nghĩa
2.2. Mô hình biểu diễn câu hỏi
2.2.1. Phương pháp biểu diễn Boolean
2.2.2. Các phương pháp biểu diễn dựa trên tần số
2.3. Một số phương pháp phân lớp câu hỏi
2.3.1. Máy véc-tơ hỗ trợ (Support Vector Machine)
2.3.2. Cực đại hóa Entropy (Maximum Entropy)
2.4. Xây dựng bộ phân lớp câu hỏi
2.4.1. Mô hình phân lớp câu hỏi
2.4.2. Trích chọn đặc trưng cho phân lớp câu hỏi
2.5. Mô hình phân tích chủ đề ẩn
2.5.1. Giới thiệu về LDA
2.5.2. Phân tích chủ đề ẩn với LDA
2.5.3. Ví dụ một số chủ đề ẩn được sinh ra bởi LDA
Chương 3. LÀM GIÀU ĐẶC TRƯNG CHO CÂU HỎI
3.1. Ý tưởng của phương pháp làm giàu
3.2. Phương pháp làm giàu đặc trưng
3.3. Cài đặt thuật toán cho phương pháp
3.3.1. Lấy dữ liệu từ Internet
3.3.2. Lựa chọn các chủ đề ẩn
3.3.3. Làm giàu các câu hỏi
Chương 4. THỰC NGHIỆM VÀ ĐÁNH GIÁ
4.1. Môi trường thực nghiệm
4.1.1. Phần cứng
4.1.2. Phần mềm
4.2. Dữ liệu thực nghiệm
4.3. Các bước tiến hành thực nghiệm
4.4. Kết quả thực nghiệm
4.4.1. Phân lớp với tập dữ liệu ban đầu
4.4.2. Phân lớp với tập dữ liệu đã được làm giàu
4.5. Đánh giá
KẾT LUẬN
TÀI LIỆU THAM KHẢO