MỤC LỤC
MỞ ĐẦU
DANH MỤC TỪ VIẾT TẮT
DANH MỤC BẢNG BIỂU
DANH MỤC HÌNH VẼ
Chương I TỔNG QUAN
I.1 Lược sử về trích chọn thông tin
I.1.1 Tính cần thiết của trích chọn thông tin
I.1.2 IE với ngôn ngữ tự nhiên
I.1.3 Một số hệ IE trong thời kỳ đầu
I.2 Xây dựng các hệ trích chọn thông tin
I.2.1 Phương pháp xây dựng hệ trích chọn thông tin
I.2.2 Kiến trúc của hệ trích chọn thông tin
I.3 Phương pháp đánh giá hệ thống
I.4 Bài toán trích chọn tên riêng
I.5 Kết luận
Chương II CÁC KIẾN THỨC NỀN TẢNG VỀ
HỌC THỐNG KÊ
II.1 Mô hình Markov ẩn (HMMs)
II.1.1 Tổng quan về HMMs
II.1.2 Thuật toán gán nhãn triagram HMMs
II.1.3 Một số hạn chế của HMMs
II.2 Conditional Random Field trong bài toán trích chọn
thông tin
II.2.1 Từ HMMs đến CRFs
II.2.2 Định nghĩa CRF
II.2.3 Thuật toán gán nhãn cho dữ liệu dạng chuỗi
II.2.4 Các phương pháp tối ưu số
II.2.5 CRF có thể giải quyết được các vấn đề lable bias
II.3 Perceptron trong bài toán trích chọn thông tin
II.3.1 Thuật toán percepton
II.3.2 Vectơ đặc trưng cục bộ và toàn cục
II.3.3 Thuật toán perceptron cho bài toán gán nhãn dữ liệu
dạng chuỗi
II.3.4 Biến thể của thuật toán perceptron trong bài toán gán
nhãn dữ liệu dạng chuỗi
II.3.5 Chứng minh tính hội tụ của thuật toán perceptron
II.4 Kết luận
Chương III XÂY DỰNG HỆ THỐNG TRÍCH CHỌN
TÊN RIÊNG CHO VĂN BẢN TIẾNG VIỆT
III.1 Môi trương thưc nghiêm
III.2 Hê thông trích chọn tên riêng cho tiêng Viêt
III.3 Các tham số huấn luyện và đánh giá thực nghiệm
III.3.1 Huấn luyện
III.3.2 Kiểm tra
III.4 Lưa chon cac thuôc tinh
III.4.1 File huấn luyện
III.4.2 File mẫu:
KẾT LUẬN
Tài liệu tham khảo