1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tự động trích chọn thực thể tên người trong văn bản tiếng Việt

52 778 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 52
Dung lượng 2,94 MB

Nội dung

Ngày đăng: 25/03/2015, 10:23

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[3] Douglas E. Appelt and David J. Israel (1999). Introduction to Information Extraction Technology. A Tutorial Prepared for IJCAI-99.in Artificial Intelligence Center SRI International: 1-10 Sách, tạp chí
Tiêu đề: Artificial Intelligence Center SRI International
Tác giả: Douglas E. Appelt and David J. Israel
Năm: 1999
[7] Công cụ tách từ tiếng Việt http://www.loria.fr/~lehong/tools/vnTokenizer.php Link
[8] Từ điển họ người Việt http://www.vietnamgiapha.com/view/?mnu=2 Link
[1] Nguyễn Thanh Hùng (2006). Hướng tiếp cận mới trong việc tách từ để phân loại văn bản tiếng Việt sử dụng giải thuật di truyền và thống kê trên Internet Khác
[2] Nguyễn Thị Minh Huyền, Vũ Xuân Lương, Lê Hồng Phương (2003). Sử dụng bộ gán nhãn từ loại xác suất QTAG cho văn bản tiếng Việt. Báo cáo hội thảo ICTTài liệu tiếng Anh Khác
[4] Fredric Brown (2009). Information Extraction: 10 – 18 (slide) Khác
[5] John Lafferty and Andrew McCallum (2001). Conditional Random Fields Probabilistic Models for Segmenting and Labeling Sequence Data. Pages 1-8 Khác

HÌNH ẢNH LIÊN QUAN

Hình 1. Ví dụ về một hệ thống trích chọn thông tin [4] - Tự động trích chọn thực thể tên người trong văn bản tiếng Việt
Hình 1. Ví dụ về một hệ thống trích chọn thông tin [4] (Trang 10)
Hình 2. Mô hình xây dựng hệ luật cho các hệ thống IE theo hướng tiếp cận thủ  công - Tự động trích chọn thực thể tên người trong văn bản tiếng Việt
Hình 2. Mô hình xây dựng hệ luật cho các hệ thống IE theo hướng tiếp cận thủ công (Trang 12)
Hình 3. Mô hình xây dựng IE theo mô hình học máy - Tự động trích chọn thực thể tên người trong văn bản tiếng Việt
Hình 3. Mô hình xây dựng IE theo mô hình học máy (Trang 13)
Hình 4. Quy trình tách từ - Tự động trích chọn thực thể tên người trong văn bản tiếng Việt
Hình 4. Quy trình tách từ (Trang 15)
Hình 5. Mô hình hoạt động của CRF++ - Tự động trích chọn thực thể tên người trong văn bản tiếng Việt
Hình 5. Mô hình hoạt động của CRF++ (Trang 17)
Bảng 2. Bảng các tham số huấn luyện - Tự động trích chọn thực thể tên người trong văn bản tiếng Việt
Bảng 2. Bảng các tham số huấn luyện (Trang 21)
Hình 6 mô hình hóa bài toán. Đầu vào là văn bản tiếng Việt. Hệ thống có nhiệm vụ  trích chọn thực thể tên người từ văn bản tiếng Việt đó - Tự động trích chọn thực thể tên người trong văn bản tiếng Việt
Hình 6 mô hình hóa bài toán. Đầu vào là văn bản tiếng Việt. Hệ thống có nhiệm vụ trích chọn thực thể tên người từ văn bản tiếng Việt đó (Trang 22)
Hình 7 là mô hình giải quyết bài toán theo những bước mô tả ở trên - Tự động trích chọn thực thể tên người trong văn bản tiếng Việt
Hình 7 là mô hình giải quyết bài toán theo những bước mô tả ở trên (Trang 23)
Hình 8. Mô hình hệ thống tự động trích chọn - Tự động trích chọn thực thể tên người trong văn bản tiếng Việt
Hình 8. Mô hình hệ thống tự động trích chọn (Trang 26)
Bảng 2. Trích dẫn một số họ trong từ điển họ tại Việt Nam gia phả [8] - Tự động trích chọn thực thể tên người trong văn bản tiếng Việt
Bảng 2. Trích dẫn một số họ trong từ điển họ tại Việt Nam gia phả [8] (Trang 28)
Hình 9. Format file prefix.txt - Tự động trích chọn thực thể tên người trong văn bản tiếng Việt
Hình 9. Format file prefix.txt (Trang 29)
Hình  10  là  mô  hình  thực  hiện  bước  đánh  giá  toàn  cục  theo  như  mô  tả  ở  trên. - Tự động trích chọn thực thể tên người trong văn bản tiếng Việt
nh 10 là mô hình thực hiện bước đánh giá toàn cục theo như mô tả ở trên (Trang 30)
Bảng 5. Các công cụ sử dụng trong thực nghiệm - Tự động trích chọn thực thể tên người trong văn bản tiếng Việt
Bảng 5. Các công cụ sử dụng trong thực nghiệm (Trang 34)
Hình 11. Sử dụng vnTokenizer 4.1.1 để tách từ văn bản tiếng Việt - Tự động trích chọn thực thể tên người trong văn bản tiếng Việt
Hình 11. Sử dụng vnTokenizer 4.1.1 để tách từ văn bản tiếng Việt (Trang 35)
Hình 13. Văn bản sau khi tách từ - Tự động trích chọn thực thể tên người trong văn bản tiếng Việt
Hình 13. Văn bản sau khi tách từ (Trang 36)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w