042 Phân loại văn bản tiếng Việt

Phát triển bộ công cụ hỗ trợ xây dựng kho ngữ liệu cho phân tích văn bản tiếng Việt

Phát triển bộ công cụ hỗ trợ xây dựng kho ngữ liệu cho phân tích văn bản tiếng Việt

... tìm kiếm thông tin, phân tích văn bản cho tổng hợp tiếng nói, mô hình ngôn ngữ trong nhận dạng tiếng nói…). 1.2. Một số bài toán cơ bản phân tích văn bản Phân tích văn bản là một bài toán ... một văn bản tiếng Việt bất kỳ. Hãy phân tách văn bản đó ra thành các đơn vị câu độc lập. Bài toán tách câu đặt ra với mục đích xây dựng công cụ tự động tách các câu...
Ngày tải lên : 12/04/2013, 15:44
  • 43
  • 1.4K
  • 13
042_Phân loại văn bản tiếng Việt

042_Phân loại văn bản tiếng Việt

... TBL) 4. Bài toán phân loại văn bản Tiếng Việt Xét bài toán phân loại văn bản Tiếng Việt, cho một văn bản bất kỹ hãy xác định chủ đề của văn bản đó dựa trên một tập gồm 200 văn bản. 5. Thực Nghiệm ... liên quan đến phân loại văn bản như: các phương pháp phân loại văn bản Tiếng Anh, các phương pháp tách từ Tiếng Việt, và cách tiến hành đi v...
Tài liệu VẤN ĐỀ GÁN NHÃN TỪ LOẠI CHO VĂN BẢN TIẾNG VIỆT pdf

Tài liệu VẤN ĐỀ GÁN NHÃN TỪ LOẠI CHO VĂN BẢN TIẾNG VIỆT pdf

... hợp tiếng nói, các hệ thống nhận dạng tiếng nói cũng như trong các hệ thống dịch máy. Đối với các văn bản Việt ngữ, việc gán nhãn từ loại có nhiều khó khăn, đặc biệt là bản thân việc phân loại ... các văn bản được gán nhãn mẫu, làm tăng chất lượng bộ gán nhãn. Kho dữ liệu này cũng đặc biệt hữu ích cho việc nghiên cứu văn phạm tiếng Việt. Việc nghiên cứu văn...
Ngày tải lên : 10/12/2013, 04:15
  • 11
  • 733
  • 1
Nghiên cứu giải pháp và xây dựng phần mềm thử nghiệm chuyển các dòng văn bản tiếng việt trong hình ảnh sang văn bản dạng text báo cáo nghiên cứu khoa học giáo viên

Nghiên cứu giải pháp và xây dựng phần mềm thử nghiệm chuyển các dòng văn bản tiếng việt trong hình ảnh sang văn bản dạng text báo cáo nghiên cứu khoa học giáo viên

... nhận dạng của chúng ta là một hình ảnh scan từ một văn bản tiếng Việt hoặc một tập tin hình ảnh chứa văn bản tiếng Việt bất kì. Đầu ra là một văn bản đã được nhận dạng. Để xử lý được điều này hệ ... chuyển các dòng văn bản tiếng việt trong hình ảnh sang văn bản dạng text” tập trung vào việc trình bày một quy trình tổng quát để giải quyết bài toán nhận dạng v...
Ngày tải lên : 18/12/2013, 14:25
  • 49
  • 891
  • 0
Nghiên cứu gán nhãn từ loại cho văn bản tiếng việt bằng phương pháp học máy không có hướng dẫn

Nghiên cứu gán nhãn từ loại cho văn bản tiếng việt bằng phương pháp học máy không có hướng dẫn

... từ loại hay không. Công việc gán nhãn từ loại cho một văn bản là xác định từ loại của mỗi từ trong phạm vi văn bản đó. Các công cụ gán nhãn (hay chú thích) từ loại cho các từ trong một văn bản ... Toán tin; Gán nhãn từ loại; Văn bản tiếng Việt; Máy tính Content MỞ ĐẦU Một trong các vấn đề nền tảng của ngôn ngữ tự nhiên là việc phân loại các từ thành cá...
Ngày tải lên : 10/02/2014, 20:19
  • 13
  • 1.2K
  • 2
NHẬN BIẾT CÁC LOẠI THỰC THỂ TRONG VĂN BẢN TIẾNG VIỆT NHẰM HỖ TRỢ WEB NGỮ NGHĨA VÀ TÌM KIẾM HƯỚNG THỰC THỂ

NHẬN BIẾT CÁC LOẠI THỰC THỂ TRONG VĂN BẢN TIẾNG VIỆT NHẰM HỖ TRỢ WEB NGỮ NGHĨA VÀ TÌM KIẾM HƯỚNG THỰC THỂ

... dụng như tên một địa danh? Bài toán nhận biết loại thực thể trong các văn bản tiếng Việt còn gặp nhiều khó khăn hơn so với bài toán này trong tiếng Anh vì một số nguyên nhân như sau:  Thiếu ... chỉ mục là các loại thực thể. Hệ thống nhận diện loại thực thể cho tiếng Việt sẽ làm tiền đề cho việc giải quyết các bài toán về trích chọn thông tin từ các tài liệu tiếng...
Ngày tải lên : 16/02/2014, 03:00
  • 58
  • 2K
  • 2
Tra cứu văn bản tiếng việt dựa trên kỹ thuật phân cụm

Tra cứu văn bản tiếng việt dựa trên kỹ thuật phân cụm

... văn bản 2.2 Kỹ thuật phân cụm văn bản tiếng Việt dựa trên thuật toán phân cấp 2.2.1 Phân cụm văn bản 2.2.1.1 Khái niệm phân cụm văn bản Định nghĩa: Thuật toán phân cụm nhóm tập các văn bản ... tài “Tra cứu văn bản tiếng Việt dựa trên kỹ thuật phân cụm”. Các đóng góp của luận văn - Nghiên cứu, cải tiến một số phương pháp tra cứu đối với văn...
Ngày tải lên : 17/02/2014, 09:46
  • 26
  • 478
  • 1