Nghiên cứu phân lớp tự động văn bản báo chí tiếng Việt về tài nguyên và môi trường

80 1.1K 0
Nghiên cứu phân lớp tự động văn bản báo chí tiếng Việt về tài nguyên và môi trường

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

. Đề tài " ;Nghiên cứu phân lớp tự động văn bản báo chí tiếng Việt về tài nguyên và môi trường& quot;, học viên vận dụng những kiến thức về kỹ thuật khai phá văn bản, kỹ thuật phân lớp văn bản. văn bản báo chí tiếng việt về tài nguyên và môi trường vào các chủ đề chuyên ngành. 10 Đầu vào của bộ phân lớp là văn bản báo chí tiếng Việt về tài nguyên và môi trường ở dạng tệp tin.doc,.txt,. toán phân lớp văn bản báo chí tiếng Việt về tài nguyên và môi trường. Chương này trình bày đặc điểm cơ bản của tiếng Việt, kỹ thuật tách từ văn bản tiếng Việt, tìm hiểu thông tin chuyên ngành tài

Ngày đăng: 25/03/2015, 10:01

Từ khóa liên quan

Mục lục

  • MỤC LỤC

  • DANH MỤC CÁC HÌNH

  • MỞ ĐẦU

  • 1.1. KHAI PHÁ DỮ LIỆU VĂN BẢN

  • 1.2. KHÁI NIỆM CƠ BẢN TRONG KHAI PHÁ VĂN BẢN

  • 1.2.1. Một số khái niệm sử dụng trong luận văn

  • 1.2.2. Các phương pháp đánh trọng số cho từ khóa

  • 1.3. MỘT SỐ PHƯƠNG PHÁP BIỂU DIỄN VĂN BẢN

  • 1.3.1. Mô hình Boolean

  • 1.3.2. Mô hình không gian vector

  • 1.3.3. Mô hình xác suất

  • 1.3.4. Mô hình LSI

  • 1.4. PHƯƠNG PHÁP LỰA CHỌN TỪ TRONG BIỂU DIỄN VĂN BẢN

  • 1.4.1. Loại bỏ từ dừng

  • 1.4.2. Thu gọn đặc trưng biểu diễn

  • 1.5. ĐỘ LIÊN QUAN GIỮA CÁC VĂN BẢN

  • 1.6. PHÂN LỚP VĂN BẢN

  • 1.7. THUẬT TOÁN K LÁNG GIỀNG GẦN NHẤT (KNN)

  • 2.1. MỘT SỐ ĐẶC ĐIỂM TIẾNG VIỆT

  • 2.1.1. Âm tiết

Tài liệu cùng người dùng

Tài liệu liên quan