... phân loại văn bản tiếng Việt gồm a)Đặc trưng văn bản: bao gồm tìm dãy từ phổ biến trong tập ngữ liệu văn bản và tạo đồ thị đồng hiện nhằm xác lập nghĩa của từ đặc trưng b) Tạo luật phân lớp văn ... văn bản. Bài báo được tổ chức như sau: 1) Giới thiệ u 2) Bài toán tìm tập phổ biến và luật kết hợp 3) Phân lớp văn bản bằng luật kết hợp 4) Tạo vector đặc trưng cho văn bản 5) Xây dựng bộ phân ... DỤNG TẬP PHỔ BIẾN VÀ LUẬT KẾT HỢP VÀO BÀI TOÁN PHÂN LOẠI VĂN BẢN TIẾNG VIỆT CÓ XEM XÉT NGỮ NGHĨA Đỗ Phúc Trung tâm Phát triển Công nghệ Thông tin, ĐHQG-HCM (Bài nhận ngày 25 tháng 08 năm 2005,
Ngày tải lên: 22/07/2014, 10:22
... đề tài phân loại văn cho thấy cải tiến việc phân loại văn tiếng Việt Việc thử nghiệm cải thiện kết việc phân loại văn tiếng Việt so với phương pháp truyền thống mạng học sâu Phân loại văn tự ... dụng cho phân loại văn tiếng Việt [18] Bộ phân loại có khả tự động điều chỉnh tham số để tối ưu hóa hiệu suất phân loại Tuy nhiên, so với ngôn ngữ tiếng Anh, phân loại văn cho tiếng Việt cho ... nhãn phân loại lên văn dựa mức độ tương tự văn so với văn gán nhãn tập huấn luyện Bài báo sử dụng để giải số vấn đề phân loại đề tài văn bản, phân loại nhận xét tích cực - tiêu cực,… Phân loại văn
Ngày tải lên: 19/11/2020, 08:15
Sự ảnh hưởng của phương pháp tách từ trong bài toán phân lớp văn bản tiếng Việt
... nghiên cứu so sánh ảnh hƣởng phƣơng pháp tách từ tiếng Việt hiệu phân lớp toán phân loại văn tiếng Việt Kết thực nghiệm tập liệu văn gồm 6000 văn thuộc 10 chủ đề trang báo điện tử vnexpress.net ... tạo nên từ ghép SỰ ẢNH HƢỞNG CỦA PHƢƠNG PHÁP TÁCH TỪ TRONG BÀI TOÁN PHÂN LỚP VĂN BẢN TIẾNG VIỆT 670 II TÁCH TỪ TIẾNG VIỆT Từ tiếng Việt, từ đơn (một âm tiết), cịn có từ ghép (đa âm tiết), khơng ... nghiên cứu so sánh ảnh hƣởng phƣơng pháp tách từ tiếng Việt hiệu phân lớp toán phân loại văn tiếng Việt Các kết thực nghiệm tập liệu văn gồm 6000 văn thuộc 10 chủ đề trang báo điện tử vnexpress.net
Ngày tải lên: 26/11/2020, 00:04
Tiếp cận học không giám sát trong học có giám sát với bài toán phân lớp văn bản tiếng việt và đề xuất cải tiến công thức tính độ liên quan giữa hai văn bản trong mô hình véctơ
... CỨU CỦA LUẬN VĂN - BÀI TOÁN PHÂN LỚP VĂN BẢN TIẾNG VIỆT 59 4.1 Khai phá liệu văn tiếng Việt 60 4.2 Các đặc trưng tiếng Việt 60 4.2.1 Các đơn vị tiếng Việt ... 61 4.2.2 Các đặc điểm tả văn tiếng Việt 61 4.2.3 Từ tiếng Việt .62 4.2.4 Các chuẩn Font tiếng Việt sử dụng 63 4.3 Bài toán phân lớp văn tiếng Việt 64 4.4 Kết ... 66 CHƯƠNG - ĐỀ XUẤT VÀ LỰA CHỌN GIẢI PHÁP TIẾP CẬN BÀI TOÁN PHÂN LỚP VĂN BẢN TIẾNG VIỆT 67 5.1 Đề xuất hai hướng tiếp cận toán 68 5.1.1 Hướng tiếp cận theo phương pháp học
Ngày tải lên: 22/01/2021, 09:16
Tiếp cận học không giám sát trong học có giám sát với bài toán phân lớp văn bản tiếng việt
... CỨU CỦA LUẬN VĂN - BÀI TOÁN PHÂN LỚP VĂN BẢN TIẾNG VIỆT 59 4.1 Khai phá liệu văn tiếng Việt 60 4.2 Các đặc trưng tiếng Việt 60 4.2.1 Các đơn vị tiếng Việt ... 61 4.2.2 Các đặc điểm tả văn tiếng Việt 61 4.2.3 Từ tiếng Việt .62 4.2.4 Các chuẩn Font tiếng Việt sử dụng 63 4.3 Bài toán phân lớp văn tiếng Việt 64 4.4 Kết ... 66 CHƯƠNG - ĐỀ XUẤT VÀ LỰA CHỌN GIẢI PHÁP TIẾP CẬN BÀI TOÁN PHÂN LỚP VĂN BẢN TIẾNG VIỆT 67 5.1 Đề xuất hai hướng tiếp cận toán 68 5.1.1 Hướng tiếp cận theo phương pháp học
Ngày tải lên: 13/02/2021, 07:12
Tiếp cận học không giám sát trong học có giám sát với bài toán phân lớp văn bản tiếng việt
... CỨU CỦA LUẬN VĂN - BÀI TOÁN PHÂN LỚP VĂN BẢN TIẾNG VIỆT 59 4.1 Khai phá liệu văn tiếng Việt 60 4.2 Các đặc trưng tiếng Việt 60 4.2.1 Các đơn vị tiếng Việt ... 61 4.2.2 Các đặc điểm tả văn tiếng Việt 61 4.2.3 Từ tiếng Việt .62 4.2.4 Các chuẩn Font tiếng Việt sử dụng 63 4.3 Bài toán phân lớp văn tiếng Việt 64 4.4 Kết ... 66 CHƯƠNG - ĐỀ XUẤT VÀ LỰA CHỌN GIẢI PHÁP TIẾP CẬN BÀI TOÁN PHÂN LỚP VĂN BẢN TIẾNG VIỆT 67 5.1 Đề xuất hai hướng tiếp cận toán 68 5.1.1 Hướng tiếp cận theo phương pháp học
Ngày tải lên: 28/02/2021, 00:12
Nghiên cứu các phương pháp học sâu cho bài toán phân loại văn bản tin tức tiếng việt luận văn thạc sĩ công nghệ thông tin
... CHO BÀI TOÁN PHÂN LOẠI VĂN BẢN TIN TỨC TIẾNG VIỆT LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN ĐỒNG NAI – NĂM 2022 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC LẠC HỒNG NGHIÊN CỨU CÁC PHƯƠNG PHÁP HỌC SÂU CHO BÀI ... HỒNG NGHIÊN CỨU CÁC PHƯƠNG PHÁP HỌC SÂU CHO BÀI TOÁN PHÂN LOẠI VĂN BẢN TIN TỨC TIẾNG VIỆT Chuyên ngành: Công nghệ thông tin Mã số: 8480201 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN ĐỒNG NAI – NĂM 2022 ... chương trình ứng dụng minh họa phân loại tin tức văn tiếng Việt 14 Hình 5.2 Trang giao diện người dùng nhập vào nội dung văn tin tức để mơ hình xác định chủ đề văn 14 Hình 5.3 Kết
Ngày tải lên: 14/03/2023, 08:23
Tìm hiểu các hướng tiếp cận bài toán phân loại văn bản và xây dựng phần mềm phân loại tin tức báo điện tử - 2 ppsx
... trong phân loại văn bản Hai mô hình sự kiện trong phân loại văn bản bằng Naïve Bayes Bài toán phân loại tin tức điện tử tiếng Việt Kết quả 62 Chương 5 BÀI TOÁN... ... ở Việt Nam, tác giả luôn trình bày nội dung tóm tắt (abstract) của bài báo trước bài viết chi tiết, nên hướng phân loại. .. tách từ để phân loại, chúng em phải xử lý văn bản ... để phân loại văn bản 5 .2 Thuật toán Naïve Bayes Theo tác giả Mitchell (20 05), thuật toán phân loại Naïve Bayes có đặc điểm nổi bật là có khả năng giảm độ phức tạp tính toán
Ngày tải lên: 12/08/2014, 10:20
phân loại văn bản tiếng việt sử dụng phương pháp máy hỗ trợ vector (support vector machine – svms)
... nghiệp Phân loại văn bản tiếng Việt sử dụng phương pháp SVMs 1.1.3 Bài toán phân loại văn bản Phân loại văn bản là quy trình gán một tài liệu văn. .. văn bản ... phá dữ liệu văn bản, đặc biệt là bài toán phân loại văn bản Đây là những nền tảng cơ bản của các bài toán xử lý văn bản nói chung và bài toán phân loại văn bản nói riêng ... liệu văn bản 2 1.1.3 Bài toán phân loại văn bản 4 1.1.4 Các khó khăn trong khai phá dữ liệu văn bản 4 1.2 Tiền xử lý và biểu diễn văn bản tiếng việt. 5 1.2.1 Tiền xử lý văn bản tiếng Việt
Ngày tải lên: 05/11/2014, 18:39
BÀI TẬP LỚN MÔN XỬ LÝ NGÔN NGỮ TỰ NHIÊN Tìm hiểu về bài toán phân loại văn bản và thu thập thông tin
... loại văn bản tiếng Việt và thu thập thông tin từ văn bản tiếng Việt 3.2.1 Bài toán phân loại văn bản tiếng Việt Cần xây dựng một hệ thống có thể phân loại được ... - Ilya Baraev PHÂN CÔNG CÔNG VIỆC 1 Lan+Khánh: Tìm hiểu bài toán phân loại văn bản và phân loại văn bản Tiếng Việt 2 Lương+Phương: Tìm hiểu bài toán thu thập ... một loại thông tin nào ví dụ như kiểu văn bản, hình ảnh, âm thanh Tuy nhiên, ở đây chúng ta chỉ đề cập đến việc thu thập văn bản bởi văn bản. .. là bài toán phân loại
Ngày tải lên: 13/08/2015, 15:24
Nghiên cứu lý thuyết Naive Bayes và ứng dụng trong phân loại văn bản tiếng Việt
... CÁC BẢNG vi Chƣơng 1: TỔNG QUAN VỀ PHÂN LOẠI VĂN BẢN 1.1 Giới thiệu toán phân loại văn tiếng Việt 1.1.1 Tổng quan toán phân loại văn 1.1.2 Mô hình hệ thống phân loại ... tiếng Anh nhƣ Phân loại văn bản do nhóm tác giả Phạm Nguyên Khang,... năng của hệ thống phân loại văn bản tự động 1.1 Giới thiệu bài toán phân loại văn bản tiếng Việt ... Naive Bayes ứng dụng phân loại văn Tiếng Việt” nhằm tìm hiểu thử nghiệm phƣơng pháp phân loại văn áp dụng tiếng Việt Phân loại văn (Text classification) công cụ khai phá liệu dạng văn cách hữu hiệu,
Ngày tải lên: 18/01/2016, 14:31
Nghiên cứu lý thuyết naive bayes và ứng dụng trong phân loại văn bản tiếng việt
... LOẠI VĂN BẢN 1.1 Giới thiệu toán phân loại văn tiếng Việt 1.1.1 Tổng quan toán phân loại văn 1.1.2 Mô hình hệ thống phân loại văn 1.1.3 Các khái niệm phân loại văn ... của hệ thống phân loại văn bản tự động 1.1 Giới thiệu bài toán phân loại văn bản tiếng Việt 1.1.1 Tổng... | ∑ = | | | | Bảng1.2 Đánh giá phân loại văn bản Trong đó: ... Mô hình bài toán phân loại văn bản được mô tả như hình sau: Hình 1.1 Quá trình học phân loại văn bản Một... TỔNG QUAN VỀ PHÂN LOẠI VĂN BẢN Trong chương này, luận văn trình
Ngày tải lên: 12/05/2016, 10:47
Nghiên cứu lý thuyết naive bayes và ứng dụng trong phân loại văn bản tiếng việt
... CÁC BẢNG vi Chƣơng 1: TỔNG QUAN VỀ PHÂN LOẠI VĂN BẢN 1.1 Giới thiệu toán phân loại văn tiếng Việt 1.1.1 Tổng quan toán phân loại văn 1.1.2 Mô hình hệ thống phân loại văn ... tiếng Anh nhƣ Phân loại văn bản do nhóm tác giả Phạm Nguyên Khang,... năng của hệ thống phân loại văn bản tự động 1.1 Giới thiệu bài toán phân loại văn bản tiếng Việt ... Naive Bayes ứng dụng phân loại văn Tiếng Việt” nhằm tìm hiểu thử nghiệm phƣơng pháp phân loại văn áp dụng tiếng Việt Phân loại văn (Text classification) công cụ khai phá liệu dạng văn cách hữu hiệu,
Ngày tải lên: 18/09/2016, 22:07
Phan loai van ban tieng viet voi bo phan loai vecto ho tro svm
... dụng SVM vào phân loại văn tiếng Việt Những thí nghiệm nhằm kiểm chứng khả phân loại SVM văn tiếng Việt Đồng thời xác định tham số SVM thích hợp cho phân lớp xác định toán phân loại văn hoàn toàn ... ưu hóa hiệu suất phân loại chí không gian đặc trưng có số chiều cao Bộ phân loại SVM tỏ phù hợp cho phân loại văn Trong thử nghiệm với toán phân loại văn tiếng Việt, độ xác phân loại 80,72% chấp ... phân bố tài liệu phân nhóm không ảnh hưởng tới phân bố tài liệu phân nhóm khác Giả thiết đặt để chuyển toán phân loại nhiều phân lớp thành toán phân loại hai phân lớp Bộ phân loại SVM huấn luyện
Ngày tải lên: 04/10/2016, 20:30
Nghiên cứu bài toán phân lớp văn bản tiếng Việt
... học cho việc xử lý liệu 2.2 Bài toán phân lớp văn Phân lớp văn xem trình gán văn vào hay nhiều lớp văn xác định trước Người ta phân lớp văn cách thủ công, tức đọc văn gán vào nhóm phù hợp Cách ... thuật toán phân lớp văn Ở đây, em đề xuất hai thuật toán là: thuật toán định (Decision Tree) thuật toán k-NN Cả hai thuật toán cho kết tốt dùng để phân lớp văn So với thuật toán định, thuật toán ... xử lý sau Tách tiếng: cần có từ điển tiếng để mã hóa văn bản, sau mã hóa ký tự, thành văn tiếng, văn biểu diễn dạng chuỗi tiếng (đã mã hóa theo số có từ điển tiếng) xếp Ngoài tiếng có từ điển,...
Ngày tải lên: 30/12/2015, 18:35
Nghiên cứu bài toán phân lớp văn bản tiếng việt
... học cho việc xử lý liệu 2.2 Bài toán phân lớp văn Phân lớp văn xem trình gán văn vào hay nhiều lớp văn xác định trước Người ta phân lớp văn cách thủ công, tức đọc văn gán vào nhóm phù hợp Cách ... thuật toán phân lớp văn Ở đây, em đề xuất hai thuật toán là: thuật toán định (Decision Tree) thuật toán k-NN Cả hai thuật toán cho kết tốt dùng để phân lớp văn So với thuật toán định, thuật toán ... sai xử lý sau Tách tiếng: cần có từ điển tiếng để mã hóa văn bản, sau mã hóa ký tự, thành văn tiếng, văn biểu diễn dạng chuỗi tiếng (đã mã hóa theo số có từ điển tiếng) xếp Ngồi tiếng có từ điển,...
Ngày tải lên: 02/08/2016, 22:05
tìm hiểu các hướng tiếp cận bài toán phân loại văn bản và xây dựng phần mềm phân loại tin tức báo điện tử
... cho toán phân loại văn xây dựng ứng dụng phân loại tin tức báo điện tử” nhằm tìm hiểu thử nghiệm phương pháp phân loại văn áp dụng tiếng Việt Để thực việc phân loại, điều bắt buộc tiếng Việt ... 87 Bảng Bốn trường hợp phân loại văn .90 Bảng Kết phân loại văn cho chủ đề 94 Bảng Bảng kho liệu viết chưa đăng 102 Bảng Bảng mô tả ô xử lý mơ hình DFD hành .103 Bảng Bảng ... phân loại văn tách từ tiếng Việt nay; chương trình bày hướng tiếp cận luận văn phân loại văn tách từ tiếng Việt; chương cuối trình bày hệ thống thử nghiệm văn bản, ứng dụng vào phân loại tin tức...
Ngày tải lên: 12/04/2013, 14:29
TÌM HIỂU CÁC HƯỚNG TIẾP CẬN BÀI TOÁN PHÂN LOẠI VĂN BẢN VÀ XÂY DỰNG PHẦN MỀM PHÂN LOẠI TIN TỨC BÁO ĐIỆN TỬ
... cho toán phân loại văn xây dựng ứng dụng phân loại tin tức báo điện tử” nhằm tìm hiểu thử nghiệm phương pháp phân loại văn áp dụng tiếng Việt Để thực việc phân loại, điều bắt buộc tiếng Việt ... 87 Bảng Bốn trường hợp phân loại văn .90 Bảng Kết phân loại văn cho chủ đề 94 Bảng Bảng kho liệu viết chưa đăng 102 Bảng Bảng mô tả ô xử lý mơ hình DFD hành .103 Bảng Bảng ... phân loại văn tách từ tiếng Việt nay; chương trình bày hướng tiếp cận luận văn phân loại văn tách từ tiếng Việt; chương cuối trình bày hệ thống thử nghiệm văn bản, ứng dụng vào phân loại tin tức...
Ngày tải lên: 26/04/2013, 16:57
ỨNG DỤNG CÁC PHƯƠNG PHÁP HỌC NỬA GIÁM SÁT VÀO BÀI TOÁN PHÂN LOẠI VĂN BẢN
... Bài tốn phân loại văn bản, thực chất, có thể xem là bài tốn phân lớp (Text Classification). Phân loại văn bản tự động là việc gán các nhãn phân loại lên một văn bản mới dựa trên mức độ tương tự của văn bản đó so với các văn bản đã được ... khoảng cách càng gần) và lấy ra k văn bản đầu tiên trong mảng (tức là k văn bản gần với văn bản cần phân lớp nhất). Khởi tạo mảng A có độ dài bằng số phân lớp để lưu số văn bản của mỗi lớp. Duyệt qua k văn bản, đếm số văn bản trong từng phân lớp và lưu vào mảng. ... nhất là đối với phân loại văn bản tiếng Anh. Tuy vậy, các nghiên cứu và ứng dụng đối với văn bản tiếng Việt còn nhiều hạn chế do khó khăn về tách từ và câu. Bài tốn phân lớp dữ liệu là bài tốn có mục tiêu nhằm giải quyết vấn đề là ...
Ngày tải lên: 24/05/2014, 09:04
Bạn có muốn tìm thêm với từ khóa: