... dựng hệ thống TómtắtvăntiếngViệt sử dụng kỹ thuật lượng giá, thống kê thuộc văn Ví dụ: Một hai câu văn bản, đoạn văn có khả cao để tạo tómtắt Một vài câu gần cuối văn bẳn, đoạn văn có giá trị ... xử lý văn chiếm vai trò quan trọng Khai thác văn Nó bước mở đầu cho hướng giải toán Các bước cho q trình tiền xử lý văntiếngViệt trình bày 3.1 Phươngpháp tách thuật ngữ tiếngViệt Từ vănban ... Xây dựng hệ thống TómtắtvăntiếngViệt sử dụng kỹ thuật lượng giá, thống kê CHƯƠNG II CÁC PHƯƠNG ÁN GIẢI QUYẾT BÀI TỐN TĨM TẮTVĂNBẢN Trước vào phân tích cụ thể số phươngpháp thực TTVB, cần...
... lý tómtắt đa văn tốn tómtắt phức tạp Chính phươngpháptómtắtvăn đời phươngpháptómtắtchovăn đơn Các phươngpháp nhằm giải toántómtắtvăn đơn tập trung vào hai loại tómtắt là: tómtắt ... nhiều loại tómtắt khác nhiên hai loại tómtắttómtắt đơn văntómtắt đa văn quan tâm lớn nhà nghiên cứu tómtắt tự động 2.2 Khái qt tómtắtvăn bản: Bài tốn tómtắtvăn đơn giống tốn tómtắt khác, ... tf*idf phươngpháp chủ yếu Một vấn đề thách thức quan tâm năm gần tốn tómtắtvăn tự động đưa kết tómtắtcho tập văn liên quan với mặt nội dung hay gọi tómtắtvăntiếngViệtBài tốn tómtắtvăn tiếng...
... PHƢƠNG PHÁPTÓMTẮTVĂNBẢNTIẾNGVIỆT DỰA TRÊN NAIVE BAYES 18 2.1 Một số phươngpháptómtắtvăn điển hình 18 2.1.1 Phươngpháptómtắtvăn định 18 2.1.2 Phươngpháptómtắtvăn ... VÀ TÓMTẮTVĂNBẢNTIẾNGVIỆT Trong chương này, luận văn trình bày khái niệm tổng quan tómtắtvăntómtắtvăntiếng Việt, kỹ thuật tómtắtvăn dựa máy học như: Naïve Bayes, Cây định, phươngpháp ... tuyến tómtắt - Xây dựng tập liệu huấn luyện gồm 200 văntiếngViệt Luận văn đƣợc chia thành chƣơng với nội dung sau: Chương 1: Tổng quan tómtắttómtắtvăntiếngViệt Chương 2: Phươngpháptóm tắt...
... loại tómtắttómtắt đơn văntómtắt đa văn quan tâm lớn nhà nghiên cứu tómtắt tự động 1.4 Tómtắt đơn vănBài tốn tómtắtvăn đơn giống toántómtắt khác, q trình tómtắt tự động với đầu vào văn ... đa văn tốn tómtắt phức tạp Đó nguyên nhân lý giải cho việc phươngpháptómtắtvăn đời phươngpháptómtắt đơn văn Các phươngpháp nhằm giải tốn tómtắtvăn đơn tập trung vào hai loại tómtắt ... tốn tómtắtvăn tự động, tómtắtvăn sử dụng phươngpháp trích rút Chương 2: Tómtắtvăn sử dụng Text Rank, trình bày chi tiết phươngpháptómtắtvăn Text Rank Đồng thời áp dụng phương pháp...
... VÀ TÓMTẮTVĂNBẢNTIẾNGVIỆT Trong chương này, luận văn trình bày khái niệm tổng quan tómtắtvăntómtắtvăntiếng Việt, kỹ thuật tómtắtvăn dựa máy học như: Naïve Bayes, Cây định, phươngpháp ... tuyến tómtắt - Xây dựng tập liệu huấn luyện gồm 200 văntiếngViệt Luận văn chia thành chương với nội dung sau: Chương 1: Tổng quan tómtắttómtắtvăntiếngViệt Chương 2: Phươngpháptómtắtvăn ... tómtắtvăntiếngViệt quan tâm nghiên cứu phát triển nhóm xử lý ngơn ngữ tự nhiên tiếngViệt nước (JAIST) Luận văn đưa đặc điểm ngôn ngữ tiếng Việt, số phươngpháptómtắtvăn đánh giá tóm tắt...
... đáp hệ thống Nhập trực tiếp: 1.Chọn văn cần tómtắt Hiện thị nội dung văn Chọn tỉ lệ tómtắt Cập nhật tỉ lệ tómtắt 5.Chọn tómtắt Thực tómtắt hiển thị văntómtắt Giảng viên hướng dẫn: TS Nguyễn ... cho câu - Lặp tómtắt tự động đạt tính tương đương với tómtắt thủ cơng: Tính điểm cho câu để tạo tómtắtchovăn ngữ liệu dựa vào đặc trưng hình thái Từ so sánh tómtắt tạo tự động với tómtắt ... chung, tómtăt hướng truy vấn + Theo miền liệu: Tómtắt miền liệu, tómtắt thể loại, tómtắt độc lập + Theo mức độ chi tiết: Tómtắt tổng quan, tómtắt tập trung kiện + Theo số lượng: Tómtắt đơn văn...
... tơi tiến hành phân lớp tómtắt báo khoa học tiếngViệt lĩnh vực CNTT Chiều dài trung bình chotómtắt báo khoa học khoảng 300 từ Chúng sử dụng khoảng 2/3 số lượng mẫu cho việc huấn luyện phần ... loại Đối với tiếng Anh, có từ điển Wordnet [7] lưu trữ tập từ đồng nghĩa quan hệ ngữ nghĩa ( nghĩa rộng, nghĩa hẹp) Đối với tiếng Việt, bước đầu xây dựng hệ thống tựa Wordnet chotiếngViệt Hình ... LỚP VĂNBẢN Sau có tập luật phân lớp, thơng điệp rút trích tạo vector đặc trưng Qui trình phân lớp thực thơng qua thuật toán [2],[8] 1.1.1.1.1.1.1 Thuật toán – Tạo phân loại văn Ứng với văn mới,...
... tự từ câu Với 13 Áp dụng độ tương đồng câu chotómtắtvăntiếngViệtTómtắtvăntiếngViệt dựa vào câu truy vấn người dùng 14 Quy trình tómtắtvăn Q trình tiền xử lý Lọc nội dung chính, ... câu vào xử lý ngôn ngữ tiếngViệt Thử nghiệm thành công độ đo tốn tómtắt trang web tiếngViệt máy tìm kiếm Cải thiện kết tính toán độ đo việc xây dựng corpus tiếngViệt (kiểu WordNet) đầy ... câu Áp dụng phươngpháp nêu nêu để tính độ tương đồng câu với câu truy vấn với Wordnet tiếngViệt thô Từ thực nghiệm cho thấy = 0,85 đưa kết độ tương đồng câu cao Q trình tómtắtvăn Xếp...
... Các phươngpháptómtắtvăn khác chủ yếu cách đánh giá xác định ĐVVB quan trọng Phần lớn phươngpháptómtắtvăn cổ điển dựa kết thống kê phươngpháp dựa tần suất xuất từ (TFxIPF), phươngpháp ... nội dung văn Tùy theo phương pháp, từ ngữ quan trọng từ ngữ xuất nhiều lần văn bản, từ ngữ xuất tiêu đề văn bản, từ ngữ xuất câu đầu, câu cuối văn bản, Tuy nhiên, kết tómtắtphươngpháp dựa ... nghiên cứu gần Tómtắtvăn bản, người ta thường sử dụng phươngpháp dựa ngữ nghĩa để nâng cao độ xác Song, phạm vi tómtắtvăntiếng Việt, đến đa phần nghiên cứu sử dụng cải tiến phươngpháp dựa thống...
... hầu hết văn bản, thực tế từ lại không mang nhiều ý nghĩa tần suất xuất Một phươngpháp khác đời khắc phục nhược điểm phươngpháp TF, phươngpháp IDF b Phươngpháp dựa nghịch đảo tần suất văn (IDF ... đề tìm k văn gần Có nhiều cách đánh giá dựa độ tương tự văn bản, có cách ý nhiều nhất: Gán nhãn văn gần Theo phươngpháp này, văn xét gán nhán cho chủ đề văn có độ tương tự cao Giải pháp tương ... thuật toán phân lớp văn Ở đây, em đề xuất hai thuật toán là: thuật toán định (Decision Tree) thuật toán k-NN Cả hai thuật toáncho kết tốt dùng để phân lớp văn So với thuật toán định, thuật toán...
... trọng văncho tốn tómtắt đơn văntiếngViệt Qua đề xuất hai phươngpháptómtắtvăntiếng Việt: là, phươngpháptómtắtvăntiếngViệt dựa hệ số đặc trưng văn bản, hệ số xác định phươngpháp ... nghiên cứu Luận án: - Các phươngpháptómtắtvăn giới - Các phươngpháp đánh giá tómtắtvăn - Các phươngpháptómtắtvăntiếngViệt - Các đặc trưng quan trọng văntiếngViệt - Các giải thuật tối ... phươngpháp xác định thơng qua q trình học văntómtắt mẫu phươngpháp học máy Phươngpháp nghiên cứu - Dựa phươngpháptómtắtvăn giới nước - Dựa phân tích hạn chế phươngpháptómtắtvăn tiếng...
... hầu hết văn bản, thực tế từ lại không mang nhiều ý nghĩa tần suất xuất Một phươngpháp khác đời khắc phục nhược điểm phươngpháp TF, phươngpháp IDF b Phươngpháp dựa nghịch đảo tần suất văn (IDF ... đề tìm k văn gần Có nhiều cách đánh giá dựa độ tương tự văn bản, có cách ý nhiều nhất: Gán nhãn văn gần Theo phươngpháp này, văn xét gán nhán cho chủ đề văn có độ tương tự cao Giải pháp tương ... thuật toán phân lớp văn Ở đây, em đề xuất hai thuật toán là: thuật toán định (Decision Tree) thuật toán k-NN Cả hai thuật toáncho kết tốt dùng để phân lớp văn So với thuật toán định, thuật toán...
... Chương 2: Bài tốn tómtắt đơn vănphươngpháptómtắtvănTiếngViệt Trình bày q trình tómtắtvăn bản, hướng tiếp cận cho việc giải tốn tómtắt đơn văn Chương 3: Xây dựng hệ thống tómtắt trích ... kết cho độ đo f2 cao 2.4 Kết luận Ở chương đưa số nghiên cứu liên quan đến tómtắtvănphươngpháptómtắtvăntiếngViệt Trong chương luận văn trình bày cụ thể phươngpháptómtắtvăntiếngViệt ... cầu Tómtắt đơn vănTómtắt đa văn bản: Khi xét đầu vào hệ thống TTVB, ta chia thành hai dạng tómtắt đơn văn (SingleDocument) tómtắt đa văn (Multi-Document) Tómtắt đơn văn từ văn nguồn cho...
... PHƢƠNG PHÁP PHÂN CỤM PHÂN CẤP VÀ PHƢƠNG PHÁP SOM 2.1 Phươngpháp phân cụm phân cấp Phươngpháp phân cụm phân cấp phươngpháp phân cụm, đối tượng liệu gom vào cụm có cấu trúc dạng Trong phƣơng pháp ... giá trị điều kiện dừng kết thúc thuật toán điều kiện dừng 2.4.2 Thuật toán HSOM toán hỗ trợ kinh doanh Thuật toán HSOM thuật toán phù hợp cho việc giải toán phân loại khách hàng triển vọng đánh ... phạm vi luận văn này, việc kết hợp hai phƣơng pháp SOM Hierachical Clustering để tạo bƣớc việc phân cụm liệu đƣợc gọi tắt thuật toán HSOM Nội dung thuật toán HSOM nhƣ sau: Input: cho tập vector...
... (P1) đạt ~90% dùng phươngpháp gán nhãn dựa văn phong kết hợp với phươngpháp xác suất (P2) Bảng cho ta kết gán nhãn chovăn bản, văn phong khác 2.4.2 Các nghiên cứu dựa phươngpháp học máy Nghiên ... hiểu phươngpháp gán nhãn từ loại tiếng Anh cho thấy hướng tiếp cận dựa theo phươngpháp học máy cho kết tốt phươngpháp cơng bố Nội dung khóa luận tập trung so sánh ba phươngpháp học máy cho ... DỤNG CHOBÀI TỐN GÁN NHÃN TỪ LOẠI TIẾNGVIỆT Việc khảo sát phươngpháp học máy áp dụng thành công cho nhiều ngôn ngữ (chủ yếu khảo sát phươngpháp sử dụng cho ngôn ngữ tiêu biểu tiếng Anh, tiếng...
... (P1) đạt ~90% dùng phươngpháp gán nhãn dựa văn phong kết hợp với phươngpháp xác suất (P2) Bảng cho ta kết gán nhãn chovăn bản, văn phong khác 2.4.2 Các nghiên cứu dựa phươngpháp học máy Nghiên ... hiểu phươngpháp gán nhãn từ loại tiếng Anh cho thấy hướng tiếp cận dựa theo phươngpháp học máy cho kết tốt phươngpháp cơng bố Nội dung khóa luận tập trung so sánh ba phươngpháp học máy cho ... DỤNG CHOBÀI TỐN GÁN NHÃN TỪ LOẠI TIẾNGVIỆT Việc khảo sát phươngpháp học máy áp dụng thành công cho nhiều ngôn ngữ (chủ yếu khảo sát phươngpháp sử dụng cho ngôn ngữ tiêu biểu tiếng Anh, tiếng...
... PHƢƠNG PHÁP PHÂN CỤM PHÂN CẤP VÀ PHƢƠNG PHÁP SOM 2.1 Phươngpháp phân cụm phân cấp Phươngpháp phân cụm phân cấp phươngpháp phân cụm, đối tượng liệu gom vào cụm có cấu trúc dạng Trong phƣơng pháp ... giá trị điều kiện dừng kết thúc thuật toán điều kiện dừng 2.4.2 Thuật toán HSOM toán hỗ trợ kinh doanh Thuật toán HSOM thuật toán phù hợp cho việc giải toán phân loại khách hàng triển vọng đánh ... phạm vi luận văn này, việc kết hợp hai phƣơng pháp SOM Hierachical Clustering để tạo bƣớc việc phân cụm liệu đƣợc gọi tắt thuật toán HSOM Nội dung thuật toán HSOM nhƣ sau: Input: cho tập vector...
... thuật toán xác định ngưỡng chặn ε cho sau lần lặp khơng có tâm cụm dịch chuyển khoảng cách nhỏ ε thuật toán dừng III Áp dụng giải thuật K-Means chovăn Để áp dụng giải thuật K-Means chovăn bản, ... cần phươngpháp tính khoảng cách văn dựa nội dung chúng Một phươngpháp tiếp cận phổ biến cho việc chuyển hóa văn thành điểm khơng gian tọa độ Giả sử ta có tập hợp N gồm tất từ (term) tấtvăn ... cần thiết phải làm giảm số lượng đặc trưng Có nhiều phươngpháp chọn đặc trưng hiệu Ở đây, sử dụng phươngpháp lượng tin tương hỗ Phươngpháp sử dụng độ đo lượng tin tương hỗ từ lớp tài liệu...