... chính xác. Cách viết của tiếng Việt trong các văn bản tiếng Việt trên Internet rất đa dạng và phong phú. Vì vậy, đôi khi thông tin viết trong các văn bản tiếng Việt trên Internet không thật ... của văn bản. Tiếng Việt có nhiều cách viết, cách thể hiện nội dung nên quá trình trích rút thông tin từ các văn bản tiếng Việt gặp nhiều khó khăn hơn trong các văn bản tiếng Anh. Trong luận văn, ... những văn bản viết đúng, đầy đủ các tiền tố và quy tắc trình bày của thực thể tên. 5 thực thể tên trong các văn bản tiếng Việt còn gặp nhiều khó khăn hơn so với bài toán trong các văn bản tiếng...
Ngày tải lên: 17/02/2014, 09:46
Bước đầu khảo sát tình hình viết địa danh nước ngoài trên một số văn bản tiếng Việt hiện nay
... danh đối với các văn bản tiếng Việt khác. Cách viết địa danh trên các bản đồ vì thế là vấn đề được lưu tâm từ trước tới nay. Tuy nhiên, trên thực tế cách viết địa danh trên các bản đồ vẫn chưa ... ngoài trên một số văn bản tiếng Việt hiện nay PHẦN MỞ ĐẦU 1. Lí do chọn đề tài Địa danh là một phạm trù lịch sử. Địa danh phản ánh nhiều khía cạnh địa lý, lịch sử, văn hoá . Địa danh được xem ... xúc giữa tiếng Việt và các ngôn ngữ phương Tây mà những âm /p/ và /r/ vào tiếng Việt và ngày nay chúng ta gọi /pari/ (paris) chứ không gọi là /bazi/ cho hợp với âm vốn có của tiếng Việt. Ngày...
Ngày tải lên: 06/04/2013, 10:22
Bước dầu khảo sát tình hình viết địa danh nước ngoài trên một số văn bản tiếng việt hiện nay
... địa danh trên một số văn bản tiếng Việt hiện nay Chương 3. Đánh giá tình hình địa danh nước ngoài trên các văn bản, giải pháp và kiến nghị. THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN 39 loại báo. Bảng 9 ... III ĐÁNH GIÁ TÌNH HÌNH ĐỊA DANH TRÊN CÁC VĂN BẢN, GIẢI PHÁP VÀ KIẾN NGHỊ 1. Tổng kết, so sánh và đánh giá tình hình viết địa danh trên các văn bản tiếng Việt hiện nay Qua chương 2, chúng ... chung và đồng nhất cho các bản đồ để định 2. Một số ý kiến về vấn đề chuẩn hoá địa danh nước ngoài trên các văn bản tiếng Việt 2.1. Những qui định của quốc tế và Việt Nam về cách viết địa...
Ngày tải lên: 07/04/2013, 10:34
Quản lý nội dung và khám phá tri thức trên bản đồ văn bản tiếng việt
Ngày tải lên: 25/12/2013, 12:32
Tài liệu Một ý kiến nhỏ về cách ghi dấu thanh trên văn bản tiếng Việt doc
... Một ý kiến nhỏ về cách ghi dấu thanh trên văn bản tiếng Việt 1. Những nguyên tắc chung Vấn đề cải cách giáo dục, sự phát triển của tin học… ... cũng như in ấn được thuận lợi. Tiếng Việt thì khác, âm tiết ngoài cấu trúc mở còn có cấu trúc không mở, cho nên, nếu dùng chữ cái để thể hiện thanh điệu như tiếng H'mông thì sẽ gây nhầm ... bản của thanh điệu trong âm tiết. Ví dụ: gà, ngã, đặc, tính… 1.2. Nguyên tắc hợp lí Xuất phát từ đặc điểm riêng, mỗi ngôn ngữ có một cách thể hiện thanh điệu khác nhau. Chẳng hạn, trong tiếng...
Ngày tải lên: 13/02/2014, 09:20
Tra cứu văn bản tiếng việt dựa trên kỹ thuật phân cụm
... CỨU VĂN BẢN TIẾNG VIỆT DỰA TRÊN KỸ THUẬT PHÂN CỤM. Trong chương này, luận văn giới thiệu các phương pháp biểu diễn văn bản, đồng thời trình bày chi tiết một phương pháp biểu diễn văn bản tiếng ... Việt dựa trên tập dữ liệu văn bản tiếng Việt đã được phân cụm. 2.1 Phương pháp biểu diễn văn bản 2.1.1 Khái niệm Biểu diễn văn bản là phương pháp mô tả nội dung hoặc đặc trưng của văn bản [1]. ... Kỹ thuật phân cụm văn bản tiếng Việt dựa trên thuật toán phân cấp 2.2.1 Phân cụm văn bản 2.2.1.1 Khái niệm phân cụm văn bản Định nghĩa: Thuật toán phân cụm nhóm tập các văn bản vào các tập...
Ngày tải lên: 17/02/2014, 09:46
Báo cáo nghiên cứu khoa học: "NGHIÊN CỨU ỨNG DỤNG TẬP PHỔ BIẾN VÀ LUẬT KẾT HỢP VÀO BÀI TOÁN PHÂN LOẠI VĂN BẢN TIẾNG VIỆT CÓ XEM XÉT NGỮ NGHĨA" pdf
... loại văn bản tiếng Việt gồm a)Đặc trưng văn bản: bao gồm tìm dãy từ phổ biến trong tập ngữ liệu văn bản và tạo đồ thị đồng hiện nhằm xác lập nghĩa của từ đặc trưng b) Tạo luật phân lớp văn bản. ... xử lý theo số văn bản và ngưỡng minsupp Độ chính xác của kết quả phân lớp được trình bày trong bảng 3. Bảng 3: Độ chính xác của kết quả phân lớp Số văn bản huấn luyện Số văn bản kiểm tra ... TẠO VECTƠ ĐẶC TRƯNG VĂN BẢN 4.1. Tìm dãy từ phổ biến Thuật toán tìm tập phổ biến được ứng dụng để tìm dãy từ phổ biến trong tập dữ liệu gồm nhiều văn bản. Mỗi văn bản được xem là một giao tác....
Ngày tải lên: 22/07/2014, 10:22
Trích chọn tự động quan hệ phương thức từ văn bản tiếng Việt dựa trên thuật toán SVM và thử nghiệm đánh giá
Ngày tải lên: 20/08/2014, 09:47
Phát hiện kế thừa văn bản tiếng Việt dựa trên từ vựng và từ điển đồng nghĩa
Ngày tải lên: 20/08/2014, 09:51
Ứng dụng xử lý ngôn ngữ tự nhiên trong hệ tìm kiếm thông tin trên văn bản tiếng Việt
Ngày tải lên: 23/03/2015, 15:38
Tìm kiếm văn bản tiếng việt
... án tốt nghiệp Tìm kiếm văn bản tiếng ViÖt II. MỘT SỐ KỸ THUẬT KHAI PHÁ DỮ LIỆU VĂN BẢN 1. Biểu diễn văn bản Như chúng ta đã biết, bài toán khai phá dữ liệu văn bản là đi phát hiện các tri ... các bài toán làm việc trên một tập lớn các tài liệu như phân lớp văn bản, phân loại văn bản, tìm kiếm văn bản do đó mối tương quan giữa các từ chiết xuất được và tập văn bản phải được lưu ý đến. ... diện cho văn bản một cách chính xác và đặc trưng cho văn bản. Việc trích lọc các từ đại diện cho văn bản là một khâu quan trọng trong việc giải quyết bài toán khai phá dữ liệu văn bản. Mô...
Ngày tải lên: 02/11/2012, 13:53
Phương pháp thêm dấu tiếng việt vào văn bàn tiếng việt không dấu
Ngày tải lên: 10/11/2012, 08:13
Luận văn tốt nghiệp Xử lý các văn bản tiếng Việt
... 6. S1 4 nil S1/1 7. S2 5 nil N2/1 Bảng 3. Quá trình phân tích từ trên xuống Bảng 5. Tập luật của văn phạm tiếng Việt 48 Bảng 6. Tập luật của văn phạm tiếng Anh 50 Khoá luận tốt nghiệp ... pháp tiếng Anh. Trong phần phụ lục của khoá luận em sẽ trình bày chi tiết bài toán tách từ vựng tiếng Việt. Chương 4. Xây dựng văn phạm tiếng Việt Khoá luận tốt nghiệp 47 4.2.5. Văn phạm tiếng ... một câu tiếng Việt nhập nhằng 62 Hình 19. Cây phân tích ứng với cách tách từ đúng 62 Danh mục bảng Bảng 1. Phân tích từ trên xuống, ưu tiên chiều sâu cho văn phạm phi ngữ cảnh 15 Bảng 2....
Ngày tải lên: 23/11/2012, 08:08
Tìm kiếm văn bản tiếng Việt
... các kỹ thuật khai phá dữ liệu văn bản khác, giải quyết các bài toán làm việc trên một tập lớn các tài liệu như phân lớp văn bản, phân loại văn bản, tìm kiếm văn bản do đó mối tương quan giữa ... dụng một hàm thống kê cho điểm trên các từ. Hàm này gán điểm cho mỗi từ dựa trên tần xuất của từ đó trên toàn bộ văn bản nói chung và phân bố xác xuất trên mỗi văn bản nói riêng. Chúng ta sẽ tiến ... liệu văn bản sẽ được trình bầy ở phần sau. 2. Các kỹ thuật khai phá Các bài toán thường được quan tâm trong khai phá dữ liệu văn bản là Phân loại văn bản (text categorization), Phân lớp văn bản...
Ngày tải lên: 05/04/2013, 15:56
Phát triển bộ công cụ hỗ trợ xây dựng kho ngữ liệu cho phân tích văn bản tiếng Việt
... 2009. Học viên Lưu Văn Tăng 4 Luận văn tốt nghiệp Chương 2. Các công cụ phân tích văn bản tiếng Việt Trong chương này em giới thiệu một số công cụ phân tích văn bản tiếng Việt đã có áp dụng ... một văn bản tiếng Việt bất kỳ. Hãy phân tách văn bản đó ra thành các đơn vị câu độc lập. Bài toán tách câu đặt ra với mục đích xây dựng công cụ tự động tách các câu trong một văn bản tiếng Việt ... máy tính. - Tóm tắt văn bản: Từ một văn bản dài, máy tính tóm tắt thành văn bản ngắn hơn với những nội dung cơ bản nhất. - Dịch tự động: Là việc dịch tự động từ tiếng này sang tiếng khác, chẳng...
Ngày tải lên: 12/04/2013, 15:44
XÂY DỰNG ỨNG DỤNG TÓM LƯỢC TỰ ĐỘNG VĂN BẢN TIẾNG VIỆT
... bài toán phân lớp văn bản 1.4.2. Bài toán Phân nhóm văn bản Bài toán Phân nhóm văn bản (Text Clustering) có điểm khác so với bài toán Phân lớp văn bản ở chỗ cho một tập văn bản chưa được phân ... nhiên cũng như các đặc trưng ngôn ngữ tiếng Việt cần thiết cho bài toán Tóm tắt văn bản tiếng Việt. Các vấn đề cơ bản của Xử lý ngôn ngữ tự nhiên trong tiếng Việt đã được nêu ra và sẽ được giải ... Như vậy, Tóm tắt văn bản đã ra đời trước khi có sự ra đời của Khai phá văn bản ! Và khi Khai phá văn bản ra đời, dựa trên những đặc điểm của nó, người ta mới xếp Tóm tắt văn bản vào lĩnh vực...
Ngày tải lên: 24/04/2013, 22:05