... thời định hướng cách xử lý địa danh đối với các văn bản tiếng Việt khác. Cách viết địa danh trên các bản đồ vì thế là vấn đề được lưu tâm từ trước tới nay. Tuy nhiên, trên thực tế cách viết địa ... không có trong tiếng Việt, âm /r/ chỉ tồn tại vi t cách l mt õm ca phng ng nhng do một qúa trình tiếp xúc giữa tiếng Việt và các ngôn ngữ phương Tây mà những âm /p/ và /r/ vào tiếng Việt và ngày ... tiếp Chủ yếu phiên theo tiếng Hán và cách đọc Hán Việt “Ngày 17. 2 tại Hà Nội, ngài Ha- tô- ri, đại sứ Nhật Bản tại Việt Nam và GS Nguyễn Trọng Nhân, chủ tịch hội Nhãn Khoa Việt Nam cùng ký kết...
Ngày tải lên: 06/04/2013, 10:22
... một cách xử lý chung và đồng nhất cho các bản đồ để định 2. Một số ý kiến về vấn đề chuẩn hoá địa danh nước ngoài trên các văn bản tiếng Việt 2.1. Những qui định của quốc tế và Việt Nam về cách ... trong từng văn bản cụ thể. Bước 3. So sánh, đối chiếu cách xử lý địa danh trên các văn bản. Từ đó đánh giá sự không thống nhất trong cách viết địa danh. Trong đề tài này, chúng tôi chọn cách ghi ... một văn bản. Vì vậy, chúng ta cần nhận thấy rằng để thống nhất cách viết địa danh trên tất cả các văn bản thì phải việc trước tiên là cần phải thống nhất cách viết ngay trong bản thân từng văn...
Ngày tải lên: 07/04/2013, 10:34
Tài liệu Một ý kiến nhỏ về cách ghi dấu thanh trên văn bản tiếng Việt doc
... Một ý kiến nhỏ về cách ghi dấu thanh trên văn bản tiếng Việt 1. Những nguyên tắc chung Vấn đề cải cách giáo dục, sự phát triển của tin học… trong những ... tác viết và đánh máy cũng như in ấn được thuận lợi. Tiếng Việt thì khác, âm tiết ngoài cấu trúc mở còn có cấu trúc không mở, cho nên, nếu dùng chữ cái để thể hiện thanh điệu như tiếng H'mông ... bản của thanh điệu trong âm tiết. Ví dụ: gà, ngã, đặc, tính… 1.2. Nguyên tắc hợp lí Xuất phát từ đặc điểm riêng, mỗi ngôn ngữ có một cách thể hiện thanh điệu khác nhau. Chẳng hạn, trong tiếng...
Ngày tải lên: 13/02/2014, 09:20
Trích chọn tự động quan hệ phương thức từ văn bản tiếng Việt dựa trên thuật toán SVM và thử nghiệm đánh giá
Ngày tải lên: 20/08/2014, 09:47
Tìm kiếm văn bản tiếng việt
... án tốt nghiệp Tìm kiếm văn bản tiếng ViÖt II. MỘT SỐ KỸ THUẬT KHAI PHÁ DỮ LIỆU VĂN BẢN 1. Biểu diễn văn bản Như chúng ta đã biết, bài toán khai phá dữ liệu văn bản là đi phát hiện các tri ... diện cho văn bản một cách chính xác và đặc trưng cho văn bản. Việc trích lọc các từ đại diện cho văn bản là một khâu quan trọng trong việc giải quyết bài toán khai phá dữ liệu văn bản. Mô ... dữ liệu văn bản, em đã lựa chọn đề tài: “Tìm kiếm văn bản tiếng Việt . Với đề tài này em đi sâu vào nghiên cứu việc tìm kiếm văn bản tiếng Việt sử dụng lý thuyết tập thô tập thô dung sai (Tolerance...
Ngày tải lên: 02/11/2012, 13:53
Phương pháp thêm dấu tiếng việt vào văn bàn tiếng việt không dấu
Ngày tải lên: 10/11/2012, 08:13
Luận văn tốt nghiệp Xử lý các văn bản tiếng Việt
... 6. S1 4 nil S1/1 7. S2 5 nil N2/1 Bảng 3. Quá trình phân tích từ trên xuống Bảng 5. Tập luật của văn phạm tiếng Việt 48 Bảng 6. Tập luật của văn phạm tiếng Anh 50 Khoá luận tốt nghiệp ... pháp tiếng Anh. Trong phần phụ lục của khoá luận em sẽ trình bày chi tiết bài toán tách từ vựng tiếng Việt. Chương 4. Xây dựng văn phạm tiếng Việt Khoá luận tốt nghiệp 47 4.2.5. Văn phạm tiếng ... một câu tiếng Việt nhập nhằng 62 Hình 19. Cây phân tích ứng với cách tách từ đúng 62 Danh mục bảng Bảng 1. Phân tích từ trên xuống, ưu tiên chiều sâu cho văn phạm phi ngữ cảnh 15 Bảng 2....
Ngày tải lên: 23/11/2012, 08:08
Tìm kiếm văn bản tiếng Việt
... trên một tập lớn các tài liệu như phân lớp văn bản, phân loại văn bản, tìm kiếm văn bản do đó mối tương quan giữa các từ chiết xuất được và tập văn bản phải được lưu ý đến. Ngưỡng kết hợp mà ... liệu văn bản sẽ được trình bầy ở phần sau. 2. Các kỹ thuật khai phá Các bài toán thường được quan tâm trong khai phá dữ liệu văn bản là Phân loại văn bản (text categorization), Phân lớp văn bản ... trong tiếng Việt có thể là một tiếng hay gồm nhiều tiến. Hơn nữa, trong tiếng Việt những từ nhiều tiếng có thể được ghép bởi những tiếng hay từ khác có nghĩa. Ví dụ như hai từ chỉ một tiếng...
Ngày tải lên: 05/04/2013, 15:56
Phát triển bộ công cụ hỗ trợ xây dựng kho ngữ liệu cho phân tích văn bản tiếng Việt
... 2009. Học viên Lưu Văn Tăng 4 Luận văn tốt nghiệp Chương 2. Các công cụ phân tích văn bản tiếng Việt Trong chương này em giới thiệu một số công cụ phân tích văn bản tiếng Việt đã có áp dụng ... một văn bản tiếng Việt bất kỳ. Hãy phân tách văn bản đó ra thành các đơn vị câu độc lập. Bài toán tách câu đặt ra với mục đích xây dựng công cụ tự động tách các câu trong một văn bản tiếng Việt ... máy tính. - Tóm tắt văn bản: Từ một văn bản dài, máy tính tóm tắt thành văn bản ngắn hơn với những nội dung cơ bản nhất. - Dịch tự động: Là việc dịch tự động từ tiếng này sang tiếng khác, chẳng...
Ngày tải lên: 12/04/2013, 15:44
XÂY DỰNG ỨNG DỤNG TÓM LƯỢC TỰ ĐỘNG VĂN BẢN TIẾNG VIỆT
... bài toán phân lớp văn bản 1.4.2. Bài toán Phân nhóm văn bản Bài toán Phân nhóm văn bản (Text Clustering) có điểm khác so với bài toán Phân lớp văn bản ở chỗ cho một tập văn bản chưa được phân ... nhiên cũng như các đặc trưng ngôn ngữ tiếng Việt cần thiết cho bài toán Tóm tắt văn bản tiếng Việt. Các vấn đề cơ bản của Xử lý ngôn ngữ tự nhiên trong tiếng Việt đã được nêu ra và sẽ được giải ... biệt là ở Việt Nam, khi Khai phá văn bản mới được chúng ta quan tâm tới trong khoảng chục năm trở lại đây. Các bài toán điển hình của Khai phá văn bản như Phân lớp văn bản, Phân nhóm văn bản hiện...
Ngày tải lên: 24/04/2013, 22:05
ỨNG DỤNG MÔ HÌNH DỊCH MÁY THỐNG KÊ CHO BÀI TOÁN BỎ DẤU CHO VĂN BẢN TIẾNG VIỆT
... song ngữ : Văn bản tiếng Việt không dấu Văn bản tiếng Việt có dấu Dữ liệu đơn ngữ Văn bản tiếng Việt có dấu Xây dựng mô hình ngôn ngữ Xây dựng mô hình dịch Dịch máy Đánh giá kết ... trên văn bản. Đối với các thứ tiếng Châu Âu, ta có thể dễ dàng nhận ra một từ, do các từ đƣợc phân cách bởi khoảng trắng. Điều này lại không đúng với tiếng Việt. Trong tiếng Việt, các tiếng_ hay ... Hinh 1.2.1-1 Thêm dấu tiếng Việt tự động bằng AMPad 11 Hình 1.2.2-2 Gõ tiếng Việt không dấu trên VietPad 12 Hình 1.2.3-3 Văn bản sau khi thực hiện chức năng thêm dấu tiếng Việt của VietPad 12...
Ngày tải lên: 26/04/2013, 11:47
Tìm kiếm văn bản tiếng Việt
... phục vụ tìm kiếm văn bản 69 5 LỜI MỞ ĐẦU 1 PHẦN I. CƠ SỞ LÝ THUYẾT 3 I.TIẾNG VIỆT VÀ NGỮ PHÁP TIẾNG VIỆT___________________3 1.Tính chính xác của văn bản tiếng Việt 3 2. Từ tiếng Việt 4 2.1. Từ ... VĂN BẢN TIẾNG VIỆT 56 1.1 Tổ chức từ điển 56 1.2. Tổ chức cơ sở dữ liệu văn bản 57 1.3. Xác định các từ khoá trong văn bản 58 MỤC LỤC MỤC LỤC 1 Hình 1: Mô hình xác định từ đại diện cho văn bản ... v)} end Đồ án tốt nghiệp Tìm kiếm văn bản tiếng ViÖt 2.2 Bảng tần xuất. Giả sử D là tập hợp của N văn bản, T là tập hợp của M term xuất hiện trong các văn bản D. Bảng tần xuất (frequency table)...
Ngày tải lên: 27/04/2013, 09:14
Phát triển một số phương pháp nhận dạng ảnh văn bản Tiếng Việt
Ngày tải lên: 27/04/2013, 14:30
Phương pháp thêm tiếng việt có dấu và văn bản tiếng việt không dấu
Ngày tải lên: 04/08/2013, 15:41
042_Phân loại văn bản tiếng Việt
... Bài toán phân loại văn bản Tiếng Việt Xét bài toán phân loại văn bản Tiếng Việt, cho một văn bản bất kỹ hãy xác định chủ đề của văn bản đó dựa trên một tập gồm 200 văn bản. 5. Thực Nghiệm ... bản như: các phương pháp phân loại văn bản Tiếng Anh, các phương pháp tách từ Tiếng Việt, và cách tiến hành đi vào làm công cụ phân loại văn bản. Trong luận văn có sử dụng một số tài liệu quan ... trọng liên quan đến vấn đề phân loại văn bản. Rút ra những kinh nghiệm của bản thân [1] Nguyễn Phương Thái, Kiểm lỗi Chính tả Cảm Ngữ cảnh Tiếng Việt, Luận văn thạc sĩ, Khoa Công nghệ, 2003....
Ngày tải lên: 06/10/2013, 19:20
Tài liệu VẤN ĐỀ GÁN NHÃN TỪ LOẠI CHO VĂN BẢN TIẾNG VIỆT pdf
... các văn bản được gán nhãn mẫu, làm tăng chất lượng bộ gán nhãn. Kho dữ liệu này cũng đặc biệt hữu ích cho việc nghiên cứu văn phạm tiếng Việt. Việc nghiên cứu văn phạm trên cơ sở các văn bản ... đợi, khi xử lí các văn bản cùng một văn phong, tập mẫu càng lớn thì tỉ lệ lỗi càng giảm - Tập mẫu v ới các văn bản có văn phong khác nhau có ảnh hưởng tới kết quả gán nhãn. Bảng 1. Kết quả ... "-uy", cách ghi dấu thanh, cách viết thuật ngữ khoa học, sử dụng con chữ f, j, w, z cho các từ mượn tiếng nước ngoài, v.v.). Trên thực tế, trong các văn bản tiếng Việt vẫn không có...
Ngày tải lên: 10/12/2013, 04:15