... chính xác. Cách viết của tiếngViệt trong các vănbảntiếngViệt trên Internet rất đa dạng và phong phú. Vì vậy, đôi khi thông tin viết trong các vănbảntiếngViệttrên Internet không thật ... của văn bản. TiếngViệt có nhiều cách viết, cách thể hiện nội dung nên quá trình trích rút thông tin từ các vănbảntiếngViệt gặp nhiều khó khăn hơn trong các vănbảntiếng Anh. Trong luận văn, ... những vănbảnviết đúng, đầy đủ các tiền tố và quy tắc trình bày của thực thể tên. 5 thực thể tên trong các vănbảntiếngViệt còn gặp nhiều khó khăn hơn so với bài toán trong các vănbản tiếng...
... Một ý kiến nhỏ về cách ghi dấu thanh trênvănbản tiếng Việt 1. Những nguyên tắc chung Vấn đề cải cách giáo dục, sự phát triển của tin học… ... cũng như in ấn được thuận lợi. TiếngViệt thì khác, âm tiết ngoài cấu trúc mở còn có cấu trúc không mở, cho nên, nếu dùng chữ cái để thể hiện thanh điệu như tiếng H'mông thì sẽ gây nhầm ... bản của thanh điệu trong âm tiết. Ví dụ: gà, ngã, đặc, tính… 1.2. Nguyên tắc hợp lí Xuất phát từ đặc điểm riêng, mỗi ngôn ngữ có một cách thể hiện thanh điệu khác nhau. Chẳng hạn, trong tiếng...
... danh đối với các vănbảntiếngViệt khác.Cách viết địa danh trên các bản đồ vì thế là vấn đề được lưu tâm từ trước tới nay. Tuy nhiên, trên thực tế cách viết địa danh trên các bản đồ vẫn chưa ... tiếpChủ yếu phiên theo tiếng Hán và cách đọc Hán Việt “Ngày 17. 2 tại Hà Nội, ngài Ha- tô- ri, đại sứ Nhật Bản tại Việt Nam và GS Nguyễn Trọng Nhân, chủ tịch hội Nhãn Khoa Việt Nam cùng ký kết ... danh nước ngoài trên một số vănbản tiếng Việt hiện nayPHẦN MỞ ĐẦU1. Lí do chọn đề tàiĐịa danh là một phạm trù lịch sử. Địa danh phản ánh nhiều khía cạnh địa lý, lịch sử, văn hoá . Địa danh...
... địa danh trên một số vănbảntiếngViệt hiện nay Chương 3. Đánh giá tình hình địa danh nước ngoài trên các văn bản, giải pháp và kiến nghị. THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN 39loại báo. Bảng 9 ... III ĐÁNH GIÁ TÌNH HÌNH ĐỊA DANH TRÊN CÁC VĂN BẢN, GIẢI PHÁP VÀ KIẾN NGHỊ 1. Tổng kết, so sánh và đánh giá tình hình viết địa danh trên các vănbản tiếng Việt hiện nay Qua chương 2, chúng ... chung và đồng nhất cho các bản đồ để định 2. Một số ý kiến về vấn đề chuẩn hoá địa danh nước ngoài trên các vănbản tiếng Việt 2.1. Những qui định của quốc tế và Việt Nam về cách viết địa...
... CỨU VĂNBẢNTIẾNGVIỆT DỰA TRÊN KỸ THUẬT PHÂN CỤM. Trong chương này, luận văn giới thiệu các phương pháp biểu diễn văn bản, đồng thời trình bày chi tiết một phương pháp biểu diễn vănbảntiếng ... Việt dựa trên tập dữ liệu vănbảntiếngViệt đã được phân cụm. 2.1 Phương pháp biểu diễn vănbản 2.1.1 Khái niệm Biểu diễn vănbản là phương pháp mô tả nội dung hoặc đặc trưng của vănbản [1]. ... Kỹ thuật phân cụm vănbảntiếngViệt dựa trên thuật toán phân cấp 2.2.1 Phân cụm vănbản 2.2.1.1 Khái niệm phân cụm vănbản Định nghĩa: Thuật toán phân cụm nhóm tập các vănbản vào các tập...
... - Danh mục bảng biểu Bảng 1 Các nguyên âm đơn tiếngViệt và tính chất 18 Bảng 2 Các nguyên âm đôi của tiếngViệt và tính chất 19 Bảng 3 Các phụ âm tiếngViệt và tính chất 21 Bảng 4 Một cách ... học và TiếngViệt , NXB Giáo dục (2000) [2] Nguyễn Thị Hương, “Tổng hợp tiếng nói từ vănbảntiếngViệt bằng phương pháp ghép nối diphone”, (2005) [3] Đoàn Thiện Thuật, “Ngữ âm tiếngViệt , ... nguyên âm 1 25 Bảng 11 Diphone phụ âm – nguyên âm 2 25 Bảng 12 Diphone nguyên âm – phụ âm 26 Bảng 13 Khai báo các carrier 27 Bảng 14 Ví dụ ánh xạ phone tiếngViệt sang phone tiếng Anh 28 ...
... dụng bộ luật Jape cho vănbảntiếngViệt có thể dùng được. Sau khi hệ thống đã hình thành, chúng tôi sử dụng nó để gán nhãn tự động cho vănbản (một tập văn bản) . Tập văn bản được gán nhãn tự ... trang web tiếng Việt. Quá trình rút trích thông tin của VN-KIM IE được thực hiện qua các bước: Quy chuẩn các vănbảntrên web về một loại mã tiếng Việt. Trích ra các khối vănbản mang thông ... định dạng vănbản như: xml, pdf, text v.v… Nhận dạng thực thể trong vănbảnTiếngViệt Nguyễn Bá Đạt vi Danh sách bảng Bảng 3.1 – Minh họa về nhãn (annotation) 14 Bảng 5.1 –...
... án tốt nghiệp Tìm kiếm vănbảntiếng ViÖtII. MỘT SỐ KỸ THUẬT KHAI PHÁ DỮ LIỆU VĂNBẢN 1. Biểu diễn văn bản Như chúng ta đã biết, bài toán khai phá dữ liệu vănbản là đi phát hiện các tri ... các bài toán làm việc trên một tập lớn các tài liệu như phân lớp văn bản, phân loại văn bản, tìm kiếm vănbản do đó mối tương quan giữa các từ chiết xuất được và tập vănbản phải được lưu ý đến. ... diện cho văn bản một cách chính xác và đặc trưng cho văn bản. Việc trích lọc các từ đại diện cho văn bản là một khâu quan trọng trong việc giải quyết bài toán khai phá dữ liệu văn bản. Mô...