0

xem văn bản tiếng việt trên android

Trích rút thực thể từ các văn bản tiếng việt trên internet

Trích rút thực thể từ các văn bản tiếng việt trên internet

Thạc sĩ - Cao học

... chính xác. Cách viết của tiếng Việt trong các văn bản tiếng Việt trên Internet rất đa dạng và phong phú. Vì vậy, đôi khi thông tin viết trong các văn bản tiếng Việt trên Internet không thật ... của văn bản. Tiếng Việt có nhiều cách viết, cách thể hiện nội dung nên quá trình trích rút thông tin từ các văn bản tiếng Việt gặp nhiều khó khăn hơn trong các văn bản tiếng Anh. Trong luận văn, ... những văn bản viết đúng, đầy đủ các tiền tố và quy tắc trình bày của thực thể tên. 5 thực thể tên trong các văn bản tiếng Việt còn gặp nhiều khó khăn hơn so với bài toán trong các văn bản tiếng...
  • 14
  • 648
  • 0
Bước đầu khảo sát tình hình viết địa danh nước ngoài trên một số văn bản tiếng Việt hiện nay

Bước đầu khảo sát tình hình viết địa danh nước ngoài trên một số văn bản tiếng Việt hiện nay

Khoa học xã hội

... danh đối với các văn bản tiếng Việt khác.Cách viết địa danh trên các bản đồ vì thế là vấn đề được lưu tâm từ trước tới nay. Tuy nhiên, trên thực tế cách viết địa danh trên các bản đồ vẫn chưa ... ngoài trên một số văn bản tiếng Việt hiện nayPHẦN MỞ ĐẦU1. Lí do chọn đề tàiĐịa danh là một phạm trù lịch sử. Địa danh phản ánh nhiều khía cạnh địa lý, lịch sử, văn hoá . Địa danh được xem ... xúc giữa tiếng Việt và các ngôn ngữ phương Tây mà những âm /p/ và /r/ vào tiếng Việt và ngày nay chúng ta gọi /pari/ (paris) chứ không gọi là /bazi/ cho hợp với âm vốn có của tiếng Việt. Ngày...
  • 56
  • 840
  • 0
Bước dầu khảo sát tình hình viết địa danh nước ngoài trên một số văn bản tiếng việt hiện nay

Bước dầu khảo sát tình hình viết địa danh nước ngoài trên một số văn bản tiếng việt hiện nay

Khoa học xã hội

... địa danh trên một số văn bản tiếng Việt hiện nay Chương 3. Đánh giá tình hình địa danh nước ngoài trên các văn bản, giải pháp và kiến nghị. THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN 39loại báo. Bảng 9 ... III ĐÁNH GIÁ TÌNH HÌNH ĐỊA DANH TRÊN CÁC VĂN BẢN, GIẢI PHÁP VÀ KIẾN NGHỊ 1. Tổng kết, so sánh và đánh giá tình hình viết địa danh trên các văn bản tiếng Việt hiện nay Qua chương 2, chúng ... chung và đồng nhất cho các bản đồ để định 2. Một số ý kiến về vấn đề chuẩn hoá địa danh nước ngoài trên các văn bản tiếng Việt 2.1. Những qui định của quốc tế và Việt Nam về cách viết địa...
  • 58
  • 633
  • 2
Tài liệu Một ý kiến nhỏ về cách ghi dấu thanh trên văn bản tiếng Việt doc

Tài liệu Một ý kiến nhỏ về cách ghi dấu thanh trên văn bản tiếng Việt doc

Cao đẳng - Đại học

... Một ý kiến nhỏ về cách ghi dấu thanh trên văn bản tiếng Việt 1. Những nguyên tắc chung Vấn đề cải cách giáo dục, sự phát triển của tin học… ... cũng như in ấn được thuận lợi. Tiếng Việt thì khác, âm tiết ngoài cấu trúc mở còn có cấu trúc không mở, cho nên, nếu dùng chữ cái để thể hiện thanh điệu như tiếng H'mông thì sẽ gây nhầm ... bản của thanh điệu trong âm tiết. Ví dụ: gà, ngã, đặc, tính… 1.2. Nguyên tắc hợp lí Xuất phát từ đặc điểm riêng, mỗi ngôn ngữ có một cách thể hiện thanh điệu khác nhau. Chẳng hạn, trong tiếng...
  • 3
  • 488
  • 0
Tra cứu văn bản tiếng việt dựa trên kỹ thuật phân cụm

Tra cứu văn bản tiếng việt dựa trên kỹ thuật phân cụm

Thạc sĩ - Cao học

... CỨU VĂN BẢN TIẾNG VIỆT DỰA TRÊN KỸ THUẬT PHÂN CỤM. Trong chương này, luận văn giới thiệu các phương pháp biểu diễn văn bản, đồng thời trình bày chi tiết một phương pháp biểu diễn văn bản tiếng ... Việt dựa trên tập dữ liệu văn bản tiếng Việt đã được phân cụm. 2.1 Phương pháp biểu diễn văn bản 2.1.1 Khái niệm Biểu diễn văn bản là phương pháp mô tả nội dung hoặc đặc trưng của văn bản [1]. ... Kỹ thuật phân cụm văn bản tiếng Việt dựa trên thuật toán phân cấp 2.2.1 Phân cụm văn bản 2.2.1.1 Khái niệm phân cụm văn bản Định nghĩa: Thuật toán phân cụm nhóm tập các văn bản vào các tập...
  • 26
  • 478
  • 1
Báo cáo nghiên cứu khoa học:

Báo cáo nghiên cứu khoa học: "NGHIÊN CỨU ỨNG DỤNG TẬP PHỔ BIẾN VÀ LUẬT KẾT HỢP VÀO BÀI TOÁN PHÂN LOẠI VĂN BẢN TIẾNG VIỆTXEM XÉT NGỮ NGHĨA" pdf

Báo cáo khoa học

... loại văn bản tiếng Việt gồm a)Đặc trưng văn bản: bao gồm tìm dãy từ phổ biến trong tập ngữ liệu văn bản và tạo đồ thị đồng hiện nhằm xác lập nghĩa của từ đặc trưng b) Tạo luật phân lớp văn bản. ... xử lý theo số văn bản và ngưỡng minsupp Độ chính xác của kết quả phân lớp được trình bày trong bảng 3. Bảng 3: Độ chính xác của kết quả phân lớp Số văn bản huấn luyện Số văn bản kiểm tra ... TẠO VECTƠ ĐẶC TRƯNG VĂN BẢN 4.1. Tìm dãy từ phổ biến Thuật toán tìm tập phổ biến được ứng dụng để tìm dãy từ phổ biến trong tập dữ liệu gồm nhiều văn bản. Mỗi văn bản được xem là một giao tác....
  • 10
  • 598
  • 1
Tìm kiếm văn bản tiếng việt

Tìm kiếm văn bản tiếng việt

Công nghệ thông tin

... án tốt nghiệp Tìm kiếm văn bản tiếng ViÖtII. MỘT SỐ KỸ THUẬT KHAI PHÁ DỮ LIỆU VĂN BẢN 1. Biểu diễn văn bản Như chúng ta đã biết, bài toán khai phá dữ liệu văn bản là đi phát hiện các tri ... các bài toán làm việc trên một tập lớn các tài liệu như phân lớp văn bản, phân loại văn bản, tìm kiếm văn bản do đó mối tương quan giữa các từ chiết xuất được và tập văn bản phải được lưu ý đến. ... diện cho văn bản một cách chính xác và đặc trưng cho văn bản. Việc trích lọc các từ đại diện cho văn bản là một khâu quan trọng trong việc giải quyết bài toán khai phá dữ liệu văn bản. Mô...
  • 77
  • 841
  • 5
Luận văn tốt nghiệp Xử lý các văn bản tiếng Việt

Luận văn tốt nghiệp Xử lý các văn bản tiếng Việt

Công nghệ thông tin

... 6. S1 4 nil S1/1 7. S2 5 nil N2/1 Bảng 3. Quá trình phân tích từ trên xuống Bảng 5. Tập luật của văn phạm tiếng Việt 48 Bảng 6. Tập luật của văn phạm tiếng Anh 50 Khoá luận tốt nghiệp ... pháp tiếng Anh. Trong phần phụ lục của khoá luận em sẽ trình bày chi tiết bài toán tách từ vựng tiếng Việt. Chương 4. Xây dựng văn phạm tiếng Việt Khoá luận tốt nghiệp 474.2.5. Văn phạm tiếng ... một câu tiếng Việt nhập nhằng 62 Hình 19. Cây phân tích ứng với cách tách từ đúng 62 Danh mục bảng Bảng 1. Phân tích từ trên xuống, ưu tiên chiều sâu cho văn phạm phi ngữ cảnh 15 Bảng 2....
  • 63
  • 1,084
  • 4
Tìm kiếm văn bản tiếng Việt

Tìm kiếm văn bản tiếng Việt

Khoa học xã hội

... các kỹ thuật khai phá dữ liệu văn bản khác, giải quyết các bài toán làm việc trên một tập lớn các tài liệu như phân lớp văn bản, phân loại văn bản, tìm kiếm văn bản do đó mối tương quan giữa ... dụng một hàm thống kê cho điểm trên các từ. Hàm này gán điểm cho mỗi từ dựa trên tần xuất của từ đó trên toàn bộ văn bản nói chung và phân bố xác xuất trên mỗi văn bản nói riêng. Chúng ta sẽ tiến ... liệu văn bản sẽ được trình bầy ở phần sau.2. Các kỹ thuật khai pháCác bài toán thường được quan tâm trong khai phá dữ liệu văn bản là Phân loại văn bản (text categorization), Phân lớp văn bản...
  • 86
  • 445
  • 0
Phát triển bộ công cụ hỗ trợ xây dựng kho ngữ liệu cho phân tích văn bản tiếng Việt

Phát triển bộ công cụ hỗ trợ xây dựng kho ngữ liệu cho phân tích văn bản tiếng Việt

Khoa học xã hội

... 2009.Học viênLưu Văn Tăng4 Luận văn tốt nghiệpChương 2. Các công cụ phân tích văn bản tiếng Việt Trong chương này em giới thiệu một số công cụ phân tích văn bản tiếng Việt đã có áp dụng ... một văn bản tiếng Việt bất kỳ. Hãy phân tách văn bản đó ra thành các đơn vị câu độc lập.Bài toán tách câu đặt ra với mục đích xây dựng công cụ tự động tách các câu trong một văn bản tiếng Việt ... máy tính.- Tóm tắt văn bản: Từ một văn bản dài, máy tính tóm tắt thành văn bản ngắn hơn với những nội dung cơ bản nhất.- Dịch tự động: Là việc dịch tự động từ tiếng này sang tiếng khác, chẳng...
  • 43
  • 1,354
  • 13
XÂY DỰNG ỨNG DỤNG TÓM LƯỢC TỰ ĐỘNG VĂN BẢN TIẾNG VIỆT

XÂY DỰNG ỨNG DỤNG TÓM LƯỢC TỰ ĐỘNG VĂN BẢN TIẾNG VIỆT

Công nghệ thông tin

... bài toán phân lớp văn bản 1.4.2. Bài toán Phân nhóm văn bản Bài toán Phân nhóm văn bản (Text Clustering) có điểm khác so với bài toán Phân lớp văn bản ở chỗ cho một tập văn bản chưa được phân ... nhiên cũng như các đặc trưng ngôn ngữ tiếng Việt cần thiết cho bài toán Tóm tắt văn bản tiếng Việt. Các vấn đề cơ bản của Xử lý ngôn ngữ tự nhiên trong tiếng Việt đã được nêu ra và sẽ được giải ... Như vậy, Tóm tắt văn bản đã ra đời trước khi có sự ra đời của Khai phá văn bản ! Và khi Khai phá văn bản ra đời, dựa trên những đặc điểm của nó, người ta mới xếp Tóm tắt văn bản vào lĩnh vực...
  • 92
  • 1,258
  • 7
ỨNG DỤNG MÔ HÌNH DỊCH MÁY THỐNG KÊ CHO BÀI TOÁN BỎ DẤU CHO VĂN BẢN TIẾNG VIỆT

ỨNG DỤNG MÔ HÌNH DỊCH MÁY THỐNG KÊ CHO BÀI TOÁN BỎ DẤU CHO VĂN BẢN TIẾNG VIỆT

Công nghệ thông tin

... Dữ liệu đƣợc chia làm 2 loại Dữ liệu song ngữ : Văn bản tiếng Việt không dấu Văn bản tiếng Việt có dấu Dữ liệu đơn ngữ Văn bản tiếng Việt có dấu Xây dựng mô hình ngôn ngữ Xây dựng ... “từ” trên văn bản. Đối với các thứ tiếng Châu Âu, ta có thể dễ dàng nhận ra một từ, do các từ đƣợc phân cách bởi khoảng trắng. Điều này lại không đúng với tiếng Việt. Trong tiếng Việt, các tiếng_ hay ... Hinh 1.2.1-1 Thêm dấu tiếng Việt tự động bằng AMPad 11 Hình 1.2.2-2 Gõ tiếng Việt không dấu trên VietPad 12 Hình 1.2.3-3 Văn bản sau khi thực hiện chức năng thêm dấu tiếng Việt của VietPad 12...
  • 44
  • 820
  • 5

Xem thêm