kho ngữ liệu tiếng việt internet

Đề tài :  nghiên cứu việc xây dựng, chuẩn hóa và khai thác kho ngữ liệu từ nguồn internet cho xử lý tiếng việt

Đề tài : nghiên cứu việc xây dựng, chuẩn hóa và khai thác kho ngữ liệu từ nguồn internet cho xử lý tiếng việt

Ngày tải lên : 03/04/2014, 15:19
... văn bản tiếng Việt từ web để xây dựng kho ngữ liệu. Xây dựng công cụ thu thập tự động kho ngữ liệu từ Internet có tên là Vncopus, triển khai thu thập kho ngữ liệu thô tiếng Việt từ Internet ... Framework) cho tiếng Việt. 3. Xây dựng bộ quan hệ ngữ pháp cơ bản tiếng Việt (37 quan hệ ngữ pháp) cho hệ thống nghiên cứu từ vựng; Tích hợp kho ngữ liệu xây dựng từ Internet (kho ngữ liệu thô được ... 52 dụng cho tiếng Việt. Để sử dụng được hệ thống Sketch Engine cho tiếng Việt, cần phải xây dựng được ngữ liệu tiếng Việt bao gồm kho ngữ liệu đã tách từ và gán nhãn từ loại cùng bộ quan hệ ngữ pháp...
  • 150
  • 1.5K
  • 5
NGHIÊN CỨU VIỆC XÂY DỰNG, CHUẨN HÓA VÀ  KHAI THÁC KHO NGỮ LIỆU TỪ NGUỒN INTERNET  CHO XỬ LÝ TIẾNG VIỆT

NGHIÊN CỨU VIỆC XÂY DỰNG, CHUẨN HÓA VÀ KHAI THÁC KHO NGỮ LIỆU TỪ NGUỒN INTERNET CHO XỬ LÝ TIẾNG VIỆT

Ngày tải lên : 27/06/2014, 16:24
... chung của mô hình cho tiếng Việt 6 2.1 2.2 tiêu cho việc xây dựng và khai thác kho ngữ liệu từ Internet cho tiếng Việt 2. CHƯƠNG 2. XÂY DỰNG KHO NGỮ LIỆU THÔ TỪ INTERNET Giới thiệu ... trình bày tổng quan về kho ngữ liệu, một số kho ngữ liệu tiêu biểu trên thế giới, nghiên cứu việc xây dựng và khai thác kho ngữ liệu chuẩn, mô hình chuẩn hóa kho ngữ liệu theo tiêu chí của ... và kho ngữ liệu tiếng Việt trên hệ thống Sketch Engine là 100%, mọi truy vấn của bộ quan hệ ngữ pháp cơ bản tiếng Việt đã phù hợp với hệ thống Sketch Engine, các ngữ cảnh trong kho ngữ liệu...
  • 29
  • 342
  • 0
hệ thống tìm kiếm thông tin trên kho tài liệu tiếng Việt

hệ thống tìm kiếm thông tin trên kho tài liệu tiếng Việt

Ngày tải lên : 24/04/2013, 16:41
... thông tin tiếng Việt dựa trên các chỉ mục có cấu trúc 4.2 Vấn đề bảng mã tiếng Việt Không như tiếng Anh, tiếng Việt có rất nhiều bảng mã đòi hỏi phải xử lý. Một số công cụ tìm kiếm tiếng Việt hỗ ... thông tin tiếng Việt dựa trên các chỉ mục có cấu trúc  Giai đoạn tách từ trong tiếng Anh chỉ đơn giản dựa vào kho ng trắng, còn tiếng Việt là ngôn ngữ đơn lập, một từ có thể có nhiều tiếng. Điều ... tin tiếng Việt. 3. Các bước để xây dựng một hệ tìm kiếm thông tin. [3.2] 3.1 Tách từ tự động cho tập các tài liệu Đối với tiếng Anh, ta tách từ dựa vào kho ng trắng. Tuy nhiên đối với tiếng Việt, giai...
  • 116
  • 577
  • 1
Nghiên cứu phương pháp tự động phát hiện lỗi trong kho dữ liệu tiếng việt được chú giải từ loại

Nghiên cứu phương pháp tự động phát hiện lỗi trong kho dữ liệu tiếng việt được chú giải từ loại

Ngày tải lên : 17/02/2014, 08:47
... nhãn từ loại tiếng Việt. Tìm hiểu một số khái niệm như kho ngữ liệu, ngữ liệu vàng, ngữ liệu huấn luyện, từ, âm tiết (tiếng) và quá trình xây dựng, cách gán nhãn ở treebank tiếng Việt. Tìm ... trong kho ngữ liệu VTB, gồm các bước sau: Bước 1: Tiền xử lý kho ngữ liệu treebank tiếng Việt; Bước 2: Sử dụng công cụ gán nhãn tự động vnTagger để tách từ và gán nhãn từ loại cho kho ngữ liệu ... huấn luyện và kiểm thử trên cùng kho ngữ liệu VietTreeBank. + Kho ngữ liệu đánh giá Mô hình được huấn luyện và thử nghiệm phần gán nhãn từ loại trên kho ngữ liệu VietTreebank gồm có 10,165...
  • 23
  • 644
  • 0
Phát triển bộ công cụ hỗ trợ xây dựng kho ngữ liệu cho phân tích văn bản tiếng Việt

Phát triển bộ công cụ hỗ trợ xây dựng kho ngữ liệu cho phân tích văn bản tiếng Việt

Ngày tải lên : 12/04/2013, 15:44
... ngữ đầy đủ, lớn, chính xác và thống nhất. Kho ngữ liệu ngôn ngữ tiếng Việt cũng là một phần trong đó. Việc xây dựng bộ công cụ hỗ trợ xây dựng kho ngữ liệu VnSynAF bước đầu đã có kết quả ứng ... dựng treebank cho tiếng Việt. 3.2. Nội dung và quy trình dựng kho ngữ liệu có chú giải cú pháp (treebank) Kho ngữ liệu (treebank) là ngân hàng các câu được chú giải cấu trúc ngữ pháp. Quy trình ... quan tới việc xây dựng kho ngữ liệu cho phân tích văn bản tiếng Việt, các hướng tiếp cận để giải các bài toán đó. Chương 2 – Giới thiệu một số công cụ trong xây dựng kho ngữ liệu cho phân tích...
  • 43
  • 1.4K
  • 13
SỬ DỤNG KHO NGỮ LIỆU TRONG GIẢNG DẠY TIẾNG VIỆT

SỬ DỤNG KHO NGỮ LIỆU TRONG GIẢNG DẠY TIẾNG VIỆT

Ngày tải lên : 30/10/2014, 10:21
... Khái niệm kho ngữ liệu và ngôn ngữ học ngữ liệu Đã có không ít nhà nghiên cứu khẳng định rằng kho ngữ liệu và việc nghiên cứu kho ngữ liệu đã làm nên cuộc cách mạng về nghiên cứu ngôn ngữ, và ... ngữ học ngữ liệu trong việc giảng dạy ngôn ngữ, mà còn đưa ra các thí dụ minh hoạ cụ thể về việc sử dụng thực tế kho ngữ liệu trong giảng dạy tiếng Việt. 2. Lí do sử dụng kho ngữ liệu trong ... giới thiệu và đề xuất việc sử dụng kho ngữ liệu (corpus) trong việc dạy và học tiếng Việt qua kinh nghiệm xây dựng, sử dụng và khai thác kho ngữ liệu tiếng Việt cũng như kinh nghiệm rút ra từ...
  • 11
  • 1.1K
  • 7
Tài liệu Tiếng Việt, Dễ Mà Khó doc

Tài liệu Tiếng Việt, Dễ Mà Khó doc

Ngày tải lên : 13/12/2013, 23:15
... Tiếng Việt, Dễ Mà Khó Nguyễn Hưng Quốc Nguồn: Văn Hóa Việt Tiếng Việt vừa dễ vừa khó, đúng hơn, dễ mà lại khó. Dễ đến độ rất hiếm người Việt Nam nào cảm thấy ... Hoa, “Tìm nguồn gốc một số từ ngữ tiếng Việt qua các hiện tượng biến đổi ngữ âm”, in trong cuốn Những vấn đề văn hoá, văn học và ngôn ngữ học (nhiều tác giả), nxb Khoa Học Xã Hội, Hà Nội, 1999: ... Thế nhưng, chẳng bao lâu sau, đọc bài viết "Tìm nguồn gốc một số từ ngữ tiếng Việt qua các hiện tượng biến đổi ngữ âm" của Lê Trung Hoa, tôi lại bàng hoàng khám phá ra là chữ "làm...
  • 6
  • 442
  • 0
Tài liệu TIẾNG VIỆT - HOẠT ĐỘNG GIAO TIẾP BẰNG NGÔN NGỮ ppt

Tài liệu TIẾNG VIỆT - HOẠT ĐỘNG GIAO TIẾP BẰNG NGÔN NGỮ ppt

Ngày tải lên : 23/02/2014, 13:20
... TIẾNG VIỆT - HOẠT ĐỘNG GIAO TIẾP BẰNG NGÔN NGỮ I. Thế nào là hoạt động giao tiếp bằng ngôn ngữ: 1. Văn bản thứ nhất: - Vua Trần và các ... kiến thức cơ bản về VHVN trong tiến trình lịch sử. - Dùng ngôn ngữ viết: Từ thuật ngữ văn học, các câu văn mang đặc điểm của văn bản khoa học. Cấu tạo phức tạp, nhiều thành phần, nhiều vế nhưng ... tiện làm căn cứ giúp người đọc cảm nhận tác phẩm: hình tượng “bánh trôi nước”, từ ngữ “ trắng, tròn” , thành ngữ bảy nổi ba chìm”, “ tấm lòng son”. 4. Bài tập 5 ( trang 24): -Nhân vật giao...
  • 5
  • 1.1K
  • 0
Nghiên cứu tự do hoá ngôn ngữ thơ tiếng Việt hiện đại thế kỷ XX (trên tư liệu các tập thơ của một số tác giả)

Nghiên cứu tự do hoá ngôn ngữ thơ tiếng Việt hiện đại thế kỷ XX (trên tư liệu các tập thơ của một số tác giả)

Ngày tải lên : 04/04/2014, 17:50
... tự do hóa ngôn ngữ thơ tiếng Việt thế kỷ XX ở cấp độ bài thơ. Chơng 3. Sự tự do hóa ngôn ngữ thơ tiếng Việt thế kỷ XX ở cấp độ khổ thơ. Chơng 4. Sự tự do hóa ngôn ngữ thơ tiếng Việt thế kỷ XX ... Kỷ yếu Hội thảo khoa học Những vấn đề Ngôn ngữ học: Học tập ngôn ngữ Hồ Chí Minh- tiếng Hà nội với ngôn ngữ văn hóa Việt Nam, từ trang 362 đến trang 375. 7 đại hóa ngôn ngữ thơ gắn liền ... Ngôn ngữ thơ tiếng Việt hiện đại thế kỷ XX (trên t liệu các tập thơ của một số tác giả) Chuyên ngành: Lý luận ngôn ngữ MÃ số: 62 22 01 01 Tóm tắt luận án Tiến sĩ ngôn ngữ...
  • 15
  • 659
  • 1
tóm tắt luận án tiếng việt đặc trưng ngữ nghĩa nhóm tính từ chỉ kích thước (trên ngữ liệu tiếng nga và tiếng việt

tóm tắt luận án tiếng việt đặc trưng ngữ nghĩa nhóm tính từ chỉ kích thước (trên ngữ liệu tiếng nga và tiếng việt

Ngày tải lên : 23/08/2014, 07:43
... chiếu ngữ nghĩa của các các tính từ chỉ kích thớc ; rộng hẹp trên ngữ liệu từ điển tiếng Nga và tiếng Việt cho thấy: - Số lợng nghĩa của các cặp tính từ trên trong tiếng Nga và tiếng Việt ... Nguồn t liệu đợc sử dụng trong luận án là ngữ liệu đợc rút ra từ các từ điển đối chiếu Nga - Việt, Việt - Nga hoặc các từ điển tờng giải tiếng Nga và tiếng Việt, các giáo trình, sách giáo khoa, ... Hệ thống từ chỉ đơn vị, chỉ loại tiếng Nga và tiếng Việt có sự khác biệt. Từ chỉ đơn vị, chỉ loại của tiếng Việt phong phú, đa dạng hơn tiếng Nga: trong tiếng Việt một vật thể không gian nào...
  • 20
  • 587
  • 1
Đặc trưng ngữ nghĩa nhóm tính từ chỉ kích thước (trên ngữ liệu tiếng nga và tiếng việt bản tóm tắt tiếng anh

Đặc trưng ngữ nghĩa nhóm tính từ chỉ kích thước (trên ngữ liệu tiếng nga và tiếng việt bản tóm tắt tiếng anh

Ngày tải lên : 23/08/2014, 07:43
... (container) ; entities as human body, parts: впадина - hèc mòi (nasal cavity), ротовая полость - khoang miÖng (oral cavity), … It can be seen in the senses and uses of the two pairs of Russian- Vietnamese...
  • 23
  • 477
  • 0

Xem thêm