1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Xây dựng môi trường xử lý tiếng ê đê ứng dụng trong dạy và học tiếng ê đê (tt)

27 206 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 27
Dung lượng 1,59 MB

Nội dung

BỘ GIÁO DỤC ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG HOÀNG THỊ MỸ LỆ XÂY DỰNG MÔI TRƯỜNG XỬ TIẾNG ÊĐÊ ỨNG DỤNG TRONG DẠY HỌC TIẾNG Ê ĐÊ Chuyên ngành Mã số : KHOA HỌC MÁY TÍNH : 62 48 01 01 TÓM TẮT LUẬN ÁN TIẾN SĨ KỸ THUẬT Đà Nẵng, năm 2017 Công trình hoàn thành tại: ĐẠI HỌC ĐÀ NẴNG Người hướng dẫn khoa học: PGS.TS PHAN HUY KHÁNH Phản biện 1: ……………………………………………………… Phản biện 2: ……………………………………………………… Phản biện 3: ……………………………………………………… Luận án bảo vệ trước Hội đồng chấm luận án cấp Đại học Đà Nẵng họp tại: Đại học Đà Nẵng Vào hồi … ngày tháng ……… năm ……… Có thể tìm hiểu luận án tại: - Thư viện Quốc gia - Trung tâm Thông tin – Học liệu, Đại học Đà Nẵng DANH MỤC CÁC CÔNG TRÌNH KHOA HỌC ĐÃ CÔNG BỐ [1] [2] [3] [4] [5] [6] [7] [8] Hoàng Thị Mỹ Lệ, Phan Thị Bông, Phan Huy Khánh, “Building a Machine Translation System in a Restrict Context from Ka-Tu Language into Vietnamese”, Proceeding of the International Conference on Knowledge and System Engineering, Springer, KSE 2012, Danang, pp 167-172, 2012 Hoàng Thị Mỹ Lệ, Vilavong Souksan, Phan Huy Khánh, “Using Unicode in Encoding the Vietnamese Ethnic Minority Languages, Applying for the EDe Language”, Proceeding of the International Conference on Knowledge and System Engineering, Springer, KSE 2013, HaNoi, pp 137-148, 2013 Hoàng Thị Mỹ Lệ, Phan Huy Khánh, “A Domain indicating method for Ede terminology in building a Vietnamese-Ede bilingual corpus”, Proceeding of The third Asian Conference on Information Systems, ACIS’2014, NhaTrang, pp 434-439, 2014 Hoàng Thị Mỹ Lệ, Phan Huy Khánh, “Giải pháp xây dựng kho ngữ liệu đa ngữ Việt-ÊĐê gán nhãn theo ngữ cảnh”, Tạp chí Khoa học Công nghệ ĐHĐN Số 1(74), 2, trang: 42-46, 2014 Hoàng Thị Mỹ Lệ, Phan Huy Khánh, “Basing on the Ede syllable models to check Ede syllable misspelling, applying to improve the quality of Ede vocabulary corpus”, Proceeding of the International Conference on Advanced Technologies for Communications (ATC’2016), HaNoi, pp 158-162, 2016 Hoàng Thị Mỹ Lệ, Phan Huy Khánh, “Giải pháp xây dựng kho ngữ vựng song ngữ Việt-Ê Đê dựa mô hình tương tác ViệtÊ Đê”, Tạp chí Khoa học Công nghệ ĐHĐN, Số 5(114), 2, trang: 36-40, 2017 Hoàng Thị Mỹ Lệ, Phan Huy Khánh, “Deploying environment for processing Ede ethnic minority language in Vietnam”, IEEE International Conference on Systems Science and Engineering (ICSSE), Jul 2017, HoChiMinh, pp 174-177, 2017 Hoàng Thị Mỹ Lệ, Phan Huy Khánh, “Giải pháp chuyển đổi văn tiếng Ê Đê dùng phông chữ riêng sang Unicode”, Tạp chí Hội nghị khoa học quốc gia lần thứ X, Nghiên cứu ứng dụng Công nghệ Thông tin-FAIR, Đà Nẵng (đang chờ in kỷ yếu), 2017 MỞ ĐẦU Xử tiếng dân tộc thiểu số (DTTS) Việt Nam nói chung xử tiếng Ê Đê nói riêng, cho Ďến có nhà khoa học quan tâm Trong bối cảnh bùng nổ sử dụng internet, với nhu cầu phát triển văn hoá hội nhập cộng Ďồng DTTS Việt Nam, lúc nhu cầu xử tiếng DTTS Ďặt thiết hết Từ tình hình thực tiễn xử tiếng DTTS, dựa gần gũi ngôn ngữ tiếng Việt tiếng Ê Đê, luận án chọn Ďề tài “Xây dựng môi trường xử tiếng Ê Đê ứng dụng dạy học tiếng Ê Đê” nhằm Ďịnh hƣớng qui trình nghiên cứu xử tiếng Ê Đê Từ Ďịnh hƣớng nghiên cứu Ďƣợc Ďặt môi trƣờng này, kho ngữ vựng Việt-Ê Đê Ďƣợc xây dựng dựa mô hình hợp nguồn liệu từ Ďiển giấy Việt-Ê Đê Ê Đê-Việt Các ứng dụng xử tiếng Ê Đê dạy học tiếng Ê Đê Ďƣợc xây dựng dựa kho ngữ vựng Việt-Ê Đê có Ďƣợc từ mô hình hợp Định hƣớng phát triển kho ngữ vựng thông qua trang web quản kho ngữ vựng Ďể chuyên gia ngôn ngữ Ê Đê tham gia Ďóng góp, cập nhật liệu vào kho ngữ vựng, góp phần nâng cao chất lƣợng kho ngữ vựng Việt-Ê Đê Bên cạnh việc phát triển kho ngữ vựng, trang web có chức chia sẻ kho ngữ vựng Việt-Ê Đê, công cụ kỹ thuật, kết nghiên cứu xử tiếng Ê Đê cho hoạt Ďộng nghiên cứu liên quan Ďến xử tiếng Ê Đê Mục tiêu nghiên cứu Luận án hƣớng Ďến nghiên cứu hai mục tiêu chính: - Xây dựng môi trƣờng xử tiếng Ê Đê Ďịnh hƣớng qui trình nghiên cứu cho xử tiếng Ê Đê thể ba vấn Ďề: soạn thảo văn tiếng Ê Đê môi trƣờng Ďa ngữ; hợp nguồn liệu từ Ďiển giấy song ngữ ViệtÊ Đê Ê Đê-Việt xây dựng KNVV-E; nâng cao chất lƣợng KNVV-E với tham gia, hỗ trợ chuyên gia ngôn ngữ tiếng Ê Đê Chia sẻ nguồn tài nguyên, công cụ kỹ thuật, kết nghiên cứu cho hoạt Ďộng nghiên cứu xử tiếng Ê Đê - Triển khai xây dựng ứng dụng xử tiếng Ê Đê dạy học tiếng Ê Đê từ V-EBVB Đối tượng phạm vi nghiên cứu 2.1 Đối tượng nghiên cứu Để Ďạt Ďƣợc mục tiêu nghiên cứu luận án, Ďối tƣợng gồm: ngôn ngữ Ê Đê ngôn ngữ DTTS; Unicode, công cụ kỹ thuật XLNNTN xử tiếng Ê Đê; từ Ďiển kho ngữ vựng Ďơn ngữ, song ngữ Việt-Ê Đê 2.2 Phạm vi nghiên cứu Để Ďạt Ďƣợc mục tiêu nghiên cứu luận án, luận án xác Ďịnh phạm vi nghiên cứu gồm: xử chữ viết theo quan Ďiểm XLNNTN xử tiếng Việt, STVB tiếng Ê Đê sử dụng Unicode, kiểm tra lỗi tả âm tiết văn tiếng Ê Đê, hạ tầng sở cho xử tiếng Ê Đê, ứng dụng xử tiếng Ê Đê dạy học tiếng Ê Đê Phương pháp nghiên cứu Phƣơng pháp nghiên cứu Ďƣợc sử dụng luận án: nghiên cứu thuyết, nghiên cứu thực nghiệm Cấu trúc luận án Nội dung luận án gồm phần mở Ďầu, nội dung chính, phần kết luận phụ lục Nội dung luận án gồm chƣơng nhƣ sau: Chương 1: Tiếp cận xử ngôn ngữ dân tộc thiểu số Chương 2: Môi trƣờng xử tiếng Ê Đê Chương 3: Xử tiếng Ê Đê Chương 4: Xây dựng ứng dụng xử tiếng Ê Đê Những đóng góp luận án 1) Đề xuất xây dựng môi trƣờng xử tiếng Ê Đê, góp phần Ďịnh hƣớng qui trình nghiên cứu xử tiếng Ê Đê 2) Đề xuất giải pháp sử dụng Unicode cho STVB tiếng DTTS nói chung tiếng Ê Đê nói riêng 3) Đề xuất xây dựng KNV V-E dựa mô hình hợp nguồn liệu song ngữ Việt-Ê Đê Ê Đê-Việt Ê Đê 4) Đề xuất mô hình kiểm tra lỗi tả âm tiết dựa mô hình âm tiết tiếng Ê Đê, góp phần phát lỗi tả âm tiết văn tiếng Ê Đê, kiểm tra âm tiết tiếng Ê Đê KNVV-E Ngoài ra, nhằm góp phần ứng dụng CNTT việc nâng cao chất lƣợng dạy học tiếng Ê Đê, số ứng dụng ứng dụng xử tiếng Ê Đê Ďã Ďƣợc triển khai dựa vào KNV V-E, gồm có: - Tra cứu trực tuyến ngoại tuyến từ vựng Việt-Ê Đê - Kiểm tra lỗi tả văn tiếng Ê Đê, - Trợ giúp dịch máy Việt-Ê Đê hỗ trợ cho việc dịch giảng, giáo án từ tiếng Việt sang tiếng Ê Đê CHƢƠNG VẤN ĐỀ XỬ NGÔN NGỮ DÂN TỘC THIỂU SỐ 1.1 Xử ngôn ngữ tự nhiên 1.1.1 Mã hóa soạn thảo văn 1.1.2 Xây dựng kho ngữ liệu 1.1.3 Tách từ gán nhãn từ loại 1.1.4 Bài toán dịch máy 1.2 Xử tiếng Việt-Kinh 1.2.1 Tiếng Việt bối cảnh xử ngôn ngữ tự nhiên Ngoài toán ứng dụng XLNNTN, xử tiếng Việt Ďặt vấn Ďề cần Ďƣợc quan tâm nghiên cứu nhƣ: Tự Ďộng thêm dấu chữ viết tiếng Việt; kiểm lỗi tả, ngữ pháp; xây dựng từ Ďiển thuật ngữ, KNV; phân tích ngữ nghĩa nhằm mục Ďích Ďể máy tính hiểu tiếng Việt; dịch tự Ďộng văn sang ngôn ngữ khác; tóm tắt nội dung văn bản; nhận dạng chữ in, chữ viết, tiếng nói; trích rút tri thức; tạo sinh văn tự Ďộng từ nguồn tài liệu khác theo ngữ cảnh Để giải vấn Ďề Ďƣợc Ďặt ra, xử tiếng Việt cần phải tập trung vào việc tạo công cụ tài nguyên cho xử tiếng Việt Vì vậy, xử tiếng Việt thách thức Ďặt 1.2.2 Một số kết xử tiếng Việt Trong bối cảnh phát triển ngành CNTT Việt Nam, số toán xử tiếng Việt Ďã Ďƣợc nghiên cứu Ďã Ďƣợc số kết quả: mã hóa Unicode, tách từ, xây dựng kho ngữ liệu, dịch máy Vấn Ďề Ďa ngữ xử tiếng Việt hệ quản trị sở liệu không gặp khó khăn, kể với kỹ thuật xếp tìm kiếm NSD không cần phải lập trình xử Ďƣợc tiếng Việt môi trƣờng Ďa ngữ 1.3.3 Xu triển vọng xử tiếng Việt Xử tiếng Việt hƣớng nghiên cứu có tầm quan trọng lớn Ďối với phát triển ứng dụng CNTT Việt Nam Xử tiếng Việt Ďang có nhu cầu lớn Việt Nam bùng nổ công nghiệp nội dung số nhiều doanh nghiệp Ďang quan tâm tới lĩnh vực 1.3 Xử tiếng dân tộc thiểu số Việt Nam 1.3.1 Bảo tồn tiếng dân tộc thiểu số Việt Nam Đứng trƣớc thực trạng tiếng nói DTTS Việt Nam Ďang Ďứng trƣớc nguy mai một, cộng Ďồng dân tộc Việt Nam Chính phủ cần có chƣơng trình nhƣ khuyến khích, vận Ďộng Ďồng bào DTTS giao tiếp ngày tiếng dân tộc Ngành GDĐT, cần xuất nhiều loại sách song ngữ Đƣa chƣơng trình giảng dạy tiếng DTTS Việt Nam phù hợp với Ďịa bàn vùng DTTS vào trƣờng phổ thông, trƣờng phổ thông Dân tộc nội trú, trung tâm Giáo dục thƣờng xuyên, trung tâm Học tập cộng Ďồng, trƣờng Dạy nghề, Trung học chuyên nghiệp, Cao Ďẳng Đại học Đào tạo Ďội ngũ trí thức ngƣời DTTS Việt Nam tạo Ďiều kiện Ďể trí thức, cán ngƣời DTTS Việt Nam trở phục vụ quê hƣơng 1.3.2 Hệ thống chữ viết dân tộc thiểu số Việt Nam Số lƣợng dân tộc thiểu số Việt Nam Ďã có chƣa có chữ viết, Ďƣợc trình bày bảng 1.1 Bảng 1.1 Các hệ chữ viết DTTS Việt Nam Hệ chữ viết Số lƣợng DTTS Chữ La tinh 17 Chữ Viết cổ Chữ viết La tinh chữ viết cổ Chƣa có chữ viết 29 1.3.3 Thực trạng tiếng dân tộc thiểu số Việt Nam Với Ďặc Ďiểm Ďa dạng dân tộc, nên Việt Nam quốc gia Ďa ngôn ngữ Dân tộc Việt Nam nói ngôn ngữ khác Ngoài dân tộc Kinh dân tộc chiếm gần 86% dân số, có 54 dân tộc khác, thuộc ngữ hệ khác thể bảng ngôn ngữ dân tộc Việt Nam Trên nƣớc có 20 tỉnh thành Ďang tổ chức dạy tiếng DTTS cho gần 110.000 học sinh thuộc dân tộc: H’Mông, Ê Đê, Gia Rai, Ba Na, Chăm, Khơ Me, Hoa Nhiều tỉnh thành Ďã triển khai thực dạy tiếng DTTS cho học sinh, cán bộ, công chức, viên chức, sở ban ngành dƣới nhiều hình thức GDĐTcũng Ďã xây dựng số chƣơng trình giáo dục song ngữ, Ďƣa vào giảng dạy trƣờng tiểu học trƣờng phổ thông Dân tộc nội trú 1.4 Xử ngôn ngữ dân tộc thiểu số 1.4.1 Vấn đề xử ngôn ngữ dân tộc thiểu số Trên giới Ďã có hiệp hội, tổ chức, dự án với hoạt Ďộng liên quan Ďến xử ngôn ngữ DTTS, kể Ďến: SALTMIL hiệp hội quốc tế tiếng nói ngôn ngữ nhóm nghiên cứu riêng biệt chủ yếu tập trung vào công nghệ ngôn ngữ DTTS, MILLE dự án Anh liên quan Ďến xử tiếng DTTS, EMILLE dự án hợp tác trƣờng ĐH Lancaster Sheffield tập trung chủ yếu vào vấn Ďề liên quan Ďến mã hóa Unicode ký tự xây dựng kho ngữ liệu 1.4.2 Khó khăn thách thức Xử ngôn ngữ DTTS thƣờng xuyên phải Ďối mặt với khó khăn Ďầu tiên chữ tiếng DTTS Ďã có bảng mã Unicode hay chƣa, thiếu nguồn tài nguyên liệu chuẩn hóa dƣới dạng Ďiện tử, chuyên môn Chính khan nguồn tài nguyên liệu hạn chế cho phƣơng pháp tiếp cận hƣớng liệu xử ngôn ngữ DTTS Khó khăn phải Ďƣợc kể Ďến Ďó thiếu hỗ trợ tài dành cho hoạt Ďộng nghiên cứu xử ngôn ngữ DTTS 1.4.3 Các phương pháp tiếp cận Nghiên cứu xử ngôn ngữ DTTS sử dụng phƣơng pháp tiếp cận khác với phƣơng pháp tiếp cận thƣờng dùng xử ngôn ngữ tự nhiên (XLNNTN) Tuy nhiên, việc chọn phƣơng pháp tiếp cận phụ thuộc vào Ďặc thù ngôn ngữ DTTS, Ďộ phức tạp vấn Ďề hay hƣớng nghiên cứu nhà khoa học 1.4.4 Định hướng nghiên cứu Triển khai hệ thống xử ngôn ngữ cho DTTS không nên bắt Ďầu phát triển ứng dụng chƣa có hạ tầng sở cho xử ngôn ngữ Nên thiết kế nguồn tài nguyên CSDL theo hƣớng mở Ďƣợc sử dụng lại cho công cụ ứng dụng khác Trong xử ngôn ngữ DTTS, vấn Ďề chia sẻ kết nghiên cứu yếu tố quan trọng, nhằm tận dụng tất hợp tác nảy sinh nhà nghiên cứu xử ngôn ngữ DTTS 1.5 Kết luận chƣơng Luận án tập trung vào bốn giải pháp chính: 1) Đề xuất xây dựng môi trƣờng xử tiếng Ê Đê, góp phần Ďịnh hƣớng qui trình nghiên cứu xử tiếng Ê Đê 2) Đề xuất giải pháp sử dụng Unicode cho STVB tiếng DTTS nói chung tiếng Ê Đê nói riêng 3) Đề xuất xây dựng KNV V-E dựa mô hình hợp nguồn liệu song ngữ Việt-Ê Đê Ê Đê-Việt Ê Đê 4) Đề xuất mô hình kiểm tra lỗi tả âm tiết dựa mô hình âm tiết tiếng Ê Đê, góp phần phát lỗi tả âm tiết văn tiếng Ê Đê, kiểm tra âm tiết tiếng Ê Đê KNVV-E Ngoài ra, nhằm góp phần ứng dụng CNTT việc nâng cao chất lƣợng dạy học tiếng Ê Đê, số ứng dụng ứng dụng xử tiếng Ê Đê Ďã Ďƣợc triển khai dựa vào KNV V-E, gồm có: - Tra cứu trực tuyến ngoại tuyến từ vựng Việt-Ê Đê - Kiểm tra lỗi tả văn tiếng Ê Đê, - Trợ giúp dịch máy Việt-Ê Đê Từ Ďịnh hƣớng nhiệm vụ nghiên cứu nêu trên, nội dung nghiên cứu Ďƣợc trình bày chƣơng CHƢƠNG MÔI TRƢỜNG XỬ TIẾNG Ê ĐÊ 2.1 Tiếng Ê Đê bối cảnh xử tiếng Việt 2.1.1 Giới thiệu tiếng Ê Đê 2.1.2 Khó khăn xử tiếng Ê Đê Với kết Ďạt nghiên cứu xử tiếng DTTS Ďạt Ďƣợc, xử tiếng DTTS nói chung tiếng Ê Đê nói riêng gặp khó khăn cần tiếp tục nghiên cứu: Chƣa có Ďịnh hƣớng qui trình nghiên cứu xử ngôn ngữ DTTS Việt Nam nói chung tiếng Ê Đê nói riêng Trong STVB tiếng DTTS thƣờng dùng phông chữ riêng Các kho ngữ vựng, kho ngữ liệu mang tính chất nghiên cứu tập ngữ liệu nhỏ, chƣa thống dùng Unicode chƣa chia sẻ cho hoạt Ďộng nghiên cứu Chƣa có kết nghiên cứu xây dựng hạ tầng sở từ bƣớc Ďầu cho xử ngôn ngữ DTTS 2.1.3 Xử tiếng Ê Đê vận dụng kết xử tiếng Việt Qua nghiên cứu tổng quan XLNNTN, xử ngôn ngữ DTTS, xử tiếng Việt, xử tiếng Ê Đê; dựa vào gần gũi tiếng Việt tiếng Ê Đê; Ďể giảm thiểu kinh phí Ďiều kiện nghiên cứu kho học; kế thừa phát triển từ Ďã, Ďang có kết nghiên cứu, vận dụng kết xử tiếng Việt cho xử tiếng Ê Đê Ďƣợc so sánh nhận Ďịnh bảng 2.2 Bảng 2.2 So sánh nhận định vấn đề xử tiếng Việt tiếng Ê Đê Vấn đề XLNNTN Mã hoá Unicode Dùng phông Unicode Hiển thị chữ viết với phông chữ Unicode Xây dựng KNV Tách từ Dịch máy Tiếng Việt Tiếng Ê Đê Đã có Chƣa có Đề xuất: Luận án tập trung nghiên cứu mã hoá Unicode chữ tiếng Ê Đê tiếng Việt Đã dùng Chƣa dùng Đề xuất: Luận án tập trung nghiên cứu dùng phông chữ Unicode cho việc hiển thị chữ viết tiếng Ê Đê, không dùng phông chữ tiếng Ê Đê riêng nhƣ Đã có gõ Unikey, VietKey, Chƣa có VNWinKey Đè xuất: Luận án tập trung nghiên cứu vấn Ďề hiển thị chữ viết tiếng Ê Đê dùng phông chữ Unicode kế thừa gõ tiếng Việt Đã có Chƣa có Đề xuất: Luận án tập trung xây dựng KNVV-E, kế thừa kho ngữ vựng tiếng Việt Ďã có chia sẻ cho hoạt Ďộng nghiên cứu Khó khăn vấn Ďề Khó khăn vấn Ďề nhập nhằng nhập nhằng Đã có công cụ tách Chƣa có công cụ tách từ chia sẻ cho từ vnTokenizer chia sẻ cho mục Ďích nghiên cứu mục Ďích nghiên cứu Đề xuất: Luận án cần chọn giải pháp kế thừa công cụ vnTokenize Ďể tách từ tiếng Việt ứng với từ tiếng Ê Đê, theo cách tiếp cận bổ sung mục từ vào KNV mở rộng công cụ vnTokenize Việt-Anh, chƣa xử hết Việt-Ê Đê chƣa xử trƣờng hợp trƣờng hợp nhập nhằng nhập nhằng từ KNV Đề xuất: Luận án tập trung nghiên cứu ứng dụng trợ giúp dịch ViệtÊ Đê cho việc dịch học song ngữ Việt-Ê Đê, giáo án, giáo trình từ tiếng Việt sang tiếng Ê Đê 2.1.4 Phân cấp chức môi trường xử tiếng Ê Đê Môi trƣờng xử tiếng Ê Đê luận án hệ thống phân cấp chức năng, Ďịnh hƣớng qui trình nghiên cứu xử tiếng Ê Đê Hệ thống phân cấp chức môi trƣờng xử tiếng Ê Đê có bốn mức: - Mức dƣới vấn Ďề sử dụng Unicode soạn thảo văn tiếng Ê Đê làm hạ tầng sở cho việc thu thập, chuyển Ďổi, xử nguồn liệu cho mức - Mức hợp nguồn liệu song ngữ Việt-Ê Đê Ê Đê-Việt xây dựng KNV song ngữ Việt-Ê Đê - Mức thứ ba quản KNV, xây dựng chia sẻ công cụ kỹ thuật, ứng dụng cho hoạt Ďộng nghiên cứu xử tiếng Ê Đê - Mức Ďại diện cho miền triển khai ứng dụng xử tiếng Ê Đê dạy học tiếng Ê Đê, bao gồm hoạt Ďộng nhƣ: tra cứu vựng, kiểm tra lỗi tả văn tiếng Ê Đê, hỗ trợ dịch Việt-Ê Đê dựa kho ngữ vựng song ngữ Việt-Ê Đê có Ďƣợc từ mức dƣới Hình 2.1 thể mức hệ thống phân cấp chức môi trƣờng xử tiếng Ê Đê 2.2 Soạn thảo văn tiếng Ê Đê 2.2.1 Xử chữ viết tiếng dân tộc thiểu số Việt Nam Kết nghiên cứu xử chữ viết tiếng DTTS Việt Nam có ƣu Ďiểm nhƣợc Ďiểm sau: Ưu điểm: góp phần tin học hóa văn tiếng DTTS, giải Ďƣợc vấn Ďề hiển thị chữ DTTS máy tính cho dân tộc Chăm, Thái, Ê Đê, Gia Rai, Ba Na, M’Nông, Ê Đê, Xơ Đăng, Cơ Ho, Xê Đăng, Sán Chay, tạo Ďiều kiện cho Ďồng bào DTTS tiếp cận với ứng dụng lĩnh vực CNTT, nhƣ ứng dụng khoa học công nghệ Hình 2.1 Hệ thống phân cấp chức Nhược điểm: sử dụngmôi trường xử tiếng Ê Đê chuẩn có sẵn ASCII tạo phông chữ riêng theo bảng mã này, khắc phục Ďƣợc tính cục bộ, ứng dụng phạm vi hẹp số phông chữ công trình nghiên cứu xây dựng gõ cho STVB Để hiển thị Ďƣợc chữ viết tiếng DTTS Việt Nam, máy phải có phông chữ ứng với gõ tiếng dân tộc Ďó Từ thực trạng xử chữ viết tiếng DTTS Việt Nam máy tính, vấn Ďề mã hóa Unicode STVB tiếng DTTS Việt Nam việc làm cần thiết phải làm sớm tốt 2.2.2 Soạn thảo văn tiếng dân tộc thiểu số Hình 2.3 Mô hình hiển thị chữ viết tiếng Hầu hết 21 DTTS Việt Nam DTTS văn Unicode có chữ viết sử dụng chữ 10 sử dụng giải pháp tƣơng tác vào gõ WinVNkey qua EIWVNK, Ďƣợc so sánh Ďánh giá dựa yếu tố liên quan Ďến vấn Ďề hiển thị chữ viết tiếng Ê Đê dùng Unicode, Ďƣợc trình bày qua Bảng 2.7 Bảng 2.7 Đánh giá yếu tố hiển thị chữ viết tiếng Ê Đê Unicode Yếu tố Phông chữ Unicode Bộ gõ Hướng mở Phím phụ kết hợp TayNguyenKey Không sử dụng Dùngtiếng Việt (Unikey, ViệtKey) Không 12 phím VnKey Không sử dụng EIWVNK Sử dụng Dùng gõ VNKey Dùng gõ WinVNKey Không Kết hợp nhƣ telex, VNI Có Phím ~ phím ^ 2.3 Sử dụng Unicode 2.3.1 Sử dụng Unicode soạn thảo văn Trong STVB việc sử dụng nhiều bảng mã khác nƣớc trở ngại lớn việc phát triển hệ thống thông tin lớn Unicode không giải mặt kĩ thuật hiển thị phông chữ mà tạo tiền Ďề cho phát triển kĩ thuật xử lí ngôn ngữ máy tính, xây dựng giải pháp sửa lỗi tả ngữ pháp tự Ďộng máy tính, xu hƣớng tất yếu phát triển mạnh mẽ internet Unicode giải pháp quốc tế, cho ngôn ngữ giới việc trao Ďổi thông tin 2.3.2 Giải pháp chuyển đổi văn tiếng DTTS sử dụng phông chữ riêng sang Unicode Các văn tiếng DTTS Việt Nam có chữ viết sử dụng ký tự chữ Latinh, phần lớn không sử dụng phông chữ Unicode mà sử dụng phông chữ riêng Sử dụng phông chữ riêng STVB khó khăn việc trao Ďổi phát triển hệ thống thông tin Từ thực trạng trên, Ďể góp phần giải khó khăn việc trao Ďổi, sử dụng văn tiếng DTTS dùng phông chữ riêng, luận án Ďề xuất giải pháp chuyển Ďổi văn tiếng DTTS dùng phông chữ riêng sang phông chữ Unicode Giải pháp chuyển Ďổi văn tiếng Hình 2.5 Giải pháp chuyển đổi văn DTTS dùng phông chữ riêng sang phông chữ Unicode Ďƣợc trình bày Hình 2.5 Trong giải pháp này, có kế thừa chức xác Ďịnh giá trị hexa cho 11 chữ nhóm nhóm chức qui Ďịnh cách gõ gõ H&TES Chức qui Ďịnh cách gõ công cụ H&TES, Ďƣợc kế thừa cho chức xác Ďịnh kí tự Ďã sử dụng văn tiếng DTTS với phông chữ riêng Ďƣợc ánh xạ vào chữ nhóm nhóm Sau Ďã xác Ďịnh Ďƣợc giá trị hexa kí tự Ďã sử dụng văn cần chuyển Ďổi, Ďƣợc lƣu vào CSDL Đây nguồn liệu Ďầu vào cho chức chuyển Ďổi văn tiếng DTTS dùng phông chữ riêng sang Unicode Giải pháp chuyển Ďổi văn tiếng DTTS dùng phông chữ riêng sang Unicode, Ďã góp phần giải khó khăn việc trao Ďổi văn tiếng DTTS dùng phông chữ riêng 2.3.3 Chuyển đổi văn tiếng Ê Đê dùng phông chữ riêng Unicode Trong soạn thảo văn tiếng Ê Đê, việc chuyển từ dùng phông chữ riêng sang Unicode, công việc chƣa thể thực Ďƣợc hai Trƣớc mắt, Ďể giải khó khăn việc trao văn tiếng Ê Đê dùng phông chữ riêng internet hay máy tính Dựa vào giải pháp chuyển Ďổi văn tiếng DTTS dùng phông chữ riêng sang Unicode, luận án Ďề xuất xây dựng chuyển Ďổi văn tiếng Ê Đê dùng phông chữ riêng sang phông chữ Unicode, Ďƣợc Ďặt tên CEDU Kịch xây dựng chuyển đổi CEDU Sử dụng chuyển Ďổi H&TES Ďã Ďƣợc Ďề xuất mục 2.2.3 Ďể tạo CSDL chứa giá trị hexa tập kí tự Ďƣợc gõ tƣơng ứng với chữ nhóm nhóm Dựa vào CSDL chứa tập giá trị hexa tập kí tự Ďƣợc gõ tƣơng ứng với chữ nhóm nhóm 3, Ďể thực chuyển Ďổi file văn tiếng Ê Đê dạng (TXT, DOC, DOCX, RFT, XML) dùng phông chữ riêng sang file văn tiếng Ê Đê dùng phông chữ Unicode Kết thực nghiệm Dữ liệu Ďầu vào Ďƣợc lấy từ tin Hệ phát dân tộc VOV Các tin sử dụng phông chữ TayNguyenKey, kiểu gõ VNI gõ UniKey Kết có Ďƣợc sau qua CEDU Ďã Ďƣợc kiểm tra thủ công gốc nhận thấy CEDU Ďã chuyển Ďổi Ďƣợc hết tất tập kí tự Ďƣợc gõ theo phông chữ TayNguyenKey chữ tiếng Ê Đê với phông chữ Unicode So sánh đánh giá Bộ chuyển Ďổi CEDU thực chuyển Ďổi Ďƣợc cho tệp có phần mở rộng TXT, DOC, DOCX, RTF, XML, không giới hạn tệp có phần mở rộng TXT RTF nhƣ chức chuyển Ďổi bảng mã tiếng Việt Unikey ToolKit gõ Unikey Bộ chuyển Ďổi CEDU Ďã góp phần giải bất cập trao Ďổi văn tiếng Ê Đê dùng phông chữ riêng internet hay máy tính với nhau, nhƣ việc sử dụng lại nguồn liệu Ďiện tử có nghiên cứu xử tiếng Ê Đê 12 2.4 Kết luận chƣơng Trong chƣơng Ďã trình bày kết chƣa Ďƣợc công bố từ trƣớc Ďến Luận án tiếp tục triển khai mức Ďã Ďƣợc Ďịnh hƣớng môi trƣờng xử tiếng Ê Đê CHƢƠNG XỬ TIẾNG Ê ĐÊ 3.1 Hợp nguồn liệu song ngữ Việt-Ê Đê 3.1.1 Mô hình hợp nguồn liệu song ngữ Xuất phát từ thực trạng KNV Việt-DTTS Việt Nam nói chung KNV Việt-Ê Đê nói riêng, Ďể góp phần giải toán xây dựng KNV song ngữ Việt-Ê Đê với nguồn liệu Ďầu vào chủ yếu từ Ďiển giấy ViệtÊ Đê Ê Đê-Việt Luận án Ďề xuất mô hình hợp nguồn liệu song ngữ từ Ďiển giấy Việt-Ê Đê Ê Đê-Việt xây dựng KNV Việt-Ê Đê Mô hình hợp nguồn liệu song ngữ Ďƣợc thể Hình 3.1 3.1.2 Môi trường hợp nguồn liệu song ngữ Việt-Ê Đê Ê ĐêViệt Môi trƣờng hợp Ďƣợc thực qua hai mô Ďun thực hợp nhất: mô Ďun tƣơng tác Ê Đê-Việt mô Ďun tƣơng tác Việt-Ê Đê 3.1.3 Đánh giá mô hình hợp nguồn liệu Với bối cảnh xử tiếng DTTS ViệtNam nói chung tiếng Ê Đê nói riêng, mô hình hợp nguồn liệu Việt-Ê Đê Ê Đê-Việt Ďƣợc Ďề xuất góp phần xây dựng KNV song ngữ Việt-Ê Đê từ nguồn liệu từ Ďiển giấy Việt-Ê Đê Ê Đê-Việt Mô hình hợp nguồn liệu Ďƣợc Hình 3.1 Mô hình hợp nguồn Ďề xuất, Ďƣợc mở rộng Ďể giải liệu song ngữ toán xây dựng KNV song ngữ Việt-DTTS khác Việt Nam 3.2 Xây dựng kho ngữ vựng song ngữ Việt-Ê Đê 3.2.1 Tổ chức kho ngữ vựng song ngữ Việt-Ê Đê a) Tiêu chí liệu Với mục tiêu, xây dựng KNVV-E Ê Đê-Việt làm hạ tầng sở cho môi trƣờng xử tiếng Ê Đê Các tiêu chí liệu Ďƣợc Ďặt KNV nhƣ sau: Các từ tiếng Ê Đê Ďƣợc thu thập ghi theo tiếng Ê Đê nhóm Kpă Các từ tiếng Việt từ tiếng Việt phổ thông ghi chữ Quốc ngữ 13 Các ví dụ Ďƣợc Ďƣa vào Ďể làm sáng tỏ cho nghĩa cách sử dụng từ ngữ hay gọi ngữ cảnh mục từ Các mục từ Ďƣợc gán nhãn từ loại: gán nhãn N cho danh từ, gán nhãn V cho Ďộng từ, gán nhãn A cho tính từ, gán nhãn O cho mục từ danh từ, Ďộng từ hay tính từ Từ Ďa nghĩa Ďƣợc ghi nhận, dịch Ďối chiếu với từ khác tƣơng Ďƣơng ngôn ngữ Ďích Khi gióng hàng từ ngôn ngữ nguồn, tìm từ tƣơng Ďƣơng ngôn ngữ Ďích, sở nghĩa bản, nghĩa thƣờng dùng hai ngôn ngữ Dữ liệu Ďƣợc lƣu máy với phông chữ Unicode Đây tiêu chí mà kết nghiên cứu KNVV-E từ trƣớc Ďến chƣa Ďề cập Ďến b) Nguồn liệu Nguồn liệu từ Ďiển giấy song ngữ Việt-Ê Đê Ê Đê-Việt Ďƣợc chọn làm liệu Ďầu vào cho mô hình tƣơng tác: Từ Ďiển Việt-Ê Đê, gồm 10.000 Ďơn vị mục từ, phần lớn thuộc vốn từ bản, thông dụng tiếng Việt Từ Ďiển, Ďƣợc nhập thủ công hệ STVB Từ Ďiển Ê Đê-Việt, có khoảng 10.000 mục từ Phần lớn từ ngữ thƣờng dùng hàng ngày tiếng Ê Đê Cũng giống nhƣ từ Ďiển Việt-Ê Đê, từ Ďiển Ďƣợc nhập thủ công hệ STVB Winword KNV tiếng Việt, có 31.000 mục từ, kế thừa từ “Đề tài VLSP” c) Cấu trúc kho ngữ vựng Tổ chức cấu trúc KNV bƣớc quan trọng xây dựng KNV Trong luận án, KNV Ďƣợc thiết kế theo mô hình CSDL quan hệ CSDL quan hệ Ďƣợc sử dụng nhƣ tập hợp bảng lƣu trữ liệu lƣu trữ tập hợp thực thể có quan hệ với Các bảng CSDL tƣơng tự nhƣ KNV, Ďƣợc lƣu trữ hoàn toàn Ďộc lập cấu trúc nhƣ liệu 3.2.2 Cập nhật liệu vào kho ngữ vựng song ngữ Việt-Ê Đê Trong KNVV-E, mục từ Ďƣợc cập nhập thông qua thông qua công cụ thực hợp nguồn liệu song ngữ, Ďƣợc luận án Ďề xuất xây dựng Ďƣợc Ďặt tên MEDAS (MErging DAta Sources) Công cụ MEDAS gồm hai chức thực hai mô Ďun tƣơng tác Việt-Ê Đê Ê Đê-Việt môi trƣờng hợp mô hình hợp nguồn liệu song ngữ Ďã Ďƣợc Ďề xuất Mục 3.1 Kết mục từ nhập vào kho ngữ vựng, Ďƣợc thống kê Bảng 3.5 Bảng 3.5 Thống kê số mục từ nhập vào kho ngữ vựng Số mục từ đƣợc cập nhật Tổng Kho ngữ vựng Mô đun tƣơng Mô đun tƣơng cộng tác Ê Đê-Việt tác Việt-Ê Đê Tiếng Việt 11.357 2.575 13.932 Tiếng Ê Đê 9.287 2.149 11.436 Việt-Ê Đê 17.980 3.167 21.147 14 3.2.3 Đánh giá kho ngữ vựng song ngữ Việt-Ê Đê Sau xây dựng KNVV-E, luận án cần Ďánh giá Ďộ bao phủ KNV văn tiếng Việt tiếng Ê Đê Chúng Ďề xuất Ďộ bao phủ KNV DC (Degree of Coverage) DC tính Ďộ bao phủ mục từ KNV văn bản, Ďƣợc hình thành nhƣ tỷ lệ phần trăm tổng số từ KNV bao phủ văn DC  Trong đó: X Y  100 X X: tổng số từ văn bản, Y: tổng số từ văn chƣa có KNV, Y≤X a) Tính độ bao phủ mục từ tiếng Ê Đê Để kiểm tra từ văn tiếng Ê Đê có hay chƣa có KNV, công cụ tách từ Ďƣợc xây dựng từ Ďể tách từ Ê Đê văn Hƣớng tiếp cận cho toán tách từ hƣớng tiếp cận dựa KNV Để tách từ KNV, phƣơng pháp tách từ Ďƣợc áp dụng phƣơng pháp so khớp cực Ďại dựa vào mục từ KNV Độ bao phủ KNV Ê Đê văn tiếng Ê Đê tính Ďƣợc bảng 3.9 Bảng 3.9 Độ bao phủ KNV Ê Đê văn tiếng Ê Đê Loại văn Số từ tách đƣợc Số từ chƣa có KNV Độ bao phủ Sách học tiếng Ê Đê Truyện Ďọc Ê Đê-Việt Bản tin tiếng Ê Đê 1.815 96 94,71% 2.052 276 86,55% 3.725 328 91,19% Độ bao phủ trung bình 90,82% b) Tính độ bao phủ mục từ tiếng Việt Để kiểm tra từ văn tiếng Việt có hay chƣa có KNV, phƣơng pháp tách từ tiếng Việt Ďƣợc kế thừa từ công cụ tách từ vnTokenizer sau Ďã bổ sung từ tiếng Việt Ďã phát chƣa có KVN tiếng Việt vào kho từ vựng mở rộng vnTokenizer Sau Ďó, kiểm tra từ tách Ďƣợc KNVV-E Độ bao phủ KNV tiếng Việt văn tiếng Việt tính Ďƣợc Bảng 3.11 Bảng 3.11 Độ bao phủ KNV văn tiếng Việt Số từ chƣa Số từ Độ Loại văn có tách đƣợc bao phủ KNV Sách học tiếng Việt 3, 4, 3.324 225 93,23% Truyện Ďọc tiếng Việt 3, 4, 3.538 274 92,26% Bản tin sở giáo dục Đăk Lăk 4.777 509 89,34% Độ bao phủ trung bình 91,61% 15 Kết tính Ďộ bao phủ KNVV-E văn tiếng Việt 91,61% tính Ďƣợc Bảng 3.9 văn tiếng Ê Đê 90,82% tính Ďƣợc Bảng 3.7, phần Ďã chứng minh Ďƣợc tính khả thi KNVV-E việc triển khai ứng dụng xử tiếng Ê Đê dạy học tiếng Ê Đê 3.3 Kiểm tra tả âm tiết tiếng Ê Đê 3.3.1 Âm tiết tiếng Ê Đê a) Khái niệm âm tiết b) Cấu tạo âm tiết tiếng Ê Đê Cấu tạo âm tiết Ê Đê thể hình 3.2 Hình 3.2 Mô hình cấu tạo âm tiết tiếng Ê Đê 3.3.2 Phát lỗi tả âm tiết tiếng Ê Đê Trong xử tiếng Ê Đê, xây dựng KNV Ďơn ngữ, song ngữ ViệtÊ Đê chủ yếu dựa vào nguồn từ Ďiển giấy Để chuyển mục từ từ Ďiển giấy vào KNV, phải có thao tác cập nhật thủ công Trong qúa trình cập nhật thủ công tránh khỏi lỗi tả Thêm vào Ďó, ngƣời nhập liệu tiếng Ê Đê chƣa quen cách gõ chữ tiếng Ê Đê, khó phát Ďƣợc lỗi gõ nhầm lúc gõ Để kiểm tra lỗi tả tiếng Ê Đê KNVV-E bƣớc giải toán kiểm tra tả tiếng Ê Đê, luận án Ďề xuất giải pháp dựa mô hình cấu tạo âm tiết tiếng Ê Đê Ďể kiểm tra tả tiếng Ê Đê mức âm tiết Dựa 22 kiểu âm tiết khác mô hình âm tiết tiếng Ê Đê trƣờng hợp kiểu âm tiết phần Ďầu, luận án Ďã rút gọn 22 kiểu âm tiết kiểu âm tiết bổ sung kiểu âm tiết phần Ďầu Rút gọn 22 kiểu âm tiết thành kiểu âm tiết gộp trƣờng hợp phần Ďầu âm tiết phụ âm hay tổ hợp hai phụ âm ba phụ âm thành trƣờng hợp chung phần Ďầu âm tiết Trong kiểu âm tiết bổ sung có trƣờng hợp kiểu âm tiết từ Ďiển Ďó trƣờng hợp nguyên âm + bán nguyên âm Vì kiểu âm tiết bổ sung kiểu âm tiết phần Ďầu Tập mô hình âm tiết tiếng Ê Đê Ďƣợc Ďề xuất luận án gồm có 14 mô hình âm tiết, Ďƣợc trình bày Bảng 3.12 Trong Ďó, Cb kí hiệu cho phần Ďầu, S1 kí hiệu cho âm Ďệm, V kí hiệu cho âm chính, S2 kí hiệu cho bán nguyên âm sau âm chính, Ce kí hiệu cho âm cuối 16 Bảng 3.12 Mô hình âm tiết tiếng Ê Đê Mô hình hình Stt âm tiết Ví dụ Stt Mô Ví dụ âm tiết V ĭ (sơ sinh) CbVCe mđơt (ngắn) VCe ung (chồng) CbVS2 hmlei (bông gòn) VS1Ce ơih (vâng) 10 CbVSCe hmiêt (gói ghém) S1V iŭ (bơm) 11 CbS1V thiê (xui khiến) S1VS2 iêu (gọi) 12 CbS1VS2 miêu (con mèo) S1VCe uan (số) 13 CbS1VCe Mđhiăr (lặp lại) CbV ƀô (mặt) 14 CbS1VSCe mbhuôih (chuốt) Tập mô hình âm tiết tiếng Ê Đê sở cho giải pháp kiểm tra lỗi tả tiếng Ê Đê mức âm tiết 3.3.3 Xây dựng mô hình kiểm tra tả âm tiết tiếng Ê Đê Từ thực trạng xử ngôn ngữ tiếng DTTS Việt Nam nói chung tiếng Ê Đê nói riêng chƣa Ďƣợc quan tâm nghiên cứu nhà khoa học Từng bƣớc Ďể góp phần giải toán kiểm tra tả tiếng Ê Đê Mô hình kiểm tra tả âm tiết Ê Đê dựa tập mô hình âm tiết tiếng Ê Đê chuẩn Ďƣợc Ďề xuất, nhƣ sau: Đầu tiên, xây dựng tập mô hình âm tiết Ê Đê dựa theo cấu trúc âm tiết tiếng Ê Đê, nhƣ Bảng 3.12 Tiếp đến, chuyển Ďổi âm tiết tiếng Ê Đê cần kiểm tra tả sang mô hình âm tiết theo cấu trúc mô hình: [Cb][S1][S2][Ce] Sau cùng, kiểm tra mô hình âm tiết Ďã chuyển Ďổi có thuộc tập mô hình âm tiết tiếng Ê Đê hay không, Ďể kết luận âm tiết cần kiểm tra có cấu trúc âm tiết Ďúng hay sai Hình 3.3 Mô hình kiểm tra tả âm tiết Mô hình kiểm tra tả tiếng Ê Đê âm tiết tiếng Ê Đê dựa tập mô hình âm tiết tiếng Ê Đê Ďƣợc trình bày hình 3.3 3.4 Quản kho ngữ vựng song ngữ Việt-Ê Đê 3.4.1 Phát triển kho ngữ vựng song ngữ Việt-Ê Đê Trong kho ngữ vựng việc bổ sung thêm mục từ cập nhật thành phần ngữ nghĩa, từ loại, ví dụ làm rõ nghĩa mục từ công việc không Ďề cập Ďến việc phát triển kho ngữ vựng Chức Cập nhật mục từ trang web cho phép bổ sung mục từ vào kho ngữ vựng theo mô hình hợp nguồn liệu song ngữ 17 chỉnh sửa thành phần mục từ Ďã có kho ngữ vựng Chức Ďƣợc thực nhà khoa học hay chuyên gia ngôn ngữ tiếng Ê Đê 3.4.2 Nâng cao chất lượng kho ngữ vựng Nhằm góp phần việc nâng cao chất lƣợng KNV Việt-Ê Đê, giải pháp kiểm tra tả âm tiết tiếng Ê Đê Ďƣợc áp dụng Ďể xây dựng kiểm tra lỗi tả âm tiết mục từ tiếng Ê Đê KNV, Ďƣợc Ďặt tên CESILD (Checking Ede Sylable In Lexical Database) Hoạt Ďộng CESILD thể Hình 3.4 3.4.3 Định hướng khai thác kho ngữ vựng song ngữ Việt-Ê Đê Nhằm tạo Ďiều kiện thuận lợi cho học sinh dân tộc Ê Đê giáo viên dạy học tiếng Ê Đê, sở khai thác KNVV-E qua môi trƣờng xử tiếng Ê Đê, ứng dụng Ďƣợc triển khai: - Tra cứu trực tuyến từ vựng Việt-Ê Đê, - Tra cứu ngoại tuyến từ vựng Việt-Ê Đê, - Kiểm tra tả văn tiếng Ê Đê, - Trợ giúp dịch máy Việt-Ê Đê, Thông qua môi trƣờng xử tiếng Ê Đê Hình 3.4 Mô hình hoạt động không triển khai ứng dụng khai thác CESILD KNVV-E, mà góp phần quản việc cập nhật mục từ KNV song ngữ Ê Đê-Việt chia sẻ KNV cho hoạt Ďộng nghiên cứu xử tiếng Ê Đê 3.5 Kết luận chƣơng Những kết Ďạt Ďƣợc chƣơng sở Ďể luận án tiếp tục triển khai số ứng dụng xử tiếng Ê Đê dạy học tiếng Ê Đê CHƢƠNG XÂY DỰNG ỨNG DỤNG XỬ TIẾNG Ê ĐÊ 4.1 Dạy học tiếng Ê Đê 4.1.1 Thực trang dạy học tiếng Ê Đê Dạy học tiếng Ê Đê cho Ďến khó khăn: Số lƣợng giáo viên dạy tiếng Ê Đê thiếu so với nhu cầu Chất lƣợng giảng dạy tiếng Ê Đê hạn chế sở vật chất, thiết bị, Ďồ dùng dạy học, tài liệu sách tham khảo phục vụ cho việc dạy học tiếng Ê Đê thiếu Soạn thảo văn tiếng Ê Đê với phông chữ tiếng Ê Đê có nhiều chữ Ê Đê khó gõ khó nhớ, dễ gây lỗi tả Trao Ďổi tài liệu tiếng Ê Đê Ďều bị hạn chế vấn Ďề hiển thị chữ viết 18 tiếng Ê Đê máy tính không cài phông chữ tiếng Ê Đê Chƣa có ứng dụng Công nghệ Thông tin trợ giúp cho giáo viên học sinh dân tộc Ê Đê dạy học tiếng Ê Đê 4.1.2 Giải pháp sử dụng môi trường xử tiếng Ê Đê Để ứng dụng Công nghệ Thông tin vào dạy học tiếng Ê Đê cần có nỗ lực chuyên gia Công nghệ Thông tin việc Ďầu tƣ phát triển sở hạ tầng cho xử tiếng Ê Đê xây dựng ứng dụng trợ giúp dạy học tiếng Ê Đê Giải pháp xây dựng môi trƣờng xử tiếng Ê Đê Ďƣợc Ďặt Luận án giải pháp thiết thực Thông qua môi trƣờng này, chuyên gia ngôn ngữ Ê Đê có Ďƣợc môi trƣờng Ďể tham gia Ďóng góp, cập nhật liệu vào kho ngữ vựng, góp phần nâng cao chất lƣợng kho ngữ vựng ViệtÊ Đê Kho ngữ vựng Việt-Ê Đê, công cụ kỹ thuật, kết nghiên cứu Ďƣợc chia sẻ cho hoạt Ďộng nghiên cứu xử tiếng Ê Đê ngƣời dùng Các triển khai xây dựng ứng dụng xử tiếng Ê Đê dạy học tiếng Ê Đê với nguồn liệu kho ngữ vựng Việt-Ê Đê Ďƣợc download từ môi trƣờng 4.1.3 Các ứng dụng dạy học tiếng Ê Đê Cùng với phƣơng pháp dạy học, sở vật chất, sách giáo khoa chuẩn, ứng dụng Công nghệ Thông tin phƣơng tiện góp phần nâng cao chất lƣợng dạy học tiếng Ê Đê Nhằm tạo Ďiều kiện thuận lợi cho giáo viên học sinh dân tộc Ê Đê việc dạy học tiếng Ê Đê, Luận án Ďã Ďề xuất triển khai xây dựng số ứng dụng xử tiếng Ê Đê dạy học tiếng Ê Đê, cụ thể: Ứng dụng tra cứu trực tuyến ngoại tuyến từ vựng song ngữ Việt-Ê Đê, góp phần giúp học sinh, giáo viên việc tra cứu từ vựng, tìm hiểu từ loại ý nghĩa từ thông qua ví dụ Ďƣợc hiển thị Ứng dụng tra từ vựng Việt-Ê Đê ngoại tuyến Ďƣợc triển khai nhƣ giáo cụ trực quan dùng giảng dạy môn học tiếng Ê Đê Ứng dụng kiểm tra lỗi tả văn tiếng Ê Đê, góp phần giúp cho giáo viên, học sinh phát sửa lỗi tả âm tiết văn Ďƣợc soạn thảo tiếng Ê Đê nhƣ giáo trình, giáo án, học, tập Ứng dụng trợ giúp dịch máy Việt-Ê Đê, góp phần hỗ trợ việc dịch máy học từ tiếng Việt sang tiếng Ê Đê, tạo Ďiều kiện Ďể tiếp tục nâng cấp trình Ďộ giảng dạy tiếng Ê Đê, giúp giáo viên việc biên soạn giáo án song ngữ Việt-Ê Đê, góp phần làm phong phú môn học song ngữ ViệtÊ Đê 4.2 Tra cứu từ vựng song ngữ Việt-Ê Đê 4.2.1 Vai trò từ vựng dạy học song ngữ Việt-Ê Đê Học từ vựng rèn luyện kĩ sử dụng từ vựng yếu tố Ďầu tiên dạy học ngôn ngữ nói chung dạy tiếng Ê Đê nói riêng Do tầm quan trọng từ vựng Ďối với ngƣời học tiếng Ê Đê, vậy, giáo viên giảng dạy tiếng Ê Đê cần phải phát triển từ vựng cho học sinh, nhƣ giúp học sinh phát triển khả giao tiếp sử dụng vốn từ vựng Ďã 19 Ďƣợc học Trên sở tầm quan trọng từ vựng dạy học tiếng Ê Đê, ứng dụng tra cứu từ vựng Việt-Ê Đê cần thiết cho giáo viên giảng dạy tiếng Ê Đê học sinh học tiếng Ê Đê 4.2.2 Xây dựng ứng dụng tra cứu từ vựng song ngữ Việt-Ê Đê Những mặt hạn chế cần Ďƣợc khắc phục xây dựng ứng dụng tra cứu từ vựng Việt-DTTS: Chƣa dùng phông chữ Unicode hiển thị chữ viết tiếng DTTS Chƣa dùng chung KNV nhƣ hạ tầng sở cho toán xử tiếng DTTS Để khắc phục hạn chế trên, kết giải pháp Unicode cho STVB tiếng Ê Đê KNVV-E luận án, Ďƣợc sử dụng xây dựng ứng tra cứu từ vựng Việt-Ê Đê a) Ứng dụng tra cứu từ vựng Việt-Ê Đê Hoạt Ďộng theo sơ Ďồ hình 4.1 b) Ứng dụng tra cứu từ vựng Ê Đê-Việt Hoạt Ďộng theo sơ Ďồ hình 4.2 Hình 4.1 Sơ đồ hoạt động tra cứu từ vựng Việt-Ê Đê Hình 4.2 Sơ đồ hoạt động tra cứu từ vựng Ê Đê-Việt 4.2.3 Ứng dụng tra cứu từ vựng song ngữ Việt-Ê Đê Ứng dụng tra cứu trực tuyến từ vựng song ngữ Việt-Ê Đê Ďƣợc triển khai trang Web quản kho ngữ vựng Chức Tra cứu từ vựng Ďƣợc xây dựng dựa sơ Ďồ hoạt Ďộng tra cứu từ vựng Việt-Ê Đê (Hình 4.1) tra cứu từ vựng Ê Đê-Việt (Hình 4.2) Ứng dụng tra cứu trực tuyến từ vựng song ngữ Việt-Ê Đê, góp phần giúp giáo viên học sinh việc tra cứu học từ vựng Tuy nhiên, ứng dụng tra cứu trực tuyến từ vựng song ngữ Việt-Ê Đê có mặt thuận 20 lợi khó khăn: Thuận lợi: ứng dụng tra cứu trực tuyến từ vựng song ngữ Việt-Ê Đê không cần cài Ďặt, tất ngƣời Ďều sử dụng, cho phép ngƣời dùng truy cập lúc, nơi thƣờng xuyên Ďƣợc cập nhật mục từ Khó khăn: lúc ngƣời dùng vào internet Ďể tra cứu từ vựng Để khắc phục khó khăn ứng dụng tra cứu trực tuyến từ vựng song ngữ Việt-Ê Đê, luận án Ďề xuất xây dựng ứng dụng tra cứu ngoại tuyến từ vựng song ngữ Việt-Ê Đê 4.2.3.1 Tra cứu ngoại tuyến từ vựng song ngữ Việt-Ê Đê Chức hiển thị kết tra cứu từ vựng Ďƣợc xây dựng dựa theo sơ Ďồ hoạt Ďộng tra cứu từ vựng Việt-Ê Đê (Hình 4.1) tra cứu từ vựng Ê ĐêViệt (Hình 4.2) Ngoài chức trợ giúp tra cứu từ vựng khắc phục mặt hạn chế ứng dụng tra cứu trực tuyến từ vựng song ngữ Việt-Ê Đê, ứng dụng tra cứu ngoại tuyến từ vựng song ngữ Việt-Ê Đê Ďƣợc dùng nhƣ giáo cụ trực quan dùng giảng dạy môn học tiếng Ê Đê 4.3 Trợ giúp dịch máy Việt-Ê Đê 4.3.1 Dịch máy văn Việt-Ê Đê dạy học Để ứng dụng toán dịch máy văn tiếng Việt sang tiếng Ê Đê vào dịch học từ tiếng Việt sang tiếng Ê Đê giải Ďƣợc trƣờng hợp nhập nhằng trình dịch Luận án Ďề xuất, xây dựng ứng dụng trợ giúp dịch máy Việt-Ê Đê Ứng dụng trợ giúp tích hợp Ďƣợc trợ giúp NSD việc xử trƣờng hợp nhập nhằng từ vựng tiếng Ê Đê Ứng dụng góp phần trợ giúp việc dịch máy học tiếng Việt sách giáo khoa sang tiếng Ê Đê, nhằm tạo Ďiều kiện Ďể tiếp tục nâng cấp trình Ďộ dạy tiếng Ê Đê, giúp giáo viên việc biên soạn giáo án song ngữ Việt-Ê Đê góp phần làm phong phú học song ngữ Việt-Ê Đê qua môn học nhƣ toán, khoa học, lịch sử, Ďịa học môn tiếng Ê Đê nhƣ 4.3.2 Giải toán tách từ tiếng Việt dịch máy Việt-Ê Đê Trong khuôn khổ luận án, không Ďi sâu vào nghiên cứu toán tách từ, mà kế thừa công cụ tách từ tiếng Việt vnTokenizer Ďã Ďƣợc công bố chia sẻ “Đề tài VLSP” Để vnTokenizer tách từ tiếng Việt tƣơng ứng với từ tiếng Ê Đê, mục từ tiếng Việt Ďƣợc ghi bổ sung KNV tiếng Việt phải Ďƣợc bổ sung vào KNV mở rộng vnTokenizer cần thiết cho việc tách từ hệ dịch Việt-Ê Đê 4.3.3 Xây dựng ứng dụng trợ giúp dịch máy Việt-Ê Đê 4.3.3.1 Phương pháp dịch Phƣơng pháp Ďƣợc chọn ứng dụng trợ giúp dịch máy Việt-Ê Đê phƣơng pháp dịch dựa vào KNVV-E Ďã Ďƣợc xây dựng Phƣơng pháp dịch phụ thuộc hoàn toàn vào KNVV-E gần nhƣ Ďây kiểu dịch trực tiếp cách thay theo kiểu 1-1 21 Tuy nhiên, áp dụng phƣơng pháp cho dịch máy Việt-Ê Đê, chƣa xử Ďƣợc trƣờng hợp nhập nhằng ranh giới từ, nhập nhằng từ Ďa nghĩa, nhập nhằng từ Ďồng âm, nhập nhằng từ loại chƣa xử Ďƣợc từ KNV Vì vậy, kết dịch Việt-Ê Đê chƣa thể Ďƣa ứng dụng dạy học tiếng Ê Đê Để kết dịch Việt-Ê Đê Ďƣợc Ďƣa vào ứng dụng dạy học tiếng Ê Đê, luận án Ďề xuất xây dựng ứng dụng trợ giúp dịch máy Việt-Ê Đê Để làm Ďƣợc công việc này, ứng dụng trợ giúp dịch máy Việt-Ê Đê cần phải tích hợp Ďƣợc trợ giúp NSD, Ďể xác Ďịnh từ thích hợp cho trƣờng hợp nhập nhằng từ KNV 4.3.3.2 Bộ ứng dụng trợ giúp dịch máy Việt-Ê Đê Trên sở Ďã xác Ďịnh phƣơng pháp dịch cho hệ dịch phƣơng pháp tách từ ứng với phƣơng pháp dịch, hỗ trợ dịch máy Việt-Ê Đê Ďƣợc Ďề xuất Hoạt Ďộng hỗ trợ dịch máy Việt-Ê Đê, trình bày hình 4.3 Hình 4.3 Mô hình hoạt động ứng dụng trợ giúp dịch máy Việt-Ê Đê 4.3.3.3 Kết thực nghiệm Bộ ứng dụng trợ giúp dịch máy Việt-Ê Đê Ďã xử Ďƣợc trật tự câu hỏi với từ Ďể hỏi Ďƣợc Ďƣa vào hệ thống dịch Bộ ứng dụng trợ giúp dịch máy Việt-Ê Đê Ďã xử Ďƣợc 90% trật tự từ Ďể hỏi 303 tổng số câu nghi vấn Còn khoảng 10% từ Ďể hỏi chƣa xử lý, Ďã Ďƣợc kiểm tra sau lần dịch nhận thấy từ dấu kết thúc câu Ďứng trƣớc câu hỏi Từ kết kiểm chứng, cho thấy rằng, từ Ďể hỏi không xử Ďƣợc NSD nhập sai, hệ thống Do Ďó, luận án có sở Ďể khẳng Ďịnh mô Ďun xử trật tự từ dùng Ďể hỏi văn tiếng Việt Ďƣa vào sử dụng hỗ trợ dịch máy Việt-Ê Đê Với trật từ phụ từ "snăk" câu nghi vấn, dịch Ďã xử Ďƣợc gần nhƣ toàn Qua kiểm chứng có số trƣờng hợp chƣa xử Ďƣợc 22 từ Ďứng sau Ďứng sau phụ từ tính từ NSD Ďặt dấu kết thúc sau phụ từ Bộ ứng dụng trợ giúp dịch máy Việt-Ê Đê, góp phần trợ giúp dịch máy học từ tiếng Việt sang tiếng Ê Đê, giúp giáo viên trình biên soạn giáo trình, giáo án song ngữ Việt-Ê Đê 4.4 Kiểm tra lỗi tả tiếng Ê Đê 4.4.1 Vấn đề lỗi tả tiếng Ê Đê Sai sót lớn văn thƣờng lỗi tả Ďánh máy nhầm Lỗi thƣờng xãy nhiều văn Ďƣợc soạn thảo ngƣời chƣa thông thạo tiếng Ê Đê, chƣa quen với cách gõ tiếng Ê Đê Trong xử tiếng Ê Đê, toán kiểm tra tả văn tiếng Ê Đê cho Ďến chƣa Ďƣợc nhà khoa học lĩnh vực xử ngôn ngữ tự nhiên quan tâm nghiên cứu Dựa vào mô hình kiểm tra tả âm tiết tiếng Ê Đê Ďã Ďề xuất mục 3.3.3, luận án tiếp tục triển khai giải toán kiểm tra lỗi tả văn tiếng Ê Đê 4.4.2 Giải toán kiểm tra lỗi tả văn tiếng Ê Đê Bài toán kiểm tra lỗi tả văn tiếng Ê Đê Ďƣợc giải dựa theo kịch bản: Đầu vào: văn tiếng Ê Đê chƣa Ďƣợc kiểm tra lỗi tả, tập 14 mô hình âm tiết Ê Đê, KNVV-E Đầu ra: văn tiếng Ê Đê Ďƣợc kiểm tra lỗi tả, KNVV-E Ďƣợc bổ sung thêm mục từ Phương pháp: hoạt Ďộng theo mô hình kiểm tra lỗi tả văn tiếng Ê Đê Ďƣợc trình bày Hình 4.4 4.4.3 Xây dựng kiểm tra lỗi tả dạy học tiếng Ê Đê Dựa mô hình kiểm tra lỗi tả văn tiếng Ê Đê, luận án Ďề xuất xây dựng kiểm tra lỗi tả văn tiếng Ê Đê, Ďƣợc Ďặt tên SCET (Spelling Checking of Ede Text) a) Cài đặt thử nghiệm Tiến hành cài Ďặt thử nghiệm SCET theo hƣớng tiếp cận mô hình âm tiết tiếng Ê Đê Ďã Ďƣợc Ďề xuất thu Ďƣợc kết thực nghiệm khả quan Dữ liệu thử nghiệm ban Ďầu Ďƣợc tiến hành sách học tiếng Ê Đê, truyện Ďọc Ê Đê-Việt, báo dân tộc miền núi Tập Hình 4.4 Mô hình kiểm tra lỗi văn thử nghiệm gồm 30 văn với tả văn tiếng Ê Đê số lỗi tả ngẫu nhiên Ďã Ďƣợc xác 23 Ďịnh, có tất 150 lỗi tả mức âm tiết Kết thử nghiệm, SCET Ďã phát Ďƣợc 142 lỗi tả âm tiết sai Ďƣợc Ďƣa vào Còn âm tiết sai không phát Ďƣợc phần có nhập nhằng phần Ďầu âm tiết với âm âm cuối Bảng 4.3 mô tả kết thử nghiệm phát lỗi tả văn với số lỗi tả ngẫu nhiên Ďã Ďƣợc xác Ďịnh Bảng 4.3 Kết thử nghiệm với số lỗi tả ngẫu nhiên xác định Lỗi Lỗi không Tỷ lệ không Số âm tiết phát đƣợc phát đƣợc phát đƣợc 150 142 5,7% Qua kết thử nghiệm thu Ďƣợc, cho thấy khả phát lỗi tả âm tiết tiếng Ê Đê giải pháp Ďạt Ďƣợc 94,3% Giải pháp Ďã góp phần phát lỗi tả âm tiết văn tiếng Ê Đê b) Đánh giá kết thử nghiệm Khả phát lỗi tả âm tiết tiếng Ê Đê giải pháp Ďạt Ďƣợc 94% (bảng 4.4) Kết phụ thuộc vào ngữ liệu Ďầu vào cho trình tiền xử văn nhƣ từ Ďiển tên riêng, từ Ďiển viết tắt Quá trình tiền xử văn cần sử dụng ngữ liệu Ďể phân loại âm tiết lọc nhiễu trƣớc thực kiểm tra tả âm tiết Với ngữ liệu Ďầu vào Ďầy Ďủ, hiệu suất khả phát lỗi tả âm tiết tiếng Ê Đê Ďƣợc nâng cao Bộ SCET Ďã góp phần trợ giúp cho giáo viên, học sinh phát sửa lỗi tả âm tiết văn soạn thảo tiếng Ê Đê nhƣ giáo trình, giáo án, học, tập 4.5 Kết luận chƣơng Những kết Ďã Ďạt Ďƣợc chƣơng này, Ďã góp phần khắc phục Ďƣợc thực trạng xử tiếng DTTS Việt Nam nói chung tiếng Ê Đê nói riêng, thông qua việc triển khai ứng dụng dạy học tiếng Ê Đê KẾT LUẬN Các kết luận án Những nghiên cứu giải pháp Ďƣợc Ďề cập Ďã góp phần: 1) Xây dựng môi trƣờng xử tiếng Ê Đê, nhằm Ďịnh hƣớng qui trình nghiên cứu xử tiếng Ê Đê 2) Sử dụng Unicode cho STVB tiếng DTTS nói chung tiếng Ê Đê nói riêng 3) Xây dựng KNV V-E dựa mô hình hợp nguồn liệu song ngữ Việt-Ê Đê Ê Đê-Việt Ê Đê 4) Đề xuất mô hình kiểm tra lỗi tả âm tiết dựa mô hình âm tiết tiếng Ê Đê, góp phần phát lỗi tả âm tiết văn tiếng Ê Đê, kiểm tra âm tiết tiếng Ê Đê KNVV-E 5) Triển khai ứng dụng dạy học tiếng Ê Đê 24 Đánh giá kết Kết Ďạt Ďƣợc sau Ďây chƣa Ďƣợc nghiên cứu từ trƣớc Ďến nay: Định hƣớng qui trình nghiên cứu xử tiếng DTTS Việt Nam nói chung xử tiếng Ê Đê nói riêng Sử dụng Unicode STVB tiếng Ê Đê, góp phần ứng dụng STVB tiếng Ê Đê môi trƣờng Ďa ngữ Chuyển Ďổi văn tiếng Ê Đê dùng phông chữ riêng sang Unicode, góp phần giải khó khăn việc trao Ďổi, sử dụng văn chữ viết tiếng DTTS không sử dụng phông chữ Unicode Kiểm tra Ďƣợc lỗi tả âm tiết văn tiếng Ê Đê, góp phần phát lỗi tả STVB tiếng Ê Đê Xây dựng KNVV-E với tiêu chí: thống dùng phông chữ Unicode, phát từ tiếng Việt tƣơng ứng với tiếng Ê Đê KNV tiếng Việt, mục từ Ê Đê KNV Ďã Ďƣợc kiểm tra lỗi tả âm tiết chia sẻ KNV cho hoạt Ďộng nghiên cứu, góp phần xây dựng hạ tầng sở cho môi trƣờng xử tiếng Ê Đê Triển khai số ứng dụng xử tiếng Ê Đê dạy học tiếng Ê Đê, góp phần ứng dụng CNTT việc nâng cao chất lƣợng dạy học tiếng Ê Đê Hướng phát triển Ngoài kết Ďã Ďạt Ďƣợc luận án, số vấn Ďề nảy sinh từ luận án cần Ďƣợc tiếp tục hoàn thiện tƣơng lai nhƣ sau: Hoàn thiện kết có Nội dung nghiên cứu luận án kiểm tra Ďƣợc lỗi tả tiếng Ê Đê mức âm tiết, toán kiểm tra lỗi tả tiếng Ê Đê Ďƣợc nghiên cứu tiếp tục mức tiếp theo, Kiểm tra lỗi tả tiếng Ê Đê tiếng Việt KNV Tiếp tục Nâng cao chất lƣợng KNVV-E với trợ giúp chuyên gia ngôn ngữ tiếng Ê Đê qua môi trƣờng xử tiếng Ê Đê, Mở rộng xử Ďa ngữ cho ngôn ngữ DTTS khác, Tiếp tục chủ Ďề xử tiếng Ê Đê theo Ďịnh hƣớng XLNNTN ... triển khai số ứng dụng xử lý tiếng Ê ê dạy học tiếng Ê ê CHƢƠNG XÂY DỰNG ỨNG DỤNG XỬ LÝ TIẾNG Ê Ê 4.1 Dạy học tiếng Ê ê 4.1.1 Thực trang dạy học tiếng Ê ê Dạy học tiếng Ê ê cho Ďến khó... XLNNTN xử lý tiếng Việt, STVB tiếng Ê ê sử dụng Unicode, kiểm tra lỗi tả âm tiết văn tiếng Ê ê, hạ tầng sở cho xử lý tiếng Ê ê, ứng dụng xử lý tiếng Ê ê dạy học tiếng Ê ê Phương pháp nghiên... lƣợng dạy học tiếng Ê ê Nhằm tạo Ďiều kiện thuận lợi cho giáo viên học sinh dân tộc Ê ê việc dạy học tiếng Ê ê, Luận án Ďã Ďề xuất triển khai xây dựng số ứng dụng xử lý tiếng Ê ê dạy học tiếng

Ngày đăng: 28/09/2017, 08:39

HÌNH ẢNH LIÊN QUAN

Bảng 2.2. So sánh và nhận định vấn đề xử lý tiếng Việt và tiếng ÊĐê - Xây dựng môi trường xử lý tiếng ê đê ứng dụng trong dạy và học tiếng ê đê (tt)
Bảng 2.2. So sánh và nhận định vấn đề xử lý tiếng Việt và tiếng ÊĐê (Trang 9)
Hình 2.1 thể hiện các mức của hệ thống phân cấp chức năng trong môi trƣờng xử lý tiếng Ê Đê - Xây dựng môi trường xử lý tiếng ê đê ứng dụng trong dạy và học tiếng ê đê (tt)
Hình 2.1 thể hiện các mức của hệ thống phân cấp chức năng trong môi trƣờng xử lý tiếng Ê Đê (Trang 10)
chuẩn có sẵn là ASCII và tạo phông chữ riêng theo bảng mã này, chỉ khắc phục  Ďƣợc  tính  cục  bộ,  ứng  dụng  - Xây dựng môi trường xử lý tiếng ê đê ứng dụng trong dạy và học tiếng ê đê (tt)
chu ẩn có sẵn là ASCII và tạo phông chữ riêng theo bảng mã này, chỉ khắc phục Ďƣợc tính cục bộ, ứng dụng (Trang 10)
Bảng 2.7. Đánh giá các yếu tố hiển thị chữ viết tiếng ÊĐê trong Unicode - Xây dựng môi trường xử lý tiếng ê đê ứng dụng trong dạy và học tiếng ê đê (tt)
Bảng 2.7. Đánh giá các yếu tố hiển thị chữ viết tiếng ÊĐê trong Unicode (Trang 13)
3.1.1. Mô hình hợp nhất nguồn dữ liệu song ngữ - Xây dựng môi trường xử lý tiếng ê đê ứng dụng trong dạy và học tiếng ê đê (tt)
3.1.1. Mô hình hợp nhất nguồn dữ liệu song ngữ (Trang 15)
Hình 3.4. Mô hình hoạt động của bộ CESILD  - Xây dựng môi trường xử lý tiếng ê đê ứng dụng trong dạy và học tiếng ê đê (tt)
Hình 3.4. Mô hình hoạt động của bộ CESILD (Trang 20)
Hoạt Ďộng theo sơ Ďồ trong hình 4.1. - Xây dựng môi trường xử lý tiếng ê đê ứng dụng trong dạy và học tiếng ê đê (tt)
o ạt Ďộng theo sơ Ďồ trong hình 4.1 (Trang 22)
Hình 4.3. Mô hình hoạt động của bộ ứng dụng trợ giúp dịch máy Việt-ÊĐê - Xây dựng môi trường xử lý tiếng ê đê ứng dụng trong dạy và học tiếng ê đê (tt)
Hình 4.3. Mô hình hoạt động của bộ ứng dụng trợ giúp dịch máy Việt-ÊĐê (Trang 24)
Dựa trên mô hình kiểm tra lỗi chính tả  văn  bản  tiếng  Ê Đê,  luận án  Ďề xuất  xây  dựng  bộ  kiểm  tra  lỗi  chính  tả  văn  bản  tiếng  Ê Đê,  Ďƣợc  Ďặt  tên  SCET  (Spelling Checking of Ede Text)  - Xây dựng môi trường xử lý tiếng ê đê ứng dụng trong dạy và học tiếng ê đê (tt)
a trên mô hình kiểm tra lỗi chính tả văn bản tiếng Ê Đê, luận án Ďề xuất xây dựng bộ kiểm tra lỗi chính tả văn bản tiếng Ê Đê, Ďƣợc Ďặt tên SCET (Spelling Checking of Ede Text) (Trang 25)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w