Nghiên cứu phương pháp rút gọn văn bản và chuyển đổi cú pháp ngôn ngữ ký hiệu Việt Nam (LV thạc sĩ)

70 181 0
Nghiên cứu phương pháp rút gọn văn bản và chuyển đổi cú pháp ngôn ngữ ký hiệu Việt Nam (LV thạc sĩ)

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Nghiên cứu phương pháp rút gọn văn bản và chuyển đổi cú pháp ngôn ngữ ký hiệu Việt NamNghiên cứu phương pháp rút gọn văn bản và chuyển đổi cú pháp ngôn ngữ ký hiệu Việt NamNghiên cứu phương pháp rút gọn văn bản và chuyển đổi cú pháp ngôn ngữ ký hiệu Việt NamNghiên cứu phương pháp rút gọn văn bản và chuyển đổi cú pháp ngôn ngữ ký hiệu Việt NamNghiên cứu phương pháp rút gọn văn bản và chuyển đổi cú pháp ngôn ngữ ký hiệu Việt NamNghiên cứu phương pháp rút gọn văn bản và chuyển đổi cú pháp ngôn ngữ ký hiệu Việt NamNghiên cứu phương pháp rút gọn văn bản và chuyển đổi cú pháp ngôn ngữ ký hiệu Việt NamNghiên cứu phương pháp rút gọn văn bản và chuyển đổi cú pháp ngôn ngữ ký hiệu Việt NamNghiên cứu phương pháp rút gọn văn bản và chuyển đổi cú pháp ngôn ngữ ký hiệu Việt NamNghiên cứu phương pháp rút gọn văn bản và chuyển đổi cú pháp ngôn ngữ ký hiệu Việt Nam

ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG MA NGỌC KHÁNH NGHIÊN CỨU PHƯƠNG PHÁP RÚT GỌN VĂN BẢN VÀ CHUYỂN ĐỔI CÚ PHÁP NGÔN NGỮ KÝ HIỆU VIỆT NAM Chuyên ngành: Khoa học máy tính Mã số: 8480101 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Người hướng dẫn khoa học: PGS.TS PHÙNG TRUNG NGHĨA THÁI NGUYÊN, 2018 MỤC LỤC MỞ ĐẦU CHƯƠNG TỔNG QUAN VỀ NGÔN NGỮ KÝ HIỆU VIỆT NAM 1.1 Tổng quan ngôn ngữ ký hiệu 1.1.1 Khái niệm ngôn ngữ ký hiệu 1.1.2 Đặc điểm ngôn ngữ học ngôn ngữ ký hiệu 1.1.3 Vai trị ngơn ngữ kí hiệu với cộng đồng người khiếm thính 1.2 Tổng quan ngơn ngữ ký hiệu Việt Nam 1.3 Tính rút gọn ngơn ngữ ký hiệu Việt Nam 11 1.4 Trật tự cú pháp ngôn ngữ ký hiệu Việt Nam 12 1.5 Ứng dụng công nghệ thông tin dịch ngôn ngữ ký hiệu 13 1.6 Mục tiêu luận văn 15 CHƯƠNG LUẬT RÚT GỌN VĂN BẢN VÀ CHUYỂN ĐỔI CÚ PHÁP ĐỐI VỚI NGÔN NGỮ KÝ HIỆU VIỆT NAM .16 2.1 Thu thập luật rút gọn ngôn ngữ ký hiệu Việt Nam 16 2.1.1 Thu thập luật rút gọn giới từ liên từ 16 2.1.2 Thu thập luật rút gọn từ tính thái 22 2.2 Thu thập luật chuyển đổi cú pháp ngôn ngữ ký hiệu Việt Nam 25 2.2.1 Vấn đề xây dựng ngân hàng câu giải cú pháp 25 2.2.2 Tổng kết đặc điểm trật tự cú pháp ngơn ngữ kí hiệu Việt Nam 31 2.3 Cơ sở liệu văn tiếng Việt 33 2.3.1 Đặc trưng văn tiếng Việt 33 2.3.2 Phân tích liệu văn tiếng Việt 36 2.3.3 Các vấn đề phân tích cú pháp Tiếng Việt 38 CHƯƠNG XÂY DỰNG HỆ THỐNG RÚT GỌN VĂN BẢN VÀ CHUYỂN ĐỔI CÚ PHÁP NGÔN NGỮ KÝ HIỆU VIỆT NAM .47 3.1 Môi trường thực nghiệm hệ thống rút gọn văn chuyển đổi cú pháp 47 3.2 Các công cụ hỗ trợ thực nghiệm 47 3.2.1 Công cụ TreeBank Editor 47 3.2.2 Bộ phân tích cú pháp Bikel 47 3.3 Cài đặt thuật toán rút gọn văn 48 3.3.1 Thuật toán rút gọn văn ngôn ngữ ký hiệu Việt Nam 48 3.3.2 Đánh giá thực nghiệm 50 3.4 Cài đặt thuật toán chuyển đổi cú pháp 53 3.4.1 Xây dựng chuyển đổi cú pháp tương ứng ngơn ngữ kí hiệu 53 3.4.2 Cài đặt thuật toán 56 3.4.3 Đánh giá, kết thực nghiệm 57 3.5 Xây dựng phần mềm thực nghiệm rút gọn văn chuyển đổi cú pháp 59 KẾT LUẬN 61 TÀI LIỆU THAM KHẢO 62 DANH MỤC HÌNH Hình 1.1 Ngơn ngữ kí hiệu hệ thơng Arthrological Hình 2.1 Quá trình gán nhãn 31 Hình 2.2 Cây cú pháp câu "tơi nhìn gái với ống nhịm” 39 Hình 2.3 Dẫn xuất phân tích top - down 42 Hình 2.4 Dẫn xuất phân tích bottom - up 45 Hình 3.1 Sơ đồ thuật toán rút gọn văn .50 Hình 3.2 Cấu trúc cú pháp chuyển đổi tương ứng sang dạng NNKH câu đơn 53 Hình 3.3 Cấu trúc cú pháp chuyển đổi tương ứng sang dạng NNKH câu phủ định dạng 53 Hình 3.4 Cấu trúc cú pháp chuyển đổi tương ứng sang dạng NNKH câu phủ định dạng 54 Hình 3.5 Cấu trúc cú pháp chuyển đổi tương ứng sang dạng NNKH câu nghi vấn dạng .54 Hình 3.6 Cấu trúc cú pháp chuyển đổi tương ứng sang dạng NNKH câu nghi vấn dạng .54 Hình 3.7 Cấu trúc cú pháp chuyển đổi tương ứng sang dạng NNKH câu đơn có bao gồm số từ .55 Hình 3.8 Sơ đồ thuật tốn chuyển đổi cú pháp .56 Hình 3.9 Kết dịch tự động câu tiếng Việt sang dạng câu ngữ pháp ngơn ngữ kí hiệu Việt Nam 58 Hình 3.10 Giao diện phần mềm thực nghiệm rút gọn chuyển đổi cú pháp 59 Hình 3.11 Giao diện phần mềm thực nghiệm rút gọn chuyển đổi cú pháp 60 Hình 3.12 Giao diện phần mềm thực nghiệm rút gọn chuyển đổi cú pháp 60 DANH MỤC BẢNG BIỂU Bảng 1.1 So sánh câu tiếng việt câu ngôn ngữ ký hiệu 12 Bảng 2.1 Một số mẫu câu rút gọn giới từ liên từ 22 Bảng 2.2 Tập nhãn từ loại 26 Bảng 2.3 Tập nhãn cụm từ 28 Bảng 2.4 Nhãn mệnh đề .28 Bảng 2.5 Nhãn chức cú pháp 29 Bảng 2.6 Nhãn chức trạng ngữ 30 Bảng 2.7 Bảng thành phần âm tiết 34 Bảng 3.1 Điểm số BLEU 52 Bảng 3.2 Điểm BLEU đánh giá tập liệu thuật toán chuyển đổi cú pháp NNKH 58 LỜI CAM ĐOAN Tơi là: Ma Ngọc Khánh Lớp: CK15 Khố học: 2016 - 2018 Chuyên ngành: Khoa học máy tính Mã số chuyên ngành: 8480101 Cơ sở đào tạo: Trường Đại học Công nghệ thông tin Truyền thông Thái Nguyên Giáo viên hướng dẫn: PGS.TS Phùng Trung Nghĩa Tôi xin cam đoan luận văn “Nghiên cứu phương pháp rút gọn văn chuyển đổi cú pháp ngôn ngữ ký hiệu Việt Nam” cơng trình nghiên cứu riêng hướng dẫn PGS.TS Phùng Trung Nghĩa Các số liệu sử dụng luận văn trung thực Các kết nghiên cứu trình bày luận văn chưa công bố cơng trình khác Thái Ngun, ngày 30 tháng năm 2018 HỌC VIÊN Ma Ngọc Khánh LỜI CẢM ƠN Học viên xin gửi lời cảm ơn chân thành tới Thầy hướng dẫn PGS.TS Phùng Trung Nghĩa, Trường Đại học Công nghệ Thông tin Truyền thông Đại học Thái Nguyên, người tận tình hướng dẫn giúp học viên hoàn thành luận văn tốt nghiệp Học viên xin gửi lời cảm ơn sâu sắc đến thầy cô giáo Trường Đại học Công nghệ Thông tin Truyền thông - Đại học Thái Nguyên, thầy cô giáo Viện Công nghệ thông tin - Viện khoa học Việt Nam nhiệt tình giảng dạy, truyền đạt kiến thức cho học viên suốt năm học để học viên hồn thành luận văn Ma Ngọc Khánh MỞ ĐẦU Hiện theo thống kê, Việt Nam có khoảng 2.5 triệu người khiếm thính [1] Do khả nghe bị suy giảm nên khả giao tiếp lời cộng đồng người khiếm thính bị hạn chế nhiều Để thay cho khả giao tiếp tiếng nói, ngơn ngữ ký hiệu, ngơn ngữ tượng hình sử dụng biểu diễn, chuyển động bàn tay, thể, sắc thái biểu cảm khuôn mặt đời Tuy nhiên, việc sử dụng ngôn ngữ ký hiệu chưa phát huy hiệu giúp người khiếm thính hịa nhập với xã hội việc giao tiếp người khiếm thính người nghe tốt cịn gặp nhiều khó khăn Trên giới nghiên cứu phát triển đưa nhiều dịch vụ thông dịch sản phẩm công nghệ nhằm hỗ trợ người khiếm thính giao tiếp xã hội máy trợ thính dành cho người nghe kém, găng tay chuyển đổi ngơn ngữ ký hiệu thành giọng nói [9], phần mềm dịch từ văn bản/giọng nói sang ngôn ngữ ký hiệu hay từ điển tra cứu ngôn ngữ ký hiệu online [12], v.v… Tuy nhiên nghiên cứu hay sản phẩm có hạn chế chưa đáp ứng việc hỗ trợ giao tiếp hai chiều người khiếm thính người nghe tốt thực tế Việc nghiên cứu xử lý ngơn ngữ ký hiệu máy tính nước ta cịn mẻ Chúng ta chưa thực có hệ thống ngôn ngữ đồng cho ngôn ngữ ký hiệu tiếng Việt [6] Bên cạnh vấn đề ngôn ngữ học, việc phát triển sản phẩm ứng dụng công nghệ để phát huy ngôn ngữ ký hiệu nhằm nâng cao trình độ, tiếp nhận thơng tin, khả giao tiếp cho người khiếm thính lại hiệu Với quan tâm đặc biệt Đảng Nhà nước, có nhiều trường học, trung tâm hỗ trợ dạy học việc làm riêng cho người khiếm thính Vì việc nghiên cứu thuật toán xây dựng phần mềm rút gọn văn bản, chuyển đổi cú pháp ngôn ngữ ký hiệu Việt Nam cần thiết [2] Do tơi chọn đề tài “Nghiên cứu phương pháp rút gọn văn chuyển đổi cú pháp ngôn ngữ ký hiệu Việt Nam” Mục tiêu luân văn Nghiên cứu lý thuyết có để phân tích, đánh giá tính chất, luật rút gọn, chuyển đổi cú pháp ngôn ngữ ký hiệu Việt Nam Dựa sở lý thuyết phân tích, đánh giá nghiên cứu cài đặt thực nghiệm thuật toán rút gọn, chuyển đổi cú pháp xây dựng phần mềm hỗ trợ rút gọn chuyển đổi cú pháp ngôn ngữ ký hiệu Việt Nam Nội dung luận văn bao gồm chương: Chương Tổng quan ngôn ngữ ký hiệu Việt Nam Chương Luật rút gọn văn chuyển đổi cú pháp ngôn ngữ ký hiệu Việt Nam Chương Xây dựng hệ thống rút gọn văn chuyển đổi cú pháp ngôn ngữ ký hiệu Việt Nam Khi viết báo cáo học viên cố gắng để đạt mục tiêu định hướng nghiên cứu đề ban đầu, song điều kiện thời gian lực cịn hạn chế nên khơng tránh khỏi thiếu sót Học viên mong nhận góp ý thầy giáo hướng dẫn, thầy giáo để học viên có kinh nghiệm thực tế bổ ích để sau xây dựng chương trình hồn thiện CHƯƠNG TỔNG QUAN VỀ NGÔN NGỮ KÝ HIỆU VIỆT NAM 1.1 Tổng quan ngôn ngữ ký hiệu 1.1.1 Khái niệm ngôn ngữ ký hiệu Ngôn ngữ ký hiệu (hay ngôn ngữ dấu hiệu, thủ ngữ) ngôn ngữ dùng biểu bàn tay thay cho âm tiếng nói Ngơn ngữ ký hiệu người điếc tạo nhằm giúp họ giao tiếp với cộng đồng tiếp thu tri thức xã hội Việc thay âm tiếng nói liên quan đến đồng thời kết hợp hình dạng tay, hướng chuyển động bàn tay, cánh tay thể, nét mặt để thể trôi chảy suy nghĩ người nói Ngơn ngữ kí hiệu có nhiều điểm tương đồng với ngơn ngữ nói (đơi gọi "ngôn ngữ miệng" - mà phụ thuộc chủ yếu vào âm thanh), lý ngơn ngữ học xem xét hai dạng ngôn ngữ ngơn ngữ tự nhiên Tuy nhiên có số khác biệt đáng kể ngôn ngữ ký hiệu ngơn ngữ nói Đặc biệt khơng nên nhầm lẫn ngơn ngữ kí hiệu với ngơn ngữ thể, loại giao tiếp phi ngôn ngữ Bất đâu cộng đồng người khiếm thính giới, ngơn ngữ ký hiệu phát triển Ngơn ngữ kí hiệu không sử dụng người điếc mà sử dụng người nghe thấy, thể chất bị hạn chế để nói chuyện bình thường Ngơn ngữ kí hiệu có thuộc tính ngơn ngữ riêng biệt Hiện nay, hàng trăm ngôn ngữ ký hiệu sử dụng giới phát triển cộng đồng người khiếm thính tất quốc gia Một số ngôn ngữ ký hiệu có cơng nhận pháp lý, số khác mang tính cục bộ, địa phương Một quan niệm sai lầm phổ biến tất ngơn ngữ ký hiệu tồn giới hồn tồn giống ngơn ngữ ký hiệu ngôn ngữ 49 thành dạng từ cụm từ- tạm gọi đơn vị ngôn ngữ Với đơn vị ngôn ngữ từ điển xây dựng số từ đồng nghĩa tương ứng Đối với thuật tốn tơi sử dụng trình bày [10], có đề cập đến khái niệm “ Trọng số từ vựng” Trong xem xét ngữ nghĩa văn bản, người ta cảm thấy dường số từ thể ngữ nghĩa nhiều từ khác Hơn nữa, có phân biệt từ ngữ chức từ ngữ mang nội dung Trong số từ ngữ mang nội dung dường thể nhiều chủ để từ khác Bất kể phương pháp dùng cho việc gán trọng số cho từ vựng cần đòi hỏi nguyên tắc gán trọng số diễn giải tốt tầm quan trọng từ vựng văn Đặc biệt ngơn ngữ kí hiệu, từ ngữ có trọng số gán tương ứng với từ loại là: giới từ, liên từ, từ tình thái… Trọng số dựa mơ hình phân bố từ, chẳng hạn phân bố Poison hay đánh giá thông tin chủ đề thông qua Entropy Một sơ đồ trọng số dùng thông dụng tf * idf với tf tần suất từ vựng văn idf nghịch đảo số lượng văn mà từ từ vựng xuất Vì trọng số từ vựng mơ hình không gian vecto ảnh hưởng trực tiếp đến kết việc rút gọn, dậy kết cụ thể phụ thuộc chủ yếu vào phương pháp gán trọng số Các bước thuật toán rút gọn văn tiến hành sau: Bước 1: Máy tách từ ( sử dụng cơng cụ phân tích cú pháp Bikel cấu trúc cú pháp Viet treebank) trả liệu cho việc tiền xử lý Dữ liệu bao gồm danh sách từ cụm từ gán nhãn Bước 2: Bằng phương pháp gán trọng số cho từ loại ta xếp từ cụm từ theo độ quan trọng 50 Bước 3: Giản lược thành phần câu theo trọng số sinh câu rút gọn Sơ đồ thuật toán rút gọn văn tiếng Việt sang dạng văn ngơn ngữ kí hiệu thể hình Hình 3.1 Sơ đồ thuật tốn rút gọn văn 3.3.2 Đánh giá thực nghiệm BLEU phương pháp để đánh giá chất lượng tài liệu dịch tự động máy, IBM đề xuất vào năm 2002 sử dụng làm phương pháp đánh giá cho nghiên cứu dịch máy Nguyên lý ban đầu phương pháp so sánh hai tài liệu dịch tự động máy chuyên gia ngôn ngữ dịch Việc so sánh thực cách phân tích thống kê trùng khớp ngẫu nhiên từ hai tài liệu có tính đến thứ tự từ câu sử dụng n-grams Cụ thể, điểm BLEU tính cách phân tích thống kê mức độ trùng hợp n-gram tài liệu dịch tự động máy tay dịch chuyên gia ngôn ngữ chất lượng cao 51 Điểm số BLEU tính sau: - NRj: số n-gram phân đoạn j dịch tham khảo (theo chuyên gia) với tham số tham chiếu phù hợp xảy phân đoạn - NTj: số n-gram đoạn j dịch (bằng máy) đánh giá - wi = N1 - Lref: số từ dịch tham chiếu (theo chuyên gia) có độ dài gần dịch ghi - Ltra: Số từ dịch (bằng máy) ghi Giá trị score đánh giá mức độ tương ứng hai dịch thực phân đoạn, phân đoạn hiểu đơn vị tối thiểu dịch, thông thường đoạn thường vài câu Các số liệu thống kê n-gram đồng xuất hiện, dựa n-gram cho phân đoạn thử nghiệm tham khảo, tính cho phân đoạn sau tích lũy tất phân đoạn Sản lượng BLEU số từ đến Giá trị cho thấy văn ứng cử viên tương tự với tài liệu tham khảo, với giá trị gần đại diện cho nhiều văn tương tự 3.3.3 Kết đánh giá thực nghiệm rút gọn văn Với liệu 200 câu đầu vào, 200 câu rút gọn chuẩn tham khảo từ tài liệu dùng cho người điếc chuyên gia ngôn ngữ ký hiệu cung cấp, sử dụng thuật tốn rút gọn trình bày để có 200 câu tương ứng rút gọn tự động Sau chúng tơi dựa phương pháp đánh giá BLEU để xem xét kết thuật toán rút gọn (kết thể 52 bảng 3.2) Tỉ lệ câu rút gọn (tương ứng với điểm BLEU = 1) chiếm 97.5% Các trường hợp cịn lại rút gọn chưa đạt tính phức tạp vấn đề nhập nhằng ngữ nghĩa chưa giải hoàn toàn Bảng 3.1 Điểm số BLEU ID Sentence Linput NRj NTj Lref Ltra BLEU score 7 3 1.000 12 12 4 1.000 15 15 6 1.000 26 20 0.7515 5 14 14 5 1.0000 … … … … … … … 99 22 16 0.8465 100 24 24 8 1.0000 … … … … … … … 199 23 23 7 1.000 200 13 18 0.9762 Với kết đánh giá phía trên, chúng tơi phân tích cài đặt thành cơng thuật tốn rút gọn văn văn tiếng Việt sang dạng văn giản lược ngơn ngữ kí hiệu Tuy nhiên, thời gian nghiên cứu có hạn nên chúng tơi đánh giá tập liệu nhỏ Kết nghiên cứu tiền đề cho việc xây dựng hệ thống dịch tự động văn tiếng Việt sang dạng văn chuẩn cú pháp ngơn ngữ kí hiệu Trong bao gồm việc chuyển đổi cú pháp văn tiếng Việt dựa đặc tính quan trọng thứ 2, trật tự từ ngơn ngữ kí hiệu mang đặc điểm riêng, khác biệt so với tiếng Việt thông thường 53 3.4 Cài đặt thuật toán chuyển đổi cú pháp 3.4.1 Xây dựng chuyển đổi cú pháp tương ứng ngơn ngữ kí hiệu Sau phân tích cú pháp văn tiếng Việt tiến hành xây dựng luật chuyển đổi cú pháp, tơi sử dụng phương pháp trình bày [11] Trên tập liệu phân tích được, kết hợp luật chuyển đổi cú pháp phân tích trên, đưa chuyển đổi cú pháp tương ứng ngơn ngữ kí hiệu sau: Hình 3.2 Cấu trúc cú pháp chuyển đổi tương ứng sang dạng NNKH câu đơn Hình 3.3 Cấu trúc cú pháp chuyển đổi tương ứng sang dạng NNKH câu phủ định dạng 54 Hình 3.4 Cấu trúc cú pháp chuyển đổi tương ứng sang dạng NNKH câu phủ định dạng Hình 3.5 Cấu trúc cú pháp chuyển đổi tương ứng sang dạng NNKH câu nghi vấn dạng Hình 3.6 Cấu trúc cú pháp chuyển đổi tương ứng sang dạng NNKH câu nghi vấn dạng 55 Hình 3.7 Cấu trúc cú pháp chuyển đổi tương ứng sang dạng NNKH câu đơn có bao gồm số từ 56 3.4.2 Cài đặt thuật toán Từ phân tích cấu trúc cú pháp chuyển đổi tương ứng tiến hành cài đặt thuật toán chuyển đổi cú pháp sau: Hình 3.8 Sơ đồ thuật tốn chuyển đổi cú pháp Bước 1: Đầu vào bao gồm câu văn tiếng Việt thơng thường cần dịch Ngồi ra, ta cần kết hợp với liệu từ điển ngôn ngữ kí hiệu 57 xây dựng bao gồm từ/cụm từ biểu diễn ngơn ngữ kí hiệu, gán nhãn xây dựng từ đồng nghĩa Bước 2: Phân tích cấu trúc cú pháp Ở sử dụng phương pháp phân tích cú pháp tiếp thống kê dựa kho ngữ liệu Viettree Bank công cụ phân tích cú pháp Bikel Bước 3: Tiến hành gán nhãn từ cụm từ câu, nhằm mục đích kết hợp với cú pháp phân tích để tìm kiếm cấu trúc câu phù hợp với luật chuyển đổi cú pháp xây dựng Bước 4: Từ kết bước nhằm mục đích kết hợp với cú pháp phân tích, bước ta tìm kiếm cấu trúc câu phù hợp với luật chuyển đổi cú pháp xây dựng Bước 5: Chuyển đổi cú pháp dạng ngơn ngữ kí hiệu từ luật chuyển đổi xây dựng 3.4.3 Đánh giá, kết thực nghiệm Để thực phương pháp dịch tự động câu tiếng việt sang dạng câu ngữ pháp ngơn ngữ kí hiệu đề xuất trên, kết đánh giá câu dịch đạt yêu cầu trợ giúp chuyên gia ngơn ngữ kí hiệu Các câu mơ hình liệu sáp nhập vào cấu trúc ngữ pháp thu cách tổng quát hóa cấu trúc Ví dụ câu "Anh đi", "Cơ đi", "Người đàn ông đi", vv sáp nhập vào cấu trúc ngữ pháp "{Anh ấy, cô ấy, người đàn ông } đi" Bằng cách phân tích tập hợp từ tham số tổng quát cấu trúc ngữ pháp xây dựng Để kiểm tra thuật toán dịch, 200 câu đơn giản lấy từ tài liệu dùng cho người điếc Chúng dựa phương pháp đánh giá BLEU để xem xét kết thuật toán chuyển đổi cú pháp ngơn ngữ kí hiệu 58 Bảng 3.2 Điểm BLEU đánh giá tập liệu thuật toán chuyển đổi cú pháp NNKH ID sentence Linput BLEU Score 1.000 1.000 0.253 1.000 … … … … … … 196 0.2778 197 1.000 198 0.5250 199 1.000 200 1.000 Kết là, 67% câu dịch tự động (tương ứng với điểm BLEU=1), 21% khơng dịch thiếu từ tương ứng với cử biểu diễn ngơn ngữ kí hiệu, 12% khơng dịch thiếu cấu trúc ngữ pháp tổng quát Hình 3.9 Kết dịch tự động câu tiếng Việt sang dạng câu ngữ pháp ngơn ngữ kí hiệu Việt Nam 59 3.5 Xây dựng phần mềm thực nghiệm rút gọn văn chuyển đổi cú pháp Với mục tiêu đặt luận văn xây dựng phần mềm thực nghiệm hỗ trợ rút gọn văn chuyển đổi cú pháp lựa chọn ngôn ngữ C# cho việc cài đặt thuật toán xây dựng phần mềm Hình 3.10 minh họa giao diện phần mềm rút gọn chuyển đổi cú pháp ngôn ngữ ký hiệu Việt Nam Hình 3.10 Giao diện phần mềm thực nghiệm rút gọn chuyển đổi cú pháp 60 Hình 3.11 Giao diện phần mềm thực nghiệm rút gọn chuyển đổi cú pháp Hình 3.12 Giao diện phần mềm thực nghiệm rút gọn chuyển đổi cú pháp 61 KẾT LUẬN Với đề tài “ Nghiên cứu phương pháp rút gọn văn chuyển đổi cú pháp ngôn ngữ ký hiệu Việt Nam”, tác giả đạt kết định, phần mềm xây dựng ngôn ngữ C# hoạt động ổn định, kết chuyển đổi tốt Đề tài có nhiều khả mở rộng ứng dụng nhiều vấn đề cần nghiên cứu phát triển Những kết mà luận văn đạt được: Luận văn tập trung nghiên cứu ngôn ngữ ký hiệu Việt Nam, vấn đề rút gọn, chuyển đổi cú pháp ngôn ngữ ký hiệu Việt Nam, nghiên cứu luật, thuật toán xây dựng phần mềm rút gọn văn bản, chuyển đổi cú pháp ngôn ngữ ký hiệu Việt Nam làm cầu nối giao tiếp người khiếm thính người nghe thuận lợi Về mặt lý thuyết: Luận văn tìm hiểu ngơn ngữ ký hiệu, ngơn ngữ ký hiệu Việt Nam, tính rút gọn, trật tự cú pháp, thu thập luật, cài đặt thuật tốn tìm hiểu ngơn ngữ lập trình C# để xây dựng môi trường thực nghiệm hệ thống rút gọn văn chuyển đổi cú pháp Về thực tiễn: Luận văn xây dựng thành công phần mềm rút gọn văn chuyển đổi cú pháp có khả rút gọn chuyển đổi đạt kết tốt Các hạn chế: Phần mềm xây dựng đơn giản, chưa có nhận dạng văn dạng âm thanh, hình ảnh, chưa có chiều chuyển ngược từ văn rút gọn sang ngôn ngữ ký hiệu Hướng phát triển: Tiếp tục nghiên cứu để xây dựng hệ thống phần mềm có nhiều tính có khả rút gọn, chuyển đổi cú pháp nhiều loại ngôn ngữ ký hiệu Khuyến nghị: Do thời gian nghiên cứu có hạn điều kiện cịn hạn chế nên kết đạt chưa đạt yêu cầu khả ứng dụng thực tiễn Tác giả mong muốn hồn thiện tương lai, q trình thực cịn nhiều thiếu xót, hi vọng nhận đóng góp ý kiến q thầy, cơ, bạn bè đồng nghiệp 62 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Báo cáo Tổng điều tra dân số, Tổng cục thống kê, 2009 [2] Đỗ Văn Ba, Báo cáo đề tài KHCN cấp Bộ “Hình thành thống hệ thống ký hiệu cử điệu cho người điếc Việt Nam”, 1997 [3] Phạm Thị Cơi (1988), Q trình hình thành ngơn ngữ nói người điếc Việt Nam, Luận án Phó tiến sĩ khoa học Ngữ văn, Viện Ngôn ngữ học, Tr 31 [4] Nguyễn Văn Khang (2012) Ngôn ngữ học xã hội, NXB Giáo dục , Tr 367 [5] Đỗ Thị Hiên (2012), Ngơn ngữ kí hiệu cộng đồng người khiếm thính Việt Nam: thực trạng giải pháp, Báo cáo tổng hợp đề tài nghiên cứu khoa học cấp bộ, Viện Khoa học xã hội Việt Nam, Tr 156 [ 6] Đặng Sinh, Truyền hình dùng ngơn ngữ ký hiệu, người điếc câm lại không hiểu, Báo điện tử Infonet, 2012 [7] Nguyễn Đức Tồn, Mấy vấn đề cú pháp ngơn ngữ kí hiệu Việt Nam, 2012 [8] Vương Hồng Tâm, Nghiên cứu cách biểu đạt ngôn ngữ kí hiệu người Điếc Việt Nam, Báo cáo tổng kết đề tài khoa học công nghệ cấp Viện, Viện khoa học giáo dục Việt Nam, 2009 Tiếng Anh [9] Bich, D N T., Phung, T N., Tat, T V., & Tung, L P (2016, December) Special Characters of Vietnamese Sign Language Recognition System Based on Virtual Reality Glove International Conference on Advances in Information and Communication Technology (pp 572-581) Springer International Publishing 63 [10] Thi Bich Diep Nguyen, Trung-Nghia Phung, Tat-Thang Vu, A rulebased method for text shortening in Vietnamese sign language translation, 4th International Conference on Information System Design and Intelligent Applications (INDIA - 2017), Springer International Publishing [11] Thi Bich Diep Nguyen and Trung-Nghia Phung, Some issues on syntax transformation in Vietnamese sign language translation, IJCSNS Vol 17 No pp 292-297 [12] M Boulares, et al Mobile sign language translation system for deaf community, International Cross-Disciplinary Conference on Web Accessibility, 2012 [13] Bauman, Dirksen, Open your eyes: Deaf studies talking University of Minnesota Press ISBN 0-8166-4619-8, 2008 [14] Pablo Bonet, J de eduction de las letras y Arte para enseñar ablar los Mudos Ed Abarca de Angulo, Madrid, ejemplar facsímil accesible en la [1], online (spanish) scan of book, held at University of Sevilla, Spain, 1620 [15] John Bulwer's "Chirologia: or the natural language of the hand.", London, mentions that alphabets are in use by deaf people, although Bulwer presents a different system which is focused on public speaking, 1644 [16] Bulwer, J Philocopus, or the Deaf and Dumbe Mans Friend, London: Humphrey and Moseley, 1648 [17] Dalgarno, George Didascalocophus, or, The deaf and dumb mans tutor Oxford: Halton, 1680 [18] Montgomery, G "The Ancient Origins of Sign Handshapes" Sign Language Studies 2(3), p.p 322-334, 2002 ... Tổng quan ngôn ngữ ký hiệu Việt Nam Chương Luật rút gọn văn chuyển đổi cú pháp ngôn ngữ ký hiệu Việt Nam Chương Xây dựng hệ thống rút gọn văn chuyển đổi cú pháp ngôn ngữ ký hiệu Việt Nam Khi viết... nghiên cứu thuật toán xây dựng phần mềm rút gọn văn bản, chuyển đổi cú pháp ngôn ngữ ký hiệu Việt Nam cần thiết [2] Do tơi chọn đề tài ? ?Nghiên cứu phương pháp rút gọn văn chuyển đổi cú pháp ngôn. .. nghiên cứu cài đặt thực nghiệm thuật toán rút gọn, chuyển đổi cú pháp xây dựng phần mềm hỗ trợ rút gọn chuyển đổi cú pháp ngôn ngữ ký hiệu Việt Nam 16 CHƯƠNG LUẬT RÚT GỌN VĂN BẢN VÀ CHUYỂN ĐỔI

Ngày đăng: 04/10/2018, 14:20

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan