1. Kết luận
Luận án đã triển khai nghiên cứu các yếu tố quan trọng ảnh hưởng đến chất lượng kết quả hệ thống dịch tự động tiếng Việt là kho ngữ liệu và phương pháp dịch, từ đó đề xuất được các giải pháp cụ thể nhằm cải tiến chất lượng của các hệ thống dịch tiếng Việt. Các nội dung nghiên cứu cụ thể như sau:
- Nghiên cứu về các phương pháp đánh giá chất lượng bản dịch máy, triển khai đánh giá tổng quát và chi tiết chất lượng của các hệ thống dịch tiếng Việt đang hoạt động hiện nay, cung cấp các số liệu làm cơ sở để phân tích, so sánh giữa các hệ thống dịch và chất lượng dịch ở các lĩnh vực khác nhau trong cùng một hệ thống cũng như có thể so sánh với chất lượng các hệ thống dịch ở các ngôn ngữ khác. Trên cơ sở đó đưa ra cái nhìn tổng thể về chất lượng của các hệ thống dịch tiếng Việt hiện có. Nghiên cứu cũng đề xuất phương pháp và số đo mới để tính tốn chất lượng các kết quả dịch trong q trình người dùng hiệu đính bản dịch máy. Phương pháp này đảm bảo tính chính xác, đồng thời tiết kiệm được nguồn lực tổ chức đánh giá.
- Nghiên cứu về các kho ngữ liệu phục vụ cho dịch tự động tiếng Việt và đề xuất giải pháp nhằm cải tiến chất lượng của các kho ngữ liệu. Các giải pháp cải tiến này ở cả khía cạnh cải tiến chất lượng và số lượng, bao gồm giải pháp mở rộng và hợp nhất kho ngữ liệu; giải pháp xây dựng kho ngữ liệu lớn; giải pháp xác định danh từ riêng bằng cách kết hợp thuật toán Maximum Matching và phân tích mối quan hệ giữa các thành tố văn bản; giải pháp xác định giới hạn từ ghép tiếng Việt từ mơ hình phân phối từ và cụm từ trong văn bản. Trên cơ sở đó nghiên cứu tiến hành xây dựng các mơ đun phần mềm để mô phỏng các giải pháp đề xuất và thử nghiệm cho kết quả tốt. Từ các giải pháp hợp nhất và mở rộng kho ngữ liệu nêu trên, nghiên cứu cũng triển khai thu thập được kho ngữ liệu có số lượng lớn, chất lượng tốt gồm 1.479.000 cặp câu song ngữ Anh – Việt để phục vụ cho các hệ thống dịch tự động tiếng Việt.
- Nghiên cứu về các phương pháp dịch tự động và đề xuất giải pháp ứng dụng mơ hình học máy mạng nơ ron vào bài toán dịch tự động tiếng Việt nhằm nâng cao chất lượng của hệ thống dịch. Nghiên cứu cũng tổ chức cài đặt và huấn luyện các mơ hình dịch thống kê và dịch sử dụng mạng nơ ron và so sánh kết quả của các mơ hình dịch này, qua đó cho thấy sự phù hợp của mơ hình dịch sử dụng mạng nơ ron trong bài toán dịch tự động tiếng Việt. Nghiên cứu và đề xuất mơ hình của hệ thống dịch tự động hướng ngữ nghĩa, thơng qua đó các hệ thống dịch có thể cung cấp đầy đủ ngữ nghĩa theo ngữ cảnh của văn bản cần dịch và giúp cho người đọc hiểu toàn vẹn nội dung văn bản.
- Xây dựng và triển khai hệ thống dịch tự động Anh – Việt có tên gọi VIKI Translator, cung cấp cho người dùng thông qua môi trường Internet. Hệ thống dịch này là sản phẩm ứng dụng các giải pháp đã được đề xuất trong nghiên cứu, được xây dựng có cơ sở đánh giá lại tính hiệu quả của các giải pháp cải tiến chất lượng dịch tiếng Việt. Hệ thống đã có hơn một triệu lượt sử dụng và đã được đánh giá tích cực từ phía người dùng.