Dịch máy là bài tốn đã được đặt ra từ hơn 50 năm nay và cũng là bài tốn cực kỳ khĩ do tính nhập nhằng vốn cĩ của ngơn ngữ tự nhiên. Từđĩ đến nay, đã cĩ nhiều chiến lược, cách tiếp cận mơ hình để giải quyết như chưa thể trọn vẹn được. Do ý nghĩa thực tiễn của nĩ quá lớn nên con người vẫn khơng ngừng cải tiến để nâng cao chất lượng dịch của nĩ.
Qua luận văn này, mơ hình học luật chuyển đổi từ ngữ liệu song ngữ cho hệ dịch tự động Anh-Việt đã được kiểm chứng ở phần xử lý ngữ nghĩa. Mơ hình tỏ ra rất đúng đắn thơng qua việc sử dụng ngữ liệu song ngữđãđược liên kết từ. Các mối liên kết từ cĩ được khơng chỉ giúp thu nhận gấp đơi tri thức từ hai ngơn ngữ mà thu được hơn thế nhiều lần. Trong bài tốn xử lý ngữ nghĩa, nhờ vào ngữ liệu song ngữ được liên kết từ mà việc xây dựng ngữ liệu huấn luyện ít vất vả hơn, thời gian xây dựng nhanh hơn, và đảm bảo chính xác hơn so với việc chỉ sử dụng người xây dựng.
Với những kết quảđãđược thử nghiệm, phần xử lý ngữ nghĩa cho hệ dịch tự động Anh-Việt bước đầu đã hoạt động hiệu quả, gĩp phần phục vụ nhu cầuthấy là hiểucủa nhiều người. Mặc dù những kết quả thử nghiệm là tốt nhưng chúng tơi hiểu rằng vấn đề mà luận văn này giải quyết là một vấn đề vơ cùng khĩ khăn trong lĩnh vực ngơn ngữ học cũng như trong lĩnh vực áp dụng trí tuệ nhân tạo. Dưới đây là những hạn chế và cũng là những hướng mở mà luận văn phải phát triển tiếp tục trong thời gian tới để hồn thiện hơn nữa khối xử lý ngữ nghĩa nĩi riêng và cho hệ dịch máy Anh-Việt nĩi chung.
Thứ nhất, chúng tơi muốn đề cập đến việc mở rộng lĩnh vực giải quyết cho hệ dịch tự động. Trong thời đại giao tiếp quốc tế rộng mở như hiện nay, rõ ràng là rất cần nhiều hệ dịch tựđộng cho các lĩnh vực khác nhau. Luận văn này chỉ mới giải quyết các nhập nhằng ngữ nghĩa cho các tài liệu tin học. Song nhưđã đề cập, việc
Khoa C NTT - Ð H KHTN TP.H CM Khoa C NTT - Ð H KHTN TP.H CM
KẾT LUẬN – HƯỚNG PHÁT TRIỂN
mở rộng lĩnh vực xem xét sẽ khơng thay đổi, ảnh hưởng nhiều đến mơ hình. Khĩ khăn chủ yếu là nguồn ngữ liệu phục vụ tiếp cho các lĩnh vực cần mở rộng. Nhưng chúng tơi tin rằng nhờcác cơng cụ sử dụng trong luận văn này, việc mở rộng lĩnh vực dịch chỉ cịn là vấn đề thời gian.
Thứ hai, một số vấn đề chưađược giải quyết nhưthếđại từ(anaphora),hiện tượng tỉnh lược(ellipsis). Những vấn đề này đã làm cho chất lượng đầu ra của câu tiếng Việt chưa được hay lắm.
Thứ ba, bên cạnh những vấn đề của riêng khối xử lý ngữ nghĩa, cịn cĩ những vấn đề khác liên quan gián tiếp làmảnh hưởng đến chất lượng của khối xử lý ngữ nghĩa mà trong tương lai chúng tơi phải tiếp tục khắc phục như phân tích hình thái học, phân tích cú pháp…