Thông tin biến cách của từ

Một phần của tài liệu tích hợp thông tin hình thái từ vào hệ dịch máy thống kê anh việt (Trang 45)

Do tiếng Anh thuộc ngôn ngữ biến hình và tiếng Việt thuộc ngôn ngữ đơn lập nên phương thức ngữ pháp dùng để biểu thị ý nghĩa ngữ pháp của hai ngôn ngữ cũng khác nhau [1, tr. 46]. Tiếng Anh dùng hình vị phụ tố, tiếng Việt dùng từ hư. Tuy nhiên hầu hết các trường hợp dẫn xuất và biến cách trong tiếng Anh đều có ánh xạ tương ứng sang tiếng Việt. [1] đưa ra danh sách đối chiếu hình thái từ cho các tiền tố, hậu tố của tiếng Anh và nghĩa tiếng Việt tương ứng.

Dựa vào đặc điểm trên, luận văn khai thác thông tin phụ tố để cải tiến hệ dịch. Trường hợp từ không dịch được do từ không có trong ngữ liệu có thể chia làm hai dạng, dạng một là từ hoàn toàn không có trong ngữ liệu, cách khắc phục dạng này là mở rộng ngữ liệu huấn luyện. Dạng thứ hai là từ không có trong ngữ liệu nhưng biến cách của nó lại nằm trong ngữ liệu, ví dụ như hệ thống có thể dịch được từ “house” thành “ngôi nhà” nhưng lại không thể dịch được từ “houses” thành “những ngôi nhà”. Vì từ “house” và “houses” được hệ thống xem như là hai từ khác biệt,

không có mối liên hệ nào với nhau. Để khắc phục khuyết điểm này, trong quá trình cài đặt, luận văn xem từ “houses” như là hai từ “house” và “s”. Như vậy, hệ thống có thể dịch được các từ dạng này mà không cần phải bổ sung mở rộng ngữ liệu song ngữ huấn luyện.

Trong khuôn khổ của đề tài, luận văn khảo sát sự biến đổi kết quả dịch khi chuyển từ tiếng Anh về dạng nguyên mẫu và thêm thông tin phụ tố biến cách.

Ngoài ra, luận văn còn thực thi thêm mô hình kết hợp chuyển về từ nguyên mẫu, thêm phụ tố và tích hợp nhãn từ loại vào câu tiếng Anh.

Một phần của tài liệu tích hợp thông tin hình thái từ vào hệ dịch máy thống kê anh việt (Trang 45)

Tải bản đầy đủ (DOCX)

(96 trang)
w