Thông tin biến cách của từ

Một phần của tài liệu ĐỀ TÀI: TÍCH HỢP THÔNG TIN HÌNH THÁI TỪ VÀO HỆ DỊCH MÁY THỐNG KÊ ANH-VIỆT pptx (Trang 45 - 46)

Do tiếng Anh thuộc ngôn ngữ biến hình và tiếng Việt thuộc ngôn ngữ đơn lập nên phƣơng thức ngữ pháp dùng để biểu thị ý nghĩa ngữ pháp của hai ngôn ngữ cũng khác nhau [1, tr. 46]. Tiếng Anh dùng hình vị phụ tố, tiếng Việt dùng từ hƣ. Tuy nhiên hầu hết các trƣờng hợp dẫn xuất và biến cách trong tiếng Anh đều có ánh xạ tƣơng ứng sang tiếng Việt. [1] đƣa ra danh sách đối chiếu hình thái từ cho các tiền tố, hậu tố của tiếng Anh và nghĩa tiếng Việt tƣơng ứng.

Dựa vào đặc điểm trên, luận văn khai thác thông tin phụ tố để cải tiến hệ dịch. Trƣờng hợp từ không dịch đƣợc do từ không có trong ngữ liệu có thể chia làm hai dạng, dạng một là từ hoàn toàn không có trong ngữ liệu, cách khắc phục dạng này là mở rộng ngữ liệu huấn luyện. Dạng thứ hai là từ không có trong ngữ liệu nhƣng biến cách của nó lại nằm trong ngữ liệu, ví dụ nhƣ hệ thống có thể dịch đƣợc từ “house” thành “ngôi nhà” nhƣng lại không thể dịch đƣợc từ “houses” thành “những ngôi nhà”. Vì từ “house” và “houses” đƣợc hệ thống xem nhƣ là hai từ khác biệt,

Trang 45

không có mối liên hệ nào với nhau. Để khắc phục khuyết điểm này, trong quá trình cài đặt, luận văn xem từ “houses” nhƣ là hai từ “house” và “s”. Nhƣ vậy, hệ thống có thể dịch đƣợc các từ dạng này mà không cần phải bổ sung mở rộng ngữ liệu song ngữ huấn luyện.

Trong khuôn khổ của đề tài, luận văn khảo sát sự biến đổi kết quả dịch khi chuyển từ tiếng Anh về dạng nguyên mẫu và thêm thông tin phụ tố biến cách.

Ngoài ra, luận văn còn thực thi thêm mô hình kết hợp chuyển về từ nguyên mẫu, thêm phụ tố và tích hợp nhãn từ loại vào câu tiếng Anh.

Một phần của tài liệu ĐỀ TÀI: TÍCH HỢP THÔNG TIN HÌNH THÁI TỪ VÀO HỆ DỊCH MÁY THỐNG KÊ ANH-VIỆT pptx (Trang 45 - 46)

Tải bản đầy đủ (PDF)

(92 trang)