Giúng hàng cõu

Một phần của tài liệu Xây dựng chương trình dịch tự động Anh - Việt bằng phương pháp thống kê (Trang 33)

2.2.1. Giới thiệu

Giúng hàng văn bản thƣờng là bƣớc bắt buộc đầu tiờn trong việc sử dụng cỏc corpus văn bản đa ngữ. Nú thƣờng đƣợc sử dụng trong rất nhiều lĩnh vực trong xử lý ngụn

ngữ tự nhiờn nhƣ biờn soạn từ điển, dịch mỏy, xử lý nhập nhằng ngữ nghĩa, khụi phục thụng tin, ...vv.

Vấn đề giúng hàng văn bản khụng phải khụng phải hề đơn giản. Ngƣời dịch khụng phải luụn dịch một cõu trong văn bản nguồn thành một cõu trong văn bản đớch mặc dự theo nghĩa tự nhiờn thỡ hầu hết là nhƣ vậy. Vỡ vậy vần đề tỡm cỏc cõu tƣơng ứng giữa hai văn bản song ngữ là hết sức quan trong trong việc giúng hàng văn bản. Gần đõy, cú rất nhiều cụng nghệ tự động đƣợc đề xuất để giải quyết bài toỏn giúng hàng cõu trong corpus song ngữ (Kay và Roscheisen 1988; Catizne at al. 1989; Gale & Church[14]; Brown at al. 1991; Chen 1993, ...) và cỏch tiếp cận dựa vào độ dài cõu tuy đơn giản mà khỏ hiệu quả (Church 1993; Dagan et al. 1993). Gần đõy, cỏch tiếp cận của Robert C.M[25] đó kết hợp giữa cỏch tiếp cận độ dài cõu và sự tƣơng ứng của từ cho kết quả rất cao trong cỏc cặp ngụn ngữ Anh-Phỏp, Anh-Tõy Ban Nha.

Vớ dụ: Output:

Tiếng Anh:

When you let someone else negotiate on your behalf, you lose a major relationship with your boss or your prospective boss. You should negotate yourself and, if possible, do it directly with your future boss. Make her your ally in the negotiating process and she will work hard to make sure that you are happy with the offer.

Tiếng Việt:

Khi bạn nhờ một người khỏc thương lượng chuyện lương bổng cho bạn, bạn đó mất đi một lợi thế chớnh: khả năng sử dụng những mối quan hệ với sếp hay vị sếp tương lai. Bạn nờn tự mỡnh thảo luận với vị sếp tương lai và gõy cho họ ấn tượng tốt với khả năng thương lượng của mỡnh.

Khi chạy chƣơng trỡnh giúng hàng cõu, output nhƣ sau:

When you let someone else negotiate on your behalf, you lose a major relationship with your boss or your prospective boss

(Khi bạn nhờ một người khỏc thương lượng chuyện lương bổng cho bạn, bạn đó mất đi một lợi thế chớnh: khả năng sử dụng những mối quan hệ với sếp hay vị sếp tương lai.)

You should negotate yourself and, if possible, do it directly with your future boss. Make her your ally in the negotiating process and she will work hard to make sure that you are happy with the offer.

(Bạn nờn tự mỡnh thảo luận với vị sếp tương lai và gõy cho họ ấn tượng tốt với khả năng thương lượng của mỡnh.)

Vớ dụ nhƣ ở đoạn văn bản trờn: Đoạn tiếng Anh cú 3 cõu, đoạn tiếng Việt cú 2 cõu. Khi giúng hàng ta phải đƣa ra kết quả nhƣ phần output ở trờn.

Ngày nay, do sự phỏt triển của Internet, cú khỏ nhiều cỏc trang web song ngữ Anh- Việt xuất hiện trờn mạng. Do đú, việc cú một chƣơng trỡnh giúng hàng cõu tự động cho corpus Anh-Việt là hết sức quan trọng. Chỳng tụi đó sử dụng kết hợp hai phƣơng phỏp tiếp cận: dựa vào độ dài cõu và sự tƣơng ứng của từ để xõy dựng chƣơng trỡnh này.

Một phần của tài liệu Xây dựng chương trình dịch tự động Anh - Việt bằng phương pháp thống kê (Trang 33)