Hướng tiếp cận sử dụng case-frame

Một phần của tài liệu Xây dựng chương trình chuyển đổi cây cú pháp trong hệ dịch tự động Anh-Việt (Trang 39 - 40)

Phương pháp chuyển đổi sử dụng cách biểu diễn trung gian case-frame (biểu diễn khung) đã được ứng dụng cho tiếng Anh-Thổ Nhĩ Kỳ [20].

Trong cách tiếp cận này, câu tiếng Anh được phân tích thành dạng QLF (Quasi Logical Form) [20], sau đĩ được chuyển thành biểu diễn trung gian dạng case-frame. QLF khơng được chọn làm biểu diễn trung gian cho giai đoạn chuyển

đổi vì nhiều lý do. Trước hết, QLF là một cấu trúc vị từđối số (predicate-argument), nĩ khơng chứa đựng những chức năng cú pháp của một câu. Thực hiện việc chuyển

đổi cấu trúc trên cách biểu diễn đĩ hồn tồn khơng khả thi. Hơn nữa, sử dụng QLF làm biểu diễn trung gian sẽ giới hạn khả năng của hệ dịch máy vào bộ phân tích CLE và do đĩ hệ thống sẽ chỉ làm việc với ngơn ngữ nguồn là tiếng Anh. Một lý do khác là thơng tin cần thiết cho câu tiếng Thổ trong một QLF rất khĩ đạt được. Vì thế, để thực thi một hệ dịch máy cĩ tính uyển chuyển, khơng phụ thuộc ngơn ngữ

nguồn hay một bộ phân tích nào đĩ, một cách biểu diễn tổng quát hơn, đĩ là case- frame. Case-frame đã được tận dụng như một cách biểu diễn trung gian.

Quá trình chuyển đổi sử dụng case-frame thực chất là một quá trình ánh xạ

tuần tự từ case-frame này sang case-frame kia theo cách thức xây dựng dần. Những

điểm đặc trưng và những mối quan hệ ngữ pháp của case-frame nhập được chuyển

đổi riêng. Sau đĩ, chúng lại kết hợp với nhau để phát triển thành một case-frame ngơn ngữđích. Những luật chuyển đổi cĩ dạng sau (theo ký hiệu ngơn ngữ Prolog):

Rulename (SourceCF, Variable, Checklist) :- If condition then Variable = TargetCf.

Bước đầu tiên trong giai đoạn chuyển đổi là xác định loại câu nguồn, chẳng hạn như : câu đơn, câu điều kiện, câu liên hợp, ... Nếu câu là một câu ghép chứa các mệnh đề độc lập, thì những mệnh đề này được xem xét riêng như từng case-frame riêng lẻ. Tiếp tục đệ qui, mỗi case-frame này sẽ được phân tích để tạo ra một bản liệt kê những mục cần kiểm tra (checklist) của câu bao gồm tất cả những thơng tin quan trọng về câu hay mệnh đề.

Các thành tố của khối chuyển đổi chỉ cĩ thể truy xuất một phần nào đĩ của case-frame, sau đĩ, nếu một luật chuyển đổi cần tham khảo đến những tính chất của một phần ở xa nĩ trong case-frame, thì những tính chất xác định đĩ cĩ thể nằm ngồi phạm vi truy xuất của nĩ. Để giải quyết vấn đề này, ở mức chiếu cực đại, thơng tin quan trọng cĩ thể địi hỏi bới việc chuyển đổi từ vựng cấu trúc và phức hợp được lưu lại trong một bản liệt kê những mục cần kiểm tra. Khi tiến trình chuyển đổi tiếp tục thực hiện, bản liệt kê này được tham chiếu đến để hạn chế việc dịch mặc định và kiểm sốt những ngoại lệ.

Cĩ 3 loại bản liệt kê các mục cần kiểm tra được sử dụng trong suốt quá trình chuyển đổi, đĩ là bản liệt kê cấp độ câu, động từ, và danh ngữ. Bản liệt kê câu cĩ thểđược truy xuất tới từ bất cứđâu trong khối chuyển đổi, trong khi đĩ bản liệt kê

động từ và danh ngữđược sử dụng cho chuyển đổi động từ và danh ngữ.

Một phần của tài liệu Xây dựng chương trình chuyển đổi cây cú pháp trong hệ dịch tự động Anh-Việt (Trang 39 - 40)