Các cách tiếp cận lai (hybrid MTs)

Một phần của tài liệu Nghiên cứu một số công cụ phục vụ cho việc phát triển hệ thống hỗ trợ dịch Trung Việt (Trang 31 - 32)

Ở các phần trên, chúng ra đã giới thiệu các cách tiếp cận chính đã được dùng trong xử lý ngôn ngữ nói chung và dịch máy nói riêng. Tuy nhiện, thực tế đã chứng minh rằng ít có hệ dịch nào thành công mà chỉ dùng một cách tiếp cận duy nhất. Mà hầu hết các hệ thực tế hiện nay thường là sự kết hợp, lai tạo giữa các cách tiếp cận khác nhau nói trên. Kiểu tiếp cận lai như thế nhằm khai thác thế mạnh của mỗi cách

tiếp cận thành phần để gia tăng sức mạnh xử lý. Các kiểu tiếp cận lai nói trên ngày càng xuất hiện nhiều trong các hệ dịch máy, như:

• Cách tiếp cận CBSO (Corpus-Based Statistics-Orinted) của hệ dịch máy Anh-Hoa ArchTran [21] và sự kết hợp giữa cách tiếp cận dựa trên luật (RBMT) và cách tiếp cận dựa trên thống kê (SMT).

• Dự án dịch máy PANGLOSS [18] của ISI/USC, Mỹ đã kết hợp cách tiếp

cận dựa trên cơ sở tri thức (KBMT) và cách tiếp cận dựa trên thống kê (SMT).

• Một hệ dịch ở Trung Quốc [12] đã sử dụng cách tiếp cận vừa dựa trên luật

cố định (RBMT), vừa dựa trên ngữ liệu (CBMT) và vừa dựa trên thống kê (SMT). Gần đây, các nhà nghiên cứu dịch máy của Nhật đã khai thác nhiều theo cách tiếp cận lai này bằng cách: vừa sử dụng CBMT vừa kết hợp với SMT và trong đó họ sử dụng thêm nhiều heuristics khác nhau để giải quyết từng trường hợp khác nhau

[23]. Chẳng hạn, để phân tích cú pháp, họ còn dựa trên các mẫu câu (sentence

patterns), các khung luật (rule templates); để khử nhập nhằng ngữ nghĩa, họ dùng

song ngữ để rút ra các từ, cụm từ, ngữ tương ứng giữa 2 ngôn ngữ (Anh-Nhật).

Cách tiếp cận lai như thế này về mặt lý thuyết thì không vững chắc, nhưng về mặt thực tế lại khả quan, nhất là trong các hệ dịch thương mại.

Một phần của tài liệu Nghiên cứu một số công cụ phục vụ cho việc phát triển hệ thống hỗ trợ dịch Trung Việt (Trang 31 - 32)