Nhận xét về các cách tiếp cận

Một phần của tài liệu Nghiên cứu một số công cụ phục vụ cho việc phát triển hệ thống hỗ trợ dịch Trung Việt (Trang 34 - 36)

2.3.2.1 Tiếp cận dựa trên luật (RBMT)

Đây là cách tiếp cận kinh điển của hầu hết các hệ dịch ở Việt Nam hiện này

(như [7], [3]) nói riêng và nhiều hệ dịch trên thế giới trước đây nói chung. Tuy

nhiên, việc xậy dựng các bộ luật chuyển ngữ là điều đáng sợ vì nó tốn nhiều công sức của chuyên gia, mà lại không bao quát, khó cập nhật, khó quản lý về sau khi qui mô mở rộng. Dù sao, cách tiếp cận này cũng tỏ ra hiệu quả khi qui mô hệ dịch nhỏ hay lĩnh vực giới hạn.

2.3.2.2 Tiếp cận dựa trên thống kê (SMT)

Cách tiếp cận này có ý nghĩa về mặt phương pháp luận (tự động hóa hoàn

toàn), có nền tảng toán học (lý thuyết xác suất thống kê) vững chắc, nhưng hiện chất lượng còn thấp. Ngoài ra, ta không thể theo dõi các kết quả dịch trung gian để can

thiệp hay giải thích các kết quả đó được. Nó lại không sử dụng nhiều tri thức về

ngôn ngữ.

2.3.2.3 Tiếp cận dựa trên cơ sở tri thức (KBMT)

Cách tiếp cận này là cách làm hứa hẹn nhưng cũng vô cùng khó khăn do có

tham vọng hiểu được toàn văn bản. Việc hiểu là vô cùng khó khăn và đa số các

trường hợp, ta không cần hiểu mà vẫn dịch được. Trong trường hợp gặp nhập

nhằng, chúng ta chỉ cần hiểu đến một mức độ nào đó đề giải quyết nhập nhằng mà thôi, chứ không cần hiểu mọi chi tiết hay các trường hợp không nhập nhằng.

2.3.2.4 Tiếp cận dựa trên ví dụ (EBMT)

Đây là cách tiếp cận của một số hệ thống dịch dựa trên máy lớn hiện nay (tận dụng khả năng lưu trữ của dữ liệu khổng lồ và tốc độ tìm kiếm, so sánh cực nhành) trên thế giới, như hệ của IBM. Cách tiếp cận này đơn giản về mặt mô hình lý thuyết và trong một số trường hợp (dịch các văn bản gần giống nhau và hay lặp đi lặp lại) thì cách tiếp cận này cho ra kết quả cao bất ngờ.

2.3.2.4 Tiếp cận dựa trên ngữ liệu (CBMT)

Đây là cách tiếp cận tiên tiến gần đây, khi mà kho dữ liệu đơn ngữ hay đa

ngữ dạng điện tử ngày càng có nhiều. Cách tiếp cận này dựa trên công nghệ máy

học để rút ra các qui luật ngôn ngữ một cách tự động. Ngoài ra, với sự biến đổi của ngôn ngữ hay chuyển đổi lĩnh vực dịch, thì cách tiếp cận này tỏ ra hiệu quả trong việc cập nhật bộ luật của nó.

2.3.2.4 Cách tiếp cận lai

Đây là xu hướng hiện nay, vì mỗi cách tiếp cận đều có những ưu-khuyết điểm riêng, Chính vì vậy, sự lai tạo giữa các cách tiếp cận sẽ tận dụng được thế mạnh của từng cách tiếp cận, nhằm nâng cao hiệu quả hệ dịch.

2.4. Kết chương

Qua các phương pháp dịch máy trình bày trên, có thể thấy các phương pháp

dịch máy đều có những mặt mạnh, mặt yếu riêng, và chưa thấy có một giải pháp

CHƯƠNG 3. CÁC ĐẶC TRƯNG CA DCH

TRUNG (HÁN) – VIT

Một phần của tài liệu Nghiên cứu một số công cụ phục vụ cho việc phát triển hệ thống hỗ trợ dịch Trung Việt (Trang 34 - 36)

Tải bản đầy đủ (PDF)

(67 trang)