CÁC HỆ THỐNG DỊCH TỰ ĐỘNG

Một phần của tài liệu Trí tuệ nhân tạo (Trang 100 - 101)

Vào những năm 60 của thế kỉ trước, người ta hi vọng máy tính có thể dịch từ một ngôn ngữ tự nhiên này sang một ngôn ngữ tự nhiên khác, đơn giản như máy Turing “dịch” các bản văn mã thành các bản văn rõ. Nhưng vào năm 1966, người ta nhận thấy rằng việc dịch đòi hỏi một sự

hiểu biết về nghĩa của văn bản (và hơn nữa là những hiểu biết chi tiết về thế giới), trong khi đó việc giải mã chỉ phụ thuộc vào các tính chất ngữ pháp của văn bản.

Điều đó không làm mất ý nghĩ về việc dịch máy. Thực tếđã có nhiều hệ thống dịch máy, hàng ngày đã tiết kiệm rất nhiều so với việc xử lý hoàn toàn thủ công. Một trong hệ thống thành công nhất là hệ thống TAUM METEO, được phát triển bởi trường đại học Montral. Nó đã dịch

các báo cáo thời tiết từ tiếng Anh sang tiếng Pháp. Nó làm được việc này bởi vì ngôn ngữđược sử

dụng trong các báo cáo thời tiết của chính phủ có mẫu và quy tắc chặt chẽ.

Một lĩnh vực khác rộng hơn, mà kết quả gây ấn tượng không kém, đó là hệ thống SPANAM (Vascocellos và Leon, 1985). Nó có thẻ dịch một đoạn văn bản tiếng Tây Ban Nha sang tiếng Anh với chất lượng hầu như hiểu được tất cả, nhưng không đúng ngữ pháp và hiếm khi trôi chảy. Việc dịch máy là không đầy đủ. Nhưng khi người dịch có được văn bản như vậy, người dịch có thể dịch nhanh gấp bốn lần. Một số người có thể dịch thẳng từ văn bản đó không cần đọc bản gốc. Giá phải trảđối với hiệu quả của việc dịch máy là để có các thông tin rộng rãi, hệ thống dịch máy phải có lượng từ vựng từ 20.000 đến 100.000 từ và 100 đến 10.000 quy tắc ngữ pháp. Các con sốđó phụ thuộc vào việc chọn hình thức dịch.

Việc dịch là khó vì, trong trường hợp tổng quát, nó đòi hỏi hiểu biết sâu sắc về văn bản, và tình huống trong giao tiếp. Thực vậy, ngay cảđối với các văn bản rất đơn giản – thậm chí chỉ

có một từ. Xét từ “Open” trên cửa ra vào của một cửa hàng. Nó có nghĩa là đang đón khách. Cũng từ “Open” trên một biển quảng cáo lớn của một nhà hàng mới khánh thành, nó có nghĩa là nhà hàng đang trong những ngày làm việc, nhưng người đọc không cảm thấy bị lừa dối khi nhà hàng

đóng cửa vào ban đêm mà không tháo biển quảng cáo. Một từ có thể mang nhiều nghĩa khác nhau. Trong một số ngôn ngữ khác, có một từ hoặc cụm từ như vậy sẽđược sử dụng trong cả hai trường hợp.

Vấn đềđó cho thấy trong các ngôn ngữ khác nhau sự phân loại từ là khác nhau. Để dịch tốt, người dịch (người, máy) phải đọc văn bản gốc hiểu được nghĩa mà nó mô tả, và tìm một văn bản tương ứng trong ngôn ngữđích có một nghĩa tương đương. Ở đây có nhiều lựa chọn. Người dịch (cả máy và người) đôi khi khó có một sự lựa chọn.

Một phần của tài liệu Trí tuệ nhân tạo (Trang 100 - 101)

Tải bản đầy đủ (PDF)

(171 trang)