Như đã trình bày trong chương 2: Các phương pháp dịch máy, thông
thường một hệ dịch trực tiếp hoạt động theo 3 giai đoạn:
Tiền xử lý: Ngắt đoạn cần dịch thành dãy các câu.
Xử lý: Hệ phân tích câu cần dịch thành dãy các từ, sau đó dựa trên từ điển song ngữ, tìm hình thái và nghĩa cho từng từ.
Sinh câu đích thích hợp.
Do tính chất của đề tài, áp dụng chủ yếu trên tài liệu hàng không; Và do đặc thù của ngôn ngữ hàng không (xin lấy một số ví dụ, như: taxi: lăn bánh
chậm để cất hạ cánh, bank: nghiêng cánh; park: đỗ; land: hạ cánh; flap: cánh
tà sau; book: đặt vé giữ chỗ, .v.v. cũng như rất nhiều thuật ngữ viết tắt khác). Có thể nói, thuật ngữ trong ngành hàng khơng khá hiếm từ đa nghĩa. Không gian của nghĩa từ là kín. Điều này được minh họa trong 03 ấn phẩm (sách) trình bày trên.
Mặc dầu có sẵn trong tay kho ngữ liệu từ hàng khơng, trình thử nghiệm này vẫn chưa đạt đến mức hoàn thiện. Do thời gian nghiên cứu và thực hiện một luận văn cao học có hạn và do khả năng thực sự cịn rất hạn chế, chúng tôi tự đánh giá thử nghiệm này mới chỉ là bước đầu nghiên cứu.
Trong luận văn, chúng tôi mạnh dạn đề nghị hướng thực hiện là dịch trực tiếp: Khối lượng từ không lớn, số lượng câu giới hạn, lĩnh vực là chuyên môn, khá hiếm nhập nhằng về ngữ nghĩa, có áp dụng các thuật tốn tác động đến
câu truy vấn để tìm kết quả thích hợp nhất, văn bản nguồn có phong cách đơn giản. Tốc độ thực hiện nhanh. Nhược điểm của phương pháp này là khơng thể
TÌM HIỂU KỸ THUẬT DỊCH MÁY VÀ ỨNG DỤNG VÀO TÀI LIỆU HÀNG KHƠNG
áp dụng cho các loại hình ngơn ngữ văn học nghệ thuật, có khơng gian mở về ngữ nghĩa.
Mặc dầu vậy, được kế thừa từ 3 cuốn từ điển hàng khơng có giải nghĩa,
nên ứng dụng thử nghiệm này có thể xem là một chương trình dịch có giải
nghĩa.
Và thuật tốn, mơ phỏng theo hướng phrase-based (đơn vị được dịch là
một chuổi các từ liên tiếp) chứ không phải là word-based (đơn vị để dịch là
từ, word-for-word) là một phương pháp mới trong xu hướng dịch trực tiếp.