Hệ dịch máy thống kê mã nguồn mở Moses

Một phần của tài liệu (LUẬN văn THẠC sĩ) sử dụng mô hình ngôn ngữ bloom filter trong cải tiến dịch máy thống kê (Trang 46 - 47)

4. Những nội dung nghiên cứu chính

3.1Hệ dịch máy thống kê mã nguồn mở Moses

Moses là hệ dịch máy thống kê cho phép người dùng dễ dàng tạo ra mơ hình dịch cho bất cứ một cặp ngôn ngữ nào. Moses cung cấp cả hai loại mơ hình dịch là dựa trên cụm và dựa trên cây. Bộ công cụ Moses (Moses Toolkit) là một bộ nghiên cứu dịch học thuật đầy đủ. Nó bao gồm đầy đủ các thành phần để tiền xử lý dữ liệu, huấn luyện mơ hình ngơn ngữ và mơ hình dịch. Nó cũng bao gồm các cơng cụ tuning cho các mơ hình này sử dụng huấn luyện với lỗi tối thiểu và đánh giá kết quả dịch sử dụng điểm BLEU. Moses sử dụng các chuẩn cơng cụ ngồi cho một số cơng việc để tránh sự trùng lặp, như GIZA++[8](Och, et al., 2003) cho gióng hàng từ và SRILM cho mơ hình hóa ngơn ngữ.

Moses sử dụng các chuẩn cơng cụ ngồi với một số cơng việc để tránh sự trùng lặp, như GIZA++ cho gióng hàng từ và SRILM cho mơ hình hóa ngơn ngữ. Đồng thời, bởi các tác vụ thường tốn CPU, bộ công cụ được thiết kế để làm việc với Sun Grid Engine trong môi trường song song để tăng hiệu quả đầu ra.

Bộ công cụ được lưu trữ và phát triển trên sourceforge.net từ khi tạo ra.

Moses có một cộng đồng nghiên cứu đang hoạt động . (Tải về tại: http://sourceforge.net/projects/mosesdecoder/).

Các thử nghiệm trình bày trong luận văn này đều được thực hiện trên cùng một máy tính cấu hình như sau:

• CPU: Intel(R) Core(TM) i3 – 3110M 2.40GHz RAM: 4GB DDR2

• Hệ điều hành: Ubuntu 12.04 64-bit

Trong chương này, chúng tơi trình bày thử nghiệm xây dựng các mơ hình ngơn ngữ với hai cơng cụ RandLM và SRILM.

Một phần của tài liệu (LUẬN văn THẠC sĩ) sử dụng mô hình ngôn ngữ bloom filter trong cải tiến dịch máy thống kê (Trang 46 - 47)