Bên cạnh đó, một số nhóm nghiên cứu khác tạo luật chuyển đổi trật tự dựa trên thông tin từ loại. Tác giả khảo sát sự khác biệt về trật tự của các cặp ngôn ngữ và rút ra các luật chuyển đổi.
Nhóm nghiên cứu của Hermann Ney [20] đƣa ra hai cách chuyển đổi trật tự tuỳ thuộc vào cặp ngôn ngữ và chiều dịch: đổi trật tự nội bộ trong các danh từ và tính từ khi dịch từ Tây Ban Nha và dịch sang Tây Ban Nha, đổi trật tự cho động từ khi dịch sang tiếng Đức. Kết quả giảm đƣợc 2% WER và tăng 7% BLEU.
- Chuyển đổi cục bộ: Trong tiếng Tây Ban Nha, tính từ đặt sau danh từ, trong
khi tiếng Anh và hầu hết những ngôn ngữ không thuộc dòng Roman thì trật tự ngƣợc lại. Nếu dịch từ tiếng Tây Ban Nha thì danh từ sẽ đƣợc đảo ra sau. Nếu dịch sang tiếng Tây Ban Nha thì ở câu nguồn, tính từ chuyển ra sau danh từ.
- Chuyển đổi xa: Trong tiếng Đức, động từ thƣờng đƣợc đặt ở cuối câu nếu ở
dạng nguyên mẫu (infinitive) hay quá khứ phân từ (past participle). Do đó, khi dịch sang tiếng Đức, hệ dịch sẽ chuyển các động từ ở dạng nguyên mẫu hay quá khứ phân từ về cuối câu.
Một nghiên cứu khác cũng sử dụng luật chuyển đổi dựa trên sự khác biệt về trật tự từ giữa tiếng Hoa và tiếng Anh. Nhóm nghiên cứu của [6] đổi trật tự câu tiếng Hoa trƣớc khi đƣa vào hệ dịch. Họ đƣa ra hệ luật chuyển đổi bằng cách khảo sát thành phần của các loại ngữ trong Penn Chinese Treebank guidelines. Những loại ngữ có thứ tự thành phần tƣơng tự tiếng Anh thì sẽ đƣợc giữ nguyên, chẳng hạn nhƣ ngữ tính từ, ngữ trạng từ,… Tác giả rút luật chuyển đổi từ sự khác biệt trong các ngữ danh từ, ngữ động từ, ngữ định vị (tƣơng ứng với ngữ giới từ trong tiếng Anh). Kết quả hệ đƣợc cải tiến từ 28,52 đến 30,86 điểm BLEU.
Trang 37
Ƣu điểm của phƣơng pháp này là có thể đƣa ra luật chuyển đổi bằng tay dựa trên khảo sát sự khác biệt của cặp ngôn ngữ, đặc biệt là những cặp khác nhau nhiều về trật tự từ.