Chức năng “Xây dựng và hoàn thiện câu dịch”

Một phần của tài liệu Đồ án tốt nghiệp Xây dựng thử nghiệm hệ dịch tự động Anh - Việt theo hướng tiếp cận So khớp tập mẫu (Trang 74)

Đây là công đoạn cuối cùng trong quá trình dịch.Chức năng này có nhiệm vụ là: Biến đổi câu dịch của câu ngữ liệu tương tự nhất thành câu dịch cho đầu vào:

Hình 4. 3: Mô hình chức năng “Xây dựng, hoàn thiện câu dịch”

Chức năng này gồm có hai phép xử lý chính, lần lượt được xét trong bảng sau:

Input: Ngữ liệu gần nhất với đầu vào.

Output: Câu dịch cần tìm.

Bước 1: Từ trạng thái so khớp của ngữ liệu gần nhất, thu được danh sách các Insertion (các từ xuất hiện trong đầu vào I mà lại không có trong ngữ liệu gần nhất E của nó). Xét với mỗi từ w: Đầu tiên, căn cứ vào từ loại và từ điển Anh- Việt, xác định được nghĩa Tiếng Việt của nó. Vấn đề mẫu chốt là: Thêm từ Tiếng Việt này vào vị trí nào trong câu dịch V của E để đảm bảo đúng nghĩa và cấu trúc ngữ pháp?

Trong cây cú pháp T của I, xác định nút cha của nút ứng với w. Như vậy nếu lấy về tập các con của nút cha này, thì đó chình là các nút “lân cận” của w.Ta xét tập các nút này, xét xem là các thành phần cấu tạo nên ngữ nào (Danh ngữ, động ngữ…).Sau đó, áp dụng luật chuyển đổi để lấy về trật tự xuất hiện của các từ thành phần sau khi dịch sang Tiếng Việt. Thứ tự của w trong câu dịch E được xác định thông qua vị trí tương đối của nó với một từ cố định trong câu dịch đó. Ví dụ, giả sử ngữ liệu tương tự nhất của “I have a beautiful dream” tìm được

Kho Liên kết A - V

XÂY DỰNG HOÀN THIỆN CÂU DỊCH

Từ điển luật chuyển đổi Từ điển Anh-Việt Chọn liên kết Khoanh vùng tập mẫu Khoanh vùng tập mẫu Câu ngữ liệu tương tự nhất Liên kết Anh - Việt Câu dịch cuối cùng 76

là “I have a dream”. Dễ thấy có 1 Insertion là “beautiful”. Từ cây cú pháp đã biết của đầu vào, đó là: (TOP (S (NP (PRP I)) (VP (VBP have) (NP (DT a) (JJ beautiful) (NN dream))) (. .)))

Suy ra nhóm từ lân cận với “beautiful” là: “a beautiful dream” (vì cùng là các thành phần trong danh ngữ NP). Áp dụng luật chuyển đối ương ứng dành ho danh ngữ này, thu được thứ tự khi chuyển sang Tiếng Việt là: a (một) / dream (giấc mơ) / beautiful(đẹp).

Như vậy, xác định được vị trí tương đối của “beautiful” trong câu Tiếng Việt là đứng sau danh từ từ “giấc mơ”. Từ đó, tiến hành thêm nó vào vị trí thích hợp đã chỉ ra.

Sau giai đoạn này, tất cả các Insertion đều đã được sắp xếp vào các vị trí đúng. Bây giờ, ta xử lý các từ còn lại.Đó là nhiệm vụ của bước tiếp theo sau đây.

Bước 2: Bước này tìm vị trí đúng trong câu dịch cho các từ thuộc loại Subtitution, Deletion và Exact (ứng với các phép thay thế, xoá và so khơp chính xác). Trước hết, nhờ liên kết Anh-Việt đã có, ta biết được với mỗi từ (dù là D,S hay E), vị trí của những từ Tiếng Việt tương ứng với nó trong câu dịch. Do vậy, công việc cò lại chỉ là: Tham chiếu đến các vị trí tương ứng đó và:

Đối với các từ D: Thay từ ở mỗi vị trí bằng rỗng (“”) (đơn giản vì đây là từ cần xoá đi).

Đối với các từ E: Giữ nguyên từ trong mỗi vị trí.

Đối với các từ D: Gán vị trí đầu tiên bằng nghĩa Tiếng Việt của từ thay thế, tất cả các vị trí còn lại gán bằng “”.

Bảng 4. 3: Các bước triển khai chức năng “Xây dựng, hoàn thiện câu dịch”.

Để minh hoạ cho các bước xử lý của pha này, xét các câu sau:

(Input) : (E) I like a cup of tea .

(Tập mẫu) : (E) You like a cup of green tea .

(V) Bạn thích một tách trà xanh .

(Liên kết Anh-Việt):

STT Từ Tiếng

Anh

Liên kết STT Từ Tiếng Anh Liên kết

1 You 0 -Bạn 5 of 7-

2 like 1-thích 6 green 5-xanh

3 a 2-một 7 tea 4-trà

4 cup 3-tách 8 . 6-. (adsbygoogle = window.adsbygoogle || []).push({});

(Trạng thái so khớp tương ứng):

(S,You,I) (E like) (E a) (E cup) (E of) (D green ) (E tea) (E .)

Như vậy, ta dựa vào loại của mỗi từ để xây dựng nên câu dịch như sau:

STT Từ so khớp Câu dịch trong tập mẫu Câu dịch cần tìm

1 (S,You,I) 0 -Bạn 0-Tôi 2 (E like) 1-thích 1-thích 3 (E a) 2-một 2-một 4 (E cup) 3-tách 3-tách 5 (E of) 7- 7- 6 (D green ) 5-xanh 5- 7 (E tea) 4-trà 4-trà 8 (E .) 6-. 6-.

Câu dịch cuối cùng thu được, nhờ việc suy diễn từ câu dịch của ngữ liệu tương tự nhất, sẽ là:

“Tôi thích một tách trà”

Một phần của tài liệu Đồ án tốt nghiệp Xây dựng thử nghiệm hệ dịch tự động Anh - Việt theo hướng tiếp cận So khớp tập mẫu (Trang 74)