Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 183 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
183
Dung lượng
2,07 MB
Nội dung
MỤC LỤC DANH MỤC HÌNH VẼ iv DANH MỤC BẢNG vii MỞ ĐẦU Chương TỔNG QUAN VỀ DỊCH MÁY VÀ NGÔN NGỮ UNL 1.1 Một số khái niệm sử dụng luận án 1.2 Một số hướng tiếp cận dịch tự động 1.2.1 Dịch máy dựa luật 10 1.2.2 Dịch máy dựa ngữ liệu 12 1.2.3 Phương pháp dịch kết hợp 14 1.2.4 Đánh giá 15 1.3 Dịch đa ngữ 16 1.4 Vấn đề dịch tự động cho tiếng Việt 20 1.5 Tổng quan UNL 22 1.5.1 Giới thiệu 22 1.5.2 Ngôn ngữ UNL 22 1.5.3 Hệ thống UNL 29 1.5.4 Một số kết nghiên cứu liên quan 31 1.5.5 Ứng dụng UNL làm ngôn ngữ trục hệ thống dịch đa ngữ 33 1.6 Tiểu kết chương 35 Chương ĐỀ XUẤT MƠ HÌNH DỊCH TIẾNG VIỆT - UNL 37 2.1 Đặt vấn đề 37 2.2 Ngữ pháp tiếng Việt 39 2.3 Đề xuất mơ hình dịch 41 -i- 2.3.1 Công cụ EnCoVie 42 2.3.2 Công cụ DeCoVie 45 2.3.3 Từ điển UNL 46 2.3.4 Luật ngữ pháp UNL 49 2.4 Một số vấn đề cần xử lý cho tiếng Việt 56 2.5 Tiểu kết chương 58 Chương GIẢI PHÁP XÂY DỰNG TỪ ĐIỂN VÀ LUẬT 60 3.1 Giải pháp xây dựng từ điển tiếng Việt - UNL 60 3.2 Giải pháp xây dựng luật ngữ pháp 69 3.2.1 Xây dựng luật mã hóa 69 3.2.2 Xây dựng luật giải mã 83 3.3 Tiểu kết chương 94 Chương THỬ NGHIỆM VÀ ĐÁNH GIÁ 96 4.1 Xây dựng công cụ EnCoVie DeCoVie 96 4.1.1 Xây dựng công cụ EnCoVie 96 4.1.2 Xây dựng công cụ DeCoVie 99 4.2 Thử nghiệm đánh giá 114 4.2.1 Từ điển tiếng Việt – UNL 114 4.2.2 Dịch đa ngữ qua ngôn ngữ trục UNL 115 4.3 Tiểu kết chương 122 KẾT L ẬN 123 TÀI LIỆ THAM KHẢO 128 PHỤ LỤC 137 -ii- ANH MỤC CÁC TỪ VIẾT T T LGW Left Generation Window Cửa sổ tạo bên trái LW Left Window Cửa sổ trái RGW Right Generation Window Cửa sổ tạo bên phải RW Right Window Cửa sổ phải UNL Universal Networking Language Ngôn ngữ mạng dùng chung UNLKB Universal Networking Language Cơ sở tri thức ngôn ngữ Knowledge Base mạng dùng chung Universal Word Từ vựng chung UW -iii- ANH MỤC HÌNH VẼ Hình Sơ đồ hệ thống dịch trực tiếp [13] 11 Hình Sơ đồ hệ thống dịch chuyển đổi [13] 11 Hình Sơ đồ hệ thống dịch qua ngôn ngữ trung gian [13] 12 Hình Sơ đồ hệ thống dịch dựa ví dụ [13] 13 Hình Sơ đồ hệ thống dịch dựa thống kê [13] 14 Hình Kết hợp phương pháp dịch dựa luật thống kê [13] .14 Hình Mơ hình dịch máy dựa luật 15 Hình Dịch trực tiếp cặp ngôn ngữ dịch đa ngữ 16 Hình ịch qua ngôn ngữ trục dịch đa ngữ .17 Hình Mơ hình đánh giá dịch trực tiếp dịch qua ngôn ngữ trung gian 17 Hình Biểu diễn câu tiếng Anh sang UNL 28 Hình Biểu diễn biểu thức UNL dạng đồ thị .29 Hình Cơ chế chuyển đổi hệ thống UNL 29 Hình Hệ thống UNL14 30 Hình Quá trình chuyển đổi liệu dự án UNL – EOLSS [15] 33 Hình Hệ thống UNL cho ngôn ngữ 34 Hình Dịch qua ngơn ngữ trục UNL 34 Hình Mơ hình dịch tiếng Việt – UNL 42 Hình Sơ đồ chuyển đổi công cụ EnCoVie 43 Hình Danh sách nút Node-list 43 Hình Sơ đồ liên kết Headword 44 -iv- Hình Sơ đồ mã hóa câu tiếng Việt sang UNL 44 Hình Sơ đồ chuyển đổi cơng cụ DeCoVie 45 Hình Mối quan hệ nhị phân hai từ vựng 45 Hình Sơ đồ mã hóa biểu thức UNL sang câu tiếng Việt 46 Hình Trạng thái cuối Node-list 46 Hình Sử dụng UW để tìm HeadWord trình giải mã 48 Hình Thay đổi Node-list cửa sổ phân tích luật “+” .51 Hình Thay đổi Node-list cửa sổ phân tích luật “-” 52 Hình Thay đổi Node-list cửa sổ phân tích luật “” .53 Hình Thay đổi Node-list cửa sổ phân tích luật “:” 54 Hình Luật chèn phải nút từ Node vào Node-list .54 Hình Luật chèn trái nút từ Node vào Node-list 55 Hình Luật xóa nút phải nút từ Node-list 56 Hình Luật xóa nút trái nút từ Node-list 56 Hình Mơ-đun xử lý câu tiếng Việt đầu vào [9] .58 Hình Luật ngữ pháp chuyển đổi tiếng Việt sang biểu thức UNL 69 Hình Đồ thị biểu diễn biểu thức UNL .83 Hình Mối tương quan hai ngôn ngữ tiếng Việt UNL 83 Hình Sắp xếp trật tự từ câu đầu tiếng Việt .84 Hình Sắp xếp trật tự từ câu đầu tiếng Việt .84 Hình Đồ thị UNL biểu diễn cho biểu thức có nút .84 Hình Đồ thị UNL biểu diễn cho biểu thức có nhiều nút 86 -v- Hình Đồ thị UNL biểu diễn biểu thức chứa nút kết hợp trường hợp .88 Hình Đồ thị UNL biểu diễn biểu thức chứa nút kết hợp trường hợp .89 Hình Đồ thị UNL biểu diễn biểu thức chứa nút kết hợp trường hợp 92 Hình Đồ thị biểu diễn biểu thức UNL .100 Hình Đồ thị biểu diễn biểu thức UNL chứa hay nhiều nút .106 Hình Đồ thị biểu diễn biểu thức UNL chứa nút kết hợp 112 Hình Hệ thống dịch đa ngữ dựa vào UNL 118 Hình Biểu đồ chất lượng dịch qua UNL dịch trực tiếp 120 -vi- ANH MỤC BẢNG Bảng Kết đánh giá qua tiếng Pháp .19 Bảng Kết đánh giá qua tiếng Đức .19 Bảng Tỷ lệ giống/khác dịch máy 20 Bảng Các quan hệ định nghĩa UNL [66] 24 Bảng Các thuộc tính định nghĩa UNL [66] .25 Bảng Mô tả hình thức bảng biểu thức UNL [66] 27 Bảng Tỷ lệ giống/khác dịch qua UNL tiếng Anh 38 Bảng Các mơ hình câu đơn [ ] 40 Bảng Tập nhãn từ loại từ điển cho tiếng Việt [9] .48 Bảng Tập nhãn từ loại từ điển cho tiếng Việt [9] 49 Bảng Số mục từ tiếng Việt – UNL thu với giải pháp thứ .115 Bảng Một số ví dụ câu khơng khớp máy chủ tiếng Anh .118 Bảng Tỷ lệ thay đổi dịch qua UNL trực tiếp .119 -vii- MỞ ĐẦ L chọn ề ài Cùng với phát triển công nghệ, người tạo lượng thông tin khổng lồ mạng Internet cung cấp từ hàng triệu Website khắp giới Nhưng khai thác hết thông tin nhiều lý lý quan trọng rào cản ngôn ngữ Vấn đề đặt làm để người giới khai thác hết nguồn thơng tin Internet mà khơng bị hạn chế ngơn ngữ? Hiện có hai giải pháp để giải vấn đề này: thứ phát triển hệ thống, ứng dụng, nguồn liệu đa ngữ để người sử dụng lựa chọn ngơn ngữ mà họ muốn sử dụng; thứ hai ứng dụng phần mềm dịch tự động để dịch giao diện, nội dung từ ngơn ngữ có sang ngơn ngữ mà người sử dụng chọn lựa Hiện có nhiều hệ thống dịch đa ngữ xây dựng với nhiều hướng tiếp cận khác chất lượng dịch ngày cải thiện Tuy nhiên, đầu dịch hệ thống hầu hết mang tính tham khảo chưa thể nghĩa, văn phong câu nguồn Hơn giới sử dụng ngơn ngữ có chữ viết, việc phát triển hệ thống dịch đa ngữ cho cặp ngơn ngữ vơ khó khăn ngơn ngữ có số lượng người dùng ít1 Một hướng tiếp cận dịch đa ngữ quan tâm sử dụng ngôn ngữ trục để dịch, hướng tiếp cận giảm chi phí xây dựng phần mềm từ (n*(n-1)) xuống (2*n) giải cặp ngôn ngữ thiếu tài nguyên không tương đồng cấu trúc ngữ pháp [13] Văn phạm câu nguồn phương pháp dịch qua ngôn ngữ trục phân tích biểu diễn qua ngơn ngữ khác gọi ngơn ngữ trung gian sau sử https://en.wikipedia.org/ (2015) dụng văn phạm ngôn ngữ đích để dịch từ ngơn ngữ trung gian Ưu điểm phương pháp cần phân tích ngơn ngữ nguồn để chuyển sang ngơn ngữ trung gian ngược lại Ngoài ra, hệ thống dịch đa ngữ, dễ dàng bổ sung ngôn ngữ vào hệ thống nhược điểm làm tìm ngơn ngữ mà biểu diễn tất thông tin ngôn ngữ tự nhiên không nhập nhằng ngữ nghĩa Trong năm gần đây, nhiều ngơn ngữ tự nhiên có kho ngữ liệu song ngữ lớn (như tiếng Anh, tiếng Tây Ban Nha, tiếng Pháp,…) lựa chọn làm ngôn ngữ trung gian dịch tự động xây dựng kho ngữ liệu song ngữ [6][55] Tuy nhiên với phương pháp dịch hai lần thông qua ngôn ngữ thứ ba, chất lượng dịch khơng cao khơng khử tính nhập nhằng từ loại ngôn ngữ tự nhiên [6] Đến nay, hướng tiếp cận thường sử dụng cho cặp ngôn ngữ không tương đồng cấu trúc ngữ pháp khan nguồn tài nguyên liệu Hiện có ngơn ngữ xây dựng cho dịch máy dựa vào phương pháp trung gian gọi UNL, ngôn ngữ cho phép người sử dụng biểu diễn tất tri thức ngơn ngữ tự nhiên máy tính mà khơng bị nhập nhằng ngữ nghĩa UNL bao gồm thành phần ngôn ngữ tự nhiên: từ vựng (UW), quan hệ (relation), thuộc tính (attributes) sở tri thức ngôn ngữ (UNLKB) Trong UNL, liên kết từ vựng dựa quan hệ ngữ nghĩa gắn thuộc tính để miêu tả khía cạnh người nói Mục đích đời UNL cung cấp cho người sử dụng Internet khả truy cập vào trang web ngôn ngữ họ Hệ thống dịch tự động đa ngữ bao gồm nhiều máy chủ ngôn ngữ khác dịch thông qua ngôn ngữ trục UNL Mỗi máy chủ ngôn ngữ đảm nhận hai chức năng, dịch văn từ ngôn ngữ nguồn sang ngôn ngữ UNL gọi q trình mã hóa dịch ngược lại sang ngơn ngữ đích gọi q trình giải mã Đến nay, nhiều ngơn ngữ giới tích hợp vào tảng UNL tạo thành hệ thống dịch đa ngữ như: tiếng Nga, tiếng Anh, tiếng Nhật, tiếng Trung, tiếng Tây Ban Nha,… Vấn đề đặt làm để tích hợp máy chủ tiếng Việt vào tảng UNL chưa triển khai? Xuất phát từ nhu cầu thực tiễn trên, tác giả chọn “Sử ụng ngôn ngữ rục r ng ịch a ngữ” làm đề tài nghiên cứu luận án tiến sỹ kỹ thuật nhằm đóng góp cho phát triển dịch tự động Đặc biệt, kết nghiên cứu luận án mở hướng nghiên cứu cho dịch tự động tiếng Việt với ngôn ngữ khác hội phát triển hệ thống dịch tự động đa ngữ ngôn ngữ Việt Nam như: tiếng Việt, Chăm, Ba-na, Ê-đê, Jrai,… Mục iêu nghiên cứu Mục tiêu chung luận án nghiên cứu thử nghiệm hệ thống dịch tự động đa ngữ áp dụng cho tiếng Việt ngôn ngữ dân tộc người Việt Nam Mục tiêu cụ thể luận án gồm: - Đề xuất hướng tiếp cận dịch tự động đa ngữ cho tiếng Việt dựa ngôn ngữ trục - Xây dựng thử nghiệm hệ thống dịch tự động đa ngữ cho tiếng Việt dựa ngôn ngữ trục UNL hệ thống UNL sẵn có - Đề xuất hướng mở rộng hệ thống dịch tự động đa ngữ có cho ngơn ngữ dân tộc người Việt Nam Đối ượng phạm vi nghiên cứu ựa mục tiêu, đối tượng nghiên cứu luận án gồm: - Các hướng tiếp cận dịch tự động; - Các vấn đề dịch tự động cho tiếng Việt; - Ứng dụng UNL dịch tự động Phạm vi nghiên cứu luận án gồm: - Hướng tiếp cận dựa ngôn ngữ trục UNL dịch tự động; - Cấu trúc ngữ pháp câu tiếng Việt biểu thức UNL; Phụ lục E anh mục nhóm mơ h nh câu ghép [21] Nhóm Nhóm Nhóm Nhóm Nhóm Nhóm CÂ NHÂN Q Ả: Vì ( C – V) nên (C – V) Vì (C-V) nên (C-V) Bởi (C-V) nên (C-V) Vì (C-V) (C-V) Nhờ có (C-V) nên (C-V) ẫu (C-V) (C-V) Nhờ (C-V) (C-V) Do (C-V) (C-V) Bởi (C-V) thành (C-V) Sở dĩ (C-V) (C-V) 10 Sở dĩ (C-V) (C-V) 11 C V (nếu V (C-V)) 12 Tuy (C-V) (C-V) (C-V) 13 Khi (C-V) (C-V) (nếu V V) 14 Vì V nên (C-V) 15 Chính V mà (C-V) 16 Vì V mà (C-V) 17 Nhờ V mà (C-V) 18 Do V mà (C-V) 19 Do V, (C-V) 20 Vì V, (C-V) 21 (C-V) mà (C-V) 22 (C-V) (C-V) 23 (C-V) (C-V) 24 (C-V) (C-V) 25 (C-V) (C-V) 26 (C-V) (C-V) 27 (C-V) lẽ (C-V) 28 (C-V) nhờ (C-V) 29 (C-V) nhờ mà (C-V) 30 (C-V) (C-V) 31 (C-V) (C-V) 32 (C-V) làm (C-V) 33 (C-V) (C-V) 34 (C-V) (C-V) 35 (C-V) (C-V) 36 (C-V) V, (hễ V (C-V)) 25 Nhóm Nhóm Nhóm Nhóm 10 Nhóm 11 Nhóm 12 Nhóm 13 Nhóm 14 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 (C-V) (C-V) (C-V) (C-V) (C-V) (C-V) (C-V) (V từ V, (C-V)) (C-V) (C-V) (C-V) (C-V) nên/mặc dù V (C-V) (C-V) vì/ sau V, (C-V) (C-V) V (C-V) (C-V), vì/ muốn V (C-V) Do (C-V) (C-V) Nhờ (C-V)(C-V) Lại ((C-V) (C-V) (C-V) nên V (C-V) V (C-V) (tuy V V) (C-V) (khơng V mà cịn V) (C-V) (C vốn V) V (C-V) V (C-V) vởi V (C-V) nhờ V (C-V) nhờ V (C-V) V (C-V) V (C-V) mà V (C-V) lẽ (C-V) (C khơng V mà cịn V) (C-V) V V (C-V) (V V) (C-V) V Sở dĩ (C-V) V Sở dĩ (C-V) Bởi (C-V), V C V (C-V) C nhờ V, V C V nên V V (C-V) V (C-V) V nên (C-V) V (C-V) 26 Nhóm 15 Nhóm 16 Nhóm 17 Nhóm 18 Nhóm 19 Nhóm Nhóm Nhóm Nhóm Nhóm Nhóm Nhóm 75 76 77 78 79 80 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 Bởi (C khơng V mà cịn V) (Nếu V V) (C-V) C V (C-V) V nên V o nên V V, (C-V) CÂ ĐIỀ KIỆN: Nếu (C – V) (C – V) Nếu (C-V) (C-V) Nếu (C-V) thơi (C-V) Nếu (C-V) (C-V) Hễ (C-V) (C-V) Nhờ (C-V) (C-V) Giá (C-V) (C-V) Muốn cho (C-V) (C-V) Có lần (C-V) (C-V) Hễ (C-V) (C-V) Nếu (C-V) (C-V) Nếu (C-V) (C-V) Hễ (C-V) (C-V) Giá (C-V) (C-V) Nếu (C-V) (C-V) (C-V) (C-V) (C-V) (C-V) (C-V) mà (C-V) (C-V) (C-V) (C-V) (C-V) (C-V) (C-V) (C-V), (C-V) Hễ V (C-V) Nhờ V (C-V) Cần V (C-V) Hễ V (C-V) Nếu (C-V) V Muốn cho (C-V) V Nếu V V Phải V V Nhỡ v V Giá V V 27 Nhóm Nhóm Nhóm 10 Nhóm 11 Nhóm 12 Nhóm 13 Nhóm 14 Nhóm 15 Nhóm 16 Nhóm 17 Nhóm 18 Nhóm 19 Nhóm 20 Nhóm 21 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 Hễ V V Chỉ có V V Khơng có V V Muốn V V Muốn V phải V Có phải V phải V Muốn V (thì khơng V mà cịn V) Muốn V, trước hết V Muốn V phải (vừa V vừa V) Chỉ có V V V V (C-V) V V V V V V (C-V) V V (C-V) V (C-V) (C-V) V Nếu (C-V) Nếu V Nếu (C-V) Nếu (C-V) V Nếu (C-V) thì/ dù (C-V) (C-V) Lâu (C-V) (C-V) Ước chừng (C-V) V (C-V) C muốn V phải V C phải V V C muốn V V C V V V có nghĩa V, V, V V trước hết V (C-V) V V Nếu V, (C-V) Muốn V, (C-V) Nhờ V, (C-V) Chừng V, (C-V) (C-V), V V, (C-V) 28 Nhóm 22 Nhóm 23 Nhóm 24 Nhóm 25 Nhóm 26 Nhóm 27 Nhóm 28 Nhóm 29 Nhóm 30 Nhóm 31 Nhóm Nhóm Nhóm Nhóm Nhóm Nhóm Nhóm Nhóm Nhóm Nhóm 10 Nhóm 11 70 71 72 73 74 75 76 77 78 79 80 81 82 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Có V, C V Chỉ V, C V Muốn V, C phải V Phải chi V, C V V, (C V) Hình (C-V), (C V) C V V C phải V V V V Muốn V mà (C-V) V (V (C-V)) V Nếu (C-V) (dẫu V, V) Nếu V, V CÂ NHÂN NHƯỢNG: Tuy (C –V) (C – V) Tuy (C-V) (C-V) Cho dù (C-V) (C-V) Mặc dù (C-V) song (C-V) ẫu (C-V) (C-V) Mặc dù V (C-V) Tuy V (C-V) Mặc dù (C-V) (C-V) Dù (C-V) (C-V) Mặc dù V (C-V) Dù cho V (C-V) ẫu V (C-V) (C-V) (C-V) (C-V) (C-V) (C-V) V (C-V) dù V (C-V) V Mặc dù/ V (C-V) (C-V) C V V C dù V V C V mà V C V V ù V (C V) C dù V (c V) ẫu cho (C-V), V 29 Nhóm 12 Nhóm 13 Nhóm Nhóm Nhóm Nhóm Nhóm Nhóm Nhóm Nhóm Nhóm Nhóm Nhóm Nhóm 25 Cho dù (C-V), V 26 ẫu vì/ V (C-V) V 27 (C-V) V, (C-V) CÂ MỤC ĐÍCH: (C-V) để (C-V) (C-V) để (C-V) (C-V) cho (C-V) (C-V) (C-V) (C-V) cốt cho (C-V) (C-V) cốt buộc (C-V) (C-V) hòng buộc (C-V) Để (C-V) (C-V) Để cho (C-V) (C-V) V để (C-V) 10 V cho (C-V) 11 (C-V) (C-V) 12 V, (C-V) CÂU SO SÁNH: (C-V) (C-V) (C-V) (C-V) (C-V) tựa (C-V) (C-V) hệt (C-V) (C-V) giống (C-V) (C-V) y (C-V) (C-V) chẳng khác (C-V) (C-V) hệt (C-V) (C-V) hệt V (C-V) V 10 (C-V) V 11 (C-V) V (C-V) 12 Đúng (C-V) (C-V) 13 Như (C-V) (C-V) 14 V (C-V) 15 (C-V) (C-V) nhiêu CÂ BÌNH ĐẲNG: (C-V) (C-V) (C-V) (C-V) (C-V) (C-V) (C-V) sau (C-V) (C-V) đồng thời (C-V) (C-V) (C-V) 30 Nhóm Nhóm Nhóm Nhóm Nhóm Nhóm Nhóm Nhóm Nhóm 10 Nhóm 11 Nhóm 12 Nhóm 13 Nhóm 14 Nhóm 15 (C-V) với (C-V) (C-V) (C-V) (C-V) có nghĩa (C-V) (C-V) với (C-V) 10 (C-V) sau (C-V) 11 (C-V) tức (C-V) 12 (C-V) nói (C-V) 13 (C-V) (C-V) 14 (C-V) (C-V) 15 (C-V) (C-V) 16 (C-V) V 17 (C-V) V 18 (C-V) sau V 19 (C-V) đồng thời V 20 (C-V) V 21 V (C-V) 22 V (C-V) 23 V, sau (C-V) 24 V có nghĩa (C-V) 25 V (C-V) 26 (C-V) đâu, V 27 (C-V) (vì (C-V) nên V) 28 (C-V) (càng V V) 29 (C-V) (vừa V vừa V) 30 (C-V) (tuy V V) 31 (C-V) (cũng V V) 32 (C-V) (V mà V) 33 (C-V) V (phải) 34 (C-V) V (có thể) 35 (C-V) V (là) 36 (C-V), (C-V) mà/nếu (C-V) V 37 (C-V) (C-V) (C-V) 38 (C-V) (C-V) (C-V) 39 (C V) V 40 (C-V) V, (C-V) 41 (Bên cạnh C V V), (C-V V) 42 V V 43 V đồng thời V 31 Nhóm 16 Nhóm 17 Nhóm 18 Nhóm 19 Nhóm 20 Nhóm Nhóm Nhóm Nhóm Nhóm 44 45 46 47 48 49 50 51 7 10 11 12 13 14 15 16 17 18 19 20 21 V có nghĩa V V V (C-V), V V (C-V) V, V cần phải V, V phải (C-V) cần phải, (C-V) C (V mà V), khơng thể (V mà cịn V) CÂ LỰA CHỌN: (C-V) HOẶC (C-V) (C-V) (C-V) (C-V) hay (C-V) (C-V) (C-V) (C-V) V (C-V) V V hay (C-V) V (C-V) CÂ TƯƠNG PHẢN: (C-V) (C-V) (C-V) (C-V) (C-V) (C-V) (C-V) mà (C-V) (C-V) mà (C-V) (C-V) (C-V) (C-V) không ngờ (C-V) (C-V) ngờ đâu (C-V) (C-V) (C-V) (C-V) phải (C-V) (C-V), ngược lại (C-V) (C-V) trái lại (C-V) (C-V) ngặt (C-V) (C-V) ngờ (C-V) (C-V) có (C-V) (C-V) (C-V) (C-V) song (C-V) (C-V) mà (C-V) (C-V) V (C-V) mà V (C-V) V (C-V) V 32 Nhóm Nhóm Nhóm Nhóm Nhóm Nhóm Nhóm Nhóm 10 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 (C-V) lại V (C-V) để V (C-V) V (C-V) mà V (C-V) mà lại V (C-V) mà V (C-V) mà V (C-V) mà V (C-V) V (C-V) song V (C-V) nhưng/ (C-V) (C-V) (C-V) nhưng/ (C-V) (C-V) (C-V) nhưng/ nhờ (C-V) mà (C-V) (C-V) nhưng/ (C-V), (C-V) V nhưng/ (C-V), (C-V) (C-V) lại (V V) (C-V) (V V) (C-V) ( V V) (C-V) mà (V nên V) (C-V) mà (khi V V) (C-V) lại (V V) (C-V) ngặt (V nên V) V (C-V) V song (C-V) V (C-V) V mà (C-V) V cịn (C-V) V khơng có (C-V) V ngặt (C-V) (C-V) (C-V) (C-V) (C-V) ngặt (C-V) nên (C-V) (C-V) (vì V (C-V)) (C-V) (V (C-V)) (C – C) mà (V (C-V)) V không V V V V khơng có V V V 33 Nhóm 11 Nhóm 12 Nhóm 13 Nhóm 14 Nhóm 15 Nhóm 16 Nhóm 17 Nhóm 18 Nhóm 19 Nhóm 20 Nhóm 21 Nhóm 22 Nhóm 23 Nhóm 24 Nhóm 25 Nhóm 26 Nhóm 27 Nhóm 28 Nhóm 29 Nhóm 30 Nhóm Nhóm 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 V mà V V đồng thời V V lại V V lại V Nếu V (C-V) (C-V) V song (khi V V) (V V), song (nếu V V) (C – vốn V) V (C phải V) khơng thể V (C V) mà không cần V (C V) mà V (C V) mà V (C tưởng V) hóa V (C-V) (nếu (C-V) V) (C-V) nên (C-V) (nếu V (C-V)) (Hễ V thì V, (C-V)) (V mà V V) V nên (C-V) (C-V) (Nếu V V) mà (V V) C khơng phải V mà (C-V) Chưa có V có (C-V) V khơng phải V mà V Không phải V mà V Một mặt V, mặt khác V Chỉ V mà (C-V) V mà/ V nên (C-V) Không phải (C-V) mà V Không nên V mà phải coi (C-V) Từ (C-V), mà (C-V) (C-V) (C-V) (C-V)V V (C-V) CÂU GHÉP: C khơng V mà cịn V C khơng V mà cịn V C khơng V mà cịn V C vừa V vừa V C V mà cịn V Khơng phải (riêng) (C-V) mà (C-V) Chẳng (C-V) mà (C-V) 34 Nhóm Nhóm Nhóm Nhóm Nhóm Nhóm Nhóm Nhóm 10 Nhóm 11 Chẳng (C-V) mà V (C-V) V V (C-V) vừa V vừa V 10 (C-V) (C-V) 11 Chẳng V mà (C-V) 12 C V, C V 13 V khơng phải V mà cịn V 14 Khơng V mà cịn V 15 Khơng phải C V mà V 16 Vừa V, C vừa V 17 Càng V, C V 35 Phụ lục G Mộ số mục ừ iển iếng Việ – UNL câu mẫu nghiệm (Các mục từ lấy từ kết thử nghiệm xây dựng từ điển luận án) STT 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 MỤC TỪ TRONG TỪ ĐIỂN TIẾNG VIỆT - UNL [kỹ sư]{}“engineer(icl>person>thing)”(n,nt); [tôi]{}“I(icl>person)”(p,pp); [chúng tôi]{}“we(icl>group)”(p,pp); [anh ấy]{}“he(icl>person)”(p,pp); [học sinh]{}“student(icl>university_student>person,obj>knowledge_domain )”(n,nt); [giáo viên]{}“teacher(icl>educator>thing)”(n,nt); [nhà văn]{}“writer(icl>communicator>thing)”(n,nt); [nhà báo]{}“journalist(icl>writer>thing)”(n,nt); [thợ may]{}“tailor(icl>garmentmaker>thing)”(n,nt); [họa sĩ]{}“artist(icl>creator>thing)”(n,nt); [làm việc]{}“ work(icl>do,agt>person,obj>role,ben>volitional_thing)”(v,vs) ; [ngủ]{}“sleep(icl>rest>be,aoj>living_thing)”(v,vs) ; [ngồi]{}“sit(icl>be,aoj>person,plc>thing)”(v,vs) ; [đứng]{}“stand(icl>be_upright>be,aoj>concrete_thing)”(v,vs) ; [nói]{}“say(icl>communicate>do,equ>tell,agt>person,obj>uw,cao>thing,rec>voliti onal_thing)”(v,vi) ; [hát]{}“sing(icl>do,com>music,cob>thing,agt>living_thing,obj>song,rec> living_thing)”(v,vi); [khóc]{}“weep(icl>cry>do,rsn>thing,agt>living_thing)”(v,vi); [gửi]{}“send(icl>direct>do,plt>uw,plf>thing,agt>volitional_thing,obj>thing, rec>thing)”(v,vt); [thư]{}“letter(icl>text>thing)”(n,na); [bưu điện]{}“post(icl>upright>thing)”(n,ng); [văn phòng]{}“office(icl>organization,icl>place,obj>organization)”(n,ng) ; [trồng]{}“grow(icl>develop>do,equ>raise,src>thing,agt>thing,obj>thing, gol>uw)”(v,vt); [hoa]{}“flower(icl>angiosperm>thing)”(v,vt); [trang trại]{}“farm(icl>workplace>thing)”(n,ng); [mua]{}“buy(icl>get>do,cob>thing,src>thing,agt>person,obj>thing)”(v,vt) ; [tài liệu]{}“paper(icl>material>thing)”(n,na); 36 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 [bán]{}“sell(icl>be_on_sale>be,aoj>thing,val>money)”(v,vt); [bắt]{}“force(icl>cause>do,equ>compel,agt>thing,obj>thing,gol>uw)” (v,vt, order); [ăn]{}“eat(icl>consume>do,agt>living_thing,obj>concrete_thing,ins>thing)” (v,vt); [ở]{}“”(e); [đi]{}“go(icl>move>do,plt>place,plf>place,agt>thing)”(v,vt); [chạy]{}“run(icl>go>do,plt>uw,plf>uw,agt>thing)”(v,vt); [khuyên]{}“advise(icl>counsel>do,agt>person,obj>uw,ben>person)”(v,vt, order); [học]{}“learn(icl>acquire>do,src>uw,agt>volitional_thing,obj>thing)”(v,vt) ; [cấm]{}“forbid(icl>prohibit>do,agt>person,obj>uw,rec>person)”(v,vt,order) vie,0,0>; [yêu cầu]{}“request(icl>beg>do,agt>person,obj>uw,rec>person)”(v,vt,order) ; [lỡ]{}“miss(icl>occur,com>fail,cob>thing,obj>thing)”(v,vt,order); [vừa]{}“”(e); [xe buýt]{}“bus(icl>public_transport>thing)”(n,nt); [sẽ]{}“”(e); [đến]{}“come(icl>move>do,plt>place,agt>person)”(v,vt); [muộn]{}“late(icl>how,ant>early)”(a,ap); [tàu]{}“ship(icl>vessel>thing)”(n,nt); [trở thành]{}“become(icl>occur,obj>thing,gol>uw)”(v,vs); [chăm chỉ]{}“studiously(icl>how,com>studious)”(a,ap); [tốt]{}“well(icl>how)”(a,ap); [luật sư]{}“lawyer(icl>professional>thing)”(n,nt); [cơng bằng]{}“fairly(icl>how,com>fair)”(a,ap); [tạp chí]{}“magazine(icl>press>thing)”(n,nt); [giải trình]{}“explain(icl>do,equ>explicate,agt>volitional_thing,obj>uw, >thing,met>thing,rec>thing)”(n,nt); [chuyến bay]{}“flight(icl>air_travel>thing)”(n,nt); [nghe]{}“listen(icl>hear>do,agt>person,obj>thing)”(v,vt); [đọc]{}“read(icl>see>do,agt>person,obj>information)”(v,vt); cao [viết]{}“write(icl>communicate>do,agt>person,obj>information,cao>thing, ins>thing,rec>person)”(v,vt); [nhảy]{}“dance(icl>move>do,com>grace,agt>person,obj>thing)”(v,vt); 37 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 STT 10 11 12 13 14 [xem]{}“watch(icl>do,equ>view,agt>living_thing,obj>thing)”(v,vt); [đỗ]{}“pass(icl>cross>do,via>thing,plt>thing,plf>thing,agt>thing,plc>thing)”(v,vs) ; [học kì]{}“semester(icl>school_term>thing)”(n,na); [có]{}“have(icl>be,equ>possess,obj>thing,aoj>thing)”(v,vs); [tiền]{}“money(icl>medium_of_exchange>thing)”(n,na); [chạy]{}“run(icl>go>do,plt>uw,plf>uw,agt>thing)”(v,vt); [nhanh]{}“fast(icl>adj,ant>slow)”(a,ap); [chiến thắng]{}“win(icl>prize>do,agt>volitional_thing,obj>thing,cag> volitional_thing,scn>thing)”(v,vs); [giải thưởng]{}“prize(icl>gift>thing)”(n,na); [chậm]{}“slow(icl>adj,ant>fast)”(a,ap); [mất]{}“lose(icl>suffer>do,agt>thing,obj>concrete_thing)”(v,vs); [thần tượng]{}“idol(icl>effigy>thing)”(n,na); [tính toán]{}“calculate(icl>rely>be,obj>person,aoj>person,scn>thing)”(v, vt); [cẩn thận]{}“carefully(icl>how,com>careful)”(a,ap); [tiến bộ]{}“ improve(icl>turn>occur,equ>better,obj>thing)”(v,vs); [toán học]{}“math(icl>science>thing,equ>mathematics)”(n,na); CÂ MẪ THỬ NGHIỆM TIẾNG VIỆT TIẾNG ANH TIẾNG NGA Tôi kỹ sư I am an engineer Я инженер Chúng kỹ sư We are engineers Мы инженеры Anh kỹ sư He is an engineer Он инженер Tôi học sinh I am a student Я студент Chúng học sinh We are students Мы студенты Anh học sinh He is an student Он студент Tôi làm việc I work Я работаю Chúng làm việc We work Мы работаем Anh làm việc He works Он работает Tôi ngủ I sleep Я сплю Chúng ngủ We sleep Мы спим Anh ngủ He sleeps Он спит Tôi gửi thư bưu I send a letter at the post Я отправляю письмо в điện почтовом отделении Chúng gửi thư We send a letter at the post Мы отправляем письмо в bưu điện почтовом отделении 38 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 Anh gửi thư bưu điện Tôi gửi thư văn phịng Chúng tơi gửi thư văn phịng Anh gửi thư văn phịng Tơi bắt anh ăn Chúng bắt anh ăn Anh bắt ăn Tôi bắt anh Chúng bắt anh Anh bắt Tôi vừa lỡ xe buýt, đến muộn Chúng vừa lỡ xe buýt, đến muộn Anh vừa lỡ xe buýt, anh đến muộn Tôi nhảy anh xem Chúng nhảy anh xem Nếu anh học chăm anh đỗ học kì Nếu tơi học chăm tơi đỗ học kì Nếu chúng tơi học chăm chúng tơi đỗ học kì He sends a letter at the Он отправляет письмо post почтовом отделении I send a letter at the office Я отправляю письмо офисе We send a letter at the Мы отправляем письмо office офисе he sends a letter at the Он отправляет письмо office офисе I force him to eat Я заставляю его есть We force him to eat Мы заставляем его есть в в в в He forces me to eat I force him to go We force him to go Он заставляет меня есть Я заставляю его идти Мы заставляем его идти He forces me to go I have missed the bus, I will come late We have missed the bus, we will come late Он заставляет меня идти Я только что пропустил автобус, я опоздаю Мы только что пропустили автобус, мы опоздаем He has missed the bus, he Он только что пропустил will come late автобус, он опоздает I dance and he watches Я танцую, и он смотрит we dance and he watches Мы танцуем и он смотрит If he learns studiously, he Если он будет усердно will pass the semester учиться, он сдаст экзамены If I learn studiously, he Если я буду учиться, я cдам will pass the semester экзамены If we learn studiously, he Если мы будем усердно will pass the semester учиться, мы cдадим экзамены 39 ... hệ thống UNL, máy chủ ngôn ngữ đảm nhận chức dịch văn ngôn ngữ sang ngôn ngữ UNL dịch ngược lại Với vai trị hệ thống, ngôn ngữ UNL sử dụng ngôn ngữ trục hệ thống dịch đa ngữ tiếng Trung EnConverter... ngơn ngữ tự nhiên) sử dụng ngôn ngữ trung gian để dịch ngôn ngữ với hệ thống dịch gọi ngơn ngữ trục2 Ví dụ, có ba ngơn ngữ tham gia vào hệ thống dịch, cặp ngôn ngữ không dịch trực tiếp với mà dịch. .. web ngôn ngữ họ Hệ thống dịch tự động đa ngữ bao gồm nhiều máy chủ ngôn ngữ khác dịch thông qua ngôn ngữ trục UNL Mỗi máy chủ ngôn ngữ đảm nhận hai chức năng, dịch văn từ ngôn ngữ nguồn sang ngôn