XÂY DỰNG CHƯƠNG TRÌNH CHUYỂN ĐỔI CÂY CÚ PHÁP TRONG HỆ DỊCH TỰ ĐỘNG ANH VIỆT

80 438 0
XÂY DỰNG CHƯƠNG TRÌNH CHUYỂN ĐỔI CÂY CÚ PHÁP TRONG HỆ DỊCH TỰ ĐỘNG ANH  VIỆT

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Luận văn tốt nghiệp Lời cảm tạ TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN KHOA CÔNG NGHỆ THÔNG TIN BỘ MÔN CÔNG NGHỆ TRI THỨC ^ ] Lời chúng em xin chân thành cảm ơn thầy Đinh Điền, người trực tiếp hướng dẫn chúng em hoàn thành luận văn NGUYỄN LƯU THÙY NGÂN - 9912621 ĐỖ XUÂN QUANG - 9912652 Thầy người truyền thụ cho chúng em nhiều kiến thức tin học ngôn ngữ học, giúp chúng em có hiểu biết sâu ứng dụng có ý nghĩa vô to lớn XÂY DỰNG CHƯƠNG TRÌNH CHUYỂN ĐỔI CÂY CÚ PHÁP TRONG HỆ DỊCH TỰ ĐỘNG ANH - VIỆT LUẬN VĂN CỬ NHÂN TIN HỌC sống tin học – vấn đề dịch máy Chúng em xin chân thành cảm ơn thầy cô khoa Công nghệ thông tin tận tình bảo giúp đỡ cho chúng em suốt thời gian chúng em học đại học trình chúng em thực luận văn Chúng xin chân thành cảm ơn ba mẹ, anh người thân gia đình nuôi dạy, tạo điều kiện tốt cho chúng học tập động viên chúng thời gian thực luận văn Và cuối cùng, xin gởi lời cảm ơn đến tất bạn bè bạn nhóm VCL (Vietnamese Computational GIÁO VIÊN HƯỚNG DẪN TS ĐINH ĐIỀN Linguistics), người hỗ trợ trình hoàn thiện luận văn Tp Hồ Chí Minh, tháng 07 năm 2003 Nguyễn Lưu Thùy Ngân - 9912621 Đỗ Xuân Quang - 9912652 NIÊN KHÓA 1999-2003 Trang Luận văn tốt nghiệp Luận văn tốt nghiệp NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN Tp Hồ Chí Minh, tháng 07 năm 2003 Tp Hồ Chí Minh, tháng 07 năm 2003 Giáo viên phản biện TS Đinh Điền Trang Trang Luận văn tốt nghiệp Luận văn tốt nghiệp Mục lục L i i đ ầ u Cho đến nay, sau 50 năm phát triển, dịch máy chứng tỏ ứng dụng Lời nói đầu .5 vô thiết thực, đồng thời toán hóc búa đặt cho nhà Mục lục khoa học toàn giới Từ đầu thập niên 1960, nhà khoa học đúc kết lại Danh sách hình .11 ba chiến lược dịch máy bản, dịch trực tiếp, dịch thông qua ngôn ngữ trung Danh sách bảng .13 gian dịch dựa chuyển đổi Và qua thực tế, chiến lược dịch dựa chuyển Chương 14 đổi khẳng định tính hiệu tiềm nó, cách tiếp TỔNG QUAN VỀ CHUYỂN ĐỔI CÂY CÚ PHÁP 14 cận mà chúng em theo đuổi để xây dựng hệ dịch tự động từ tiếng Anh sang tiếng Việt Trong hệ dịch dựa chuyển đổi, khối chuyển đổi cú pháp (cấu trúc) 1.1 Đặt vấn đề .14 1.2 Các chiến lược dịch máy 16 giữ vai trò quan trọng, định chất lượng hệ dịch Vì lý đó, chúng em 1.1.1 Chiến lược dịch trực tiếp .16 định chọn “Xây dựng chương trình chuyển đổi cú pháp hệ dịch 1.1.2 Chiến lược dịch dựa ngôn ngữ trung gian .17 Anh-Việt” làm đề tài luận văn tốt nghiệp cử nhân Khối chuyển đổi cú 1.1.3 Chiến lược dịch dựa chuyển đổi .18 pháp đảm nhiệm việc thay đổi trật tự, chèn, xoá thành phần cú pháp 1.2 câu tiếng Anh cho sau hoàn tất việc gắn nghĩa, ta thu câu tiếng chuyển đổi 20 Việt có trật tự từ hợp lý 1.3 Luận văn tổ chức thành phần sau: ™ Chương 1: Giới thiệu tầm quan trọng, mục tiêu, phạm vi đề tài, sở lý thuyết ngôn ngữ học, tin học hướng tiếp cận vấn đề Vai trò chuyển đổi cú pháp cách tiếp cận dựa Cơ sở lý thuyết 22 1.3.1 Cơ sở lý thuyết ngôn ngữ học việc chuyển đổi 23 1.3.2 Cơ sở lý thuyết tin học - Hướng tiếp cận vấn đề 33 ™ Chương 2: Điểm qua cách tiếp cận chuyển đổi cấu trúc Chương 35 ™ Chương 3: Thuật toán tảng, mô hình học mô hình áp dụng chuyển CÁC HƯỚNG TIẾP CẬN CHUYỂN ĐỔI CẤU TRÚC TRONG DỊCH đổi cú pháp MÁY 35 ™ Chương 4: Thiết kế – Cài đặt 2.1 ™ Chương 5: Thử nghiệm – đánh giá ™ Chương 6: Kết – Kết luận – Hướng phát triển ™ Phần phụ lục Tài liệu tham khảo Trang Hướng tiếp cận dựa luật cố định 35 2.1.1 Cơ chế chuyển đổi cách tiếp cận dựa luật cố định 35 2.1.2 Nhận xét 38 Trang Luận văn tốt nghiệp 2.2 Luận văn tốt nghiệp Hướng tiếp cận sử dụng case-frame .39 3.2 Thuật toán học nhanh FnTBL 71 2.2.1 Chuyển đổi thông tin cấp độ câu 40 3.2.1 Hình thức hóa TBL .72 2.2.2 Chuyển đổi ngữ động từ 41 3.2.2 Thuật toán FnTBL .73 2.2.3 Sự chuyển đổi định ngữ, bổ ngữ 42 2.2.4 Tự điển chuyển đổi 43 2.2.5 Nhận xét 44 2.3 Hướng tiếp cận sử dụng TAG đồng (STAG) 44 2.3.1 Văn phạm TAG .45 2.3.2 TAG đồng (STAG) 49 2.3.3 Nhận xét 52 2.4 Cách tiếp cận phân tích ngữ pháp song song 53 3.3 Mô hình chuyển đổi cú pháp sử dụng thuật toán FnTBL 78 3.3.1 Mô hình áp dụng chuyển đổi cú pháp 80 3.3.2 Mô hình học luật chuyển đổi phương pháp học FnTBL 82 3.4 Nâng cao khả mở rộng cho mô hình học 95 Chương 97 CÀI ĐẶT CHƯƠNG TRÌNH 97 4.1 Thiết kế 97 4.1.1 Mô hình tổng thể 97 2.4.1 Ngữ pháp chuyển dịch đảo có thống kê (SITG) 53 2.4.2 Thuật toán phân tích cú pháp song song với SITG .55 2.4.3 Đánh nhãn cấu trúc 58 4.2.1 Thuật toán 99 2.4.4 Chuyển đổi cú pháp song song cho hai ngôn ngữ .58 4.2.2 Xây dựng cú pháp 99 2.4.5 Nhận xét 59 4.2.3 Xây dựng quan hệ .103 Cách tiếp cận dựa cấu trúc vị từ - đối số .60 4.2.4 Thuật toán chuyển đổi theo nguyên tắc 105 2.5 4.2 Thuật toán gán nhãn sở cho ngữ liệu 99 2.5.1 Rút trích cấu trúc vị từ - đối số .60 2.5.2 Khối chuyển đổi cấu trúc 62 4.3.1 Xây dựng ngữ liệu học 106 2.5.3 Nhận xét 64 4.3.2 Xây dựng khung luật cho học chuyển đổi cấp 108 Tổng kết chương 65 4.3.3 Sơ đồ lớp chương trình học 114 4.3.4 Xây dựng luật (giai đoạn học cấp) 114 4.3.5 Áp dụng luật chuyển đổi cấp .116 2.6 Chương 66 MÔ HÌNH CHUYỂN ĐỔI CÂY CÚ PHÁP 66 3.1 Phương pháp học hướng lỗi dựa chuyển trạng thái 66 3.1.1 Ý tưởng 66 3.1.2 Thuật toán học TBL Eric Brill 68 3.1.3 Nhận xét 70 Trang 4.3 4.4 Học chuyển đổi cấp 106 Học chuyển đổi khác cấp 117 4.4.1 Xây dựng ngữ liệu học 117 4.4.2 Xây dựng khung luật cho trình học chuyển đổi khác cấp 120 4.4.3 Sơ đồ lớp chương trình học 125 4.4.4 Xây dựng luật (giai đoạn học khác cấp) 125 Trang Luận văn tốt nghiệp 4.4.5 Luận văn tốt nghiệp Áp dụng luật chuyển đổi khác cấp 127 PHỤ LỤC 156 Chương 128 CÁC NHÃN QUAN HỆ NGỮ PHÁP 156 THỬ NGHIỆM – ĐÁNH GIÁ 128 TÀI LIỆU THAM KHẢO 157 5.1 Thử nghiệm 128 5.1.1 Độ đo sử dụng .128 5.1.2 Kết học rút luật chuyển đổi 129 5.1.3 Một số kết chuyển đổi 131 5.2 Đánh giá 134 5.2.1 Ngữ liệu thử nghiệm 134 5.2.2 Nhận xét 135 Chương 137 TỔNG KẾT 137 6.1 Kết 137 6.2 Hướng phát triển 137 6.3 Kết luận .138 PHỤ LỤC 139 KHUNG LUẬT VÀ MỘT SỐ LUẬT CÙNG CẤP 139 PHỤ LỤC 141 KHUNG LUẬT VÀ MỘT SỐ LUẬT KHÁC CẤP 141 PHỤ LỤC 142 MỘT SỐ KẾT QUẢ DỊCH SỬ DỤNG KHỐI CHUYỂN ĐỔI CÂY CÚ PHÁP VCLTRANSFER 142 PHỤ LỤC 147 MỘT SỐ CÂU DỊCH CỦA HAI HỆ DỊCH .147 PHỤ LỤC 153 HỆ THỐNG NHÃN NGỮ PHÁP .153 Trang Trang 10 Luận văn tốt nghiệp Luận văn tốt nghiệp Danh sách hình Hình 21: Xây dựng ngữ tiếng Việt từ quan hệ ngữ pháp 86 Hình 22: Lưu đồ thuật toán gán nhãn chuyển đổi sở cho ngữ liệu 87 Hình 23: Lưu đồ thuật toán học luật chuyển đổi Hình 1: Mô hình dịch trực tiếp 16 Hình 2: Mô hình dịch dựa ngôn ngữ trung gian 17 Hình 3: Mô hình dịch dựa chuyển đổi 18 Hình 4: Hình tháp minh họa chiến lược dịch máy 20 Hình 5: Cây cú pháp câu “I have already read that interesting book.” 21 Hình 6: So sánh trật tự định ngữ tiếng Anh tiếng Việt 26 Hình 7: Áp dụng luật cố định để thực việc chuyển đổi cấu trúc 36 Hình 8: Trường hợp chuyển đổi khác cấp luật cố định thực 37 Hình 9: Khả chuyển đổi cú pháp luật cố định 38 Hình 10: Giản đồ khởi tạo phụ trợ TAG 46 Hình 11: Tác tố kết hợp 47 Hình 12: Tác tố thay 48 Hình 13: Một số mẫu sơ cấp tự điển chuyển đổi Anh-Pháp 50 Hình 14: Cây phân tích ngữ pháp chuyển dịch đảo 55 Hình 15: Chuyển đổi khung ngôn ngữ 63 Hình 16: Sơ đồ phương pháp học TBL tổng quát 70 cấp – FnTBL 90 Hình 24: Lưu đồ học luật chuyển đổi khác cấp (FnTBL) 94 Hình 25: Mô hình tổng thể trình học luật chuyển đổi Anh-Việt 97 Hình 26: Kết phân tích cú pháp: “Last week, I saw a very interesting film.” 100 Hình 27: Cây quan hệ câu “Last week, I saw a very interesting film.” 104 Hình 28: Cây tiếng Anh chuyển đổi thành phần với tiếng Việt 107 Hình 29: Cây cú pháp câu “What is a computer ?” 111 Hình 30: Cây cú pháp (E) sau áp dụng luật R 113 Hình 31: Sơ đồ lớp khối học luật chuyển đổi cấp 114 Hình 32: Mô hình áp dụng tập luật chuyển đổi cấp 116 Hình 33: Cây cú pháp câu tiếng Anh “It is a good type of book.” 118 Hình 34: Một cú pháp tiếng Anh sau chuyển sang cấu trúc tiếng Việt 119 Hình 35: Một phần cú pháp với đường thành phần [ADVP] 123 Hình 36: Sơ đồ lớp khối học luật chuyển đổi khác cấp 125 Hình 37: Mô hình áp dụng tập luật chuyển đổi khác cấp 127 Hình 38: Đánh giá tập luật học chuyển đổi cấp 130 Hình 39: Đánh giá tập luật học chuyển đổi khác cấp 131 Hình 17: Một ví dụ minh hoạ chuyển đổi cú pháp 79 Hình 18: Mô hình áp dụng chuyển đổi cú pháp 81 Hình 19: Mô hình học luật chuyển đổi cú pháp theo thuật toán FnTBL 82 Hình 20: Ví dụ quan hệ ngữ pháp ngữ 85 Trang 11 Trang 12 Luận văn tốt nghiệp Chương - Tổng quan chuyển đổi cú pháp Danh sách bảng Chương TỔNG QUAN VỀ CHUYỂN ĐỔI CÂY Bảng 1: Trật tự thành phần ngữ danh từ tiếng Anh 27 Bảng 2: Trật tự thành phần ngữ danh từ tiếng Việt 28 CÚ PHÁP Bảng 3: Danh sách 23 cấu trúc vị từ - đối số tiếng Hoa 61 Bảng 4: Một số quan hệ ngữ pháp ánh xạ ngoại lệ 84 Bảng 5: Các quan hệ câu tiếng Anh 103 Bảng 6: Ý nghĩa ký hiệu dùng mô tả ngữ liệu học giai đoạn 108 Chương giới thiệu đề tài luận văn - mục đích phạm vi thực Phần chương trình bày cách tổng quát chuyển đổi cú pháp: vai trò, vị trí khối chuyển đổi cú pháp hệ dịch Anh-Việt Ngoài ra, khái niệm then chốt liên quan đến đề tài, sở lý thuyết ngôn ngữ Bảng 7: Các thành phần khung luật học bước 109 học tin học, tảng để chúng em thực luận văn, nêu Bảng 8: Các khung luật dùng học luật chuyển đổi cấp 109 rõ phần chương Bảng 9: Ý nghĩa khuôn mẫu khung luật 110 1.1 Đặt vấn đề Bảng 10: Các đặc trưng ngôn ngữ mẫu rút từ cú pháp tiếng Anh 112 Chế tạo loại máy có khả dịch tự động để giúp cho người vượt Bảng 11: Các thành phần khung luật học chuyển đổi khác cấp 120 qua rào cản ngôn ngữ mơ ước loài người có từ kỷ XVII, lâu Bảng 12: Các khung luật dùng học luật chuyển đổi khác cấp 121 trước máy tính điện tử đời Và chẳng sau máy tính điện tử đầu Bảng 13: Ý nghĩa thành phần khung luật bước 122 Bảng 14: Một phần cú pháp minh hoạ việc đánh ID tương đối cho route 123 tiên đời, bên cạnh ứng dụng tính toán lĩnh vực toán học vật lý, người ta nghĩ đến việc sử dụng “bộ não máy tính” cho ứng dụng không liên quan đến số, có vấn đề dịch tự động Lần đầu tiên, việc sử dụng Bảng 15: Tóm tắt kết học luật chuyển đổi cấp 130 máy tính điện tử để dịch văn từ ngôn ngữ sang ngôn ngữ khác đề cập Bảng 16: Tóm tắt kết học luật chuyển đổi cấp 131 đến thảo luận Andrew D Booth Warren Weaver vào năm Bảng 17: Kết thử nghiệm việc áp dụng chuyển đổi cú pháp 135 1946 Vượt qua nhiều trở ngại lý thuyết công nghệ, Booth cộng ông cho mắt “hệ dịch dựa tự điển” hội nghị MIT vào năm 1952 Từ bước khởi đầu đó, dịch máy ngày thu hút quan tâm nghiên cứu nhiều nhà khoa học máy tính, nhiều nhà ngôn ngữ học, cộng đồng giới thừa nhận hiệu to lớn Dịch máy giúp cho Trang 13 Trang 14 Chương - Tổng quan chuyển đổi cú pháp Chương - Tổng quan chuyển đổi cú pháp việc dịch tài liệu, dịch trang Web nhanh chóng tốn công sức hơn, việc Trong luận văn này, chúng em tìm hiểu xây dựng chương trình chuyển đổi giao lưu trao đổi văn hoá nước dễ dàng hơn, mà có ý nghĩa việc cú pháp Anh-Việt, đóng vai trò khối chuyển đổi cấu trúc hệ dịch tự bảo mật cho tài liệu quan trọng cần dịch thuật động Anh-Việt dựa chuyển đổi Như trình bày phần trên, việc thực Tuy vậy, để có hệ dịch tự động cho kết dịch tốt chương trình có khả bao quát tất cấu trúc chuyển đổi có trình nghiên cứu xây dựng phức tạp, phụ thuộc nhiều vào ngôn vấn đề không tưởng xử lý ngôn ngữ tự nhiên Do đó, chúng em giới hạn ngữ cần dịch Điều khiến cho dịch máy lâm vào thời kỳ “khủng đề tài chuyển đổi cú pháp văn thuộc lĩnh vực khoa học kỹ thuật hoảng” phương pháp xây dựng hệ dịch Từ năm 1960, sau thập kỷ Kết chương trình chuyển đổi cú pháp Anh - Việt thể gián tiếp đời, dịch máy có nhiều chiến lược, phương pháp rõ ràng mục tiêu qua trật tự từ câu tiếng Việt dịch (không quan tâm đến nghĩa từ hệ dịch máy đặt sát với thực tế Người ta nhận thấy tham vọng chọn có thực xác hay không) xây dựng hệ dịch tự động có khả dịch tất câu ngôn Trong phần tiếp theo, chúng em trình bày tóm tắt ba chiến lược dịch máy ngữ tự nhiên điều không tưởng, mục tiêu hệ dịch phải thu gọn lại lĩnh để có nhìn bao quát hệ dịch dựa chuyển đổi, vực hẹp để hạn chế bớt tính nhập nhằng ngôn ngữ thấy ưu điểm so với hai chiến dịch lại Có chiến lược dịch máy, : 1.2 Các chiến lược dịch máy ™ Dịch trực tiếp ™ Dịch dựa ngôn ngữ trung gian 1.1.1 Chiến lược dịch trực tiếp ™ Dịch dựa chuyển đổi Cho đến nay, hệ dịch dựa chuyển đổi đánh giá cao tính khả thi Tùy thuộc vào hai ngôn ngữ cần dịch mà hệ thống thiết kế khối phân tích, chuyển đổi, tái tạo với độ phức tạp thích hợp Một số hệ dịch dựa chuyển đổi tiêu biểu như, hệ dịch Anh-Pháp METEO xây dựng đại học Montreal - TAUM, đưa vào sử dụng để dịch tin dự báo thời tiết; Chiến lược có cách tiếp cận dịch máy đơn giản Thiết kế hệ xử lý hệ thống đơn giản, bao gồm khối : ™ Phân tích hình thái : đảm nhận việc đưa từ ngôn ngữ nguồn dạng gốc để thực việc tra tự điển ™ Tra từ điển song ngữ: xác định từ tương ứng từ gốc ngôn ngữ đích ™ Sắp xếp trật tự từ đơn giản : trình thường dựa qui luật hệ dịch GETA (Đại học Grenoble, 1971-), Trong hệ dịch dựa chuyển đổi, bước chuyển đổi bước quan trọng nhất, giữ vai trò định chất lượng hệ dịch Chuyển đổi bao gồm hai phần cố định đơn giản ta xây dựng luật xử lý trật tự phức tạp phân tích ngôn ngữ nguồn cần thiết chuyển đổi chính, chuyển đổi từ vựng chuyển đổi cấu trúc Chuyển đổi từ vựng trình chọn nghĩa cho từ ngôn ngữ nguồn thể sang từ tương ứng ngôn ngữ đích Còn chuyển đổi cấu trúc trình xếp lại, Văn nguồn Phân tích hình thái Tra từ điển song ngữ Sắp xếp trật tự đơn giản Văn kết thêm bớt, thay thành phần cấu trúc câu ngôn ngữ nguồn để có Hình 1: Mô hình dịch trực tiếp cấu trúc tương ứng ngôn ngữ đích Trang 15 Trang 16 Chương - Tổng quan chuyển đổi cú pháp Chương - Tổng quan chuyển đổi cú pháp Các hệ dịch hạn chế tối đa bước phân tích cần thiết để giải nhập nhằng, đơn giản hoá việc xác định thành phần tương ứng ngôn ngữ đích thông qua tự điển lẫn xác định trật tự từ ngôn ngữ đích Giữa khối phân tích tái tạo câu bước trung gian Các từ ngôn ngữ trung gian thoả điều kiện điều khó khăn Hơn nữa, tất thông tin cần thiết bước tái tạo phải nằm ngôn ngữ trung gian 1.1.3 Chiến lược dịch dựa chuyển đổi văn nguồn qua bước phân tích hình thái Cách làm phù hợp ngôn ngữ nguồn đích có nhiều điểm giống tiếng Anh tiếng Tây Ban Nha, không phù hợp với phần lớn ngôn ngữ khác Ngữ pháp ngôn ngữ nguồn / Tự điển 1.1.2 Chiến lược dịch dựa ngôn ngữ trung gian lại theo ngôn ngữ trung gian, văn ngôn ngữ đích phát sinh từ Luật chuyển đổi / Tự điển ngôn ngữ trung gian Do đó, có cách biểu diễn cho đơn vị Ngữ pháp ngôn ngữ đích / Tự điển Phân tích Phát sinh CHUYỂN ĐỔI Biểu diễn trung gian ngôn ngữ đích ngữ nghĩa, ngôn ngữ gốc Văn nguồn PHÂN TÍCH Biểu diễn trung gian ngôn ngữ nguồn Trong chiến lược này, ngữ nghĩa văn ngôn ngữ nguồn biểu diễn Ngôn ngữ trung gian Văn nguồn Văn kết PHÁT SINH Văn kết Hình 3: Mô hình dịch dựa chuyển đổi Hình 2: Mô hình dịch dựa ngôn ngữ trung gian Chiến lược chia trình dịch thành giai đoạn Xử lý hệ thống dựa ngôn ngữ trung gian bao gồm hai bước quan trọng, : ™ Phân tích ™ Chuyển đổi ™ Phân tích văn nguồn để biểu diễn lại dạng thức ngôn ngữ trung gian ™ Phát sinh Chiến lược dịch dựa chuyển đổi phân tích biểu diễn lại câu ngôn ngữ ™ Sử dụng đơn vị ngữ nghĩa cấu trúc cú pháp ngôn ngữ đích để nguồn theo dạng thức trung gian thích hợp cho việc chuyển đổi Khối phát sinh phát sinh văn kết từ cách biểu diễn theo dạng ngôn ngữ trung gian câu nhận dạng thức trung gian ngôn ngữ đích tạo câu ngôn ngữ đích Sự Ngôn ngữ trung gian sử dụng hệ dịch đòi hỏi phải chuyển đổi hai dạng thức trung gian thực nhờ khối chuyển đổi, khối đủ phong phú để biểu diễn tất đơn vị từ vựng cú pháp ngôn sử dụng tự điển chuyển đổi chứa tương quan từ vựng hai ngôn ngữ liên quan trình dịch Do đó, việc tự định nghĩa hay tìm kiếm ngữ nguồn đích tập hợp luật chuyển đổi Trang 17 Trang 18 Chương - Tổng quan chuyển đổi cú pháp Chương - Tổng quan chuyển đổi cú pháp Quá trình phân tích thực nhiều cấp độ khác tùy thuộc 1.2 Vai trò chuyển đổi cú pháp cách tiếp vào hai ngôn ngữ, chẳng hạn phân tích hình thái, cấu trúc, ngữ nghĩa, Các cấp cận dựa chuyển đổi độ phân tích khác dẫn đến nhiều cấp độ dạng thức trung gian Những dạng thức chứa thành phần từ vựng nguồn đích, phản ánh cấu trúc hai Ngôn ngữ trung gian ngôn ngữ Có nhiều loại biểu diễn khác sử dụng hệ dịch dựa chuyển đổi như: phụ thuộc, cấu trúc ngữ, Chiến lược dịch máy dựa chuyển đổi có nhiều ưu điểm Trước hết, tính Chuyển đổi tương đồng ngôn ngữ nguồn đích cao bước chuyển đổi đơn giản Tương tự, giai đoạn phân tích phát sinh đơn giản so với hệ dịch dựa ngôn ngữ trung gian Dịch trực tiếp Trong ba chiến lược nói chiến lược dựa chuyển đổi quan Văn nguồn tâm nhiều tính khả thi cao linh động Bằng chứng có nhiều hệ dịch dựa chuyển đổi đời hoạt động hiệu quả.[21] Văn đích Hình 4: Hình tháp minh họa chiến lược dịch máy1 Trên lý thuyết, phân tích ngữ pháp sâu, gánh nặng bước chuyển đổi giảm Hai vấn đề lớn mà khối chuyển đổi cần giải chuyển đổi từ vựng chuyển đổi cấu trúc Chuyển đổi từ vựng thay từ văn nguồn từ tương ứng ngôn ngữ đích Công việc đơn giản từ ngôn ngữ nguồn tương ứng với từ ngôn ngữ đích thực tế, từ ngôn ngữ nguồn từ tương ứng có nhiều từ tương ứng ngôn ngữ đích Chọn lựa cho vào ngữ cảnh câu cần dịch vấn đề mà chuyển đổi từ vựng phải giải Chuyển đổi cấu trúc bước xếp thành phần ngữ pháp ngôn ngữ nguồn, bao gồm chèn, xoá thành phần cho kết dịch tuân thủ luật ngữ pháp ngôn ngữ đích, văn kết xuất gần với ngôn ngữ tự nhiên Trang 19 Hình tháp nhóm GETA đưa vào năm 1968 Trang 20 Chương – Thử nghiệm & đánh giá Chương – Thử nghiệm & đánh giá (E) These devices convert a bar code, which is a pattern of printed bar on Số khung luật sử dụng (phụ lục 2) Thời gian học bước 27 phút 06 giây products, into a code the computer can understand Số luật rút 817 Ö Số luật giữ lại 112 in sản phẩm, vào mã máy tính hiểu (V) Những thiết bị biến đổi mã thanh, mà mẫu (E) A game controller can be considered an input device because a Bảng 16: Tóm tắt kết học luật chuyển đổi cấp computer game is a program Ö 0.9406 0.9404 ™ Câu tiếng Anh có chuyển đổi trung bình 0.9402 Độ xác (V) Một điều khiển trò chơi cân nhắc thiết bị đầu vào trò chơi máy tính chương trình 0.94 (E2) This is a new and very powerful computer 0.9398 0.9396 (V2) Đây máy tính mạnh 0.9394 70 139 208 277 346 415 484 553 622 691 760 Một số kết chuyển đổi tương tự: Số luật (E) Intel will jointly develop the chips with an Israeli company, Alvarion, which will incorporate them into its own line of broadband wireless access Hình 39: Đánh giá tập luật học chuyển đổi khác cấp – 112 luật đầu cho kết tốt systems now under development, the companies said in separate statements Ö 5.1.3 Một số kết chuyển đổi (V) Intel kết hợp phát triển vi mạch với công ty Israeli, Alvarion, mà tập hợp chúng vào đường hệ thống (sự) truy cập Dưới số minh hoạ cho kết dịch sử dụng khối chuyển đổi cú pháp chúng em (VCLTransfer), câu dịch hiển thị tiếng Việt không dây băng thông rộng phát triển, công ty nói tuyên bố riêng biệt ™ Câu tiếng Anh có chuyển đổi phức tạp ™ Câu tiếng Anh có chuyển đổi tương đối đơn giản (E1) This computer is the most powerful (E3) This system is able to translate all normal and new sentence patterns (V1) Máy tính mạnh (V3) Hệ thống có khả để dịch tất mẫu câu bình thường Một số kết chuyển đổi tương tự: Một số kết chuyển đổi tương tự: Trang 131 Trang 132 Chương – Thử nghiệm & đánh giá Chương – Thử nghiệm & đánh giá (E) Several computer manufacturers now offer another spacesaving pointing device, consisting of a small joystick positioned near the middle of the (E1) How can a computer compute a complex formular ? keyboard, typically between the G and H keys Ö (V) Vài nhà sản xuất máy tính đưa thiết bị trỏ tiết kiệm (V1) Một máy tính tính toán công thức phức tạp cách ? không gian khác, gồm cần điều khiển trò chơi nhỏ định vị gần Một số kết chuyển đổi tương tự: bàn phím, điển hình phím G H (E) How you double-click an item with a mouse ? (E) When running any Windows program, you can press Alt to activate the menu bar, and then press a highlighted letter in a menu's name to open that Ö (E) Do you think Intel should implement a similar change? menu Ö (V) Nhấp kép mục với chuột cách ? (V) Khi mà chạy chương trình Windows nào, bạn nhấn Alt để kích hoạt thực đơn, sau nhấn chữ sáng mạnh tên Ö (V) Bạn có suy nghĩ Intel nên thực thay đổi tương tự không? (E) Which operating system are you using ? thực đơn để mở thực đơn Ö ™ Câu phủ định tiếng Anh (E4) Some people can not use a mouse (V) Bạn sử dụng hệ điều hành ? Một vấn đề lớn chuyển đổi cú pháp hệ dịch Anh-Việt giải chuyển đổi cho câu hỏi Việc chuyển đổi cấu trúc cho dạng câu hỏi dễ dẫn đến việc luật mâu thuẫn Điều làm ảnh hưởng đến chất (V4) Vài người không sử dụng chuột lượng tập luật: không đảm bảo chuyển đổi tất dạng câu hỏi nói Ö Một số kết chuyển đổi tương tự: riêng cấu trúc câu khác nói chung Do tính phức tạp câu hỏi, (E) In many cases, however, an ordinary input device may not be appropriate cấu trúc câu hỏi thường phải có tác động giai đoạn: chuyển đổi sở (V) Tuy nhiên, nhiều trường hợp, thiết bị đầu vào thông thường dựa nguyên tắc; chuyển đổi thành phần cấp/khác cấp cuối không (thì) thích hợp giai đoạn chèn/xoá ™ Câu hỏi tiếng Anh 5.2 Đánh giá (E1) Is an old man installing a new computer program ? 5.2.1 Ngữ liệu thử nghiệm (V1) Một người đàn ông già cài đặt chương trình máy tính phải không ? Ngữ liệu thử nghiệm chúng em gồm 1.000 câu sách CADASA phần chưa dùng để huấn luyện Kết thử nghiệm tóm tắt bảng sau: Trang 133 Trang 134 Chương – Thử nghiệm & đánh giá Chương – Thử nghiệm & đánh giá W A Độ xác Ds Sau gán nhãn chuyển đổi sở 17.767 2.239 87,4% Sau chuyển đổi cấp 17.767 1.385 92,2% Sau chuyển đổi khác cấp 17.767 1.058 94,1% sai trường hợp Để khắc phục nhược điểm này, ta cần phải tăng lượng ngữ liệu học tính đa dạng ngữ liệu học Bảng 17: Kết thử nghiệm việc áp dụng chuyển đổi cú pháp Ngoài để đánh giá chung kết chuyển đổi chương trình (bao gồm phần chèn/xoá thành phần chức tiếng Việt Chúng em so sánh kết xuất chương trình với chương trình dịch có thị trường, EVTRAN 2.0 (công ty SOFTEX, 1999-2000) Do kết dịch phối hợp chuyển đổi cấu trúc chuyển đổi từ vựng, nên việc đánh giá kết chuyển đổi cấu trúc làm tự động dựa vào kết dịch Chúng ta đánh giá câu đúng, sai trật tự từ mà Một số mẫu câu dịch từ hai hệ thống chúng em trình bày phần phụ lục Ở chúng em muốn nhấn mạnh đến trật tự từ câu ngữ nghĩa bề mặt câu thuộc thành phần khác hệ dịch 5.2.2 Nhận xét Chương trình chuyển đổi cú pháp chuyển đổi tốt phạm vi cấp chuyển đổi thành phần khác cấp, điều mà chương trình chuyển đổi dựa luật cố định thực thực bề mặt câu Tuy nhiên số vấn đề trở ngại lớn cho việc chuyển đổi cú pháp Đó phụ thuộc chương trình chuyển đổi cú pháp vào xác trình phân tích bước trước Cụ thể phận: gán nhãn từ loại, phân tích cú pháp câu, xác định quan hệ ngữ pháp câu Chẳng hạn, từ cú pháp bị gán nhãn từ loại sai dẫn đến cú pháp câu bị sai Phương pháp học chuyển trạng thái học luật khắc phục lỗi sai có hệ thống Những lỗi sai chi tiết dẫn đến luật sửa sai chi tiết áp dụng cho đa số trường hợp khác, chí làm Trang 135 Trang 136 Chương - Tổng kết Chương - Tổng kết Mặt khác, giới hạn luận văn, khung luật chương trình khai Chương thác đặc trưng từ loại, từ, cấu trúc ngữ, … mà chưa quan tâm đến TỔNG KẾT nhân tố ảnh hưởng đến khác biệt cấu trúc tiếng Anh tiếng Việt khác Do đó, chúng em tiếp tục mở rộng thêm loại khung luật để rút trích đặc trưng lại như: ngữ nghĩa, chiều dài nghĩa tiếng Việt thành phần cú pháp (chẳng hạn: "Trong tiếng Việt, định ngữ dài đứng sau định 6.1 Kết ngữ ngắn hơn"), loại tính từ miêu tả làm định ngữ danh ngữ (chỉ màu sắc, Hiện nay, chương trình chuyển đổi cú pháp có khả năng: ™ hình dáng, ), Chuyển đổi trật tự thành phần cấp với nhiều mức độ phức tạp: chuyển vị trí định ngữ so với danh từ trung tâm định ngữ, bổ ngữ so với tính từ/động từ tính ngữ/động ngữ, … ™ Cấu trúc cú pháp câu góp phần tạo nên ngữ nghĩa câu Do đó, chuyển Chuyển đổi trật tự thành phần không cấp: chuyển vị trí trạng từ bổ nghĩa cho câu, vị trí từ hỏi, … ™ 6.3 Kết luận đổi cấu trúc cú pháp hệ dịch tự động Anh-Việt góp phần không nhỏ vào chất lượng hệ dịch Trong luận văn này, chúng em đưa cách tiếp cận Chèn, xoá số thành phần như: xoá trợ động từ câu tiếng Anh việc chuyển đổi cú pháp Anh-Việt, dựa phương pháp học Chuyển (không có ý nghĩa ngữ pháp tiếng Việt), chèn thêm số hư từ để trạng thái hướng lỗi nhanh (FnTBL) để rút trích tri thức chuyển đổi từ ngữ liệu câu tiếng Việt trở nên tự nhiên song ngữ Chương trình chuyển đổi cú pháp cài đặt cho kết thử Như vậy, chương trình hoàn thành mục tiêu mà luận văn đề ban đầu chuyển đổi cú pháp cho tài liệu khoa học kỹ thuật (trước mắt nghiệm tài liệu Khoa học cao (trên 94%) chứng tỏ phương pháp có tiềm lớn tài liệu tin học) có khả tiếp tục mở rộng tương lai chúng em Với kết đạt qua thực nghiệm, chúng em thấy khối chuyển xây dựng kho ngữ liệu huấn luyện đầy đủ bao quát Tuy nhiên cho đổi cú pháp chúng em thực đưa vào làm khối chuyển đổi đến nay, chương trình số hạn chế nhập nhằng mặt cấu trúc hệ dịch tự động Anh-Việt dựa chuyển đổi tốt Đây độ xác kết khối phân tích bước trước (phân tích ngữ pháp, bước khởi đầu trình nghiên cứu chuyển đổi cấu trúc Anh-Việt Để xác định quan hệ, …) chương trình đạt chất lượng cao đòi hỏi trình tiếp tục lao động nghiên cứu, sáng tạo không ngừng Tuy nhiên, kết bước đầu chương 6.2 Hướng phát triển trình khích lệ để chúng em bước tiếp đường thực mơ ước Chương trình cài đặt theo phương pháp hướng đối tượng kết hợp với khả mở rộng chương trình học, có khả phát triển dễ dàng “được đóng góp phần nhỏ bé vào việc xây dựng hệ dịch tự động từ tiếng Anh sang tiếng mẹ đẻ - tiếng Việt” tương lai Trong thời gian tới, chúng em tiếp tục hoàn thiện ngữ liệu học số lượng lẫn chất lượng để chương trình bao quát nhiều cấu trúc Trang 137 Trang 138 Phụ lục Phụ lục PHỤ LỤC idx(1,3)=({1},{2},{3}) : idx(1,3)=({2},{1},{3}) KHUNG LUẬT VÀ MỘT SỐ LUẬT CÙNG CẤP STT Khung luật học chuyển đổi cấp prpos=({VP}) & pos(1,3)=({MD},{ADVP},{VP}) & idx(1,3)=({1},{2},{3}) : idx(1,3)=({2},{1},{3}) prpos=({NP}) & pos(1,3)=({DT},{ORD},{NN}) & idx(1,3)=({1},{2},{3}) : idx(1,3)=({1},{3},{2}) grpos=({S}) & prpos=({NP}) & pos(1,3)=({NP},{:},{NP}) idx(1,3)=({1},{2},{3}) : idx(1,3)=({3},{1},{2}) prpos=({ADJP}) & pos(1,2)=({RB},{JJR}) & wrd(1)=({RB},{much}) & idx(1,2)=({1},{2}) : idx(1,2)=({2},{1}) prpos=({SQ}) & pos(1,3)=({MD},{NP},{VP}) & idx(1,3)=({1},{2},{3}) : idx(1,3)=({2},{1},{3}) 10 prpos=({ADVP}) & pos(1,2)=({RBS},{RB}) & idx(1,2)=({1},{2}) : idx(1,2)=({2},{1}) & prpos=(P) & pos(X,Y)=() & idx(X,Y)=() : idx(X,Y)=() grpos=(G) & prpos=(P) & pos(X,Y)=() & idx(X,Y)=() : idx(X,Y)=() prpos=(P) & pos(X,Y)=() & wrd(T)=({DT},W) & idx(X,Y)=() : idx(X,Y)=() prpos=(P) & pos(X,Y)=() & wrd(T)=({JJ},W) & idx(X,Y)=() : idx(X,Y)=() prpos=(P) & pos(X,Y)=() & wrd(T)=({RB},W) & idx(X,Y)=() : idx(X,Y)=() prpos=(P) & pos(X,Y)=() & wrd(T)=({IN},W) & idx(X,Y)=() : idx(X,Y)=() 11 prpos=(P) & pos(X,Y)=() & wrd(T)=({AUX},W) & idx(X,Y)=() : idx(X,Y)=() prpos=({NP}) & pos(1,3)=({VB},{NN},{CD}) & idx(1,3)=({1},{3},{2}) : idx(1,3)=({1},{2},{3}) 12 prpos=(P) & pos(X,Y)=() & wrd(T)=({PRP$},W) & idx(X,Y)=() : idx(X,Y)=() prpos=({SBARQ}) & pos(1,3)=({WHADVP},{SQ},{.}) idx(1,3)=({1},{2},{3}) : idx(1,3)=({2},{1},{3}) & 13 prpos=(P) & pos(X,Y)=() & wrd(T)=({CC},W) & idx(X,Y)=() : idx(X,Y)=() prpos=({NP}) & pos(1,4)=({DT},{NN},{NN},{POS}) idx(1,4)=({2},{4},{3},{1}) : idx(1,4)=({1},{4},{3},{2}) & 10 prpos=(P) & pos(X,Y)=() & wrd(T)=({MD},W) & idx(X,Y)=() : idx(X,Y)=() 14 prpos=({ADJP}) & pos(1,3)=({RBS},{RB},{VBN}) idx(1,3)=({1},{2},{3}) : idx(1,3)=({3},{2},{1}) & 11 prpos=(P) & pos(X,Y)=() & wrd(T)=({PRT},W) & idx(X,Y)=() : idx(X,Y)=() 15 & : 12 prpos=(P) & pos(X,Y)=() & wrd(T)=({ORD},W) & idx(X,Y)=() : idx(X,Y)=() prpos=({NP}) & wrd(1)=({DT},{the}) idx(1,4)=({1},{4},{3},{2}) 16 grpos=({SQ}) & prpos=({VP}) & idx(1,2)=({1},{2}) : idx(1,2)=({2},{1}) 17 prpos=({NP}) & pos(1,3)=({DT},{JJ},{NN}) & wrd(2)=({JJ},{great}) & idx(1,3)=({1},{3},{2}) : idx(1,3)=({1},{2},{3}) STT Một số luật chuyển đổi cấp pos(1,4)=({DT},{JJ},{NN},{POS}) & idx(1,4)=({2},{4},{3},{1}) pos(1,2)=({AUX},{NP}) & prpos=({NP}) & idx(1,2)=({1},{2}) : 18 grpos=({ADJP}) & prpos=({ADVP}) & pos(1,2)=({RB},{RBR}) & idx(1,2)=({1},{2}) : idx(1,2)=({2},{1}) prpos=({NP}) & pos(1,3)=({DT},{NN},{POS}) & wrd(1)=({DT},{the}) & idx(1,3)=({2},{3},{1}) : idx(1,3)=({1},{3},{2}) 19 grpos=({NP}) & prpos=({ADJP}) & idx(1,2)=({1},{2}) : idx(1,2)=({2},{1}) prpos=({NP}) & idx(1,2)=({1},{2}) 20 prpos=({NP}) & pos(1,4)=({JJ},{:},{NN},{NNS}) idx(1,4)=({1},{2},{4},{3}) : idx(1,4)=({4},{1},{3},{2}) grpos=({S1}) & prpos=({SBARQ}) & pos(1,3)=({WHNP},{SQ},{.}) & pos(1,2)=({NN},{CD}) pos(1,2)=({NNP},{CD}) & & idx(1,2)=({2},{1}) idx(1,2)=({2},{1}) Trang 139 : pos(1,2)=({RB},{VBN}) & & Trang 140 Phụ lục Phụ lục PHỤ LỤC PHỤ LỤC KHUNG LUẬT VÀ MỘT SỐ LUẬT KHÁC CẤP MỘT SỐ KẾT QUẢ DỊCH SỬ DỤNG KHỐI CHUYỂN ĐỔI CÂY CÚ PHÁP VCLTRANSFER STT Khung luật học chuyển đổi khác cấp route() & pos() & posb(X,Y)=() & pose(W,Z)=() : move(U,V) route() & pos() & posb(X,Y)=() & pose(W,Z)=() & posw()=(IN) & wrd()=(T) : move(U,V) Với đề tài “Xây dựng chương trình chuyển đổi cú pháp tự động hệ dịch Anh-Việt” chúng em, chất lượng chuyển đổi chương trình route() & pos() & posb(X,Y)=() & pose(W,Z)=() & posw()=(IN) & wrd()=(T) & noc()=(N) : move(U,V) kiểm chứng thực tế qua việc tích hợp khối chuyển đổi vào hệ dịch Anh-Việt hoàn chỉnh Dưới số kết dịch hệ dịch VCLEVT 2.0 tích hợp khối chuyển đổi cú pháp chúng em (đây chương trình dịch tự động STT Một số luật chuyển đổi khác cấp route(0.1.0,0.1,0)&pos(RB,ADVP,VP)&posb(0,0)=(RB)& pose(0,2)=(AUX,ADVP,NP):move(0,0)posw()=(RB)&wrd()=(too): move(0,0) route(0.1,0,0.2) & pos(ADVP,S,VP) & posb(0,3)=(NP,ADVP,VP,.) & pose(0,1)=(VBZ,SBAR) : move(1,1) route(0.1,0,0.2) & pos(ADVP,S,VP) & posb(0,3)=(NP,ADVP,VP,.) & pose(0,1)=(VBP,SBAR) : move(1,1) route(0.2.1,0.2,0) & pos(AUX,VP,SQ) pose(0,2)=(N*,MD,VP) : move(1,2) & posb(0,1)=(N*,AUX) & route(0.1,0,0.2) & pos(WH*,VP,PP) pose(0,0)=(IN) : move(1,1) posb(0,2)=(VBG,WH*,PP) & route(0.1.0,0.1,0,0.0) & pos(RB,VP,S,NP) & pose(0,0)=(EX) & posw()=(RB) & wrd()=(not) : move(0,0) route(0.3.1,0.3,0) & pos(AUX,VP,SQ) & posb(0,1)=(N*,AUX) & pose(0,4)=(NP,AUX,ADVP,VP,.) & posw(1)=(AUX) & wrd(1)=(been) : move(1,3) route(0.1.0,0.1,0,0.0,0.0.0) & pos(WP,WH*,SBARQ,SQ,VP) & posb(0,0)=(WP)&pose(0,1)=(VB*,S)&posw()=(WP)&wrd()=(what):move(1,0) route(0.1,0,0.2,0.2.0) & pos(WH*,VP,S,VP) & posb(0,2)=(VBG,WH*,S) & pose(0,0)=(TO) : move(1,1) 10 route(0.2.0,0.2,0) & pos(RB,ADVP,VP) pose(0,2)=(VBP,NP,ADVP) & & & posb(0,0)=(RB) Trang 141 & Anh-Việt nhóm VCL thực hiện) * Do chúng em muốn nhấn mạnh đến chất lượng khối chuyển đổi nên phần dịch chúng em có hiệu chỉnh lại ngữ nghĩa số từ chưa dịch xác (tuy nhiên hạn chế), điều nhằm mục đích làm cho câu dịch dễ đọc dễ theo dõi hơn; kết chuyển đổi kết thực tế chương trình hiệu chỉnh ™ Các câu tiếng Anh thử nghiệm thuộc sách CADASA, Come to the world of microcomputers, NXB Thống kê, 2002 STT Câu tiếng Anh VCLEVT 2.0 (sử dụng VCLTransfer) In an era of high-speed Vào thời đại truyền thông tốc độ communications, we want to cao, muốn để nhận thông tin receive information immediately nhiều cách song song and in many ways simultaneously Today's multimedia products appeal to multiple senses at one time and respond to our changing needs with ever-increasing speed Những sản phẩm truyền thông đa phương tiện hôm kêu gọi tới nhiều giác quan lúc đáp ứng tới nhu cầu thay đổi với tốc độ ngày tăng Trang 142 Phụ lục Phụ lục This chapter introduces you to Chương giới thiệu bạn tới khái basic multimedia concepts and niệm truyền thông đa phương tiện explains how multimedia works giải thích làm truyền thông đa phương tiện làm việc At a more advanced level, people use movies and television to combine multiple types of media (sound, video, animation, still graphics, and text) to create different kinds of messages that inform or entertain in unique and meaningful ways Tại mức tiên tiến hơn, người sử dụng phim truyền hình để kết hợp nhiều loại phương tiện ( âm thanh, hình, hoạt hình, đồ họa, văn ) để tạo loại khác thông điệp mà báo tin giải trí cách đầy ý nghĩa This requirement may mean giving the user multiple pieces of information simultaneously - such as a rotating 3-D image of a motor, an audio description of its function, and pop-up text boxes that provide more information when the user points at certain parts of the graphic Yêu cầu nghĩa đưa nhiều miếng người dùng thông tin song song hình ảnh 3-D quay động cơ, mô tả âm chức nó, hộp văn phổ biến mà cung cấp thông tin nhiều mà người dùng trỏ phận đồ họa Multimedia developers continually struggle to find ways to make their products more appealing to users, whether the product is a fast-paced action game, a tutorial on disk, or an e-commerce Web site Những nhà phát triển truyền thông đa phương tiện liên tục đấu tranh để tìm thấy cách để làm sản phẩm họ hấp dẫn tới người dùng, dù sản phẩm trò chơi hoạt động fast-paced, hướng dẫn dĩa, trang web thương mại điện tử Steps in a tutorial or a carefully crafted story, for example, must be told in an unalterable sequence for accuracy or the most dramatic impact Ví dụ như, bước hướng dẫn chuyện thủ công cẩn thận, phải bảo dãy nối tiếp không thay đổi cho xác va chạm kịch tính Because of the intensive amount of digital information that goes into building every second of a program, multimedia publishers must always consider the user's equipment - the hardware on which the content will be displayed Bởi lượng cao độ thông tin số mà vào xây dựng giây chương trình nên nhà xuất truyền thông đa phương tiện luôn phải cân nhắc thiết bị người dùng - phần cứng mà nội dung hiển thị Trang 143 The advantage of passive matrix monitors is that they are less expensive than active matrix, a major consideration in laptops where the monitor can account for one-third the cost of the entire computer Thuận lợi hình ma trận thụ động chúng (thì) mắc hơn so với ma trận hoạt động, cân nhắc máy xách tay nơi mà hình xem one-third(một phần ba) giá toàn thể máy vi tính 10 Many large companies and organizations rely heavily on a commercial or custom DBMS to handle immense data resources Nhiều công ty lớn tổ chức phụ thuộc nặng nề DBMS thương mại phong tục để xử lý tài nguyên liệu bao la ™ Các câu tiếng Anh thử nghiệm thuộc phần Help and Support Windows XP Professional, Microsoft Coporation STT Câu tiếng Anh VCLEVT 2.0 (Sử dụng VCLTransfer) Read articles containing full Đọc tác phẩm chứa mô tả descriptions for performing key đầy đủ cho thực nhiệm vụ chủ tasks from start to finish chốt từ khởi đầu để/đến hoàn tất Thank you for choosing to use Cám ơn bạn cho chọn để sử dụng WindowsWindows-XP-Professional! XP-Professional! There are many new and exciting Có nhiều đặc tính thú vị lúc/ở đầu ngón tay bạn features at your fingertips You can also communicate with other people on other networks without worrying about compromising your privacy or your personal data files Windows XP Professional has Windows XP Professional có nhiều đặc tính many features and tools that will công cụ mà làm sử dụng máy tính make using your computer easy, bạn dễ, hữu hiệu, giải trí effective, and entertaining Copying software without the permission of the owner is "copyright infringement," and the law imposes penalties on infringers Bạn truyền tin với người khác mạng khác mà lo ngại thỏa hiệp riêng tư bạn tập tin liệu cá nhân bạn Sao chép phần mềm mà cho phép người sở hữu `` vi phạm quyền quyền, '' luật đánh thuế phạt người vi phạm quyền Trang 144 Phụ lục Phụ lục Almost all commercial computer software is licensed directly or indirectly from the copyright owner (the software publisher) for use by the customer through a type of contract called an "End User License Agreement" (also known as a EULA) Hầu tất phần mềm máy tính thương mại cho phép trực tiếp gián tiếp từ người sở hữu quyền ( nhà xuất phần mềm ) cho việc sử dụng khách hàng xuyên qua loại hợp đồng gọi `` thỏa thuận giấy phép người dùng cuối '' ( biết EULA ) Do Microsoft products give me the Những sản phẩm Microsoft có đưa khả ability to access the Internet? để truy cập Internet không? Internet access is included in most products 10 It is important to understand the Nó (thì) quan trọng để hiểu khác difference between registering đăng ký bạn your copy of Windows-XP and Windows-XP kích hoạt activating it a feature (sự) truy cập mạng INTERNET đặc Microsoft tính bao gồm hầu hết sản phẩm Microsoft the highest text quality A high price does not necessarily Một giá cao không thiết thị indicate excellent graphics đồ họa xuất sắc From home offices to businesses, monochrome laser printers offer the best balance between price, print quality, and speed If you need color, you'll probably Nếu bạn cần màu bạn có lẽ muốn want an ink jet printer, but if you máy in tia mực, bạn có không have the space, it's almost worth it gian (thì) đáng giá để mua hai to buy both Color laser toner cartridges are Những băng mực toner la-de màu (thì) also potentially hazardous to the có tiềm nguy hiểm tới môi environment trường Few home users will need a color Một người dùng nhà cần máy in laser printer la-de màu 10 If you plan to print mostly photos, look for photo printers with extra features such as a built-in PC Card slot, an LCD panel that allows you to view and print an image without using your PC, and bundled image-editing software ™ Các câu tiếng Anh thử nghiệm thuộc trang Web PCWorld Mỹ, địa http://www.pcworld.com/howto/bguide/ STT Câu tiếng Anh khoảng chất lượng văn cao nhất VCLEVT 2.0 (Sử dụng VCLTransfer) Từ văn phòng nhà tới kinh doanh, máy in la-de đơn sắc đưa cân tốt giá, chất lượng in, tốc độ Nếu bạn hoạch định để in chủ yếu ảnh tìm kiếm máy in ảnh với đặc tính thêm khe PC Card nội tại, bảng điều khiển LCD mà cho phép bạn xem in hình ảnh mà sử dụng PC bạn, phần mềm image-editing Ink jet printers, along with digital Dọc theo với máy ảnh số, cameras, are changing the way we máy in tia mực, thay đổi cách chúng print photographs in hình chụp 11 These printers provide superior Những máy in cung cấp chất lượng text quality compared with high- văn cao cấp so sánh với máy in end ink jet printers tia mực đầu cuối When loaded with special photo inks and paper, ink jet printers have become one of the best options for transforming a digital image into a photograph 12 PC World tests and reviews three different types of printers: ink jets, monochrome lasers, and color lasers, on a regular basis These printers provide superior Những máy in cung cấp chất lượng text quality compared with high- văn cao cấp so sánh với máy in end ink jet printers tia mực đầu cuối Ink jet printers are inexpensive printers for the masses, designed for home users, students, or anyone who isn't concerned about Khi mà nạp với mực ảnh đặc biệt giấy, máy in tia mực trở nên lựa chọn tốt cho biến thể hình ảnh số thành hình chụp PC World kiểm tra ôn lại ba loại khác máy in: tia mực, la-de đơn sắc, la-de màu, sở thông thường Những máy in tia mực máy in không đắt cho khối lượng lớn, thiết kế cho người dùng nhà, sinh viên, (thì) liên quan Trang 145 Trang 146 Phụ lục Phụ lục PHỤ LỤC Cùng hội IBM / Microsoft không IBM / quan hệ đối tác Microsoft không kéo dài lâu lần cuối kéo dài MỘT SỐ CÂU DỊCH CỦA HAI HỆ DỊCH Lúc thời gian ấn nó, Windows NT định địa thị trường cho trạm làm việc 32-bit, nối mạng mà sử dụng vài CPU mạnh thị trường Dưới số kết dịch hai hệ dịch VCLEVT 2.0 tích hợp khối chuyển đổi cú pháp chúng em hệ dịch EVTRAN 2.0 sản phẩm thương mại thị trường ™ Các câu tiếng Anh thử nghiệm thuộc sách CADASA, Come to the world of microcomputers, NXB Thống kê, 2002 STT VCLEVT 2.0 (sử dụng VCLTransfer) You can also communicate with other people on other networks without worrying about compromising your privacy or your personal data files Bạn truyền tin với người khác mạng khác mà lo ngại thỏa hiệp riêng tư bạn tập tin liệu cá nhân bạn Bạn giao tiếp với người khác (về) mạng khác mà gây lo lắng việc thoả hiệp riêng tư tập tin liệu cá nhân (của) Bạn (của) Bạn In other words , two computers running Windows for Workgroups could be networked together without the need to purchase a separate network operating system like Novell NetWare Nói cách khác, hai máy tính chạy Windows cho Workgroups nối mạng với mà nhu cầu để mua hệ điều hành mạng riêng biệt giống Novell NetWare Nói cách khác, hai máy tính chạy Windows cho nhóm làm việc (thì) nối mạng mà nhu cầu để mua hệ điều hành mạng riêng biệt Novell NetWare The IBM / Microsoft partnership did not last long Trang 147 Nếu bạn có Macintosh, bạn (thì) chạy vài phiên (của) UNIX Linux ( Nhưng Không phải Windows) Do you plan to develop or test applications that run on a specific operating system ? Bạn có hoạch định để phát triển Bạn lập kế hoạch phát triển kiểm kiểm tra ứng dụng mà chạy tra ứng dụng mà chạy (về) hệ điều hành cụ thể không? hệ điều hành đặc biệt không ? She plays tennis and he does too Cô chơi quần vợt anh Cô chơi quần vợt làm Từng lúc, bạn thấy/xem thuật Thỉnh thoảng, bạn nhìn thấy thuật ngữ Windows 3.x ngữ Windows X Vào thời gian (của) phiên (của) nó, Windows NT hướng vào thị trường cho 32 bít, nối mạng trạm làm việc mà sử dụng CPUs mạnh thị trường If you have a Macintosh , you may also be able to run some versions of UNIX or Linux ( but not Windows ) Nếu bạn có Macintosh bạn có khả để chạy vài phiên UNIX Linux ( cửa sổ ) EVTRAN 2.0 From time to time , you may see the term Windows 3.x At the time of its release , Windows NT addressed the market for the 32-bit , networked workstations that used some of the most powerful CPUs on the market The Web is a convenient place to obtain updated information about your new operating system Web chỗ tiện lợi để nhận Mạng chỗ tiện lợi để tồn thông tin cập nhật hệ điều cập nhật hệ điều hành thông tin (của) bạn hành bạn 10 Resources on the local computer , as well as resources on remote servers , can be configured to limit access to specific users and groups of users Những tài nguyên máy tính cục bộ, tốt tài nguyên máy chủ từ xa, cấu hình để giới hạn (sự) truy cập tới người dùng cụ thể nhóm Những tài nguyên (về) máy tính địa phương, tài nguyên (về) người phục vụ từ xa, định hình tới truy nhập tới người dùng nhóm Trang 148 Phụ lục người dùng 11 ™ Các câu tiếng Anh thử nghiệm thuộc phần Help and Support đặc biệt (của) người dùng giới hạn Although performance varies according to your hardware and application , you can expect about a 50 percent improvement Mặc dù thực thi thay đổi tới phần cứng ứng dụng bạn bạn mong đợi cải tiến 50 phần trăm 12 Phụ lục Windows XP Professional, Microsoft Coporation STT Mặc dầu thực thay đổi theo phần cứng ứng dụng (của) bạn, bạn chờ đợi khoảng 50 cải tiến phần trăm If you have an active Internet connection , the information will update automatically Commercial software developers have also made a commitment to Linux , and users can expect to see popular software applications to be modified to run under Linux Những nhà phát triển phần mềm thương mại làm cam kết tới Linux, người dùng mong đợi để thấy/xem ứng dụng phần mềm phổ biến để hiệu đính để chạy Linux 14 Vài hệ thống hệ ngôn ngữ làm phức tạp liên quan lấy kiến thức cú pháp, kiến thức ngữ nghĩa, kiến thức võ đoán kiến thức giới vào cân nhắc When you are connected to the Internet, this area will display links to timely help and support information If you want to connect to the Internet now, start the New-Connection-Wizard and see how to establish a Web connection through an Internet service provider Nếu bạn muốn để nối tới Internet bắt đầu New-Connection-Wizard thấy/xem làm để thiết lập kết nối web xuyên qua nhà cung cấp dịch vụ Internet Nếu bạn muốn nối tới Internet bây giờ, khởi động New_Connection_Wizard xem để thiết lập kết nối Mạng xuyên qua nhà cung cấp dịch vụ Internet See what is new; take an entertaining tour; learn about the programs Windows-XP contains, including systems, accessories, and communications and entertainment programs Thấy/xem (thì) mới; lấy chuyến du lịch giải trí; học chương trình Windows-XP chứa, bao gồm hệ thống, phụ tùng, truyền thông chương trình giải trí Thế hệ ngôn ngữ làm phức tạp (mà) hệ thống kéo theo cầm (lấy) cho kiến thức giới kiến thức cú pháp , kiến thức ngữ nghĩa học , thực dụng kiến thức vào xem xét Xem (thì) mới; cầm (lấy) giải trí du lịch; học khoảng chơng trình (mà) Windows - XP chứa đựng , kể hệ thống, (mà) phụ kiện, truyền thông trò giải trí lập trình For example, you can use Remote-Desktop to access your work computer and its resources from home, and to view files and documents on your computer's desktop from a co-worker's computer Ví dụ như, bạn sử dụng RemoteDesktop để truy cập máy tính công việc bạn tài nguyên từ nhà, để xem tập tin tài liệu loại để bàn máy tính bạn từ máy tính đồng Trang 149 Làm bạn biết? Khi mà bạn nối tới Internet, khu Khi bạn đợc nối tới mạng(lới), vực hiển thị mối liên kết (mà) vùng trình bày liên kết tới tới giúp đỡ lúc hỗ trợ thông thông tin giúp đỡ hỗ trợ lúc tin Phần mềm Thương mại (mà) người phát triển có làm tống đạt tới Linux, người dùng mong đợi săn sóc ứng dụng phần mềm đại chúng sửa đổi chạy Linux Some complicated language generation systems involve taking syntactic knowledge, semantic knowledge, pragmatic knowledge and world knowledge into consideration EVTRAN 2.0 Did you know? Bạn có biết không ? Nếu bạn có kết nối Internet Nếu bạn có tích cực kết nối hoạt động thông tin cập nhật Internet, thông tin cập nhật tự động cách tự động 13 VCLEVT 2.0 (sử dụng VCLTransfer) Chẳng hạn, bạn sử dụng Từ xa Desktop để truy nhập máy tính công việc (của) bạn tài nguyên (của) từ nhà, để nhìn hồ sơ tài liệu máy tính bạn có Desktop từ co - máy tính Trang 150 Phụ lục nghiệp ™ Một số câu hỏi chúng em đưa STT Windows-XP-Professional cung cấp giúp đỡ trực tuyến mở rộng cho tất đặc tính hệ điều hành, tốt chuyến du lịch số để giúp bạn khám phá khả đợi bạn Windows - XP - Chuyên nghiệp cung cấp Giúp đỡ trực tuyến rộng lớn cho tất đặc tính hệ điều hành, nh số du lịch Giúp đỡ bạn khám phá khả đợi bạn Phần mềm Máy tính pháp luật hiệp ước bảo vệ luật quyền hiệp ớc quyền quốc tế nh sở hữu trí tuệ khác VCLEVT 2.0 (sử dụng VCLTransfer) Tôi cần phải làm giữ vững với John gì? Who did he beat two years ago ? Anh đánh cách hai năm ? Bạn làm? What should I to keep up with John ? Tôi nên làm để tiếp tục với John ? EVTRAN 2.0 What are you doing ? Bạn làm gì? Computer software is protected by copyright law and international copyright treaties as well as other intellectual property laws and treaties Ai làm cho đập hai năm trước đây? How tall is your mother’s sister ? Chị/em gái mẹ bạn cao bao Làm cao mẹ (của) bạn có nhiêu ? chị, em gái ? Microsoft is not responsible for Webcasting or any other form of transmission received from any linked site Microsoft không (thì) có trách nhiệm với Webcasting mẫu (dạng) khác (của) truyền nhận từ vị trí đợc liên kết With online registration, you can use your modem or an Internet connection to register your copy of Windows-XP Với đăng ký trực tuyến, bạn sử dụng điều giải bạn kết nối Internet để đăng ký bạn Windows-XP 11 Với NetMeeting bạn cho phép thực tế gặp Với ai, nơi đâu, bạn can dự vào thảo luận sử dụng âm thanh, viđêô, tán gẫu Microsoft (thì) không chịu trách nhiệm Webcasting hình thức khác truyền nhận từ chỗ liên kết 10 Sự đăng ký bảo đảm bạn nhận hỗ Sự Đăng ký bảo đảm bạn nhận sản trợ sản phẩm, thông tin cập nhật sản phẩm hỗ trợ, sản phẩm cập nhật phẩm, lợi ích khác thông tin, lợi ích khác Windows-XP-Professional provides extensive online Help for all operating system features, as well as a digital tour to help you discover the possibilities awaiting you Phần mềm máy tính bảo vệ luật quyền hiệp ước quyền quốc tế tốt luật hiệp ước tài sản trí thức khác (của) công nhân With NetMeeting you can have virtual meetings with anyone, anywhere, and you can participate in discussions using audio, video, or chat Với NetMeeting bạn có họp ảo với ai, nơi nào, bạn tham dự thảo luận sử dụng âm, hình, tán gẫu Phụ lục Với trực tuyến registration, Bạn sử dụng mô đem (của) bạn kết nối Internet để đăng ký chép (của) bạn (của) Windows - XP Registration ensures that you receive product support, product update information, and other benefits Trang 151 Trang 152 Phụ lục Phụ lục PHỤ LỤC 22 23 RP Tiểu từ (Particle) HỆ THỐNG NHÃN NGỮ PHÁP 24 SYM Ký hiệu (Symbol) 25 TO Từ “to” 26 UH Thán từ (Interjection) 27 VB Động từ nguyên mẫu không “to” (Verb, base form) Nhãn từ loại Penn Tree Bank, kho ngữ liệu thông dụng STT Nhãn từ loại Ý nghĩa RBS Trạng từ so sánh (Adverb, superlative) 28 VBD Động từ khứ (Verb, past tense) 29 VBG Danh động từ hay phân từ (Verb, gerund or present participle) 30 VBN Quá khứ phân từ (Verb, past participle) 31 VBP Động từ thứ ba số tại(Verb, non-3rd person singular present) CC Liên từ kết hợp (Coordinating conjunction) CD Số đếm (Cardinal number) DT Định từ (Determiner) EX “có” (Existential “there”) FW Từ tiếng nước (Foreign word) 32 VBZ IN Giới từ hay liên từ với mệnh đề phụ (Preposition or subordinating conjunction) Động từ thứ ba số (Verb, 3rd person singular present) 33 WDT Định từ bắt đầu Wh- (Wh-determiner) JJ Tính từ (Adjective) 34 WP JJR Tính từ so sánh (Adjective, comparative) 35 WP$ Đại từ sở hữu bắt đầu Wh- (Possessive wh-pronoun) JJS Tính từ so sánh (Adjective, superlative) 36 WRB Trạng từ bắt đầu Wh- (Wh-adverb) Đại từ bắt đầu Wh- (Wh-pronoun) 10 LS Dấu liệt kê(List item marker) 11 MD Động từ khiếm khuyết (Modal) 12 NN Danh từ số hay không đếm (Noun, singular or mass) 13 NNS Danh từ số nhiều (Noun, plural) ADJP Danh từ riêng số (Proper noun, singular) ADVP Ngữ trạng từ (Adverbial phrase) AUX Ngữ động từ có trợ động từ (Auxiliary verb phrase) 14 NP 20 nhãn cú pháp Penn Tree Bank: STT Nhãn cú pháp Ý nghĩa Ngữ tính từ (Adjective phrase) 15 NPS Danh từ riếng số nhiều (Proper noun, plural) 16 PDT Tiền định từ (Predeterminer) CONJP 17 POS Dấu cuối sở hữu cách (Possessive ending) INTJ Đại từ nhân xưng (Personal pronoun) NEG Ngữ phủ định (Negative) NP Danh ngữ (Noun phrase) Giới ngữ (Preposional phrase) 18 PP 19 PP$ Đại từ sở hữu (Possessive pronoun) 20 RB Trạng từ (Adverb) PP 21 RBR PRT 10 S Trạng từ so sánh (Adverb, comparative) Trang 153 Ngữ có liên từ (Coordinate phrase) Ngữ cảm thán từ (Interjection) Ngữ bắt đầu tiểu từ (Partical phrase) Mệnh đề khẳng định đơn (Simple declarative clause) Trang 154 Phụ lục Phụ lục 11 SBAR Mệnh đề phụ bổ nghĩa (Subordinate clause) 12 SBARQ Mệnh đề hỏi Wh- 13 SINV Câu đảo ngữ (Inversion sentence) 14 SQ PHỤ LỤC Bộ phận lại SBARQ sau bỏ từ/ngữ Wh- 15 VP 16 WHADVP 17 WHNP Danh ngữ bắt đầu Wh- (Wh- noun phrase) 18 WHPP Giới ngữ bắt đầu Wh- (Wh- preposional phrase) 19 X Thành phần không xác định (Constituent of unknown or uncertain type) 20 ? Dấu hỏi câu hỏi (Question mark enclosing a constituent) CÁC NHÃN QUAN HỆ NGỮ PHÁP Động ngữ (Verb phrase) Trạng ngữ bắt đầu Wh- (Wh- adverbial phrase) Trang 155 STT Nhãn quan hệ 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 appo aux be c compl det gen have i inv-aux inv-be inv-have mod pnmod p-spec pcomp-c pcomp-n post pre pred rel vrel wha whn whp obj Ví dụ “ACME president, —appoÆP.W Buckman” shouldÅaux—resign “isÅbe—sleeping “thatÅc—John loves Mary first complement “theÅdet—hat” “Jane’sÅgen—uncle” “haveÅhave—disappeared” the relationship between a C clause and its I clause inverted auxiliary: “WillÅinv-aux—you stop it” inverted be: “IsÅinv-be—she sleeping” inverted have: “HaveÅinv-have—you slept” the relationship between a word and its adjunct modifier post nomial modifier specifier of prepositional phrases clausal complement of prepositions nominal complement of prepositions post determiner pre determiner predicate of a clause relative clause passive verb modifier of nouns wh-elements at C-spec positions wh-elements at C-spec positions wh-elements at C-spec positions object of verbs Trang 156 Tài liệu tham khảo Tài liệu tham khảo TÀI LIỆU THAM KHẢO [9] James Allen, University of Rochester, Natural Language Understanding, the Benjamin/Cummings Publishing Company, Inc., 1995 [10] Ken Samuel, Presentation for DFKI about TBL, Lecture of University, 1997 [1] Aravind K.Joshi & Yves Schabes, An Eearley Type Parsing Algorimth for [2] [3] Translation System Design, Computational Linguistics and Chinese Languge for Computational Linguistics, Buffalo, June 1998 Processing Vol 1, no 1, August 1996 Aravind K.Joshi, An Introduction to Tree Adjoining Grammars, A Manaster- [12] Ngô Quốc Hưng Phạm Phú Hội, Liên kết từ song ngữ Anh-Việt (Ứng Rammer, editor, Mathematics of Language John Benjamins, Amsterdam, dụng khảo sát trật tự từ), Luận văn tốt nghiệp cử nhân tin học, 1987 ĐHKHTN, 2002 David Yarowsky and Grace Ngai Inducing Multilingual POS Taggers and NP Bracketers via Robust Projection across Aligned Corpora, Proceedings of HLT-02, 2002 [4] ĐHKHTN lần III, 2002, pp 192-196 Quang, Word alignment in English – Vietnamese bilingual corpus, [16] Radu Floriance & Grace Ngai, Transformation-Based Learning in the Fast Lane : A generative Approach, ACL 2001 [17] Rebecca Hwa, Philip Resnik, Amy Weinberg, and Okan Kolak, Evaluating Dinh Dien, Thuy Ngan, Xuan Quang, A Hybrid Approach to Word Order Translational Correspondence using Annotation Projection, ACL 2002 Transfer in the English-to-Vietnamese Machine Translation, paper at MT – [18] Stuart Sheiber & Yves Schabes, Synchronous Tree Adjoining Grammars, Summit IX, Lousiana., USA, 2003 Proceedings of 13th COLING-90, Helsinki, ACL 1990 Dinh Dien, Thuy Ngan, Xuan Quang, Automatic Tree Transfer in English- [19] Trần Quốc Bảo, Tìm hiểu cài đặt phân tích cú phấp dựa văn phạm Vietnamese Machine Translation, The First International Workshop for TAG (Tree adjoining grammar) để phân tích cú pháp câu tiếng Anh, Luận văn Computer, Information and Communication Technologies – Theme: State of cử nhân tin học, ĐHKHTN, 2002 Art and Future Trends of Information Technologies in Korea and Vietnam – 11 February 2003 – Hanoi, Vietnam, 2003, pp 7-12 [8] tích ngữ pháp song song vào song ngữ Anh-Việt, Hội nghị khoa học trường Dinh Dien, Hoang Kiem, Van Toan, Quoc Hung, Phu Hoi, Thuy Ngan, Xuan and Internet Information Tecnology 2002, Hanoi, Vietnam, 2002, pp 3-11 [7] ĐHTH TP HCM, số 1/1995 [15] Nguyễn Tài Cẩn, Ngữ pháp tiếng Việt, NXB ĐHQG Hà Nội, 1998 Proceedings of International Conference on East-Asia Language Processing [6] [13] Nguyễn Đức Dân, Phạm trù thứ tự tiếng Việt, Tập san khoa học A – [14] Nguyễn Lưu Thùy Ngân, Đỗ Xuân Quang, Nguyễn Văn Toàn, Ứng dụng phân Đinh Điền, Dịch tự động Anh - Việt dựa việc học luật chuyển đổi từ ngữ liệu song ngữ, Luận án tiến sĩ toán học, ĐHKHTN - ĐHQG Tp.HCM, 2003 [5] [11] Kuang-Hua Chen & Hsin-His Chen, A Hybrid Approach to Machine Tree Adjoining Grammars, Proceedings of the 26 Meeting of the Association th [20] Cigdem Keyder Turhan, Structural transfer in an English to Turkish machine translation system, PhD-dissertation, The Middle East Technical University, Eric Brill, A corpus-based approach to language learning, PhD-dissertation, 1998 1993 Trang 157 Trang 158 Tài liệu tham khảo [21] W John Hutchins, An Introduction to Machine Translation, The Library of the University of East Anglia – Norwich – UK, 1992 Trang 159 [...]... đến những mối liên hệ có ảnh hưởng book/cuốn sách DT ADJ that/đó interesting/thú vị đến việc chuyển đổi cấu trúc cú pháp của câu ™ Bộ luật chuyển đổi từ cây cú pháp tiếng Anh sang cây cú pháp tiếng Việt Hình 5: Cây cú pháp của câu “I have already read that interesting book.” Trang 21 Trang 22 Chương 1 - Tổng quan về chuyển đổi cây cú pháp Chương 1 - Tổng quan về chuyển đổi cây cú pháp 1.3.1 Cơ sở lý... nhiệm vụ thay đổi vị trí, chèn hoặc đổi cấu trúc của một câu từ ngôn ngữ nguồn sang ngôn ngữ đích tức là quá trình xác xoá các thành phần trong cây cú pháp sao cho trật tự từ bề mặt của câu trở nên định mối liên hệ giữa các thành phần trong cây cú pháp và tìm ra những qui luật để đúng Trong ví dụ trên, ta thấy nếu chương trình chuyển đổi thay đổi cây cú pháp chuyển cây cú pháp đó về dạng phù hợp với ngôn... tích cú pháp dựa trên văn phạm của ngôn ngữ nguồn (ở đây là tiếng Anh) Mỗi cây sơ cấp trong cây dẫn xuất nguồn sau đó được ánh xạ Hình 13: Một số mẫu cây sơ cấp trong tự điển chuyển 4 đổi cây Anh -Pháp “Bỗng nhiên John nhớ Mary” Trang 49 Trang 50 Chương 2 – Các hướng tiếp cận chuyển đổi cấu trúc trong dịch máy Chương 2 – Các hướng tiếp cận chuyển đổi cấu trúc trong dịch máy Chúng ta bắt đầu đi từ cặp cây. .. trước đây, bộ luật chuyển đổi này được các chuyên gia ngôn ngữ xây dựng bằng tay, một số hệ dịch sử dụng phương pháp Trang 33 Trang 34 Chương 2 – Các hướng tiếp cận chuyển đổi cấu trúc trong dịch máy Chương 2 – Các hướng tiếp cận chuyển đổi cấu trúc trong dịch máy (E) NP → DT JJ NN3 Chương 2 trong đó: CÁC HƯỚNG TIẾP CẬN CHUYỂN ĐỔI NP là ngữ danh từ (thành tố không kết thúc) CẤU TRÚC TRONG DỊCH MÁY JJ là... pháp trong câu, tức là để chuyển đổi các thành phần trong cây cú pháp của tiếng Anh cho phù hợp với làm thành phần câu (thành phần chính và phụ), xa hơn nữa là thực từ có tiếng Việt Trật tự các thành phần cây cú pháp phụ thuộc vào những nhân tố sau : khả năng độc lập tạo câu Trang 29 Trang 30 Chương 1 - Tổng quan về chuyển đổi cây cú pháp Chương 1 - Tổng quan về chuyển đổi cây cú pháp 1.3.1.3.1 Nhân tố... trật tự từ trong các thành phần tổng | Ct R (i ) ) quát sau khi chuyển đổi khung là một chiến lược có ý nghĩa làm tăng chất lượng a P (Wt R ( i ) ) O P (Wt R ( i ) j +1 | Wt R ( j ) j ) chuyển đổi nhờ giảm thiểu rủi ro trong việc chuyển đổi trên toàn bộ câu Trang 63 Trang 64 Chương 2 – Các hướng tiếp cận chuyển đổi cấu trúc trong dịch máy Chương 3 – Mô hình chuyển đổi cây cú pháp 2.6 Tổng kết chương Chương... xuất TAG Gọi T là cây mô tả sự dẫn xuất thì cây T có dạng như sau: Trang 47 Trang 48 Chương 2 – Các hướng tiếp cận chuyển đổi cấu trúc trong dịch máy Chương 2 – Các hướng tiếp cận chuyển đổi cấu trúc trong dịch máy ™ Nút gốc của T được đánh nhãn là cây khởi tạo với yếu tố nguyên thủy S đến một cây sơ cấp tương ứng bằng cách tra trong tự điển các cây chuyển đổi Câu ™ Tất cả các nút trong cây dẫn xuất được... trong thực tế có rất nhiều nhân tố có thể ảnh hưởng đến trật tự từ pháp máy học phù hợp với loại ngữ liệu, mục đích của công việc, và tận dụng được trong câu hay trật tự các thành phần cú pháp trong cây cú pháp do ngôn ngữ tự tối đa ưu điểm của phương pháp đó Trong bài toán chuyển đổi cây cú pháp, chúng nhiên vốn rất đa dạng, phong phú Tuy nhiên, trong giới hạn luận văn này, như đã em chọn phương pháp. .. là số thứ tự: The last Mohicans -1 0 +1 +1 0 → người Mohican cuối cùng 0 +1 Hình 6: So sánh trật tự định ngữ tiếng Anh và tiếng Việt (0: vị trí danh từ chính trong ngữ, -: từ bổ nghĩa đứng trước danh từ chính, +: từ bổ nghĩa đứng sau danh từ chính) Trang 25 Trang 26 Chương 1 - Tổng quan về chuyển đổi cây cú pháp Chương 1 - Tổng quan về chuyển đổi cây cú pháp Dưới đây là bảng tóm tắt trật tự phổ biến... có toán học nhanh (FnTBL - phần 3.2) cải tiến thuật toán ban đầu rất nhiều về mặt tốc những điểm giống nhau, chẳng hạn như có cùng trật tự S-V-O (Chủ ngữ, động từ, độ Phần 3.3 là mô hình áp dụng, mô hình học chuyển đổi cây cú pháp do chúng em tự xây dựng dựa trên thuật toán học FnTBL áp dụng cho việc chuyển đổi cây cú túc từ), Do đó, chúng em xây dựng mô hình học chuyển đổi cấu trúc Anh- Việt kết hợp

Ngày đăng: 15/10/2016, 22:50

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan