i LỜI CAM ĐOAN Tôi xin cam đoan luận án cơng trình nghiên cứu khoa học tơi Các kết luận án trung thực chưa khác công bố cơng trình khác TP.HCM, ngày 25 tháng 03 năm 2017 Người thực Trần Lê Tâm Linh ii LỜI CẢM ƠN Lời đầu tiên, tác giả xin bày tỏ lòng tri ân sâu sắc Thầy hướng dẫn: PGS TS Đinh Điền, người trực tiếp hướng dẫn bảo cho tác giả từ bước đầu ban đầu khó khăn, động viên tác giả mặt để tác giả hồn thành luận án Tác giả xin bày tỏ lịng biết ơn chân thành thầy Trường Đại học Khoa học Xã hội Nhân văn, TP.HCM truyền đạt cho tác giả kiến thức quý báu để tác giả phát triển đề tài luận án Tác giả xin cảm ơn lãnh đạo trường Đại học Khoa học Xã hội Nhân văn, Thành phố Hồ Chí Minh lãnh đạo trường Đại học Khoa học Tự nhiên, Thành phố Hồ Chí Minh tạo điều kiện thuận lợi cho tác giả trình học tập Và xin gửi lời cảm ơn trân trọng đến anh chị em đồng nghiệp, bạn bè người thân gia đình ln động viên giúp đỡ tác giả thực luận án Cuối cùng, tác giả xin chân thành cảm ơn tất bạn hữu lớp CEO-48 giúp đỡ tác giả việc thu thập nguồn ngữ liệu cho luận án iii MỤC LỤC MỞ ĐẦU .1 0.1 Lý nghiên cứu 1 0.2 Mục tiêu nhiệm vụ nghiên cứu .1 0.3 Lịch sử vấn đề 2 0.3.1 Nghiên cứu lỗi 2 0.3.2 Nghiên cứu lỗi dịch thuật 3 0.3.3 Nghiên cứu dịch tự động 4 0.3.4 Nghiên cứu lỗi dịch tự động .5 0.4 Đối tượng phạm vi nghiên cứu .6 0.4.1 Đối tượng nghiên cứu 6 0.4.2 Phạm vi nghiên cứu .6 0.5 Phương pháp nghiên cứu nguồn ngữ liệu .6 0.5.1 Phương pháp nghiên cứu .6 0.5.2 Phần mềm BLAST .7 0.5.3 Phần mềm BLAST - VCL 8 0.5.4 Nguồn ngữ liệu 8 0.6 Ý nghĩa khoa học ý nghĩa thực tiễn 9 0.7 Bố cục luận án .10 CHƯƠNG CƠ SỞ LÝ THUYẾT 11 1.1 Khái niệm lỗi .11 1.1.1 Lỗi ngôn ngữ 11 1.1.1.1 Khái niệm lỗi tả 11 1.1.1.2 Khái niệm lỗi từ vựng 11 1.1.1.3 Khái niệm lỗi ngữ pháp 12 1.1.2 Lỗi kỹ thuật 12 1.1.2.1 Khái niệm lỗi hệ thống .12 1.1.2.2 Khái niệm lỗi ngẫu nhiên 12 1.2 Cơ sở lý luận việc phân tích lỗi dịch thuật 12 1.2.1 Định nghĩa lỗi dịch thuật lỗi dịch tự động 13 1.2.1.1 Định nghĩa lỗi dịch thuật 13 iv 1.2.1.2 Định nghĩa lỗi dịch tự động .13 1.2.2 Các bước xử lý ngữ liệu trước phân tích lỗi 14 1.2.2.1 Thu thập ngữ liệu .14 1.2.2.2 Chuẩn hóa ngữ liệu 14 1.2.2.3 Xử lý ngữ liệu 15 1.2.3 Phân tích lỗi dịch tự động Anh-Việt 19 1.2.3.1 Nhận dạng lỗi dịch tự động 19 1.2.3.2 Phân tích lỗi dịch tự động 19 1.3 Những lỗi ngôn ngữ dịch tự động Anh-Việt hợp đồng kinh tế .21 1.3.1 Đặc điểm dịch tự động 21 1.3.1.1 Khái niệm dịch tự động 21 1.3.1.2 Những thuận lợi bất lợi dịch tự động 21 1.3.1.3 Các cách tiếp cận dịch tự động chưa ứng dụng thống kê 22 1.3.1.4 Dịch tự động thống kê (SMT) 26 1.3.2 Đặc điểm loại hình tiếng Việt tiếng Anh 28 1.3.2.1 Đặc điểm tiếng Việt 28 1.3.2.2 Đặc điểm tiếng Anh 29 1.3.3 Hợp đồng kinh tế .30 1.3.3.1 Khái niệm hợp đồng kinh tế .30 1.3.3.2 Các loại hợp đồng kinh tế 30 1.3.4 Nhận diện phân loại lỗi ngôn ngữ dịch tự động 32 1.3.4.1 Lỗi tả dịch tự động hợp đồng kinh tế Anh-Việt 32 1.3.4.2 Lỗi từ vựng dịch tự động hợp đồng kinh tế Anh-Việt 36 1.3.4.3 Lỗi ngữ pháp dịch tự động hợp đồng kinh tế Anh-Việt 38 1.3.4.4 Lỗi hệ thống dịch tự động hợp đồng kinh tế Anh-Việt .41 1.3.4.5 Lỗi ngẫu nhiên dịch tự động hợp đồng kinh tế Anh-Việt 43 CHƯƠNG PHÂN TÍCH LỖI CHÍNH TẢ VÀ LỖI TỪ VỰNG 46 2.1 Lỗi tả 46 2.1.1 Lỗi dịch sai chữ số - loại I 46 2.1.2 Lỗi dịch sai chữ số - loại II 47 2.1.3 Lỗi dịch sai dấu câu - loại I 48 v 2.1.4 Lỗi dịch sai dấu câu - loại II 49 2.1.5 Lỗi thành phần cấu trúc âm tiết - loại II 49 2.1.6 Lỗi giữ nguyên từ thuộc ngôn ngữ nguồn - loại I 50 2.1.7 Lỗi giữ nguyên từ thuộc ngôn ngữ nguồn - loại II 51 2.1.8 Lỗi viết hoa - loại I 52 2.1.9 Lỗi viết hoa - loại II 53 2.1.10 Lỗi viết tắt – loại I 54 2.1.11 Lỗi viết tắt – loại II 54 2.1.12 Các lỗi tả khác- loại II 55 2.2 Lỗi từ vựng .58 2.2.1 Lỗi nhập nhằng - loại I .58 2.2.2 Lỗi nhập nhằng - loại II .59 2.2.3 Lỗi hiểu sai thành ngữ- loại II 60 2.2.4 Lỗi hiểu sai nghĩa thuật ngữ - loại I 61 2.2.5 Lỗi hiểu sai nghĩa thuật ngữ - loại II 62 2.3 Lỗi kỹ thuật 66 2.3.1 Lỗi tả lỗi từ vựng thuộc lỗi hệ thống 67 2.3.2 Lỗi tả lỗi từ vựng thuộc lỗi ngẫu nhiên .71 2.3.3 Lỗi hệ thống lỗi ngẫu nhiên thông qua khoảng cách Levenshtein 73 2.3.3.1 Kết lỗi hệ thống thông qua khoảng cách Levenshtein 74 2.3.3.2 Kết lỗi ngẫu nhiên thông qua khoảng cách Levenshtein 76 TIỂU KẾT 80 CHƯƠNG PHÂN TÍCH LỖI NGỮ PHÁP 81 3.1 Lỗi trật tự từ .81 3.1.1 Lỗi trật tự từ theo tiêu chí BLAST 81 3.1.2 Lỗi trật tự từ theo tiêu chí BLAST-VCL 84 3.1.2.1 Lỗi trật tự từ thuộc cấu trúc chủ động cấu trúc bị động 86 3.1.2.2 Lỗi trật tự từ tính từ - danh từ 88 3.1.2.3 Lỗi trật tự từ trạng từ - tính từ tiếng Anh 89 3.1.2.4 Lỗi trật tự từ mạo từ - danh từ tiếng Anh 89 3.1.2.5 Lỗi trật tự từ thuộc liên từ 91 vi 3.1.2.6 Lỗi trật tự từ danh từ - danh từ 91 3.1.2.7 Lỗi trật tự từ danh từ - sở hữu cách - danh từ 92 3.1.2.8 Lỗi trật tự từ số - danh từ 93 3.1.2.9 Lỗi trật tự từ giới từ - danh từ 94 3.1.2.10 Lỗi trật tự từ chủ từ - động từ 95 3.1.2.11 Lỗi trật tự từ động từ - trạng từ tiếng Anh .96 3.1.2.12 Lỗi trật tự từ động từ - túc từ .96 3.1.2.13 Lỗi trật tự từ động từ - động từ 97 3.2 Lỗi dịch sai từ công cụ - loại II 99 3.3 Lỗi dịch sai hòa hợp chủ từ động từ - loại II 101 3.4 Lỗi thừa từ 102 3.4.1 Lỗi thừa từ - loại I 102 3.4.1.1 Lỗi thừa từ nội dung - loại I .102 3.4.1.2 Lỗi thừa từ ngữ pháp - loại I 103 3.4.1.3 Lỗi dịch thừa từ so với ngôn ngữ nguồn - loại I 103 3.4.2 Lỗi thừa từ - loại II 104 3.4.2.1 Lỗi thừa từ nội dung - loại II 104 3.4.2.2 Lỗi thừa từ ngữ pháp - loại II 105 3.4.2.3 Lỗi dịch thừa từ so với ngôn ngữ nguồn - loại II 106 3.5 Lỗi thiếu từ .107 3.5.1 Lỗi thiếu từ - loại I 107 3.5.1.1 Lỗi thiếu từ nội dung - loại I 107 3.5.1.2 Lỗi thiếu từ ngữ pháp - loại I 108 3.5.2 Lỗi thiếu từ - loại II 108 3.5.2.1 Lỗi thiếu từ nội dung - loại II 109 3.5.2.2 Lỗi thiếu từ ngữ pháp - loại II 110 3.6 Lỗi kỹ thuật 113 3.6.1 Lỗi ngữ pháp thuộc lỗi hệ thống 113 3.6.2 Lỗi ngữ pháp thuộc lỗi ngẫu nhiên 116 TIỂU KẾT .119 KẾT LUẬN .121 vii DANH MỤC CÁC CƠNG TRÌNH KHOA HỌC CĨ LIÊN QUAN ĐẾN LUẬN ÁN CỦA TÁC GIẢ 126 TÀI LIỆU THAM KHẢO .128 viii DANH SÁCH BẢNG Bảng 1 Minh họa lỗi hệ thống thông qua khoảng cách Levenshtein 42 Bảng Lỗi dịch sai chữ số - loại I 47 Bảng 2 Lỗi dịch sai chữ số - loại II 47 Bảng Lỗi dịch sai dấu câu - loại I 48 Bảng Lỗi dịch sai dấu câu - loại II .49 Bảng Các loại lỗi hình thái khác 50 Bảng Lỗi giữ nguyên từ thuộc ngôn ngữ nguồn - loại I 50 Bảng Lỗi giữ nguyên từ thuộc ngôn ngữ nguồn - loại II .51 Bảng Lỗi viết hoa – loại I 52 Bảng Lỗi viết hoa – loại II .53 Bảng 10 Lỗi viết hoa – loại II 54 Bảng 11 Lỗi viết hoa – loại II 54 Bảng 12 Các lỗi tả khác- loại II 55 Bảng 13 Lỗi nhập nhằng - loại I .58 Bảng 14 Lỗi nhập nhằng - loại II 59 Bảng 15 Lỗi hiểu sai thành ngữ 60 Bảng 16 Lỗi hiểu sai nghĩa thuật ngữ - loại I 61 Bảng 17 Lỗi hiểu sai nghĩa thuật ngữ - loại II 62 Bảng 18 Minh họa lỗi hệ thống có L1 = 74 Bảng 19 Minh họa lỗi ngẫu nhiên - năm 2014 dịch tốt năm 2012 77 Bảng 20 Minh họa lỗi ngẫu nhiên - năm 2012 dịch tốt năm 2014 78 Bảng Lỗi trật tự từ thuộc cấu trúc chủ động cấu trúc bị động 87 Bảng Lỗi trật tự từ tính từ - danh từ 88 Bảng 3 Lỗi trật tự từ trạng từ - tính từ tiếng Anh 89 Bảng Lỗi trật tự từ mạo từ - danh từ 90 Bảng Lỗi trật tự từ thuộc liên từ 91 Bảng Lỗi trật tự từ danh từ - danh từ .92 Bảng Lỗi trật tự từ danh từ - sở hữu cách- danh từ .92 Bảng Lỗi trật tự từ số - danh từ .93 Bảng Lỗi trật tự từ giới từ - danh từ 94 ix Bảng 10 Lỗi trật tự từ chủ từ - động từ .95 Bảng 11 Lỗi trật tự từ động từ - trạng từ 96 Bảng 12 Lỗi trật tự từ động từ - túc từ 96 Bảng 13 Lỗi trật tự từ động từ - động từ 97 Bảng 14 Lỗi dịch sai từ công cụ -loại II 100 Bảng 15 Lỗi phù ứng 101 Bảng 16 Lỗi thừa từ nội dung - loại I .102 Bảng 17 Lỗi thừa từ ngữ pháp - loại I 103 Bảng 18 Lỗi dịch thừa từ so với ngôn ngữ nguồn - loại I 104 Bảng 19 Lỗi thừa từ nội dung - loại II 104 Bảng 20 Lỗi thừa từ ngữ pháp - loại II 106 Bảng 21 Lỗi dịch thừa từ so với ngôn ngữ nguồn - loại II .106 Bảng 22 Lỗi thiếu từ nội dung - loại I 107 Bảng 23 Lỗi thiếu từ ngữ pháp - loại I 108 Bảng 24 Lỗi thiếu từ nội dung - loại II 109 Bảng 25 Lỗi thiếu từ ngữ pháp - loại II 110 x DANH SÁCH HÌNH Hình 1 Giới thiệu tiền xử lý ngữ liệu 15 Hình Minh họa công cụ BLAST 16 Hình Minh họa bước xử lý liệu 17 Hình Mơ hình phân tích lỗi BLAST-VCL 18 Hình Lỗi tả 57 Hình 2 Tỉ lệ phần trăm lỗi tả 58 Hình Lỗi thuật ngữ 63 Hình Minh họa lỗi hiểu sai nghĩa thuật ngữ - loại II .64 Hình Lỗi từ vựng 65 Hình Tỉ lệ phần trăm lỗi từ vựng 66 Hình Lỗi tả lỗi từ vựng thuộc lỗi hệ thống .68 Hình Tỷ lệ phần trăm lỗi tả lỗi từ vựng thuộc lỗi hệ thống 69 Hình Lỗi tả lỗi từ vựng thuộc lỗi ngẫu nhiên 72 Hình 10 Tỷ lệ phần trăm lỗi tả lỗi từ vựng thuộc lỗi ngẫu nhiên 72 Hình 11 Số cặp câu (a) tỷ lệ phần trăm cặp câu (b) mang lỗi hệ thống lỗi ngẫu nhiên 73 Hình 12 Tỉ lệ phần trăm lỗi hệ thống lỗi ngẫu nhiên ngữ liệu 74 Hình Lỗi trật tự từ theo tiêu chí BLAST 81 Hình Số lượng câu chứa lỗi trật tự từ 83 Hình 3 Mơ hình phân tích lỗi BLAST-VCL 85 Hình Lỗi trật tự từ theo tiêu chí BLAST-VCL 98 Hình Tỉ lệ phần trăm lỗi trật tự từ theo tiêu chí BLAST-VCL 99 Hình Kết lỗi ngữ pháp 111 Hình Tỉ lệ phần trăm lỗi ngữ pháp .112 Hình Lỗi ngữ pháp theoBLAST - thuộc lỗi hệ thống 114 Hình tỷ lệ phần trăm lỗi ngữ pháp theo BLAST - thuộc lỗi hệ thống 115 Hình 10 Lỗi ngữ pháp thuộc lỗi ngẫu nhiên 117 Hình 11 Tỷ lệ phần trăm lỗi ngữ pháp thuộc lỗi ngẫu nhiên 118 122 Thứ hai, loại lỗi với tiểu loại lỗi mà luận án đề xuất gồm: lỗi tả, lỗi từ vựng lỗi ngữ pháp Luận án cho thấy phạm vi khái niệm lỗi mở rộng nhiều qua tiểu loại lỗi loại Quan điểm phân loại lỗi luận án khai thác đầy đủ lực dịch tự động chương trình dịch tác giả luận án thử nghiệm liên tục năm liền, so sánh đối chiếu sản phẩm dịch - ngữ liệu thực tế thời điểm khác cho thấy cách hiểu lỗi cung cấp đường dẫn vào mơ hình khai thác lỗi lý tưởng để hướng lộ trình khắc phục cho ngơn ngữ phải thể tư người ngữ từ ngơn ngữ nguồn sang ngơn ngữ đích Xét phương diện từ vựng, tương đồng hai ngôn ngữ Anh – Việt tạo điều kiện cho máy dịch nhiều trường hợp Các cơng trình nghiên cứu tương đồng dị biệt hai ngơn ngữ đối chiếu chương trình dịch tự động việc làm cần thiết cấp bách để cải tiến nguồn ngữ liệu song song chiều, đặc biệt lĩnh vực chuyển dịch Anh-Việt qua dịch máy từ vựng Các giải pháp khử nhập nhằng dịch tự động khắc phục khó khăn chuyển dịch từ ngơn ngữ nguồn sang ngơn ngữ đích, đặc biệt văn hợp đồng kinh tế Thứ ba, phân tích lỗi tìm hiểu nguyên nhân đề xuất số biện pháp khắc phục, cho phép người dùng nhận thức lỗi hệ thống lỗi ngẫu nhiên chương trình dịch nhằm làm tiền đề cho nghiên cứu vấn đề dịch tự động, công cụ hữu ích sử dụng qua mạng tồn cầu Do đó, khắc phục lỗi ngẫu nhiên lỗi hệ thống nhiệm vụ người thiết kế chương trình dịch máy người sử dụng việc nhận dạng lỗi Lỗi mang ý nghĩa mặt học thuật nghệ thuật giảng dạy Ta sử dụng lỗi dịch máy để trau chuốt cho ngơn ngữ dịch ngày tốt qua thực hành thường xuyên với dịch máy Đây hỗ trợ không nhỏ học viên học môn biên phiên dịch học ngoại ngữ để đạt đến mức thành thạo ngoại ngữ Kết nghiên cứu đối chiếu lĩnh vực dịch tự động hợp đồng kinh tế Anh – Việt lỗi từ vựng tả gợi ý cho tìm tịi phương pháp dạy tiếng Việt cho 123 người nước ngữ nói tiếng Anh phương diện từ vựng bình diện ngữ nghĩa Thứ tư, việc tìm hiểu lỗi dịch tự động loại văn hợp đồng kinh tế vấn đề mà nhà ngôn ngữ đặt ra, cần thiết phải gắn liền với việc tìm hiểu giải pháp khắc phục lỗi cho chương trình dịch tự động hai ngôn ngữ xét Đối tượng cụ thể dịch tự động ngôn ngữ đích, tiếng Việt với tư cách văn dịch chấp nhận luật, ý nghĩa, khả tri nhận ngơn ngữ văn hóa ngơn ngữ đích, tiếng Việt chuyển từ ngơn ngữ nguồn văn hợp đồng có chọn lọc Các lỗi này, mặt giúp xem xét lại vấn đề chương trình dịch tự động, mặt khác, đặt vấn đề cách tiếp cận để nhận diện phân loại lỗi việc dịch tự động văn hợp đồng kinh tế từ Anh sang Việt Nghiên cứu lý thuyết, thực tiễn lỗi văn dịch tự động giúp có khám phá việc nghiên cứu ngơn ngữ máy tính qua việc dịch tự động mạng toàn cầu, phát tương đồng dị biệt hai ngôn ngữ Anh Việt loại văn hợp đồng kinh tế nói riêng ngơn ngữ học nói chung Thứ năm, luận án tìm hiểu mối quan hệ ngôn ngữ dịch tự động ngôn ngữ dịch thủ công với phương pháp tiếp cận khai thác chương trình phần mềm BLAST để hỗ trợ cho người nghiên cứu phân tích, nhận định phân tích có sở khoa học hợp lý Cần thấy, vai trò người quan sát quan trọng việc phân loại, xử lý thống kê tiểu loại lỗi chương để tìm lỗi thuộc lỗi hệ thống lỗi thuộc lỗi ngẫu nhiên Đồng thời, dịch tự động công việc khách quan, sản phẩm dịch nói lên mặt mạnh yếu hệ thống thời điểm khảo sát xử lý ngữ liệu Thứ sáu, sơ đồ hình ảnh, bảng biểu phân loại lỗi minh họa luận án rút từ thực tiễn dịch tự động Sự tương tác người xử lý lỗi dịch tự động với sản phẩm dịch đánh giá qua hai lần dịch thử nghiệm hai thời điểm khác phân tích luận án, cho thấy khác hai ngôn ngữ lập thành hệ thống cho loại lỗi hệ thống lỗi ngẫu nhiên 124 Luận án xác định khó khăn mà chương trình dịch tự động gặp phải trình chuyển dịch văn Anh-Việt theo cặp câu đồng thời cung cấp số liệu đáng tin cậy cho việc huấn luyện chương trình dịch tự động cho nghiên cứu tương lai để cải tiến việc dịch tự động Do hệ thống dịch tự động có ưu điểm tốc độ dịch nhanh nhiều so với dịch thủ cơng lại có nhược điểm kết dịch chưa có độ xác cao, nên cần phải có kết hợp chặt chẽ nhà ngôn ngữ học chuyên gia tin học để cải thiện chất lượng dịch tự động Sự kết hợp đạt thành sau: 1/ Giải toán “từ nhiễu” dịch máy thống kê Anh-Việt để tăng chất lượng dịch 9); 2/ Cải tiến chất lượng dịch tự động thống kê Việt-Anh mơ hình phát sinh từ cơng cụ 10); 3/ Phân tích tác nhân ảnh hưởng đến khác việc nhận diện tên riêng nhằm cải tiến dịch tự động thống kê Anh-Pháp-Việt 8) Hoa-Việt 7) Luận án góp phần khẳng định xu nghiên cứu cải tiến dịch tự động để phục vụ ngày tốt cho người dùng, với văn dịch nhanh, chi phí thấp văn đáp ứng nhu cầu lợi ích người dùng giai đoạn hội nhập quốc tế Luận án cố gắng trình bày tất nội dung cần thiết để trả lời câu hỏi nghiên cứu luận án vấn đề mở cần quan tâm nghiên cứu sâu tương lai: Vấn đề thứ số lần thử nghiệm chưa nhiều nên luận án chưa thể xác định liệu có lần dịch lỗi thuộc lỗi hệ thống lỗi ngẫu nhiên có thay đổi khơng lần dịch Nhưng lần thử nghiệm luận án, tác giả phân tích lỗi tỉ mỉ hai thứ tiếng xét Vấn đề thứ hai mở rộng nghiên cứu cho loại văn khơng phải hợp đồng kinh tế Ngồi văn nằm phụ lục luận án, luận án 125 chưa tiếp cận loại văn khác có nhiều loại lỗi khác chưa phát luận án Vấn đề thứ ba vấn đề dịch tự động từ Việt sang Anh Người nghiên cứu không nắm hai thứ tiếng cách thấu đáo phương diện lý thuyết thực hành nên chưa thể nghiên cứu vần đề Ngoài ra, khối lượng văn dịch không nhỏ, máy dịch nhiều thời điểm để thống kê đánh giá, nên luận án nghiên cứu dịch tự động chiều từ Anh sang Việt Phần dịch tự động theo chiều ngược lại Việt - Anh, tác giả mong muốn tiếp tục thực tương lai gần 126 DANH MỤC CÁC CƠNG TRÌNH KHOA HỌC CĨ LIÊN QUAN ĐẾN LUẬN ÁN CỦA TÁC GIẢ TIẾNG VIỆT 1) Trần Lê Tâm Linh (2013a), Khảo sát nét nghĩa trợ động từ “shall” hợp đồng kinh tế Anh-Việt, Tạp chí KHXH, Viện Hàn lâm Việt Nam, Viện KHXH vùng Nam , trang 44-50 2) Trần Lê Tâm Linh (2013b), Khảo sát thuật ngữ tiếng Anh- tiếng Việt ngữ liệu hợp đồng kinh tế, Tạp chí KHXH, Viện Hàn lâm Việt Nam, Viện KHXH vùng Nam bộ, trang 45-49 3) Trần Vũ Hoàng Ưng, Nguyễn Thị Phương Như, Trần Lê Tâm Linh (2013), Cải tiến dịch tự động thống kê Anh-Việt phương pháp xóa "từ nhiễu", Hội thảo quốc gia lần thứ XVI: Một số vấn đề chọn lọc Công nghệ thông tin truyền thông, trang 34-39 4) Nguyễn Thị Phương Như, Trần Vũ Hoàng Ưng, Nguyễn Thị Thanh Thảo, Trần Lê Tâm Linh (2014), Cải tiến chất lượng dịch tự động thống kê Việt-Anh mơ hình phát sinh từ chức năng, Hội thảo quốc gia lần thứ XVII: Một số vấn đề chọn lọc Công nghệ thông tin truyền thông - Đắk Lắk, 3031/10/2014, trang 24-30 5) Huỳnh Quang Đức, Trần Lê Tâm Linh (2015), Gán nhãn ngữ nghĩa song ngữ Anh Việt, Hội thảo Quốc gia 2015 Điện tử, Truyền thông Công nghệ Thông tin (The 2015 National Conference on Electronics, Communications, and Information Technology - ECIT 2015) - Thành phố Hồ Chí Minh, 1011/12/2015, trang 71-76 127 TIẾNG ANH 6) Tran Le Tam Linh (2013), Survey of Common Errors of English to Vietnamese Google Translate in Business Contract, Open Journal of Modern Linguistics, USA, Vol.3, No.2, 101-107 7) Phuoc Tran, Dien Dinh, Linh Tran (2013), Resolving Named Entity Unknown Word in Chinese-Vietnamese Machine Translation, The fifth international conference on knowledge and systems engineering- KSE 2013, trang 273-284 8) Lê Ngọc Tấn, Lê Ngọc Tiến, Trần Lê Tâm Linh (2013), A survey of named entity recognition in English-French-Vietnamse trilingual corpus, Hội thảo quốc gia lần thứ XVI: Một số vấn đề chọn lọc Công nghệ thông tin truyền thông, trang 6-11 9) Nguyễn Thị Châu Anh, Trần Lê Tâm Linh, Quách Trọng Liêm, Huỳnh Thái Lộc, Nguyễn Thị Hồng Yến (2013), A case study of translating interrogative sentences into English & Chinese from Google Translation Machine: Some suggestions for learners of the two languages as a foreign, 2013 International Conference on Innovation in English Teaching and Research, trang 25 10) Nguyễn Thị Thanh Thảo, Lê Ngọc Tấn, Lê Ngọc Tiến, Trần Lê Tâm Linh, Trần Vũ Hoàng Ưng, Nguyễn Thị Phương Như (2014), An Empirical Named Entity Tagging For Vietnamese By Using English – Vietnamese Bilingual (Thực nghiệm gán nhãn thực thể có tên cho tiếng Việt dựa vào song ngữ Anh-Việt), Hội thảo quốc gia lần thứ XVII: Một số vấn đề chọn lọc Công nghệ thông tin truyền thông-Đắk Lắk, 30-31/10/2014, trang 7-12 11) Huynh Quang Duc, Tran Le Tam Linh (2015), Semantic role labelling in bilingual English-Vietnamese corpus, International Journal of Mathematics and Computational Science, Vol.1, No.5, 2015, 260-267 128 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Phạm Đăng Bình (2003), Khảo sát lỗi giao thoa ngơn ngữ - văn hố diễn ngơn người Việt học tiếng Anh, Luận án Tiến sĩ Ngữ văn, ĐH KHXH & NV, ĐHQG TPHCM [2] Nguyễn Linh Chi (2009), Lỗi ngơn ngữ người nước ngồi học tiếng Việt, Luận án Tiến sĩ ngôn ngữ học, Viện Ngôn ngữ học, Viện Khoa học Xã hội, Bộ Giáo dục Đào tạo [3] Đào Xuân Chúc (chủ biên) (1990), Lý luận thực tiễn công tác lưu trữ, Đại học Trung học Chuyên nghiệp, Hà nội [4] Hà Thành Chung (2005), “Cách dịch mệnh đề phân từ tiếng Anh sang tiếng Việt”, Ngôn ngữ, (4), trang 56-67 [5] Nguyễn Đức Dân (1973), “Dịch tự động gì?”, Ngơn ngữ (1), trang 55-60 [6] Nguyễn Đức Dân (2015), Từ câu sai đến câu hay (tái lần 3), Nxb.Trẻ [7] Lê Ngọc Diệp (2009), Lỗi ngữ pháp - từ vựng người Mỹ học tiếng Việt, Luận văn Thạc sĩ ngôn ngữ học, ĐH KHXH&NV [8] Đinh Điền (2002), Dịch tự động Anh - Việt dựa việc học luật chuyển đổi từ ngữ liệu song ngữ, Luận án tiến sĩ Toán-Tin học, Đại học Khoa học Tự nhiên, ĐHQG TPHCM [9] Đinh Điền (2006a), “So sánh trật tự từ định ngữ tiếng Anh tiếng Việt”, Tập san KHXH&NV, (18), ĐH KHXH & NV, ĐHQG TPHCM [10] Đinh Điền (2006b), Xử lý ngôn ngữ tự nhiên, ĐHQG TPHCM 129 [11] Cao Xuân Hạo, Lý Tùng Hiếu, Nguyễn Kiên Tường, Võ Xuân Trang, Trần Thị Tuyết Mai (2002), Lỗi ngữ pháp cách khắc phục, Nxb KHXH [12] Nguyễn Thị Quỳnh Hoa (2004), Khảo sát cấu trúc - ngữ nghĩa tượng đảo ngữ tiếng Anh tiếng Việt, Luận án Tiến sĩ ngữ văn, Đại học KHXH&NV, Đại học Quốc gia Hà Nội [13] Lê Trung Hoa (2009), Lỗi tả cách khắc phục, Nxb KHXH, trang [14] Đỗ Minh Hùng (2007), Lỗi ngữ pháp tiếng Anh thường gặp người Việt Nam, Luận án Tiến sĩ ngôn ngữ học, ĐH KHXH&NV, ĐHQG TPHCM, trang 65-74 [15] Phạm Thị Tuyết Hương (2009), Nghiên cứu trật tự từ câu đơn tiếng Anh bình diện kết học, nghĩa học, dụng học (có so sánh đối chiếu với tiếng Việt, Luận án tiến sĩ ngôn ngữ học, Viện Ngôn ngữ học, Viện Khoa học Xã hội, Bộ Giáo dục Đào tạo [16] Xuân Huy-Minh Khiết (2001), Mẫu văn hợp đồng thương mại Anh - Việt Model of business documents, Nxb Trẻ [17] Trần Khuyến (1983), Đối chiếu trật tự từ Nga-Việt, loại câu: vị ngữnội động từ trước chủ ngữ-danh từ, Luận án phó tiến sĩ, Nxb Hà Nội, trang 11 [18] Hồ Lê, Trần Thị Ngọc Lang Tô Đình Nghĩa (2009), Lỗi từ vựng cách khắc phục, Nxb KHXH [19] Trần Lê Tâm Linh (2010), Thuật ngữ tiếng Anh tiếng Việt văn hợp đồng kinh tế (dựa sở ngôn ngữ học ngữ liệu), Luận văn thạc sĩ Ngôn ngữ học, ĐH KHXH&NV, ĐHQG TPHCM [20] Nguyễn Thiện Nam (2001), Khảo sát lỗi tiếng Việt người nước vấn đề liên quan, Luận án Tiến sĩ ngữ văn, ĐH KHXH & NV, ĐHQG, HN 130 [21] Nguyễn Thiện Nam (2004), “Lỗi loại từ tiếng Việt người nước ngồi”, Electronic Journal of Foreign Language Teaching Vol.1, © Centre for Language Studies, National University of Singapore, (1), trang 81-88 [22] Trần Thị Minh Phượng (2005), “Những lỗi thường gặp trật tự từ người Việt học tiếng Anh”, Ngôn ngữ đời sống, (10), trang 28-29 [23] Lý Toàn Thắng (2002), Lý thuyết trật tự từ cú pháp, ĐHQG HN [24] Nguyễn Minh Thuyết (1974), “Mấy gợi ý việc phân tích lỗi sửa lỗi ngữ pháp cho học sinh”, Ngôn ngữ, (3), trang 65-70 [25] Cung Kim Tiến (2005), Mẫu hợp đồng thương mại quốc tế International business contract form, Nxb Lao động [26] Nguyễn Văn Tu (1976), Từ vốn từ tiếng Việt đại, Nxb ĐH THCN, trang 202 [27] Vũ Ngọc Tú (1996), Nghiên cứu đối chiếu trật tự từ Anh - Việt số cấu trúc bản, Luận án phó tiến sĩ khoa học ngữ văn, ĐH KHXH&NV, ĐHQG TPHCM, trang 186 [28] Nguyễn Thành Yến biên dịch (2005), Hướng dẫn soạn thảo hợp đồng kinh tế tiếng Anh, Nxb.Tổng hợp TPHCM [29] (1997), Các văn pháp luật hợp đồng lao động, hợp đồng kinh tế, giải tranh chấp lao động tranh chấp kinh tế (Legal documents on labour and economic contracts, settlement of labour and economic disputes), Nxb Chính trị Quốc gia (National political publishing house) 131 Tiếng Anh [30] Bar-Hillel Y (1953), “Machine translation” Computers and Automation 2(5), 1-6 [31] Bell, R (1991), Translation and Translating: Theory and Practice, Longman, New York [32] Booth A.D (1965), “Mechanical resolution of linguistic problems” In: Kent A Taulbee O.E eds Electronic information handling (Washington, D.C.: Spartan Books), 41-50 [33] Burch C.C & Koeln P (2005), “Introduction to Statistical Machine Translation”, ESSLLI 2005 [34] Burt M (1975), “Error Analysis in the Adult EFL Classroom”, TESOL Quarterly (9) [35] Catford, J.C (1965), A Linguistic Theory of Translation, Oxford University, Oxford [36] Celce-Mucrcia M and Larsen-Freeman D (1999), The grammar book: An English teacher’s course, Boston: Heinle and Heinle [37] Charles E.B., Scott B and Truong N Binh (1970), “Demonstration of LOGOS I system for English-Vietnamese machine translation”, ResearchGate [38] Corder S.P (1971), “Describing the Language Learner’s Language, interdisciplinary to Language”, CET Report and Papers, (6), 55-76 [39] Corder S.P (1981), “Error analysis”, in J.Allen and S.Corder The Edinburgh Course in Applied Linguistics [40] Delavenay E (1960), An introduction to machine translation, London: Thames and Hudson [41] Ellis R (1997), Error analysis and interlanguage, Oxford University Press, 128 132 [42] Flanagan M.A (1994), “Error classification for MT evaluation” In: Proceedings of the 1st Conference of the Association for Machine Translation in the America: Technology Partnerships for Crossing the Language Barrier, Columbia, MD, 65-72 [43] Garvin P.L (1963), “Syntax in machine translation” In: Garvin, P.L ed Natural language and the computer (New York: McGraw-Hill), 223-232 [44] George V (1972), Common Errors in Language Learning, Rowley: Massachusetts [45] Gyse Hansen (2010), “Translation ‘error’ (In) Handbook of Translation Studies”, Volume Pp 385–388 [46] Harry Aveling (2002) “Mistakes” in translation: A functionalist approach La Trobe University Melbourne, Australia A Paper Prepared for the Third Workshop on “The Art of Translation” [47] Hays D.G (1963), “Research procedures in machine translation” In: Garvin P.L ed Natural language and the computer (New York: McGraw-Hill), 183-214 [48] Hutchins J & Somers H.L (1992), An introduction to machine translation, Great Britain at the University Press, Cambridge [49] Jakobson R., (1998), On Linguistic Aspects of Translation (1959), in The Translation Studies Reader, L Venuti (ed.), Roudledge, London & New York [50] James, C (1998), Errors in Language Learning and Use: Exploring Error Analysis Longman: London and New York [51] Johansson F (1973) Immigrant Swedish Phonology Lund, Sweden: Gleerup [52] Julian Edge (1990) Mistakes and Correction London – New York: Longman 133 [53] Jurafsky D & Martin J.H (2006), Speech and Language Processing: An introduction to natural language processing, computational linguistics, and speech recognition, Prentice Hall, 80-83 [54] Koeln P (2014), Statistical machine translation, Cambridge University Press [55] Kroll B and Schafer J (1978), “Error-Analysis and the Teaching of Composition”, College Composition and Communication (29), 242248 [56] Kupsch-Losereit, S.(1985), “The Problem of Translation Error Evaluation”, In Titford, C and Hieke A (eds.), Translation in Foreign Language Teaching and Testing, pp 169-79, Tübingen: Gunter Narr, 1985 [57] Na, P.P.Q (2005), “Errors in the translation of topic-comment structures of Vietnamese into English”, The Asian EFL Journal September 2005 Volume Issue Pp 127-159 [58] Neubert, A., & Shreve, G M (1995) Translation as Text Kent Ohio: Kent State University Press [59] Newman, P (1988), Approaches to Translation, Oxford and New York: Pergamon [60] Newmark, P (1979), “Some Problems of Translation Theory And Methodology” I-III (In) Fremdsprachen Pp 98-102 [61] Newmark, P.A (1988), A Textbook of Translation, Prentice Hall, London [62] Nida, E A (1964), “Toward a Science of Translating: with Special Reference to Principles and Procedures Involved in Bible Translating” Leiden: Brill 134 [63] Nord, C (1992) Text Analysis in Translation Training In Teaching Translation and Interpreting: Training Talent and Experience: John Benjamins Publishing Company [64] Popovic M and Burchardt A (2007), “Improving statistical machine translation using word sense disambiguation” In: Proceedings of the 2007 Joint Conference on Empirical Methods in Natural Language Processing and Computational, 61-72 [65] Richards J.C (1971a), “A non-contrastive approach to error analysis”, English Language Teaching (25), 204-219 [66] Richards J.C (1971b), “Error analysis and second language strategies”, Language Science, (17),12-22 [67] Sakamoto Y (1970), Automatic language processing system in natural language dictionary for machine translation Research of the Electro technical Laboratory no.707 [68] Satterthwait A.C (1965), “Sentence-for-sentence translation: an example”, Mechanical Translation 8(2), 14-38 [69] Schachter J (1974), “An error in error analysis”, Language learning, Vol.24, No.2: 205-214 [70] Schachter J and Murcia M (1977), “Some reservations concerning error analysis”, TESOL, Quarterly Vol.11, No.4: 441-451 [71] Selinker L (1984), Interlanguage, Cited in Error Analysis of Richards London and New York: Longman [72] Sridhar S (1911), Contrastive analysis, error analysis and interlanguage, OUP, Oxford [73] Steele S (1976), Word order variation: A typological study, Summer Linguistic institute in Oswego, New York 135 [74] Stymne S (2011), BLAST: “A tool for error analysis of machine translation output”, Department of Computer and Information Science, Linkăoping University, Linkăoping, Sweden [75] Stymne S and Ahrenberg L (2010), “Using a grammar checker for evaluation and postprocessing of statistical machine translation” In Proceedings of LREC,Valetta, Malta, 2175–2181 [76] Taylor G (1986), “Errors and explanations”, Applied Linguistics (7), 144-166 [77] Tucker A.B and Nirenburg S (1984), “Machine translation: a contemporary view”, Annual Review of Information Science and Technology, (19), 129-160 [78] Vilar D., Jia Xu, D’Haro L.F., Ney H (2006), “Error analysis of statistical machine translation output” In: Proceedings of LREC, 697702 [79] Vilar D., Jia Xu, D’Haro L.F., Ney H (2010), “Linguistic-based evaluation criteria to identify statistical machine translation errors”, EAMT May 2010 St Raphael, France [80] Walz J.C (1982), Error correction techniques for the classroom, Prentice Hall, Englewood Cliffs [81] Weaver W (1949), Translation, In : Machine translation of languages: fourteen essays, Technology Press, Cambridge, MA., 1523 [82] Williams J.M (1981), “The phenomenology of error”, College composition and Communication, Vol.32 (2), 152-169 [83] Wilss, W (1982) The science of Translation Problems and Methods, Tübingen: Gunter Narr 136 Truy cập từ Internet [84] http://snuraddin.blogspot.com/2011/04/machine-translation-disadvantagesand.html (Ngày truy cập 2013-05-09) [Machine Translation , Disadvantages and Advantages - Stefán Briem] [85] http://www.omniglot.com/language/articles/machinetranslation.htm (Ngày truy cập 2013-05-09) [The Advantages and Disadvantages of Machine Translation - IngilizceTurkce.Gen.Tr] [86] http://nhantaidatviet.vnpt.vn/ShowNews.aspx?lang=vn&cat=012004&nid= 444 (Ngày truy cập : 2013-05-09) [87] http://www.pcworld.com.vn/articles/kinh-doanh/giaiphap/2008/09/1205798/nhung-su-kien-noi-bat-trong-tuan-tu-23-den-29-92008/ (Ngày truy cập : 2013-05-09) [88] https://translate.google.com.vn/ (Ngày truy cập : 2013-05-09) [89] http://voer.edu.vn/m/lich-su-cua-dich-tu-dong/5f4207ed Ngày truy cập : 2015-02-07 [90] www.mt-archive.info/Weaver-1949.pdf Ngày truy cập: 2015-02-07) Từ điển [91] Hoàng Phê (chủ biên) (1994), Từ điển tiếng Việt, Nxb KHXH,HN ... tự động hợp đồng kinh tế Anh- Việt 36 1.3.4.3 Lỗi ngữ pháp dịch tự động hợp đồng kinh tế Anh- Việt 38 1.3.4.4 Lỗi hệ thống dịch tự động hợp đồng kinh tế Anh- Việt .41 1.3.4.5 Lỗi ngẫu... lỗi ngơn ngữ dịch tự động hợp đồng kinh tế Anh- Việt Luận án đứng quan điểm ngôn ngữ học để khảo sát loại lỗi ngôn ngữ, chủ yếu lỗi tả, lỗi từ vựng lỗi ngữ pháp dịch tự động hợp đồng kinh tế Anh- Việt. .. niệm lỗi, lỗi dịch thuật sở lý thuyết lỗi ngôn ngữ dịch tự động Anh- Việt 1.1 Khái niệm lỗi Nghiên cứu vấn đề lý thuyết lỗi ngôn ngữ phần mềm Google Translate dịch tự động hợp đồng kinh tế Anh- Việt,