1. Trang chủ
  2. » Luận Văn - Báo Cáo

Xây dựng mô hình ánh xạ cấu trúc cụm động từ tiếng anh sang tiếng việt tương ứng

98 25 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 98
Dung lượng 1,15 MB

Nội dung

ĐẠI HỌC QUỐC GIA TP HCM TRƯỜNG ĐẠI HỌC BÁCH KHOA CỘNG HOÀ XÃ HỘI CHỦ NGHIÃ VIỆT NAM Độc Lập - Tự Do - Hạnh Phúc -oOo - Tp HCM, ngày 30 tháng 11 năm 2008 NHIỆM VỤ LUẬN VĂN THẠC SĨ Họ tên học viên : Huỳnh Thị Ngọc Thuý Giới tính : Nam / Nữ Ngày, tháng, năm sinh : 20/07/1982 Nơi sinh : Trà Vinh Chun ngành : Khoa học Máy tính Khố : 2006 1- TÊN ĐỀ TÀI : Xây dựng mơ hình ánh xạ cấu trúc cụm động từ tiếng Anh sang tiếng Việt tương ứng 2- NHIỆM VỤ LUẬN VĂN : - Nghiên cứu văn phạm tiếng Anh phạm vi động từ trợ động từ Nghiên cứu văn phạm tiếng Việt phạm vi động từ thành tố phụ phía trước động từ Nghiên cứu phương pháp ánh xạ cấu trúc cú pháp động từ tiếng Anh sang tiếng Việt, ý nét tương đồng khác biệt hai cấu trúc Xây dựng tập luật ánh xạ từ cấu trúc động từ tiếng Anh sang tiếng Việt - Viết chương trình để dịch động từ tiếng Anh sang tiếng Việt 3- NGÀY GIAO NHIỆM VỤ : 15/06/2008 4- NGÀY HOÀN THÀNH NHIỆM VỤ : 30/11/2008 5- HỌ VÀ TÊN CÁN BỘ HƯỚNG DẪN : PGS.TS Phan Thị Tươi Nội dung đề cương Luận văn thạc sĩ Hội Đồng Chuyên Ngành thơng qua CÁN BỘ HƯỚNG DẪN CHỦ NHIỆM BỘ MƠN (Họ tên chữ ký) QUẢN LÝ CHUYÊN NGÀNH (Họ tên chữ ký) PGS.TS Phan Thị Tươi CƠNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI TRƯỜNG ĐẠI HỌC BÁCH KHOA ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH Cán hướng dẫn khoa học : PGS.TS Phan Thị Tươi Cán chấm nhận xét : TS Nguyễn Xuân Dũng Cán chấm nhận xét : TS Quản Thành Thơ Luận văn thạc sĩ bảo vệ HỘI ĐỒNG CHẤM BẢO VỆ LUẬN VĂN THẠC SĨ TRƯỜNG ĐẠI HỌC BÁCH KHOA, ngày 26 tháng 02 năm 2009 i Lời cảm ơn Tôi xin chân thành cảm ơn PGS.TS Phan Thị Tươi, tận tình hướng dẫn, bảo tơi suốt q trình hồn thành luận văn Xin chân thành cảm ơn tận tình dạy dỗ quý thầy cô trường Đại học Bách Khoa thành phố Hồ Chí Minh, q thầy khoa Khoa học kỹ thuật máy tính Xin cảm ơn bạn lớp, gia đình, người giúp đỡ, động viên tơi nhiều q trình hồn thành luận văn ii Tóm tắt Dịch máy dựa kho ngữ liệu (Corpus-Based Machine Translation_CBMT) mơ hình dịch máy chiếm ưu thập kỉ vừa qua Trong hệ thống CBMT có tồn kho ngữ liệu song ngữ song song (bilingual parallel corpus) gồm chuỗi văn ngôn ngữ nguồn (source language) với chuỗi văn tương ứng ngơn ngữ đích (target language) Một hai hướng CBMT dịch máy dựa ví dụ (Example-Based Machine Translation_ EBMT) Hệ thống EBMT dùng kỹ thuật so trùng chuỗi văn đầu vào với chuỗi ngôn ngữ nguồn kho ngữ liệu, rút trích chuỗi ngơn ngữ đích tương ứng kết hợp chuỗi ngơn ngữ đích lại kết văn đầu Đơn vị đoạn văn kho ngữ liệu chuỗi từ (cụm từ – phrase đoạn – fragment) Mức cụm từ chọn để lưu trữ xây dựng kho ngữ liệu thay mức câu hay mức từ độ xác dịch mức cụm từ cao mức từ khả lưu trữ sưu tập mức cụm từ khả thi mức câu Trong luận văn này, xây dựng tập luật ánh xạ cấu trúc từ cụm động từ tiếng Anh sang tiếng Việt tương ứng, tập luật sở để xây dựng kho ngữ liệu cụm động từ song ngữ Anh-Việt Các luật ánh xạ rút từ trình khảo sát cấu trúc cụm động từ tiếng Anh, tiếng Việt, qui luật văn phạm động từ tiếng Anh dùng phương pháp chiếu thông qua kết đối sánh từ iii Abstract Corpus-Base Machine Translation (CBMT) has been the dominant model of machine translation in the last decade In CBMT, there is existence of bilingual parallel corpus comprises of texts in source language together with correlative texts in target language Example-Based Machine Translation (EBMT) is one of the two main trends of CBMT The basic techniques for EBMT are the matching of the input strings again source strings in the corpus, the extraction of corresponding target language strings and the recombination the strings as output result The basic unit in the corpus is sequence of words (phrase or fragment) To constructing the corpus, examples at phrase-level are chosen for storage instead of word-level or sentence-level It can explain that the translating at phrase-level is more exact than at word-level and the capacity as well as the gathering of examples in phrase-level is more possible than in sentence level In this thesis, we construct a mapping rule set of verb phrase structure from English to Vietnamese, this set is a foundation for constructing English-Vietnamese verb-phrase bilingual parallel corpus The rules were shaped as the results of the studying processes in English verb phrase structure, Vietnamese verb phrase structure, English grammar and applying “projection across word-alignment” method iv MỤC LỤC Lời cảm ơn i Tóm tắt ii Abstract iii Mục lục iv Danh mục hình .vi Danh mục bảng biểu vii Chương Tổng quan Chương Các Nghiên Cứu Liên Quan Chương Cơ Sở Lý Thuyết 3.1 Trợ động từ động từ cấu trúc cụm động từ tiếng Anh 10 3.1.1 Cấu trúc chung biến thể cụm động từ tiếng Anh 10 3.1.2 Các thành tố phụ phía trước 11 3.1.3 Trung tâm cụm động từ tiếng Anh 14 3.2 Phần phụ trước động từ cụm động từ tiếng Việt 15 3.2.1 Nhận xét mở đầu cụm động từ tiếng Việt 15 3.2.2 Các thành tố phụ phía trước 16 3.2.3 Trung tâm cụm động từ tiếng Việt 20 3.2.4 Các phạm trù ngữ pháp trật tự 21 Chương Tập luật ánh xạ Anh-Việt 23 4.1 Mô hình chuyển đổi cấu trúc “trợ động từ động từ chính” tiếng Anh sang cấu trúc tiếng Việt tương ứng 23 4.2 Tập luật ánh xạ Anh-Việt 26 v 4.2.1 Các khái niệm 26 4.2.2 Diễn tả cho phép (permission): can, could, may 28 4.2.3 Diễn tả suy đoán khả xảy (possibility): can, could, may, might 32 4.2.4 Diễn tả khả thực (ability): can be able 35 4.2.5 Diễn tả bổn phận (obligation): ought to, should, must, need 38 4.2.6 Diễn tả suy diễn (deduction) giả định (assumption): must, have, will should 41 4.2.7 Dare, need used to 45 4.2.8 “Be, have, do” với vai trò trợ động từ 47 4.2.9 Diễn đạt ý tương lai 55 Chương Hiện thực đánh giá 63 5.1 Hiện thực 63 5.1.1 Tiền xử lý 64 5.1.2 Ánh xạ cụm động từ tiếng Anh sang tiếng Việt 65 5.1.3 Giải nhập nhằng 66 5.2 Đánh giá độ xác chương trình 68 Chương Kết luận 72 6.1 Đóng góp luận văn 72 6.2 Hướng phát triển 73 Tài Liệu Tham Khảo 74 Phụ lục A GATE_cơng cụ rút trích cụm từ gán nhãn từ loại cho câu tiếng Anh 77 Phụ lục B Bảng thống kê tập luật ánh xạ theo ý nghĩa Phụ lục C Bảng thống kê tập luật ánh xạ theo trợ động từ vi Danh mục hình Hình 4.1 Cây cú pháp câu “The boy will be playing the football”………… 24 Hình 4.2 Ánh xạ cấu trúc cú pháp câu hình 3.1 sang cấu trúc cú pháp tiếng Việt tương ứng …………………………………………………………………….24 Hình 4.3 Minh hoạ phép chiếu đối sánh từ ………………………………………25 Hình 5.1 Mơ hình ánh xạ cấu trúc cụm động từ tiếng Anh sang tiếng Việt…… 64 Hình 5.2 Mơ hình biểu diễn ý nghĩa CAN dạng tập mờ…………… 67 vii Danh mục bảng biểu Bảng 5.1 Kết đánh giá tập câu song ngữ huấn luyện rút từ tài liệu “Ngữ pháp tiếng Anh thực hành- A Practical English Grammar”……………………… 69 Bảng 5.2 Kết đánh giá tập câu rút từ tài liệu“The semantics of the modal auxiliaries” ……………………………………………………………… 69 Bảng 5.3 Ví dụ cặp câu song ngữ Anh-Việt kết đầu tương ứng chạy chương trình ……………………………………………………………………….69 Bảng 5.4 Kết đánh giá tập câu song ngữ huấn luyện ………………….71 Bảng 5.5 Kết đánh giá tập câu tài liệu “The semantics of the modal auxiliaries” …………… 71 Chương : Tổng quan Xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP) lĩnh vực nghiên cứu quan trọng, động thúc đNy nhiều nhà khoa học máy tính quan tâm đến lĩnh vực khả xử lý ngôn ngữ tự nhiên cách mạng hố cách thức máy tính sử dụng Bởi phần lớn tri thức người ghi lại dạng ngơn ngữ, máy tính có khả hiểu ngôn ngữ tự nhiên tiếp cận tồn nguồn thơng tin Thêm vào đó, máy tính dùng giao diện diễn đạt ngơn ngữ tự nhiên cho phép người, kể người không chuyên, tiếp cận dễ dàng hệ thống phức tạp Dịch máy (machine translation - MT) nhiều ứng dụng lĩnh vực xử lý ngơn ngữ tự nhiên, mục đích dịch máy làm cho máy tính chuyển văn hay giọng nói từ ngơn ngữ tự nhiên sang ngôn ngữ tự nhiên khác mà giữ nguyên ngữ nghĩa sáng Trong thập kỉ vừa qua, mơ hình dịch máy dựa kho ngữ liệu (copus-based data-driven) có ưu vượt trội, điều tương phản sâu sắc với mô hình năm 1980 thập kỉ trước, mơ hình dịch máy dựa luật (rule-based) [9] Trong hệ thống dịch máy dựa kho ngữ liệu (Corpus-Based Machine Translation – CBMT) có tồn kho ngữ liệu song ngữ song song (bilingual parallel corpus) gồm đoạn (segments) văn ngôn ngữ nguồn với đoạn văn tương ứng ngơn ngữ đích, kích thước đoạn khác tuỳ hệ thống, tiêu biểu mức câu (sentence) Kho ngữ liệu sử dụng cho mục đích tra cứu, tham khảo để thu tri thức cần thiết cho lần dịch Trong mơ hình CBMT lại phân làm hai hướng phân biệt: dịch máy thống kê (Statistical Machine Translation – SMT) dịch máy dựa ví dụ 75 [10] Y.S Hwang, K Paik, Y Saraki, 2004, “Bilingual Knowledge Extraction using Chunk Alignment”, In Proceedings of PACLIC 18, Waseda University, Tokyo, December 8th-10th [11] H.C Nguyen, T.T Phan, D.X Nguyen, H.M Le, 2006, “English- Vietnamse Noun Phrase Extraction”, In Proceedings of The 9th International Oriental COCOSDA 2006 Conference, O-COCOSDA’06, pp 161-164 [12] T.P Nguyen, A Shimazu, 2006, “Improving Phrase-Based SMT with Morpho-Syntactic Analysis and Transformation”, In Proceedings of the 7th Conference of the Assoctiation for Machine Translation in the Americas, Cambridge, August, pp 138-147 [13] M.F Porter, 1997, “An algorithm for suffix stripping”, Readings in Information Retrieval 1997, Morgan Kaufmman Publishers Inc., pp 313-316 [14] Harold Somers, 1999, “Review Article: Example-Based Machine Translation”, Machine Translation, Vol 14, Issue 2, Kluwer Academic Publishers, pp 113-157 [15] A.J.Thomson, A.V.Martinet, “Ngữ pháp tiếng Anh thực hành- A Practical English Grammar”, dịch giải Nguyễn Trung Tánh, Nhà xuất Thành phố Hồ Chí Minh, 1996 [16] W Wang, M Zhou, 2002, “Structure Alignment Using Bilingual Chunking”, In Proceedings of The 19th International Conference on Computational Linguistics, Coling [17] H Wantanabe, S Kurohashi, and E Aramakia, 2000, “Finding Structural Correspondences from Bilingual Parsed Corpus for Corpus-based Translation”, In Proceedings of The 18th conference on Computational Linguistics, Germany, July 31- August 04 [18] D.Yarowsky and G.Ngai, 2001, “Inducing Multilingual POS Taggers and NP Bracketers via Robust Projection across Aligned Corpora”, In Second meeting of the North American Chapter of the Association for Computational Linguistics on Language technologies 2001, Pittspurgh, Pennsylvania, June 01-07, pp 1-8 76 [19] Hồ Ngọc Đức, 2009, Từ điển tiếng Việt, http://www.informatik.uni- leipzig.de/~duc/Dict/ 77 Phụ lục A GATE- công cụ dùng để rút trích cụm từ gán nhãn từ loại cho câu tiếng Anh GATE, đề tài dùng để nhận biết cụm động từ tiếng Anh gán nhãn từ loại cho từ đầu vào GATE câu đơn tiếng Anh GATE vừa kiến trúc phần mềm (software architecture), vừa khung làm việc (framework) vừa môi trường phát triển (development environment) Với vai trị kiến trúc phần mềm, GATE khơng cho phép phát triển thành công ứng dụng xử lý ngơn ngữ tự nhiên (đặc biệt rút trích thơng tin _ Information Extraction), mà dùng để xây dựng, thích kho ngữ liệu tiến hành việc đánh giá ứng dụng tạo Với vai trị khung làm việc mơi trường phát triển, GATE cho phép người dùng phát triển triển khai thành phần (component) xử lý ngôn ngữ tự nhiên theo cách thức vững Khung làm việc dùng để phát triển ứng dụng nhiều ngơn ngữ khác nhau, GATE hỗ trợ hồn tồn mã Unicode Các thành phần (component, cịn gọi tài nguyên_ resource) GATE chia làm ba loại: - Tài ngun ngơn ngữ (Language Resources_ LR): ví dụ kho ngữ liệu, ontology; - Tài nguyên xử lý (Processing Resources_ PR): giải thuật; - Tài nguyên hiển thị (Visual Resources_PR): thành phần dùng để hiển thị hiệu chỉnh (editing) gắn vào GUI 78 Ba loại tài nguyên gọi chung CREOLE (Collection of REusable Object for Language Engineering) Trong GATE có tập gồm vài tài nguyên xử lý dùng cho tác vụ NLP (natural language processing) phổ biến (như tác vụ gán nhãn từ loại,…) Tập tài nguyên đóng gói lại với hình thành nên ANNIE (A Nearly New IE system) POS tagger số tài nguyên có ANNIE, dùng để gán nhãn từ loại cho từ văn đưa vào Phụ lục B Bảng thống kê tập luật ánh xạ theo ý nghĩa Chủ từ thứ Sự cho phép (permission) : can, could, may Sự cho phép tương lai: may can Chủ từ thứ hai Chủ từ thứ ba Sự cho phép nói chung khứ: could I/we(Context ) can/may VBE Tơi/chúng tơi phép/có thể VBV I/we(Context ) can/may not VBE Tôi/chúng không phép/không thể VBV You(Context ) may VBE Tôi cho phép anh VBV Anh VBV You(Context ) can VBE Anh có quyền/có thể VBV Tôi cho phép anh VBV You(Context ) can/may not VBE Anh không phép/không thể VBV Tôi không cho phép anh VBV SubjE(Context ) can/may VBE SubjV có quyền/có thể VBV Tơi cho phép SubjV VBV SubjE(Context ) can/may not VBE SubjV không phép/không thể VBV Tôi khơng cho phép SubjE VBV could VBE phép/có thể VBV could not VBE SubjE(Context ) Khả xảy tương lai May, might could Sự suy đoán khả xảy (possibility) : can, could, may, might Sự suy đoán (speculation) hành động khứ Tình cho phép Khả xảy không thường Can cách dùng xuyên di không phép/không thể VBV may/might/could SubjE(Context ) SubjE(Context ) SubjE(Context ) SubjE(Context ) VBE Có lẽ SubjV (đang/sẽ) VBV SubjV VBV may/might not VBE Có lẽ SubjV (sẽ) khơng VBV may/might/could be VBGE Có lẽ SubjV (đang/sẽ) VBV may/might not be VBGE Có lẽ SubjV (sẽ) khơng VBV may/might/could have VBNE Có lẽ SubjV (đã) VBV SubjE(Context ) may/might not can can VBE VBV not VBE khơng thể can VBE VBV have VBV VBNE Có lẽ SubjV (đã) khơng VBV Khả xảy không thường could xuyên khứ (I/we VBE VBV shall/)will be able to VBE VBV biết VB Khả thực V tương lai (I/we shall/)will not be able to VBE VBV VBV can/am able to/is able to/are able to VBE VBV biết VBV Khả thực can not/ am not able to/is not able to/are not able to VBE VBV VBV Khả thực Khi có hàm ý điều ki could VBE VBV (ability) : can could/was able to/were able to VBE (đã) VBV Khả thực be able khứ could not/was not able to /were not able to VBE (đã) VBV Khả thực have/has/had been able to VBE (đã) VBV hồn thành khứ hoàn thành have/has/had not been able to Khả thực khứ hành động khơng thực SubjE(Context ) could have must VBE ought to/should phải VBE VBV phải/nên Trách nhiệm bổn phận chủ từ diễn tả hành động đắn, hợp lý: must, ought to, should Lời khuyên: ought to, should, must ought not to/should not ought to/should must VBE VBE phải VBE VBNE VBE nên VBV (đã) Lẽ VBV không nên VBV SubjV VBV VBV VBV Bổn phận (obligation) : ought to, should, must, need SubjE(Context ) ought to/should Chủ từ khơng thực bổn phận chủ từ hành động cách ngớ ngẩn, hấp tấp Một bổn phận không thực hành động phải làm mà lại bị bỏ qua need not must not Sự giả định (assumption) ought not to/should not be SubjE(Context ) ought to/should VBNE have/had to be must must must must have can’t/couldn’t can’t/couldn’t SubjE(Context ) SubjE(Context ) SubjE(Context ) SubjE(Context ) SubjE(Context ) SubjE(Context ) SubjE(Context ) SubjE(Context ) VBGE SubjV Lẽ Lẽ phải (đang) SubjV SubjV VBV không nên phải NPE(context) VBV VBV Lẽ SubjV không cần phải VBV Lẽ SubjV không nên VBV VBE Chắc hẳn SubjV VBV be VBGE Chắc hẳn SubjV VBV have VBNE Chắc hẳn SubjV VBV have been VBGE Chắc hẳn SubjV đã/đã a/ Sự việc can’t/couldn’t VBE can’t/couldn’t be VBGE b/ Sự việc khứ Lẽ SubjE(Context ) SubjE(Context ) SubjE(Context ) SubjE(Context ) SubjE(Context ) have/had diễn đạt suy diễn Sự suy diễn (deduction) giả định (assumption) : must, have, will, should VBGE need not VBE không cần (phải) VBV must not VBE không VBV Một hành động không Subj c E(Context ) need not have VBNE Một hành động sai Subj trái ho should not have VBNE E(Context ) must diễn đạt ý suy diễn (deduction) Sự suy diễn phủ định (negative deduction) : can't, couldn't be Chắc VBV NPV khơng thể VBV khơng thể VBV have VBNE VBV have been VBGE VBV will VBE Hẳn SubjV VBV will not VBE Hẳn SubjV không VBV will be VBGE Hẳn SubjV VBV will have VBNE Hẳn SubjV VBV should/ought to VBE Chắc SubjV VBV should not/ought not to VBE Chắc SubjV không VBV should/ought to be VBGE Chắc SubjV VBV should/ought to have VBNE Chắc SubjV VBV dare not VBE dared not VBE Dare không dám VBV (đã) không dám VBV Need Dare, need used to Used to Thói quen bị used to VBE Trước Subj thường VBV gián đoạn VBV tình trạng khứ used not to VBE Trước Subj (thường) không tương phản với chưa VBV Thói quen suốt thời gian used to/would VBE thường VBV khứ am/is/are used to VBGE/NPE was/were used to VBGE/NPE VBV quen VBV/NPV quen VBV/NPV be used to get used to VBGE/NPE got used to VBGE/NPE (làm) quen VBV/NPV (đã) (làm) quen VBV/NPV Giúp thành lập thể tiếp diễn Be Truyền đạt mệnh am/is/are lệnh, thị hay was/were kế hoạch was/were Diễn tả tương lai trước mắt Be, have, Do Thành lập dạng phủ định đơn did not khứ đơn Đặc biệt nhấn mạnh Have to VBE phải/được phép/hãy/sẽ/dự định VBV to VBE phải/được phép/hãy/dự định VBV to have VBNE Lẽ theo dự tính Subj am/is/are/was/were about to VBE VBV am/is/are/was/were on the point of VBGE VBV do/does not VBE không VBV VBE (đã) không do/does VBE did VBE có VBV có VBV SubjE (Context) SubjE (Context) had better had better VBV VBV Have giúp thành lập thể hoàn thành had better VBE Tốt SubjV nên VBV not VBE Tốt SubjV đừng/không nên VBV Ý nghĩa tương lai Ý định (intention) will VBE sẽ/sẽ VBV said(Context ) … would VBE nói … VBV will/would not VBE không/không chịu/từ chối VBV am/is/are going to VBE sẽ/định VBV am/is/are not going to VBE khơng/ khơng định VBV Sự tiên đốn (prediction) am/is/are going to Hiện tiếp diễn am/is/are am/is/are am/is/are am/is/are VBGE đang/ _ /sẽ /sẽ VBV VBGE đang/ _ / VBV VBGE timePhrase /sẽ VBV not VBGE không (đang)/sẽ không VBV was/were was/were VBGE đang/_ VBV not VBGE không (đang) Quá khứ tiếp diễn Hiện hồn thành Hiện hồn thành tiếp diễn Các Quá khứ tiếp diễn VBE sắp/sẽ VBV VBV have/has VBNE (đã) VBV have/has not VBNE không/đã không/chưa VBV have/has been VBGE vừa/mới vừa/đã/đã VBV have/has not been VBGE không VBV Quá khứ hoàn thành had had VBNE (đã) VBV not VBNE khơng/ khơng/chưa Q khứ hồn thành tiếp diễn had been Tương lai đơn I/we(Context) shall VBE Tôi/Chúng VBV I/we(Context) shall not VBE Tôi/Chúng không VBV You(Context) shall VBE Anh VBV will VBE VBV expect/probably (Context) … would VBE mong/có lẽ … VBV will not VBE không VBV VBGE _/đã/đã VBV VBV Tương lai tiếp diễn will will be VBGE sẽ/sẽ VBV not be VBGE không (đang) Tương lai hoàn thành I/we(Context) will/shall have VBNE will have VBNE VBV Tương lai hoàn thành ti I/we(Context) will/shall have been VBGE will have been VBGE VBV VBV Tôi/chúng VBV Tôi/chúng VB-V Phụ lục C Bảng thống kê tập luật ánh xạ theo trợ động từ CAN I/we(Context ) can VBE I/we(Context ) can not You(Context ) can VBE Tơi/chúng tơi phép/có thể Tơi/chúng tơi VBV khơng phép/khơng thể Anh có quyền/có thể VBV Tơi cho phép anh VBV Sự cho phép Sự cho phép (permission) You(Context ) can not VB Anh không phép/không thể VBV E (permission) tương lai Tôi không cho phép anh VBV SubjE(Context ) can VBE SubjV có quyền/có thể VBV Tơi cho phép SubjV VBV SubjE(Context ) can not VBE SubjV không phép/không thể VBV Tôi không cho phép SubjE VBV VBV Khả xảy (possibility) : can VBE Khả xảy tình cho phép can not VBE VBV (possibility) Khả thực (ability) Khả xảy không thường xuyên Khả thực (ability) Suy diễn phủ định Sự suy diễn (negative phủ định (negative deduction) deduction) : can't Sự cho phép (permission) Sự cho phép (permission) nói chung khứ can VBE can VBE can not VBE VBV VBV biết VBV VBE VBV VBV can’t VBE VBV can’t be VBGE VBV can’t have VBNE VBV can’t have been VBGE VBV could VBE phép/có thể VBV could not VBE khơng phép/không thể VBV VBV Khả xảy (possibility) tương lai Khả xảy (possibility) COULD Khả thực (ability) Khả xảy khứ Khả xảy không thường xuyên khứ, dạng khứ CAN Khả thực (ability) (khi có hàm ý điều kiện) MAY could SubjE(Context ) could SubjE(Context ) VBE Có lẽ SubjV (đang/sẽ) VBV SubjV VBV be VBGE Có lẽ SubjV (đang/sẽ) VBV could have VBNE could VBE VBV could VBE VBV Khả thực khứ could could VBE (đã) VBV not VBE (đã) khơng thể Khả thực khứ hành động không thực SubjE(Context ) Suy diễn phủ định Sự suy diễn (negative phủ định (negative deduction) deduction) : couldn't Sự cho phép (permission) SubjE(Context ) Sự cho phép (permission) tương lai couldn’t VBE could have VBNE Có lẽ SubjV (đã) VBV VBV Lẽ SubjV (đã) VBV khơng thể VBV couldn’t be VBGE VBV couldn’t have VBNE VBV couldn’t have been VBGE VBV I/we(Context ) may VBE Tơi/chúng tơi phép/có thể VBV I/we(Context ) may not VBE Tôi/chúng không phép/không thể VBV You(Context ) may VBE Tôi cho phép anh VBV Anh VBV You(Context ) may not VBE Anh không phép/không thể VBV Tôi không cho phép anh VBV SubjE(Context ) may VBE SubjV có quyền/có thể VBV Tơi cho phép SubjV VBV SubjE(Context ) may not VBE SubjV không phép/không thể VBV Tôi không cho phép SubjE VBV Khả xảy (possibility) Khả xảy (possibility) tương lai Khả xảy khứ MIGHT Khả xảy (possibility) Khả xảy (possibility) tương lai Khả xảy khứ Bổn phận (obligation), lời khuyên MUST Bổn phận, lời khuyên must not Suy diễn (deduction) Bổn phận (obligation), lời khuyên Bổn phận (obligation), lời khuyên OUGHT TO Sự giả định (assumption) Chủ từ không thực bổn phận chủ từ hành động cách ngớ ngẩn, hấp tấp Một bổn phận không thực hành động phải làm mà lại bị bỏ qua SubjE(Context ) may VBE Có lẽ SubjV (đang/sẽ) VBV SubjV VBV SubjE(Context ) may not VBE Có lẽ SubjV (sẽ) khơng VBV SubjE(Context ) may be VBGE Có lẽ SubjV (đang/sẽ) VBV SubjE(Context ) may not be VBGE Có lẽ SubjV (sẽ) khơng VBV SubjE(Context ) may have VBNE Có lẽ SubjV (đã) VBV SubjE(Context ) may not have VBNE Có lẽ SubjV (đã) khơng VBV SubjE(Context ) might VBE Có lẽ SubjV (đang/sẽ) VBV SubjV VBV SubjE(Context ) might not VBE Có lẽ SubjV (sẽ) khơng VBV SubjE(Context ) might be VBGE Có lẽ SubjV (đang/sẽ) VBV SubjE(Context ) might not be VBGE Có lẽ SubjV (sẽ) khơng VBV SubjE(Context ) might have VBNE Có lẽ SubjV (đã) VBV SubjE(Context ) might not have VBNE Có lẽ SubjV (đã) khơng VBV must VBE phải VBV must not VBE không VBV SubjE(Context ) must VBE Chắc hẳn SubjV VBV SubjE(Context ) must be VBGE Chắc hẳn SubjV VBV SubjE(Context ) must have VBNE Chắc hẳn SubjV VBV SubjE(Context ) must have been VBGE Chắc hẳn SubjV đã/đã VBV ought to VBE phải/nên VBV ought not to VBE không nên VBV SubjE(Context ) ought to be VBGE Lẽ SubjV phải (đang) VBV SubjE(Context ) ought not to SubjE(Context ) ought to have SubjE(Context ) SubjE(Context ) SubjE(Context ) SubjE(Context ) ought to ought not ought to ought to VBE Chắc SubjV VBV to VBE Chắc SubjV không VBV be VBGE Chắc SubjV VBV have VBNE Chắc SubjV VBV be VBGE VBNE Lẽ Lẽ SubjV SubjV không nên phải VBV VBV SHALL Tương lai đơn Bổn phận (obligation), lời khuyên Bổn phận (obligation), lời khuyên SHOULD Chủ từ không thực bổn phận chủ từ hành động cách ngớ ngẩn, hấp tấp Một bổn phận không thực hành động phải làm mà lại bị bỏ qua Một hành động sai trái ngớ ngẩn khứ Sự giả định (assumption) Sự giả định (assumption) WILL Ý định (intention) Tương lai đơn WOULD Thói quen suốt thời gian khứ Dạng khứ tương đương will tương lai đơn Sự tiên đoán (prediction) I/we(Context) shall VBE Tôi/Chúng VBV I/we(Context) shall not VBE Tôi/Chúng không VBV should VBE phải/nên VBV should not VBE không nên VBV SubjE(Context ) should be VBGE Lẽ SubjV phải (đang) VBV SubjE(Context ) should not be SubjE(Context ) should have SubjE(Context ) should not VBGE VBNE have Lẽ SubjV không nên Lẽ SubjV phải VBNE Lẽ SubjV VBV VBV không nên VBV SubjE(Context ) should VBE Chắc SubjV VBV SubjE(Context ) should not VBE Chắc SubjV không VBV SubjE(Context ) should be VBGE Chắc SubjV VBV SubjE(Context ) should have VBNE Chắc SubjV VBV SubjE(Context ) will VBE Hẳn SubjV VBV SubjE(Context ) will not VBE Hẳn SubjV không VBV SubjE(Context ) will be VBGE Hẳn SubjV VBV SubjE(Context ) will have VBNE Hẳn SubjV VBV will VBE sẽ/sẽ VBV will not VBE không/không chịu/từ chối VBV will VBE VBV will not VBE không VBV would VBE thường VBV said/expect/probably (Context) … would VBE nói/mong/có lẽ … VBV LÝ LNCH TRÍCH NGANG Họ tên : Huỳnh Thị Ngọc Thuý Ngày, tháng, năm sinh : 20/07/1983 Nơi sinh : Trà Vinh Địa liên lạc : 702/31/28 Điện Biên Phủ, phường 10, quận 10, TP Hồ Chí Minh Q TRÌNH ĐÀO TẠO - 2000 – 2004 : sinh viên khoa Toán – Tin học, Đại học Khoa học tự nhiên TP Hồ Chí Minh - 2006 – 2009 : học viên khoa Khoa học máy tính, Đại học Bách khoa TP Hồ Chí Minh Q TRÌNH CÔNG TÁC ... đối sánh từ Yarowsky, tức việc ? ?xây dựng tập luật ánh xạ cấu trúc từ cụm động từ tiếng Anh sang tiếng Việt tương ứng? ?? dựa tiếp cận chiếu qua kết đối sánh từ AnhViệt Kết từ cụm động từ tiếng Anh. .. đổi cấu trúc trợ động từ động từ tiếng Anh sang cấu trúc tiếng Việt tương ứng để giải thích rõ thêm biến đổi cấu trúc từ tiếng Anh sang tiếng Việt luật ánh xạ 4.1 Mơ hình chuyển đổi cấu trúc. .. trình ánh xạ cấu trúc từ động từ tiếng Anh sang tiếng Việt với đầu vào câu đơn tiếng Anh đầu động từ tiếng Việt có ý nghĩa tương đương với động từ tiếng Anh câu đầu vào Tập luật ánh xạ sở để xây dựng

Ngày đăng: 08/03/2021, 23:54

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Diệp Quang Ban, 1989, “Ngữ pháp tiếng Việt phổ thông (tập 1, tập 2)”, Nhà xuất bản Đại học và Trung học chuyên nghiệp Sách, tạp chí
Tiêu đề: Ng"ữ" pháp ti"ế"ng Vi"ệ"t ph"ổ" thông (t"ậ"p 1, t"ậ"p 2)”
Nhà XB: Nhà xuất bản Đại học và Trung học chuyên nghiệp
[2] Đinh Văn Đức, 2001, “Ngữ pháp tiếng Việt (từ loại)”, Nhà xuất bản Đại học quốc gia Hà Nội Sách, tạp chí
Tiêu đề: “Ng"ữ" pháp ti"ế"ng Vi"ệ"t (t"ừ" lo"ạ"i)”
Nhà XB: Nhà xuất bản Đại học quốc gia Hà Nội
[3] Nguyễn Tài CNn, 1981, “Ngữ pháp tiếng Việt”, Nhà xuất bản Đại học và Trung học chuyên nghiệp Sách, tạp chí
Tiêu đề: “Ng"ữ" pháp ti"ế"ng Vi"ệ"t”
Nhà XB: Nhà xuất bản Đại học và Trung học chuyên nghiệp
[4] Nguyễn Hân, 2006, “Đối chiếu trật tự của các thành tố phụ trong đoản ngữ tiếng Việt và tiếng Anh”, Luận văn thạc sĩ ngữ văn, Trường đại học Khoa học Xã hội và Nhân văn thành phố Hồ Chí Minh Sách, tạp chí
Tiêu đề: Đố"i chi"ế"u tr"ậ"t t"ự" c"ủ"a các thành t"ố" ph"ụ" trong "đ"o"ả"n ng"ữ" ti"ế"ng Vi"ệ"t và ti"ế"ng Anh
[5] Nguyễn Chí Hiếu, 2008, “Xây dựng mô hình xác định cụm danh từ tiếng Việt trong cặp câu song ngữ Anh-Việt”, Luận án tiến sĩ kỹ thuật, Đại học quốc gia Thành phố Hồ Chí Minh, Đại học Bách Khoa Sách, tạp chí
Tiêu đề: Xây d"ự"ng mô hình xác "đị"nh c"ụ"m danh t"ừ" ti"ế"ng Vi"ệ"t trong c"ặ"p câu song ng"ữ" Anh-Vi"ệ"t
[6] Vũ Ngọc Tú, 1996, “Nghiên cứu đối chiếu trật tự từ Anh-Việt trên một số cấu trúc cú pháp cơ bản”, Tóm tắt luận án phó tiến sĩ khoa học ngữ văn, Đại học quốc gia Hà Nội, Trường đại học khoa học xã hội và nhân văn.• Tiếng Anh Sách, tạp chí
Tiêu đề: Nghiên c"ứ"u "đố"i chi"ế"u tr"ậ"t t"ự" t"ừ" Anh-Vi"ệ"t trên m"ộ"t s"ố" c"ấ"u trúc cú pháp c"ơ" b"ả"n
[7] Micheal Carl, Anday Way, 2003, “Recent advances in example-based machine translation”, Dordrecht: Kluwer Academic Publisher Sách, tạp chí
Tiêu đề: “Recent advances in example-based machine translation”
[8] Jennifer Coates, 1983, “The sematics of the modal auxiliaries”, Croom Helm Publisher Sách, tạp chí
Tiêu đề: “The sematics of the modal auxiliaries”
[9] John Hutchins, 2006, “Example-based machine translation: a review and commentary”, Machine Translation, Vol. 19, Issue 3-4, pp. 197-211 Sách, tạp chí
Tiêu đề: Example-based machine translation: a review and commentary”, "Machine Translation
[10] Y.S. Hwang, K. Paik, Y. Saraki, 2004, “Bilingual Knowledge Extraction using Chunk Alignment”, In Proceedings of PACLIC 18, Waseda University, Tokyo, December 8 th -10 th Sách, tạp chí
Tiêu đề: Bilingual Knowledge Extraction using Chunk Alignment”, In "Proceedings of PACLIC 18
[11] H.C. Nguyen, T.T. Phan, D.X. Nguyen, H.M. Le, 2006, “English- Vietnamse Noun Phrase Extraction”, In Proceedings of The 9 th International Oriental COCOSDA 2006 Conference, O-COCOSDA’06, pp. 161-164 Sách, tạp chí
Tiêu đề: English-Vietnamse Noun Phrase Extraction”, In "Proceedings of The 9"th" International Oriental COCOSDA 2006 Conference, O-COCOSDA’06
[12] T.P. Nguyen, A. Shimazu, 2006, “Improving Phrase-Based SMT with Morpho-Syntactic Analysis and Transformation”, In Proceedings of the 7 th Conference of the Assoctiation for Machine Translation in the Americas, Cambridge, August, pp. 138-147 Sách, tạp chí
Tiêu đề: Improving Phrase-Based SMT with Morpho-Syntactic Analysis and Transformation”, In "Proceedings of the 7"th"Conference of the Assoctiation for Machine Translation in the Americas
[13] M.F. Porter, 1997, “An algorithm for suffix stripping”, Readings in Information Retrieval 1997, Morgan Kaufmman Publishers Inc., pp. 313-316 Sách, tạp chí
Tiêu đề: An algorithm for suffix stripping”, "Readings in Information Retrieval 1997
[14] Harold Somers, 1999, “Review Article: Example-Based Machine Translation”, Machine Translation, Vol. 14, Issue 2, Kluwer Academic Publishers, pp. 113-157 Sách, tạp chí
Tiêu đề: Review Article: Example-Based Machine Translation”, "Machine Translation
[15] A.J.Thomson, A.V.Martinet, “Ngữ pháp tiếng Anh thực hành- A Practical English Grammar”, dịch và chú giải Nguyễn Trung Tánh, Nhà xuất bản Thành phố Hồ Chí Minh, 1996 Sách, tạp chí
Tiêu đề: “Ng"ữ" pháp ti"ế"ng Anh th"ự"c hành- A Practical English Grammar”
Nhà XB: Nhà xuất bản Thành phố Hồ Chí Minh
[16] W. Wang, M. Zhou, 2002, “Structure Alignment Using Bilingual Chunking”, In Proceedings of The 19 th International Conference on Computational Linguistics, Coling Sách, tạp chí
Tiêu đề: Structure Alignment Using Bilingual Chunking”, In "Proceedings of The 19"th" International Conference on Computational Linguistics
[17] H. Wantanabe, S. Kurohashi, and E. Aramakia, 2000, “Finding Structural Correspondences from Bilingual Parsed Corpus for Corpus-based Translation”, In Proceedings of The 18 th conference on Computational Linguistics, Germany, July 31- August 04 Sách, tạp chí
Tiêu đề: Finding Structural Correspondences from Bilingual Parsed Corpus for Corpus-based Translation”, In "Proceedings of The 18"th" conference on Computational Linguistics
[18] D.Yarowsky and G.Ngai, 2001, “Inducing Multilingual POS Taggers and NP Bracketers via Robust Projection across Aligned Corpora”, In Second meeting of the North American Chapter of the Association for Computational Linguistics on Language technologies 2001, Pittspurgh, Pennsylvania, June 01-07, pp. 1-8 Sách, tạp chí
Tiêu đề: Inducing Multilingual POS Taggers and NP Bracketers via Robust Projection across Aligned Corpora”, In "Second meeting of the North American Chapter of the Association for Computational Linguistics on Language technologies 2001

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w