1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu dịch tự động việt anh dựa trên ví dụ trên nền android

119 37 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 119
Dung lượng 2,12 MB

Nội dung

Đại Học Quốc Gia Tp Hồ Chí Minh TRƯỜNG ĐẠI HỌC BÁCH KHOA LÊ THÀNH NGUYÊN NGHIÊN CỨU DỊCH TỰ ĐỘNG VIỆT- ANH DỰA TRÊN VÍ DỤ TRÊN NỀN ANDROID Chuyên ngành: Khoa học máy tính LUẬN VĂN THẠC SĨ TP HỒ CHÍ MINH, tháng 07 năm 2009 CƠNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI TRƯỜNG ĐẠI HỌC BÁCH KHOA ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH Cán hướng dẫn khoa học : PGS TS Đinh Điền Cán chấm nhận xét : Cán chấm nhận xét : Luận văn thạc sĩ bảo vệ HỘI ĐỒNG CHẤM BẢO VỆ LUẬN VĂN THẠC SĨ TRƯỜNG ĐẠI HỌC BÁCH KHOA, ngày 18 tháng 08 năm 2009 ĐẠI HỌC QUỐC GIA TP HCM TRƯỜNG ĐẠI HỌC BÁCH KHOA CỘNG HOÀ XÃ HỘI CHỦ NGHIÃ VIỆT NAM Độc Lập - Tự Do - Hạnh Phúc -oOo Tp HCM, ngày 30 tháng 06 năm 2009 NHIỆM VỤ LUẬN VĂN THẠC SĨ Họ tên học viên: LÊ THÀNH NGUYÊN Giới tính : Nam Ngày, tháng, năm sinh : 10/05/1982 Nơi sinh : Tp.HCM Chuyên ngành : Khoa học máy tính Khóa : 2007 1- TÊN ĐỀ TÀI: NGHIÊN CỨU DỊCH TỰ ĐỘNG VIỆT- ANH DỰA TRÊN VÍ DỤ TRÊN NỀN ANDROID 2- NHIỆM VỤ LUẬN VĂN: • Xây dựng mơ hình dịch tự động Việt- Anh dựa ví dụ • Xây dựng ngữ liệu song ngữ Việt- Anh • Xây dựng ngữ liệu mẫu dịch Việt- Anh • Xây dựng thành phần cải thiện mẫu dịch, nâng cao chất lượng câu dịch • Nghiên cứu mơ hình lập trình ứng dụng hệ điều hành Android • Xây dựng mơ hình lưu trữ tìm kiếm liệu hiệu hệ điều hành Android 3- NGÀY GIAO NHIỆM VỤ : 01/2009 4- NGÀY HOÀN THÀNH NHIỆM VỤ : 07/2009 5- HỌ VÀ TÊN CÁN BỘ HƯỚNG DẪN : PGS TS ĐINH ĐIỀN Nội dung đề cương Luận văn thạc sĩ Hội Đồng Chuyên Ngành thông qua CÁN BỘ HƯỚNG DẪN CHỦ NHIỆM BỘ MÔN QUẢN LÝ CHUYÊN NGÀNH PGS TS ĐINH ĐIỀN LỜI CẢM ƠN Em xin bày tỏ lòng biết ơn sâu sắc đến PGS TS Đinh Điền tận tình dẫn, giúp đỡ em nhiều suốt thời gian thực luận văn Em xin chân thành cảm ơn quý Thầy Cô Trường Đại học Bách khoa Tp Hồ Chí Minh, đặc biệt q Thầy Cơ khoa Khoa học máy tính nhiệt tình giúp đỡ, truyền đạt cho em kiến thức kinh nghiệm quý báu, tạo điều kiện thuận lợi cho em suốt thời gian học tập trường trình thực luận văn tốt nghiệp Xin cảm ơn ba mẹ, gia đình người thân yêu cho chỗ dựa vững chắc, động viên khuyến khích tạo điều kiện cho suốt thời gian học tập Cuối cùng, xin gửi đến anh chị bạn – người sát cánh tôi, giúp đỡ, động viên tơi nhiều suốt q trình thực luận văn – lời cảm ơn chân thành Tp Hồ Chí Minh, tháng 07 năm 2009 Lê Thành Nguyên TÓM TẮT Mục tiêu đề tài nghiên cứu dịch tự động Việt- Anh dựa ví dụ tảng di động Android Phạm vi đề tài giới hạn dịch câu đàm thoại thông dụng Mơ hình dịch dựa ví dụ sử dụng tài nguyên ngữ liệu câu ví dụ, ngữ liệu mẫu dịch, tự điển Việt- Anh Mơ hình dịch bao gồm ba giai đoạn Giai đoạn tìm kiếm câu cần dịch ngữ liệu câu ví dụ, tồn trả kết dịch tương ứng Giai đoạn giúp có kết dịch tốt thời gian ngắn Nếu khơng tìm thấy ngữ liệu câu ví dụ, giai đoạn hai tìm kiếm ứng viên tập mẫu dịch tương ứng với câu cần dịch Khi tìm mẫu khớp hồn tồn tiến hành dịch phần khuyết mẫu Trong trường hợp khơng tìm thấy mẫu dịch phù hợp, giai đoạn ba chọn ngữ liệu cặp câu ứng viên để tổng hợp phần tồn câu cần dịch Ngoài ra, sử dụng thêm số heuristic nhằm cải thiện cách dịch cụm từ, cải thiện chất lượng tập từ vựng rút tự động Ngoài ra, tiến hành nghiên cứu môi trường Android để phát triển ứng dụng dịch tự động Việt- Anh điện thoại di động Android sử dụng mơ hình dịch Kết xây dựng cho thấy mơ hình dịch đạt kết tốt, ứng dụng dịch tự động Việt- Anh đảm bảo yêu cầu sử dụng dịch thuật ABSTRACT Researching Example-based Vietnamese- English machine translation based on Android platform is the objective of this thesis This scope is common conversation Example-based model uses resources, such as example sentence corpus, template translation corpus, Vietnamese- English dictionary Translation model involves three phases In the first phase, finding the translated sentence in example sentence corpus, returning correlative translation result if translated sentence exists This phase helps to have a good quality translation result in a short time If not exist, in the second phase, finding the candidate in template translation corpus correlated with translated sentence When discovering a complete matching template, try to translate the missing on template If can’t find the appropriate translation template, in the third phase, choose the pair of candidate sentence from the corpus to collect existing parts in translated sentence Beside that, using some heuristic to improve translation method of phrase, to improve the quality of automatic withdrawed word set Finally, researching on Android platform to develop Vietnamese- English machine translation on Android mobile using the above translation model The result shows that the translation model gets a good quality, Vietnamese- English machine translation application guarantees translation requirement MỤC LỤC PHẦN 1: MỞ ĐẦU PHẦN : TỔNG QUAN .4 2.1 Tổng quan dịch tự động .4 2.1.1 Giới thiệu dịch tự động 2.1.2 Các chiến lược dịch máy .5 2.1.3 Các cách tiếp cận dịch máy 2.2 Giới thiệu số nghiên cứu dịch máy dựa ví dụ 11 PHẦN 3: GIỚI THIỆU NỀN TẢNG ANDROID .24 3.1 Android gì? 24 3.1.1 Nền tảng Android lịch sử hình thành 24 3.1.2 Kiến trúc tảng Android .27 3.1.3 Ưu khuyết điểm tảng Android 28 3.2 Lập trình tảng Android .29 3.2.1 Thiết kế giao diện 29 3.2.2 Điều khiển thành phần giao diện 32 3.2.3 Thao tác với tập tin 33 3.2.4 Hiển thị tiếng Việt .33 3.2.5 Cài đặt ứng dụng vào điện thoại Android 34 PHẦN 4: CÁC VẤN ĐỀ CƠ BẢN DỊCH TỰ ĐỘNG DỰA TRÊN VÍ DỤ .36 4.1 Xây dựng ngữ liệu song ngữ 36 4.1.1 Cách thức xây dựng ngữ liệu .36 4.1.2 Tiêu chí xây dựng ngữ liệu 41 4.2 Cách thức lưu ngữ liệu mẫu .43 4.3 So khớp câu với câu ngữ liệu 44 4.3.1 Giới thiệu độ đo Levenshtein 45 4.3.3 Xác định mẫu tổng quát từ ma trận tính độ đo Levenshtein .48 PHẦN 5: HƯỚNG TIẾP CẬN DỊCH TỰ ĐỘNG VIỆT- ANH 50 5.1 Xây dựng ngữ liệu 50 5.1.1 Xây dựng ngữ liệu câu dịch ví dụ 51 5.1.2 Xây dựng ngữ liệu mẫu dịch 54 5.1.3 Xây dựng tập từ vựng 59 5.2 Phương thức lưu trữ truy vấn tài nguyên 61 5.2.1 Lưu trữ truy vấn ngữ liệu câu ví dụ, ngữ liệu mẫu dịch .61 5.2.2 Lưu trữ truy vấn tự điển Việt- Anh .64 5.3 Phương thức phân tách từ câu tiếng Việt .67 5.4 Xây dựng bảng chuyển dịch từ loại tiếng Việt 70 5.5 Mơ hình dịch tự động Việt- Anh dựa ví dụ 73 5.5.1 Thành phần xử lý dịch câu từ ngữ liệu câu ví dụ 74 5.5.2 Thành phần xử lý dịch câu từ ngữ liệu mẫu dịch .75 5.5.3 Thành phần xử lý dịch câu dựa vào chọn lựa- tổng hợp .77 5.5.4 Thành phần dịch cụm từ heuristic cải thiện chất lượng dịch 79 PHẦN 6: THỬ NGHIỆM VÀ ỨNG DỤNG MINH HỌA 85 6.1 Thử nghiệm đánh giá 85 6.2 Ứng dụng minh họa 89 PHẦN 7: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 93 7.1 Kết luận 93 7.2 Hướng phát triển 94 7.2.1 Cải thiện chất lượng câu dịch 94 7.2.2 Mở rộng chức ứng dụng 95 TÀI LIỆU THAM KHẢO 96 Luận văn thạc sĩ Trang PHẦN 1: MỞ ĐẦU Trong năm gần đây, với mức sống người dân nước ta ngày nâng cao, nhu cầu tham quan, du lịch, học tập, làm việc nước người dân trở nên phổ biến Khi đó, giao tiếp tiếng Anh yêu cầu thiếu giao tiếp ngày (như hỏi đường, mua sắm ), trao đổi cơng việc hay q trình học tập Tuy nhiên, thực tế là, nhiều người Việt Nam gặp khơng khó khăn giao tiếp với người nước tiếng Anh, phần lớn khơng biết thể suy nghĩ tiếng Anh Do đó, ứng dụng giúp người Việt Nam tự tin giao tiếp với người nước tiếng Anh, thông tin nắm bắt cách nhanh chóng nhu cầu cần thiết Ứng dụng giúp dịch tự động tiếng Việt sang tiếng Anh, giúp trình bày u cầu, suy nghĩ tiếng Anh cách dễ dàng, nhanh chóng Hiện nay, có số ứng dụng dịch tự động phát triển, kể đến EvShuttle, số trang web hỗ trợ dịch tự động trực tuyến http://vdict.com, http://translate.google.com.vn, http://www.vietgle.vn [35] Tuy nhiên, để sử dụng ứng dụng này, người sử dụng phải có máy vi tính, điện thoại có khả truy cập internet Điều gây nhiều phiền toái cho người sử dụng có nhu cầu dịch thuật mà khơng thể thực được, khơng có máy vi tính, khơng có mạng internet khu vực Vì thế, để thuận tiện cho việc sử dụng, ứng dụng cần thiết phát triển thiết bị điện thoại di động (có thể kể đến điện thoại phát triển hệ điều hành mã nguồn mở Android) thực tế điện thoại di động trở thành vật dụng phổ biến người Tuy nhiên, nhược điểm thiết bị di động không gian nhớ tốc độ xử lý chậm Vì thế, cần phải có giải pháp cách tiếp cận phù hợp để hạn chế điểm yếu này, đảm bảo ứng dụng đáp ứng yêu cầu tức thời người sử dụng HVTH: Lê Thành Nguyên Luận văn thạc sĩ Trang Từ yêu cầu trên, đề tài "Nghiên cứu dịch tự động Việt- Anh dựa ví dụ Android" thực với mục tiêu xây dựng mơ hình dịch tự động từ ngôn ngữ tiếng Việt sang ngôn ngữ tiếng Anh, đồng thời tiến hành thực hóa điện thoại sử dụng tảng Android Một số cách tiếp cận dịch tự động kể đến như: tiếp cận dịch tự động dựa luật, tiếp cận dịch tự động dựa thống kê, tiếp cận dịch tự động dựa sở tri thức, tiếp cận dịch tự động dựa ví dụ, tiếp cận dịch tự động dựa tiếp cận lai [1] Ứng dụng tập trung vào đối tượng câu giao tiếp ngày, việc xây dựng ứng dụng theo hướng tiếp cận dịch tự động dựa luật khơng thể, hướng tiếp cận u cầu việc xây dựng hệ gồm nhiều luật, đòi hỏi công sức lớn nhiều lại bao quát hết trường hợp Hơn nữa, số luật tăng lên khiến cho người thiết kế luật khó kiểm sốt tính hợp lý tất luật Ứng dụng xây dựng theo hướng tiếp cận dựa thống kê, hướng tiếp cận yêu cầu xây dựng tập ngữ liệu song ngữ lớn Điều khơng khả thi, dung lượng nhớ điện thoại di động hạn chế tốc độ xử lý không cao Hướng tiếp cận dịch tự động dựa sở tri thức không chọn lựa tốt, ngơn ngữ giao tiếp ngày bao hàm nhiều lĩnh vực, không dễ dàng xây dựng hệ sở tri thức đáp ứng đủ lĩnh vực đó, nhớ hạn chế điện thoại di động Cách tiếp cận lai áp dụng khơng thể tận dụng mạnh hướng tiếp cận Trong cách tiếp cận, cách tiếp cận dựa ví dụ phù hợp để xây dựng ứng dụng dịch tự động điện thoại di động với hạn chế dung lượng tốc độ xử lý Cách tiếp cận đơn giản, cần so khớp câu dựa mẫu dịch mà khơng cần địi hỏi phân tích ngơn ngữ học, cú pháp, ngữ nghĩa [1] Hơn nữa, cách tiếp cận tương tự cách dịch người Khi cần dịch câu mới, người khơng cần phải phân tích cấu trúc ngữ nghĩa câu đó, mà đơn tìm kiếm nhớ câu tương tự để rút trích HVTH: Lê Thành Nguyên Luận văn thạc sĩ [8] Trang 97 Christopher D Manning and Hinrich Schutze 1999 Foundations of Statistical Natural Language Processing, The MIT Press [9] Cranias L H Papageorgiou and S Piperidis, 1994, A Matching Technique in Example-Based Machine Translation In The 15th International Conference on Computaional Linguistics, Kyoto, Japan, pp 100-104 [10] Daniel Jurafsky and James H Martin 2000 Speech and Language Processing, Prentice-Hall, Inc [11] Dinh Dien, Kiem Hoang, & Eduard Hovy 2003 BTL: a hybrid model for English-Vietnamese machine translation MT Summit IX, New Orleans, USA, 23-27 September 2003; pp.87-94 [12] Dinh Dien, Nguyen Luu Thuy Ngan, Do Xuan Quang, & Van Chi Nam 2003 A hybrid approach to word order transfer in the English-toVietnamese machine translation MT Summit IX, New Orleans, USA, 23-27 September 2003; pp.79-86 [13] Do Xuan Quang, Nguyen Luu Thuy Ngan, & Dinh Dien 2003 An advanced approach for English-Vietnammese syntactic tree transfer [14] Eiichiro Sumita 2001 Example-based machine translation using DPmatching between word sequences Proceedings of the workshop on Data-driven methods in machine translation, p.1-8, July 07-07, 2001, Toulouse, France [15] Eiji Aramaki and Sadao Kurohashi 2004 Example-based Machine Translation using Structural Translation Examples In proceedings of the IWSLT2004 HVTH: Lê Thành Nguyên Luận văn thạc sĩ [16] Trang 98 Eiji Aramaki, Sadao Kurohashi, Hideki Kashioka and Naoto Kato 2005 Probabilistic Model for Example-based Machine Translation In Proceedings of MT Summit X [17] Furuse O and H Iida 1992 Cooperation between Transfer and Analysis in Example-Based Framework In Proceedings of the fifteenth [sic] International Conference on Computational Linguistics, France, pp 654-651 [18] Furuse O and H Iida 1992 An Example-Based Method for TransferDriven Machine Translation In Fourth International Conference on Theoretical and Methodological Issues in Machine Translation, Montréal, Québec, pp 139-150 [19] James Allen Natural Language Understanding, 1995 The Benjamin/ Cummings Publishing Company, Inc [20] Kenji Imamura, Hideo Okuma, Taro Watanabe, and Eiichiro Sumita 2004 Example-based Machine Translation Based on Syntactic Transfer with Statistical Models In Coling 2004, Vol.I, pp.99-105 [21] Kfir Bar, Nachum Dershowitz, and Yaacov Choueka Matching Phrases for Arabic-to-English Example-Based Translation System Language, Culture, Computation: Studies in Honor of Yaacov Choueka, Lecture Notes in Computer Science, Nachum Dershowitz and Ephraim Nissan, eds., Springer-Verlag, Berlin [22] Masaki Murata, Qing Ma, Kiyotaka Uchimoto and Hitoshi Isahara 1999 An Example-Based Approach to Japanese-to-English Translation of Tense, Aspect, and Modality In TMI '99, pages 66-76 HVTH: Lê Thành Nguyên Luận văn thạc sĩ [23] Trang 99 McEnery, T and A Wilson 1996 Corpus Linguistics Edinburgh: Edinburgh University Press [24] Mima H., H Iida and O Furuse 1998 Simultaneous Interpretation Utilizing Example-Based Incremental Transfer 36th Annual Meeting of the Association for Computational Linguistics and 17th International Conference on Computational Linguistics, Montreal, Quebec [25] Mitsuo Shimohata, Eiichiro Sumita and Yuji Matsumoto 2003 Retrieving Meaning-equivalent Sentences for Example-based Rough Translation Proceedings of the HLT-NAACL 2003 Workshop on Building and using parallel texts: data driven machine translation and beyond, p.50-56, May 31-31, 2003, Edmonton, Canada [26] Satoshi Shirai, Francis Bond and Yamato Takahashi 1997 A Hybrid Rule and Example-based Method for Machine Translation In proceedings of the Natural Language Processing Pacific Rim Symposium 1997, pages 49-54, December [27] Stroppa N., Groves D., Way A., Sarasola K 2006 Example-Based Machine Translation of the Basque Language AMTA 7th conference of the Association for Machine Translation in the Americas pp.232 241 Boston [28] Toshiaki Nakazawa, Kun Yu, Daisuke Kawahara, and Sadao Kurohashi 2006 Example-based machine translation based on deeper NLP In Proceedings of International Workshop on Spoken Language Translation (IWSLT2006), pages 64–70 HVTH: Lê Thành Nguyên Trang 100 Luận văn thạc sĩ [29] Vamshi Ambati and Rohini U 2007 A Hybrid Approach to Example based Machine Translation for Indian Languages In Proceedings of 5th International Conference on Natural Language Processing (ICON 2007) [30] Yang Muyun, Zhao Tiejun, Liu Haijie, Shi Xiasheng & Jiang Hongfei 2004 Auto word alignment based Chinese-English EBMT International Workshop on Spoken Language Translation: Evaluation Campaign on Spoken Language Translation [IWSLT 2004], September 30 – October 1, 2004, Kyoto, Japan; pp 27-29 TÀI LIỆU TỪ INTERNET [31] http://androidguys.com/2008/08/18/fun-with-fonts/ [32] http://blogs.zdnet.com/Burnette/?p=515 [33] http://code.google.com/p/droiddraw/ [34] http://developer.android.com/guide/basics/what-is-android.html [35] http://en.wikipedia.org [36] http://www.developer.com/java/j2me/article.php/10934_3763991_1 [37] http://www.openmoko.com/ HVTH: Lê Thành Nguyên DANH MỤC CÁC BẢNG Bảng 4.1: Giá trị ma trận tính giá trị Levenshtein 47 Bảng 4.2: Truy vấn để xác định phần giống, khác câu nguồn câu đích .48 Bảng 5.1: Bảng so sánh font chữ 51 Bảng 5.2: Bảng so sánh kích thước tập tin theo loại font .52 Bảng 5.3: Bảng quy hoạch động áp dụng cho câu tiếng Việt 56 Bảng 5.4: Bảng tra ánh xạ .62 Bảng 5.5: Thống kê tần số xuất từ tiếng Việt 64 Bảng 5.6: Khảo sát số lượng từ theo chiều dài .65 Bảng 5.7: Kết tra từ điển với từ bắt đầu "chá" 67 Bảng 5.8: Bảng chuyển dịch từ loại tiếng Việt .71 Bảng 5.9: Phần khác hai câu dịch 76 Bảng 5.10: Phần khác câu dịch mẫu dịch 79 Bảng 6.1: Số lượng mẫu thu theo độ tương đồng 85 Bảng 6.2: Chi tiết số lượng loại mẫu dịch 86 Bảng 6.3: So sánh hệ số BLEU hệ dịch 87 Bảng 6.4: So sánh hệ số BLEU với mơ hình dịch dựa ví dụ khác 87 DANH MỤC CÁC HÌNH Hình 2.1: Mơ hình dịch trực tiếp ……………………………………………… .5 Hình 2.2: Mơ hình dịch kiểu chuyển đổi cú pháp .6 Hình 2.3: Chuyển đổi cú pháp ngơn ngữ nguồn sang ngơn ngữ đích Hình 2.4: Mơ hình dịch liên ngơn ngữ Hình 2.5: Các chiến lược dịch dịch máy Hình 2.6: Lưu đồ Giai đoạn học giải thuật fTBL .12 Hình 2.7: Sơ đồ hệ thống khử nhập nhằng ngữ nghĩa .14 Hình 2.8: Liên kết ngữ nghĩa cặp phrase .15 Hình 2.9: Tiêu chí Equality Similarity .16 Hình 2.10: Ví dụ dịch câu từ tiếng Nhật sang tiếng Anh 16 Hình 2.11: Ví dụ dịch từ tiếng Nhật sang tiếng Anh 17 Hình 2.12: Ví dụ mơ hình Syngraph Data 18 Hình 2.13: Mơ hình dịch tự động Nhật- Anh có sử dụng xác suất 19 Hình 2.14: Cấu trúc mơ hình dịch đề nghị 21 Hình 2.15: Mơ hình dịch tự động theo phương pháp lai 22 Hình 3.1: Logo tảng Android .24 Hình 3.2: Màn hình trình giả lập Android 25 Hình 3.3: Điện thoại HTC Dream chạy tảng Android 26 Hình 3.4: Điện thoại Openmoko chạy tảng Android 26 Hình 3.5: Kiến trúc tảng Android .27 Hình 3.6: Cơng cụ DroidDraw 32 Hình 4.1: Cách lưu ngữ liệu song ngữ 39 Hình 4.2: Ví dụ minh họa SSTC cho câu nguồn tiếng Anh “The old man died” câu đích tiếng Malaysia “lekati tua itu mati” .44 Hình 5.1: Mơ hình tài ngun dịch tự động Việt- Anh 50 Hình 5.2: Số lượng từ theo chiều dài 66 Hình 5.3: Cấu trúc bảng băm cho ba ký tự đầu từ 66 Hình 5.4: Lưu đồ giải thuật quy trình dịch câu .74 Hình 5.5: Lưu đồ dịch câu dựa vào ví dụ 75 Hình 5.6: Lưu đồ dịch câu dựa vào mẫu dịch 76 Hình 5.7: Lưu đồ dịch câu dựa vào chọn lựa- tổng hợp 78 Hình 5.8: Lưu đồ dịch cụm từ 80 Hình 6.1: Biến đổi BLEU theo N .86 Hình 6.2: Đánh giá cảm quan chất lượng dịch người sử dụng 88 Hình 6.3: Màn hình menu chọn lựa 89 Hình 6.4: Quá trình nạp tài nguyên 90 Hình 6.5: Màn hình chương trình .91 Hình 6.4: Kết tra từ điển từ “ca” 91 Hình 6.5: Kết câu dịch 92 LÝ LỊCH TRÍCH NGANG Họ tên học viên: LÊ THÀNH NGUYÊN Giới tính : Nam Ngày, tháng, năm sinh : 10/05/1982 Nơi sinh : Tp.HCM Địa liên lạc : 410/27B Cách Mạng Tháng 8, Phường 11, Quận 3, Tp.HCM QUÁ TRÌNH ĐÀO TẠO 2000 – 2004 : Học đại học Trường Đại học Khoa học Tự nhiên Tp.HCM, Khoa Toán- Tin học 2007 – 2009 : Học cao học Trường Đại học Bách Khoa Tp.HCM, Khoa Khoa học máy tính Q TRÌNH CƠNG TÁC 2004 – 2005 : Công tác Trường Đại học Khoa học tự nhiên Tp.HCM 2005 đến : Công tác Ban quản lý Khu Công nghệ cao Tp.HCM PHỤ LỤC A BẢNG CÁC DANH TỪ CHỈ LOẠI [1] STT Loại từ Ví dụ Áng văn Bài thơ, diễn văn tuyên ngôn, tài liệu, tiểu thuyết từ điển, máy hoa tranh, thư, tượng, vách, ảnh bàn, ghế, đầu, thuyền, khuyết điểm, tâm trạng nến, đèn, roi, bút, súng, đàn, tăm phòng, nhà bàn, ghế, thuyền dao, thuyền, sơng gió sách, tập vở, tiểu thuyết đóa hoa hịn đạn, bi, núi súng, đại bác bùa, thư, phiếu, đơn gió kịch quà, nợ văn hóa, độc lập, khoa học nhà cờ, núi ngơi nhà, đền, mộ, (sao) tượng, truyện, sách bom, núi sách, ảnh, tranh, bảng, bìa tuồng, kịch tòa nhà, lâu đài gươm, kiếm ruộng, đất sao, vua kịch, tuồng anh sinh viên, cán bà chủ nhiệm, vợ bác thợ, phu xe chị giáo viên, nhà báo bậc vĩ nhân, anh hùng Tí, Tỉu cậu học trị, trai trâu, bị, gà; gián điệp, mẹ mìn dược sĩ, y tá chàng thi sĩ, văn nhân liên lạc, tài xế đấng anh hùng, thánh thần em học sinh, nhi đồng lão quản gia, tri huyện mụ đàn bà, vợ nàng công chúa, tiên người giáo viên, thợ nề tay thầu khốn, nhà bn tên sĩ quan dịch, ngụy binh thằng quỷ sứ, mật thám vị phụ lão, chủ tịch viên sĩ quan, đại úy B MẪU ĐÁNH GIÁ CẢM QUAN CHẤT LƯỢNG CÂU DỊCH Đánh giá chất lượng máy dịch STT Câu tiếng Việt cần dịch Câu tiếng Anh người dịch Câu tiếng Anh máy dịch xin chào anh vui gặp anh lần anh đến Việt Nam phải không ? how are you doing ? glad to meet you is this your first time in Vietnam ? good you it 's very happy to meet you is this first time you come Vietnam ? số điện thoại tơi tơi thích bạn từ đâu đến ? bạn đến để nghỉ mát hay công việc ? this is my phone number I would like it where are you from ? are you here on vacation or business ? this is my telephone number I 'd like it where are you from ? you come here in order to vacation or business ? 10 11 12 13 14 15 bạn có nói tiếng Anh khơng ? bạn học tiếng Anh đâu ? xin chào ! anh khỏe không ? Robert bị lạc đường lối xuống phố ? không gặp nhiều người Mỹ vui giúp đỡ anh you speak any English ? where did you learn English ? good morning ! how are you doing ? I am Robert I am a little lost which way is downtown ? we not see many Americans you say English ? where you did learn English ? hello ! you strong ? I am Robert I have a little lost which path descend street ? we not see many America we are very happy to help you we very happy help you 16 Rất tốt Khá tốt, đảm bảo nội dung cần truyền tải câu tiếng Việt Không tốt, không đảm bảo nội dung cần truyền tải câu tiếng Việt 17 18 19 20 21 anh có gặp Mike khơng ? sở thích tơi tơi khỏe bạn muốn đâu ? nghĩ chưa gặp trước have you met Mike ? it 's my pleasure I am fine where would you like to go ? I not think we have met before you meet Mike ? it 's my pleasure I fine where you want to go ? I think be we not yet meet mutually before 22 23 24 25 26 27 28 29 30 muốn ăn trưa sớm anh nghĩ trời mưa khơng ? tơi cần tơi nghe nói trời mưa anh tin không ? nghĩ bão đến tơi mua Mỹ tơi thật thích nhà bạn anh nghĩ áo sơ mi hợp với tơi ? tơi thích kiểu tóc bạn anh thích ăn khơng ? tơi bạn nơi hấp dẫn thành phố I want to eat lunch soon you think it will rain ? I need it I heard it was going to rain can you believe him ? I think a storm is coming I got it in America I really like your house you think this shirt looks okay on me ? I like your haircut how you like the food here ? I can shoe you the high points of the city I would like eat lunch early you think it will rain ? I very need it I heard it will rain you can believe him ? I think storm arrange to come I buy it in America I really like your house you think this shirt suit with me ? 34 35 thật tuyệt vời cho bạn số điện thoại that would be nice I 'll give you my number 36 37 bạn biết chỗ khơng ? tơi kiếm nơi để ăn you know any spots ? I am looking for a place to eat it 's wonderful I 'll give you my telephone number you know any place ? I being look some place in order to eat 38 tơi bạn nơi cuối đường I can show you one place down the street 31 32 33 I 'd like your hairstyle you like food here ? I can show you many attract place of this city I can show you one road end place 39 muốn đến thăm Việt Nam I have always wanted to see Vietnam I often want to come to visit Vietnam 40 anh nghỉ ? how long will you rest here ? 41 42 43 chuyến bay bạn ? tơi mong tơi vui thấy anh đến an toàn how long will you be vacationing here ? how was your flight ? I will look forward to it I am glad to see that you got here safely 44 45 khách sạn ? muốn đến sớm ngày how is the hotel ? I want to come a day earlier how hotel ? I would like come more early one day 46 tơi muốn có nhiều thời gian để thích nghi với thay đổi giấc I would have liked more time to adjust to the time changes 47 vui đưa anh dạo quanh thành phố I will be happy to show you around the city I would like have much time in order to adapt with affair change time I 'm very happy give you walk around city 48 49 khách sạn đẹp tơi thích xem vài nơi thành phố the hotel is very nice I would like to see some of the city hotel very nice I 'd like look at some place in city 50 công tác cho công ty I go on business to give company 51 52 53 anh lâu ? bạn đến Việt Nam ? xin phép cho tơi nói chuyện với Robert ? I am on business with my company will you be here long ? why did you come to Vietnam ? Could I speak to Robert , please ? 54 55 56 ăn tối muốn học ngơn ngữ tơi muốn có để tập luyện let 's get together for dinner I want to learn this language I would like someone to practice let 's go to have dinner together I would like learn this language I would like have someone in order to train how your flight ? I 'll very wait it I 'm very happy when see you come here safe you will here long ? why you come Vietnam ? may I speak with Robert ? 57 58 gặp trực tiếp lại vài năm 59 học tiếng Anh năm 60 61 62 63 số điện thoại 123456 tới dãy phố kế bên anh thật tử tế nơi để ăn tối gần đâu ? let 's meet in person I am going to be staying here for a few years I have been studying English for the pass years phone number is 123456 down the next block that 's very kind of you where is the nearest place to eat ? let 's meet direct I 'll remain here few years 64 tơi muốn có hội luyện tập tiếng Anh I would like the chance to practice English I would like have chance practice English 65 66 67 68 gọi điện cho tơi tơi khơng nghĩ tơi khơng nói tiếng Anh anh có nghĩ đến học tiếng Anh không ? call me I don 't think so I don 't speak a bit of English have you ever thought about learning English ? let to telephone for me I don 't think so I don 't speak English have you ever think to come to learn English ? 69 70 71 72 73 hội tốt cho bạn muốn dạy tiếng Anh không ? cần giáo viên tiếng Anh đến Việt Nam thường xun tơi chấp nhận lời đề nghị this is good chance for me would you like teach English ? I need English teacher I come frequent Vietnam I can accept that suggestion 74 anh muốn hộ hay nhà ? this is a good chance for me you want to teach English ? I need English teacher I come to Vietnam a lot I may take you up on that suggestion you want an apartment or a house ? 75 76 77 78 tơi giúp anh tìm cảm ơn tơi hiểu đầy đủ vui lịng nói chậm I will help you find it thanks I understand completely please speak slower I 'll help you find it thanks I understand complete please speak more slow I have already to learn English year telephone number be 123456 let 's arrive block beside that 's very kind of you where is the nearest place in order to have dinner ? you want one apartment or one house ? 79 bạn chơi tennis ? how long have you been playing tennis ? are you free on Thursday evening ? you enjoy camping out ? I can 't wait I enjoy camping you want to go to the theater on Friday ? 80 81 82 83 84 bạn rảnh chiều thứ năm khơng ? bạn có thích cắm trại không ? chờ đợi tơi thích cắm trại bạn muốn xem phim vào thứ sáu không ? 85 86 87 88 89 90 91 how long you did play tennis ? you Thursday afternoon free ? you like to go to camp ? I can 't wait I 'd like go to camp would you like go to the theater enter Friday ? who sings that song ? they are my favorite music group when you teach me English ? what time does the party begin ? where is a good hotel ? we have a small house I have to run to the grocery store who sing that song ? they is my favorite music group when you teach me English ? what time party begin ? where good hotel ? we have small house I have to run to grocery store 92 93 hát hát ? họ nhóm nhạc u thích tơi anh dạy tiếng Anh ? bữa tiệc bắt đầu ? khách sạn tốt đâu ? chúng tơi có ngơi nhà nhỏ tơi phải chạy cửa hàng lương thực cảm ơn lời khuyên anh anh mua phần mềm vi tính đâu ? thanks for your advice where you buy computer software ? thank your advice where you buy computer software ? 94 95 96 97 98 99 100 hỏi người bán hàng anh có giảm giá khơng ? tơi nghĩ Kelly thích họ có ? tơi cần xem hóa đơn tơi mua ngơi nhà xe tơi cần có tài khoản ngân hàng let 's ask the salesman you get a discount ? I think Kelly will like it what they have ? I need to see the receipt I buy three houses and two cars I need a bank account let 's ask salesman you acquire to discount ? I think Kelly will like it what they have ? I need to see receipt I buy three houses and two cars I need to have bank account Người thực (Ký tên, ghi rõ họ tên) ... 1- TÊN ĐỀ TÀI: NGHIÊN CỨU DỊCH TỰ ĐỘNG VIỆT- ANH DỰA TRÊN VÍ DỤ TRÊN NỀN ANDROID 2- NHIỆM VỤ LUẬN VĂN: • Xây dựng mơ hình dịch tự động Việt- Anh dựa ví dụ • Xây dựng ngữ liệu song ngữ Việt- Anh. .. đề tài nghiên cứu dịch tự động Việt- Anh dựa ví dụ tảng di động Android Phạm vi đề tài giới hạn dịch câu đàm thoại thơng dụng Mơ hình dịch dựa ví dụ sử dụng tài nguyên ngữ liệu câu ví dụ, ngữ... ứng dụng dịch tự động Việt- Anh điện thoại di động Android sử dụng mơ hình dịch Kết xây dựng cho thấy mơ hình dịch đạt kết tốt, ứng dụng dịch tự động Việt- Anh đảm bảo yêu cầu sử dụng dịch thuật

Ngày đăng: 15/02/2021, 18:23

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w