Hướng phát triển

Một phần của tài liệu Nghiên cứu giải pháp cải tiến chất lượng dịch tự động tiếng việt (Trang 136 - 150)

6 .Đóng góp chính của luận án

2. Hướng phát triển

Để hoàn thiện các giải pháp đối với hệ thống dịch tự động tiếng Việt và giúp các hệ thống đạt chất lượng tốt hơn, trong thời gian tới nghiên cứu sinh sẽ tiếp tục tập trung nghiên cứu các nội dung chính sau đây:

- Tiếp tục nghiên cứu, cải tiến phương pháp dịch sử dụng mạng nơ ron nhằm

đạt hiệu quả cao hơn.

- Xây dựng kho ngữ liệu phong phú hơn bằng nhiều phương pháp khác nhau,

đồng thời mô tả ngữ nghĩa của dữ liệu và kết hợp phân tích ngữ nghĩa trong phương pháp dịch.

- Mở rộng xây dựng kho ngữ liệu ở các lĩnh vực khác nhau và triển khai đánh

giá, phân tích và so sánh.

- Đánh giá yếu tố ngữ cảnh của toàn văn bản để làm tham số đầu vào cho hệ

DANH MỤC CÁC CƠNG TRÌNH KHOA HỌC ĐÃ CƠNG BỐ

1. Huỳnh Công Pháp, Đặng Đại Thọ, Nguyễn Văn Bình, “Cải tiến chất lượng dịch tự động bằng giải pháp mở rộng kho ngữ liệu”, Kỷ yếu Hội nghị Quốc gia lần

thứ VIII về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR) (ISBN: 978-604-913-397-8), pp. 80-87, 07/2015.

2. Phạm Tuấn Anh, Nguyễn Văn Bình, “Nghiên cứu các phương pháp và đề

xuất hệ thống đánh giá chất lượng dịch tự động song ngữ Anh - Việt”, Kỷ yếu Hội

thảo khoa học Quốc gia Công nghệ thông tin và ứng dụng trong các lĩnh vực CITA2015, Trang 118-121, 06/2015.

3. Nguyễn Văn Bình, Huỳnh Cơng Pháp, “Cải tiến chất lượng dịch Việt-Anh bằng mơ hình học máy mạng nơron kết hợp kho ngữ liệu lớn”, Kỷ yếu Hội thảo Quốc

gia “Một số vấn đề chọn lọc của Công nghệ thông tin và Truyền thông” (Hội thảo @), 11/2017.

4. Nguyễn Văn Bình, Huỳnh Cơng Pháp, “A System of Exploiting and Building Homogeneous and Large Resources for the Improvement of Vietnamese- Related Machine Translation Quality”, International Journal of Applied

Engineering Research, pp. 10242-10248, 12/2017 (Indexed in Scopus).

5. Nguyễn Văn Bình, Huỳnh Cơng Pháp, Huỳnh Thị Tâm Thương, “Giải pháp tách từ sử dụng mạng nơ ron nhằm nâng cao chất lượng dịch tự động tiếng Việt”, Kỷ

yếu hội thảo quốc gia CITA2017 (ISBN: 978-604-80-2853-4), 11/2017.

6. Huỳnh Cơng Pháp, Nguyễn Văn Bình, “Cải tiến chất lượng dịch máy kết hợp giải pháp xây dựng kho ngữ liệu phục vụ đánh giá chất lượng hệ thống dịch tự động tiếng Việt”, Tạp chí Khoa học và Cơng nghệ Đại học Đà Nẵng, ISSN: 1859-1531, số 05(114), trang 46-51, 2017.

7. Nguyễn Văn Bình, Huỳnh Cơng Pháp, “An English-Vietnamese Translation System Using Artificial Intelligence Approach”, ACIIDS 2018: Intelligent

Information and Database Systems, Lecture Notes in Computer Science; Nhà xuất bản: Springer Nature, pp. 211-220, 03/2018 (Indexed in Scopus).

8. Huỳnh Công Pháp, Cao Xuân Tuấn, Nguyễn Văn Bình, Đinh Thị Mỹ Hạnh, “Xây dựng mơ hình và thuật tốn hợp nhất dữ liệu từ điển phục vụ xử lý ngôn ngữ tự nhiên”, Kỷ yếu Hội thảo khoa học Quốc gia CITA2018, “Công nghệ thông tin và

ứng dụng trong các lĩnh vực”, ISBN: 978-604-84-3470-0, Trang 215-222, 09/2018.

9. Nguyễn Văn Bình, Huỳnh Cơng Pháp, “Đánh giá vai trị của kho ngữ liệu

đối với chất lượng dịch tự động tiếng Việt”, Tạp chí Khoa học và Cơng nghệ Đại

10. Huỳnh Cơng Pháp, Đặng Đại Thọ, Nguyễn Văn Bình, “Giải pháp phát triển kho ngữ liệu dịch tự động theo hướng làm giàu ngữ nghĩa”, Kỷ yếu Hội thảo

khoa học Quốc gia CITA2021, 06/2021.

11. Nguyễn Văn Bình, Huỳnh Cơng Pháp, Đặng Đại Thọ, “Improving the neural network model in combination with a big semantic-enriched corpus for building an English - Vietnamese semantic-oriented machine translation system”,

Design Engineering, ISSN 0011-9342, Vol 2021, Issue 07, 07/2021 (Indexed in Scopus).

Ngoài ra, nghiên cứu sinh đã thực hiện 01 đề tài NCKH cấp Bộ:

12. Nguyễn Văn Bình, Đề tài NCKH cấp Bộ: “Nghiên cứu giải pháp đánh giá chất lượng dịch tự động tiếng Việt”, Mã số: B2016-DNA-48-TT, 2017-2018, Báo cáo nghiệm thu 03/2019.

135

TÀI LIỆU THAM KHẢO

[1] W. Hutchins and H. Somers, An Introduction fo Machine

Translation. Academic Press, Harcourt Brace Jovanovich, Publishers, 1992.

[2] Đ. T. Hồng, “Xây dựng hệ thống dịch tự động tiếng Việt.” Tạp chí Ngơn ngữ và Đời sống, p. vol. 11(157), 2008.

[3] R. K. Philipp Koehn, “Six Challenges for Neural Machine Translation.” Proceedings of the First Workshop on Neural Machine Translation, Vancouver, Canada, pp. 28–39, 2017.

[4] W. J. Hutchins, “Machine Translation: A Brief History,” Concise

History of

the Language Sciences. pp. 431–445, 1995, doi: 10.1016/b978-0-08-042580-

1.50066-0.

[5] M. Nagao, “A Framework of a Mechanical Translation between Japanese and English by Analogy Principle,” in Readings in Machine

Translation, 1984, pp. 173–180, doi: 10.7551/mitpress/5779.003.0038.

[6] S. Sato and M. Nagao, “Toward memory-based translation,” in

Proceedings of the 13th conference on Computational linguistics -, 1990, vol.

3, pp. 247–252, doi: 10.3115/991146.991190.

[7] H. Somers, “Review Article: Example-based Machine Translation.” Kluwer Academic Publishers. Printed in the Netherlands, pp. 113–157, 1999.

[8] N. Q. Phuoc, Y. Quan, and C.-Y. Ock, “Building a Bidirectional English-Vietnamese Statistical Machine Translation System by Using MOSES,” International Journal of Computer and Electrical Engineering, vol. 8, no. 2. pp. 161–168, 2016, doi: 10.17706/ijcee.2016.8.2.161-168.

[9] P. Koehn, Statistical Machine Translation. Cambridge University Press, 2010.

[10] H. N. Franz Josef Och, “A Systematic Comparison of Various,”

Association for Computational Linguistics. 2003.

[11] D. M. Philipp Koehn, Franz Josef Och, “Statistical Phrase-Based Translation,” DARPA IAO Machine Translation Workshop. Santa Monica, CA, 2002.

[12] H. H. A. B. Philipp Koehn, “Moses: Open Source Toolkit for Statistical Machine Translation,” Proceedings ofthe ACL 2007. Association for Computational Linguistics, Prague, pp. 177–180, 2007, doi: 10.5539/ijel.v5n3p143.

[13] Phan Thị Hà, “Nghiên cứu việc xây dựng, chuẩn hóa và khai thác kho ngữ liệu từ nguồn Internet cho xử lý tiếng Việt.” Luận án Tiến sĩ kỹ thuật Ngành Hệ thống thơng tin, Học viện cơng nghệ Bưu chính Viễn thơng, 2013.

136

XII, no. 1. p. 25, 2007, doi: 10.3917/rfla.121.0025.

[15] L. N. M. Đinh Điền, “Ứng dụng Ngữ liệu Song ngữ Anh-Việt trong Giảng dạy Ngôn ngữ,” in Hội thảo Liên ngành NNH Ứng dụng & Giảng dạy

Ngôn ngữ, 2015, pp. 559–567.

[16] P. Koehn, “Europarl: A Parallel Corpus for Statistical Machine Translation,” in Proc. of the 10th Machine Translation Summit, 2005, pp. 79– 86, doi: 10.5209/DIDA.19853.

[17] J. B. Carroll, “An Experiment in Evaluating the Quality of Translations,” Mechanical Translation and Computational Linguistics, vol. 9, no. 3–4. pp. 67–75, 1966.

[18] J. S. Chris Callison-Burch, Cameron Fordyce, Philipp Koehn, Christof Monz, “(Meta-) Evaluation of Machine Translation,” in Proceedings

ofthe Second Workshop on Statistical Machine Translation, 2007, pp. 136–

158.

[19] M. Przybocki, K. Peterson, S. Bronsart, and G. Sanders, “The NIST 2008 Metrics for machine translation challenge—overview, methodology, metrics, and results,” Mach. Transl., vol. 23, no. 2–3, pp. 71–103, Sep. 2009, doi: 10.1007/s10590-009-9065-6.

[20] and I. D. M. Joseph P. Turian, Luke Shen, “Evaluation of Machine Translation and its Evaluation,” Proceedings of the International Conference

& Workshop on Emerging Trends in Technology - ICWET ’11. ACM Press,

New York, New York, USA, 2011, doi: 10.1145/1980022.1980409.

[21] M. Snover, B. Dorr, R. Schwartz, L. Micciulla, and J. Makhoul, “A study of translation edit rate with targeted human annotation,” AMTA2006 -

Proceedings of the 7th Conference of the Association for Machine Translation of the Americas: Visions for the Future of MT. pp. 223–231, 2006.

[22] D. Gates et al., “End-to-end evaluation in JANUS: A speech-to-speech translation system,” in Lecture Notes in Computer Science (including subseries

Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics),

1997, vol. 1236, pp. 195–206, doi: 10.1007/3-540-63175-5_47.

[23] R. Nübel, “End-to-End evaluation in VERBMOBIL I,” in

Proceedings of MT Summit VI, 1997, pp. 232–239.

[24] J. S. White and T. A. O’Connell, “Evaluation in the ARPA machine translation program,” Human Language Technology: Proceedings of a Workshop

held at Plainsboro, New Jersey. 1994, doi: 10.3115/1075812.1075840.

[25] M. Denkowski and A. Lavie, “Choosing the right evaluation for machine translation: An examination of annotator and automatic metric performance on human judgment tasks,” AMTA 2010 - 9th Conference of the

137

Meeting of the Association for Computational Linguistics. pp. 160–167, 2003.

[27] K.-Y. Su, M.-W. Wu, and J.-S. Chang, “A new quantitative quality measure for machine translation systems.” p. 433, 1992, doi: 10.3115/992133.992137.

[28] V. I. Levenshtein, “Binary codes capable of correcting deletions, insertions, and reversals,” Soviet physics doklady, vol. 10, no. 8. pp. 707–710, 1966.

[29] S. Nießen, F. J. Och, G. Leusch, and H. Ney, “An evaluation tool for machine translation: Fast evaluation for MT research,” 2nd International

Conference on Language Resources and Evaluation, LREC 2000. 2000.

[30] H. S. C. Tillmann, S. Vogel, H. Ney, A. Zubiaga, “Accelerated Dp Based Search For Statistical Translation,” Fifth European Conference on

Speech Communication and Technology. 1997.

[31] W.-J. Z. Kishore Papineni, Salim Roukos, Todd Ward, “BLEU: a Method for Automatic Evaluation of Machine Translation,” in Proceedings of the

40th Annual Meeting of the Association for Computational Linguistics (ACL),

2002,

pp. 311–318, doi: 10.1002/andp.19223712302.

[32] E. Hovy, “Toward Finely Differentiated Evaluation Metrics for Machine Translation,” Proceedings of the EAGLES Workshop on Standards

and Evaluation. pp. 127–133, 1999.

[33] A. Popescu-Belis, “An experiment in comparative evaluation: human vs. computers,” MT Summit IX. pp. 307–314, 2003.

[34] G. N. Ramaswamy, J. Navrátil, U. V. Chaudhari, and R. D. Zilca, “The IBM system for the NIST-2002 cellular speaker verification evaluation,”

ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings, vol. 2. pp. 61–64, 2003, doi:

10.1109/icassp.2003.1202294.

[35] V. T. Hùng, “Phương pháp và công cụ đánh giá tự động các hệ thống dịch tự

động trên mạng,” Tạp chí Khoa học và Cơng nghệ Đại học Đà Nẵng, vol. 1(18),

pp. 37–42, 2007.

[36] H. V. Tran, T. H. Vu, T. T. Le, P. L. Nghia, and V. V. Nguyen, “The English-Vietnamese Machine Translation System for IWSLT 2015,”

Proceeding of the 12th International Workshop on Spoken Language Translation. 2015.

[37] M. Luong and C. D. Manning, “Stanford Neural Machine Translation Systems for Spoken Language Domains,” Proceedings of the

Conference of the European Association for MT, EAMT2016. pp. 190–202,

2016.

[39] Dinh Dien, “Building an annotated English-Vietnamese parallel corpus,” MKS A J. Southeast Asian Linguist. Lang., vol. 35, pp. 21–36, 2005.

138

[40] T.-N.-D. Do, V.-B. Le, B. Bigi, L. Besacier, and E. Castelli, “Mining a comparable text corpus for a Vietnamese - French statistical machine translation system.” p. 165, 2009, doi: 10.3115/1626431.1626466.

[41] L. T. H. Dương Minh Hùng, Lê Mạnh Thạnh, “Một phương pháp xây dựng ngữ liệu song ngữ Anh-Việt từ nguồn tài nguyên internet,” in Kỷ

yếu Hội nghị KHCN Quốc gia lần thứ XII về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR), Oct. 2019, pp. 315–321, doi:

10.15625/vap.2019.00040.

[42] N. T. Hà, N. T. M. Huyền, and N. M. Hải, “Xây dựng kho ngữ liệu du lịch song ngữ Việt–Anh gióng hàng mức câu cho dịch máy,” Res. Dev. Inf.

Commun. Technol., Jul. 2018, doi: 10.32913/rd-ict.vol1.no39.550.

[43] P. N. Luân, N. V. Vinh, and N. H. Hồng, “Thích ứng miền trong dịch máy nơ ron cho cặp ngôn ngữ Anh-Việt,” Kỷ yếu Hội nghị Quốc gia lần

thứ XII về Nghiên cứu cơ bản và ứng dụng Công Nghệ thông tin (FAIR).

Publishing House for Science and Technology, Huế, Oct. 28, 2019, doi: 10.15625/vap.2019.00056.

[44] T. B. Ho, N. K. Pham, T. L. Ha, and P. T. Nguyen, “Issues and First Phase Development of the English-Vietnamese Translation System EVSMT1.0,” Special Issue in Journal of Science, Natural Sciences and

Technology. pp. 59– 66, 2008.

[45] L. K. Hung, “One method of interlingual translation,” National

Conference on IT Research, Development and Applications CNTT&TT. 2003.

[46] M. Alez, J. Us Giménez, and L. Arquez, “A Graphical Interface for MT Evaluation and Error Analysis,” Jeju, Republic of Korea. Association for Computational Linguistics, pp. 139–144, 2012.

[47] B. Chen and C. Cherry, “A Systematic Comparison of Smoothing Techniques for Sentence-Level BLEU,” in Association for Computational

Linguistics (ACL), 2015, pp. 362–367, doi: 10.3115/v1/w14-3346.

[48] C.-P. Huynh, “Des suites de test pour la TA à un système d’exploitation de corpus alignés de documents et métadocuments multilingues, multiannotés et multimédia.” Institut National Polytechnique de Grenoble - INPG, p. 226, 2010.

[49] D. M. Dragos Stefan Munteanu, “Extracting parallel sub-sentential fragments from non-parallel corpora,” in Proceedings of the 21st

International Conference on Computational Linguistics and 44th Annual Meeting of the ACL, 2006, pp. 81–88.

[50] C. P. Huynh, “New approach for collecting high quality parallel corpora from multilingual websites,” ACM International Conference

139

dịch tự động.” Đề tài nghiên cứu khoa học cấp Đại học Đà Nẵng, 2012.

[52] C. B. Hervé Blanchon, “Pour l évaluation externe des systèmes de TA par des méthodes fondées sur la tâche.pdf.” .

[53] H.C. Pháp, Đ.Đ. Thọ, “Mở rộng kho ngữ liệu theo hướng ngữ nghĩa,” Hội thảo CNTT và ứng dụng trong các lĩnh vực, Lần thứ 2. Đà Nẵng, 2013.

[54] Đ. Đ. T. Huỳnh Cơng Pháp, “Giải pháp chuẩn hóa các kho ngữ liệu dùng trong lĩnh vực dịch tự động,” Tạp chí Khoa học và Công nghệ Đại học

Đà Nẵng, vol. 9(58).2012, pp. 111–117, 2012.

[55] and C.-Y. O. Van-Hai Vu, Quang-Phuoc Nguyen, Pum-Mo Ryu, “Effect of Named Entity Recognition on English-Vietnamese Neural Machine Translation,” Int. J. Mach. Learn. Comput., vol. 12, no. 2, pp. 51–55, 2021, doi: 10.18178/ijmlc.2022.12.2.1078.

[56] T. Mikolov, “Distributed Representations of Words and Phrases and their Compositionality,” NIPS Deep Learning Workshop. pp. 1–31, 2013.

[57] D. Bahdanau, K. H. Cho, and Y. Bengio, “Neural machine translation by jointly learning to align and translate,” 3rd International

Conference on Learning Representations, ICLR 2015 - Conference Track Proceedings. 2015.

[58] Q. Le Oriol Vinyals, “A Neural Conversational Model,” in The 31st

International Conference on Machine Learning, 2015, pp. 233–239.

[59] O. V. Wojciech Zaremba, Ilya Sutskever, “Recurrent Neural Network Regularization,” ICLR 2015 : International Conference on Learning

Representations 2015. 2015, doi: 10.1111/j.1745-3984.1987.tb00286.x.

[60] Z. Li, J. Cai, S. He, and H. Zhao, “Seq2seq Dependency Parsing,”

Proceedings of the 27th International Conference on Computational Linguistics, no. 15. pp. 3203–3214, 2018.

[61] Z. Yang, Z. Hu, Y. Deng, C. Dyer, and A. Smola, “Neural Machine Translation with Recurrent Attention Modeling,” in Proceedings of the 15th

Conference of the European Chapter of the Association for Computational Linguistics: Volume 2, Short Papers, 2017, pp. 383–387, doi: 10.18653/v1/E17-

2061.

[62] Y. Wu et al., “Google’s Neural Machine Translation System: Bridging the Gap between Human and Machine Translation,”

https://arxiv.org/abs/ 1609.08144v2, Sep. 2016.

[63] J. D. Tomas Mikolov, Kai Chen, Greg Corrado, “Efficient Estimation ofWord Representations in Vector Space.” 2013, [Online]. Available: https://arxiv.org/abs/1301.3781.

Conference of the European Association for M. Translation, EAMT 2017. p. 22,

Một phần của tài liệu Nghiên cứu giải pháp cải tiến chất lượng dịch tự động tiếng việt (Trang 136 - 150)

Tải bản đầy đủ (DOCX)

(150 trang)
w