Kết quả thử nghiệm sử dụng phương pháp lai (Hybird)

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu một phương pháp phi giám sát phát hiện cảm xúc trong văn bản 10 (Trang 50 - 57)

3.2 .Một số kết quả thử nghiệm

3.10 Kết quả thử nghiệm sử dụng phương pháp lai (Hybird)

Khó có thể so sánh các kết quả với nhau, do các tác giả không sử dụng cùng bộ dữ liệu khi tiến hành thực nghiệm, số lượng khái niệm cảm xúc,... Tuy nhiên, có thể nhận thấy rằng các phương pháp phi giám sát cho kết quả chưa thực sự cao. Đối với tiếng Việt, do chưa có nguồn dữ liệu hỗ trợ cho bài toán phát hiện cảm xúc trong văn bản được cơng bố nên khó tiếp cận theo phương pháp học máy có giám sát hay phương pháp sử dụng từ vựng. Việc tìm hiểu các phương pháp khác, có thể áp dụng cho bài tốn phát hiện cảm xúc trong văn bản tiếng Việt và nâng cao độ chính xác của kết quả là hướng nghiên cứu trong tương lai của tác giả. Có thể thấy được kết quả của phương pháp lai giữa phương pháp học máy và phương pháp sử dụng từ vựng cho độ chính xác khá cao. Đây cũng là hướng nghiên cứu và phát triển tiếp của luận văn nhằm tìm ra phương pháp cho bài tốn phát hiện cảm xúc trong văn bản tiếng Việt đạt độ chính xác cao hơn.

Kết luận

Luận văn đã trình bày tổng quát về vấn đề phát hiện cảm xúc trong văn bản, trong đó đi sâu vào phương pháp phi giám sát cho bài toán phát hiện cảm xúc trong văn bản.

Hai phương pháp phi giám sát được trình bày là: phương pháp sử dụng mơ hình khơng gian véc-tơ và phương pháp sử dụng ngữ nghĩa và cú pháp phụ thuộc cho bài toán phát hiện cảm xúc trong văn bản.

Thực nghiệm phát hiện cảm xúc trong văn bản tiếng Việt. Việc tiến hành thử nghiệm gặp nhiều vấn đề do chưa có dữ liệu tiếng Việt được gán nhãn cảm xúc hay từ điển cảm xúc cho tiếng Việt vì vậy tác giả cùng cộng sự đã đi xây dựng dữ liệu để tiến hành thử nghiệm.

Trong tương lai, tác giả sẽ tiếp tục tìm hiểu về phương pháp phi giám sát và phương pháp lai giữa phương pháp học máy và phương pháp sử dụng từ vựng để tìm ra mơ hình với độ chính xác cao hơn. Thêm vào đó, tác giả cũng sẽ tìm hiểu về các độ đo khác như Word2Vec, đồng thời sử dụng thêm một số cú pháp phụ thuộc, với mục đích nâng cao độ chính xác cho mơ hình, từ đó có cơng cụ xây dựng kho ngữ liệu cảm xúc cho tiếng Việt.

Tài liệu tham khảo Tài liệu tiếng Việt

[1] Hứa Thị An, Nguyễn Thị Minh Huyền, Ngô Thế Quyền. Ứng dụng một phương pháp phi giám sát xác định cảm xúc trong văn bản tiếng Việt. Kỷ yếu Hội thảo quốc gia lần thứ XVII: Một số vấn đề chọn lọc của Công nghệ thông tin và Truyền thông 2014. Tây Nguyên. Trang 390 - 395.

Tài liệu tiếng Anh

[2] Ameeta Agrawal and Aijun An. 2012. Unsupervised Emotion Detection from Text Using Semantic and Syntactic Relations. In Proceedings of the The 2012 IEEE/WIC/ACM International Joint Conferences on Web Intel- ligence and Intelligent Agent Technology - Volume 01 (WI-IAT ’12), Vol. 1. IEEE Computer Society, Washington, DC, USA, 346-353.

[3] Alexandra Balahur, Jesús M. Hermida, and AndrésMontoyo. 2011. De- tecting Implicit Expressions ofSentiment in Text Based on Commonsense Knowledge. In 2nd Workshop on Computational Approaches to Subjectiv- ity and Sentiment Analysis, ACL-HLT 2011, pages 53–60.

[4] Alm, C. O., Roth, D., & Sproat, R. (2005). Emotions from text: Machine learning for text-based emotion prediction. Paper presented at the Pro- ceedings of Human Language Technology Conference and Conference on Empirical Methods in Natural Language Processing, Vancouver.

[5] Clore, G.L., Ortony, A., and Foss, M.A. (1987). “The psychological foun- dations of the affective lexicon”. Journal of Personality and Social Psy- chology, Vol. 53, pages 751–766.

[6] C Strapparava, R Mihalcea. Learning to identify emotions in text. Pro- ceedings of the 2008 ACM symposium on Applied computing, 1556-1560

[7] Dave, K., Lawrence, S., & Pennock, D. M. (2003). Mining the peanut gallery: Opinion extraction and semantic classification of product reviews. Paper presented at the Proceedings of the 12th international conference on World Wide Web.

[8] Desmond C. Ong, Wen Hao Lui. Building an Emotional Relation Extrac- tion Tool. CS 224N Project. Stanford

[9] D’Mello, S., Picard, R. W., & Graesser, A. (2007). Toward an Affect- Sensitive AutoTutor. IEEE Intelligent Systems, 22(4), 53-61.

[10] Ekman, P. (1992). An argument for basic emotions. Cognition Emotion, 6(3), 169-200.

[11] Gievska, S.; Koroveshovski, K.; Chavdarova, T., A Hybrid Approach for Emotion Detection in Support of Affective Interaction, in Data Mining Workshop (ICDMW), 2014 IEEE International Conference on 14-14 Dec. 2014. pp.352-359.

[12] Kao, E.C.-C.; Chun-Chieh Liu; Ting-Hao Yang; Chang-Tai Hsieh; Von- Wun Soo, Towards Text-based Emotion Detection A Survey and Possible Improvements, in Information Management and Engineering, 2009. ICIME ’09. International Conference on , vol., no., pp.70-74, 3-5 April 2009.

[13] Kim, S. M., & Calvo, R. A. (2010). Sentiment Analysis in Student Experi- ences of Learning. Paper presented at the the 3rd International Conference on Educational Data Mining, Pittsburgh, USA.

[14] Kim, S.-M., & Hovy, E. (2004). Determining the sentiment of opinions. Paper presented at the Proceedings of the 20th international conference on Computational Linguistics, Geneva, Switzerland.

[15] Li, Y., Bontcheva, K., & Cunningham, H. (2007). Experiments of Opinion Analysis on the Corpora MPQA and NTCIR-6. Paper presented at the

Proceedings of the 6th NTCIR Workshop Meeting on Evaluation of Infor- mation Access Technologies: Information Retrieval, Question Answering, and Cross-Lingual Information Access, Tokyo, Japan.

[16] Liu, H., Lieberman, H., & Selker, T. (2003b). A model of textual affect sensing using real-world knowledge. Paper presented at the the 8th inter- national conference on Intelligent user interfaces, Miami, Florida, USA

[17] Mehrabian, A. (1995). Framework for a comprehensive description and measurement of emotional states. Genetic, Social, and General Psychology Monographs, 121, pages 339-361.

[18] Russell, J. A. (1979). “Affective space is bipolar”. Journal of Personality and Social Psychology, 37(3), 345-356.

[19] Russell, J. A. (1980). “A circumplex model of affect”.Journal of Personality and Social Psychology, 39(6), 1161-1178.

[20] Russell, J. A., Lewicka, M., & Niit, T. (1989). “A Cross-Cultural Study of a Circumplex Model of Affect”. Journal of Personality and Social Psychol- ogy, 57(5), 848-856.

[21] Strapparava, C., Valitutti, A. and Stock, O. (2006). The affective weight of lexicon. In Proceedings of the Fifth International Conference on Language Resources and Evaluation (LREC 2006), pages 423–426, Genoa, Italy.

[22] Schlosberg, H. (1952). “The description of facial expressions in terms of two dimensions”. Journal of Experimental Psychology, 44, pages 229-237. [23] Watson, D. and Tellegen, A. (1985). “Towards a consensual structure of

mood”. Psychological Bulletin, 98, pages 219-235.

[24] Valentina Sintsova, Claudiu Musat, Pearl Pu. Semi-Supervised Method for Multi-Category Emotion Recognition in Tweets. IEEE International Con- ference on Data Mining Workshop. 2014.

[25] Xuren Wang and Qiuhui Zheng. 2013. Text Emotion Classification Re- search Based on Improved Latent Semantic Analysis Algorithm. In Pro- ceedings of the 2nd International Conference on Computer Science and Electronics Engineering (ICCSEE 2013), number Iccsee, pages 210–213, Paris, France. Atlantis Press.

Phụ lục

Vietnamese treebank

VietTreeBank là kho dữ liệu tiếng Việt được xây dựng từ đề tài nhà nước “Nghiên cứu phát triển một số sản phẩm thiết yếu về xử lý tiếng nói và văn bản tiếng Việt”, mã số KC01.01/06-10. VietTreeBank có hơn 10.000 câu tiếng Việt đã được tách từ, gán nhãn từ loại, gán nhãn cú pháp và được định dạng cấu trúc sử dụng ngoặc.

Ví dụ một câu trong VietTreeBank: (S (NP-SUB (N-H Dịch_vụ) (PP (E-H của) (NP (P-H họ)))) (VP (T chính) (V-H là) (NP-DOB (N-H khâu) (A trung_gian) (VP (V-H đảm_bảo) (PP (E-H cho) (NP (L những) (N-H niềm) (A vui) (P ấy)) (VP (V-H được) (AP (A-H trọn_vẹn))))))) (. .))

Bảng 3.11 liệt kê các nhãn từ loại trong VietTreeBank.

STT Tên Chú thích STT Tên Chú thích

1 N Danh từ 10 R Phụ từ

2 Np Danh từ riêng 11 E Giới từ

3 Nc Danh từ chỉ loại 12 C Liên từ

4 Nu Danh từ đơn vị 13 I Thán từ

5 V Động từ 14 T Trợ từ, tiểu từ, từ tình thái

6 A Tính từ 15 U Từ đơn lẻ

7 P Đại từ 16 Y Từ viết tắt

8 L Định từ 17 X Các từ không phân loại được

9 M Số từ

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu một phương pháp phi giám sát phát hiện cảm xúc trong văn bản 10 (Trang 50 - 57)

Tải bản đầy đủ (PDF)

(61 trang)