Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 84 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
84
Dung lượng
2,76 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC QUY NHƠN VÕ LÊ MINH lu an n va XÂY DỰNG MƠ HÌNH PHÂN TÍCH CẢM XÚC tn to NGƢỜI DÙNG ĐÁNH GIÁ SẢN PHẨM BẰNG p ie gh PHƢƠNG PHÁP PHÂN TÍCH TỪ VỰNG d oa nl w KẾT HỢP VỚI HỌC MÁY Chuyên ngành: Khoa học máy tính lu nf va an Mã số: 8480101 z at nh oi lm ul Ngƣời hƣớng dẫn : TS Hồ Văn Lâm z m co l gm @ an Lu n va ac th si LỜI CAM ĐOAN Tôi xin cam đoan đề tài “Xây dựng mơ hình phân tích cảm xúc người dùng đánh giá sản phẩm phương pháp phân tích từ vựng kết hợp với học máy” cơng trình nghiên cứu riêng tơi Các kết khảo sát, nghiên cứu Luận văn trung thực chƣa đƣợc công bố cơng trình khác Bình Định, ngày 08 tháng 11 năm 2021 lu an Tác giả n va p ie gh tn to d oa nl w nf va an lu z at nh oi lm ul z m co l gm @ an Lu n va ac th si LỜI CẢM ƠN Để hoàn thành luận văn này, xin chân thành xin gửi lời cảm ơn chân thành đến quý thầy cô trƣờng Đại học Quy Nhơn, bạn bè trƣờng,… bảo, quan tâm, giúp đỡ tận tình suốt q trình thực đề tài Nhờ tơi có thêm nhiều kinh nghiệm để xử lý khó khăn gặp phải hồn thành tốt đề tài Tôi xin gửi đến lời cám ơn sâu sắc đến Tiến sĩ Hồ Văn Lâm lu trực tiếp hƣớng dẫn, định hƣớng chuyên môn, quan tâm giúp đỡ tận tình an Trong thời gian làm luận văn, tơi có trải nghiệm bổ ích Tơi n va tạo điều kiện thuận lợi trình thực luận văn tn to gh đƣợc học tập, tìm hiểu nhiều kiến thức mẻ Hơn hết, đƣợc tiếp cận p ie với thành tựu nghiên cứu liên quan đến đề tài nƣớc w Đồng thời, đƣợc hƣớng dẫn tận tình cách làm việc chuyên nghiệp oa nl ngƣời hƣớng dẫn – TS Hồ Văn Lâm, tơi tích lũy đƣợc nhiều kinh nghiệm d cho thân, phục vụ cho công việc đề tài nghiên cứu sau lu an Mặc dù cố gắng nỗ lực để hoàn thành tốt luận văn mình, nf va nhƣng khó tránh khỏi sai sót, mong nhận đƣợc góp ý bảo quý lm ul Thầy, Cô để đề tài đƣợc tốt z at nh oi Lời cuối cùng, tơi muốn nói cảm ơn tất ngƣời, ngƣời giúp cho tơi có đƣợc ngày hơm z Sinh viên thực m co l gm @ Bình Định, ngày 08 tháng 11 năm 2021 an Lu Võ Lê Minh n va ac th si MỤC LỤC LỜI CAM ĐOAN LỜI CẢM ƠN DANH MỤC CÁC CHỮ VIẾT TẮT DANH MỤC CÁC BẢNG DANH MỤC CÁC HÌNH TĨM TẮT lu MỞ ĐẦU an Chƣơng TỔNG QUAN VỀ ĐỀ TÀI va n 1.1 Tổng quan đề tài to 1.1.2 Mục tiêu đề tài ie gh tn 1.1.1 Phát biểu toán p 1.1.3 Mơ hình tổng quan nl w 1.2 Tổng quan tình hình nghiên cứu nƣớc giới 10 d oa 1.2.1 Trong nƣớc 10 an lu 1.2.2 Nƣớc 11 nf va 1.3 Bố cục luận văn 13 Chƣơng CƠ SỞ LÝ THUYẾT 14 lm ul 2.1 Bộ từ điển cảm xúc SO-CAL tiếng Anh 14 z at nh oi 2.2 Phƣơng pháp phân loại chủ quan 18 2.2.1 Câu có từ hàm chứa cảm xúc 18 z 2.2.2 Các trƣờng hợp ngoại lệ 18 @ gm 2.3 Phƣơng pháp phân loại cảm xúc 20 l 2.3.1 Giá trị cảm xúc câu phụ thuộc vào từ hàm chứa cảm xúc 20 m co 2.3.2 Giá trị cảm xúc câu phụ thuộc vào từ tăng cƣờng 21 an Lu 2.3.3 Giá trị cảm xúc câu phụ thuộc vào từ phủ định 22 2.3.4 Giá trị cảm xúc câu phụ thuộc vào từ khiếm khuyết 22 n va ac th si 2.3.5 Giá trị cảm xúc câu có xu hƣớng tích cực 23 2.4 Phƣơng pháp phân lớp Support Vector Machine (SVM) 23 2.4.1 Ý tƣởng 24 2.4.2 Cơ sở lý thuyết 26 Chƣơng XÂY DỰNG HỆ THỐNG THỬ NGHIỆM 29 3.1 Giới thiệu 29 3.2 Bộ từ điển cảm xúc SO-CAL tiếng Việt 30 3.3 Thu thập liệu 35 3.4 Tiền xử lý liệu rút trích đặc trƣng 39 lu an 3.5 Bộ liệu huấn luyện 41 va n 3.5.1 Gán nhãn câu tay 41 3.6 Phƣơng pháp phân loại chủ quan 44 gh tn to 3.5.2 Mô tả liệu huấn luyện 43 p ie 3.7 Phƣơng pháp phân loại cảm xúc 47 w 3.8 Giao diện hệ thống thực nghiệm 55 oa nl Chƣơng KẾT QUẢ THỬ NGHIỆM 58 d 4.1 Bộ liệu thử nghiệm 58 lu nf va an 4.2 Kết đánh giá phƣơng pháp phân loại chủ quan 59 4.3 Kết đánh giá phƣơng pháp phân loại cảm xúc 59 lm ul 4.4 Kết phân tích bình luận khách tham quan trung tâm khám z at nh oi phá khoa học 59 Chƣơng KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN 61 5.1 Kết đạt đƣợc 61 z DANH MỤC TÀI LIỆU THAM KHẢO co l PHỤ LỤC gm @ 5.2 Hƣớng phát triển 61 m QUYẾT ĐỊNH GIAO ĐỀ TÀI LUẬN VĂN THẠC SĨ(BẢN SAO) an Lu n va ac th si DANH MỤC CÁC CHỮ VIẾT TẮT AAC (Adverb-Adjective Combinations) API (Application Programming Interface) cURL (Client for Uniform Resource Locator) HTTP (The Hypertext Transfer Protocol) ID (Identification) TS (Tiến sĩ) lu an SO (Semantic Orientation) n va SO-CAL (the Semantic Orientation CALculator) tn to SRM (Structural Risk Minimization) STT (Số thứ tự) p ie gh SVM (Support Vector Machines) w url lib (Uniform Resource Locator Library) oa nl VC (Vapnik-Chervonenkis) d Wifi (Wireless Fidelity) nf va an lu z at nh oi lm ul z m co l gm @ an Lu n va ac th si DANH MỤC BẢNG Bảng 2-1 Một số từ tăng cƣờng 15 Bảng 2-2 Bảng so sánh hiệu suất từ điển khác với từ điển SO-CAL 17 Bảng 3-1 Một số từ từ điển danh từ 33 Bảng 3-2 Một số từ từ điển động từ 33 Bảng 3-3 Một số từ từ điển tính từ 34 lu Bảng 3-4 Một số từ từ điển trạng từ 34 an n va Bảng 3-5 Một số từ từ điển từ tăng cƣờng 34 tn to Bảng 3-6 Kết phân loại chủ quan tay 44 gh Bảng 3-7 Kết phân loại cảm xúc tay 44 p ie Bảng 4-1 Kết liệu thử nghiệm 59 w Bảng 4-2 Kết đánh giá độ xác phƣơng pháp phân loại chủ quan 59 d oa nl Bảng 4-3 Kết đánh giá độ xác phƣơng pháp phân loại cảm xúc 59 nf va an lu z at nh oi lm ul z m co l gm @ an Lu n va ac th si DANH MỤC HÌNH VẼ Hình 1-1 Mơ hình tổng quan hệ thống phân tích cảm xúc dựa vào bình luận mạng xã hội Hình 3-1 Mơ hình hệ thống thực nghiệm 29 Hình 3-2 Mơ hình Graph API 35 Hình 3-3 Ví dụ liệu thô chƣa xử lý 37 Hình 3-4 Những bình luận trang VnExpress.net mạng xã hội lu Facebook 38 an Facebook Graph API 38 n va Hình 3-5 Nội dung bình luận đƣợc lấy thơng qua thƣ viện gh tn to Hình 3-6 Ví dụ liệu dạng mã UNICODETH 39 p ie Hình 3-7 Ví dụ liệu sau chuyển mã 39 Hình 3-8 Giao diện đánh giá độ xác liệu thử nghiệm 55 oa nl w Hình 3-9 Giao diện phân loại cảm xúc, đánh giá mức độ quan tâm d ngƣời dùng 56 lu an Hình 3-10 Giao diện thu thập liệu 56 nf va Hình 3-11 Giao diện hình bắt đầu 57 z at nh oi lm ul Hình 3-12 Giao diện hiển thị từ điển 57 z m co l gm @ an Lu n va ac th si TÓM TẮT Mạng internet cơng cụ giúp ngƣời kết nối với dễ dàng thông qua những chia sẻ, thơng điệp, bình luận hay ý kiến cá nhân tất vật, việc diễn ngày Từ đó, ngƣời có nhìn tổng quan, thông tin cần thiết hỗ trợ việc đánh giá đƣa định vấn đề diễn sống Điều không phƣơng diện cá nhân mà đƣợc tổ chức sử dụng rộng rãi Việc thu thập, tổng hợp phân tích bình luận làm theo lu phƣơng pháp thủ công tốn nhiều thời gian nhƣ chi phí để thực an Nếu có hệ thống tự động xử lý, phân loại chúng dựa cảm xúc va n ngƣời dùng giúp tiết kiệm nhiều mặt to gh tn Đã có nhiều ài áo, cơng trình nghiên cứu có liên quan đến đề tài ie nhƣng hầu hết chúng đƣợc sử dụng cho tiếng Anh Hầu hết cơng trình p thu đƣợc nhiều kết khả quan Tuy nhiên, báo cơng trình nghiên oa nl w cứu tƣơng tự tiếng Việt hạn chế Hiện nay, với phát triển mạnh mẽ truyền thông mạng xã hội nhu cầu thu thập ý kiến d an lu vật, việc diễn xung quanh chúng ta, hƣớng nghiên cứu dần đƣợc nf va ý nhiều Việt Nam lm ul Trong khoá luận này, nghiên cứu lý thuyết, giải thuật giúp phân z at nh oi loại cảm xúc tìm hiểu đặc tính ản văn phạm tiếng Việt Từ xây dựng mơ hình phân tích cảm xúc tiếng Việt áp dụng trực tiếp bình luận mạng xã hội Ngồi tơi cịn sử dụng số kỹ thuật xử lý z @ ngơn ngữ tự nhiên hỗ trợ cho việc phân tích liệu hiệu nhanh chóng l gm Cuối cùng, tổng hợp kết đạt đƣợc đƣa đánh giá Sau đó, đề hƣớng phát triển đề tài tƣơng lai m co mơ hình phân tích cảm xúc tiếng Việt dựa vào bình luận ngƣời dùng an Lu n va ac th si MỞ ĐẦU Với phát triển mạnh mẽ mạng Internet cộng với bùng nổ thơng tin tồn cầu, mạng xã hội đƣợc sử dụng rộng rãi dần trở thành phần thiếu sống ngƣời đặc biệt giới trẻ - ngƣời quan tâm cập nhật tin tức thƣờng xuyên Những tin tức, bình luận, đánh giá nhiều lĩnh vực đƣợc chia sẻ nhanh chóng từ lúc việc diễn đƣợc lan truyền đến nơi lu Phân loại tâm lý, cảm xúc khai thác ý kiến, đánh giá sản phẩm hỗ an n va trợ cho việc nghiên cứu, phân tích cảm xúc, đánh giá thái độ ngƣời dùng vực đƣợc nghiên cứu rộng rãi khai thác liệu Big Data, đồng thời có ý gh tn to sản phẩm, chủ đề đƣợc chia sẻ Đây lĩnh p ie nghĩa quan trọng ngành khoa học xử lý ngôn ngữ tự nhiên Trong thực w tế, mức độ ảnh hƣởng ngày đƣợc coi trọng tỷ lệ thuận với oa nl bùng nổ thông tin mạng Internet d Chẳng hạn nhƣ muốn mua sản phẩm đó, muốn an lu biết tốt hay không? Những lời quảng cáo hoa mỹ nhà sản xuất chƣa đủ nf va thuyết phục, muốn nghe lời đánh giá chân thực từ lm ul ngƣời sử dụng có hiểu biết sản phẩm Hay tổ chức, z at nh oi số khô khan doanh thu sản phẩm khơng đủ để họ hài lịng Họ muốn biết đánh giá khách hàng ngƣời dùng sản phẩm họ Những khía cạnh tốt đƣợc trì, phát huy mặt xấu, không z gm @ tốt đƣợc họ cải thiện để dần hoàn thiện chất lƣợng sản phẩm mặt Từ lý này, lựa chọn đề tài: “Xây dựng mơ hình phân tích cảm l co xúc ngƣời dùng đánh giá sản phẩm phƣơng pháp phân tích từ vựng kết m hợp với máy học” nhằm phát triển phƣơng pháp nghiên cứu phân tích an Lu cảm xúc ngôn ngữ tiếng Việt dựa đặc trƣng nguồn liệu từ bình n va ac th si 61 Chƣơng 5.KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN 5.1 KẾT QUẢ ĐẠT ĐƢỢC Xuyên suốt trình thực hiện, đƣợc tiếp cận với nhiều nghiên cứu liên quan ngồi nƣớc Điều giúp cho hiểu đƣợc rộng hơn, sâu kỹ đề tài Tôi cố gắng xây dựng phƣơng pháp khả thi để phân tích cảm xúc ngôn ngữ tiếng Việt dựa vào đặc trƣng sử dụng ngôn từ ngƣời lu dùng mạng internet Tuy nhiên, với giới hạn luận văn tốt nghiệp an n va xây dựng đƣợc mơ hình phân loại cảm xúc có dựa vào phƣơng thức học tn to máy cách rập khuôn mà chƣa xét đến vấn đề xử lý ngơn ngữ tự Ngồi ra, việc dịch từ điển cảm xúc từ từ điển tiếng Anh độ p ie gh nhiên Đó giới hạn dễ thấy đề tài mà thực w xác khơng cao nhƣng với thời gian có hạn nên tơi thực oa nl mức độ d Mặc dù gặp nhiều khó khăn nhƣng với hƣớng dẫn tận tình lu nf va an ngƣời hƣớng dẫn – TS Hồ Văn Lâm chia sẻ chân thành cử nhân Nguyễn Thành Lƣu, đạt đƣợc kết khả quan lm ul mong đợi an đầu Với kết này, hy vọng phát triển đề tài lên z at nh oi mức cao áp dụng vào thực tiễn sống nhƣ đóng góp vào nghiên cứu khoa học khác có liên quan 5.2 HƢỚNG PHÁT TRIỂN z gm @ Việc phát triển phƣơng pháp phân tích cảm xúc tiếng Việt, l đặc biệt liệu từ mạng xã hội vốn dạng liệu m co chuẩn tiếng Việt cịn cần nhiều cải tiến nhiều nghiên cứu khác: xây an Lu dựng từ điển cảm xúc đủ lớn độ xác cao, xây dựng liệu huấn luyện liệu thử nghiệm đạt chuẩn độ lớn độ xác, áp n va ac th si 62 dụng phƣơng pháp xử lý ngôn ngữ tự nhiên, phƣơng pháp chuẩn hóa liệu từ mạng xã hội, giải ài tốn ig data chƣơng trình thực thi liệu lớn, v.v… nhằm đạt đƣợc độ xác tốt hiệu hệ thống tốt khối lƣợng liệu lớn Đồng thời, đƣợc cải tiến nâng cấp hệ thống thực nghiệm, tơi hy vọng đề tài đƣợc áp dụng thực tiễn sống đóng góp cho nghiên cứu khác có liên quan Thiết thực việc đánh giá kiến khách hàng lĩnh vực kinh tế lu an n va p ie gh tn to d oa nl w nf va an lu z at nh oi lm ul z m co l gm @ an Lu n va ac th si 63 DANH MỤC TÀI LIỆU THAM KHẢO [1] Son Trinh, Luu Nguyen, Minh Vo, “Com ining Lexicon-Based and LearningBased Methods for Sentiment Analysis for Product Reviews in Vietnamese Language”, Computer and Information Science, 2018 [2] Son Trinh, Luu Nguyen, Minh Vo, Phuc Do, “Lexicon-Based Sentiment Analysis of Face ook Comments in Vietnamese Language”, Recent Developments in Intelligent Information and Database Systems, 2016 [3] Vo Ngoc Phu and Phan Thi Tuoi, “Sentiment classification using Enhanced lu an Contextual Valence Shifters”, Proceedings of International Conference n va on Asian Language Processing, Malaysia, 2014 tn to [4] Maite Taboada, Julian Brooke, Milan Tofiloski, Kimberly Voll and Manfred p ie gh Stede, “Lexicon-Based Methods for Sentiment Analysis”, Association for Computational Linguistics, 2011 w [5] Bing Liu, “Sentiment Analysis and Opinion Mining”, Morgan & Claypool oa nl Publishers, May 2012 d [6] Wie e, Janyce, Re ecca F Bruce, and Thomas P O'Hara, “Development and lu nf va an use of a gold-standard data set for subjective classifications”, Proceedings of the Association for Computational Linguistics (ACL- lm ul 1999), 1999 Using Subjective z at nh oi [7] Bo Pang and Lillian Lee, “A Sentimental Education: Sentiment Analysis Summarization Based on Minimum Cuts”, z Proceedings of ACL, pp 271 278, 2004 gm @ [8] Namrata God ole, Manjunath Srinivasaiah and Steven Skiena, “Large-Scale l Sentiment Analysis for News and Blogs”, ICWSM ’2007 Boulder, m co Colorado, USA [9] Rudy Pra owo and Mike Thelwall, “Sentiment Issue 2, Pages 143–157, April 2009 an Lu Analysis: A Combined Approach”, Journal of Informetrics Volume 3, n va ac th si 64 [10] Farah Benamara, Carmine Cesarano and Diego Reforgiato, “Sentiment Analysis: Adjectives and Adver s are etter than Adjectives Alone”, ICWSM ’2006 Boulder, CO USA, 2006 [11] A Go, L Huang, R Bhayani – Entropy, “Twitter Sentiment Analysis”, CS224N - Final Project Report, June 6, 2009 [12] Efthymios Kouloumpis, Theresa Wilson and Johanna Moore, “Twitter Sentiment Analysis: The Good the Bad and the OMG!”, Fifth International AAAI Conference on Weblogs and Social Media, 2011 lu [13] Thanh Ho, Duy Doan and Phuc Do, “Discovering Hot Topics On Social an Network Based On Improving The Aging Theory”, ACSIJ Advances in va n Computer Science: an International Journal, Vol 3, Issue 3, No.9 , May to gh tn 2014 p ie [14] Kennedy, Alistair and Diana Inkpen, “Sentiment classification of movie and product reviews using contextual valence shifters”, Computational nl w Intelligence, 2006 d oa [15] Mrutyunjaya Panda, Satchidananda Dehuri and Gi-Nam Wang, “Social an lu Networking Mining, Visualization, and Security”, Springer International nf va Publishing, Switzerland, 2014 lm ul [16] Nguyễn Ngọc Duy, “Luận văn thạc sĩ khoa học: Tóm tắt kiên sở Chí Minh, 2014 z at nh oi phân loại cảm xúc”, ngành Khoa học máy tính, Đại học Bách khóa Hồ TÀI LIỆU TRÊN MẠNG INTERNET z gm @ [17] Polarity Dataset, www.cs.cornell.edu/People/pabo/movie-review-data/ [18] VIETTIEN Dictionary for Mac, http://nguyenvietkhoa.edu.vn/?page_id=346 l co [19] Dictionaries for the Semantic Orientation CALculator, m https://github.com/DrOttensooser/BiblicalNLPworks/tree/master/SkyDrive/NLP/ an Lu CommonWorks/Data/Opion-Lexicon-English/SO-CAL, n va ac th si 65 [20] vnTokenizer, http://mim.hus.vnu.edu.vn/phuonglh/softwares/vnTokenizer [21] vnTagger, http://mim.hus.vnu.edu.vn/phuonglh/softwares/vnTagger [22]Epinions 1, https://www.sfu.ca/~mtaboada/research/SFU_Review_ Corpus.html, lu an n va p ie gh tn to d oa nl w nf va an lu z at nh oi lm ul z m co l gm @ an Lu n va ac th si Pl.1 PHỤ LỤC I Bộ từ điển cảm xúc SO-CAL tiếng Việt Một số từ từ điển từ loại Danh từ Động từ Tính từ Trạng từ n va vƣợt trội lộng lẫy cực điểm hoan hỉ xuất sắc xuất sắc kỳ quan thành đạt ật sáng chói thiên tài hân hoan ƣu việt thần kỳ công lao đăng quang thông minh tuyệt hảo cống hiến thắng sơi tích cực huy chƣơng tâm thuận lợi nhộn nhịp chiến công hợp tác tế nhị quán 2 cảm ơn tiếng phù hợp phúc lợi tốt nghiệp trẻ lôi 2 miễn phí tinh xảo khiêm tốn giúp đỡ sáng mãnh liệt -1 hợp l nhiệt tình -1 thích hợp tồi tệ -1 -2 yêu ớt -1 nặng nề -1 -2 mờ mịt -1 khó chịu -2 -2 tồi -2 ngu ngốc -2 -3 thô ỉ -3 thô thiển -3 -3 quanh co -3 tn to cảm phục ie an gh lu kiệt tác học p oa nl d ấn tƣợng w niềm tin an lu độc lập vận may hủy cô lập -1 đói kẻ cƣớp -1 chán nf va ác mộng -3 hối tiếc rác rƣởi -3 đánh -3 ngu m co l gm @ -2 ám sát z ạo lực z at nh oi lm ul uồn an Lu n va ac th si Pl.2 Một số từ từ điển từ tăng cƣờng lu an n va p ie gh tn to Giá trị -3 -2 -2 -2 -1.5 -1.5 -0.5 -0.5 -0.3 -0.3 -0.3 0.2 0.1 0.2 0.3 0.3 0.4 0.4 0.4 0.4 0.5 0.5 0.5 0.5 0.5 d oa nl w Từ tăng cường vài thấp vài hầu nhƣ chút phần tƣơng đối vừa phải chắn đáng kinh ngạc tuyệt khó tin q chừng đỗi vô khổng lồ nhiều phi thƣờng tuyệt đối nf va an lu z at nh oi lm ul z m co l gm Bộ liệu chủ đề giáo dục @ II Bộ liệu thử nghiệm an Lu n va ac th si Pl.3 Nội dung ý kiến Câu lu an n va ie gh tn to Con nhà ngƣời ta Trƣớc năm 75, miền Nam đa phần sinh viên du học trở quê Khách hƣơng làm việc quan Còn ngày nay, sinh viên du học không muốn quay đất nƣớc nhà ngƣời ta Học xong cố gắng ên cơng tác chúc em sau công dân Mỹ thành đạt Thật uồn cho Việt Nam Chủ Thật giỏi, khâm phục ạn quan Hy vọng đất nƣớc ta "chảy máu chất xám" cố lên phát triển nghiệp đổi cho nƣớc ngƣời ta nƣớc ngồi họ ln iết cách trọng dụng nhân tài p Câu d oa nl Tiêu cực w Nội dung ý kiến Thật uồn cho Việt Nam Quản l viết văn lủng củng Đọc ình luận mà uồn xấu trai Hãy học hay tốt điều mẻ ngƣời ta để phục vụ cho quê hƣơng ngƣời thơng minh u nƣớc em Chúc em bình an thành tài Ngƣỡng mộ Tự hào tiếng Việt Nam Hãy iết ơn đất nƣớc Việt Nam học thật giỏi để mang vinh quan cho đất nƣớc, cho Đảng em Ngƣỡng mộ em, cố gắng thành ngƣời có ích em Chúc em thành công Thật tự hào nhân tài đất Việt Chúc em bình an thành tài Chúc em học thành tài mai sau dựng xây đất nƣớc gọi nf va an lu z at nh oi lm ul z m co l gm @ Tích cực an Lu n va ac th si Pl.4 ngƣời có tài có tâm em Bộ liệu chủ đề phim ảnh Nội dung ý kiến Nguyễn Anh Tú hồi tao rạp để xem phim ln Ý kiến riêng tơi Khách Có ạn nghiện ản nhạc phim giống khơng? quan có đƣờng dẫn xem phim khơng? phim xem khoảng lần Thì " Anh Da Đen " từ mà ộ phim hay xem phim hay, xem khơng dƣới lần nhớ đến chi tiết, phim a out time Đây ộ phim tơi thích Đúng Kéo khỏi ngun tắc nên tình cảm tơi nảy sinh Nói thiệt em yêu giọng văn anh quản l trang Chủ quan Vừa lãng mạn vừa có chiều sâu đơi lại đáng yêu Với Driss anh không xem Phillip ngƣời tàn tật mà đối xử với ông nhƣ ngƣời ình thƣờng Cơng nhận hay thật Tơi thấy đƣợc ài học phim phải giữ cho khoẻ mạnh dù có khơng giàu nhƣng khoẻ đƣợc phim chƣa xem nên xem nghĩa Phim xem lại lần hay nhƣ lần đầu Câu Nội dung ý kiến Ban đầu tơi thấy uồn cƣời khó hiểu với tình cảm Nhƣng nói thật tạo hình u qi xấu Nội dung phim ổn nhƣng nhìn yêu quái chán Tiêu riết làm phim thua xa phim hồi xƣa xem cực Đồ hoạ phim tệ Phim tệ nghỉ nhân vật đọc lời thoại chậm thật khơng có mạch lạc Câu lu an n va p ie gh tn to d oa nl w nf va an lu z at nh oi lm ul z m co l gm @ an Lu n va ac th si Pl.5 lu an n va p ie gh tn to ộ phim hay xem phim hay, xem khơng dƣới lần nhớ đến chi tiết, phim a out time Đây ộ phim tơi thích Nói thiệt em u giọng văn anh quản l trang Vừa lãng mạn vừa có chiều sâu đơi lại đáng yêu Tích Với Driss anh k xem Phillip ngƣời tàn tật mà đối xử với ơng cực nhƣ ngƣời ình thƣờng Điều gắn kết họ với ằng tình ạn kẻ tìm cho ản thân lẽ sống ! Thích đoạn Thƣa ạn , ộ phim hay xem Tôi thấy đƣợc ài học phim phải ln giữ cho khoẻ mạnh dù có không giàu nhƣng khoẻ đƣợc Bộ liệu chủ đề thể thao d oa nl w Nội dung ý kiến ánh viên + công phƣợng = công viên Ngƣời đất Phong Điền Cần thơ câu đề văn quốc gia đƣợc Khách Truyền nhân Yết Kiêu quan Con gái môi trƣờng rèn luyện nhƣ Ánh Viên Trời tính cách nhà vơ địch, Ánh Viên cịn tiến xa xin chúc mừng Ánh Viên, chúc mừng Việt Nam Thay suốt ngày tập trung vào hot girl hot oy ca sĩ diễn viên suốt ngày trƣng "hàng" khoe tài sản, giới trẻ Việt Nam nên thần Chủ tƣợng ản lĩnh chí gái trẻ quan Viên đẹp từ tâm hồn em, khơng cần phải trang điểm điểm tô Yêu tự hào em Xem vận động viên thi đấu sƣớng thật Câu nf va an lu z at nh oi lm ul z m co l gm @ an Lu n va ac th si Pl.6 Họ rèn luyện, hi sinh nhiều thứ để tỏa sáng khoảnh khắc Chúc mừng Đại U Ánh Viên Bơi nhanh chẳng Thuỷ Thần Yết Kiêu Triệu Fan nƣớc mến yêu Chúc em gặt hái thật nhiều huy chƣơng Việt Nam tự hào em, Ánh Viên Nội dung ý kiến Câu lu an n va p ie gh tn to Tội chị Tiêu Nghĩ mà uồn cho số phận nhƣ cực Cái nghiệp ạc ẽo nghiệp thể thao Thƣơng xót tính cách nhà vơ địch, Ánh Viên tiến xa xin chúc mừng Ánh Viên, chúc mừng Việt Nam Thay suốt ngày tập trung vào hot girl hot oy ca sĩ diễn viên suốt ngày trƣng "hàng" khoe tài sản, giới trẻ Việt Nam nên thần tƣợng ản lĩnh chí gái trẻ Viên đẹp từ tâm hồn em, khơng cần phải makeup điểm tơ Tích u tự hào em cực Xem vận động viên thi đấu sƣớng thật Họ rèn luyện, hi sinh nhiều thứ để tỏa sáng khoảnh khắc Chúc mừng Đại U Ánh Viên Đây gƣơng để nỗ lực Mang lại vinh quang cho tổ quốc,cho gia đình Ánh Viên niềm tự hào dân tộc Thật yêu qu khâm phục chị! III Thử nghiệm phân tích liệu d oa nl w nf va an lu z at nh oi lm ul z gm @ Phân tích bình luận “Đề dài, sợ viết khơng kịp cảm thấy m co Tiền xử lý, cắt câu: l đề khơng khó Các sĩ tử làm nhỉ?” Các sĩ tử làm an Lu Đề dài, sợ viết khơng kịp cảm thấy đề khơng khó n va ac th si Pl.7 Gán nhãn: lu Đề dài , chỉ sợ viết không kịp chứ mình cảm thấy đề khơng khó lắm an n va p ie gh tn to d oa nl w nf va an lu Các sĩ tử làm bài như nào rồi nhỉ z l gm @ - Chủ quan: z at nh oi lm ul Rút đặc trƣng: m co Câu: “Đề dài, sợ viết không kịp cảm thấy đề khơng an Lu khó lắm” n va ac th si Pl.8 1:14.0 2:-2.0 3:-2.0 4:0.0 5:-1.0 6:-5.0 Trong đó: Đặc trƣng số tổng số từ câu có giá trị 14.0 câu có 14 từ Đặc trƣng số tổng giá trị cảm xúc tính từ có giá trị -2.0 câu có tính từ chứa cảm xúc “khó” (-2) Đặc trƣng số tổng giá trị cảm xúc trạng từ có giá trị -2.0 câu có trạng từ chứa cảm xúc “chỉ” (-2) lu Đặc trƣng số tổng giá trị cảm xúc danh từ có giá trị an va 0.0 câu khơng có danh từ chứa cảm xúc n Đặc trƣng số tổng giá trị cảm xúc động từ có giá trị to gh tn -1.0 câu có động từ chứa cảm xúc “sợ” (-1) p ie Đặc trƣng số tổng giá trị cảm xúc câu có giá trị (những trƣờng hợp ngoại lệ Do tổng giá trị cảm xúc câu oa nl w 5.0) Ta thấy, câu bình thƣờng khơng thuộc vào d tổng giá trị cảm xúc loại từ câu hay nói cách lu nf va an khác tổng giá trị đặc trƣng số 3, 4, cộng lại: (-2) + (-2) + (0) + (-1) = (-5) lm ul Câu: “Các sĩ tử làm nhỉ” Trong đó: z at nh oi 1:7.0 2:0.0 3:0.0 4:0.0 5:0.0 6:0.0 Đặc trƣng số có giá trị 7.0 câu có từ z gm @ Đặc trƣng số 2, 3, 4, có giá trị 0.0 câu khơng có l tính từ, trạng từ, danh từ hay động từ chứa cảm xúc m co Đặc trƣng số có giá trị 0.0 câu nghi vấn (vì có - Phân tích cảm xúc: an Lu cụm từ “nhƣ nào”) nên tổng giá trị cảm xúc câu n va ac th si Pl.9 Câu: “Đề dài, sợ viết khơng kịp cảm thấy đề khơng khó lắm” 1:-2.0 2:-2.0 3:0.0 4:-1.0 5:-5.0 6:-4.5 7:-1.0 8:-5.0 9:-7.5 10:-5.0 Trong đó: Các đặc trƣng số 1, 2, đƣợc kế thừa từ đặc trƣng số 3, 4, phần phân tích chủ quan Đặc trƣng số có giá trị tổng giá trị đặc trƣng 1, 2, cộng lại (-5.0) lu Đặc trƣng số giá trị cảm xúc câu sau hệ thống xét an va trƣờng hợp có từ tăng cƣờng Đặc trƣng số có giá trị -4.5 n câu có từ “chỉ” mang giá trị cảm xúc (-0.5) từ điển to gh tn từ tăng cƣờng từ “sợ” mang giá trị cảm xúc (-1) Do đó, giá p ie trị cảm xúc câu đƣợc tính nhƣ sau: (-2) + (-0.5)*(-1) + (- 1) + (-2) = (-4.5) oa nl w Đặc trƣng số giá trị cảm xúc câu xét đến trƣờng d hợp giá trị cảm xúc câu thay đổi câu có vế liên kết lu an với từ liên kết mang nghĩa phủ định Trong câu nf va có từ liên kết mang nghĩa phủ định “khơng” tính từ “khó” lm ul mang giá trị cảm xúc (-2) sau nên giá trị cảm xúc câu z at nh oi đƣợc tính nhƣ sau: (-1) + (-2) + (-1)*(-2) = (-1) Vì đặc trƣng số có giá trị (-1.0) Đặc trƣng số giá trị cảm xúc câu xét trƣờng hợp z gm @ giá trị cảm xúc câu thay đổi chịu ảnh hƣởng từ khiếm l khuyết Câu khơng có từ khiếm khuyết giá trị cảm co xúc không thay đổi với giá trị đặc trƣng số m Đặc trƣng số giá trị cảm xúc câu xét trƣờng hợp an Lu giá trị cảm xúc câu thay đổi tăng 50% giá trị cảm xúc n va ac th si Pl.10 từ tiêu cực Trong trƣờng hợp này, câu có ba từ tiêu cực từ “chỉ”, từ “sợ” từ “khó” Ba từ có giá trị cảm xúc lần lƣợt (-2), (-1) (-2) nên giá trị cảm xúc câu đƣợc tính nhƣ sau: (-2)*1.5 + (-1)*1.5 + (-2)*1.5 = (-7.5) Đặc trƣng số 10 giá trị cảm xúc câu thay đổi xét đến trƣờng hợp từ phủ định thay đổi Vì khơng có từ phủ định thay đổi nên giá trị cảm xúc câu giữ nguyên với giá trị đặc trƣng số lu an n va p ie gh tn to d oa nl w nf va an lu z at nh oi lm ul z m co l gm @ an Lu n va ac th si