Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 84 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
84
Dung lượng
2,3 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC QUY NHƠN VÕ LÊ MINH XÂY DỰNG MƠ HÌNH PHÂN TÍCH CẢM XÚC NGƢỜI DÙNG ĐÁNH GIÁ SẢN PHẨM BẰNG PHƢƠNG PHÁP PHÂN TÍCH TỪ VỰNG KẾT HỢP VỚI HỌC MÁY Chuyên ngành: Khoa học máy tính Mã số: 8480101 Ngƣời hƣớng dẫn : TS Hồ Văn Lâm LỜI CAM ĐOAN Tơi xin cam đoan đề tài “Xây dựng mơ hình phân tích cảm xúc người dùng đánh giá sản phẩm phương pháp phân tích từ vựng kết hợp với học máy” cơng trình nghiên cứu riêng tơi Các kết khảo sát, nghiên cứu Luận văn trung thực chƣa đƣợc công bố cơng trình khác Bình Định, ngày 08 tháng 11 năm 2021 Tác giả LỜI CẢM ƠN Để hồn thành luận văn này, tơi xin chân thành xin gửi lời cảm ơn chân thành đến quý thầy cô trƣờng Đại học Quy Nhơn, bạn bè trƣờng,… bảo, quan tâm, giúp đỡ tận tình suốt trình thực đề tài Nhờ tơi có thêm nhiều kinh nghiệm để xử lý khó khăn gặp phải hồn thành tốt đề tài Tôi xin gửi đến lời cám ơn sâu sắc đến Tiến sĩ Hồ Văn Lâm trực tiếp hƣớng dẫn, định hƣớng chuyên môn, quan tâm giúp đỡ tận tình tạo điều kiện thuận lợi trình thực luận văn Trong thời gian làm luận văn, tơi có trải nghiệm bổ ích Tơi đƣợc học tập, tìm hiểu nhiều kiến thức mẻ Hơn hết, đƣợc tiếp cận với thành tựu nghiên cứu liên quan đến đề tài nƣớc Đồng thời, đƣợc hƣớng dẫn tận tình cách làm việc chuyên nghiệp ngƣời hƣớng dẫn – TS Hồ Văn Lâm, tơi tích lũy đƣợc nhiều kinh nghiệm cho thân, phục vụ cho công việc đề tài nghiên cứu sau Mặc dù cố gắng nỗ lực để hoàn thành tốt luận văn mình, nhƣng khó tránh khỏi sai sót, mong nhận đƣợc góp ý bảo quý Thầy, Cô để đề tài đƣợc tốt Lời cuối cùng, tơi muốn nói cảm ơn tất ngƣời, ngƣời giúp cho tơi có đƣợc ngày hơm Bình Định, ngày 08 tháng 11 năm 2021 Sinh viên thực Võ Lê Minh MỤC LỤC LỜI CAM ĐOAN LỜI CẢM ƠN DANH MỤC CÁC CHỮ VIẾT TẮT DANH MỤC CÁC BẢNG DANH MỤC CÁC HÌNH TĨM TẮT MỞ ĐẦU Chƣơng TỔNG QUAN VỀ ĐỀ TÀI 1.1 Tổng quan đề tài 1.1.1 Phát biểu toán 1.1.2 Mục tiêu đề tài 1.1.3 Mơ hình tổng quan 1.2 Tổng quan tình hình nghiên cứu nƣớc giới 10 1.2.1 Trong nƣớc 10 1.2.2 Nƣớc 11 1.3 Bố cục luận văn 13 Chƣơng CƠ SỞ LÝ THUYẾT 14 2.1 Bộ từ điển cảm xúc SO-CAL tiếng Anh 14 2.2 Phƣơng pháp phân loại chủ quan 18 2.2.1 Câu có từ hàm chứa cảm xúc 18 2.2.2 Các trƣờng hợp ngoại lệ 18 2.3 Phƣơng pháp phân loại cảm xúc 20 2.3.1 Giá trị cảm xúc câu phụ thuộc vào từ hàm chứa cảm xúc 20 2.3.2 Giá trị cảm xúc câu phụ thuộc vào từ tăng cƣờng 21 2.3.3 Giá trị cảm xúc câu phụ thuộc vào từ phủ định 22 2.3.4 Giá trị cảm xúc câu phụ thuộc vào từ khiếm khuyết 22 2.3.5 Giá trị cảm xúc câu có xu hƣớng tích cực 23 2.4 Phƣơng pháp phân lớp Support Vector Machine (SVM) 23 2.4.1 Ý tƣởng 24 2.4.2 Cơ sở lý thuyết 26 Chƣơng XÂY DỰNG HỆ THỐNG THỬ NGHIỆM 29 3.1 Giới thiệu 29 3.2 Bộ từ điển cảm xúc SO-CAL tiếng Việt 30 3.3 Thu thập liệu 35 3.4 Tiền xử lý liệu rút trích đặc trƣng 39 3.5 Bộ liệu huấn luyện 41 3.5.1 Gán nhãn câu tay 41 3.5.2 Mô tả liệu huấn luyện 43 3.6 Phƣơng pháp phân loại chủ quan 44 3.7 Phƣơng pháp phân loại cảm xúc 47 3.8 Giao diện hệ thống thực nghiệm 55 Chƣơng KẾT QUẢ THỬ NGHIỆM 58 4.1 Bộ liệu thử nghiệm 58 4.2 Kết đánh giá phƣơng pháp phân loại chủ quan 59 4.3 Kết đánh giá phƣơng pháp phân loại cảm xúc 59 4.4 Kết phân tích bình luận khách tham quan trung tâm khám phá khoa học 59 Chƣơng KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN 61 5.1 Kết đạt đƣợc 61 5.2 Hƣớng phát triển 61 DANH MỤC TÀI LIỆU THAM KHẢO PHỤ LỤC QUYẾT ĐỊNH GIAO ĐỀ TÀI LUẬN VĂN THẠC SĨ(BẢN SAO) DANH MỤC CÁC CHỮ VIẾT TẮT AAC (Adverb-Adjective Combinations) API (Application Programming Interface) cURL (Client for Uniform Resource Locator) HTTP (The Hypertext Transfer Protocol) ID (Identification) TS (Tiến sĩ) SO (Semantic Orientation) SO-CAL (the Semantic Orientation CALculator) SRM (Structural Risk Minimization) SVM (Support Vector Machines) STT (Số thứ tự) url lib (Uniform Resource Locator Library) VC (Vapnik-Chervonenkis) Wifi (Wireless Fidelity) DANH MỤC BẢNG Bảng 2-1 Một số từ tăng cƣờng 15 Bảng 2-2 Bảng so sánh hiệu suất từ điển khác với từ điển SO-CAL 17 Bảng 3-1 Một số từ từ điển danh từ 33 Bảng 3-2 Một số từ từ điển động từ 33 Bảng 3-3 Một số từ từ điển tính từ 34 Bảng 3-4 Một số từ từ điển trạng từ 34 Bảng 3-5 Một số từ từ điển từ tăng cƣờng 34 Bảng 3-6 Kết phân loại chủ quan tay 44 Bảng 3-7 Kết phân loại cảm xúc tay 44 Bảng 4-1 Kết liệu thử nghiệm 59 Bảng 4-2 Kết đánh giá độ xác phƣơng pháp phân loại chủ quan 59 Bảng 4-3 Kết đánh giá độ xác phƣơng pháp phân loại cảm xúc 59 DANH MỤC HÌNH VẼ Hình 1-1 Mơ hình tổng quan hệ thống phân tích cảm xúc dựa vào bình luận mạng xã hội Hình 3-1 Mơ hình hệ thống thực nghiệm 29 Hình 3-2 Mơ hình Graph API 35 Hình 3-3 Ví dụ liệu thơ chƣa xử lý 37 Hình 3-4 Những bình luận trang VnExpress.net mạng xã hội Facebook 38 Hình 3-5 Nội dung bình luận đƣợc lấy thông qua thƣ viện Facebook Graph API 38 Hình 3-6 Ví dụ liệu dạng mã UNICODETH 39 Hình 3-7 Ví dụ liệu sau chuyển mã 39 Hình 3-8 Giao diện đánh giá độ xác liệu thử nghiệm 55 Hình 3-9 Giao diện phân loại cảm xúc, đánh giá mức độ quan tâm ngƣời dùng 56 Hình 3-10 Giao diện thu thập liệu 56 Hình 3-11 Giao diện hình bắt đầu 57 Hình 3-12 Giao diện hiển thị từ điển 57 TĨM TẮT Mạng internet cơng cụ giúp ngƣời kết nối với dễ dàng thơng qua những chia sẻ, thơng điệp, bình luận hay ý kiến cá nhân tất vật, việc diễn ngày Từ đó, ngƣời có nhìn tổng quan, thơng tin cần thiết hỗ trợ việc đánh giá đƣa định vấn đề diễn sống Điều không phƣơng diện cá nhân mà đƣợc tổ chức sử dụng rộng rãi Việc thu thập, tổng hợp phân tích bình luận làm theo phƣơng pháp thủ cơng tốn nhiều thời gian nhƣ chi phí để thực Nếu có hệ thống tự động xử lý, phân loại chúng dựa cảm xúc ngƣời dùng giúp tiết kiệm nhiều mặt Đã có nhiều ài áo, cơng trình nghiên cứu có liên quan đến đề tài nhƣng hầu hết chúng đƣợc sử dụng cho tiếng Anh Hầu hết cơng trình thu đƣợc nhiều kết khả quan Tuy nhiên, báo cơng trình nghiên cứu tƣơng tự tiếng Việt hạn chế Hiện nay, với phát triển mạnh mẽ truyền thông mạng xã hội nhu cầu thu thập ý kiến vật, việc diễn xung quanh chúng ta, hƣớng nghiên cứu dần đƣợc ý nhiều Việt Nam Trong khố luận này, tơi nghiên cứu lý thuyết, giải thuật giúp phân loại cảm xúc tìm hiểu đặc tính ản văn phạm tiếng Việt Từ xây dựng mơ hình phân tích cảm xúc tiếng Việt áp dụng trực tiếp bình luận mạng xã hội Ngồi tơi cịn sử dụng số kỹ thuật xử lý ngơn ngữ tự nhiên hỗ trợ cho việc phân tích liệu hiệu nhanh chóng Cuối cùng, tơi tổng hợp kết đạt đƣợc đƣa đánh giá mơ hình phân tích cảm xúc tiếng Việt dựa vào bình luận ngƣời dùng Sau đó, đề hƣớng phát triển đề tài tƣơng lai MỞ ĐẦU Với phát triển mạnh mẽ mạng Internet cộng với bùng nổ thơng tin tồn cầu, mạng xã hội đƣợc sử dụng rộng rãi dần trở thành phần thiếu sống ngƣời đặc biệt giới trẻ - ngƣời quan tâm cập nhật tin tức thƣờng xuyên Những tin tức, bình luận, đánh giá nhiều lĩnh vực đƣợc chia sẻ nhanh chóng từ lúc việc diễn đƣợc lan truyền đến nơi Phân loại tâm lý, cảm xúc khai thác ý kiến, đánh giá sản phẩm hỗ trợ cho việc nghiên cứu, phân tích cảm xúc, đánh giá thái độ ngƣời dùng sản phẩm, chủ đề đƣợc chia sẻ Đây lĩnh vực đƣợc nghiên cứu rộng rãi khai thác liệu Big Data, đồng thời có ý nghĩa quan trọng ngành khoa học xử lý ngôn ngữ tự nhiên Trong thực tế, mức độ ảnh hƣởng ngày đƣợc coi trọng tỷ lệ thuận với bùng nổ thông tin mạng Internet Chẳng hạn nhƣ muốn mua sản phẩm đó, muốn biết tốt hay khơng? Những lời quảng cáo hoa mỹ nhà sản xuất chƣa đủ thuyết phục, muốn nghe lời đánh giá chân thực từ ngƣời sử dụng có hiểu biết sản phẩm Hay tổ chức, số khô khan doanh thu sản phẩm không đủ để họ hài lòng Họ muốn biết đánh giá khách hàng ngƣời dùng sản phẩm họ Những khía cạnh tốt đƣợc trì, phát huy mặt xấu, không tốt đƣợc họ cải thiện để dần hoàn thiện chất lƣợng sản phẩm mặt Từ lý này, lựa chọn đề tài: “Xây dựng mơ hình phân tích cảm xúc ngƣời dùng đánh giá sản phẩm phƣơng pháp phân tích từ vựng kết hợp với máy học” nhằm phát triển phƣơng pháp nghiên cứu phân tích cảm xúc ngôn ngữ tiếng Việt dựa đặc trƣng nguồn liệu từ bình 61 Chƣơng 5.KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN 5.1 KẾT QUẢ ĐẠT ĐƢỢC Xuyên suốt trình thực hiện, tơi đƣợc tiếp cận với nhiều nghiên cứu liên quan ngồi nƣớc Điều giúp cho hiểu đƣợc rộng hơn, sâu kỹ đề tài Tôi cố gắng xây dựng phƣơng pháp khả thi để phân tích cảm xúc ngôn ngữ tiếng Việt dựa vào đặc trƣng sử dụng ngôn từ ngƣời dùng mạng internet Tuy nhiên, với giới hạn luận văn tốt nghiệp xây dựng đƣợc mô hình phân loại cảm xúc có dựa vào phƣơng thức học máy cách rập khuôn mà chƣa xét đến vấn đề xử lý ngôn ngữ tự nhiên Đó giới hạn dễ thấy đề tài mà tơi thực Ngồi ra, việc dịch từ điển cảm xúc từ từ điển tiếng Anh độ xác khơng cao nhƣng với thời gian có hạn nên tơi thực mức độ Mặc dù cịn gặp nhiều khó khăn nhƣng với hƣớng dẫn tận tình ngƣời hƣớng dẫn – TS Hồ Văn Lâm chia sẻ chân thành cử nhân Nguyễn Thành Lƣu, đạt đƣợc kết khả quan mong đợi an đầu Với kết này, hy vọng phát triển đề tài lên mức cao áp dụng vào thực tiễn sống nhƣ đóng góp vào nghiên cứu khoa học khác có liên quan 5.2 HƢỚNG PHÁT TRIỂN Việc phát triển phƣơng pháp phân tích cảm xúc tiếng Việt, đặc biệt liệu từ mạng xã hội vốn dạng liệu chuẩn tiếng Việt cịn cần nhiều cải tiến nhiều nghiên cứu khác: xây dựng từ điển cảm xúc đủ lớn độ xác cao, xây dựng liệu huấn luyện liệu thử nghiệm đạt chuẩn độ lớn độ xác, áp 62 dụng phƣơng pháp xử lý ngơn ngữ tự nhiên, phƣơng pháp chuẩn hóa liệu từ mạng xã hội, giải ài toán ig data chƣơng trình thực thi liệu lớn, v.v… nhằm đạt đƣợc độ xác tốt hiệu hệ thống tốt khối lƣợng liệu lớn Đồng thời, đƣợc cải tiến nâng cấp hệ thống thực nghiệm, hy vọng đề tài đƣợc áp dụng thực tiễn sống đóng góp cho nghiên cứu khác có liên quan Thiết thực việc đánh giá khách hàng lĩnh vực kinh tế kiến 63 DANH MỤC TÀI LIỆU THAM KHẢO [1] Son Trinh, Luu Nguyen, Minh Vo, “Com ining Lexicon-Based and LearningBased Methods for Sentiment Analysis for Product Reviews in Vietnamese Language”, Computer and Information Science, 2018 [2] Son Trinh, Luu Nguyen, Minh Vo, Phuc Do, “Lexicon-Based Sentiment Analysis of Face ook Comments in Vietnamese Language”, Recent Developments in Intelligent Information and Database Systems, 2016 [3] Vo Ngoc Phu and Phan Thi Tuoi, “Sentiment classification using Enhanced Contextual Valence Shifters”, Proceedings of International Conference on Asian Language Processing, Malaysia, 2014 [4] Maite Taboada, Julian Brooke, Milan Tofiloski, Kimberly Voll and Manfred Stede, “Lexicon-Based Methods for Sentiment Analysis”, Association for Computational Linguistics, 2011 [5] Bing Liu, “Sentiment Analysis and Opinion Mining”, Morgan & Claypool Publishers, May 2012 [6] Wie e, Janyce, Re ecca F Bruce, and Thomas P O'Hara, “Development and use of a gold-standard data set for subjective classifications”, Proceedings of the Association for Computational Linguistics (ACL1999), 1999 [7] Bo Pang and Lillian Lee, “A Sentimental Education: Sentiment Analysis Using Subjective Summarization Based on Minimum Cuts”, Proceedings of ACL, pp 271 278, 2004 [8] Namrata God ole, Manjunath Srinivasaiah and Steven Skiena, “Large-Scale Sentiment Analysis for News and Blogs”, ICWSM ’2007 Boulder, Colorado, USA [9] Rudy Pra owo and Mike Thelwall, “Sentiment Analysis: A Combined Approach”, Journal of Informetrics Volume 3, Issue 2, Pages 143–157, April 2009 64 [10] Farah Benamara, Carmine Cesarano and Diego Reforgiato, “Sentiment Analysis: Adjectives and Adver s are etter than Adjectives Alone”, ICWSM ’2006 Boulder, CO USA, 2006 [11] A Go, L Huang, R Bhayani – Entropy, “Twitter Sentiment Analysis”, CS224N - Final Project Report, June 6, 2009 [12] Efthymios Kouloumpis, Theresa Wilson and Johanna Moore, “Twitter Sentiment Analysis: The Good the Bad and the OMG!”, Fifth International AAAI Conference on Weblogs and Social Media, 2011 [13] Thanh Ho, Duy Doan and Phuc Do, “Discovering Hot Topics On Social Network Based On Improving The Aging Theory”, ACSIJ Advances in Computer Science: an International Journal, Vol 3, Issue 3, No.9 , May 2014 [14] Kennedy, Alistair and Diana Inkpen, “Sentiment classification of movie and product reviews using contextual valence shifters”, Computational Intelligence, 2006 [15] Mrutyunjaya Panda, Satchidananda Dehuri and Gi-Nam Wang, “Social Networking Mining, Visualization, and Security”, Springer International Publishing, Switzerland, 2014 [16] Nguyễn Ngọc Duy, “Luận văn thạc sĩ khoa học: Tóm tắt kiên sở phân loại cảm xúc”, ngành Khoa học máy tính, Đại học Bách khóa Hồ Chí Minh, 2014 TÀI LIỆU TRÊN MẠNG INTERNET [17] Polarity Dataset, www.cs.cornell.edu/People/pabo/movie-review-data/ [18] VIETTIEN Dictionary for Mac, http://nguyenvietkhoa.edu.vn/?page_id=346 [19] Dictionaries for the Semantic Orientation CALculator, https://github.com/DrOttensooser/BiblicalNLPworks/tree/master/SkyDrive/NLP/ CommonWorks/Data/Opion-Lexicon-English/SO-CAL, 65 [20] vnTokenizer, http://mim.hus.vnu.edu.vn/phuonglh/softwares/vnTokenizer [21] vnTagger, http://mim.hus.vnu.edu.vn/phuonglh/softwares/vnTagger [22]Epinions 1, Corpus.html, https://www.sfu.ca/~mtaboada/research/SFU_Review_ Pl.1 PHỤ LỤC I Bộ từ điển cảm xúc SO-CAL tiếng Việt Một số từ từ điển từ loại Danh từ Động từ Tính từ Trạng từ kiệt tác cảm phục vƣợt trội lộng lẫy cực điểm hoan hỉ xuất sắc xuất sắc kỳ quan thành đạt ật sáng chói thiên tài hân hoan ƣu việt thần kỳ công lao đăng quang thông minh tuyệt hảo cống hiến thắng sơi tích cực huy chƣơng tâm thuận lợi nhộn nhịp chiến công hợp tác tế nhị quán học cảm ơn tiếng phù hợp phúc lợi tốt nghiệp trẻ lôi niềm tin miễn phí tinh xảo khiêm tốn ấn tƣợng giúp đỡ sáng mãnh liệt độc lập chán -1 hợp l nhiệt tình vận may hủy -1 thích hợp tồi tệ -1 lập -1 đói -2 u ớt -1 nặng nề -1 kẻ cƣớp -1 -2 mờ mịt -1 khó chịu -2 uồn ạo lực -2 ám sát -2 tồi -2 ngu ngốc -2 ác mộng -3 hối tiếc -3 thô ỉ -3 thô thiển -3 rác rƣởi -3 đánh -3 ngu -3 quanh co -3 Pl.2 Một số từ từ điển từ tăng cƣờng Từ tăng cường vài thấp vài hầu nhƣ chút phần tƣơng đối vừa phải chắn đáng kinh ngạc tuyệt khó tin chừng đỗi vô khổng lồ nhiều phi thƣờng tuyệt đối II Bộ liệu thử nghiệm Bộ liệu chủ đề giáo dục Giá trị -3 -2 -2 -2 -1.5 -1.5 -0.5 -0.5 -0.3 -0.3 -0.3 0.2 0.1 0.2 0.3 0.3 0.4 0.4 0.4 0.4 0.5 0.5 0.5 0.5 0.5 Pl.3 Câu Nội dung ý kiến Con nhà ngƣời ta Trƣớc năm 75, miền Nam đa phần sinh viên du học trở quê Khách hƣơng làm việc quan Còn ngày nay, sinh viên du học không muốn quay đất nƣớc nhà ngƣời ta Học xong cố gắng ên công tác chúc em sau công dân Mỹ thành đạt Thật uồn cho Việt Nam Chủ Thật giỏi, khâm phục ạn quan Hy vọng đất nƣớc ta "chảy máu chất xám" cố lên phát triển nghiệp đổi cho nƣớc ngƣời ta nƣớc ngồi họ ln iết cách trọng dụng nhân tài Câu Tiêu cực Tích cực Nội dung ý kiến Thật uồn cho Việt Nam Quản l viết văn lủng củng Đọc ình luận mà uồn xấu trai Hãy học hay tốt điều mẻ ngƣời ta để phục vụ cho quê hƣơng ngƣời thông minh yêu nƣớc em Chúc em bình an thành tài Ngƣỡng mộ Tự hào tiếng Việt Nam Hãy iết ơn đất nƣớc Việt Nam học thật giỏi để mang vinh quan cho đất nƣớc, cho Đảng em Ngƣỡng mộ em, cố gắng thành ngƣời có ích em Chúc em thành công Thật tự hào nhân tài đất Việt Chúc em bình an thành tài Chúc em học thành tài mai sau dựng xây đất nƣớc gọi Pl.4 ngƣời có tài có tâm em Bộ liệu chủ đề phim ảnh Nội dung ý kiến Nguyễn Anh Tú hồi tao rạp để xem phim Ý kiến riêng tơi Khách Có ạn nghiện ản nhạc phim giống khơng? quan có đƣờng dẫn xem phim không? phim xem khoảng lần Thì " Anh Da Đen " từ mà ộ phim hay xem phim hay, xem khơng dƣới lần nhớ đến chi tiết, phim a out time Đây ộ phim tơi thích Đúng Kéo khỏi nguyên tắc nên tình cảm tơi nảy sinh Nói thiệt em yêu giọng văn anh quản l trang Chủ quan Vừa lãng mạn vừa có chiều sâu đơi lại đáng u Với Driss anh không xem Phillip ngƣời tàn tật mà đối xử với ơng nhƣ ngƣời ình thƣờng Công nhận hay thật Tôi thấy đƣợc ài học phim phải ln giữ cho khoẻ mạnh dù có khơng giàu nhƣng khoẻ đƣợc phim chƣa xem nên xem nghĩa Phim xem lại lần hay nhƣ lần đầu Câu Nội dung ý kiến Ban đầu thấy uồn cƣời khó hiểu với tình cảm Nhƣng nói thật tạo hình u qi q xấu Nội dung phim ổn nhƣng nhìn yêu quái chán Tiêu riết làm phim thua xa phim hồi xƣa xem cực Đồ hoạ phim tệ Phim tệ nghỉ nhân vật đọc lời thoại chậm thật khơng có mạch lạc Câu Pl.5 ộ phim hay xem phim hay, xem khơng dƣới lần nhớ đến chi tiết, phim a out time Đây ộ phim tơi thích Nói thiệt em u giọng văn anh quản l trang Vừa lãng mạn vừa có chiều sâu đơi lại đáng yêu Tích Với Driss anh k xem Phillip ngƣời tàn tật mà đối xử với ơng cực nhƣ ngƣời ình thƣờng Điều gắn kết họ với ằng tình ạn kẻ tìm cho ản thân lẽ sống ! Thích đoạn Thƣa ạn , ộ phim hay xem Tôi thấy đƣợc ài học phim phải ln giữ cho khoẻ mạnh dù có không giàu nhƣng khoẻ đƣợc Bộ liệu chủ đề thể thao Nội dung ý kiến ánh viên + công phƣợng = công viên Ngƣời đất Phong Điền Cần thơ câu đề văn quốc gia đƣợc Khách Truyền nhân Yết Kiêu quan Con gái tơi môi trƣờng rèn luyện nhƣ Ánh Viên Trời tính cách nhà vơ địch, Ánh Viên tiến xa xin chúc mừng Ánh Viên, chúc mừng Việt Nam Thay suốt ngày tập trung vào hot girl hot oy ca sĩ diễn viên suốt ngày trƣng "hàng" khoe tài sản, giới trẻ Việt Nam nên thần Chủ tƣợng ản lĩnh chí gái trẻ quan Viên đẹp từ tâm hồn em, không cần phải trang điểm điểm tô Yêu tự hào em Xem vận động viên thi đấu sƣớng thật Câu Pl.6 Họ rèn luyện, hi sinh nhiều thứ để tỏa sáng khoảnh khắc Chúc mừng Đại U Ánh Viên Bơi nhanh chẳng Thuỷ Thần Yết Kiêu Triệu Fan nƣớc mến yêu Chúc em gặt hái thật nhiều huy chƣơng Việt Nam tự hào em, Ánh Viên Nội dung ý kiến Câu Tội chị Tiêu Nghĩ mà uồn cho số phận nhƣ cực Cái nghiệp ạc ẽo nghiệp thể thao Thƣơng xót tính cách nhà vơ địch, Ánh Viên tiến xa xin chúc mừng Ánh Viên, chúc mừng Việt Nam Thay suốt ngày tập trung vào hot girl hot oy ca sĩ diễn viên suốt ngày trƣng "hàng" khoe tài sản, giới trẻ Việt Nam nên thần tƣợng ản lĩnh chí gái trẻ Viên đẹp từ tâm hồn em, khơng cần phải makeup điểm tơ Tích Yêu tự hào em cực Xem vận động viên thi đấu sƣớng thật Họ rèn luyện, hi sinh nhiều thứ để tỏa sáng khoảnh khắc Chúc mừng Đại U Ánh Viên Đây gƣơng để nỗ lực Mang lại vinh quang cho tổ quốc,cho gia đình Ánh Viên niềm tự hào dân tộc Thật yêu qu khâm phục chị! III Thử nghiệm phân tích liệu Phân tích bình luận “Đề dài, sợ viết khơng kịp cảm thấy đề khơng khó Các sĩ tử làm nhỉ?” Tiền xử lý, cắt câu: Đề dài, sợ viết không kịp cảm thấy đề khơng khó Các sĩ tử làm Pl.7 Gán nhãn: Đề dài , chỉ sợ viết không kịp chứ mình cảm thấy đề khơng khó lắm Các sĩ tử làm bài như nào rồi nhỉ Rút đặc trƣng: - Chủ quan: Câu: “Đề dài, sợ viết không kịp cảm thấy đề khơng khó lắm” Pl.8 1:14.0 2:-2.0 3:-2.0 4:0.0 5:-1.0 6:-5.0 Trong đó: Đặc trƣng số tổng số từ câu có giá trị 14.0 câu có 14 từ Đặc trƣng số tổng giá trị cảm xúc tính từ có giá trị -2.0 câu có tính từ chứa cảm xúc “khó” (-2) Đặc trƣng số tổng giá trị cảm xúc trạng từ có giá trị -2.0 câu có trạng từ chứa cảm xúc “chỉ” (-2) Đặc trƣng số tổng giá trị cảm xúc danh từ có giá trị 0.0 câu khơng có danh từ chứa cảm xúc Đặc trƣng số tổng giá trị cảm xúc động từ có giá trị -1.0 câu có động từ chứa cảm xúc “sợ” (-1) Đặc trƣng số tổng giá trị cảm xúc câu có giá trị (5.0) Ta thấy, câu bình thƣờng khơng thuộc vào trƣờng hợp ngoại lệ Do tổng giá trị cảm xúc câu tổng giá trị cảm xúc loại từ câu hay nói cách khác tổng giá trị đặc trƣng số 3, 4, cộng lại: (-2) + (-2) + (0) + (-1) = (-5) Câu: “Các sĩ tử làm nhỉ” 1:7.0 2:0.0 3:0.0 4:0.0 5:0.0 6:0.0 Trong đó: Đặc trƣng số có giá trị 7.0 câu có từ Đặc trƣng số 2, 3, 4, có giá trị 0.0 câu khơng có tính từ, trạng từ, danh từ hay động từ chứa cảm xúc Đặc trƣng số có giá trị 0.0 câu nghi vấn (vì có cụm từ “nhƣ nào”) nên tổng giá trị cảm xúc câu - Phân tích cảm xúc: Pl.9 Câu: “Đề dài, sợ viết khơng kịp cảm thấy đề khơng khó lắm” 1:-2.0 2:-2.0 3:0.0 4:-1.0 5:-5.0 6:-4.5 7:-1.0 8:-5.0 9:-7.5 10:-5.0 Trong đó: Các đặc trƣng số 1, 2, đƣợc kế thừa từ đặc trƣng số 3, 4, phần phân tích chủ quan Đặc trƣng số có giá trị tổng giá trị đặc trƣng 1, 2, cộng lại (-5.0) Đặc trƣng số giá trị cảm xúc câu sau hệ thống xét trƣờng hợp có từ tăng cƣờng Đặc trƣng số có giá trị -4.5 câu có từ “chỉ” mang giá trị cảm xúc (-0.5) từ điển từ tăng cƣờng từ “sợ” mang giá trị cảm xúc (-1) Do đó, giá trị cảm xúc câu đƣợc tính nhƣ sau: (-2) + (-0.5)*(-1) + (1) + (-2) = (-4.5) Đặc trƣng số giá trị cảm xúc câu xét đến trƣờng hợp giá trị cảm xúc câu thay đổi câu có vế liên kết với từ liên kết mang nghĩa phủ định Trong câu có từ liên kết mang nghĩa phủ định “khơng” tính từ “khó” mang giá trị cảm xúc (-2) sau nên giá trị cảm xúc câu đƣợc tính nhƣ sau: (-1) + (-2) + (-1)*(-2) = (-1) Vì đặc trƣng số có giá trị (-1.0) Đặc trƣng số giá trị cảm xúc câu xét trƣờng hợp giá trị cảm xúc câu thay đổi chịu ảnh hƣởng từ khiếm khuyết Câu khơng có từ khiếm khuyết giá trị cảm xúc khơng thay đổi với giá trị đặc trƣng số Đặc trƣng số giá trị cảm xúc câu xét trƣờng hợp giá trị cảm xúc câu thay đổi tăng 50% giá trị cảm xúc Pl.10 từ tiêu cực Trong trƣờng hợp này, câu có ba từ tiêu cực từ “chỉ”, từ “sợ” từ “khó” Ba từ có giá trị cảm xúc lần lƣợt (-2), (-1) (-2) nên giá trị cảm xúc câu đƣợc tính nhƣ sau: (-2)*1.5 + (-1)*1.5 + (-2)*1.5 = (-7.5) Đặc trƣng số 10 giá trị cảm xúc câu thay đổi xét đến trƣờng hợp từ phủ định thay đổi Vì khơng có từ phủ định thay đổi nên giá trị cảm xúc câu giữ nguyên với giá trị đặc trƣng số ... lƣợng sản phẩm mặt Từ lý này, lựa chọn đề tài: ? ?Xây dựng mơ hình phân tích cảm xúc ngƣời dùng đánh giá sản phẩm phƣơng pháp phân tích từ vựng kết hợp với máy học? ?? nhằm phát triển phƣơng pháp nghiên... bình luận đánh giá sản phẩm ngƣời dùng - Xây dựng từ điển cảm xúc - Phân tích, đánh giá cảm xúc ngƣời dùng sản phẩm a) Thu thập thông tin, liệu từ bình luận, đánh giá sản phẩm người dùng Chúng... Tôi xin cam đoan đề tài ? ?Xây dựng mơ hình phân tích cảm xúc người dùng đánh giá sản phẩm phương pháp phân tích từ vựng kết hợp với học máy? ?? cơng trình nghiên cứu riêng Các kết khảo sát, nghiên cứu