1. Trang chủ
  2. » Cao đẳng - Đại học

NGHIÊN cứu rút TRÍCH THÔNG TIN dựa TRÊN cơ sở PHÂN TÍCH cảm xúc (2)

8 10 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

TRƯỜNG ĐẠI HỌC THỦ DẦU MỘT KHOA KỸ THUẬT CÔNG NGHỆ Tên đề tài: NGHIÊN CỨU RÚT TRÍCH THƠNG TIN DỰA TRÊN CƠ SỞ PHÂN TÍCH CẢM XÚC Mã số: Chuyên đề: Thực nghiệm thu kiểm tra độ ổn định ••“•_•• xác sản phẩm ứng dụng Chủ nhiệm đề tài : ThS.Nguyễn Tấn Lộc Người chủ trì thực chuyên đề : ThS.Nguyễn Tấn Lộc Bình Dương, 08/01/2018 Mục lục Đặt vấn đề Phương pháp nghiên cứu .1 Kết đạt 3.1 Rút trích thơng tin dựa mơ hình SEN1 Kết luận kiến nghị 5 Tài liệu tham khảo TF: term frequency Danh mục chữ viết tắt IDF: inverse document frequency TF.IDF: term frequency inverse document frequency DTM: document term matrix Logistic: hồi quy logistic P(A): Xác xuất kiện A NER: Named Entity Recognition SoA: Sentiment analysis - Phân tích cảm xúc Đặt vấn đề - Trong phần nghiên cứu này, Chúng đề xuất đo lường kết 02 mơ hình khác nhau, 02 mơ hình đặt tên SEN0, SEN1 SEN0 mơ hình chưa chuẩn hóa, SEN1 chuẩn hóa L2 norm, tối ưu với hệ số chuẩn hóa C=0.2154 Phương pháp nghiên cứu - Xây dựng mơ hình dựa lý thuyết logistic - Tính tốn hàm mát- Loss function - Chuẩn hóa mơ hình dùng L2-Norm chọn lamda tối ưu tránh overfitting Kết đạt Kết thực nghiệm liệu với mơ hình logistic SEN1 cho kết tốt với độ xác cao accuracy=90%, recall=89.8%, precision=96.9% hệ số chuẩn hóa cho mơ hình tối ưu với hệ số chuẩn hóa C=0.2154 Hình Đánh giá mơ hỉnh huấn luyện kiểm thử liệu Bảng So Thước đo SEN0 SEN1 recall 83% 89.8% precision 90% 96.9% accuracy 87% 90% sánh hiệu suất mô hỉnh 3.1 Rút trích thơng tin dựa SEN1 Trong phần thực nghiệm này, chúng tơi rút trích thơng tin hữu ích bình luận nằm nhóm đầu 10 bình luận tốt nhất, nhóm 10 bình luận hàng đầu theo quốc gia: name star s textclean categori es American (New) American (New) Kai This is a belated review for a meal that took Cain's Saloon Great beer list always changing it up Follows Olive Garden Italian Restaurant In the last few years Ive tried my best to lik Italian Olive Garden Italian Restaurant I dont know what is happening to Olive Garden Italian NYPD Pizza My favorite lunch spot in the area Im from NJ Italian Sunup Brewing Nice cozy neighborhood brewery Friendly staff Murphy's Pub Well its an institution here at the u of I You Randy's Restaurant & Ice Cream I go here when i am working and want to get aw American (New) Filibertos Mexican Food After hearing a few individuals talk about Fil Mexican Hiro Sushi This IS as good as it gets for sushi in Arizon Japanese American (New) American (New) Bảng 2.Các bình luận tích cực cho doanh nghiệp name star s textclean categories Loving Hut We love this place Th is is gonna be a long rev Vietnamese Loving Hut Yummmmmmm Best vegetarian restaurant in Phoen Vietnamese Tram's Kitchen It might be a holeinthewall but its a pretty n Vietnamese Saigon Pho & Seafood Fast service delicious food and excellent pric Vietnamese Tea Light Cafe Im giving Tea Light Cafe an extra star well de Vietnamese Tea Light Cafe Ive been driving by Tea Lite for awhile but ne Vietnamese Savor Flavor Asia This is a great little spot casual and quick a Vietnamese Pho Minh Best place for in the city I have tried th Vietnamese Saigon Pho & Seafood Saigon is by far my favorite stop I come h Vietnamese Cyclo Vietnamese Cuisine We really like this place I love the owners Vietnamese Bảng Các bình luận cảm xúc tích cực cho doanh nghiệp Việt Nam - Nhóm 10 bình luận cảm xúc tiêu cực cho nhà hàng Việt Nam, liệu phản ánh hợp lý với xếp hạng đến name star s textclean categories Phu Thanh Being a huge fan of Vietnamese food and how he Vietnamese Saigon Pho & Seafood Dont go to this restaurant The employees are Vietnamese Tea Light Cafe First and foremost this fastfood Vietnam rest Vietnamese Pho Minh Maybe I went on a bad day but the food was pre Vietnamese My Ngoc Restaurant Theres a reason why this place has no reviews Vietnamese Saigon Pho & Seafood Very VERY disappointed in the service This was Vietnamese Cyclo Vietnamese Cuisine I really dont understand what the fuss is aboil Vietnamese Loving Hut Absolutely terrible and slow service They are Vietnamese Saigon Pho & Seafood We always eat here when we crave Saigon Pho To Vietnamese Saigon Pho & Seafood We had dinner and had the worst experience we Vietnamese Bảng 3.Nhóm bình luận cảm xúc tiêu cực cho doanh nghiệp Việt Nam Kết phân loại cảm xúc tích cực tiêu cực ảnh hưởng mạnh đến kết rút trích thơng tin Nếu kết phân loại xác, truy vấn rút trích thơng tin có độ xác cao Nhóm 10 từ m xúc mạ nh tích cự c tiêu cự c nhấ t Tích cực - hệ số r excellent: 1.14614924052 delicious: 1.1119727885 amazing: 1.03514286548 awesome: 0.872256805683 perfect: 0.838463244404 great: 0.806499315192 best: 0.744851346902 fantastic: 0.734042587596 love: 0.731300119008 reasonable: 0.72016372024 Bảng Nhóm Tiêu cực-hệ số r worst: -1.13781905968 horrible: -1.0873361229 terrible: -1.04677190115 mediocre: -1.04432799702 bland: -0.874645601756 awful: -0.836073920222 tasteless: -0.821659220617 rude: -0.820886331069 disgusting: -0.805035172104 overpriced: -0.803561081306 10 từ cảm xúc rút từ kết phân tích - Nhóm 20 từ phổ biến trích từ bình luận hàng đầu thể cảm xúc tích Các từ có tần số xuất cao phù hợp với thực tế Món ăn phổ biến Việt Nam phở Hình Phân phối từ có tần suất cao ẩm thực Việt Nam Hình Các từ ảnh hưởng mạnh ẩm thực Việt - Kết phân loại rút trích cảm xúc xác cho nhà hàng Nhật bản, ăn phổ biến Sushi tươi sống Hình Phân phối từ có tần suất cao ẩm thực Nhật Hình 5.Các từ ảnh hưởng mạnh ẩm thực Nhật Kết luận kiến nghị Thời gian tới đề tài tiếp tục phát triển : - Xây dựng nhiều mơ hình phân loại cảm xúc với nhiều thuật toán mở rộng hướng tiếp cận ngữ nghĩa ontology, phương pháp từ điển, học máy từ so sánh kết thực nghiệm để so sánh đánh giá ưu khuyết phương pháp cho trường hợp cụ thể - Xây dựng mơ hình rút trích thơng tin sở phân tích cảm xúc trang tiếng việt dịch vụ du lịch tripadvisor, Lazada Tài liệu tham khảo [1] B Agarwal and N Mittal, “Optimal feature selection for sentiment analysis,” in Proceedings of the 14th International Conference on Intelligent Text Processing and Computational Linguistics (CICLing 13), vol 7817, pp 13-24, 2013 [2] A Basant, M Namita, B Pooja, Sonal Garg “Sentiment Analysis Using Common-Sense and Context Information” Hindawi Publishing Corporation Computational Intelligence and Neuroscience (2015) [3] RuiXia, FengXu, JianfeiYu,” Polarity shift detection, elimination and ensemble: A three stage model for document-level sentiment analysis” Information Processing and Management 52 (2016) 36- 45 [4] Y Ainur, Y Yisong, C Claire “Multi-level structured models for document- level sentiment classification”.Proceedings of the 2010 Conference on Empirical Methods in Natural Language Processing, MIT, Massachusetts, Association for Computational Linguistics, USA (2010), pp 1046-1056 [5] F Noura, C Elie, A.A Rawad, H Hazem “Sentence-level and documentlevel sentiment mining for arabic texts”.Proceeding IEEE International Conference on Data Mining Workshops (2010) [6] Hao chen Zhou and Fei Song.(2015) “Aspect-level sentiment analysis based on a generalized probabilistic topic and syntax model” Proceedings of the Twenty-Eighth International Florida Artificial Intelligence Research Society Conference, Association for the Advancement of Artificial Intelligence (2015) [7] Ariyasriwatana, W., Buente, W., Oshiro, M., & Streveler, D (2014) Categorizing health-related cues to action: using Yelp reviews of restaurants in Hawaii New Review of Hypermedia and Multimedia, 20(4), 317-340 [8] Hicks, A., Comp, S., Horovitz, J., Hovarter, M., Miki, M., & Bevan, J L (2012) Why people use Yelp com: An exploration of uses and gratifications Computers in Human Behavior, 28(6), 2274-2279 [9] Huang, J., Rogers, S., & Joo, E (2014) “Improving restaurants by extracting subtopics from yelp reviews” iConference 2014 (Social Media Expo) [10] Ruhui Shen, Jialiang Shen, Yuhong Li & Haohan Wang (2016), ” Predicting usefulness of Yelp reviews with localized linear regression models ”, 2016 7th IEEE International Conference on Software Engineering and Service Science (ICSESS) [11] Solov'ev A N., Antonova A Ju., Pazel'skaia A G., (2012), Using sentimentanalysis for text information extraction I-Teco (Moscow) [12] Wanxiang Che, Yanyan Zhao, Honglei Guo, Zhong Su, and Ting Liu,” Sentence Compression for spect-Based Sentiment Analysis” IEEE/ACM TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROCESSING, VOL 23, NO 12, DECEMBER 2015 [13] P.D Turney,(2000), “Learning algorithms for keyphrase extraction” Information Retrieval vol 2, no 4, pp 303 - 336 [14] I.H Witten, G.W Paynter, E Frank, C Gutwin and C.G Nevill- Manning (1999) “KEA: Practical automatic Keyphrase Extraction.” The proceedings of Digital Libraries '99: The Fourth ACM Conference on Digital Libraries, pp 254-255 [15] Huong Nguyen Thi Xuan, Anh Cuong Le ; Le Minh Nguyen, (2012) ”Linguistic Features for Subjectivity classification“ Asian Language Processing (IALP), 2012 International Conference Xác nhận thực chuyên đề Chủ nhiệm đề tài ... bình luận cảm xúc tiêu cực cho doanh nghiệp Việt Nam Kết phân loại cảm xúc tích cực tiêu cực ảnh hưởng mạnh đến kết rút trích thơng tin Nếu kết phân loại xác, truy vấn rút trích thơng tin có độ... -0.820886331069 disgusting: -0.805035172104 overpriced: -0.803561081306 10 từ cảm xúc rút từ kết phân tích - Nhóm 20 từ phổ biến trích từ bình luận hàng đầu thể cảm xúc tích Các từ có tần số... 90% 96.9% accuracy 87% 90% sánh hiệu suất mơ hỉnh 3.1 Rút trích thông tin dựa SEN1 Trong phần thực nghiệm này, chúng tơi rút trích thơng tin hữu ích bình luận nằm nhóm đầu 10 bình luận tốt nhất,

Ngày đăng: 02/09/2021, 16:54

Xem thêm:

Mục lục

    Tên đề tài: NGHIÊN CỨU RÚT TRÍCH THÔNG TIN DỰA TRÊN CƠ SỞ PHÂN TÍCH CẢM XÚC

    Thực hiện nghiệm thu và kiểm tra độ ổn định và

    • • “ • _ • • chính xác của sản phẩm ứng dụng

    Danh mục chữ viết tắt

    2. Phương pháp nghiên cứu

    3. Kết quả đạt được

    3.1 Rút trích thông tin dựa trên SEN1

    4. Kết luận và kiến nghị

    5. Tài liệu tham khảo

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w