(Luận án tiến sĩ) mô hình hành vi và quan tâm của người dùng trên các mạng xã hội

205 2 0
(Luận án tiến sĩ) mô hình hành vi và quan tâm của người dùng trên các mạng xã hội

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - NGUYỄN THỊ HỘI MƠ HÌNH HÀNH VI VÀ QUAN TÂM CỦA NGƯỜI DÙNG TRÊN CÁC MẠNG XÃ HỘI LUẬN ÁN TIẾN SĨ KỸ THUẬT HÀ NỘI - 2021 ii BỘ THÔNG TIN VÀ TRUYỀN THƠNG HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THÔNG NGUYỄN THỊ HỘI MƠ HÌNH HÀNH VI VÀ QUAN TÂM CỦA NGƯỜI DÙNG TRÊN CÁC MẠNG XÃ HỘI CHUYÊN NGÀNH: HỆ THỐNG THÔNG TIN MÃ SỐ: 9.48.01.048 LUẬN ÁN TIẾN SĨ KỸ THUẬT NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS TRẦN ĐÌNH QUẾ PGS.TS ĐÀM GIA MẠNH HÀ NỘI - 2021 i LỜI CAM ĐOAN Tôi xin cam đoan tất nội dung luận án: “Mô hình hành vi quan tâm người dùng mạng xã hội” cơng trình nghiên cứu riêng tôi, hướng dẫn khoa học PGS.TS.Trần Đình Quế PGS.TS.Đàm Gia Mạnh Tất tài liệu tham khảo sử dụng luận án nêu rõ nguồn gốc danh mục tài liệu tham khảo Tất kết quả, số liệu sử dụng luận án trung thực chưa người khác cơng bố cơng trình khoa học Hà Nội, ngày tháng năm 2021 TM TẬP THỂ HƯỚNG DẪN KHOA HỌC TÁC GIẢ LUẬN ÁN PGS.TS Trần Đình Quế Nguyễn Thị Hội ii LỜI CẢM ƠN Trong q trình hồn thành luận án này, tơi thầy hướng dẫn tận tình bảo Tơi xin kính gửi lịng biết ơn sâu sắc đến thầy PGS.TS Trần Đình Quế, thầy tận tình hướng dẫn trình định hướng nghiên cứu, đặt vấn đề nghiên cứu, phương pháp nghiên cứu khoa học, cơng việc cụ thể trình bày báo khoa học, báo cáo luận án Tơi bày tỏ lịng biết ơn sâu sắc đến thầy PGS.TS Đàm Gia Mạnh, thầy tận tình giúp đỡ thường xun động viên khích lệ tơi, hướng dẫn cách viết tỉ mỉ, hướng tiếp cận hồn thiện báo cáo luận án Tơi xin chân thành cảm ơn Ban lãnh đạo Học viện Cơng nghệ Bưu Viễn thơng, thầy Khoa Đào tạo Sau đại học động viên, giúp đỡ tạo điều kiện thuận lợi cho suốt q trình thực luận án Tơi xin cảm ơn thầy cô Khoa Công nghệ thông tin có nhiều đóng góp q báu giúp tơi hồn thiện luận án, tận tình hướng dẫn, động viên thầy cô giúp tự tin đường nghiên cứu khoa học Tơi cảm thấy thật học hỏi nhiều kỹ nghiên cứu, thu nhận nhiều kiến thức sau năm tháng học tập nghiên cứu sở đào tạo Học viện Luận án khơng thể hồn thành tốt khơng có hỗ trợ tạo điều kiện thuận lợi từ Ban giám hiệu Trường Đại học Thương mại thầy cô Khoa Hệ thống thông tin kinh tế Thương mại điện tử thầy cô Bộ môn Công nghệ thông tin Đặc biệt cám ơn bạn sinh viên K50S, K51S K52S hỗ trợ việc thu thập liệu phục vụ cho trình thực nghiệm Con xin cảm ơn mẹ, chồng hai anh chị gia đình, đặc biệt em trai PGS.TS Nguyễn Mạnh Hùng, ln động viên, giúp đỡ, khích lệ góp ý cho luận án hồn thành Tác giả luận án Nguyễn Thị Hội iii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN .ii MỤC LỤC iii DANH MỤC CÁC TỪ VIẾT TẮT vii CÁC KÝ HIỆU viii DANH MỤC BẢNG BIỂU ix DANH MỤC HÌNH xi MỞ ĐẦU Tính cấp thiết luận án Mục tiêu luận án nội dung nghiên cứu Mục tiêu luận án Nội dung nghiên cứu luận án Đối tượng nghiên cứu phạm vi nghiên cứu Đối tượng nghiên cứu Phạm vi nghiên cứu Phương pháp nghiên cứu Các phương pháp nghiên cứu: Thu thập liệu thực nghiệm đánh giá Kịch thực nghiệm 10 Phương pháp đánh giá 11 Những đóng góp luận án 12 Bố cục luận án 13 CHƯƠNG 1: TỔNG QUAN VỀ HÀNH VI, QUAN TÂM VÀ MƠ HÌNH NGƯỜI DÙNG TRÊN CÁC MẠNG XÃ HỘI 15 1.1 Mạng xã hội hành vi người dùng mạng xã hội 15 1.1.1 Mạng xã hội 15 1.1.2 Dữ liệu mạng xã hội 17 1.1.3 Người dùng cộng đồng người dùng mạng xã hội 19 1.1.4 Mơ hình người dùng mạng xã hội 21 1.1.5 Quan tâm người dùng mạng xã hội 23 1.1.6 Chủ đề trang mạng xã hội 24 1.1.7 Hành vi người dùng mạng xã hội 24 1.2 Phát chủ đề quan tâm người dùng mạng xã hội 25 1.2.1 Phát biểu toán câu hỏi nghiên cứu 25 1.2.2 Ứng dụng phát quan tâm người dùng mạng xã hội 27 1.3 Các nghiên cứu liên quan đến toán 28 iv 1.3.1 Các hướng tiếp cận toán 28 1.3.2 Các bước xây dựng hồ sơ quan tâm người dùng 36 1.3.3 Những nội dung nghiên cứu mạng xã hội 38 1.3.4 Hướng nghiên cứu luận án 39 1.4 Xử lý liệu văn ngắn mạng xã hội 42 1.4.1 Biểu diễn tiền xử lý văn 43 1.4.2 Véctơ hóa dựa TF.IDF 44 1.5 Kết luận 46 CHƯƠNG 2: MƠ HÌNH VÀ QUAN TÂM CỦA NGƯỜI DÙNG THEO NỘI DUNG BÀI VIẾT 47 2.1 MƠ HÌNH NGƯỜI DÙNG THEO NỘI DUNG BÀI VIẾT 47 2.1.1 Biểu diễn véctơ viết TF.IDF 47 2.1.2 Biểu diễn người dùng véctơ 60 2.1.3 Độ đo tương tự độ tương quan hai đối tượng 60 2.1.4 Độ tương tự hai người dùng theo nội dung viết 61 2.2 MƠ HÌNH QUAN TÂM CỦA NGƯỜI DÙNG THEO CHỦ ĐỀ 63 2.2.1 Biểu diễn véctơ trọng số chủ đề 63 2.2.2 Xây dựng chủ đề mạng xã hội 64 2.2.3 Biểu diễn véctơ nội dung viết theo chủ đề 68 2.2.4 Độ quan tâm người dùng theo chủ đề mạng xã hội 69 2.2.5 Tương tự quan tâm theo chủ đề người dùng 70 2.3 TƯƠNG QUAN GIỮA TƯƠNG TỰ NGƯỜI DÙNG VÀ QUAN TÂM 71 2.3.1 Mối tương quan tương tự quan tâm người dùng 71 2.3.2 Xác định độ quan tâm vấn đề tương quan 73 2.3.3 Thảo luận kết 81 2.4 KẾT LUẬN 84 CHƯƠNG 3: MÔ HÌNH VÀ QUAN TÂM CỦA NGƯỜI DÙNG DỰA TRÊN BÀI VIẾT MỞ RỘNG 85 3.1 XÁC ĐỊNH QUAN TÂM CỦA NGƯỜI DÙNG THEO BÀI VIẾT 85 3.2 MƠ HÌNH BÀI VIẾT MỞ RỘNG 87 3.2.1 Mơ hình viết 87 3.2.2 Biểu diễn viết véctơ 92 3.2.3 Độ tương tự hai viết mở rộng 95 3.3 MƠ HÌNH NGƯỜI DÙNG THEO BÀI VIẾT MỞ RỘNG 98 3.3.1 Biểu diễn người dùng theo viết mở rộng 98 3.3.2 Độ tương tự hai người dùng theo mơ hình viết mở rộng 99 3.4 QUAN TÂM CỦA NGƯỜI DÙNG THEO MƠ HÌNH BÀI VIẾT MỞ RỘNG 100 v 3.4.1 Biểu diễn viết theo chủ đề 100 3.4.2 Xác định mối tương quan người dùng chủ đề 100 3.4.3 Độ tương tự quan tâm người dùng theo chủ đề 101 3.5 TƯƠNG QUAN GIỮA TƯƠNG TỰ NGƯỜI DÙNG VÀ QUAN TÂM 101 3.5.1 Bài toán xác định tương quan tương tự người dùng chủ đề 101 3.5.2 Thực nghiệm đánh giá 102 3.5.3 Thảo luận kết thực nghiệm 111 3.6 KẾT LUẬN 113 CHƯƠNG 4: HÀNH VI VÀ QUAN TÂM CỦA NGƯỜI DÙNG THEO HÀNH VI TRÊN MẠNG XÃ HỘI 115 4.1 HÀNH VI CỦA NGƯỜI DÙNG TRÊN MẠNG XÃ HỘI 115 4.1.1 Hành vi phân loại hành vi người dùng mạng xã hội 115 4.1.2 Phát quan tâm người dùng dựa hành vi 119 4.1.3 Nhóm hay cộng đồng người dùng mạng xã hội 122 4.2 MƠ HÌNH NGƯỜI DÙNG THEO HÀNH VI 123 4.2.1 Mơ hình biểu diễn người dùng 123 4.2.2 Biểu diễn mơ hình người dùng véc tơ trọng số 127 4.2.3 Độ tương tự hai người dùng theo hành vi 130 4.3 QUAN TÂM CỦA NGƯỜI DÙNG THEO MƠ HÌNH HÀNH VI 133 4.3.1 Biểu diễn mơ hình hành vi người dùng theo không gian chủ đề 133 4.3.2 Xác định chủ đề quan tâm theo hành vi 134 4.3.3 Độ tương tự quan tâm người dùng theo chủ đề 135 4.4 TƯƠNG QUAN GIỮA TƯƠNG TỰ NGƯỜI DÙNG VÀ QUAN TÂM 136 4.4.1 Bài toán xác định tương quan tương tự người dùng chủ đề 136 4.4.2 Thực nghiệm đánh giá 136 4.4.3 Thảo luận kết thực nghiệm 143 4.5 SO SÁNH VỚI MỘT SỐ MƠ HÌNH KHÁC 145 4.5.1 Các mơ hình so sánh 145 4.5.2 Các bước thực 148 4.5.3 Kết so sánh mơ hình thảo luận 151 4.6 KẾT LUẬN 152 KẾT LUẬN 154 Những kết nghiên cứu luận án 154 Ý nghĩa khả ứng dụng vào thực tiễn 156 Những vấn đề hạn chế luận án 157 Hướng nghiên cứu 157 DANH MỤC CÁC CƠNG TRÌNH NGHIÊN CỦA TÁC GIẢ LIÊN QUAN ĐẾN LUẬN ÁN 159 vi TÀI LIỆU THAM KHẢO 161 PHỤ LỤC xii PHỤ LỤC A: MỘT SỐ THUẬT NGỮ SỬ DỤNG TRÊN MẠNG XÃ HỘI .xii PHỤ LỤC B: THỰC NGHIỆM LỰA CHỌN THUẬT TỐN TÍNH GIÁ TRỊ CHO THỂ LOẠI, QUAN ĐIỂM VÀ CẢM XÚC xiii PL2.1 Một số thuật toán gán nhãn liệu văn thực nghiệm xiii PL2.2 Kịch thực nghiệm tham số đầu xiii PL2.3 Kết thực nghiệm xiv PHỤ LỤC C: DANH MỤC CÁC TỪ DỪNG SỬ DỤNG TRONG LUẬN ÁN xxiii vii DANH MỤC CÁC TỪ VIẾT TẮT TỪ VIẾT TẮT DIỄN GIẢI TIẾNG ANH TIẾNG VIỆT IDF Inverse Document Frequency Tần số nghịch đảo từ, cụm từ văn IRS Information Retrieval Similarity Độ tương tự trích xuất thơng tin LSA Latent Semantic Analysis Phân tích ngữ nghĩa tiềm ẩn Sim Similarity Độ tương tự TF Term Frequency Tần suất từ, cụm từ xuất văn TCAM Temporal Mixture Model UIW User Interest Weight WFST Weighted Transducer Context-Aware Mơ hình hỗn hợp thống kê lớp tiềm ẩn Finite Trọng số quan tâm người dùng State Chuyển đổi trạng thái trọng số hữu hạn TBTĐ Trung bình độ lệch tuyệt đối TBTgĐ Trung bình độ lệch tương đối viii CÁC KÝ HIỆU DIỄN GIẢI Ký hiệu TIẾNG ANH TIẾNG VIỆT B Behavior Hành vi C Comment Bình luận ci E Bình luận thứ i Entry Bài viết ej Bài viết thứ j ej Véctơ viết j G Group Nhóm/ Cộng đồng gk Nhóm thứ k gk Véctơ nhóm thứ k J Join a group Gia nhập nhóm L Like an entry Thích viết N Network Mạng P Post an entry Đăng viết T Topic Chủ đề tx Chủ đề x tx Véctơ chủ đề x U User Người dùng uy Người dùng y uy Véctơ người dùng y cont Content Nội dung cat Category Thể loại des Description Mô tả emo Emotion Cảm xúc name Name Tên tag Tag Đánh dấu sent Sentiment Quan điểm sty Style Kiểu/ Loại cor(ex,t) Corellation between ex Mức độ liên quan viết and t ex với chủ đề t sim(x,y) Similar between x and y Độ tương tự x y int(x,y) Interest of x to y Quan tâm x đến y xvi Bảng PL2.3: Độ xác F1- score ngữ liệu 20 NewsGroups Nhãn CNN W2V MNB NB SVM K-NN C4.5 RF alt.atheism 84.22 83.03 96.09 91.60 94.51 73.15 97.70 96.32 comp.graphics 82.73 76.60 91.69 86.33 89.96 67.35 97.99 89.50 comp.os.ms-windows.misc 84.15 55.35 87.44 89.68 95.08 72.65 99.90 93.68 comp.sys.ibm.pc.hardware 79.10 79.99 90.16 87.90 91.29 72.62 99.50 95.23 comp.sys.mac.hardware 71.50 80.77 92.20 84.48 93.08 71.84 99.10 95.52 comp.windows.x 81.55 80.65 93.76 81.55 92.14 62.03 97.43 95.23 misc.forsale 83.26 83.12 92.59 81.14 93.87 72.94 99.40 93.81 rec.autos 82.49 78.30 94.78 87.02 91.49 71.63 99.69 94.70 rec.motorcycles 86.26 84.77 96.12 92.89 94.20 70.20 99.80 97.58 rec.sport.baseball 82.76 79.76 97.28 94.27 94.74 74.78 99.50 96.64 rec.sport.hockey 88.68 79.66 98.24 95.32 97.66 70.14 99.70 97.76 sci.crypt 86.38 76.57 95.30 92.34 95.65 72.56 99.40 97.80 sci.electronics 82.82 83.03 92.74 87.65 93.29 65.59 98.51 92.13 sci.med 84.49 75.68 94.34 86.18 94.19 67.31 98.61 96.80 sci.space 83.50 80.26 96.46 88.46 94.73 70.97 99.30 98.23 soc.religion.christian 88.18 74.95 98.33 97.36 99.90 80.80 99.50 99.11 talk.politics.guns 83.50 78.88 95.24 87.89 94.71 77.73 98.50 95.25 talk.politics.mideast 81.36 77.85 97.26 91.91 98.08 75.64 97.44 97.46 talk.politics.misc 78.96 80.25 90.12 86.08 95.03 68.31 96.77 94.28 talk.religion.misc 82.91 82.07 94.15 85.68 94.64 68.83 98.63 94.07 Trung bình nhãn 82.94 78.58 94.21 88.79 94.41 71.35 98.82 95.45 Kết giá trị F1- score thu từ ngữ liệu 20 NewsGroups trình bày Bảng PL2.3 Từ kết cho thấy, thuật toán C45 đạt giá trị F1- score cao 18/20 nhãn, thuật toán SVM đạt giá trị F1- score cao hai nhãn lại: “soc.religion.christian” “talk.politics.mideast” xvii 100 95 90 85 80 Accuracy F1-score 75 70 65 60 CNN T2V MNB NB SVM KNN C45 RF Hình PL2.1: So sánh Accuracy F1- score 20 NewsGroups Tổng hợp kết thực nghiệm từ liệu 20 NewsGroups cho thấy thuật toán C45 cho kết tốt nhất, thuật toán RF, SVM, MNB So sánh kết thực nghiệm độ xác Accuracy F1-score thuật toán ngữ liệu 20 NewsGroups minh họa Hình PL2.1 Kết độ xác Accuracy từ ngữ liệu cảm xúc SemEval-2017 trình bày Bảng PL2.4 Bảng PL2.4: Độ xác thuật toán ngữ liệu SemEval-2017 Nhãn CNN W2V MNB NB SVM K-NN C4.5 RF anger 64.04 66.18 78.67 70.20 83.67 53.47 53.16 74.69 fear 59.69 66.36 76.12 67.55 80.31 56.22 52.35 79.39 joy 65.18 72.81 78.47 66.43 86.22 60.41 57.55 88.27 sadness 62.08 65.65 78.67 70.51 85.10 55.61 54.90 81.43 Trung bình nhãn 62.75 67.75 77.98 68.67 83.83 56.43 54.49 80.94 Từ kết cho thấy thuật toán SVM đạt giá trị Accuracy cao 3/4 nhãn, thuật toán RF cho giá trị Accuracy cao nhãn lại “joy” Kết trung bình tất nhãn, thuật tốn SVM cho giá trị Accuracy cao nhất, thuật toán RF MNB xviii Bảng PL2.5: F1 - score thuật toán ngữ liệu SemEval-2017 Nhãn CNN W2V MNB NB SVM K-NN C4.5 RF anger 59.69 69.58 79.71 72.87 83.48 67.94 60.83 79.03 fear 54.05 66.99 77.27 63.45 81.57 69.56 52.27 81.95 joy 55.39 75.74 79.45 60.41 86.22 40.70 41.16 88.00 sadness 61.54 71.56 80.26 67.94 85.00 68.59 35.23 82.57 Trung bình nhãn 57.66 70.97 79.17 66.17 84.07 61.70 47.37 82.89 Tổng hợp kết F1- score từ ngữ liệu cảm xúc SemEval-2017 trình bày Bảng PL2.5 Từ kết cho thấy rằng, thuật tốn SVM đạt giá trị F1- score cao hai nhãn “joy” “sadness” Kết trung bình tất nhãn ngữ liệu thuật tốn SVM cho kết F1-score cao nhất, thuật toán RF MNB 90 85 80 75 70 65 Accuracy F1-score 60 55 50 45 40 CNN T2V MNB NB SVM KNN C45 RF Hình PL2.2: So sánh Accuracy F1- score SemEval-2017 Tổng hợp kết từ ngữ liệu cảm xúc SemEval-2017 thuật toán SVM cho kết tốt nhất, thuật toán RF MNB Riêng trường hợp thuật toán C45 cho kết tốt với liệu 20 NewsGroups, với liệu cảm xúc gọi văn ngắn SemEval-2017, thuật tốn C45 cho kết khơng cao, chí thấp thuật toán xem xét So sánh kết thực nghiệm độ xác Accuracy F1-score thuật toán ngữ liệu SemEval-2017 minh họa Hình PL2.2 xix Bảng PL2.6: Độ xác thuật tốn ngữ liệu viết luận án Nhãn CNN W2V MNB NB SVM K-NN C4.5 RF Chính trị 71.91 66.38 76.17 76.17 68.51 58.72 73.62 62.13 Đời sống – Xã hội 63.91 62.17 70.87 70.00 63.91 58.70 70.00 60.43 Giáo dục 72.77 60.85 78.72 68.94 68.94 54.89 74.47 64.26 Khoa học – Công nghệ 62.76 68.80 71.91 62.55 69.36 42.55 62.55 72.77 Kinh doanh 71.91 68.09 66.38 71.06 66.81 58.30 65.53 69.79 Thời 56.52 56.35 57.39 49.13 56.09 57.83 56.96 59.13 Văn hóa – Giải trí 69.36 60.85 77.02 61.70 65.53 58.72 71.06 59.15 Pháp luật 73.62 77.02 87.66 65.96 84.26 45.96 70.64 74.04 Thể thao 67.83 76.65 86.09 70.00 68.70 40.87 80.43 69.13 Sức khỏe 76.49 78.30 83.40 68.09 73.19 56.60 72.34 73.19 Trung bình nhãn 68.71 67.55 75.56 66.36 68.53 53.31 69.76 66.40 Với hai ngữ liệu chủ đề cảm xúc xây dựng từ liệu thu thập thực tế luận án, kết độ xác Accuracy từ ngữ liệu chủ đề luận án trình bày Bảng PL2.6 Từ kết cho thấy thuật toán MNB đạt giá trị Accuracy cao 7/10 nhãn, thuật toán RF cho giá trị Accuracy cao hai nhãn “Khoa học – công nghệ” “Thời sự”, cịn thuật tốn CNN cho kết cao nhãn “Kinh doanh” Xét kết trung bình tất nhãn, thuật tốn MNB cho giá trị Accuracy cao nhất, thuật toán C45, CNN SVM Kết F1- score thu từ ngữ liệu chủ đề luận án trình bày Bảng PL2.7 Từ kết cho thấy thuật toán MNB đạt giá trị F1- score cao 8/10 nhãn Thuật toán W2V đạt giá trị F1- score cao hai nhãn “Thời sự” “Pháp luật” Thuật toán NB cho giá trị F1- score cao nhãn “Kinh doanh” Xét kết trung bình tất nhãn ngữ liệu chủ đề thuật tốn MNB cho giá trị F1- score cao nhất, thuật toán W2V C45 xx Bảng PL2.7: Kết F1- score ngữ liệu viết luận án Nhãn CNN W2V MNB NB SVM K-NN C4.5 RF Chính trị 60.66 57.47 75.51 74.34 47.66 6.90 67.81 27.23 Đời sống – Xã hội 65.49 67.17 71.05 65.21 36.86 0.00 63.10 9.64 Giáo dục 66.91 68.16 79.04 61.39 50.07 22.09 69.03 30.79 Khoa học – Công nghệ 34.14 58.84 67.50 48.05 48.28 59.70 55.69 52.44 Kinh doanh 65.62 59.53 48.05 70.46 69.04 8.87 60.22 69.38 Thời 52.57 54.58 43.65 45.71 16.86 0.00 48.88 2.00 Văn hóa – Giải trí 47.07 63.73 72.12 58.18 36.10 5.71 68.75 7.45 Pháp luật 57.09 77.05 84.86 63.75 80.53 49.42 66.25 63.74 Thể thao 69.89 68.77 79.82 70.17 71.03 58.02 76.64 68.40 Sức khỏe 62.12 76.87 78.87 66.24 73.37 18.33 68.16 68.25 Trung bình nhãn 58.15 65.22 70.05 62.35 52.98 22.91 64.45 39.93 80 70 60 Accuracy F1-score 50 40 30 20 CNN T2V MNB NB SVM KNN C45 RF Hình PL2.3: So sánh Accuracy F1- score liệu chủ đề luận án Tổng hợp kết từ liệu chủ đề luận án thuật toán MNB cho kết cao nhất, thuật toán cho kết xếp xỉ W2V C45 Thuật toán C45 thuật toán SVM cho kết tốt liệu 20 NewsGroups SemEval-2017 lại không cho kết cao liệu chủ xxi đề luận án So sánh kết thực nghiệm độ xác Accuracy F1-score thuật tốn ngữ liệu chủ đề luận án minh họa Hình 3.6 Bảng PL2.8: Độ xác thuật toán ngữ liệu cảm xúc luận án Nhãn CNN W2V MNB NB SVM K-NN C4.5 RF Anger 56.36 59.39 62.73 62.42 62.12 54.85 60.91 55.76 Disgust 55.76 58.48 63.03 60.61 62.73 54.85 56.36 54.85 Fear 53.64 60.79 56.67 56.36 58.18 55.45 52.12 55.76 Joy 47.88 60.03 67.58 58.48 61.82 50.30 52.12 59.70 Love 66.97 71.21 72.73 69.39 70.30 46.97 66.67 69.70 Sad 51.21 55.76 57.58 54.55 53.33 47.58 54.24 53.03 Other 49.39 57.27 56.67 54.25 55.15 54.85 53.94 54.85 Trung bình nhãn 54.46 60.85 62.42 59.44 60.52 52.12 56.62 57.66 Kết thu độ xác Accuracy từ ngữ liệu cảm xúc luận án trình bày Bảng PL2.8 Kết cho thấy thuật toán MNB đạt giá trị Accuracy cao 5/7 nhãn Thuật toán W2V cho giá trị Accuracy cao hai nhãn lại “Fear” “Other” Xét kết trung bình tất nhãn, thuật toán MNB cho giá trị Accuracy cao nhất, thuật toán W2V thuật toán SVM Bảng PL2.9: F1- score thuật toán ngữ liệu cảm xúc luận án Nhãn CNN W2V MNB NB SVM K-NN C4.5 RF Anger 41.11 66.68 63.79 60.81 42.07 1.29 57.84 9.70 Disgust 64.23 60.93 62.36 58.82 47.12 1.29 50.87 6.21 Fear 27.61 47.63 53.19 47.26 36.82 3.87 48.13 7.46 Joy 53.16 57.99 58.95 58.96 62.83 15.87 45.77 61.65 Love 61.18 64.61 68.34 68.30 72.24 50.00 63.51 72.46 Sad 59.36 49.30 51.53 52.27 38.21 50.13 47.44 19.03 Other 36.37 37.89 49.98 53.37 42.18 2.58 51.37 16.48 Trung bình nhãn 49.00 55.00 58.30 57.11 48.78 17.86 52.13 27.57 xxii 70 60 50 40 Accuracy F1-score 30 20 10 CNN T2V MNB NB SVM KNN C45 RF Hình PL2.4: So sánh Accuracy F1- score liệu cảm xúc luận án Tổng hợp kết từ liệu cảm xúc luận án cho thấy thuật toán MNB cho kết cao nhất, thuật toán NB thuật toán W2V Tương tự kết liệu chủ đề luận án, thuật toán C45 SVM cho kết tốt liệu 20 NewsGroups SemEval-2017 lại không cho kết cao liệu cảm xúc luận án So sánh kết thực nghiệm độ xác Accuracy F1-score thuật tốn ngữ liệu cảm xúc luận án minh họa Hình PL2.4 Từ kết Accuracy F1-score thu ngữ liệu thực nghiệm, xét kết thực nghiệm, luận án lựa chọn sử dụng thuật toán MNB để gán nhãn hay xác định đặc trưng chủ đề, đặc trưng cảm xúc đặc trưng quan điểm viết mơ hình đề xuất luận án phần sau xxiii PHỤ LỤC C: DANH MỤC CÁC TỪ DỪNG SỬ DỤNG TRONG LUẬN ÁN a lô ba ba ngày biết biết buổi ngày bác bán cấp bên bị bước khỏi chừ nhiêu bằng bị bỏ khơng bỏ nhỏ bỏ xa nhiên thuộc cao sang cha cho cho chung lại chuyện mày chúng tơi chưa chưa kể chắc người ba ba ba biết biết trước biết buổi sớm bỏ bán bên có bước tới riêng bất ngờ bỏ bỏ lại bỏ bỗng điều chưng cao cao số cho biết cho chung chuẩn bị chúng ơng chơi chưa có chưa tính chắn vào ba ba tăng biết việc buổi bà bán bên cạnh bước thân lâu không bỏ bà bỏ bỏ chốc thấy cao lâu cao thấp cho cho cho chung chung chuyển chúng chơi họ chưa cần chưa ăn ai anh ba biết biết buổi làm bà bác bạn ý bắt đầu người vào bị bỏ cha bỏ bỏ riêng dưng đâu cao cao chia sẻ cho hay cho thấy cho ăn nỗi chung cho chuyển tự thị dẫn chưa chưa dùng hẳn anh ba họ chừng buổi bán bên bước chầy bị bỏ bỏ việc không đâu cao cao xa cho cho tin cho chung chung chuyển đạt chính điểm khách chưa chưa dễ lòng xxiv chịu chưa chọn bên nghe lị cách nước cịn có có có phải có đáng cùng cắt cơ hội nghĩ thảy cảm thấy cần cụ thể như có dành dành dù dì dùng cho nước dạ dẫn dễ dễ dễ thấy cách giảm giống người giữ lấy gây cho gì gần ngày chị chịu lời chọn khơng nhìn con cuối cậu cách cịn có có có ngày có số có ý có đâu chung với tính chừng mà ngày thể cảm ơn cần cấp cậu việc dài dù dùng hết dạ khách dễ dùng dễ chơi dễ ăn em giảm giống giữ ý gây giống gần có chị chịu tốt kể không cuối càng cách cái cịn có có có người có tháng có ăn có tăng cực ăn người tin cấp cần điểm dài lời dì dùng làm bán mà dễ dễ đâu em em giảm thấp giống gây gần gần xa chị chịu ăn chớ chứ coi nhà cuối điểm hay cách câu hỏi cịn có chuyện có nhiều có điều cóc khơ dẫn cả nhà ăn cấp số cần số cụ thể tin dài dù dù dùng đến dễ khiến dễ sử dụng giá trị giảm giờ đến lúc gây thêm gần bên gần tên chịu chọn chi coi mịi tính cá nhân cách khơng họ cịn thời gian có có họ có nhà có điều kiện cơng nhiên tuổi nên nghe năm đến cấp trực tiếp cụ thể dành dùng dài dễ nghe giá trị thực tế giống lâu giữ gây gần hết gần đến xxv gặp hay biết hay hiểu hết hết hết họ xa hỗ trợ nên khoảng không khác khác khách khó làm khó thấy khơng khơng có khơng dùng khơng ngồi khơng thể khơng để kể loại tay phải làm làm lại làm nên làm làm lự lâu lên cao lên số lúc lúc sáng lúc lượng từ lại giống lại lấy có lấy lại lấy thêm lấy để lần lần tìm lời mang nặng mà không mạnh mọi thứ lần cách gặp khó khăn hay hay hay nói hết chuyện hết hỏi khi trước khác khó khó mở khó tránh khơng biết khơng có khơng khơng nhận khơng tính khẳng định kể loại từ là làm cho làm lấy làm làm tin làm lên lên xuống lúc khác lúc trước lý lại lại làm lại lấy lấy lấy lần lần sang lớn lời nói mang mà lại lúc việc một gặp phải hay không hay hết hỏi lại khác khiến tốt khác khó biết khó nghe khơng khơng bán khơng khơng hay khơng không điều kiện khỏi kể tới là làm làm làm riêng làm làm lâu lên mạnh lên đến lúc lâu lúc lượng lại lại người lại ăn lấy giống lấy lấy vào lần khác lần sau lớn lên mang muốn mà thơi cịn người mối ngày gồm hay tin hoàn toàn hơn trước hết họ hỏi xem khơng khoảng khác khác thường khó chơi khó nghĩ không không không cần không khỏi khơng khỏi nói kể từ ln là làm làm làm tăng làm lâu ngày lên ngơi lịng lúc lúc lượng lại lại nói lại lấy làm lấy sau lấy xuống lần lần lần theo lớn nhỏ mang lại mà mà mọi nơi mỗi người lúc hay hay làm hay đâu hầu hết hết nói họ gần hỏi xin khoảng cách khác khác xa khó khăn khó nói khơng khơng cịn khơng khơng kể không không đầy kể liên quan ln nhiều làm làm lịng làm làm theo làm lâu lên lên nước lịng khơng lúc lúc đến lượng số lại lại lấy lấy lý lấy số lấy lần lần trước lời mang mang mà mọi lúc xxvi vài mợ ngay nghe nghe nhìn nghe thấy nghe nghĩ nguồn ngày ngày người khách ngồi không nhanh lên nhiều nhà khó nhà việc nhìn chung nhìn xuống chơi sau luật sinh đán nhận làm nhận nhằm để nhớ nhờ chuyển những muốn nên người nói bơng nói lại nói riêng nói trước nói đến nơi nơi nước nặng mở mức ngay thật nghe nghe tin nghĩ tới ngày tháng ngơi người nguồn ngồi sau nhanh tay nhà làm nhìn lại nhóm không thường trước mà định nhận nhằm nhớ lại nhờ có những phải nên nên tránh nói chung nói nhỏ nói rõ nói tốt nói đủ nước nước nặng có mở mang đến tức khắc nghe hiểu nghe nói nghe trực tiếp nghĩ xa nhà người người nghe ngồi nhà ngồi nhìn nhận như tuồng nhược mực nhận nhận nhằm nhỏ nhớ lấy nhờ nhờ nào đâu nói khó nói phải nói thêm nói với năm nước nước xuống nặng cần hay mở nước tức nghe khơng nghe nghĩ nghĩ đến ngồi xa ngày cấp ngày ngơi thứ người hỏi người người ngồi nhà nhà nhìn theo như tâm nhận biết nhận thấy nhằm lúc nhỏ người nhớ nhờ nào nên nói nói qua nói thật nói xa năm tháng nước nước ăn nặng khơng mở từ nghe lại nghe rõ nghĩ lại qua ngày đến người khác người nhận ngồi nhanh nhiều nhà chung nhà tơi nhìn nhìn thấy thể ý loạt tề nhận họ nhận việc nhằm vào nhớ nhờ lúc hay nên làm nói nói lên nói nói nói ý nơi nước lên nước đến nặng mà xxvii phía phải phải phải lời phần phần việc nước qua lần quan trọng quay lại quá tay đáng ra ý riêng rồi sang sau sau so sáng số cụ thể số thiếu sử dụng tanh ăn không thay đổi theo tin thuộc từ tháng tháng thì thơi thích tự thường thường tính phè phía sau phải biết phải phải người phần lớn theo qua qua ngày quan trọng vấn đề quay số quá chơi người điều riêng nước rón rồi xem sang năm sau so với sáng ngày sì biết số loại tay than thanh thay đổi tình trạng nghe thuộc thái thêm thích ý thương thường số thường phía phía phù hợp phải phải phần nhiều tính qua chuyện qua tay quan tâm quay lời tin quận ra trọi rõ răng rốt sang sáng cho sau sau sáng rõ hay số sớm tay quay thanh tính theo thiếu nhiên thuộc tháng thêm chuyện thích thím thường thường thường xuất phía bên phía phải phải phần qua khỏi qua quay quá mức trình ra lại tay rõ sau sang tay sau sau sáng số số người sớm ngày việc ba điều kiện theo bước thiếu thuộc cách tháng ngày thêm phải thích thơi thường bị thường thơi thường đến phía bạn phía trước phải cách phải lại phải tay phần sau qua lại qua quay bước bán nhiều tuổi lời vào bước rõ thật lâu rồi tay sao sau hết sau sáng ý đặt số cho biết số phần chơi chuyển điểm theo thiếu điểm thuộc lại thành tháng năm thêm vào thích thuộc thơi việc thường hay thường thường xxviii thảo thấy cấp thật tốt lại thế thời điểm thực tế trong tránh tình trạng trước trước ngày trước trả trực tiếp nhiên tuổi tên tênh tìm tính tị te tăng thêm tại tạo ý tắp tốt mối tới tức từ từ từ phần tự cao veo vài nhà vào gặp thấp thấy tháng từ thật mà tháo thực tiếp tục trong tránh xa trước hết trước trước trả trước trực tiếp làm tuổi tên tìm tìm việc tính người tơi tăng tăng tạo tạo điều kiện tới tốt tốt ngày tới gần từ loại từ từ từng thời gian tự tự ý việc vài nơi vào khoảng thấp thật thật thế thời gian thứ thực tin tiếp trong tránh trước trước sau trả trời đất tuy tuổi tên họ tìm bạn tình trạng tính tơi tăng chúng tạo hội tất tập trung tỏ tốt bạn tới mức từ từ từ từng đơn vị tự lượng tự ăn việc vài vài tên vào lúc thấp thật thật chuẩn bị nên thường nhiên thời gian sử dụng thứ thực tin thêm trong số tránh khỏi trước trước tiên trả trở thành có tên tự tìm cách tính tính từ tơng tốc tăng cấp lịng đâu tạo nên tất tốt tới nơi từ từ từ điều từng tự tính vài ba vài điều vào vùng thấp xuống chí thật thật thế thế nói thời gian tính thứ đến thực tin vào tồ lúc vùng tránh trước trước tuổi trả lại tuy tên tìm hiểu tính cách tăng giảm nơi tạo lự tốt tớ tới từ từ tính từ nhà tự tự tạo vài người vào vào đến xxix ví vơ vàn vượt vậy phần vừa qua xa gần xin xồnh xoạch xử lý q hơ ông ông ăn ăn làm ăn sáng tay điểm đáng đáng số đâu có tuổi đưa chuyện đưa tới đảm bảo đầy tuổi đặt mức đến đến gần đến đến chịu vèo vùng vượt khỏi vấn đề vậy sau với vừa vừa xa nhà xem xin gặp yêu cầu vào chà ít lâu kê ơng nhỏ ăn chịu ăn người ăn tay điểm đáng kể đánh giá lâu với đưa em đưa vào đặc biệt đặt đến đến hay đến ngày đến tuổi bước vì vơ hình trung vùng lên vượt vấn đề quan trọng mà về tay vừa vừa vừa xa xem lại xin xảy ào dà biết nhiều thơi ơng tạo chà ý ăn ăn ngồi ăn điều điểm gặp đâu đã đơn vị đưa đưa lời đầy đặt đặt trước đến cực đến đến nơi đến xem vâng chưng ví vơ kể vùng nước vạn nên khơng vị trí với vừa lúc xa xa xem xuống có thấy ông từ ăn ăn hết ăn ăn điều điểm đâu hay ngày đưa đưa tay đưa xuống nước đầy năm đặt làm đặt để đến đến lúc đến điều đều ý vơ luận vả nước vừa xa cách xa xa xem số xuất áà ít ông ý ăn chung ăn hỏi ăn riêng điều kiện phải không đủ đưa cho đưa tin đưa đến tin đạt đầy đặt đến đến đến lời đến đến đâu để xxx đồng thời đủ điều ơi ở ứừ ừừ để giống để phần đủ đủ điểm là phải nhờ để không để đủ dùng thật ồồ ờờ năm để lòng để đủ nơi hay ối ở để lại đủ số hẳn lại vào ... CHƯƠNG 4: HÀNH VI VÀ QUAN TÂM CỦA NGƯỜI DÙNG THEO HÀNH VI TRÊN MẠNG XÃ HỘI 115 4.1 HÀNH VI CỦA NGƯỜI DÙNG TRÊN MẠNG XÃ HỘI 115 4.1.1 Hành vi phân loại hành vi người dùng mạng xã hội. .. TỔNG QUAN VỀ HÀNH VI, QUAN TÂM VÀ MƠ HÌNH NGƯỜI DÙNG TRÊN CÁC MẠNG XÃ HỘI 15 1.1 Mạng xã hội hành vi người dùng mạng xã hội 15 1.1.1 Mạng xã hội 15 1.1.2 Dữ liệu mạng xã hội. .. 1.1.3 Người dùng cộng đồng người dùng mạng xã hội 19 1.1.4 Mô hình người dùng mạng xã hội 21 1.1.5 Quan tâm người dùng mạng xã hội 23 1.1.6 Chủ đề trang mạng xã hội 24 1.1.7 Hành

Ngày đăng: 25/06/2021, 05:36

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan