1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu và ứng dụng các phương pháp xác định người có ảnh hưởng trên mạng xã hội thực tế (Facebook)

59 5 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 59
Dung lượng 3,61 MB

Nội dung

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI ĐỒ ÁN TỐT NGHIỆP Nghiên cứu ứng dụng phương pháp xác định người có ảnh hưởng mạng xã hội thực tế NGUYỄN XXX Ngành Công nghệ thông tin Chuyên ngành Hệ thống thông tin Giảng viên hướng dẫn: PGS TS Thân Quang Khốt Chữ ký GVHD Bộ mơn: Viện: Hệ thống thông tin Công nghệ thông tin truyền thông HÀ NỘI, 6/2021 ĐỀ TÀI TỐT NGHIỆP PHIẾU GIAO NHIỆM VỤ ĐỒ ÁN TỐT NGHIỆP Thông tin sinh viên Mục đích nội dung ĐATN Nghiên cứu ứng dụng phương pháp xác định người có ảnh hưởng mạng xã hội thực tế Các nhiệm vụ cụ thể ĐATN • Tìm hiểu lý thuyết độ đo trung tâm tầm ảnh hưởng nút đồ thị • Thu thập xử lý liệu từ mạng xã hội (cụ thể Facebook) • Cài đặt, thử nghiệm đánh giá hiệu phương pháp Lời cam đoan sinh viên Em tên Nguyễn XXX xin cam đoan đề tài ĐATN: “Nghiên cứu ứng dụng phương pháp xác định người có ảnh hưởng mạng xã hội thực tế ” cơng trình nghiên cứu độc lập hướng dẫn giảng viên hướng dẫn PGS.TS Thân Quang Khoát Đề tài, nội dung báo cáo sản phẩm mà em nỗ lực nghiên cứu trình làm đồ án Các số liệu, kết trình bày hồn toàn trung thực, em xin chịu trách nhiệm kỷ luật mơn nhà trường có vấn đề xảy Hà Nội, ngày … tháng … năm 2021 Sinh viên thực Ký ghi rõ họ tên Xác nhận giáo viên hướng dẫn mức độ hoàn thành ĐATN cho phép bảo vệ: Giáo viên hướng dẫn Ký ghi rõ họ tên LỜI CẢM ƠN Đối với thân em, quãng thời gian năm sinh viên Đại học Bách Khoa Hà Nội thực khoảng thời gian quý giá đáng nhớ đời Em học tập làm việc ngơi trường tốt Việt Nam, có người bạn học tập, làm việc bảo tận tình thầy cô Viện Công nghệ thông tin truyền thông Em xin gửi lời cảm ơn trân trọng đến thầy, cô Em xin chúc thầy cô mạnh khỏe thành công nghiệp giảng dạy nghiên cứu Mặc dù người thiên làm ứng dụng hệ thống, thật may mắn hướng dẫn tận tình PGS TS Thân Quang Khốt Với sở thích, mong muốn khai phá liệu, thầy tiếp nhận định hướng cho em đề tài tốt nghiệp Thầy truyền đạt cho em kiến thức quý báu học thuật mà người chia sẻ, giúp đỡ em trình làm việc Em xin gửi lời cảm ơn chân thành đến thầy Cuối cùng, em gửi lời cảm ơn sâu sắc đến gia đình em, người ln bên em động lực để em tiếp tục phấn đấu đường nghiệp sau Tóm tắt nội dung đồ án Trong thời đại Cách mạng 4.0 ngày nay, mạng xã hội ngày phổ biến thiếu người Mạng xã hội giúp cho cập nhật tin tức xã hội, tin nhiều người quan tâm tin hot, giúp đẩy mạnh trình kết nối bạn bè, người thân, nâng cao kỹ sống hiểu biết qua đăng, video,… Đặc biệt, việc kinh doanh qua mạng xã hội phát triển vũ bão giới Việt Nam Marketing người có ảnh hưởng (influencer marketing) hình thức marketing qua mạng xã hội Đây hình thức marketing với trọng tâm đặt vào người có tầm ảnh hưởng việc đặt thị trường mục tiêu tất phương tiện truyền thông xã hội Hình thức nhận diện cá nhân có sức ảnh hưởng nhóm khách hàng tiềm định hướng hoạt động marketing xung quanh người có ảnh hưởng Bài tốn đánh giá độ ảnh hưởng hay tầm quan trọng người dùng mạng xã hội lĩnh vực ứng dụng quan trọng sử dụng kĩ thuật phân tích mạng xã hội Tuy nhiên, nghiên cứu cịn hạn chế độ xác tính tốn độ đo chấp nhận phổ biến cộng đồng Đồ án trình bày cách chi tiết phương pháp để nhận biết người có ảnh hưởng mạng xã hội Sinh viên thực Ký ghi rõ họ tên MỤC LỤC CHƯƠNG GIỚI THIỆU ĐỒ ÁN 11 1.1 Đặt vấn đề 11 1.2 Phát biểu toán 12 1.3 Nhiệm vụ đồ án 12 1.4 Ý nghĩa đồ án 13 CHƯƠNG CƠ SỞ LÝ THUYẾT 14 2.1 Tổng quan mạng xã hội 14 2.2 Lý thuyết đồ thị 15 Định nghĩa 15 Biểu diễn ma trận đồ thị 15 Một số loại đồ thị 15 2.3 Phân tích mạng xã hội (Social Network Analysis - SNA) 17 Bối cảnh 17 Ứng dụng thực tế 17 2.4 Một số tốn điển hình 18 Dự đoán liên kết 18 Phân loại nút 19 Phân cụm phát cộng đồng 19 Phân loại đồ thị 20 2.5 Phân tích độ ảnh hưởng nút đồ thị 20 Độ đo trung tâm dựa bậc (Degree Centrality) 22 Độ đo trung tâm dựa lân cận (Closeness Centrality) 24 Độ đo trung tâm dựa trung gian (Betweennees Centrality) 25 Độ đo trung tâm dựa trị vector đặc trưng (Eeigenvector Centrality) 26 Thuật toán PageRank cổ điển 27 Thuật toán Quantum PageRank 31 Thuật toán HITS 32 CHƯƠNG THU THẬP VÀ TIỀN XỬ LÝ DỮ LIỆU 33 3.1 Mạng xã hội facebook 33 Tổng quan 33 Các khái niệm mạng xã hội Facebook 34 Khó khăn việc thu thập liệu facebook 35 3.2 Phương pháp thu thập liệu 35 Mô tả liệu thu thập 37 CHƯƠNG ĐÁNH GIÁ THỬ NGHIỆM 39 4.1 Thực nghiệm đánh giá với liệu ego-facebook 39 Dữ liệu sử dụng 39 Thực nghiệm sử dụng thuật toán 39 Đánh giá kết so sánh 45 4.2 Thực nghiệm đánh giá với liệu thực 48 Thu thập trích rút liệu 49 Mơ hình hóa sang đồ thị đồng 50 Thực nghiệm sử dụng thuật toán 52 CHƯƠNG KẾT LUẬN 57 5.1 Tổng hợp kết đạt đồ án 57 5.2 Công việc hướng tới tương lai 57 DANH MỤC HÌNH VẼ Hình 1: Tổng quan internet Việt Nam tính đến tháng 2/2021 [1] 11 Hình 2: Mơ hình mạng xã hội (Social Network) [3] 14 Hình 3: Biểu diễn ma trận đồ thị .15 Hình 4: Đồ thị vô hướng (undirect graph) .16 Hình 5: Đồ thị có hướng (direct graph) 16 Hình 6: Các dạng liệu đồ thị thực tế 18 Hình 7: Bài tốn dự đốn liên kết đồ thị 19 Hình 8:Phân loại nút đồ thị 19 Hình 9: Phân cụm phát cộng đồng đồ thị [4] .20 Hình 10: Đồ thị mơ hình hóa tác dụng phụ thuốc polypharmacy [5] 20 Hình 11: Mơ hình mạng xã hội facebook [6] 22 Hình 12: Đồ thị vơ hướng độ đo trung tâm dựa trung tâm bậc 23 Hình 13: Mơ tả mức độ Closeness Centrality đồ thị 25 Hình 14: Mơ tả mức độ Betweenness Centrality đồ thị .26 Hình 15: Độ đo trung tâm dựa trung gian, lân cận trị vector đặc trưng 27 Hình 16: Sơ đồ hoạt động PageRank 28 Hình 17: Các bước thực PageRank (Nguồn: [14]) 30 Hình 18: So sánh PageRank Quantum PageRank [16] 31 Hình 19: Giao diện facebook 33 Hình 20: Lượng người sử dụng facebook giới tính đến tháng 2/2021 (Nguồn: https://bit.ly/3w16br5 ) 34 Hình 21: Dữ liệu Graph API facebook (Nguồn: https://bit.ly/3tQaeop) 35 Hình 22: Data flow scrapy [19] 36 Hình 23: Các bình luận viết 38 Hình 24: Đồ thị theo độ đo trung tâm dựa trung tâm bậc 39 Hình 25: Đồ thị theo độ đo trung tâm dựa trung gian .40 Hình 26: Đồ thị theo độ đo trung tâm dựa theo lân cận 41 Hình 27: Đồ thị theo độ đo trung tâm dựa trị vector đặc trưng 42 Hình 28: Đồ thị theo độ đo trung tâm dựa theo PageRank 43 Hình 29: Đồ thị theo độ đo trung tâm dựa theo HITS 44 Hình 30: Đồ thị đường biểu diễn kết tính tốn độ ảnh hưởng 4039 người dùng đánh số từ đến 4038 mạng xã hội Facebook PageRank 45 Hình 31: Đồ thị đường biểu diễn kết tính tốn độ ảnh hưởng 4039 người dùng đánh số từ đến 4038 mạng xã hội Facebook Closeness Centrality 46 Hình 32: Đồ thị đường biểu diễn kết tính tốn độ ảnh hưởng 4039 người dùng đánh số từ đến 4038 mạng xã hội Facebook Degree Centrality 46 Hình 33: Đồ thị đường biểu diễn kết tính tốn độ ảnh hưởng 4039 người dùng đánh số từ đến 4038 mạng xã hội Facebook Betweenness Centrality 47 Hình 34: Các bước thực xử lý liệu thu thập .48 Hình 35: Nội dung liệu thơ thu thập 49 Hình 36: Dữ liệu ghi viết gốc .50 Hình 37: Dữ liệu ghi trả lời bình luận viết gốc 50 Hình 38: Đồ thị đồng sau xử lý 51 Hình 39: Đồ thị theo độ đo trung tâm dựa theo bậc với liệu thực .52 Hình 40: Đồ thị theo độ đo trung tâm dựa theo trung gian với liệu thực 53 Hình 41: Đồ thị theo độ đo trung tâm dựa theo lân cận với liệu thực 53 Hình 42: Đồ thị theo độ đo trung tâm dựa theo PageRank với liệu thực 54 Hình 43: Đồ thị theo độ đo trung tâm dựa theo Quantum PageRank với liệu thực 54 DANH MỤC TỪ VIẾT TẮT KOL MXH TMH HITS Người ảnh hưởng Mạng xã hội Độ đo Tendency to Make Hub Thuật toán Hubs and Authorities DANH MỤC BẢNG Bảng 1: Thứ hạng 10 người dùng có độ đo cao theo thuật toán trung tâm 47 Bảng 2: Độ tương quan thuật toán PageRank thuật toán degree, betweenness closeness 48 Bảng 3: Mô tả liệu thu thập từ Facebook 49 Bảng 4: Dữ liệu sau mơ hình hóa sang đồ thị đồng 51 Bảng 5: Xếp người có hạng cao theo liệu thực từ ngày 11/04/2021 đến 17/01/2021 52 Bảng 6: Độ tương quan thuật toán PageRank thuật toán degree, betweenness closeness theo liệu thực 55 Bảng 7: Bảng kết xếp hạng theo tuần với liệu thực 56 CHƯƠNG GIỚI THIỆU ĐỒ ÁN 1.1 Đặt vấn đề Mức độ phổ biến mạng xã hội ngày minh chứng việc sử dụng chúng ngày người Lấy ví dụ Facebook có 2,3 tỷ người dùng hàng tháng theo số liệu Mạng xã hội cho phép người dùng chia sẻ câu chuyện, viết, ý tưởng cá nhân, đăng ảnh, video đồng thời thông báo hoạt động họ mạng giới thực Mạng xã hội vận hành tất tảng máy tính hay điện thoại thông minh Việc khai phá liệu mạng xã hội có ý nghĩa to lớn tính ứng dụng tính cấp thiết Hiện nay, với dân số quốc gia xấp xỉ 97 triệu người, mà số lượng kết nối di động lên đến 145 triệu (tỷ lệ thâm nhập dân số đạt 150%), đó, 68.17 triệu người (chiếm 70% tổng dân số) kết nối internet, 65 triệu người tham gia vào mạng xã hội (chiếm 67% tổng dân số) theo thông tin từ Báo Cáo năm 2021 Tổng quan internet Việt Nam 2/2021 180 160 154.4 Đơn vị (triệu) 140 120 Total population 100 80 60 Mobile connections 97.75 Internet users 68.72 72.01 Active social media users 40 20 Hình 1: Tổng quan internet Việt Nam tính đến tháng 2/2021 [1] Những số liệu mang đến hội béo bở cho nhà tiếp thị gia tăng tìm kiếm cách tiếp cận hiệu lượng dối tượng khách hàng tiềm Việt Nam Bên cạnh đó, tham khảo tỉ lệ người dùng tương tác với mạng xã hội Việt Nam tính đến tháng năm 2021, “ông trùm” Facebook thống lĩnh tỉ lệ người dùng, theo sát sau chẳng thể khác Youtube, Instagram - TikTok - Twitter hoàn thiện danh sách “Năm mạng xã hội yêu thích Việt Nam” Những thơng tin quan trọng tiếp thị gia thực chiến lược cho kênh mạng xã hội trình hoạch định kiến tạo thực thi hoạt động truyền thơng thơng qua người ảnh hưởng Do đó, việc xác định người có ảnh hưởng mạng xã hội quan trọng, giúp cho nhãn hàng, sản phẩm xác định đối tượng cần tập trung để giúp đẩy mạnh quảng cáo sản phẩm cho Hiện nay, Việt Nam có nhiều hạng mục người ảnh hưởng phát triển Giải trí, Đời sống/Phong cách sống, Gaming, Gia đình-trẻ em, âm nhạc,… Có thể thấy việc xác định người ảnh hưởng vô có ý nghĩa mặt khác chứa đựng nhiều khó khăn thách thức Mạng xã hội lĩnh vực nghiên cứu nổi, hành vi người dùng ln thay đổi cập nhật liên tục Có nhiều khó khăn việc xác định người ảnh hưởng 1.2 • Thứ nhất, việc thu thập liệu vơ khó khăn chế, tập trung vào liệu Facebook, Facebook gắt gao việc phát truy cập bất thường dẫn đến khóa tài khoản thu thập liệu • Thứ hai, phương pháp đánh giá đơn giản, không đánh giá ảnh hưởng tầm quan trọng • Thứ ba tính tốn đồ thị phức tạp mở rộng đồ thị số lượng nút cạnh • Thứ tư, phương pháp ứng dụng tập trung vào mạng lưới bạn bè để đánh giá mức độ ảnh hưởng sử dụng phương pháp đểm thống kê để đưa người có tầm ảnh hưởng mạng xã hội dẫn đến nhiều hạn chế độ xác tính tốn Phát biểu tốn Đồ án tập trung vào ý tưởng phân tích liệu mạng xã hội thu thập để xác định người dùng có tầm ảnh hưởng theo chủ đề cụ thể Bằng việc xử lý liệu tương tác người dùng với viết tổ chức thành liệu dạng đồ thị, từ sử dụng thuật tốn, độ đo trung tâm tầm ảnh hưởng nút đồ thị để so sánh xác định người dùng có tầm ảnh hưởng mạng xã hội theo chủ đề định 1.3 Nhiệm vụ đồ án Để giải toán đặt ra, cần thực công việc sau: - Từ liệu thô thu thập, xử lý liệu cách tạo liên kết thực thể cá nhân mạng xã hội theo thời gian thành mạng lưới tương tác cá nhân mạng - Sử dụng thuật toán độ đo trung tâm tầm ảnh hưởng nút đồ thị để phân tích liệu - So sánh đánh giá hiệu phương pháp 1.4 Ý nghĩa đồ án Người ảnh hưởng người có tiếng nói mạng xã hội trở thành nhân vật có sức ảnh hưởng đến sống người khác Tuy nhiên, với khổng lồ mạng xã hội nên khó để xác định, đồng thời nhà 10 • • Hình 29: Đồ thị theo độ đo trung tâm dựa theo HITS 45 Đánh giá kết so sánh Độ ảnh hưởng nút tính tốn trực quan hóa dạng biểu đồ cột tren hình 33 hình 34, biểu diễn nút giá trị độ ảnh hưởng tương ứng Thực nghiệm liệu ego-Facebook : Hình 30: Đồ thị đường biểu diễn kết tính tốn độ ảnh hưởng 4039 người dùng đánh số từ đến 4038 mạng xã hội Facebook PageRank Phân tích kết độ ảnh hưởng 4039 người dùng từ liệu nói cho thuật toán PageRank, độ ảnh hưởng cao người dùng đánh số 3437 (����3437 = 0.007614), kết cao gấp 186 lần độ ảnh hưởng người dùng đánh số 2079, 2195, 2269, 2457, 2470 (đều có ���� = 0.000041) Và tổng tất độ ảnh hưởng ( ����� = 1) Tính trung tâm Eigenvector đo lường tầm quan trọng nút cân nhắc tầm quan trọng nút lân cận Ví dụ: nút có 300 người bạn tương đối không tiếng Facebook có mức độ trung tâm thấp so với người có 300 người bạn phổ biến (như Sơn Tùng, Jack) Theo mạng egofacebook mạng bạn bè, nút có bạn bạn nút tồn nút có nhiều bạn bè giá trị eigenvalue nút cao Nên khác với độ đo cịn lại độ trung tâm tỷ lệ số lượng bạn bè Đối với HITS, giá trị quan tâm giá trị thẩm quyền ���ℎ����� phụ thuộc vào giá trị trung tâm nút liên kết với nó, nên khác với độ đo cịn lại độ trung tâm tỷ lệ với số lượng kết nối bạn bè Để có liệu so sánh, độ trung tâm dựa bậc, độ trung tâm dựa trung gian, độ trung tâm dựa lân cận tính liệu ego-facebook Kết độ đo ứng với phương pháp biểu đồ hóa sau: 46 Hình 31: Đồ thị đường biểu diễn kết tính tốn độ ảnh hưởng 4039 người dùng đánh số từ đến 4038 mạng xã hội Facebook Closeness Centrality Hình 32: Đồ thị đường biểu diễn kết tính tốn độ ảnh hưởng 4039 người dùng đánh số từ đến 4038 mạng xã hội Facebook Degree Centrality 47 Hình 33: Đồ thị đường biểu diễn kết tính toán độ ảnh hưởng 4039 người dùng đánh số từ đến 4038 mạng xã hội Facebook Betweenness Centrality Qua quan sát, biểu đồ đường biểu diễn giá trị độ đo nút phản ánh tương quan định kết đầu thuật toán Từ kết thu được, 10 người dùng có độ đo cao thuật tốn trích rút sau: # PageRank Degree Centrality Betweenness Centrality Closeness Centrality 10 3437 107 1648 1912 348 686 3980 414 698 107 1684 1912 3437 2543 2347 1888 1800 1663 107 1684 3437 1912 1085 698 567 58 428 107 58 428 563 1684 171 348 483 414 376 Bảng 1: Thứ hạng 10 người dùng có độ đo cao theo thuật tốn trung tâm Bảng liệu cho thấy sử dụng thuật tốn khác để tính độ ảnh hưởng người dùng danh sách {0, 107, 1684, 1912, 3437} danh sách 10 người dùng có độ ảnh hưởng lớn Để có nhìn bao qt tồn dải kết quả, phép tính độ tương quan � (������� �����������) [20] kết đầu thuật toán Quantum PageRank phương pháp cịn lại thực Độ tương quan tính sau: � ∑ �� − ∑ � ∑ � � (�ớ� � �à �ố �ặ� �ữ ��ệ�) Trong đó: X Y hai liệu cần so sánh độ tương quan tính Kết tính độ tương quan biểu diễn bảng đây: # Phương pháp Degree Centrality Độ tương quan với thuật toán PageRank 0.671382 48 Betweenness Centrality Closeness Centrality 0.768196 0.147079 Bảng 2: Độ tương quan thuật toán PageRank thuật toán degree, betweenness closeness Như vậy, tương quan thuật toán PageRank thuật toán độ trung tâm trung gian độ trung tâm dựa bậc nút cao, khoảng 67% tương đồng Mỗi phương pháp tính có đặc trưng riêng rõ rang thấy tác động tổng thể nút mạng thuật toán PageRank cho kết tốt so sánh với phương pháp phổ biến đơn giản khác Để xác nhận tính đắn PageRank, ta kiểm tra liệu thu thập 4.2 Thực nghiệm đánh giá với liệu thực Hình 34: Các bước thực xử lý liệu thu thập Bộ liệu em thu thập mô tả phần 3.1 3.2, liệu bao gồm 141923 nút (người dùng) thu thập từ 1714 viết khoảng thời gian từ ngày 11/04/2021 đến 15/05/2021 Thu thập trích rút liệu Dữ liệu thu thập bao gồm: • • • • • Source : Tên tài khoản bình luận Reply_to : Tên, đường dẫn đến tài khoản trả lời bình luận tài khoản bình luận viết gốc (nếu có) Date : Ngày bình luận Text : Nội dung bình luận Source_url : Đường dẫn đến trang cá nhân tài khoản bình luận viết gốc 49 • • Url : ID viết gốc Page_id : đường dẫn đến trang cá nhân người sở hữu viết gốc Hình 35: Nội dung liệu thô thu thập Mô tả liệu thu thập: Thời gian thu thập Số lượng page/person thu thập Số lượng viết Số lượng bình luận Số lượng page_id 11/04/2021-15/05/2021 141923 1715 37282 187 Bảng 3: Mô tả liệu thu thập từ Facebook Do trình thu thập liệu có xảy vấn đề trùng lặp nên tập liệu thu thập cần phải qua giai đoạn xử lý làm để phù hợp với việc tổ chức cấu trúc liệu cho tốn 50 Hình 36: Dữ liệu ghi viết gốc Hình 37: Dữ liệu ghi trả lời bình luận viết gốc Mơ hình hóa sang đồ thị đồng Dữ liệu mạng xã hội sử dụng đồ án Facebook bao gồm thực thể (Người, Trang, Bài Viết, Bình Luận) Đồ án tập trung vào việc phân tích bình luận viết cách cung cấp liệu mạng xã hội nút trạng thái biểu đồ đồng Ý tưởng mặt định tính thường viết cá nhân (người) trang - Page đại diện cho người chủ đề (giải trí, âm nhạc…) khoảng thời gian định Input: Person (P), Page (Pg), Comment(C), Status(S) Output: G(N, E) N= For Pi in set (P, Pg) do: Add Pi in N Where Pi write a status Sj: If Pk comment status Sj: Add Pk in N Create a connection Cik from Pk to Pi Else Pm reply to a comment Cjk of Pk in Status j: Create a connection Cmk and Cmi End for Return G, N Dữ liệu sau xử lý thành đồ thị: Thời gian thu thập 11/04/2021-15/05/2021 Số nút người sau xử lý 141923 Số lượng liên kết 148839 51 Bảng 4: Dữ liệu sau mơ hình hóa sang đồ thị đồng Hình 38: Đồ thị đồng sau xử lý Thực nghiệm sử dụng thuật toán Các bước thực nghiệm: Bước 1: Thu thập liệu theo tuần Bước 2: Xử lý đưa liệu đồ thị đồng Bước 3: Thực nghiệm so sánh phương pháp xếp hạng nút ảnh hưởng đồ thị Dữ liệu sau tính tốn theo tuần từ 11/04/2021-17/04/2021 4.2.3.1 Degree Centrality • • Thời gian tính tốn : 0.08 giây 10 người có độ đo cao : [4600,1,20358,38917,90255,58807 ,112485,66689,106272,19347] 52 Hình 39: Đồ thị theo độ đo trung tâm dựa theo bậc với liệu thực Xếp hạng 4600 20358 38917 90255 58807 28350 Tên Jack 97 Sơn Tùng MTP Trấn Thành Ngọc Trinh Mỹ Tâm Quang Hải BinZ Bảng 5: Xếp người có hạng cao theo liệu thực từ ngày 11/04/2021 đến 17/01/2021 Thời gian từ ngày 11/4/2021 - 17/4/2021, độ ảnh hưởng Jack 97 nhiều Jack 97 bắt đầu thông báo hát “laylalay” Do thu hút lượng tương tác nhiều Tương tự, Sơn Tùng MTP, anh chuẩn bị phát hành hát “Muộn mà cịn” 4.2.3.2 Betweenness Centrality • Thời gian tính tốn : 20537.272 giây • 10 người có độ đo cao : [1,4600,38917,20358,58807,90255,28350,19347,106272,66689] 53 Hình 40: Đồ thị theo độ đo trung tâm dựa theo trung gian với liệu thực 4.2.3.3 Closeness Centrality • • Thời gian tính tốn : 152.003 giây 10 người có độ đo cao : [1,4600,8566,15491,7451,5045,16926,16782,13274,16457] Hình 41: Đồ thị theo độ đo trung tâm dựa theo lân cận với liệu thực 4.2.3.4 PageRank • • Thời gian tính tốn : 2.7706 giây 10 người có độ đo cao : [4600,1,20358,38917,90255,58807,112485,28350,28350,66689] 54 Hình 42: Đồ thị theo độ đo trung tâm dựa theo PageRank với liệu thực Phân tích kết độ ảnh hưởng 45374 người dùng từ liệu nói cho thuật toán PageRank, độ ảnh hưởng cao người dùng đánh số (����1 = 0.1393), kết cao gấp nhiều lần so với người dùng có thứ hạng đại trà Và tổng tất độ ảnh hưởng ( 4.2.3.5 Quantum PageRank • • ����� = 1) Thời gian tính tốn : 20003.56 giây 10 người có độ đo cao : [4600,1,20358,38917,90255,58807,112485,28350,28350,66689] Hình 43: Đồ thị theo độ đo trung tâm dựa theo Quantum PageRank với liệu thực Kết tính độ tương quan biểu diễn bảng đây: # Phương pháp Degree Centrality Độ tương quan với thuật toán PageRank 0.9999965 55 Closeness Centrality Betweenness Centrality 0.0209417 0.9374025 Bảng 6: Độ tương quan thuật toán PageRank thuật toán degree, betweenness closeness theo liệu thực Bảng so sánh phương pháp : Tuần Tuần Degree 4600 Centrality Betweenness Degree Num time of Node 20358 38917 90255 45374 0.029 4600 38917 20358 90255 45374 22382 PageRank Quantum PageRank Tuần Degree Centrality Betweenness Degree 4600 4600 1 20358 38917 90255 45374 10.86 20358 38917 90255 45374 21358 4600 20346 90255 20358 50017 0.06 4600 20346 20358 90255 50017 22346 PageRank Quantum PageRank Tuần Degree Centrality Betweenness Degree 4600 4600 1 20358 38917 90255 50017 11.35 20346 90255 20358 50017 21035 4600 23806 60135 20358 14112 0.009 4600 23806 20358 60135 14112 1087 PageRank Quantum PageRank Tuần Degree Centrality Betweenness Degree 1 4600 4600 23806 60135 20358 14112 3.5 23806 60135 20358 14112 1065 4600 90255 60135 19347 26098 0.025 4600 90255 60135 19347 26098 5418.13 4600 4600 1 90255 60135 19347 26098 6.44 90255 60135 19347 26098 5218.35 Tuần Phương pháp PageRank Quantum PageRank Phương pháp 4 5 Num of Node time 56 Tuần Degree 20358 90255 20346 Centrality Betweenness 20358 90255 20346 Degree PageRank Quantum PageRank 20358 90255 20346 20358 90255 20346 86644 29530 0.021 86644 29530 6783.68 86644 29530 6.64 86644 29530 6088.52 Bảng 7: Bảng kết xếp hạng theo tuần với liệu thực Nhận xét: Ta nhận thấy tuần Jack 97 (số 4600) Sơn Tùng MTP (số 1) xếp đầu, đến tuần thứ hạng bị tụt xuống (Sơn Tùng MTP vị trí thứ Jack 97 vị trí số 23 ) thời điểm sau kiện hát nên giới thiệu cập nhật trạng thái giảm Thay vào Trấn Thành phát hành phim điện ảnh “Bố già”, Mỹ Tâm (số 90255) mở liveshow “Tri Âm” Số thứ tự 20346 (Thủy Tiên) 23806 (Hồ Ngọc Hà) tài khoản có lượng tương tác cao họ có viết quảng cáo cho nhãn hàng như: MOI cosmetics, 82XPlacenta, Guccimulticolor,… CHƯƠNG KẾT LUẬN 5.1 Tổng hợp kết đạt đồ án Việc phân tích xếp loại nút đồ thị để tìm nhóm phần tử quan trọng mạng việc tạo đồ thị đồng dựa tương tác, hỗ trợ doanh nghiệp hay tổ chức tìm phát nhân tố đặc biệt quan trọng mạng xã hội sở để tìm người có tầm ảnh hưởng theo thời gian thay đổi thể tính động thay đổi mạng xã hội Kết thu từ thuật toán xếp hạng nút bao gồm thuật toán độ trung tâm dựa trung gian, trung tâm bậc trung tâm giữa, thuật toán PageRank, QuantumPageRank HITS Cho thấy thuật toán PageRank thu mức độ tương quan cao so với thuật toán độ trung tâm dựa trung tâm bậc trung tâm trung gian đồng thời có lợi tốc độ tính tốn dùng để đánh giá ảnh hưởng người dùng tác động toàn cấu trúc mạng, giá trị có ý nghĩa phản ảnh tốt ảnh hưởng người mạng Mặc dù hạn chế sách bảo mật riêng tư mạng xã hội, hạn chế kích thước mạng khai phá có phần hạn chế thời gian chạy hệ thống lâu với số lượng nút tăng lên, nhiên kết tính 57 tốn tiềm việc ứng dụng lý thuyết đồ thị, xếp hạng nút có thuật tốn PageRank thể vượt trội 5.2 Công việc hướng tới tương lai Đồ án tập trung tìm hiểu nghiên cứu giải thuật xếp hạng phần tử đồ thị áp dụng khai phá liệu mạng xã hội lĩnh vực giải trí Do thời gian có hạn nên chưa giải triệt để hệ thống phức tạp số lượng nút mở rộng Trong tương lai cần xây dựng giải thuật hướng xử lý song song để cải thiện tính tốn lựa chọn tài ngun xử lý Đối với người ảnh hưởng, ảnh hưởng họ tác động tích cực tiêu cực người dùng mạng xã hội tương lai em phát triển đồ án thêm phân tích ngữ nghĩa để phản ánh tầm ảnh hưởng theo hướng tích cực hay tiêu cực người tiếng TÀI LIỆU THAM KHẢO [1] "http://digimarkvn.com/bao-cao-viet-nam-digital-2021-do-we-are-socialvahootsuite-thong-ke/," [Online] [2] "https://en.wikipedia.org/wiki/The_Social_Network," [Online] [3] "https://bit.ly/3tUACxs," [Online] [4] "https://jiayi.blog/2020/12/31/community-detection/," [Online] [5] "https://academic.oup.com/bioinformatics/article/34/13/i457/5045770," [Online] [6] "https://www.flickr.com/photos/caseorganic/4935757995," [Online] [7] "https://en.wikipedia.org/wiki/Centrality," [Online] [8] L C Freeman, Centrality in social networks conceptual clarification , vol Social networks 1.3, p 215–239, 1979 [9] "https://en.wikipedia.org/wiki/Floyd%E2%80%93Warshall_algorithm," [Online] [10] "https://en.wikipedia.org/wiki/Johnson%27s_algorithm," [Online] [11] "http://snap.stanford.edu/class/cs224w-readings/brandes01centrality.pdf," [Online] [12] "https://en.wikipedia.org/wiki/Eigenvector_centrality," [Online] [13] "http://infolab.stanford.edu/~backrub/google.html," [Online] [14] M N a A E Hodler, "Graph Algorithms: Practical Examples in Apache Spark and Neo4j" [15] B J Gram-Hansen, An Insight Into: Quantum Random Walks [16] G Paparo, Quantum Google Algorithm 58 [17] J M Kleinberg, Authoritative Sources in a Hyperlinked Environment [18] "https://doc.scrapy.org/en/0.10.3/topics/architecture.html," [Online] [19] "https://docs.scrapy.org/en/latest/_images/scrapy_architecture_02.png," [Online] [20] P W M Trochim, "Research Methods Knowledge Base," Research Methods Knowledge Base, 1999 [21] "https://gs.statcounter.com/social-media-stats/all/viet-nam," [Online] 59 ... Mục đích nội dung ĐATN Nghiên cứu ứng dụng phương pháp xác định người có ảnh hưởng mạng xã hội thực tế Các nhiệm vụ cụ thể ĐATN • Tìm hiểu lý thuyết độ đo trung tâm tầm ảnh hưởng nút đồ thị • Thu... kênh mạng xã hội trình hoạch định kiến tạo thực thi hoạt động truyền thông thông qua người ảnh hưởng Do đó, việc xác định người có ảnh hưởng mạng xã hội quan trọng, giúp cho nhãn hàng, sản phẩm xác. .. học, nghiên cứu truyền thông, kinh tế, địa lý, khoa học thông tin, nghiên cứu tổ chức, tâm lý xã hội trở thành chủ đề phổ biến nghiên cứu Ứng dụng thực tế Phân tích mạng xã hội – SNA, ứng dụng

Ngày đăng: 03/04/2022, 21:39

HÌNH ẢNH LIÊN QUAN

Hình 1: Tổng quan về internet tại Việt Nam tính đến tháng 2/2021 [1] - Nghiên cứu và ứng dụng các phương pháp   xác định người có ảnh hưởng trên mạng xã hội thực tế  (Facebook)
Hình 1 Tổng quan về internet tại Việt Nam tính đến tháng 2/2021 [1] (Trang 9)
Hình 5: Đồ thị có hướng (direct graph) - Nghiên cứu và ứng dụng các phương pháp   xác định người có ảnh hưởng trên mạng xã hội thực tế  (Facebook)
Hình 5 Đồ thị có hướng (direct graph) (Trang 14)
Hình 4: Đồ thị vơ hướng (undirect graph) - Nghiên cứu và ứng dụng các phương pháp   xác định người có ảnh hưởng trên mạng xã hội thực tế  (Facebook)
Hình 4 Đồ thị vơ hướng (undirect graph) (Trang 14)
Hình 7: Bài tốn dự đốn liên kết trong đồ thị - Nghiên cứu và ứng dụng các phương pháp   xác định người có ảnh hưởng trên mạng xã hội thực tế  (Facebook)
Hình 7 Bài tốn dự đốn liên kết trong đồ thị (Trang 17)
Hình 8:Phân loại nút trong đồ thị - Nghiên cứu và ứng dụng các phương pháp   xác định người có ảnh hưởng trên mạng xã hội thực tế  (Facebook)
Hình 8 Phân loại nút trong đồ thị (Trang 17)
Hình 9: Phân cụm và phát hiện cộng đồng trong đồ thị [4] - Nghiên cứu và ứng dụng các phương pháp   xác định người có ảnh hưởng trên mạng xã hội thực tế  (Facebook)
Hình 9 Phân cụm và phát hiện cộng đồng trong đồ thị [4] (Trang 18)
Hình 11: Mơ hình mạng xã hội facebook [6] - Nghiên cứu và ứng dụng các phương pháp   xác định người có ảnh hưởng trên mạng xã hội thực tế  (Facebook)
Hình 11 Mơ hình mạng xã hội facebook [6] (Trang 20)
Hình 12: Đồ thị vơ hướng trong độ đo trung tâm dựa trên trung tâm bậc - Nghiên cứu và ứng dụng các phương pháp   xác định người có ảnh hưởng trên mạng xã hội thực tế  (Facebook)
Hình 12 Đồ thị vơ hướng trong độ đo trung tâm dựa trên trung tâm bậc (Trang 21)
Hình 13: Mô tả mức độ Closeness Centrality của đồ thị - Nghiên cứu và ứng dụng các phương pháp   xác định người có ảnh hưởng trên mạng xã hội thực tế  (Facebook)
Hình 13 Mô tả mức độ Closeness Centrality của đồ thị (Trang 23)
Hình 14: Mơ tả mức độ Betweenness Centrality của đồ thị - Nghiên cứu và ứng dụng các phương pháp   xác định người có ảnh hưởng trên mạng xã hội thực tế  (Facebook)
Hình 14 Mơ tả mức độ Betweenness Centrality của đồ thị (Trang 24)
Hình 15: Độ đo trung tâm dựa trên trung gian, sự lân cận và trị vector đặc trưng - Nghiên cứu và ứng dụng các phương pháp   xác định người có ảnh hưởng trên mạng xã hội thực tế  (Facebook)
Hình 15 Độ đo trung tâm dựa trên trung gian, sự lân cận và trị vector đặc trưng (Trang 25)
Hình 16: Sơ đồ hoạt động của PageRank - Nghiên cứu và ứng dụng các phương pháp   xác định người có ảnh hưởng trên mạng xã hội thực tế  (Facebook)
Hình 16 Sơ đồ hoạt động của PageRank (Trang 26)
Hình 17: Các bước thực hiện trong PageRank (Nguồn: [14]) - Nghiên cứu và ứng dụng các phương pháp   xác định người có ảnh hưởng trên mạng xã hội thực tế  (Facebook)
Hình 17 Các bước thực hiện trong PageRank (Nguồn: [14]) (Trang 28)
Mơ hình Quantum PageRank, sử dụng ma trận QuantumPageRank Q như sau: - Nghiên cứu và ứng dụng các phương pháp   xác định người có ảnh hưởng trên mạng xã hội thực tế  (Facebook)
h ình Quantum PageRank, sử dụng ma trận QuantumPageRank Q như sau: (Trang 29)
Hình 19: Giao diện chính của facebook - Nghiên cứu và ứng dụng các phương pháp   xác định người có ảnh hưởng trên mạng xã hội thực tế  (Facebook)
Hình 19 Giao diện chính của facebook (Trang 31)
Hình 20: Lượng người sử dụng facebook trên thế giới tính đến tháng 2/2021.(Nguồn: - Nghiên cứu và ứng dụng các phương pháp   xác định người có ảnh hưởng trên mạng xã hội thực tế  (Facebook)
Hình 20 Lượng người sử dụng facebook trên thế giới tính đến tháng 2/2021.(Nguồn: (Trang 32)
Hình 22: Data flow của scrapy [19] - Nghiên cứu và ứng dụng các phương pháp   xác định người có ảnh hưởng trên mạng xã hội thực tế  (Facebook)
Hình 22 Data flow của scrapy [19] (Trang 34)
Hình 23: Các bình luận trên một bài viết - Nghiên cứu và ứng dụng các phương pháp   xác định người có ảnh hưởng trên mạng xã hội thực tế  (Facebook)
Hình 23 Các bình luận trên một bài viết (Trang 36)
Hình 24: Đồ thị theo độ đo trung tâm dựa trên trung tâm bậc - Nghiên cứu và ứng dụng các phương pháp   xác định người có ảnh hưởng trên mạng xã hội thực tế  (Facebook)
Hình 24 Đồ thị theo độ đo trung tâm dựa trên trung tâm bậc (Trang 37)
Hình 30: Đồ thị đường biểu diễn kết quả tính tốn độ ảnh hưởng của 4039 người dùng được đánh số từ 0 đến 4038 trên mạng xã hội Facebook bằng PageRank  - Nghiên cứu và ứng dụng các phương pháp   xác định người có ảnh hưởng trên mạng xã hội thực tế  (Facebook)
Hình 30 Đồ thị đường biểu diễn kết quả tính tốn độ ảnh hưởng của 4039 người dùng được đánh số từ 0 đến 4038 trên mạng xã hội Facebook bằng PageRank (Trang 46)
Hình 32: Đồ thị đường biểu diễn kết quả tính tốn độ ảnh hưởng của 4039 người dùng được đánh số từ 0 đến 4038 trên mạng xã hội Facebook bằng Degree Centrality    - Nghiên cứu và ứng dụng các phương pháp   xác định người có ảnh hưởng trên mạng xã hội thực tế  (Facebook)
Hình 32 Đồ thị đường biểu diễn kết quả tính tốn độ ảnh hưởng của 4039 người dùng được đánh số từ 0 đến 4038 trên mạng xã hội Facebook bằng Degree Centrality (Trang 47)
Hình 31: Đồ thị đường biểu diễn kết quả tính tốn độ ảnh hưởng của 4039 người dùng được đánh số từ 0 đến 4038 trên mạng xã hội Facebook bằng Closeness Centrality  - Nghiên cứu và ứng dụng các phương pháp   xác định người có ảnh hưởng trên mạng xã hội thực tế  (Facebook)
Hình 31 Đồ thị đường biểu diễn kết quả tính tốn độ ảnh hưởng của 4039 người dùng được đánh số từ 0 đến 4038 trên mạng xã hội Facebook bằng Closeness Centrality (Trang 47)
Bảng 2: Độ tương quan giữa thuật toán PageRank và các thuật toán degree, betweenness và closeness  - Nghiên cứu và ứng dụng các phương pháp   xác định người có ảnh hưởng trên mạng xã hội thực tế  (Facebook)
Bảng 2 Độ tương quan giữa thuật toán PageRank và các thuật toán degree, betweenness và closeness (Trang 49)
Hình 35: Nội dung dữ liệu thô thu thập được - Nghiên cứu và ứng dụng các phương pháp   xác định người có ảnh hưởng trên mạng xã hội thực tế  (Facebook)
Hình 35 Nội dung dữ liệu thô thu thập được (Trang 50)
Hình 36: Dữ liệu một bản ghi trên bài viết gốc - Nghiên cứu và ứng dụng các phương pháp   xác định người có ảnh hưởng trên mạng xã hội thực tế  (Facebook)
Hình 36 Dữ liệu một bản ghi trên bài viết gốc (Trang 51)
Bảng 4: Dữ liệu sau khi mơ hình hóa sang đồ thị đồng nhất - Nghiên cứu và ứng dụng các phương pháp   xác định người có ảnh hưởng trên mạng xã hội thực tế  (Facebook)
Bảng 4 Dữ liệu sau khi mơ hình hóa sang đồ thị đồng nhất (Trang 52)
Hình 39: Đồ thị theo độ đo trung tâm dựa theo bậc với dữ liệu thực - Nghiên cứu và ứng dụng các phương pháp   xác định người có ảnh hưởng trên mạng xã hội thực tế  (Facebook)
Hình 39 Đồ thị theo độ đo trung tâm dựa theo bậc với dữ liệu thực (Trang 53)
Hình 43: Đồ thị theo độ đo trung tâm dựa theo QuantumPageRank với dữ liệu thực - Nghiên cứu và ứng dụng các phương pháp   xác định người có ảnh hưởng trên mạng xã hội thực tế  (Facebook)
Hình 43 Đồ thị theo độ đo trung tâm dựa theo QuantumPageRank với dữ liệu thực (Trang 55)
Bảng 6: Độ tương quan giữa thuật toán PageRank và các thuật toán degree, betweenness và closeness theo dữ liệu thực  - Nghiên cứu và ứng dụng các phương pháp   xác định người có ảnh hưởng trên mạng xã hội thực tế  (Facebook)
Bảng 6 Độ tương quan giữa thuật toán PageRank và các thuật toán degree, betweenness và closeness theo dữ liệu thực (Trang 56)
Bảng 7: Bảng kết quả xếp hạng theo từng tuần với dữ liệu thực - Nghiên cứu và ứng dụng các phương pháp   xác định người có ảnh hưởng trên mạng xã hội thực tế  (Facebook)
Bảng 7 Bảng kết quả xếp hạng theo từng tuần với dữ liệu thực (Trang 57)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w