1. Trang chủ
  2. » Tất cả

Đề xuất mô hình sử dụng cơ chế biểu quyết kết hợp với độ đo trung tâm cho bài toán xác định các nút ảnh hưởng trên mạng xã hội

84 3 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 84
Dung lượng 1,95 MB

Nội dung

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI LUẬN VĂN THẠC SĨ Đề xuất mơ hình sử dụng chế biểu kết hợp với độ đo trung tâm cho toán xác định nút ảnh hưởng mạng xã hội PHẠM VĂN DƯƠNG duong.pv202652M@sis.hust.edu.vn Ngành Khoa học máy tính Giảng viên hướng dẫn: PGS.TS Phạm Văn Hải Trường: Công nghệ Thông tin Truyền thông HÀ NỘI, 10/2022 Chữ ký GVHD CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự – Hạnh phúc BẢN XÁC NHẬN CHỈNH SỬA LUẬN VĂN THẠC SĨ Họ tên tác giả luận văn: Phạm Văn Dương Đề tài luận văn: Đề xuất mơ hình sử dụng chế biểu kết hợp với độ đo trung tâm cho toán xác định nút ảnh hưởng mạng xã hội Chuyên ngành: Khoa học máy tính Mã số SV: 20202652M Tác giả, Người hướng dẫn khoa học Hội đồng chấm luận văn xác nhận tác giả sửa chữa, bổ sung luận văn theo biên họp Hội đồng ngày 29/10/2022 với nội dung sau: Bỏ tên đầu mục Chương 1: Giới thiệu Chương 5: Kết luận thành Giới thiệu Kết luận Bổ sung chỉnh sửa nội dung Phần Giới thiệu luận văn: − Chỉnh sửa nội dung Phần Giới thiệu ngắn gọn đầy đủ ý − Phân chia đoạn dài thành nhiều đoạn con, đoạn diễn tả ý trình bày − Định nghĩa tốn Phần Giới thiệu với việc giải thích rõ đầu vào đầu toán kí hiệu kèm Bổ sung chỉnh sửa nội dung Chương 2: Mơ hình đề xuất luận văn: − Phát biểu mô tả ngắn gọn tốn trước đưa mơ hình tốn học phần đầu Chương 2: Mơ hình đề xuất − Mô tả rõ nút mối quan hệ liệu mạng xã hội − Bổ sung ý nghĩa vấn đề logic việc tính tốn kết hợp độ đo thuật toán đề xuất EAVoteRank++ Bổ sung chỉnh sửa nội dung Chương 3: Thực nghiệm, đánh giá luận văn: − Bổ sung lí lựa chọn so sánh thuật tốn đề xuất EAVoteRank++ với thuật toán lựa khác Luận văn − Mô tả rõ cấu trúc trường liệu liệu thực nghiệm − Bổ sung ý nghĩa đường màu đồ thị tương ứng với thuật toán kết thực nghiệm với số quy mô lan truyền − Bổ sung phần so sánh tính hiệu thực nghiệm với thuật toán đề xuất EAVoteRank++ so với thuật toán khác − Bổ sung nội dung kết thực nghiệm đánh giá hiệu mặt thời gian áp dụng thuật toán đề xuất Ngày 29 tháng 11 năm 2022 Giáo viên hướng dẫn Tác giả luận văn PGS.TS Phạm Văn Hải Phạm Văn Dương CHỦ TỊCH HỘI ĐỒNG ĐỀ TÀI LUẬN VĂN Biểu mẫu Đề tài/Luận văn tốt nghiệp theo qui định Viện, nhiên cần đảm bảo giáo viên giao đề tài ký ghi rõ họ tên Trường hợp có giáo viên hướng dẫn ký tên Giáo viên hướng dẫn Ký ghi rõ họ tên PGS.TS Phạm Văn Hải LỜI CAM ĐOAN Tôi – Phạm Văn Dương - cam kết luận văn cơng trình nghiên cứu thân tơi, hướng dẫn PGS.TS Phạm Văn Hải Các kết công bố báo cáo trung thực, chép cá nhân, tổ chức công bố khác Tất trích dẫn tham chiếu rõ ràng Ngày 12 tháng 10 năm 2022 Tác giả luận văn Phạm Văn Dương Xác nhận người hướng dẫn Giáo viên hướng dẫn Ký ghi rõ họ tên PGS.TS Phạm Văn Hải LỜI CẢM ƠN Lời em xin gửi lời cảm ơn chân thành, sâu sắc đến quý Thầy, Cô giáo Trường CNTT – TT, Đại Học Bách Khoa Hà Nội tận tình dạy quan tâm em suốt trình học tập rèn luyện trường Em trân trọng biết ơn PGS.TS Phạm Văn Hải tận tình hướng dẫn, bảo, góp ý cho em suốt q trình thực luận văn để em hồn thiện luận văn tiến độ Con xin gửi lời cảm ơn đến gia đình bố, mẹ, anh, chị, bà ngoại bên động viên lúc ln mong có thành cơng Cảm ơn đến người yêu, người bạn bên, chia sẻ lúc khó khăn Bốn năm học Đại học hai năm học Thạc sĩ Trường CNTT - TT, Đại học Bách Khoa Hà Nội năm xuân rực rỡ thân Ở đây, có niềm vui có nỗi buồn tất khoảnh khắc vô đáng nhớ mà em không quên Cảm ơn Bách khoa cho em hội phần đó, cảm ơn Trường CNTT & TT cho em hành trang vô quý báu chặng đường phía trước Em nhớ ngày đầu nhập học với mưa lác đác, nhớ lúc bất ngờ phải lên phòng đào tạo xếp hồ sơ, nhớ lúc tưởng chừng phải học lại mà qua, nhớ cảm giác Giỏi, nhớ học bổng mà nhận Sẽ nhớ mãi! Xin chân thành cảm ơn! TÓM TẮT NỘI DUNG LUẬN VĂN Trong thời đại bùng nổ thông tin, đặc biệt thông tin mạng xã hội nay, nhiều toán đặt nhằm giải vấn đề thực tiễn sống dựa vào tập liệu tìm mối quan hệ người dùng hay gợi ý sản phẩm người dùng quan tâm, … Những toán gọi chung tốn phân tích mạng xã hội Một số tốn phân tích mạng xã hội nhiều nhà khoa học quan tâm nghiên cứu toán xác định nút ảnh hưởng mạng xã hội Từ giá trị thực tiễn mà toán mang lại chiến dịch quảng cáo, truyền thơng hay kiểm sốt tin đồn, dịch bệnh, luận văn đề xuất mơ hình xác định nút ảnh hưởng mạng xã hội bao gồm: mơ hình hóa liệu thu thập từ mạng xã hội Facebook thành đồ thị đồng phương pháp xây dựng đồ thị tri thức dựa tương tác người dùng; đề xuất thuật toán xác định nút ảnh hưởng theo chế biểu kết hợp với độ đo trung tâm Thuật tốn đề xuất xây dựng cơng thức tính điểm khả biểu dựa việc kết hợp thơng tin bao gồm hệ số bậc, vị trí mạng nút hệ số phân cụm cục Xây dựng trọng số cho độ đo dựa theo thuật tốn thơng tin entropy Ngồi ra, luận văn xây dựng cơng thức tính điểm ảnh hưởng nút dựa lân cận cấp cấp Bên cạnh đó, thuật tốn đề xuất lựa chọn tập hợp nút ảnh hưởng phân phối rộng rãi toàn mạng cách áp dụng chế giảm nhiễu với lân cận theo hệ số Để chứng minh tính hiệu thuật tốn, luận văn lựa chọn mơ hình mơ thơng tin lan truyền thơng tin SIR mơ lại q trình lan truyền thơng tin áp dụng số đánh quy mô lan truyền, quy mơ lan truyền cuối trung bình khoảng cách nút hạt giống Kết thực nghiệm liệu bao gồm liệu mạng phức hợp thường sử dụng toán xác định nút ảnh hưởng liệu xây dựng từ việc thu thập Facebook, đạt hiệu tốt hơn phương pháp thuật toán xác định nút ảnh hưởng khác HỌC VIÊN Ký ghi rõ họ tên Phạm Văn Dương MỤC LỤC GIỚI THIỆU Đặt vấn đề Mục đích luận văn Phạm vi nghiên cứu Nội dung luận văn CHƯƠNG CƠ SỞ LÝ THUYẾT 11 1.1 Lý thuyết đồ thị 11 Định nghĩa 11 Một số loại đồ thị 11 Biểu diễn đồ thị 12 Một số khái niệm khác 15 1.2 Tổng quan tốn phân tích mạng xã hội 16 Tổng quan 16 Các toán nghiên cứu phân tích mạng xã hội 16 1.3 Một số phương pháp xác định nút ảnh hưởng 18 Độ đo trung tâm dựa bậc 19 Độ đo trung tâm dựa lân cận 19 Phân rã k-shell cải tiến k-shell 20 Hệ số phân cụm 22 Cải tiến mô hình lực hấp dẫn 23 Độ đo trung tâm kết hợp nhiều thông tin cục có trọng số dựa thơng tin entropy (LWC) 23 Độ đo kết hợp vị trí, hệ số bậc Entropy (MCDE) 25 Thuật toán EnRenew 26 Thuật toán VoteRank 28 Thuật toán WVoteRank 28 Thuật toán cải tiến WVoteRank 29 Thuật toán VoteRank++ 30 1.4 Một số lý thuyết liên quan 30 Đồ thị tri thức 30 Thông tin Entropy 31 1.5 Phương pháp đánh giá thuật toán 31 Mơ hình Nhạy cảm – Bị nhiễm – Phục hồi 32 Trung bình đường ngắn nút 35 CHƯƠNG MƠ HÌNH ĐỀ XUẤT 36 2.1 Mơ hình hóa liệu đồ thị mạng xã hội 38 2.2 Thuật toán đề xuất EAVoteRank++ 40 Xây dựng độ đo trọng số tương ứng 40 Khởi tạo điểm khả biểu 42 Xác định điểm ảnh hưởng (điểm biểu quyết) 43 Giảm nhiễu thông tin với lân cận nút hạt giống cập nhật điểm khả biểu 43 Tính tốn lại điểm ảnh hưởng điểm khả biểu lựa chọn nút hạt giống 44 2.3 Mơ tả thuật tốn 46 CHƯƠNG THỰC NGHIỆM, ĐÁNH GIÁ 51 3.1 Bộ liệu 51 Mơ hình hóa liệu mạng xã hội 51 Mô tả liệu 52 3.2 Thực nghiệm thuật toán 53 3.3 Kết thực nghiệm 54 KẾT LUẬN 64 Kết đạt 64 Hướng phát triển 64 DANH MỤC HÌNH VẼ Hình 0.1: Thống kê người dùng Facebook Việt Nam năm 2021 Hình 1.1: Đồ thị có hướng biểu diễn đồ thị ma trận kề 12 Hình 1.2: Đồ thị có hướng biểu diễn ma trận liên thuộc đỉnh cạnh 13 Hình 1.3: Danh sách cạnh (cung) đồ thị 14 Hình 1.4: Danh sách kề đồ thị vô hướng G 14 Hình 1.5: Danh sách kề đồ thị có hướng 𝐺𝐺1 15 Hình 1.6: Ví dụ đồ thị vơ hướng 16 Hình 1.7: Bài tốn dự đốn liên kết mạng 17 Hình 1.8: Bài toán phân loại nút 17 Hình 1.9: Bài tốn phân loại lĩnh vực hóa dược [28] 18 Hình 1.10: Ví dụ đồ thị vô hướng 19 Hình 1.11: Ví dụ đồ thị cho thuật toán phân rã k-shell 20 Hình 1.12: Ví dụ đồ thị cho thuật tốn MCDE 25 Hình 1.13: Ví dụ tính điểm ảnh hưởng theo thuật tốn Enrenew 27 Hình 1.14: Sơ đồ minh họa tham số mơ hình SIR 32 Hình 1.15: Minh họa q trình mơ lan truyền mơ hình SIR mạng Krackhardt’s Kite 33 Hình 2.1: Mơ hình đề xuất 36 Hình 2.2: Ví dụ phương pháp xây dựng đồ thị tri thức dựa tương tác người dùng 39 Hình 2.3: Ví dụ mạng phức hợp 47 Hình 3.1: Mơ tả nút mối quan hệ liệu thu thập từ mạng xã hội Facebook 51 Hình 3.2: Chỉ số quy mơ lan truyền 𝐹𝐹(𝑡𝑡) thực nghiệm liệu 55 Hình 3.3: Chỉ số quy mô lan truyền cuối 𝐹𝐹(𝑡𝑡𝑡𝑡) thực nghiệm liệu với số lượng 𝜌𝜌 nút hạt giống khác 57 Hình 3.4: Chỉ số quy mơ lan truyền cuối 𝐹𝐹𝐹𝐹𝐹𝐹 với xác suất lây nhiễm 𝛽𝛽 khác 59 Hình 3.5: Chỉ số trung bình đường ngắn nút hạt giống thực nghiệm mạng 61 xanh nước biển có hình vng biểu thị kết thuật toán CC, đường màu xanh ngọc bích có chấm trịn biểu thị kết thuật tốn KS_im, đường màu tím có chấm trịn biểu thị kết cho thuật toán LWC, đường màu xanh có dấu nhân biểu thị kết cho thuật tốn DKGM_CLC, đường nét đứt màu tím có hình vng biểu thị kết cho thuật tốn MCDE, đường màu đen có chứa gạch biểu thị kết cho thuật tốn EnRenew, đường màu nâu nhạt có hình vng biểu thị kết cho thuật tốn VoteRank, đường nét liền màu cam biểu thị kết cho thuật tốn WVoteRank, đường màu hồng có hình biểu thị kết cho thuật toán cải tiến WVoteRank, đường màu than có gạch biểu thị kết cho thuật tốn VoteRank++ đường màu đỏ có chấm trịn biểu thị kết cho thuật toán đề xuất EAVoteRank++ Kết số tính trung bình 1000 phép chạy độc lập với 𝛽𝛽 = 1,5 𝛽𝛽𝑐𝑐 𝜌𝜌 = 0,03 Riêng liệu Brightkite kg-Facebook, số lượng nút mối quan hệ có số lượng lớn, nên luận văn sử dụng trung bình kết 100 phép thử độc lập để giảm thiểu chi phí tính tốn Mục đích thực nghiệm để đánh giá tốc độ khuếch tán lan truyền thông tin tập hợp nút hạt giống khác từ thuật tốn Từ kết Hình 3.2, thấy với số lượng nút hạt giống ban đầu, thuật toán EAVoteRank++ (đường nét liền chấm màu đỏ) đạt kết lan truyền cao toàn liệu thực nghiệm Còn kết thuật tốn KS_im, đạt hiệu nhất, lí thấy KS_im xác định vị trí nút mạng mà không xem đến việc số lượng liên kết nút dẫn đến nút chọn làm hạt giống có độ ảnh hưởng khơng lớn Đối với liệu có trọng số khơng có trọng số (kg-Facebook), thuật tốn đề xuất EAVoteRank++ thể khả ưu việt Tại thời điểm 𝑡𝑡 = 0, hầu hết liệu, sai khác thuật tốn khơng nhiều việc lựa chọn nút ảnh hưởng lúc có số lượng giống Từ thời điểm trở đi, số lượng nút bị ảnh hưởng nút hạt giống lựa chọn thuật tốn EAVoteRank++ ln lớn so với phương pháp khác Với việc tận dụng độ đo bán cục việc kết hợp với chế biểu giúp thuật toán giảm chi phí tính tốn, yếu tố giúp thuật tốn EAVoteRank++ có hiệu cao tốc độ tính tốn nhanh so với phương pháp dựa thơng tin tồn cục Hình 3.3 hình biểu diễn kết số quy mơ lan truyền cuối với số lượng nút hạt giống ban đầu khác Kết dược tính trung bình 1000 phép thử độc lập với xác suất lây nhiễm 𝛽𝛽 = 1,5 𝛽𝛽𝑐𝑐 Thử nghiệm nhằm đánh giá phạm vi lan truyền ảnh hưởng cuối phương pháp khác với số lượng mút hạt giống khác Số lượng nút hạt giống nhiều kéo theo số lượng nút lan truyền thơng tin nhiều Do đó, để đánh giá cách khách quan hơn, thực nghiệm thực số lượng nút hạt giống khác với số lượng tối đa 0.03 nút mạng, cụ thể 𝜌𝜌 ∈ {0.005; 0.01; 0.015; 0.02; 0.025; 0.03} 56 a) Jazz b) Email c) USAir2010 d) Hamster e) Condmat f) ego-Facebook g) Brightkite h) kg-Facebook Hình 3.3: Chỉ số quy mô lan truyền cuối 𝐹𝐹(𝑡𝑡𝑐𝑐 ) thực nghiệm liệu với số lượng 𝜌𝜌 nút hạt giống khác Từ kết trên, ta thấy rằng, thuật tốn đề xuất EAVoteRank++ có kết cao hơn tất phương pháp khác việc lựa chọn tập hợp nút hạt giống để lan truyền ảnh hưởng, đặc biệt số lượng nút hạt giống ban đầu có tỉ lệ lớn, độ ảnh hưởng nút đề xuất thuật toán EAVoterank++ ln 57 lớn tồn mạng thực nghiệm Với liệu Brightkite kg-Facebook, sai khác tầm ảnh hưởng nút hạt giống lựa chọn thuật toán khác tương đối nhỏ, kết nút mạng thường tập trung vào nhóm nút khác để thu thập Bên cạnh đó, số lượng nút hạt giống 𝜌𝜌 nhỏ, kết tất phương pháp tương đối giống nhau, phạm vi ảnh hưởng mà nút hạt giống đề xuất EAVoteRank ++ mở rộng lan truyền toàn mạng 𝜌𝜌 lớn Điều cho thấy cải tiến EAVoteRank++ hiệu giúp khuếch tán thông tin đến nhiều nút số lượng nút hạt giống ban đầu lớn Đối với liệu Jazz hay Hamster, chênh lệch kết không nhiều số lượng nút mối quan hệ nút dẫn đến việc lan truyền phương pháp đạt hiệu tương đối giống 58 a) Jazz b) Email c) USAir2010 d) Hamster e) Condmat f) ego-Facebook g) Brightkite h) kg-Facebook Hình 3.4: Chỉ số quy mô lan truyền cuối 𝐹𝐹(𝑡𝑡𝑐𝑐 ) với xác suất lây nhiễm 𝛽𝛽 khác Trong mơ hình SIR, xác suất lây nhiễm 𝛽𝛽 ảnh hưởng lớn đến trình lây lan Nếu 𝛽𝛽 nhỏ, thông tin lan truyền thành cơng tồn mạng, đo lường khả lan truyền thông tin nút mặc việc lựa chọn tập nút hạt giống Nếu 𝛽𝛽 lớn, thơng tin nút có khả lan truyền tốt hơn, việc khuếch tán thơng tin lan truyền 59 gần tồn mạng, điều khiến việc xác định mức ảnh hưởng nút khó khăn Để đảm bảo tính thực tiễn, thực nghiệm lấy kết số lan truyền cuối 𝐹𝐹(𝑡𝑡𝑐𝑐 ) với xác suất lây nhiễm 𝛽𝛽 = 𝑘𝑘𝛽𝛽𝑐𝑐 , (𝑘𝑘 ∈ {0.5, 0.8, 1.1, 1.4, 1.7, 2.0}) khác thuật tốn Tương ứng với kết Hình 3.4, cột đen biểu thị cho kết thuật toán DC, cột màu xanh nước biển kết thuật tốn CC, cột màu xanh ngọc bích biểu thị kết thuật toán KS_im, xanh biểu thị kết cho thuật toán LWC, cột màu xanh nõn chuối biểu thị kết cho thuật toán DKGM_CLC, cột màu màu tím than biểu thị kết cho thuật toán MCDE, cột màu nâu nhạt biểu thị kết cho thuật toán EnRenew, cột màu vàng nhật biểu thị kết cho thuật tốn VoteRank, cột màu tím biểu thị kết cho thuật toán WVoteRank, cột màu hồng tím biểu thị kết cho thuật tốn cải tiến WVoteRank, cột màu than biểu thị kết cho thuật toán VoteRank++ cột màu đỏ biểu thị kết cho thuật tốn đề xuất EAVoteRank++ Từ kết Hình 3.4, ta thấy rằng, EAVoteRank++ đạt hiệu so với phương pháp khác, đặc biệt xác suất lây nhiễm lớn hầu hết mạng thực nghiệm Với liệu không trọng số Email, Hamster, egoFacebook thuật tốn VoteRank++ đạt hiệu tốt sau thuật toán đề xuất Tuy nhiên, liệu có trọng số kg-Facebook, thuật tốn đề xuất EAVoteRank++ thuật tốn có hiệu tốt xếp sau thuật tốn cải tiến WVoteRank Điều chứng tỏ hiệu thuật tốn đề xuất liệu có trọng số Việc lựa chọn tập hợp nút hạt giống khác so với phương pháp đạt hiệu lan truyền tốt thực nghiệm lan truyền khác chứng minh tính hiệu thuật toán đề xuất Từ kết thực nghiệm trên, thuật tốn đề xuất EAVoteRank ++ có khả tổng quát hóa với nhiều trường hợp so với thuật toán khác 60 a) Jazz b) Email c) USAir2010 d) Hamster e) Condmat f) ego-Facebook g) Brightkite h) kg-Facebook Hình 3.5: Chỉ số trung bình đường ngắn nút hạt giống thực nghiệm mạng Như phân tích mục 1.5.2, khoảng cách nút hạt giống khía cạnh quan trọng việc tối đa hóa ảnh hưởng mạng Nếu nút hạt giống lựa chọn phân phối tồn mạng thơng tin lan truyền có xu hướng 61 lan rộng tồn mạng Do đó, để chứng minh tập hợp nút hạt giống lựa chọn thuật toán đề xuất EAVoterank++ phân phối rộng rãi toàn mạng tập hợp nút hạt giống đề xuất thuật toán khác, luận văn sử dụng số trung bình đường ngắn nút hạt giống 𝐿𝐿𝑠𝑠 để so sánh liệu thực nghiệm khác Hình 3.5 cho thấy giá trị 𝐿𝐿𝑠𝑠 tập hợp nút hạt giống đề xuất thuật tốn khác Từ kết thấy, EAVoteRank ++ có kết 𝐿𝐿𝑠𝑠 trội so với phương pháp khác với số lượng nút hạt giống khác Nói cách khác, nút có ảnh hưởng xác định phương pháp EAVoteRank ++ phân tán rộng rãi mạng Ngoài ra, hai mạng lớn Brightkite kg-Facebook, EAVoteRank ++ đạt hiệu đáng kể so với thuật toán khác Điều này, cho thấy nút có ảnh hưởng chọn EAVoteRank ++ phân phối rộng khắp mạng kể mạng phức tạp Từ khẳng định thêm phương pháp EAVoteRank ++ lựa chọn nút có khả lan truyền mạnh mẽ Ngoài để đánh giá tính khả thi thuật tốn đề xuất việc triển khai liệu mạng thực tế, luận văn thực đánh giá thời gian thuật tốn việc tìm tập hợp nút hạt giống liệu Đối với liệu có số lượng nút mối quan hệ Jazz, Email USAir2010, Hamster, luận văn thực nghiệm tìm 3% nút hạt giống Riêng với liệu Condmat, ego-Facebook Brightkite kg-Facebook, kết thực nghiệm lấy 10 nút có ảnh hưởng Kết thực nghiệm mô tả Bảng 3.2 Bảng 3.2: Kết thời gian thực thuật toán đề xuất EAVoteRank++ liệu thực nghiệm STT Bộ liệu Thời gian (s) Jazz 0.25 Email 2.07 USAir2010 Hamster 14.27 Condmat 39 ego-Facebook 220 Brightkite 530 kg-Facebook 22 7,195 Từ kết Bảng 3.2, ta thấy việc thực tìm nút hạt giống mạng thực tế dựa thuật toán EAVoteRank++ tương đối ngắn, phù hợp với việc áp dụng liệu thực tế với số lượng nút mối quan hệ lớn Tuy nhiên việc cải thiện thời gian so với thuật tốn so sánh trước khơng q lớn, có đơi tốn nhiều thời gian tính tốn so với thuật toán khác VoteRank++, WVoteRank Bởi vì, với thuật tốn đề xuất EAVoteRank++, việc tính tốn kết hợp nhiều độ đo làm thuật tốn có độ phức tạp khiến chi phí tính tốn mặt thời gian nhiều Mặc dù, thuật toán đề xuất áp dụng chế giảm nhiễu giúp giảm chi phí tính tốn 62 vịng lặp khơng phải cập nhật điểm tồn nút mạng Tuy nhiên, việc cải thiện mặt thời gian hướng phát triển tương lai để giải toán Từ thực nghiệm mơ hình mơ lan truyền thơng tin SIR với số đánh quy mô lan truyền, quy mơ lan truyền cuối trung bình đường ngắn nút hạt giống, thấy thuật toán EAVoterank++ đạt hiệu toàn mạng thực nghiệm Với việc áp dụng chế biểu việc kết hợp độ đo trung tâm dựa thông tin bán cục có trọng số giúp giải tốn xác định nút ảnh hưởng tốt với thời gian tính tốn tối ưu Đây kết khả quan quan trọng giúp cải tiến thuật toán giải toán xác định nút ảnh hưởng mạng xã hội 63 KẾT LUẬN Kết đạt Với đề tài toán xác định nút ảnh hưởng, luận văn xác định ý nghĩa giá trị thực tiễn mà toán mang lại tìm hiểu, khảo sát hướng nghiên cứu liên quan việc giải toán xác định nút ảnh hưởng mạng xã hội Từ phân tích ưu điểm, hạn chế khó khăn hướng tiếp cận, luận văn lựa chọn “Đề xuất mơ hình sử dụng chế biểu kết hợp với độ đo trung tâm cho toán xác định nút ảnh hưởng mạng xã hội” bao gồm mơ hình hóa liệu thu thập từ mạng xã hội thành đồ thị đồng đề xuất thuật toán giúp xác định xếp hạng nút ảnh hưởng mạng Cụ thể, kết đạt luận văn, bao gồm: • Đề xuất thuật toán giải toán xác định nút ảnh hưởng chế biểu kết hợp với độ đo trung tâm có trọng số đạt hiệu xác cao • Thu thập, xử lý xây dựng phương pháp chuyển đổi liệu mạng xã hội Facebook thành đồ thị đồng sở đồ thị tri thức dựa tương tác người dùng Bên cạnh đó, luận văn sử dụng mơ hình mô lan truyền thông tin SIR số đánh giá quy mô lan truyền, quy mô lan truyền cuối trung bình khoảng cách ngắn nút hạt giống để đánh giá hiệu thuật toán đề xuất mang lại Kết thử nghiệm liệu chứng minh tính hiệu phương pháp đề xuất khả tìm kiếm nút ảnh hưởng xếp hạng nút mạng Hướng phát triển Mặc dù, thuật toán đề xuất giải toán xác định nút ảnh hưởng có kết thực nghiệm tốt so với thuật toán khác Tuy nhiên, để phát triển đạt hiệu cao tương lai, thuật toán cần có cải tiến phù hợp hiệu Như ta biết, mạng xã hội cập nhật thường xuyên, chúng biến đổi liên tục phát triển với lượng liệu vô lớn Không liệu mạng xã hội, liệu tổ chức dạng đồ thị ngày phát triển phức tạp Do đó, việc xây dựng thuật tốn xác định nút ảnh hưởng phải đáp ứng yêu cầu Theo đó, luận văn xem xét cải tiến bao gồm: • Cải tiến thuật tốn đề xuất mạng có lượng nút mối quan hệ rộng áp dụng thuật toán mạng động để phù hợp với liệu thực tiễn • Xem xét giảm chi phí tính tốn độ đo Nghiên cứu kĩ thuật đánh trọng số cho tập liệu để xây dựng trọng số cho độ đo tương ứng 64 • Tận dụng đồ thị đồng mơ hình hóa theo đồ thị tri thức, áp dụng kĩ thuật nhúng mạng để biểu diễn đặc trưng nút sử dụng đặc trưng cho mơ hình Học máy, Học sâu 65 TÀI LIỆU THAM KHẢO [1] Bond, Robert M and Fariss, Christopher J and Jones, Jason J and Kramer, Adam DI and Marlow, Cameron and Settle, Jaime E and Fowler, James H, "A 61-million-person experiment in social influence and political mobilization," Nature, vol 489, pp 295 298, 2012 [2] Domingos, Pedro and Richardson, Matt, "Mining the network value of customers," in Proceedings of the seventh ACM SIGKDD international conference on Knowledge discovery and data mining, 2001 [3] Da Silva, Li'aria Nunes and Malacarne, Alan and e Silva, Jos'e Walter Silva and Kirst, Fl'a}vio Valdir and De-Bortoli, Robelius and others, "The Scientific Collaboration Networks in University Management in Brazil," Creative Education, vol 9, p 1469, 2018 [4] Klimt, Bryan and Yang, Yiming, "Introducing the Enron corpus.," in CEAS, 2004 [5] Sathyapriya, R and Vijayabaskar, MS and Vishveshwara, Saraswathi, "Insights into protein DNA interactions through structure network analysis," PLoS computational biology, vol 4, p e1000170, 2008 [6] Guo, Chungu and Yang, Liangwei and Chen, Xiao and Chen, Duanbing and Gao, Hui and Ma, Jing, "Influential nodes identification in complex networks via information entropy," Entropy, vol 22, p 242, 2020 [7] Csermely, Peter and Korcsm{\'a}ros, Tam'as and Kiss, Huba JM and London, G'abor and Nussinov, Ruth, "Structure and dynamics of molecular networks: a novel paradigm of drug discovery: a comprehensive review," Pharmacology & therapeutics, vol 138, pp 333 408, 2013 [8] Leskovec, Jure and Adamic, Lada A and Huberman, Bernardo A, "The dynamics of viral marketing," {ACM Transactions on the Web (TWEB), vol 1, pp es, 2007 [9] Li, Yuchen and Fan, Ju and Wang, Yanhao and Tan, Kian-Lee, "Influence maximization on social graphs: A survey," IEEE Transactions on Knowledge and Data Engineering, vol 30, pp 1852 1872, 2018 [10] Kumar, Sanjay and Panda, Ankit, "Identifying influential nodes in weighted complex networks using an improved WVoteRank approach," Applied Intelligence, vol 52, pp 1838 1852, 2022 [11] Wang, Zhixiao and Du, Changjiang and Fan, Jianping and Xing, Yan, "Ranking influential nodes in social networks based on node position and neighborhood," Neurocomputing, vol 260, pp 466 477, 2017 [12] Linton, C Freeman, "Centrality in social networks conceptual clarification," Social networks, vol 1, pp 215 239, 1978 66 [13] Brin, Sergey and Page, Lawrence, "The anatomy of a large-scale hypertextual web search engine," Computer networks and ISDN systems, vol 30, pp 107 117, 1998 [14] Chen, Duan-Bing and Sun, Hong-Liang and Tang, Qing and Tian, ShengZhao and Xie, Mei, "Identifying influential spreaders in complex networks by propagation probability dynamics," Chaos: An Interdisciplinary Journal of Nonlinear Science, vol 29, p 033120, 2019 [15] Chen, Duanbing and L"u, Linyuan and Shang, Ming-Sheng and Zhang, YiCheng and Zhou, Tao, "Identifying influential nodes in complex networks," Physica a: Statistical mechanics and its applications, vol 391, pp 1777-1787, 2012 [16] Yang, Yuanzhi and Wang, Xing and Chen, You and Hu, Min and Ruan, Chengwei, "A novel centrality of influential nodes identification in complex networks," IEEE Access, vol 8, pp 58742 58751, 2020 [17] Liu, Zhonghua and Jiang, Cheng and Wang, Juyun and Yu, Hua, "The node importance in actual complex networks based on a multi-attribute ranking method," Knowledge-Based Systems, vol 84, pp 56 66, 2015 [18] Ullah, Aman and Wang, Bin and Sheng, JinFang and Long, Jun and Khan, Nasrullah and Sun, ZeJun, "Identification of nodes influence based on global structure model in complex networks," Scientific Reports, vol 11, pp 11, 2021 [19] Li, Zhe and Ren, Tao and Ma, Xiaoqi and Liu, Simiao and Zhang, Yixin and Zhou, Tao, "Identifying influential spreaders by gravity model," Scientific reports, vol 9, pp 7, 2019 [20] Perozzi, Bryan and Al-Rfou, Rami and Skiena, Steven, "Deepwalk: Online learning of social representations," in Proceedings of the 20th ACM SIGKDD international conference on Knowledge discovery and data mining, 2014 [21] Mikolov, Tomas and Sutskever, Ilya and Chen, Kai and Corrado, Greg S and Dean, Jeff, "Distributed representations of words and phrases and their compositionality," Advances in neural information processing systems, vol 26, 2013 [22] Grover, Aditya and Leskovec, Jure, "node2vec: Scalable feature learning for networks," in Proceedings of the 22nd ACM SIGKDD international conference on Knowledge discovery and data mining, 2016 [23] Zhang, Jian-Xiong and Chen, Duan-Bing and Dong, Qiang and Zhao, ZhiDan, "Identifying a set of influential spreaders in complex networks," Scientific reports, vol 6, pp 10, 2016 67 [24] Singh, Shashank Sheshar and Kumar, Ajay and Singh, Kuldeep and Biswas, Bhaskar, "LAPSO-IM: A learning-based influence maximization approach for social networks," Applied Soft Computing, vol 82, p 105554, 2019 [25] Sun, Hong-liang and Chen, Duan-bing and He, Jia-lin and Ch’ng, Eugene, "A voting approach to uncover multiple influential spreaders on weighted networks," Physica A: Statistical Mechanics and its Applications, vol 519, pp 303 312, 2019 [26] Liu, Panfeng and Li, Longjie and Fang, Shiyu and Yao, Yukai, "Identifying influential nodes in social networks: A voting approach," Chaos, Solitons & Fractals, vol 152, p 111309, 2021 [27] Tiến, LM, "Tổng quan phương pháp phân tích mạng lưới xã hội nghiên cứu xã hội," Tạp chí Khoa học Xã hội (9-2006), pp 66 77, 2006 [28] Ying, Rex and Bourgeois, Dylan and You, Jiaxuan and Zitnik, Marinka and Leskovec, Jure, "Gnn explainer: A tool for post-hoc explanation of graph neural networks," arXiv preprint arXiv:1903.03894, 2019 [29] P G a M Q a S S Sun, "Community-based k-shell decomposition for identifying influential spreaders," Pattern Recognition, vol 120, p 108130, 2021 [30] Li, Zhe and Huang, Xinyu, "Identifying influential spreaders in complex networks by an improved gravity model," Scientific Reports, vol 11, pp 1-10, 2021 [31] Zhao, Xiaohui and Liu, Fang’ai and Wang, Jinlong and Li, Tianlai, "Evaluating influential nodes in social networks by local centrality with a coefficient," ISPRS International Journal of Geo-Information, vol 6, p 35, 2017 [32] Van Duong, Pham and Dinh, Xuan Truong and Son, Le Hoang and Van Hai, Pham, "Enhancement of Gravity Centrality Measure Based on Local Clustering Method by Identifying Influential Nodes in Social Networks," in International Conference on Multimedia Technology and Enhanced Learning, 2022 [33] Zhang, Jinhua and Zhang, Qishan and Wu, Ling and Zhang, Jinxin, "Identifying Influential Nodes in Complex Networks Based on Multiple Local Attributes and Information Entropy," Entropy, vol 24, p 293, 2022 [34] Sheikhahmadi, Amir and Nematbakhsh, Mohammad Ali, "Identification of multi-spreader users in social networks for viral marketing," Journal of Information Science, vol 43, pp 412 423, 2017 [35] Sun, Hong-liang and Chen, Duan-bing and He, Jia-lin and Ch’ng, Eugene, "A voting approach to uncover multiple influential spreaders on weighted 68 networks," Physica A: Statistical Mechanics and its Applications, vol 519, pp 303 312, 2019 [36] ogan, Aidan and Blomqvist, Eva and Cochez, Michael and d’Amato, Claudia and Melo, Gerard De and Gutierrez, Claudio and Kirrane, Sabrina and Gayo, Jos'e Emilio Labra and Navigli, Roberto and Neumaier, Sebastian and others, "Knowledge graphs," ACM Computing Surveys (CSUR), vol 54, pp 37, 2021 [37] Tao, Zhou and Zhongqian, Fu and Binghong, Wang, "Epidemic dynamics on complex networks," Progress in Natural Science, vol 16, pp 452 457, 2006 [38] Huang, Xinyu and Chen, Dongming and Wang, Dongqi and Ren, Tao, "Identifying influencers in social networks," Entropy, vol 22, p 450, 2020 [39] Castellano, Claudio and Pastor-Satorras, Romualdo, "Thresholds for epidemic spreading in networks," Physical review letters, vol 105, p 218701, 2010 [40] Krackhardt, David, "Assessing the political landscape: Structure, cognition, and power in organizations," Administrative science quarterly, pp 342 369, 1990 [41] Mao, Guoyong and Zhang, Ning, "Analysis of average shortest-path length of scale-free network," Journal of Applied Mathematics, vol 2013, 2013 [42] Tran, Quan M and Nguyen, Hien D and Huynh, Tai and Nguyen, Kha V and Hoang, Suong N and Pham, Vuong T, "Measuring the influence and amplification of users on social network with unsupervised behaviors learning and efficient interaction-based knowledge graph," Journal of Combinatorial Optimization, pp 27, 2021 [43] Berahmand, Kamal and Bouyer, Asgarali and Samadi, Negin, "A new centrality measure based on the negative and positive effects of clustering coefficient for identifying influential spreaders in complex networks," Chaos, Solitons & Fractals, vol 110, pp 41 54, 2018 [44] Gleiser, Pablo M and Danon, Leon, "Community structure in jazz," Advances in complex systems, vol 6, pp 565 573, 2003 [45] Guimera, Roger and Danon, Leon and Diaz-Guilera, Albert and Giralt, Francesc and Arenas, Alex, "Self-similar community structure in a network of human interactions," Physical review E, vol 68, p 065103, 2003 [46] Colizza, Vittoria and Pastor-Satorras, Romualdo and Vespignani, Alessandro, "Reaction diffusion processes and metapopulation models in heterogeneous networks," Nature Physics, vol 3, pp 276 282, 2007 69 [47] Rossi, Ryan and Ahmed, Nesreen, "The network data repository with interactive graph analytics and visualization," in Twenty-ninth AAAI conference on artificial intelligence, 2015 [48] Leskovec, Jure and Kleinberg, Jon and Faloutsos, Christos, "Graph evolution: Densification and shrinking diameters," ACM transactions on Knowledge Discovery from Data (TKDD), vol 1, pp es, 2007 [49] Cho, Eunjoon and Myers, Seth A and Leskovec, Jure, "Friendship and mobility: user movement in location-based social networks," in Proceedings of the 17th ACM SIGKDD international conference on Knowledge discovery and data mining, 2011 [50] Leskovec, Jure and Mcauley, Julian, "Learning to discover social circles in ego networks," Advances in neural information processing systems, vol 25, 2012 [51] Guimera, Roger and Danon, Leon and Diaz-Guilera, Albert and Giralt, Francesc and Arenas, Alex, "Self-similar community structure in a network of human interactions," Physical review E, vol 68, p 065103, 2003 70 ... hạn chế nghiên cứu liên quan việc giải toán xác định nút ảnh hưởng mạng xã hội, luận văn lựa chọn ? ?Đề xuất mơ hình sử dụng chế biểu kết hợp với độ đo trung tâm cho toán xác định nút ảnh hưởng mạng. .. phần mạng 35 CHƯƠNG MƠ HÌNH ĐỀ XUẤT Đề xuất mơ hình xác định nút ảnh hưởng mạng xã hội Bài toán xác định nút ảnh hưởng mạng xã hội nói riêng hay toán xác định nút ảnh hưởng mạng đồ thị đồng nói... đánh giá ảnh hưởng nút xác định nút có ảnh hưởng mạng phức tạp Thuật toán xác định ảnh hưởng nút bao gồm ảnh hưởng trực tiếp ảnh hưởng gián tiếp: • Ảnh hưởng trực tiếp ảnh hưởng nút nút kết nối

Ngày đăng: 24/03/2023, 23:42

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w