GIẢM THIỂU TỐI ĐA THIỆT HẠI DO THÔNG TIN SAI LỆCH GÂY RA TRÊN MẠNG XÃ HỘI TRỰC TUYẾN

LỜI CAM ĐOAN Tôi xin cam đoan, kiến thức trình bày luận văn tơi tìm hiểu, nghiên cứu trình bày hướng dẫn PGS.TS Hồng Xn Huấn Trong q trình làm luận văn, tơi tham khảo tài liệu có liên quan trích dẫn nguồn đầy đủ, rõ ràng Những kết luận văn riêng tôi, khơng chép từ cơng trình khác Nếu có điều khơng trung thực, tơi xin hoàn toàn chịu trách nhiệm Học viên Vũ Minh Mạnh LỜI CẢM ƠN Trước hết, xin gửi lời cảm ơn sâu sắc đến PGS.TS Hoàng Xuân Huấn, người thầy giành nhiều thời gian để hướng dẫn, góp ý giúp tơi hồn thành luận văn Thầy ln truyền cho cảm hứng, nhiệt huyết nghiên cứu khoa học, động viên cho nhiều lời khuyên quý báu Tơi xin bày tỏ lịng biết ơn chân thành tới thầy, cô giáo giảng dạy suốt năm học Trường Đại học Công nghệ - Đại học Quốc gia Hà Nội Mỗi thầy cô cho giảng thật hay bổ ích Tôi xin gửi lời cảm ơn tới Ban giám đốc Học viện An ninh nhân dân, Lãnh đạo Khoa Công nghệ An ninh thông tin anh chị đồng nghiệp tạo điều kiện thuận lợi giúp tơi tham gia hồn thành khóa học Cuối cùng, xin gửi lời biết ơn đến bố mẹ, anh chị gia đình, bạn bè, người thân ủng hộ, động viên vượt qua khó khăn sống, để tơi theo đuổi ước mơ hồi bão Học viên Vũ Minh Mạnh Mục lục MỞ ĐẦU 1 GIỚI THIỆU VỀ MẠNG XÃ HỘI 1.1 1.2 1.3 Giới thiệu chung mạng xã hội 1.1.1 Lịch sử phát triển mạng xã hội 1.1.2 Những tính mạng xã hội Các đặc trưng mạng xã hội 10 1.2.1 Đặc trưng giới nhỏ 10 1.2.2 Đặc trưng tập nhân 11 1.2.3 Phân bố luật lũy thừa 11 1.2.4 Đặc trưng cấu trúc cộng đồng 12 1.2.5 Các đặc trưng khác mạng xã hội 13 Một số chủ đề nghiên cứu mạng xã hội 14 1.3.1 Phát cấu trúc cộng đồng mạng xã hội 14 1.3.2 Dự đoán liên kết mạng xã hội 15 1.3.3 Tính riêng tư mạng xã hội 16 1.3.4 Tiến hóa động mạng xã hội 16 1.3.5 Khai phá liệu mạng xã hội 17 1.3.6 Tối đa hóa ảnh hưởng mạng xã hội 18 1.3.7 Phát hiện, giám sát ngăn ngừa thông tin sai lệch mạng xã hội 18 THÔNG TIN SAI LỆCH VÀ CÁC MƠ HÌNH LAN TRUYỀN THƠNG TIN SAI LỆCH 20 2.1 Định nghĩa thông tin sai lệch 20 2.2 Mơ hình lan truyền thơng tin sai lệch 24 2.2.1 Mơ hình tầng độc lập 25 2.2.2 Mơ hình ngưỡng tuyến tính 26 2.3 Một số hướng nghiên cứu liên quan đến toán hạn chế lan truyền thông tin sai lệch mạng xã hội trực tuyến 29 GIẢI PHÁP GIẢM THIỂU TỐI ĐA THIỆT HẠI DO THÔNG TIN SAI LỆCH GÂY RA TRÊN MẠNG XÃ HỘI TRỰC TUYẾN 34 3.1 Phát biểu toán 34 3.2 Độ khó tốn 39 3.3 Các thuật toán đề xuất giải toán MDM 41 3.3.1 Thuật toán tham lam dựa hàm f (I) 41 3.3.2 Thuật toán tham lam dựa hàm α(v) 43 THỰC NGHIỆM 45 4.1 Mục đích thực nghiệm 45 4.2 Dữ liệu tiến hành thực nghiệm 45 4.3 Cài đặt thực nghiệm 46 4.4 Kết thực nghiệm 47 4.5 Kết luận nhận xét 51 KẾT LUẬN 52 DANH MỤC CƠNG TRÌNH ĐÃ CÔNG BỐ 54 PHỤ LỤC 62 Danh mục từ viết tắt Từ viết tắt Thuật ngữ tiếng Anh IC Independent Cascade LT Linear Threshold MDM Minimize Damage of Misinformation MXH Social Network Thuật ngữ tiếng Việt Mơ hình tầng độc lập Mơ hình ngưỡng tuyến tính Bài tốn cực tiểu hóa thiệt hại thơng tin sai lệch gây Mạng xã hội Danh sách bảng 1.1 Một số mạng xã hội tiêu biểu cho phân bố luật lũy thừa 12 4.1 Dữ liệu thực nghiệm 46 Danh sách hình vẽ 1.1 Bảng xếp hạng mạng xã hội theo số lượng người dùng, tháng 1/2017 (đơn vị Triệu người dùng) 1.2 Các trang mạng xã hội Internet 1.3 Đặc trưng giới nhỏ mạng xã hội 11 1.4 Đặc trưng tập nhân mạng xã hội 12 1.5 Mạng đồng tác giả 13 1.6 Đường kính mạng xã hội Facebook 14 1.7 Mơ hình câu lạc karate Zachary, mơ hình chuẩn cho tốn phát cấu trúc cộng đồng 1.8 14 Sự tiến hóa mạng lưới nhà phát minh làm việc cho Apple năm 17 2.1 Một ví dụ q trình lan truyền thơng tin mơ hình IC 26 2.2 Một ví dụ q trình lan truyền thơng tin mơ hình LT 28 3.1 Phép dẫn từ toán Tập phủ dạng − đến toán MDM 40 4.1 Tổng thiệt hại ngân sách B thay đổi, d = 6, |S| = 10 48 4.2 Tổng thiệt hại ngân sách B thay đổi, d = 6, |S| = 20 49 4.3 Độ giảm thiệt hại kích thước nguồn S thay đổi, d = 5, B = 25 50 MỞ ĐẦU Ngày nay, mạng xã hội trực tuyến trở thành phần thiếu sống người, cho phép tạo, chia sẻ trao đổi thông tin, ý tưởng cách nhanh chóng dễ dàng hết Đối với nhiều người dùng, trang mạng xã hội trực tuyến Facebook, Twitter, Google+ coi kênh tin tức Trong nhiều trường hợp, trang mạng xã hội đưa tin tức quan trọng trước số phương tiện truyền thông đại chúng khác phát thanh, truyền hình vv Ví dụ, tin tức trùm khủng bố Bin Laden bị tiêu diệt lan truyền Twitter trước Tổng thống Mỹ thức thông báo phương tiện truyền thông công cộng [52] câu chuyện chết ca sĩ Whitney Houston lan rộng Twitter, trước 27 phút so với hãng tin AP (Associated Press) [53] Có thể nói rằng, trang mạng xã hội ngày nguồn cung cấp thông tin phong phú, đa chiều "nơi khám phá tin tức" nhiều độc giả, đặc biệt độc giả trẻ phụ nữ, chiếm số đơng nhóm chọn mạng xã hội để cập nhật tin tức Bên cạnh thơng tin tin cậy, xác thơng tin sai lệch lan truyền rộng rãi mạng xã hội cách dễ dàng Một nhóm nghiên cứu đến từ Đại học Columbia (New York, Mỹ) [23] tốc độ lan truyền thông tin sai lệch ngang so với tin tức thống Chính điều gây thiệt hại to lớn cho cá nhân, tổ chức kinh tế, trị mà cịn tác động đến tâm lý, sống người Gần đây, diễn đàn Kinh tế giới (World Economic Forum, 2014) coi gia tăng nhanh chóng thơng tin sai lệch phương tiện xã hội trực tuyến mười xu hướng hàng đầu mà giới phải đối mặt Trước thách thức nêu trên, làm thể để hạn chế lan truyền thông tin sai lệch mạng xã hội cách kịp thời hiệu quả? câu hỏi nhận quan tâm nghiên cứu nhiều nhà khoa học thời gian gần Một số nghiên cứu tập trung vào việc nhận dạng thông tin sai lệch tin đồn (Rumor) nghiên cứu Qazvinian, 2011, [6] Kwwon, 2013, [7] Một số khác, nghiên cứu vấn đề xác định tập đỉnh nguồn phát thông tin sai lệch ban đầu Chẳng hạn, Dung T Nguyen cộng sự, 2012, [65] nghiên cứu toán xác định k nguồn phát tán thông tin sai lệch khả nghi từ tập người dùng bị kích hoạt thơng tin sai lệch cho trước Bên cạnh đó, số tác giả đề xuất giải pháp hạn chế lan truyền thông tin sai lệch mạng xã hội cách chọn số đỉnh ban đầu để tiêm thông tin tốt, từ lan truyền thơng tin mạng nhằm thuyết phục người dùng khác tin theo, sử dụng mơ hình lan truyền thơng tin khác [2–4] Budak cộng sự, 2011, [2], đưa mơ hình tầng độc lập đa chiến dịch (Multi-Campaign Independent Cascade Model), gồm chiến dịch phổ biến thông tin tốt chiến dịch phổ biến thông tin sai lệch cạnh tranh với H Zhang cộng sự, 2015, [3], nghiên cứu toán hạn chế lan truyền thông tin sai lệch mơ hình kích hoạt cạnh tranh (Competitive Activation Model) Hay nghiên cứu N P Nguyen cộng sự, 2013, [4], nghiên cứu toán hạn chế thơng tin sai lệch hai mơ hình tầng độc lập (Independent Cascade) ngưỡng tuyến tính (Linear Threshold), đồng thời đề xuất thuật toán xác định tập nhỏ đỉnh có ảnh hưởng lớn nhất, từ lan truyền thơng tin tốt nhằm hạn chế ảnh hưởng thơng tin sai lệch Đặc biệt, ngồi hướng nghiên cứu kể cách tiếp cận khác việc ngăn chặn thông tin sai lệch lan truyền mạng xã hội trình bày cơng trình nghiên cứu H Zhang cộng sự, 2016, [1], cách đặt giám sát (Monitor Placement) số đỉnh đồ thị mạng nhằm ngăn chặn thông tin sai lệch lây lan đến đỉnh khác mạng Đặt giám sát phương pháp sử dụng lọc nội dung nhằm phát thông tin sai lệch người dùng (đỉnh) cài đặt ngăn chặn chia sẻ, lan truyền thông tin sai lệch từ đỉnh này; ngữ cảnh khác hiểu việc thuyết phục người dùng (đỉnh) không tin theo lan truyền thông tin sai lệch Một số cơng trình nghiên cứu khác gọi phương pháp với tên gọi phương pháp tạo miễn dịch (Immunize) cho đỉnh đồ thị mạng xã hội Đứng trước nguy an toàn, an ninh thông tin mạng xã hội thông tin sai lệch gây ra, đồng thời thúc đẩy cơng trình nghiên cứu nêu trên, đặc biệt nghiên cứu H Zhang, 2016, [1] tạo động lực cho tác giả lựa chọn đề tài "Giảm thiểu tối đa thiệt hại thông tin sai lệch gây mạng xã hội trực tuyến" làm đề tài luận văn Đóng góp luận văn bao gồm: - Thứ nhất, đề xuất mơ hình ngưỡng tuyến tính cho tốn Cực tiểu hóa thiệt hại thơng tin sai lệch gây ra, đồng thời chứng tốn thuộc lớp tốn NP-khó - Thứ hai, đề xuất hai thuật toán tham lam nhằm giải toán đặt - Thứ ba, kết thực nghiệm cho thấy ưu điểm trội hai thuật toán đề xuất so với thuật tốn thơng dụng khác thuật toán bậc cực đại (Max Degree) thuật toán ngẫu nhiên (Random) việc hạn chế thông tin sai lệch lan truyền mạng Ngoài phần mở đầu kết luận, bố cục luận văn gồm bốn chương sau: Chương 1: Giới thiệu mạng xã hội Chương giới thiệu tổng quan mạng xã hội gồm: Định nghĩa mạng xã hội, lịch sử hình thành, phát triển đặc trưng mạng xã hội Đặc biệt, chương trình bày tổng quan số chủ đề bật liên quan đến mạng xã hội, nhận quan tâm nghiên cứu nhiều học giả thời gian gần Chương 2: Thông tin sai lệch mơ hình lan truyền thơng tin sai lệch Chương tác giả trình bày định nghĩa thơng tin sai lệch, nguy hậu thông tin sai lệch gây cá nhân, tổ chức Đồng thời, phân tích chế lan truyền thơng tin đặc tính hai mơ hình lan truyền thông tin sử dụng rộng rãi bao gồm: Mơ hình tầng độc lập mơ hình ngưỡng tuyến tính Ngồi ra, Chương tổng quan số hướng nghiên cứu liên quan đến toán hạn chế lan truyền thông tin sai lệch mạng xã hội trực tuyến Chương 3: Giải pháp giảm thiểu tối đa thiệt hại thông tin sai lệch gây mạng xã hội trực tuyến Từ thực trạng nêu Chương xuất phát từ cơng trình nghiên cứu liên quan trước đó, tác giả phát biểu tốn Cực tiểu hóa thiệt hại thơng tin sai lệch gây mạng xã hội trực tuyến, chứng minh tốn thuộc lớp tốn NP-khó, đồng thời đề xuất thuật toán nhằm giải toán 48 40 Algorithm Max Degree 35 Random Algorithm Tổng thiệt hại 30 25 20 15 10 0 10 20 30 40 50 60 70 80 90 100 110 Ngân sách (B) (a) Email 60 Algorithm Max Degree 50 Random Tổng thiệt hại Algorithm 40 30 20 10 0 10 20 30 40 50 60 70 80 90 100 110 Ngân sách (B) (b) CollegeMsg 120 Algorithm Max Degree 100 Random Tổng thiệt hại Algorithm 80 60 40 20 0 10 20 30 40 50 60 70 80 90 100 110 Ngân sách (B) (c) Gnutella Hình 4.1: Tổng thiệt hại ngân sách B thay đổi, d = 6, |S| = 10 Khi ta tăng kích thức tập nguồn phát thông tin sai lệch lên |S| = 20, kết hình 4.2 Ta thấy rằng, tất trường hợp, hai thuật toán tham lam đề xuất tốt hai thuật toán Max Degree Random Đặc biệt, mạng Gnutella, ngân sách B = 25, Thuật toán Thuật toán hiệu thuật toán Max Degree 3.466 lần xét độ giảm thiệt hại sau tạo miễn dịch với tập đỉnh I 49 Nhìn chung, Thuật tốn Thuật tốn có hiệu gần ngân sách B thay đổi ba liệu 90 Algorithm 80 Max Degree Random Tổng thiệt hại 70 Algorithm 60 50 40 30 20 10 0 10 20 30 40 50 60 70 80 90 100 110 Ngân sách (B) (a) Email 160 Algorithm Max Degree 140 Random Tổng thiệt hại 120 Algorithm 100 80 60 40 20 0 10 20 30 40 50 60 70 80 90 100 110 Ngân sách (B) (b) CollegeMsg 160 Algorithm Max Degree 140 Random Tổng thiệt hại 120 Algorithm 100 80 60 40 20 0 10 20 30 40 50 60 70 80 90 100 110 Ngân sách (B) (c) Gnutella Hình 4.2: Tổng thiệt hại ngân sách B thay đổi, d = 6, |S| = 20 Ảnh hưởng kích thước tập nguồn S thay đổi: Chúng ta so sánh hiệu hai thuật tốn tham lam với thuật tốn cịn lại kích thước tập nguồn phát thơng tin sai lệch S thay đổi, |S| = {5, 10, 15, 20, 25}, với d = ngân sách cố định B = 25 Hình 4.3 độ giảm thiệt hại thông tin sai lệch 50 gây sau áp dụng thuật tốn nhằm tìm tập đỉnh I để tạo miễn dịch Ta thấy rằng, tất trường hợp, Thuật toán Thuật tốn tốt hai thuật tốn cịn lại Với liệu Email, |S| = 5, ta thấy Thuật toán hiệu gấp 2.563 lần thuật tốn Max Degree, cịn liệu Gnutella, |S| = 20, Thuật toán hiệu gấp 3.98 lần thuật toán Max Degree 70 Algorithm Algorithm 60 Độ giảm thiệt hại (%) Max Degree Random 50 40 30 20 10 10 15 20 25 Kích thước tập nguồn (|S|) (a) Email 60 Algorithm Algorithm Độ giảm thiệt hại (%) 50 Max Degree Random 40 30 20 10 10 15 20 25 Kích thước tập nguồn (|S|) (b) CollegeMsg 90 Algorithm 80 Algorithm Max Degree Độ giảm thiệt hại (%) 70 Random 60 50 40 30 20 10 10 15 20 25 Kích thước tập nguồn (|S|) (c) Gnutella Hình 4.3: Độ giảm thiệt hại kích thước nguồn S thay đổi, d = 5, B = 25 51 4.5 Kết luận nhận xét Khi ngân sách B tăng dần, ta thấy hai thuật toán tham lam: Thuật toán Thuật toán hiệu thuật toán Max Degree thuật tốn Random Tuy nhiên, tính hiệu thể rõ với giá trị B nhỏ Tính hiệu hai thuật tốn đề xuất khơng thay đổi nhiều kích thước tập nguồn phát thơng tin sai lệch tăng lên Thuật toán đa số trường hợp hiệu Thuật toán 3, nhiên hai thuật tốn chênh lệch khơng nhiều 52 KẾT LUẬN Sự bùng nổ thông tin sai lệch mạng xã hội trực tuyến nguy lớn người dùng Thông tin sai lệch lan truyền nhanh chóng mạng xã hội đến từ chủ quan vơ ý người dùng lan truyền cách có chủ đích với động cơ, mục đích khơng sáng Do thiệt hại to lớn mà thông tin sai lệch gây cá nhân, tổ chức khơng kinh tế, trị mà cịn tác động đến tâm lý, sống người, gây ổn định an ninh quốc gia, việc đưa giải pháp hiệu để ngăn chặn kịp thời lan truyền thông tin sai lệch mạng xã hội trực tuyến việc làm cấp thiết nhằm giảm thiểu tối đa thiệt hai chúng gây người dùng, góp phần làm môi trường mạng, đồng thời nâng cao tin tưởng người dùng thông tin mạng xã hội Trong luận văn này, tác giả đề xuất giải pháp ngăn chặn lan truyền thông tin sai lệch cách tạo miễn dịch cho số đỉnh đồ thị mạng xã hội, từ hạn chế thơng tin sai lệch lây lan sang đỉnh khác Luận văn đạt số kết sau: • Tìm hiểu tổng quan mạng xã hội, đặc trưng mạng xã hội Tìm hiểu số chủ đề bật liên quan đến mạng xã hội nhận quan tâm nghiên cứu nhiều học giả • Tìm hiểu chế lan truyền thơng tin đặc tính hai mơ hình lan truyền thơng tin: Mơ hình tầng độc lập (IC) mơ hình ngưỡng tuyến tính (LT) Đặc biệt, tác giả tìm hiểu hướng nghiên cứu liên quan đến toán hạn chế thông tin sai lệch lan truyền mạng xã hội cơng bố • Đề xuất mơ hình ngưỡng tuyến tính cho tốn Cực tiểu hóa thiệt hại thông tin sai lệch gây chứng minh tốn thuộc lớp NP-Khó, đồng thời đề xuất hai thuật toán tham lam để giải toán Kết thực nghiệm cho thấy ưu điểm trội hai thuật toán đề xuất so với thuật tốn thơng dụng khác thuật tốn Max Degree thuật tốn Random việc hạn chế thơng tin sai lệch lan truyền mạng Mặc dù cố gắng nỗ lực hết mình, thời gian nghiên cứu trình độ thân có hạn nên luận văn tránh khỏi thiếu 53 sót hạn chế, tác giả mong nhận ý kiến đóng góp để luận văn đạt kết tốt Hướng phát triển: Trong thời gian tới, tác giả đề xuất số hướng phát triển luận văn sau: • Thiết kế thuật tốn đạt tỉ lệ tối ưu cao cho toán MDM Cải tiến thời gian chạy thuật toán, giúp thuật toán chạy nhanh mạng xã hội có quy mơ lớn • Mở rộng phạm vi toán MDM xét với trường hợp đỉnh u ∈ V bị kích hoạt thơng tin sai lệch gây thiệt hai khác nhau, đồng thời nghiên cứu tốn mơ hình lan truyền thơng tin khác • Trong luận văn, tác giả giả thiết tập nguồn thông tin sai lệch S biết trước Tuy nhiên, xác định nguồn thông tin sai lệch ban đầu vấn đề phức tạp, hướng nghiên cứu tác giả tương lai 54 DANH MỤC CƠNG TRÌNH ĐÃ CƠNG BỐ Manh M Vu and Huan X Hoang, Minimizing the Spread of Misinformation on Online Social Networks with Time and Budget Constraint, In proceeding of the 9th International Conference on Knowledge and Systems Engineering (KSE 2017) (Notification of acceptance: July 30, 2017) Canh V Pham, Manh M Vu and Huan X Hoang, Preventing and Detecting Infiltration on Online Social Networks, In proceeding of the 4th International Conference on Computational Social Networks (CsoNet), 2015, pp 60-73 Tài liệu tham khảo [1] H Zhang, M Alim, X Li, M T Thai, and H Nguyen Misinformation in Online Social Networks: Detect Them All with Limited Budget ACM Transactions on Information Systems, 2016, pp 18:1-18:24 [2] Ceren Budak, Divyakant Agrawal, Amr El Abbadi Limiting the Spread of Misinformation in Social Networks In Proceedings of the 20th International Conference on World Wide Web, 2011, pp 665-674 [3] H Zhang, H Zhang, X Li, and M T Thai Limiting the Spread of Misinformation while Effectively Raising Awareness in Social Networks In Proceedings of the 4th International Conference on Computational Social Networks, 2015, pp 35-47 [4] N P Nguyen, G Yan, and M T Thai Analysis of Misinformation Containment in Online Social Networks Elsevier Computer Networks-Towards a Science of Cyber Security, 2013, pp 2133-2146 [5] B Aditya Prakash, Jilles Vreeken, and Christos Faloutsos Spotting Culprits in Epidemics: How many and Which ones? In Data Mining (ICDM), 2012 IEEE 12th International Conference on IEEE, 2012, pp 11-20 [6] V Qazvinian, E Rosengren, D R Radev, and Qiaozhu Mei Rumor has it: Identifying Misinformation in Microblogs In Proc EMNLP, 2011, pp 1589-1599 [7] S Kwon, M Cha, K Jung, W Chen, and Y Wang 2013 Prominent Features of Rumor Propagation in Online Social Media In Proc ICDM, 2013, pp 1103-1108 [8] Devavrat Shah and Tauhid Zaman Rumors in a Network: Who’s the Culprit? IEEE Transactions on Information Theory, 2011, pp 5163-5181 [9] Vahed Qazvinian, Emily Rosengren, Dragomir R Radev, and Qiaozhu Mei Rumor has it: Identifying Misinformation in Microblogs In Proceedings of the Conference on Empirical Methods in Natural Language Processing, 2011, pp 1589-1599 55 56 [10] Sejeong Kwon, Meeyoung Cha, Kyomin Jung, Wei Chen, and Yajun Wang Prominent Features of Rumor Propagation in Online Social Media In Data Mining (ICDM), 2013 IEEE 13th International Conference on IEEE, 2013, pp 1103-1108 [11] Kai Zhu and Lei Ying 2014 A Robust Information Source Estimator with Sparse Observations Computational Social Networks, 2014, pp 1-21 [12] Wuqiong Luo, Wee Peng Tay, and Mei Leng Identifying Infection Sources and Regions in Large Networks IEEE Transactions on Signal Processing, 2013, pp 2850-2865 [13] H Nguyen and R Zheng On budgeted Influence Maximization in Social Networks IEEE Journal on Selected Areas in Communications, 2013, pp 1084-1094 [14] Mạng xã hội nhận diện thông tin xấu độc Truy xuất từ http://dangcongsan.vn/dien-dan/mang-xa-hoi-nhan-dien-thong-tin-xaudoc-434891.html [Ngày truy cập 22/5/2017] [15] Bimal Viswanath, Alan Mislove, Meeyoung Cha, Krishna P Gummadi On the Evolution of User Interaction in Facebook In Proceedings of the 2nd ACM Workshop on Online Social Networks, 2009, pp 37-42 [16] N P Nguyen, M A Alim, T N Dinh, and M T Thai A Method to Detect Communities with Stability in Social Networks Social Network Analysis and Mining, 2014, pp 224:1-224:15 [17] N P Nguyen, G Yan, M T Thai, and S Eidenbenz Containment of Misinformation Spread in Online Social Networks In Proceedings of the 4th Annual ACM Web Science Conference, 2012, pp 213-222 [18] H Zhang, M Alim, M T Thai, and H Nguyen Monitor Placement to Timely Detect Misinformation in Online Social Networks In Proceedings of the 2015 IEEE International Conference on Communications, 2015, pp 1152-1157 [19] H Zhang, H Zhang, X Li, and M T Thai Limiting the Spread of Misinformation while Effectively Raising Awareness in Social Networks In Proceedings of the 4th International Conference on Computational Social Networks, 2015, pp 35-47 57 [20] T N Dinh, H Zhang, D T Nguyen, and M T Thai Cost-Effective Viral Marketing for Time-Critical Campaigns in Large-Scale Social Networks IEEE/ACM Transactions on Networking, 2014, pp 2001-2011 [21] Wei Chen, Wei Lu, and Ning Zhang Time-Critical Influence Maximization in Social Networks with Time-Delayed Diffusion Process In Proc AAAI, 2012, pp 1-5 [22] Santo Fortunato Community Detection in Graphs Physics reports, 2010, pp 75-174 [23] Misinformation on Social Media: Can Technology Save Us? Available at https://www.usnews.com/news/national-news/articles/2016-11- 28/misinformation-on-social-media-can-technology-save-us [Accessed 12 May 2017] [24] Việt Nam đổi tiền: Hoàn toàn bịa đặt Truy xuất từ http://vietnamnet.vn/vn/kinh-doanh/tai-chinh/viet-nam-sap-doi-tienhoan-toan-bia-dat-342761.html [Ngày truy cập 21/5/2017] [25] Bác thơng tin tăng lệ phí cấp hộ chiếu Việt Nam Truy xuất từ http://dantri.com.vn/xa-hoi/bac-thong-tin-tang-le-phi-cap-ho-chieu-taiviet-nam-20161209192924661.htm [Ngày truy cập 21/5/2017] [26] D Kempe, J Kleinberg, and E Tardos Influential Nodes in a Diffusion Model for Social Networks In ICALP, 2005, pp 1127-1138 [27] J Goldenberg, B Libai, and E Muller Talk of the Network: A Complex Systems Look at the Underlying Process of Word-of-Mouth Marketing Letters, 2001, pp 211-223 [28] J Leskovec, M Mcglohon, C Faloutsos, N Glance, and M Hurst Cascading Behavior in Large Blog Graphs In Proceedings of the 2007 SIAM International Conference on Data Mining, 2007, pp 551-556 [29] T Carnes, R Nagarajan, S M Wild, and A V Zuylen Maximizing Influence in a Competitive Social Network: a Follower’s Perspective In Proceedings of the Ninth International Conference on Electronic Commerce, 2007, pp 351-360 58 [30] Alexandra Marin and Barry Wellman Social Network Analysis: An Introduction The SAGE Handbook of Social Network Analysis, 2011, pp 11-25 [31] Jiyang Chen Community Mining: Discovery Communities in Social Network Thesis, University of Alberta, 2010 [32] Jon Kleinberg Authoritative Sources in a Hyperlinked Environment Journal of the ACM, 1999, pp 604-632 [33] Jurij Lescovec Dynamics of Large Networks Carnegie Mellon University, 2008 [34] Jure Leskovec, Jon Kleinberg, and Christos Faloutsos Graphs Over Time: Densification Laws, Shrinking Diameters and Possible Explanations In Proceedings of the Eleventh ACM SIGKDD International Conference on Knowledge Discovery in Data Mining,2005, pp 177-187 [35] Charu C Aggarwal Social Network Data Analytics New York: Springer, 2011 [36] M E J Newman Modularity and Community Structure in Networks In Proceedings of the National Academy of Sciences, 2006, pp 8577-8582 [37] R Guimera, M Sales-Pardo Missing and Spurious Interactions and the Reconstruction of Complex Ntworks In Proceedings of the National Academy of Sciences, 2009, pp 22073-22078 [38] Steve Gregory Finding Overlapping Communities Using Disjoint Community Detection Algorithms Complex networks, 2009, pp 47-61 [39] Leskovec, Huttenlocher, and Kleinberg Predicting Positive and Negative Links in Online Social Networks In Proceedings of the 19th International Conference on World Wide Web, 2010, pp 641-650 [40] Linyuan Lu, Tao Zhou Link Prediction in Complex Networks: A Survey Physica A: Statistical Mechanics and Its Applications, 2011, pp 1150-1170 [41] Zhihao Wu, Youfang Lin, Jing Wang, Steve Gregory Efficient Link Prediction with Node Clustering Coefficient arXiv preprint arXiv:1510.07819, 2015 59 [42] T N Dinh, Y Shen, and M T Thai The Walls Have Ears: Optimize Sharing for Visibility and Privacy in Online Social Networks In Proceedings of ACM Int Conference on Information and Knowledge Management, 2012, pp 1452-1461 [43] Y Shen, Y-S Syu, D T Nguyen, and M T Thai Maximizing Circle of Trust in Online Social Networks In Proceedings of ACM Conference on Hypertext and Social Media, 2012, pp 155-164 [44] Y Shen, M T Thai, and H Nguyen Staying Safe and Visible via Message Sharing in Online Social Networks Journal of Combinatorial Optimization, 2014, pp 186-217 [45] J Leskovec, L Backstrom, R Kumar, A Tomkins Microscopic Evolution of Social Networks In Proc KDD, 2008, pp 462-470 [46] J Leskovec, J Kleinberg, C Faloutsos Graph Evolution: Densification and Shrinking Diameters ACM TKDD, 2007 [47] D Kempe, J Kleinberg, and E Tardos Maximizing the Spread of Influence through a Social Network In Proceedings of the Ninth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2003, pp 137–146 [48] Huiyuan Zhang, Thang N Dinh, and My T Thai Maximizing the Spread of Positive Influence in Online Social Networks In Distributed Computing Systems (ICDCS), 2013 IEEE 33rd International Conference on IEEE, 2013, pp 317-326 [49] J Zhang, P Zhou, C Cao, Y Guo L Personalized Influence Maximization on Social Networks In Proceedings of the 22nd ACM International Conference on Information and Knowledge Management, 2013, pp 199-2008 [50] Honglei Zhuang, Yihan Sun, Jie Tang, Jialin Zhangz and Xiaoming Sunz Influence Maximization in Dynamic Social Networks In Data Mining (ICDM), 2013 IEEE 13th International Conference on IEEE, 2013, pp 1313-1318 [51] A Goyal, F Bonchi, and L V S Lakshmanan Learning Influence Probabilities in Social Networks In Proceedings of the third ACM International Conference on Web Search and Data Mining, 2010, pp 241-250 60 [52] How bin Laden news spread on Twitter Available at http://edition.cnn.com/2011/TECH/social.media/05/02/osama.bin.laden twitter/index.html [Accessed 16 April 2017] [53] Twitter Breaks News of Whitney Houston Death 27 Minutes Before Press Available at http://mashable.com/2012/02/12/whitney-houstontwitter/ [Accessed 16 April 2017] [54] Hackers send fake market-moving AP tweet on White House explosions Available at http://www.reuters.com/article/net-us-usa-whitehouseap-idUSBRE93M12Y20130423 [Accessed 16 April 2017] [55] A Goyal, W Lu, and L V S Lakshmanan Simpath: An Efficient Algorithm for Influence Maximization under the Linear Threshold Model In Proc ICDM, 2011, pp 211-220 [56] Swine Flu Frenzy Demonstrates Twitter’s Achilles Heel Available at http://www.pcworld.com/businesscenter/article/163920/swine flufrenzy demonstratest-witters achillesheel.html [Accessed 22 April 2017] [57] Fan, L., Lu, Z., Wu, W., Thuraisingham, B., Ma, H., and Bi, Y Least Cost Rumor Blocking in Social Networks In Distributed Computing Systems, 2013 IEEE 33rd International Conference on IEEE, 2013, pp 540-549 [58] Karlova, Natascha, Fisher Karen A Social Diffusion Model of Misinformation and Disinformation for Understanding Human Information Behaviour Information Research, 2013, pp 1-17 [59] Liang Wu, Fred Morstatter, Huan Liu Misinformation in Social Media: Diffusion, Detection and Intervention SBP-BRIMS 2016 Tutorial [60] Wei Chen, Laks V.S Lakshmanan, and Carlos Castillo Information and Influence Propagation in Social Networks A Publication in the Morgan & Claypool Publishers series Synthesis Lectures on Data Management, 2014 [61] Wei Chen, Yifei Yuan, and Li Zhang Scalable Influence Maximization in Social Networks under the Linear Threshold Model In Data Mining (ICDM), 2010 IEEE 10th International Conference on IEEE, 2010, pp 88-97 61 [62] Pedro Domingos and Matthew Richardson Mining the Network Value of Customers In Proceedings of the Seventh ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2001, pp 57-66 [63] J Leskovec, A Krause, C Guestrin, C Faloutsos, J VanBriesen, N Glance Cost-Effective Outbreak Detection in Networks In Proc KDD, 2007, pp 420-429 [64] A Goyal, W Lu, L V.S Lakshmanan Celf++: Optimizing the Greedy Algorithm for Onfluence Maximization in Social Networks In Proc WWW, 2011, pp 47-48 [65] D T Nguyen, N P Nguyen, and M T Thai Sources of Misinformation in Online Social Networks: Who to Suspect? In Proceedings of the IEEE Military Communications Conference, 2012, pp 1-6 [66] Kempe, 2008 Design and Analysis of Algorithms Available at http://wwwbcf.usc.edu/ dkempe/CS303/solutions13.pdf [Accessed 22 May 2017] 62 PHỤ LỤC Algorithm 4: Thuật toán Max Degree 10 11 12 13 14 Input : G = (V, E), w(u, v), d, B, tập nguồn phát thông tin sai lệch S Output: Tập đỉnh I lời giải toán MDM begin I ← ∅; N ← Nd (S); C ← 0; while (C < B) and (N = ∅) u ← maxdegree(N ); //Chọn đỉnh có bậc lớn tập N để tạo miễn dịch if C + c(u) ≤ B then I ← I ∪ {u}; C ← C + c(u); end N ← N \{u}; end Return I; end Algorithm 5: Thuật toán Random 10 11 12 13 14 Input : G = (V, E), w(u, v), d, B, tập nguồn phát thông tin sai lệch S Output: Tập đỉnh I lời giải toán MDM begin I ← ∅; N ← Nd (S); C ← 0; while (C < B) and (N = ∅) u ← random(N ); //Chọn ngẫu nhiên đỉnh tập N để tạo miễn dịch if C + c(u) ≤ B then I ← I ∪ {u}; C ← C + c(u); end N ← N \{u}; end Return I; end ... đến toán hạn chế lan truyền thông tin sai lệch mạng xã hội trực tuyến 29 GIẢI PHÁP GIẢM THIỂU TỐI ĐA THIỆT HẠI DO THÔNG TIN SAI LỆCH GÂY RA TRÊN MẠNG XÃ HỘI TRỰC TUYẾN 34 3.1 Phát biểu toán... quan đến toán hạn chế lan truyền thông tin sai lệch mạng xã hội trực tuyến Chương 3: Giải pháp giảm thiểu tối đa thiệt hại thông tin sai lệch gây mạng xã hội trực tuyến Từ thực trạng nêu Chương... Chương GIẢI PHÁP GIẢM THIỂU TỐI ĐA THIỆT HẠI DO THÔNG TIN SAI LỆCH GÂY RA TRÊN MẠNG XÃ HỘI TRỰC TUYẾN Chương tập trung vào việc xây dựng toán Cực tiểu hóa thiệt hại thơng tin sai lệch gây - MDM, chứng

Định dạng
Số trang	69
Dung lượng	2,67 MB