Tóm tắt Luận văn Thạc sĩ: Giảm thiểu tối đa thiệt hại do thông tin sai lệch gây ra trên mạng xã hội trực tuyến

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang	37
Dung lượng	1,39 MB

Nội dung

Đề tài được thực hiện nhằm đề xuất một mô hình ngưỡng tuyến tính cho bài toán cực tiểu hóa thiệt hại do thông tin sai lệch gây ra, đồng thời chứng mình bài toán này thuộc lớp bài toán NP-khó; đề xuất hai thuật toán tham lam nhằm giải quyết bài toán đặt ra; kết quả thực nghiệm cho thấy ưu điểm nổi trội của hai thuật toán đề xuất so với các thuật toán thông dụng khác như thuật toán bậc cực đại (Max Degree) và thuật toán ngẫu nhiên (Random) trong việc hạn chế thông tin sai lệch lan truyền trên mạng.

LỜI CAM ĐOAN Tôi xin cam đoan, kiến thức trình bày luận văn tơi tìm hiểu, nghiên cứu trình bày hướng dẫn PGS.TS Hồng Xn Huấn Trong q trình làm luận văn, tơi tham khảo tài liệu có liên quan trích dẫn nguồn đầy đủ, rõ ràng Những kết luận văn riêng tôi, khơng chép từ cơng trình khác Nếu có điều khơng trung thực, tơi xin hoàn toàn chịu trách nhiệm Học viên Vũ Minh Mạnh LỜI CẢM ƠN Trước hết, xin gửi lời cảm ơn sâu sắc đến PGS.TS Hoàng Xuân Huấn, người thầy giành nhiều thời gian để hướng dẫn, góp ý giúp tơi hồn thành luận văn Thầy ln truyền cho cảm hứng, nhiệt huyết nghiên cứu khoa học, động viên cho nhiều lời khuyên quý báu Tơi xin bày tỏ lịng biết ơn chân thành tới thầy, cô giáo giảng dạy suốt năm học Trường Đại học Công nghệ - Đại học Quốc gia Hà Nội Mỗi thầy cô cho giảng thật hay bổ ích Tôi xin gửi lời cảm ơn tới Ban giám đốc Học viện An ninh nhân dân, Lãnh đạo Khoa Công nghệ An ninh thông tin anh chị đồng nghiệp tạo điều kiện thuận lợi giúp tơi tham gia hồn thành khóa học Cuối cùng, xin gửi lời biết ơn đến bố mẹ, anh chị gia đình, bạn bè, người thân ủng hộ, động viên vượt qua khó khăn sống, để tơi theo đuổi ước mơ hồi bão Học viên Vũ Minh Mạnh Mục lục MỞ ĐẦU 1 GIỚI THIỆU VỀ MẠNG XÃ HỘI 1.1 1.2 1.3 Giới thiệu chung mạng xã hội 1.1.1 Lịch sử phát triển mạng xã hội 1.1.2 Những tính mạng xã hội Các đặc trưng mạng xã hội 1.2.1 Đặc trưng giới nhỏ 1.2.2 Đặc trưng tập nhân 1.2.3 Phân bố luật lũy thừa 1.2.4 Đặc trưng cấu trúc cộng đồng 1.2.5 Các đặc trưng khác mạng xã hội Một số chủ đề nghiên cứu mạng xã hội 1.3.1 Phát cấu trúc cộng đồng mạng xã hội 1.3.2 Dự đoán liên kết mạng xã hội 1.3.3 Tính riêng tư mạng xã hội 1.3.4 Tiến hóa động mạng xã hội 1.3.5 Khai phá liệu mạng xã hội 1.3.6 Tối đa hóa ảnh hưởng mạng xã hội 1.3.7 Phát hiện, giám sát ngăn ngừa thông tin sai lệch mạng xã hội THÔNG TIN SAI LỆCH VÀ CÁC MƠ HÌNH LAN TRUYỀN THƠNG TIN SAI LỆCH 2.1 Định nghĩa thông tin sai lệch 2.2 Mơ hình lan truyền thơng tin sai lệch 2.2.1 Mơ hình tầng độc lập 2.2.2 Mơ hình ngưỡng tuyến tính 2.3 Một số hướng nghiên cứu liên quan đến toán hạn chế lan truyền thông tin sai lệch mạng xã hội trực tuyến 10 GIẢI PHÁP GIẢM THIỂU TỐI ĐA THIỆT HẠI DO THÔNG TIN SAI LỆCH GÂY RA TRÊN MẠNG XÃ HỘI TRỰC TUYẾN 12 3.1 Phát biểu toán 12 3.2 Độ khó tốn 14 3.3 Các thuật toán đề xuất giải toán MDM 14 3.3.1 Thuật toán tham lam dựa hàm f (I) 15 3.3.2 Thuật toán tham lam dựa hàm α(v) 16 THỰC NGHIỆM 18 4.1 Mục đích thực nghiệm 18 4.2 Dữ liệu tiến hành thực nghiệm 18 4.3 Cài đặt thực nghiệm 19 4.4 Kết thực nghiệm 19 4.5 Kết luận nhận xét 23 KẾT LUẬN 24 DANH MỤC CƠNG TRÌNH ĐÃ CÔNG BỐ 25 PHỤ LỤC 33 MỞ ĐẦU Ngày nay, mạng xã hội trực tuyến trở thành phần thiếu sống người, cho phép tạo, chia sẻ trao đổi thông tin, ý tưởng cách nhanh chóng dễ dàng hết Đối với nhiều người dùng, trang mạng xã hội trực tuyến Facebook, Twitter, Google+ coi kênh tin tức Trong nhiều trường hợp, trang mạng xã hội đưa tin tức quan trọng trước số phương tiện truyền thông đại chúng khác phát thanh, truyền hình vv Ví dụ, tin tức trùm khủng bố Bin Laden bị tiêu diệt lan truyền Twitter trước Tổng thống Mỹ thức thơng báo phương tiện truyền thơng công cộng [52] câu chuyện chết ca sĩ Whitney Houston lan rộng Twitter, trước 27 phút so với hãng tin AP (Associated Press) [53] Có thể nói rằng, trang mạng xã hội ngày nguồn cung cấp thông tin phong phú, đa chiều "nơi khám phá tin tức" nhiều độc giả, đặc biệt độc giả trẻ phụ nữ, chiếm số đơng nhóm chọn mạng xã hội để cập nhật tin tức Bên cạnh thơng tin tin cậy, xác thông tin sai lệch lan truyền rộng rãi mạng xã hội cách dễ dàng Một nhóm nghiên cứu đến từ Đại học Columbia (New York, Mỹ) [23] tốc độ lan truyền thông tin sai lệch ngang so với tin tức thống Chính điều gây thiệt hại to lớn cho cá nhân, tổ chức khơng kinh tế, trị mà cịn tác động đến tâm lý, sống người Gần đây, diễn đàn Kinh tế giới (World Economic Forum, 2014) coi gia tăng nhanh chóng thơng tin sai lệch phương tiện xã hội trực tuyến mười xu hướng hàng đầu mà giới phải đối mặt Trước thách thức nêu trên, làm thể để hạn chế lan truyền thông tin sai lệch mạng xã hội cách kịp thời hiệu quả? câu hỏi nhận quan tâm nghiên cứu nhiều nhà khoa học thời gian gần Một số nghiên cứu tập trung vào việc nhận dạng thông tin sai lệch tin đồn (Rumor) nghiên cứu Qazvinian, 2011, [6] Kwwon, 2013, [7] Một số khác, nghiên cứu vấn đề xác định tập đỉnh nguồn phát thông tin sai lệch ban đầu Chẳng hạn, Dung T Nguyen cộng sự, 2012, [65] nghiên cứu toán xác định k nguồn phát tán thông tin sai lệch khả nghi từ tập người dùng bị kích hoạt thơng tin sai lệch cho trước Bên cạnh đó, số tác giả đề xuất giải pháp hạn chế lan truyền thông tin sai lệch mạng xã hội cách chọn số đỉnh ban đầu để tiêm thông tin tốt, từ lan truyền thơng tin mạng nhằm thuyết phục người dùng khác tin theo, sử dụng mơ hình lan truyền thơng tin khác [2–4] Budak cộng sự, 2011, [2], đưa mơ hình tầng độc lập đa chiến dịch (Multi-Campaign Independent Cascade Model), gồm chiến dịch phổ biến thông tin tốt chiến dịch phổ biến thông tin sai lệch cạnh tranh với H Zhang cộng sự, 2015, [3], nghiên cứu tốn hạn chế lan truyền thơng tin sai lệch mơ hình kích hoạt cạnh tranh (Competitive Activation Model) Hay nghiên cứu N P Nguyen cộng sự, 2013, [4], nghiên cứu toán hạn chế thơng tin sai lệch hai mơ hình tầng độc lập (Independent Cascade) ngưỡng tuyến tính (Linear Threshold), đồng thời đề xuất thuật toán xác định tập nhỏ đỉnh có ảnh hưởng lớn nhất, từ lan truyền thơng tin tốt nhằm hạn chế ảnh hưởng thông tin sai lệch Đặc biệt, ngồi hướng nghiên cứu kể cịn cách tiếp cận khác việc ngăn chặn thông tin sai lệch lan truyền mạng xã hội trình bày cơng trình nghiên cứu H Zhang cộng sự, 2016, [1], cách đặt giám sát (Monitor Placement) số đỉnh đồ thị mạng nhằm ngăn chặn thông tin sai lệch lây lan đến đỉnh khác mạng Đặt giám sát phương pháp sử dụng lọc nội dung nhằm phát thông tin sai lệch người dùng (đỉnh) cài đặt ngăn chặn chia sẻ, lan truyền thông tin sai lệch từ đỉnh này; ngữ cảnh khác hiểu việc thuyết phục người dùng (đỉnh) không tin theo lan truyền thông tin sai lệch Một số cơng trình nghiên cứu khác gọi phương pháp với tên gọi phương pháp tạo miễn dịch (Immunize) cho đỉnh đồ thị mạng xã hội Đứng trước nguy an tồn, an ninh thơng tin mạng xã hội thông tin sai lệch gây ra, đồng thời thúc đẩy cơng trình nghiên cứu nêu trên, đặc biệt nghiên cứu H Zhang, 2016, [1] tạo động lực cho tác giả lựa chọn đề tài "Giảm thiểu tối đa thiệt hại thông tin sai lệch gây mạng xã hội trực tuyến" làm đề tài luận văn Đóng góp luận văn bao gồm: - Thứ nhất, đề xuất mơ hình ngưỡng tuyến tính cho tốn Cực tiểu hóa thiệt hại thơng tin sai lệch gây ra, đồng thời chứng tốn thuộc lớp tốn NP-khó - Thứ hai, đề xuất hai thuật toán tham lam nhằm giải toán đặt - Thứ ba, kết thực nghiệm cho thấy ưu điểm trội hai thuật toán đề xuất so với thuật tốn thơng dụng khác thuật toán bậc cực đại (Max Degree) thuật toán ngẫu nhiên (Random) việc hạn chế thông tin sai lệch lan truyền mạng Ngoài phần mở đầu kết luận, bố cục luận văn gồm bốn chương sau: Chương 1: Giới thiệu mạng xã hội Chương giới thiệu tổng quan mạng xã hội gồm: Định nghĩa mạng xã hội, lịch sử hình thành, phát triển đặc trưng mạng xã hội Đặc biệt, chương trình bày tổng quan số chủ đề bật liên quan đến mạng xã hội, nhận quan tâm nghiên cứu nhiều học giả thời gian gần Chương 2: Thông tin sai lệch mơ hình lan truyền thơng tin sai lệch Chương tác giả trình bày định nghĩa thơng tin sai lệch, nguy hậu thông tin sai lệch gây cá nhân, tổ chức Đồng thời, phân tích chế lan truyền thơng tin đặc tính hai mơ hình lan truyền thông tin sử dụng rộng rãi bao gồm: Mơ hình tầng độc lập mơ hình ngưỡng tuyến tính Ngồi ra, Chương tổng quan số hướng nghiên cứu liên quan đến toán hạn chế lan truyền thông tin sai lệch mạng xã hội trực tuyến Chương 3: Giải pháp giảm thiểu tối đa thiệt hại thông tin sai lệch gây mạng xã hội trực tuyến Từ thực trạng nêu Chương xuất phát từ công trình nghiên cứu liên quan trước đó, tác giả phát biểu tốn Cực tiểu hóa thiệt hại thơng tin sai lệch gây mạng xã hội trực tuyến, chứng minh toán thuộc lớp toán NP-khó, đồng thời đề xuất thuật tốn nhằm giải tốn Chương 4: Thực nghiệm Mơ tả bước tiến hành kết thực nghiệm nhằm đánh giá hiệu thuật toán đề xuất việc ngăn chặn lan truyền thông tin sai lệch Thực nghiệm tiến hành dựa ba liệu mạng xã hội thực, bao gồm: Gnutella, CollegeMsg Email Kết thực nghiêm cho thấy, thuật toán tác giả đề xuất tốt thuật tốn thơng dụng khác thuật tốn bậc cực đại (Max Degree) thuật toán ngẫu nhiên (Random) Chương GIỚI THIỆU VỀ MẠNG XÃ HỘI Chương giới thiệu tổng quan mạng xã hội bao gồm: Định nghĩa mạng xã hội, lịch sử hình thành, phát triển đặc trưng mạng xã hội Đặc biệt, chương trình bày tổng quan số chủ đề bật liên quan đến mạng xã hội, nhận quan tâm nghiên cứu nhiều học giả thời gian gần 1.1 Giới thiệu chung mạng xã hội Theo Marin Wellman [30], mạng xã hội (MXH) tập hợp tác nhân có yếu tố xã hội kết nối với nhiều quan hệ xã hội 1.1.1 Lịch sử phát triển mạng xã hội Lịch sử phát triển MXH đồng hành với phát triển Internet Từ email gửi nhà nghiên cứu Thụy Sĩ vào năm 1971 đến MXH đại Facebook, Twitter vv 1.1.2 Những tính mạng xã hội - Tính liên kết cộng đồng - Tính đa phương tiện - Tính tương tác - Khả truyền tải lưu trữ thông tin 1.2 1.2.1 Các đặc trưng mạng xã hội Đặc trưng giới nhỏ Vấn đề nghiên cứu cấu trúc MXH gây ý quan tâm sâu sắc nhà nghiên cứu nhiều năm qua Đầu tiên thí nghiệm tiếng có tên gọi "thí nghiệm giới nhỏ" (Small World Experiment) thực Stanley Milgram, 1967, nhằm tính tốn số bước cần thiết để hai người dân số xác định biết 1.2.2 Đặc trưng tập nhân Cấu trúc vận động MXH chịu tác động nút có số lượng lớn cung kết nối hay nút có bậc cao Người ta gọi nút nút trung tâm hay nút nhân Phân tích cấu trúc MXH rằng, MXH ln chứa lượng lớn nút có bậc cao [32] Bao quanh nút nút có bậc thấp hơn, quanh nút có bậc thấp lại nút có bậc thấp chúng, tạo thành hệ thống phân cấp 1.2.3 Phân bố luật lũy thừa Sự phân bố bậc nút mạng mô tả hàm P (k), hàm cho biết xác suất nút có bậc k Phân bố bậc mơ tả các liên kết mạng phân bố nút 1.2.4 Đặc trưng cấu trúc cộng đồng MXH có đặc trưng quan trọng cấu trúc cộng đồng, mạng phân chia thành cộng đồng lớn nhỏ khác nhau; bên cộng đồng lớn có cộng đồng nhỏ Giữa nút cộng đồng có mật độ kết nối lớn so với nút bên 1.2.5 Các đặc trưng khác mạng xã hội Một mạng có đường kính d cặp nút mạng kết nối với đường chiều dài tối đa d Leskovec, 2005, [34] MXH khơng có đường kính nhỏ (đặc trưng giới nhỏ) mà đường kính mạng cịn co ngắn lại sau giữ ổn định theo thời gian 19 4.3 Cài đặt thực nghiệm Các thuật tốn thực nghiệm cài đặt ngơn ngữ lập trình Python Ngồi hai thuật tốn tham lam đề xuất, tác giả sử dụng hai thuật toán sau để so sánh, chi tiết hai thuật toán xem phần phụ lục luận văn: • Max Degree: Lựa chọn đỉnh có bậc cao để tạo miễn dịch • Random: Lựa chọn ngẫu nhiên đỉnh để tạo miễn dịch Trọng số ảnh hưởng w(u, v) mơ hình lan truyền thơng tin LT, thiết lập nội dung thực nghiệm Kempe, 2003, [47] nhiều cơng trình nghiên cứu khác [13, 61]: Mỗi cạnh đến đỉnh v gán trọng số ảnh hưởng 1/d(v), với d(v) bậc đến (In-degree) v Điều có nghĩa cạnh có đóng góp trọng việc kích hoạt đỉnh v tổng trọng số tất cạnh đến đỉnh v Chi phí tạo miễn dịch với thơng tin sai lệch đỉnh u ∈ V khởi tạo ngẫu nhiên số thuộc khoảng [1.0, 3.0] Hơn nữa, tất thuật tốn sử dụng phương pháp mơ Mote Carlo chọn số lần mô R = 10000 4.4 Kết thực nghiệm Ảnh hưởng ngân sách B thay đổi: Chúng ta so sánh hiệu Thuật toán Thuật toán với thuật tốn cịn lại ngân sách B thay đổi, B = {10, 25, 35, 50, 70, 110}, với d = tập nguồn phát thông tin sai lệch khởi tạo ngẫu nhiên, |S| = 10 Tổng thiệt hại thông tin sai lệch gây sau tạo miễn dịch cho tập đỉnh I hình 4.1 Ở tất trường hợp, Thuật toán Thuật toán tốt hai thuật toán Max Degree Random, độ giảm thiệt hại áp dụng hai thuật toán cao từ 1.017 lần đến 3.4781 lần so với thuật toán Max Degree Đặc biệt, mạng Email, ngân sách B = 10, Thuật toán Thuật toán hiệu 3.4781 lần 2.87 lần tương ứng, so với thuật toán Max Degree; mạng Gnutella, ngân sách B = 10, Thuật toán Thuật toán hiệu 3.0521 lần 3.02781 lần tương ứng, so với thuật toán Max Degree Khi ngân sách B = {50, 70, 110}, áp dụng Thuật toán Thuật toán hạn chế từ 43.11% đến 90.44% thông tin sai lệch lan truyền mạng Đặc biệt, 20 mạng Gnutella, B = 110, Thuật toán Thuật toán hạn chế 90.44% 90.41% tương ứng, thông tin sai lệch lan truyền 40 Algorithm Max Degree 35 Random Algorithm Tổng thiệt hại 30 25 20 15 10 0 10 20 30 40 50 60 70 80 90 100 110 Ngân sách (B) (a) Email 60 Algorithm Max Degree 50 Random Tổng thiệt hại Algorithm 40 30 20 10 0 10 20 30 40 50 60 70 80 90 100 110 Ngân sách (B) (b) CollegeMsg 120 Algorithm Max Degree 100 Random Tổng thiệt hại Algorithm 80 60 40 20 0 10 20 30 40 50 60 70 80 90 100 110 Ngân sách (B) (c) Gnutella Hình 4.1: Tổng thiệt hại ngân sách B thay đổi, d = 6, |S| = 10 Khi ta tăng kích thức tập nguồn phát thông tin sai lệch lên |S| = 20, kết hình 4.2 Ta thấy rằng, tất trường hợp, hai thuật toán tham lam đề xuất tốt hai thuật toán Max Degree Random Đặc biệt, mạng Gnutella, ngân sách B = 25, Thuật toán Thuật toán 21 hiệu thuật toán Max Degree 3.466 lần xét độ giảm thiệt hại sau tạo miễn dịch với tập đỉnh I Nhìn chung, Thuật tốn Thuật tốn có hiệu gần ngân sách B thay đổi ba liệu 90 Algorithm 80 Max Degree Random Tổng thiệt hại 70 Algorithm 60 50 40 30 20 10 0 10 20 30 40 50 60 70 80 90 100 110 Ngân sách (B) (a) Email 160 Algorithm Max Degree 140 Random Tổng thiệt hại 120 Algorithm 100 80 60 40 20 0 10 20 30 40 50 60 70 80 90 100 110 Ngân sách (B) (b) CollegeMsg 160 Algorithm Max Degree 140 Random Tổng thiệt hại 120 Algorithm 100 80 60 40 20 0 10 20 30 40 50 60 70 80 90 100 110 Ngân sách (B) (c) Gnutella Hình 4.2: Tổng thiệt hại ngân sách B thay đổi, d = 6, |S| = 20 Ảnh hưởng kích thước tập nguồn S thay đổi: Chúng ta so sánh hiệu hai thuật tốn tham lam với thuật tốn cịn lại kích thước 22 tập nguồn phát thơng tin sai lệch S thay đổi, |S| = {5, 10, 15, 20, 25}, với d = ngân sách cố định B = 25 Hình 4.3 độ giảm thiệt hại thông tin sai lệch gây sau áp dụng thuật tốn nhằm tìm tập đỉnh I để tạo miễn dịch Ta thấy rằng, tất trường hợp, Thuật toán Thuật tốn tốt hai thuật tốn cịn lại Với liệu Email, |S| = 5, ta thấy Thuật toán hiệu gấp 2.563 lần thuật tốn Max Degree, cịn liệu Gnutella, |S| = 20, Thuật toán hiệu gấp 3.98 lần thuật toán Max Degree 70 Algorithm Algorithm 60 Độ giảm thiệt hại (%) Max Degree Random 50 40 30 20 10 10 15 20 25 Kích thước tập nguồn (|S|) (a) Email 60 Algorithm Algorithm Độ giảm thiệt hại (%) 50 Max Degree Random 40 30 20 10 10 15 20 25 Kích thước tập nguồn (|S|) (b) CollegeMsg 90 Algorithm 80 Algorithm Max Degree Độ giảm thiệt hại (%) 70 Random 60 50 40 30 20 10 10 15 20 25 Kích thước tập nguồn (|S|) (c) Gnutella Hình 4.3: Độ giảm thiệt hại kích thước nguồn S thay đổi, d = 5, B = 25 23 4.5 Kết luận nhận xét Khi ngân sách B tăng dần, ta thấy hai thuật toán tham lam: Thuật toán Thuật toán hiệu thuật toán Max Degree thuật tốn Random Tuy nhiên, tính hiệu thể rõ với giá trị B nhỏ Tính hiệu hai thuật tốn đề xuất khơng thay đổi nhiều kích thước tập nguồn phát thơng tin sai lệch tăng lên Thuật toán đa số trường hợp hiệu Thuật toán 3, nhiên hai thuật tốn chênh lệch khơng nhiều 24 KẾT LUẬN Luận văn đạt số kết sau: • Tìm hiểu tổng quan mạng xã hội, đặc trưng mạng xã hội Tìm hiểu số chủ đề bật liên quan đến mạng xã hội nhận quan tâm nghiên cứu nhiều học giả • Tìm hiểu chế lan truyền thơng tin đặc tính hai mơ hình lan truyền thơng tin: Mơ hình tầng độc lập (IC) mơ hình ngưỡng tuyến tính (LT) Đặc biệt, tác giả tìm hiểu hướng nghiên cứu liên quan đến toán hạn chế thông tin sai lệch lan truyền mạng xã hội cơng bố • Đề xuất mơ hình ngưỡng tuyến tính cho tốn Cực tiểu hóa thiệt hại thông tin sai lệch gây chứng minh tốn thuộc lớp NP-Khó, đồng thời đề xuất hai thuật toán tham lam để giải toán Kết thực nghiệm cho thấy ưu điểm trội hai thuật toán đề xuất so với thuật tốn thơng dụng khác thuật tốn Max Degree thuật tốn Random việc hạn chế thơng tin sai lệch lan truyền mạng Hướng phát triển: Trong thời gian tới, tác giả đề xuất số hướng phát triển luận văn sau: • Thiết kế thuật toán đạt tỉ lệ tối ưu cao cho toán MDM Cải tiến thời gian chạy thuật toán, giúp thuật toán chạy nhanh mạng xã hội có quy mơ lớn • Mở rộng phạm vi toán MDM xét với trường hợp đỉnh u ∈ V bị kích hoạt thơng tin sai lệch gây thiệt hai khác nhau, đồng thời nghiên cứu tốn mơ hình lan truyền thơng tin khác • Trong luận văn, tác giả giả thiết tập nguồn thông tin sai lệch S biết trước Tuy nhiên, xác định nguồn thông tin sai lệch ban đầu vấn đề phức tạp, hướng nghiên cứu tác giả tương lai 25 DANH MỤC CƠNG TRÌNH ĐÃ CƠNG BỐ Manh M Vu and Huan X Hoang, Minimizing the Spread of Misinformation on Online Social Networks with Time and Budget Constraint, In proceeding of the 9th International Conference on Knowledge and Systems Engineering (KSE 2017) (Notification of acceptance: July 30, 2017) Canh V Pham, Manh M Vu and Huan X Hoang, Preventing and Detecting Infiltration on Online Social Networks, In proceeding of the 4th International Conference on Computational Social Networks (CsoNet), 2015, pp 60-73 Tài liệu tham khảo [1] H Zhang, M Alim, X Li, M T Thai, and H Nguyen Misinformation in Online Social Networks: Detect Them All with Limited Budget ACM Transactions on Information Systems, 2016, pp 18:1-18:24 [2] Ceren Budak, Divyakant Agrawal, Amr El Abbadi Limiting the Spread of Misinformation in Social Networks In Proceedings of the 20th International Conference on World Wide Web, 2011, pp 665-674 [3] H Zhang, H Zhang, X Li, and M T Thai Limiting the Spread of Misinformation while Effectively Raising Awareness in Social Networks In Proceedings of the 4th International Conference on Computational Social Networks, 2015, pp 35-47 [4] N P Nguyen, G Yan, and M T Thai Analysis of Misinformation Containment in Online Social Networks Elsevier Computer Networks-Towards a Science of Cyber Security, 2013, pp 2133-2146 [5] B Aditya Prakash, Jilles Vreeken, and Christos Faloutsos Spotting Culprits in Epidemics: How many and Which ones? In Data Mining (ICDM), 2012 IEEE 12th International Conference on IEEE, 2012, pp 11-20 [6] V Qazvinian, E Rosengren, D R Radev, and Qiaozhu Mei Rumor has it: Identifying Misinformation in Microblogs In Proc EMNLP, 2011, pp 1589-1599 [7] S Kwon, M Cha, K Jung, W Chen, and Y Wang 2013 Prominent Features of Rumor Propagation in Online Social Media In Proc ICDM, 2013, pp 1103-1108 [8] Devavrat Shah and Tauhid Zaman Rumors in a Network: Who’s the Culprit? IEEE Transactions on Information Theory, 2011, pp 5163-5181 [9] Vahed Qazvinian, Emily Rosengren, Dragomir R Radev, and Qiaozhu Mei Rumor has it: Identifying Misinformation in Microblogs In Proceedings of the Conference on Empirical Methods in Natural Language Processing, 2011, pp 1589-1599 26 27 [10] Sejeong Kwon, Meeyoung Cha, Kyomin Jung, Wei Chen, and Yajun Wang Prominent Features of Rumor Propagation in Online Social Media In Data Mining (ICDM), 2013 IEEE 13th International Conference on IEEE, 2013, pp 1103-1108 [11] Kai Zhu and Lei Ying 2014 A Robust Information Source Estimator with Sparse Observations Computational Social Networks, 2014, pp 1-21 [12] Wuqiong Luo, Wee Peng Tay, and Mei Leng Identifying Infection Sources and Regions in Large Networks IEEE Transactions on Signal Processing, 2013, pp 2850-2865 [13] H Nguyen and R Zheng On budgeted Influence Maximization in Social Networks IEEE Journal on Selected Areas in Communications, 2013, pp 1084-1094 [14] Mạng xã hội nhận diện thông tin xấu độc Truy xuất từ http://dangcongsan.vn/dien-dan/mang-xa-hoi-nhan-dien-thong-tin-xaudoc-434891.html [Ngày truy cập 22/5/2017] [15] Bimal Viswanath, Alan Mislove, Meeyoung Cha, Krishna P Gummadi On the Evolution of User Interaction in Facebook In Proceedings of the 2nd ACM Workshop on Online Social Networks, 2009, pp 37-42 [16] N P Nguyen, M A Alim, T N Dinh, and M T Thai A Method to Detect Communities with Stability in Social Networks Social Network Analysis and Mining, 2014, pp 224:1-224:15 [17] N P Nguyen, G Yan, M T Thai, and S Eidenbenz Containment of Misinformation Spread in Online Social Networks In Proceedings of the 4th Annual ACM Web Science Conference, 2012, pp 213-222 [18] H Zhang, M Alim, M T Thai, and H Nguyen Monitor Placement to Timely Detect Misinformation in Online Social Networks In Proceedings of the 2015 IEEE International Conference on Communications, 2015, pp 1152-1157 [19] H Zhang, H Zhang, X Li, and M T Thai Limiting the Spread of Misinformation while Effectively Raising Awareness in Social Networks In Proceedings of the 4th International Conference on Computational Social Networks, 2015, pp 35-47 28 [20] T N Dinh, H Zhang, D T Nguyen, and M T Thai Cost-Effective Viral Marketing for Time-Critical Campaigns in Large-Scale Social Networks IEEE/ACM Transactions on Networking, 2014, pp 2001-2011 [21] Wei Chen, Wei Lu, and Ning Zhang Time-Critical Influence Maximization in Social Networks with Time-Delayed Diffusion Process In Proc AAAI, 2012, pp 1-5 [22] Santo Fortunato Community Detection in Graphs Physics reports, 2010, pp 75-174 [23] Misinformation on Social Media: Can Technology Save Us? Available at https://www.usnews.com/news/national-news/articles/2016-11- 28/misinformation-on-social-media-can-technology-save-us [Accessed 12 May 2017] [24] Việt Nam đổi tiền: Hoàn toàn bịa đặt Truy xuất từ http://vietnamnet.vn/vn/kinh-doanh/tai-chinh/viet-nam-sap-doi-tienhoan-toan-bia-dat-342761.html [Ngày truy cập 21/5/2017] [25] Bác thơng tin tăng lệ phí cấp hộ chiếu Việt Nam Truy xuất từ http://dantri.com.vn/xa-hoi/bac-thong-tin-tang-le-phi-cap-ho-chieu-taiviet-nam-20161209192924661.htm [Ngày truy cập 21/5/2017] [26] D Kempe, J Kleinberg, and E Tardos Influential Nodes in a Diffusion Model for Social Networks In ICALP, 2005, pp 1127-1138 [27] J Goldenberg, B Libai, and E Muller Talk of the Network: A Complex Systems Look at the Underlying Process of Word-of-Mouth Marketing Letters, 2001, pp 211-223 [28] J Leskovec, M Mcglohon, C Faloutsos, N Glance, and M Hurst Cascading Behavior in Large Blog Graphs In Proceedings of the 2007 SIAM International Conference on Data Mining, 2007, pp 551-556 [29] T Carnes, R Nagarajan, S M Wild, and A V Zuylen Maximizing Influence in a Competitive Social Network: a Follower’s Perspective In Proceedings of the Ninth International Conference on Electronic Commerce, 2007, pp 351-360 29 [30] Alexandra Marin and Barry Wellman Social Network Analysis: An Introduction The SAGE Handbook of Social Network Analysis, 2011, pp 11-25 [31] Jiyang Chen Community Mining: Discovery Communities in Social Network Thesis, University of Alberta, 2010 [32] Jon Kleinberg Authoritative Sources in a Hyperlinked Environment Journal of the ACM, 1999, pp 604-632 [33] Jurij Lescovec Dynamics of Large Networks Carnegie Mellon University, 2008 [34] Jure Leskovec, Jon Kleinberg, and Christos Faloutsos Graphs Over Time: Densification Laws, Shrinking Diameters and Possible Explanations In Proceedings of the Eleventh ACM SIGKDD International Conference on Knowledge Discovery in Data Mining,2005, pp 177-187 [35] Charu C Aggarwal Social Network Data Analytics New York: Springer, 2011 [36] M E J Newman Modularity and Community Structure in Networks In Proceedings of the National Academy of Sciences, 2006, pp 8577-8582 [37] R Guimera, M Sales-Pardo Missing and Spurious Interactions and the Reconstruction of Complex Ntworks In Proceedings of the National Academy of Sciences, 2009, pp 22073-22078 [38] Steve Gregory Finding Overlapping Communities Using Disjoint Community Detection Algorithms Complex networks, 2009, pp 47-61 [39] Leskovec, Huttenlocher, and Kleinberg Predicting Positive and Negative Links in Online Social Networks In Proceedings of the 19th International Conference on World Wide Web, 2010, pp 641-650 [40] Linyuan Lu, Tao Zhou Link Prediction in Complex Networks: A Survey Physica A: Statistical Mechanics and Its Applications, 2011, pp 1150-1170 [41] Zhihao Wu, Youfang Lin, Jing Wang, Steve Gregory Efficient Link Prediction with Node Clustering Coefficient arXiv preprint arXiv:1510.07819, 2015 30 [42] T N Dinh, Y Shen, and M T Thai The Walls Have Ears: Optimize Sharing for Visibility and Privacy in Online Social Networks In Proceedings of ACM Int Conference on Information and Knowledge Management, 2012, pp 1452-1461 [43] Y Shen, Y-S Syu, D T Nguyen, and M T Thai Maximizing Circle of Trust in Online Social Networks In Proceedings of ACM Conference on Hypertext and Social Media, 2012, pp 155-164 [44] Y Shen, M T Thai, and H Nguyen Staying Safe and Visible via Message Sharing in Online Social Networks Journal of Combinatorial Optimization, 2014, pp 186-217 [45] J Leskovec, L Backstrom, R Kumar, A Tomkins Microscopic Evolution of Social Networks In Proc KDD, 2008, pp 462-470 [46] J Leskovec, J Kleinberg, C Faloutsos Graph Evolution: Densification and Shrinking Diameters ACM TKDD, 2007 [47] D Kempe, J Kleinberg, and E Tardos Maximizing the Spread of Influence through a Social Network In Proceedings of the Ninth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2003, pp 137–146 [48] Huiyuan Zhang, Thang N Dinh, and My T Thai Maximizing the Spread of Positive Influence in Online Social Networks In Distributed Computing Systems (ICDCS), 2013 IEEE 33rd International Conference on IEEE, 2013, pp 317-326 [49] J Zhang, P Zhou, C Cao, Y Guo L Personalized Influence Maximization on Social Networks In Proceedings of the 22nd ACM International Conference on Information and Knowledge Management, 2013, pp 199-2008 [50] Honglei Zhuang, Yihan Sun, Jie Tang, Jialin Zhangz and Xiaoming Sunz Influence Maximization in Dynamic Social Networks In Data Mining (ICDM), 2013 IEEE 13th International Conference on IEEE, 2013, pp 1313-1318 [51] A Goyal, F Bonchi, and L V S Lakshmanan Learning Influence Probabilities in Social Networks In Proceedings of the third ACM International Conference on Web Search and Data Mining, 2010, pp 241-250 31 [52] How bin Laden news spread on Twitter Available at http://edition.cnn.com/2011/TECH/social.media/05/02/osama.bin.laden twitter/index.html [Accessed 16 April 2017] [53] Twitter Breaks News of Whitney Houston Death 27 Minutes Before Press Available at http://mashable.com/2012/02/12/whitney-houstontwitter/ [Accessed 16 April 2017] [54] Hackers send fake market-moving AP tweet on White House explosions Available at http://www.reuters.com/article/net-us-usa-whitehouseap-idUSBRE93M12Y20130423 [Accessed 16 April 2017] [55] A Goyal, W Lu, and L V S Lakshmanan Simpath: An Efficient Algorithm for Influence Maximization under the Linear Threshold Model In Proc ICDM, 2011, pp 211-220 [56] Swine Flu Frenzy Demonstrates Twitter’s Achilles Heel Available at http://www.pcworld.com/businesscenter/article/163920/swine flufrenzy demonstratest-witters achillesheel.html [Accessed 22 April 2017] [57] Fan, L., Lu, Z., Wu, W., Thuraisingham, B., Ma, H., and Bi, Y Least Cost Rumor Blocking in Social Networks In Distributed Computing Systems, 2013 IEEE 33rd International Conference on IEEE, 2013, pp 540-549 [58] Karlova, Natascha, Fisher Karen A Social Diffusion Model of Misinformation and Disinformation for Understanding Human Information Behaviour Information Research, 2013, pp 1-17 [59] Liang Wu, Fred Morstatter, Huan Liu Misinformation in Social Media: Diffusion, Detection and Intervention SBP-BRIMS 2016 Tutorial [60] Wei Chen, Laks V.S Lakshmanan, and Carlos Castillo Information and Influence Propagation in Social Networks A Publication in the Morgan & Claypool Publishers series Synthesis Lectures on Data Management, 2014 [61] Wei Chen, Yifei Yuan, and Li Zhang Scalable Influence Maximization in Social Networks under the Linear Threshold Model In Data Mining (ICDM), 2010 IEEE 10th International Conference on IEEE, 2010, pp 88-97 32 [62] Pedro Domingos and Matthew Richardson Mining the Network Value of Customers In Proceedings of the Seventh ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2001, pp 57-66 [63] J Leskovec, A Krause, C Guestrin, C Faloutsos, J VanBriesen, N Glance Cost-Effective Outbreak Detection in Networks In Proc KDD, 2007, pp 420-429 [64] A Goyal, W Lu, L V.S Lakshmanan Celf++: Optimizing the Greedy Algorithm for Onfluence Maximization in Social Networks In Proc WWW, 2011, pp 47-48 [65] D T Nguyen, N P Nguyen, and M T Thai Sources of Misinformation in Online Social Networks: Who to Suspect? In Proceedings of the IEEE Military Communications Conference, 2012, pp 1-6 [66] Kempe, 2008 Design and Analysis of Algorithms Available at http://wwwbcf.usc.edu/ dkempe/CS303/solutions13.pdf [Accessed 22 May 2017] 33 PHỤ LỤC Algorithm 4: Thuật toán Max Degree 10 11 12 13 14 Input : G = (V, E), w(u, v), d, B, tập nguồn phát thông tin sai lệch S Output: Tập đỉnh I lời giải toán MDM begin I ← ∅; N ← Nd (S); C ← 0; while (C < B) and (N = ∅) u ← maxdegree(N ); //Chọn đỉnh có bậc lớn tập N để tạo miễn dịch if C + c(u) ≤ B then I ← I ∪ {u}; C ← C + c(u); end N ← N \{u}; end Return I; end Algorithm 5: Thuật toán Random 10 11 12 13 14 Input : G = (V, E), w(u, v), d, B, tập nguồn phát thông tin sai lệch S Output: Tập đỉnh I lời giải toán MDM begin I ← ∅; N ← Nd (S); C ← 0; while (C < B) and (N = ∅) u ← random(N ); //Chọn ngẫu nhiên đỉnh tập N để tạo miễn dịch if C + c(u) ≤ B then I ← I ∪ {u}; C ← C + c(u); end N ← N \{u}; end Return I; end ... đến toán hạn chế lan truyền thông tin sai lệch mạng xã hội trực tuyến 10 GIẢI PHÁP GIẢM THIỂU TỐI ĐA THIỆT HẠI DO THÔNG TIN SAI LỆCH GÂY RA TRÊN MẠNG XÃ HỘI TRỰC TUYẾN 12 3.1 Phát biểu toán... quan đến toán hạn chế lan truyền thông tin sai lệch mạng xã hội trực tuyến Chương 3: Giải pháp giảm thiểu tối đa thiệt hại thông tin sai lệch gây mạng xã hội trực tuyến Từ thực trạng nêu Chương... chặn chia sẻ, lan truyền thông tin sai lệch từ đỉnh đến đỉnh láng giềng 12 Chương GIẢI PHÁP GIẢM THIỂU TỐI ĐA THIỆT HẠI DO THÔNG TIN SAI LỆCH GÂY RA TRÊN MẠNG XÃ HỘI TRỰC TUYẾN Chương tập trung

Ngày đăng: 19/01/2020, 02:52