Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 69 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
69
Dung lượng
1,3 MB
Nội dung
BỘ GIÁO DỤC VIỆN HÀN LÂM VÀ ĐÀO TẠO KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ VI MẠNH TUYÊN Vi Mạnh Tuyên NGHIÊN CỨU PHƯƠNG PHÁP NGĂN CHẶN PHÁT TÁN HỆ THỐNG THÔNG TIN THÔNG TIN SAI LỆCH ĐA CHỦ ĐỀ TRÊN MẠNG XÃ HỘI LUẬN VĂN THẠC SĨ NGÀNH MÁY TÍNH 2021 Hà Nội – 2021 download by : skknchat@gmail.com BỘ GIÁO DỤC VIỆN HÀN LÂM VÀ ĐÀO TẠO KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ Vi Mạnh Tuyên NGHIÊN CỨU PHƯƠNG PHÁP NGĂN CHẶN PHÁT TÁN THÔNG TIN SAI LỆCH ĐA CHỦ ĐỀ TRÊN MẠNG XÃ HỘI Chuyên ngành : Hệ thống thông tin Mã số: 8480104 LUẬN VĂN THẠC SĨ NGÀNH MÁY TÍNH NGƯỜI HƯỚNG DẪN KHOA HỌC : TS TRẦN ĐỨC NGHĨA TS NGUYỄN VIỆT ANH Hà Nội – 2021 download by : skknchat@gmail.com LỜI CAM ĐOAN Tôi Vi Mạnh Tun, học viên khóa 2019B, ngành Máy tính, chun ngành Hệ Thống Thông Tin Tôi xin cam đoan luận văn “Nghiên cứu phương pháp ngăn chặn phát tán thông tin sai lệch đa chủ đề mạng xã hội” tơi nghiên cứu, tìm hiểu thực hướng dẫn TS Trần Đức Nghĩa TS Nguyễn Việt Anh Trong trình làm luận văn tơi có tham khảo tài liệu có liên quan ghi rõ nguồn tài liệu tham khảo Tôi xin chịu trách nhiệm lời cam đoan Hà Nội, ngày tháng năm 2021 Tác giả Vi Mạnh Tuyên download by : skknchat@gmail.com LỜI CẢM ƠN Lời cảm ơn trân trọng em muốn dành tới thầy cô Học viện khoa học công nghệ Việt Nam, Viện công nghệ thông tin, Viện Hàn lâm khoa học cơng nghệ Việt Nam tận tình giảng dạy truyền đạt kiến thức quý báu, tạo môi trường học tập, nghiên cứu khoa học nghiêm túc suốt thời gian vừa qua, giúp em có kiến thức chuyên môn tảng để làm sở lý luận khoa học cho luận văn Đặc biệt em xin chân thành cảm ơn hai thầy TS Trần Đức Nghĩa TS Nguyễn Việt Anh định hướng, dìu dắt hướng dẫn em suốt trình làm luận văn, bảo thầy giúp em tự tin nghiên cứu vấn đề giải toán cách khoa học Em xin trân trọng cảm ơn Ban giám hiệu Học viện khoa học công nghệ Việt Nam - Viện Hàn lâm khoa học công nghệ Việt Nam tạo điều kiện cho em học tập làm luận văn cách thuận lợi Trong trình học tập thực luận văn, thực với tinh thần nghiêm túc, chắn không tránh khỏi thiết sót Em mong thơng cảm bảo tận tình thầy bạn Hà Nội, ngày tháng năm 2021 Tác giả Vi Mạnh Tuyên download by : skknchat@gmail.com MỤC LỤC DANH MỤC KÝ HIỆU VÀ CÁC CHỮ VIẾT TẮT DANH MỤC HÌNH VẼ VÀ ĐỒ THỊ DANH MỤC BẢNG BIỂU 10 MỞ ĐẦU 1 Động lực nghiên cứu 2 Mục tiêu luận văn Cấu trúc luận văn CHƯƠNG CƠ SỞ LÝ THUYẾT 1.1 Giới thiệu chung mạng xã hội (MXH) 1.1.1 Đặc điểm MXH 1.1.2 Lợi ích tác động MXH 1.2 Tác hại thông tin sai lệch MXH 11 1.2.1 Định nghĩa thông tin sai lệch tính chất thơng tin sai lệch 11 1.2.2 Tác hại thực trạng phát tán thông tin sai lệch MXH 13 1.3 Mơ hình ngưỡng tuyến tính (Linear Threshold – LT) 17 1.4 Mơ hình Ngưỡng tuyến tính đa chủ đề (Multiple Topics Linear Threshold – MT-LT) 20 1.5 Kết luận chương 24 CHƯƠNG NGĂN CHẶN THÔNG TIN SAI LỆCH ĐA CHỦ ĐỀ TRÊN MẠNG XÃ HỘI 25 2.1 Đặt vấn đề 25 2.2 Bài tốn ngăn chặn thơng tin sai lệch đa chủ đề 27 2.2.1 Mơ hình định nghĩa tốn 27 download by : skknchat@gmail.com 2.2.2 Biểu diễn mạng xã hội 31 2.2.3 Tập liệu sử dụng 32 2.3 Thuật toán Tham lam cải tiến IGA (Impove Greedy Algorithm) 33 2.4 Thuật toán tham lam mở rộng GEA (Greedy Extension Algorithm) 38 2.5 Kết luận chương 43 CHƯƠNG 3: THỬ NGHIỆM VÀ ĐÁNH GIÁ 44 3.1 Cài đặt thử nghiệm 44 3.1.1 Mục đích thử nghiệm 44 3.1.2 Cài đặt tham số 45 3.2 Đánh giá hiệu thuật toán thiết lập chi phí đơn vị 45 3.3 Đánh giá hiệu thuật tốn chi phí chung 48 3.4 So sánh thời gian chạy 50 3.4.1 So sánh thời gian chạy thuật toán cài đặt chi phí đơn vị 50 3.4.2 So sánh thời gian chạy thuật toán cài đặt chi phí chung 52 3.5 Kết luận chương 53 KẾT LUẬN 54 TÀI LIỆU THAM KHẢO 56 download by : skknchat@gmail.com DANH MỤC KÝ HIỆU VÀ CÁC CHỮ VIẾT TẮT Từ viết tắt MT-LT Từ chuẩn Multiple Topics Linear Diễn giải Mơ hình Ngưỡng tuyến tính đa chủ đề Threshold LT Linear Threshold Mơ hình Ngưỡng tuyến tính IC Independent Cascade Mơ hình Bậc độc lập Social Network Mạng xã hội Multiple Topics and Đa chủ đề ràng buộc ngân sách MXH MMTB Budget Constraint GEA Greedy Extension Tham lam mở rộng Algorithm IGA Impove Greedy Algorithm Tham lam cải tiến download by : skknchat@gmail.com DANH MỤC HÌNH VẼ VÀ ĐỒ THỊ Hình 1.3.1 Mơ tả q trình lan truyền thơng tin mơ hình với t = 18 Hình 1.3.2 Mơ tả q trình lan truyền thơng tin mơ hình LT với t = 19 Hình 1.3.3 Mơ tả q trình lan truyền thơng tin mơ hình LT với t = 20 Hình 1.4.1 Mơ tả q trình lan truyền thơng tin mơ hình MT- LT với t = 22 Hình 1.4.2 Mơ tả q trình lan truyền thơng tin mơ hình MT- LT với t = 23 Hình 1.4.3 Mơ tả q trình lan truyền thơng tin mơ hình MT- LT với t = 23 Hình 2.2.1.1 Xây dựng mơ hình suy giảm từ Knapsack thành MMTB 30 Hình 2.2.3.1 Tập liệu mạng Epinions 33 Hình 2.4.1 Ước tính cập nhật 𝑓𝑇𝑖 ⊙ {𝑢}, 𝐻𝑖 cách sử dụng gốc 41 Hình 3.2 a Hiệu thuật toán với thiết lập 𝑐(𝑣)=1 tập liệu mạng NetHepP 46 Hình 3.2 b Hiệu thuật toán với thiết lập 𝑐(𝑣)=1 tập liệu mạng Gnutella 47 Hình 3.2 c Hiệu thuật tốn với thiết lập 𝑐(𝑣)=1 tập liệu mạng Epinions 47 Hình 3.3 a Hiệu thuật toán với thiết lập 𝑐(𝑣)∈ [1.0, 3.0] tập liệu mạng Gnutella 48 Hình 3.3 b Hiệu thuật toán với thiết lập 𝑐(𝑣)∈ [1.0, 3.0] tập liệu mạng NetHepP 49 Hình 3.3 c Hiệu thuật tốn với thiết lập 𝑐(𝑣)∈ [1.0, 3.0] tập liệu mạng Epinions 49 Hình 3.4 a Thời gian chạy thuật toán với thiết lập 𝑐(𝑣)=1 tập liệu mạng Gnutella 50 download by : skknchat@gmail.com Hình 3.4 b Thời gian chạy thuật tốn với thiết lập 𝑐(𝑣)=1 tập liệu mạng NetHepP 51 Hình 3.4 c Thời gian chạy thuật toán với thiết lập 𝑐(𝑣)=1 tập liệu mạng Epinions 51 Hình 3.4 d Thời gian chạy thuật toán với thiết lập 𝑐(𝑣)∈ [1.0, 3.0] tập liệu mạng Gnutella 52 Hình 3.4 e Thời gian chạy thuật tốn với thiết lập 𝑐(𝑣)∈ [1.0, 3.0] tập liệu mạng NetHepP 53 Hình 3.4 f Thời gian chạy thuật toán với thiết lập 𝑐(𝑣)∈ [1.0, 3.0] tập liệu mạng Epinions 53 download by : skknchat@gmail.com DANH MỤC BẢNG BIỂU Bảng Bảng ký hiệu Bảng Tập liệu 44 download by : skknchat@gmail.com 3.1.2 Cài đặt tham số Vì khó xác định xác trọng số ảnh hưởng đỉnh 𝑢 đỉnh 𝑣 đồ thị 𝐺, nên nghiên cứu trước [20, 24, 26], nghiên cứu giả định tập cạnh vào đỉnh bị nhiễm thông tin sai lệch có đóng góp việc kích hoạt đỉnh lân cận, tham số thiết lập sau: • Trọng số cạnh (𝑢, 𝑣) là: 𝑤(𝑢, 𝑣) = , với Nin(𝑣) tập đỉnh |Nin(𝑣)| vào đỉnh 𝑣 • ∑𝑢∈𝑁𝑖𝑛 (𝑣) 𝑤(𝑢, 𝑣) = Mỗi cạnh có đóng góp việc kích hoạt đỉnh 𝑣 • 𝑝𝑣𝑖 𝛾𝑣𝑖 khởi tạo ngẫu nhiên phạm vi [0,1] • Chi phí cho việc chặn đỉnh 𝑐(𝑣), 𝑣 ∈ 𝑉 khởi tạo ngẫu nhiên khoảng [1.0, 3.0] • Nguồn phát tán thơng tin sai lệch 𝑆: 𝑆1 = 𝑆2 = 𝑆3 = 100 Trong trường hợp chi phí giống hệt nhau, tác giả tiến hành đặt 𝑐(𝑣 ) = Phương pháp mô MC thuật tốn thực để tính tốn gần kết Đối với thuật tốn IGA, mơ MC thực để ước tính kết hàm mục tiêu 𝜎( ) Thuật toán GEA cập nhật nhanh chóng với giá trị hàm mục tiêu dựa phép duyệt sâu sử dụng cấu trúc mẫu số trung bình gần tất 𝑇𝑖 Tất thuật toán lập trình ngơn ngữ Python Các thử nghiệm thực hệ điều hành Linux với CPU Intel Core i7 – 8550U 1.8Ghz, RAM 8GB DDR4 2400MHz 3.2 Đánh giá hiệu thuật toán thiết lập chi phí đơn vị Để đánh giá hiệu thuật toán IGA GEA, tác giả tiến hành số thử nghiệm điều kiện thiết lập chi phí cho việc ngăn chặn đỉnh Trong thiết lập chi phí đơn vị, chi phí cho việc chặn đỉnh 𝑐(𝑣) cho tất tập liệu Ngân sách 𝐵 cài đặt cho thay đổi từ đến 100 Hiệu 45 download by : skknchat@gmail.com đo dựa kết trung bình hàm khuếch tán 𝜎 (𝐺, 𝑆, 𝐴) công thức Hình 3.2a, 3.2b, 3.2c cho thấy kết tất thuật toán Khi ngân sách tăng lên, số lượt kích hoạt trung bình đồ thị tăng theo Có thể thấy, với thiết lập 𝑐(𝑣)=1, GEA có hiệu tốt nhất, IGA hai thuật toán hoạt động tốt Random Degree với biên độ lớn Lý Degree sử dụng thuộc tính cấu trúc liên kết mạng xã hội mà khơng thể xem xét q trình tác động đỉnh nguồn cịn Random thêm đỉnh ngẫu nhiên vào tập đỉnh chặn giới hạn ngân sách Trong hình 3c, buộc phải dừng IGA sớm ngân sách lớn 40 việc tính tốn nhiều thời gian Hình 3.2 a Hiệu thuật toán với thiết lập 𝑐(𝑣)=1 tập liệu mạng NetHepP 46 download by : skknchat@gmail.com Hình 3.2 b Hiệu thuật toán với thiết lập 𝑐(𝑣)=1 tập liệu mạng Gnutella Hình 3.2 c Hiệu thuật toán với thiết lập 𝑐(𝑣)=1 tập liệu mạng Epinions 47 download by : skknchat@gmail.com 3.3 Đánh giá hiệu thuật toán chi phí chung Trong thử nghiệm này, tác giả giữ nguyên ngân sách 𝐵 thay đổi từ đến 100 thiết lập chi phí chung, chi phí cho việc chặn đỉnh 𝑐(𝑣) phạm vi [1.0, 3.0] cho tất tập liệu Trong hình 3.3 a, 3.3 b, 3.3 c, hai thuật toán GEA IGA hoạt động tốt thuật toán Random Degree Thuật toán GEA hiệu từ 1,1 đến 2,24 lần so với thuật toán IGA hiệu tới 121 lần so với thuật toán Degree xét số lượt kích hoạt trung bình Trong trình thử nghiệm, tiến hành dừng IGA sớm với ngân sách lớn 40 tập liệu mạng Epinions thuật tốn nhiều thời gian (lâu 72 giờ) Hình 3.3 a Hiệu thuật toán với thiết lập 𝑐(𝑣)∈ [1.0, 3.0] tập liệu mạng Gnutella 48 download by : skknchat@gmail.com Hình 3.3 b Hiệu thuật toán với thiết lập 𝑐(𝑣)∈ [1.0, 3.0] tập liệu mạng NetHepP Hình 3.3 c Hiệu thuật toán với thiết lập 𝑐(𝑣)∈ [1.0, 3.0] tập liệu mạng Epinions 49 download by : skknchat@gmail.com 3.4 So sánh thời gian chạy Cuối cùng, tác giả tiến hành so sánh thuật toán IGA, GEA, Random Degree với thời gian chạy chúng Hình 3.4 a, 3.4 b, 3.4 c Hình 3.4 d, 3.4 e, 3.4 f hiển thị thời gian chạy thuật toán thiết lập chi phí đơn vị chi phí chung tập liệu Thời gian chạy tăng lên ngân sách 𝐵 tăng lên Việc lấy kết thời gian chạy thuật toán thực đồng thời với thử nghiệm đánh giá hiệu thuật toán mục 3.2 3.3 3.4.1 So sánh thời gian chạy thuật tốn cài đặt chi phí đơn vị Để thể rõ hiệu suất thuật toán này, tác giả thử nghiệm thời gian chạy thuật tốn theo chi phí đơn vị (tất chi phí xóa bỏ đỉnh 𝑐(𝑣) 1) tất tập liệu Hình 3.4 a, 3.4 b, 3.4 c hiển thị kết tất thuật tốn cài đặt chi phí đơn vị Hình 3.4 a Thời gian chạy thuật toán với thiết lập 𝑐(𝑣)=1 tập liệu mạng Gnutella 50 download by : skknchat@gmail.com Hình 3.4 b Thời gian chạy thuật toán với thiết lập 𝑐(𝑣)=1 tập liệu mạng NetHepP Hình 3.4 c Thời gian chạy thuật toán với thiết lập 𝑐(𝑣)=1 tập liệu mạng Epinions Các thuật toán Tham lam Random chạy nhanh mạng lớn Tuy nhiên, thuật toán GEA đạt thời gian chạy cạnh tranh Lý kỹ thuật phân nhóm tính tốn hiệu IGA thuật tốn chậm tốn nhiều thời gian mô MC 51 download by : skknchat@gmail.com 3.4.2 So sánh thời gian chạy thuật toán cài đặt chi phí chung Trong thử nghiệm thời gian chạy thuật tốn cài đặt chi phí chung, tác giả thiết lập chi phí cho việc chặn đỉnh 𝑐(𝑣) phạm vi [1.0, 3.0] cho tất tập liệu Hình 3.4 d, 3.4 e, 3.4 f hiển thị kết tất thuật toán cài đặt chi phí chung Hình 3.4 d Thời gian chạy thuật toán với thiết lập 𝑐(𝑣)∈ [1.0, 3.0] tập liệu mạng Gnutella 52 download by : skknchat@gmail.com Hình 3.4 e Thời gian chạy thuật toán với thiết lập 𝑐(𝑣)∈ [1.0, 3.0] tập liệu mạng NetHepP Hình 3.4 f Thời gian chạy thuật toán với thiết lập 𝑐(𝑣)∈ [1.0, 3.0] tập liệu mạng Epinions Thời gian chạy cài đặt chi phí chung tất thuật tốn lớn 1,05 đến 1,2 lần so với cài đặt chi phí đơn vị Trong tất cài đặt, GEA chạy nhanh IGA tới 196 lần 3.5 Kết luận chương Trong phần này, tác giả tiến hành thử nghiệm thấy hiệu thuật toán IGA GEA, thuật toán so sánh với thuật toán Degree Random thiết lập mơ hình MT-LT Các tham số cài đặt thủ công giả định cạnh có vai trị việc kích hoạt đỉnh đồ thị Trong tất thử nghiệm, IGA GEA cho kết vượt trội số lượt kích hoạt trung bình hai thuật tốn xét q trình tác động đỉnh nguồn tập liệu Thuật toán IGA chạy chậm việc mô MC nhiều thời gian 53 download by : skknchat@gmail.com KẾT LUẬN Trong luận văn này, tác giả thực nghiệm mơ hình ngăn chặn thông tin sai lệch đa chủ đề lan truyền MXH với nguồn ngân sách hạn chế Tác giả lập mơ hình tốn dạng tốn tối ưu hóa kết hợp dựa mơ hình MT-LT với yêu cầu đa chủ đề ngân sách cố định cho việc lựa chọn đỉnh Trong mô hình MT-LT, lan truyền thơng tin mơ hình hóa dựa mức độ ảnh hưởng ngưỡng kích hoạt khác cho chủ đề Vấn đề MMTB đề cập dựa mơ hình MT-LT Tác giả chứng minh tốn MMTB NP-Khó, tính tốn hàm mục tiêu #P-Khó hàm mục tiêu đơn điệu có tính chất Submodular Tác giả ứng dụng thuật toán Tham lam cải tiến IGA thuật toán Tham lam mở rộng GEA cho kết vượt trội thực nghiệm cho tập liệu mơ MXH dạng đồ thị có hàng trăm nghìn đỉnh cạnh Kết đạt được: • Tìm hiểu tổng quan mạng xã hội, lây lan tác hại thông tin sai lệch mạng xã hội • Tìm hiểu chế lan truyền thơng tin đặc tính mơ hình lan truyền thơng tin: mơ hình ngưỡng tuyến tính (LT) mơ hình ngưỡng tuyến tính đa chủ đề MT-LT Tác giả tìm hiểu hướng nghiên cứu liên quan đến tốn ngăn chặn thơng tin sai lệch lan truyền mạng xã hội cơng bố • Thực nghiệm, đánh giá mơ hình lan truyền thơng tin ngưỡng tuyến tính đa chủ đề với hai thuật tốn IGA GEA Kết thực nghiệm cho thấy thuật toán IGA GEA vượt trội thuật toán sở Random Greedy Mặc dù cố gắng nỗ lực hết mình, thời gian nghiên cứu trình độ thân có hạn nên luận văn khơng thể tránh khỏi thiếu sót hạn chế, tác giả mong nhận ý kiến đóng góp để luận văn đạt kết tốt 54 download by : skknchat@gmail.com Định hướng nghiên cứu tiếp theo: ✓ Nghiên cứu tìm cách cải tiến thuật toán tham lam để tối ưu toán ✓ Có thể áp dụng kỹ thuật Heuristic thuật toán di truyền, đàn kiến… để giảm thời gian tính tốn giảm chi phí 55 download by : skknchat@gmail.com TÀI LIỆU THAM KHẢO [1] P Domm, “False rumor of explosion at white house causes stocks to briefly plunge; ap confirms its twitter feed was hacked,” 2018 [Online] Available: http://www.cnbc.com/id/100646197 [2] H Allcott, M Gentzkow, “Social media and fake news in the 2016 election,” 2019 [Online] Available: https://web.stanford.edu/ gentzkow/ research/ fakenews.pdf [3] D Kempe, J M Kleinberg, and É Tardos Maximizing the spread of influence through a social network In Proceedings of the Ninth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Washington, DC, USA, August 24 - 27, 2003, pages 137–146, 2003 [4] N Barbieri, F Bonchi, and G Manco Topic-aware social influence propagation models Knowledge and Information Systems, 37(3):555– 584, 2013 [5] W Chen, L V S Lakshmanan, and C Castillo Information and Influence Propagation in Social Networks Synthesis Lectures on Data Management Morgan & Claypool Publishers, 2013 [6] W Chen, C Wang, and Y Wang Scalable influence maximization for prevalent viral marketing in large-scale social networks In Proceedings of the 16th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Washington, DC, USA, July 25-28, 2010, pages 1029–1038, 2010 [7] W Chen, Y Yuan, and L Zhang Scalable influence maximization in social networks under the linear threshold model In ICDM 2010, The 10th IEEE International Conference on Data Mining, Sydney, Australia, 14-17 December 2010, pages 88–97, 2010 56 download by : skknchat@gmail.com [8] N P Nguyen, G Yan, and M T Thai Analysis of misinformation containment in online social networks Computer Networks, 57(10):2133– 2146, 2013 [9] C V Pham, H M Dinh, H D Nguyen, H T Dang, and H X Hoang Limiting the spread of epidemics within time constraint on online social networks In Proceedings of the Eighth International Symposium on Information and Communication Technology, Nha Trang City, Viet Nam, December 7-8, 2017, pages 262–269, 2017 [10] C V Pham, Q V Phu, and H X Hoang Targeted misinformation blocking on online social networks In Intelligent Information and Database Systems - 10th Asian Conference, ACIIDS 2018, Dong Hoi City, Vietnam, March 19-21, 2018, Proceedings, Part I, pages 107– 116, 2018 [11] Dung V Pham, Giang L Nguyen, Tu N Nguyen, Canh V Pham, Anh V Nguyen Multi-Topic Misinformation Blocking With Budget Constraint on Online Social Networks, IEEE, 2020 [12] Twitter deletes 125,000 isis accounts and expands anti-terror teams [13] C Song, W Hsu, and M Lee Node immunization over infectious period In Proceedings of the 24th ACM International Conference on Information and Knowledge Management, CIKM 2015, Melbourne, VIC, Australia, October 19 - 23, 2015, pages 831–840, 2015 [14] E B Khalil, B N Dilkina, and L Song Scalable diffusion-aware optimization of network topology In The 20th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, KDD ’14, New York, NY, USA - August 24 - 27, 2014, pages 1226–1235, 2014 [15] H T Nguyen, A Cano, T N Vu, and T N Dinh Blocking self-avoiding walks stops cyber-epidemics: A scalable gpu-based approach IEEE Transactions on Knowledge and Data Engineering, 2019 [16] Statista 2021 Number of social network users worldwide from 2017 to 2025 07/15/2021, from https://www.statista.com/statistics/ 278414/ number-of-worldwide-social-network-users/ 57 download by : skknchat@gmail.com [17] Statista 2021 Facebook usage penetration in Vietnam from 2017 to 2023 07/15/2021, From https://www.statista.com/statistics/553800/ [18] Karlova and Fisher A Social Diffusion Model of Misinformation and Disinformation for Understanding Human Information Behaviour Proceedings of the ISIC (Tokyo), 2012 [19] V Luckerson Fear, misinformation, and social media complicate ebola fight In http://time.com/3479254/ebola-social-media/, 2014 [20] Y Zhang, A Adiga, S Saha, A Vullikanti, and B A Prakash, “Nearoptimal algorithms for controlling propagation at group scale on networks,” IEEE Trans Knowl Data Eng., vol 28, no 12, pp 3339– 3352, 2016 [21] L G Valiant, W Wu and D Z Du, "Distributed rumor blocking with multiple positive cascades", IEEE Trans Comput Social Syst., vol 5, no 2, pp 468-480, Mar 2018 [22] M Kimura, K Saito, and H Motoda, “Solving the contamination minimization problem on networks for the linear threshold model,” in PRICAI 2008, Hanoi, Vietnam, December 15-19, 2008 Proceedings, 2008, pp 977–984 [23] M Kimura, K Saito, and H.Motoda, “Blocking links to minimize contamination spread in a social network,” ACM TKDD, vol 3, no 2, pp 9:1–9:23, 2009 [24] Y Zhang and B A Prakash, “Data-aware vaccine allocation over large networks,” TKDD, vol 10, no 2, pp 20:1–20:32, 2015 [25] Y Zhang and A Prakash, “Scalable vaccine distribution in large graphs given uncertain data,” in The 23rd ACM CIKM 2014, Shanghai, China, November 3-7, 2014, 2014, pp 1719–1728 [26] C V Pham, M T Thai, H V Duong, B Q Bui, and H X Hoang Maximizing misinformation restriction within time and budget constraints J Comb Optim., 35(4):1202–1240, 2018 58 download by : skknchat@gmail.com [27] C V Pham, Q V Phu, H X Hoang, J Pei, and M T Thai Mini – mum budget for misinformation blocking in online social networks J Comb Optim., 38(4):1101–1127, 2019 [28] L G Valiant, W Wu and D Z Du, "Distributed rumor blocking with multiple positive cascades", IEEE Trans Comput Social Syst., vol 5, no 2, pp 468-480, Mar 2018 [29] J Leskovec, J M Kleinberg, and C Faloutsos, “Graph evolution: Densification and shrinking diameters,” TKDD, vol 1, no 1, p 2, 2007 [30] J Leskovec, M Kleinberg, and C Faloutsos, “Graphs over time: densification laws, shrinking diameters and possible explanations,” in The Eleventh ACM SIGKDD, Chicago, Illinois, USA, August 21-24, 2005, 2005, pp 177–187 [31] M Richardson, R Agrawal, and P M Domingos, “Trust management for the semantic web,” in ISWC 2003, Sanibel Island, FL, USA, October 2023, 2003, Proceedings, 2003, pp 351–368 [32] S Khuller, A Moss and J S Naor, "The budgeted maximum coverage problem", Inf Process Lett., vol 70, no 1, pp 39-45, Apr 1999 59 download by : skknchat@gmail.com ... hình việc ngăn chặn thơng tin sai lệch mạng xã hội CHƯƠNG 2: Ngăn chặn thông tin sai lệch đa chủ đề mạng xã hội: Chương trình bày giải pháp ngăn chặn thơng tin sai lệch đa chủ đề mạng xã hội diện... LỆCH ĐA CHỦ ĐỀ TRÊN MẠNG XÃ HỘI Chương trình bày giải pháp ngăn chặn thông tin sai lệch đa chủ đề mạng xã hội diện rộng bao gồm: (1) đặt vấn đề, (2) đề xuất toán ngăn chặn lan truyền thông tin sai. .. CÔNG NGHỆ Vi Mạnh Tuyên NGHIÊN CỨU PHƯƠNG PHÁP NGĂN CHẶN PHÁT TÁN THÔNG TIN SAI LỆCH ĐA CHỦ ĐỀ TRÊN MẠNG XÃ HỘI Chuyên ngành : Hệ thống thông tin Mã số: 8480104 LUẬN VĂN THẠC SĨ NGÀNH MÁY TÍNH