Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 109 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
109
Dung lượng
869,04 KB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ …… ….***………… DƯƠNG NGỌC SƠN MỘT SỐ PHƯƠNG PHÁP NÂNG CAO HIỆU QUẢ DỰ BÁO LAN TRUYỀN THÔNG TIN TRÊN MẠNG XÃ HỘI LUẬN ÁN TIẾN SĨ NGÀNH MÁY TÍNH Hà Nội - 2022 VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ …… ….***………… DƯƠNG NGỌC SƠN MỘT SỐ PHƯƠNG PHÁP NÂNG CAO HIỆU QUẢ DỰ BÁO LAN TRUYỀN THÔNG TIN TRÊN MẠNG XÃ HỘI LUẬN ÁN TIẾN SĨ NGÀNH MÁY TÍNH Chun ngành : Hệ thống thơng tin Mã số: 48 01 04 Người hướng dẫn khoa học: TS Nguyễn Như Sơn TS Nguyễn Ngọc Cương Hà Nội - 2022 i LỜI CAM ĐOAN Tơi cam đoan cơng trình nghiên cứu riêng tôi, các số liệu, tài liệu được sử dụng Luận án được thu thập từ nghiên cứu thực tế; đó, bao gồm một số kết quả nghiên cứu đã được đăng ở các tạp chí khoa học nước cũng như thử nghiệm thực tế “Hệ thống phân tích liệu mạng xã hội” mà có cơ hội tham gia thực hiện Các nội dung viết chung với các tác giả khác được sự đồng ý các đồng tác giả trước đưa vào Luận án Ngoài ra, tài liệu tham khảo được trích dẫn nguồn đầy đủ Trân trọng, Dương Ngọc Sơn ii LỜI CẢM ƠN Để có kết quả hôm nay, xin cảm ơn Học viện Khoa học công nghệ, Viện Hàn lâm Khoa học công nghệ Việt Nam đã tổ chức, đào tạo hướng dẫn tơi hồn thành các thủ tục hồn thiện Luận án Tơi xin bày tỏ lịng biết ơn sâu sắc đến TS Nguyễn Ngọc Cương - Phó Cục trưởng Cục An ninh mạng phịng chớng tội phạm sử dụng công nghệ cao, Bộ Công an TS.Nguyễn Như Sơn - Trưởng Phịng Các hệ thớng phần mềm tích hợp, Viện Công nghệ thông tin, Viện Hàn lâm Khoa học cơng nghệ Việt Nam đã tận tình hướng dẫn, bảo giúp đỡ suốt quá trình thực hiện Luận án Xin chân thành cảm ơn sự giúp đỡ PGS.TS.Nguyễn Long Giang, TS.Nguyễn Việt Anh - Viện Công nghệ thông tin, PGS.TS.Nguyễn Ngọc Hóa Trường Đại học Quốc gia Hà Nội đã truyền đạt cho kiến thức quý báu làm tiền đề cho tơi từ quá trình bắt đầu nghiên cứu đến xây dựng hồn thiện Luận án Tơi cũng xin cảm ơn lãnh đạo đơn vị công tác Phòng Kỹ thuật Viện Nghiên cứu KTNV, Cục Kỹ thuật nghiệp vụ, Bộ Công an đã tạo điều kiện cho để vừa làm việc, vừa học tập thực hiện nghiên cứu Trong quá trình làm việc đã cho có điều kiện tiếp xúc với các hệ thống kỹ thuật, tham dự các hội thảo liên quan đến nội dung trình bày Luận án Ći cùng, xin gửi lời cảm ơn sâu sắc chân thành đến Gia đình, người đã ln ở bên ủng hộ, động viên để có được ngày hơm Trong quá trình thực hiện Luận án, tơi cũng nhận được sự giúp đỡ nhiều người mà không tiện liệt kê ở đây, xin cảm ơn kính chúc tất cả mọi người sức khỏe, hạnh phúc thành công Dương Ngọc Sơn iii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii MỤC LỤC iii DANH MỤC CÁC TỪ VIẾT TẮT v DANH MỤC CÁC BẢNG vi DANH MỤC CÁC HÌNH vii MỞ ĐẦU 1 Phát biểu vấn đề Lý chọn đề tài 3 Mục tiêu luận án Các đóng góp luận án Bố cục Luận án Chương I TỔNG QUAN VỀ LAN TRUYỀN THÔNG TIN TRÊN MẠNG XÃ HỘI 1.1 Mạng xã hội lan truyền thông tin mạng xã hội 1.1.1 Mạng xã hội .6 1.1.2 Lan truyền thông tin mạng xã hội .8 1.2 Các lĩnh vực nghiên cứu phân tích mạng xã hội 1.2.1 Khai phá liệu mạng xã hội 1.2.2 Phân tích mơ hình liệu đờ thị 10 1.2.3 Phát hiện cộng đồng 10 1.2.4 Dự báo lan truyền thông tin 11 1.2.5 An tồn thơng tin 12 1.3 Phát biểu toán phát triển một số phương pháp nâng cao hiệu quả dự báo lan truyền thông tin mạng xã hội 13 1.4 Các hướng nghiên cứu liên quan 16 1.4.1 Nâng cao tốc độ dự báo lan truyền thông tin 16 1.4.2 Nâng cao độ chính xác dự báo lan truyền thông tin 18 1.5 Phương pháp đề xuất 20 1.6 Một số định nghĩa cơ bản 21 1.6.1 Đồ thị 21 1.6.2 Tính toán song song 26 1.6.3 Mơ hình lan truyền thơng tin 27 1.7 Kết luận Chương I 28 iv Chương II NÂNG CAO TỐC ĐỘ DỰ BÁO LAN TRUYỀN THÔNG TIN .30 2.1 Đặt vấn đề 30 2.2 Một số khái niệm liên quan 33 2.2.1 Các phép toán đồ thị 33 2.2.2 Độ trung tâm 37 2.2.3 Tính toán song song 39 2.3 Nâng cao tốc độ dự báo lan truyền thông tin 43 2.3.1 Rút gọn đồ thị 43 2.3.2 Song song hóa quá trình tính toán độ trung tâm trung gian 47 2.3.3 Phương pháp kết hợp hai kỹ thuật 50 2.4 Thực nghiệm kết quả 53 2.4.1 Dữ liệu thực nghiệm 53 2.4.2 Cài đặt thực nghiệm 53 2.4.3 Kết quả thực nghiệm 54 2.5 Kết luận Chương II 58 Chương III NÂNG CAO ĐỘ CHÍNH XÁC DỰ BÁO LAN TRUYỀN THÔNG TIN 59 3.1 Đặt vấn đề 59 3.2 Một số khái niệm liên quan 61 3.2.1 Mơ hình lan truyền thơng tin rời rạc 61 3.2.2 Mô hình Ngưỡng tuyến tính (LT) 62 3.2.3 Mơ hình bậc độc lập (IC) 64 3.2.4 Mơ hình cạnh trực tún (live-edge) 65 3.3 Nâng cao độ chính xác dự báo lan truyền thông tin 68 3.3.1 Ảnh hưởng quan hệ người dùng 69 3.3.2 Ảnh hưởng sở thích người dùng 71 3.3.3 Đo lường ảnh hưởng bên 73 3.3.4 Xây dựng lan truyền 74 3.4 Thực nghiệm kết quả 76 3.4.1 Dữ liệu thực nghiệm 76 3.4.2 Phương pháp thực nghiệm 77 3.4.3 Kết quả thực nghiệm 78 3.5 Kết luận chương III 81 KẾT LUẬN CHUNG 83 DANH MỤC CÁC CƠNG TRÌNH ĐÃ CƠNG BỐ 86 TÀI LIỆU THAM KHẢO 87 Từ v STT tắ AP bBF BC BF CC CP DC DF DS 10 EC 11 GP 12 IC 13 LT 14 RM 15 SDS 16 SSS 17 U vi DANH MỤC CÁC BẢNG Bảng 2.1 So sánh thời gian lan truyền (s) 47 Bảng 2.2 Kết tính BC CC trước rút gọn 51 Bảng 2.3 Kết tính BC CC sau rút gọn 52 Bảng 2.4 Thông tin liệu thử nghiệm 53 Bảng 2.5 So sánh thời gian tính tốn BC trước sau rút gọn 55 Bảng 2.6 Thời gian tính tốn BC giải thuật Red-Bet số luồng thay đổi (giây) 55 Bảng 2.7 Hệ số tăng tốc giải thuật Red-Bet số luồng thay đổi .56 Bảng 2.8 Thời gian tính tốn BC với liệu ba giải pháp (giây) 57 Bảng 2.9 Hệ số tăng tốc Red-Bet so với TeexGraph NetworKit tính tốn BC 58 Bảng 3.1 Ví dụ nhật ký hoạt động 69 Bảng 3.2 So sánh hiệu suất phương pháp chưa xét ảnh hưởng bên 79 Bảng 3.3 So sánh hiệu suất phương pháp xuất ảnh hưởng bên 80 vii DANH MỤC CÁC HÌNH Hình Thống kê số liệu người dùng năm 2020 Hình Ứng dụng phân tích thơng tin mạng xã hội .3 Hình 1.1 Lan truyền thông tin Hình 1.2 Bài tốn phát cấu trúc cộng đồng học viên trường đại học 11 Hình 1.3 Cấu trúc đồ thị 21 Hình 1.4 Một số kiểu đồ thị 22 Hình 2.1 Ví dụ duyệt theo chiều rộng trước 34 Hình 2.2 Ví dụ duyệt theo chiều sâu trước 35 Hình 2.3 Mơ hình xử lý song song CilkPlus 43 Hình 2.4 Đồ thị ngẫu nhiên 500 đỉnh 46 Hình 2.5 Đồ thị ngẫu nhiên 400 đỉnh 46 Hình 2.6 Sơ đồ khối trình tính tốn Độ trung tâm trung gian theo giải thuật kết hợp 49 Hình 2.7 Đồ thị trước rút gọn 51 Hình 2.8 Đồ thị sau rút gọn 52 Hình 2.9 Đồ thị hóa thời gian tính tốn BC giải thuật Red-Bet số luồng thay đổi 56 Hình 2.10 Biểu diễn thời gian tính tốn BC với liệu ba giải pháp 57 Hình 3.1 Ví dụ cho mơ hình LT 63 Hình 3.2 Ví dụ cho mơ hình IC 64 Hình 3.3 Hình dạng hàm logistic 74 Hình 3.4 Sơ đồ khối trình xây dựng lan truyền 75 Hình 3.5 Hình dạng lan truyền 76 Hình 3.6 Biểu diễn chi tiết hiệu suất phương pháp chưa xét ảnh hưởng bên 80 Hình 3.7 Biểu diễn chi tiết hiệu suất phương pháp xuất ảnh hưởng bên 81 MỞ ĐẦU Phát biểu vấn đề Trong thời đại công nghệ thông tin phát triển hiện nay, việc sử dụng Internet trở nên phổ cập Thống kê Hootsuite We Are Social cho thấy, tính đến tháng 1/2020, tổng lượng người dùng Internet toàn thế giới đạt 4,54 tỷ1 Số lượng người dùng Internet ngày tăng nhanh, cụ thể, so với tháng 1/2019, số người dùng mới đã tăng thêm 298 triệu người dùng Ngày có nhiều người sử dụng Internet đồng nghĩa với việc gia tăng nhu cầu sử dụng mạng xã hội Các số thống kê cho thấy lượng người dùng mạng xã hội nói chung toàn thế giới đã chạm ngưỡng xấp xỉ 3,8 tỷ chiếm 49% dân sớ Hình Thống kê số liệu người dùng năm 2020 Con người dành nhiều thời gian ngày cho việc sử dụng Internet nói chung mạng xã hội nói riêng Cũng theo thống kê đối với người độ tuổi từ 16 đến 64 tuổi, trung bình một ngày, người sử dụng 6h43p cho việc truy cập Internet thời gian đó 2h24p để sử dụng các tiện ích liên quan đến mạng xã hội https://wearesocial.com/blog/2020/01/digital-2020-3-8-billion-people-use-social-media 84 Việc duyệt đồ thị sử dụng phương pháp BFS được lồng ghép vào pha duyệt đồ thị Thuật toán Brandes Cuối cùng, chọn một đỉnh làm đại diện, hay tức xóa các đỉnh tương đương để lại một đỉnh Đối với kỹ thuật song song hóa, đó việc thi hành song song các phép tính Độ trung tâm trung gian các đỉnh khác để khai thác được hiệu năng CPU đa lõi Sử dụng bộ thư viện Cilkplus với trọng tâm vector reducerBC[v] bộ thư viện Cilkplus để cập nhật tương tranh giá trị BC đỉnh v thi hành song song Ngoài ra, đối với liệu được biểu diễn theo phương pháp danh sách liền kề lưu trữ dưới dạng mảng Đối với toán tính xác suất chấp nhận thông tin người dùng (hay xác suất lan truyền), đó việc xác định ảnh hưởng từ mối quan hệ người dùng (được xác định dựa lịch sử hoạt động) có xét đến lan truyền sơ cấp thứ cấp; ảnh hưởng từ sở thích, quan tâm người dùng đối với nội dung; ảnh hưởng từ bên ngồi đến qút định người dùng Ći xây dựng lan truyền “có khả năng nhất” cho một nội dung cụ thể dựa các xác suất đã tính với xác suất tạo ( ) = ∏( , )∈ ( ) Tiến hành thực nghiệm cho thấy, phương pháp nâng cao tốc độ tính toán dự báo lan truyền Luận án đã mang lại hiệu quả hơn so với bộ công cụ TeexGraph từ 1,2 đến 1,41 lần so với bộ công cụ NetworKit từ 1,76 đến 2,55 lần thực nghiệm với một số bộ liệu được công bố bởi SNAP Phương pháp nâng cao độ chính xác dự báo lan truyền thông tin Luận án mang lại hiệu quả hơn, sai số thấp hơn hay độ chính xác cao hơn ba mơ hình phổ biến hiện mơ hình bậc độc lập IC, mơ hình tương tác người dùng UI, mơ hình hời quy RM việc dự đoán kích thước lan truyền tạo có khả năng đối với ba bộ liệu mô phỏng, Meme, Tencent Weibo Đặc biệt hiệu quả hơn xét đến ảnh hưởng từ bên Tồn bộ các cơng trình nghiên cứu Luận án được công bố chờ công bố xuất bản các kỷ yếu hội thảo, tạp chí có mục SCOPUS Hạn chế luận án Do hạn chế cả thời gian, nguồn lực lẫn sự giới hạn không 85 gian nghiên cứu, nghiên cứu Luận án cũng nhiều điểm chưa thể giải quyết chưa được đề cập đến Một số điểm hạn chế có thể được liệt kê dưới đây: - Nghiên cứu tăng tốc độ đờ thị Luận án cịn chưa thể tiến hành với đồ thị mạng xã hội có quy mô siêu lớn như Facebook với hơn hai tỷ đỉnh hơn nghìn tỷ cạnh Nguyên nhân xuất phát từ giới hạn các bộ liệu thực được công bớ cơng khai cịn hạn chế với liệu quy mô lớn năng lực hệ thống tính toán mà Nghiên cứu sinh có thể sử dụng cũng cho phép xử lý được với liệu quy mơ siêu lớn như vậy Ngồi ra, việc rút gọn tối ưu phạm vi Luận án - Nghiên cứu dự báo lan truyền thông tin ước tính ảnh hưởng bên một bước thời gian giả định ảnh hưởng vẫn có tác động giữ nguyên cho bước thời gian tiếp theo Do đó, nó chưa thể được sử dụng để dự đoán sớm với liệu lan truyền cập nhật liên tục phân tích liệu lớn Hướng phát triển tương lai Toàn bộ hạn chế đã nêu được Nghiên cứu sinh xác định nghiên cứu được trọng tiến hành thời gian tới, cụ thể: - Với vấn đề nâng cao tốc độ dự báo lan truyền thông tin, có thể tập trung mở rộng phương pháp để nâng cao tốc độ tính toán các phép đo khác phân tích đồ thị mạng xã hội như độ trung tâm gần, độ trung tâm eigenvector, độ trung tâm Pagerank , đồng thời tiến hành phân tích đồ thị phức tạp hơn ứng dụng vào các toán phát hiện điểm nóng, phát hiện cộng đồng, hay toán dự báo lan truyền thông tin, - Với vấn đề nâng cao hiệu quả dự báo lan truyền, tiếp tục nghiên cứu sâu hơn các khía cạnh ảnh hưởng bên ngồi có thể tác động đến quá trình lan truyền Tức kiểm tra ảnh hưởng bên làm thay đổi cấu trúc lan truyền sử dụng sự thay đổi cấu trúc để dự đoán hình dạng kích thước lan truyền - Chứng minh kết quả thực nghiệm Luận án có thể ứng dụng vào hệ thống phân tích thông tin mạng xã hội nghiên cứu phương án áp dụng kết quả nghiên cứu để nâng cao hiệu năng hệ thống 86 DANH MỤC CÁC CƠNG TRÌNH ĐÃ CƠNG BỐ C1 Duong Ngoc Son, Nguyen Ngoc Cuong, Nguyen Nhu Son (2019), Một phương pháp rút gọn đồ thị mạng xã hội dựa thay lớp đỉnh tương đương, The 22nd National Symposium of Selected ICT Problems, pp: 27 C2 Duong Ngoc Son, Nguyen Ngoc Cuong, Nguyen Nhu Son, Nguyen Ngoc Hoa (2020), Một phương pháp nâng cao hiệu tính tốn đồ thị, The 23rd National Symposium of Selected ICT Problems, pp: 60 C3 Du Phuong Hanh, Duong Ngoc Son, Nguyen Ngoc Cuong, Nguyen Ngoc Hoa (2020), A Fast Computation of Betweenness Centrality in LargeScale Unweighted Graphs, International Journal on Emerging Technologies 11(2): 370-377 C4 Duong Ngoc Son, Nguyen Ngoc Cuong, Nguyen Ngoc Hoa, Du Phuong Hanh (2021), A RED-BET Method to Improve the Information Diffusion on Social Networks, International Journal of Advanced Computer Science and Applications, 12(8): 867-875 C5 Nguyen Viet Anh, Duong Ngoc Son, Nguyen Thi Thu Ha, Sergey Kuznetsov, Nguyen Tran Quoc Vinh (2018), A Method for determining information diffusion cascades on social networks, Eastern-European Journal of Enterprise Technologies, Vol 6, No (96), pp: 61-69 87 TÀI LIỆU THAM KHẢO Kim, J., Leem, C., Kim, B., & Cheon, Y (2013) Evolution of online social networks: A conceptual framework Asian Social Science, 9(4), 208-220 Sajithra, K., & Patil, R (2013) Social media–history and components Journal of Business and Management, 7(1), 69-74 Howard, P N., Duffy, A., Freelon, D., Hussain, M M., Mari, W., & Maziad, M (2011) Opening closed regimes: what was the role of social media during the Arab Spring? Information Technology and Political Islam, 1-30 Hughes, A L., & Palen, L (2009) Twitter adoption and use in mass convergence and emergency events International journal of emergency management, 6(3-4), 248-260 Rogers, E M (1962) (1995) Diffusion of innovations New York: Free Press Kaya, M., & Alhajj, R (Eds.) (2019) Influence and Behavior Analysis in Social Networks and Social Media Springer Li, N., & Wu, D D (2010) Using text mining and sentiment analysis for online forums hotspot detection and forecast Decision support systems, 48(2), 354-368 Duggirala, S (2018) NewSQL databases and scalable in-memory analytics In Advances in Computers (Vol 109, pp 49-76) Elsevier Mondal, J., & Deshpande, A (2012) Managing large dynamic graphs efficiently In Proceedings of the 2012 ACM SIGMOD International Conference on Management of Data (pp 145-156) 10 Fortunato, S (2010) Community detection in graphs Physics reports, 486(3-5), 75-174 11 Newman, M E (2006) Modularity and community structure in networks Proceedings of the national academy of sciences, 103(23), 8577-8582 88 12 Guimerà, R., & Sales-Pardo, M (2009) Missing and spurious interactions and the reconstruction of complex networks Proceedings of the National Academy of Sciences, 106(52), 22073-22078 13 Domingos, P., & Richardson, M (2001, August) Mining the network value of customers In Proceedings of the seventh ACM SIGKDD international conference on Knowledge discovery and data mining (pp 57-66) 14 Yang, W., Brenner, L., & Giua, A (2018, April) Computation of activation probabilities in the independent cascade model In 2018 5th International Conference on Control, Decision and Information Technologies (CoDIT) (pp 791-797) IEEE 15 Cohen, E., Delling, D., Pajor, T., & Werneck, R F (2014, November) Sketch-based influence maximization and computation: Scaling up with guarantees In Proceedings of the 23rd ACM International Conference on Conference on Information and Knowledge Management (pp 629-638) 16 Kempe, D., Kleinberg, J., & Tardos, É (2003, August) Maximizing the spread of influence through a social network In Proceedings of the ninth ACM SIGKDD international conference on Knowledge discovery and data mining (pp 137-146) 17 Lucier, B., Oren, J., & Singer, Y (2015, August) Influence at scale: Distributed computation of complex contagion in networks In Proceedings of the 21th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (pp 735-744) 18 Dinh, T N., Shen, Y., & Thai, M T (2012, October) The walls have ears: optimize sharing for visibility and privacy in online social networks In Proceedings of the 21st ACM international conference on Information and knowledge management (pp 1452-1461) 19 Shen, Y., Syu, Y S., Nguyen, D T., & Thai, M T (2012, June) Maximizing circle of trust in online social networks In Proceedings of the 23rd ACM conference on Hypertext and social media (pp 155-164) 89 20 Wu, L., Morstatter, F., Hu, X., & Liu, H (2016) Mining misinformation in social media Big data in complex and social networks, 123-152 21 Budak, C., Agrawal, D., & El Abbadi, A (2011, March) Limiting the spread of misinformation in social networks In Proceedings of the 20th international conference on World wide web (pp 665-674) 22 Nguyen, D T., Nguyen, N P., & Thai, M T (2012, October) Sources of misinformation in online social networks: Who to suspect? In MILCOM 2012-2012 IEEE Military Communications Conference (pp 1-6) IEEE 23 Zhang, H., Zhang, H., Li, X., & Thai, M T (2015, August) Limiting the spread of misinformation while effectively raising awareness in social networks In International Conference on Computational Social Networks (pp 35-47) Springer, Cham 24 Saraswathi, S., Mukhopadhyay, A., Shah, H., & Ranganath, T S (2020) Social network analysis of COVID-19 transmission in Karnataka, India Epidemiology & Infection, 148 25 Feder, T., & Motwani, R (1995) Clique partitions, graph compression and speeding-up algorithms Journal of Computer and System Sciences, 51(2), 261-272 26 Adler, M., & Mitzenmacher, M (2001, March) Towards compressing web graphs In Proceedings DCC 2001 Data Compression Conference (pp 203-212) IEEE 27 Gilbert, A C., & Levchenko, K (2004, August) Compressing network graphs In Proceedings of the LinkKDD workshop at the 10th ACM Conference on KDD (Vol 124) 28 Nguyen Xuan Dung, Luận án rút gọn đồ thị mạng xã hội đề xuất thuật toán lan truyền nhãn đồ thị rút gọn để phát cấu trúc cộng đồng, 2019 29 Du, P H., Nguyen, H C., Nguyen, K K., & Nguyen, N H (2018, December) An efficient parallel algorithm for computing the closeness centrality in social networks In Proceedings of the Ninth International 90 Symposium on Information and Communication Technology (pp 456462) 30 Bernaschi, M., Carbone, G., & Vella, F (2015, November) Betweenness centrality on multi-GPU systems In Proceedings of the 5th Workshop on Irregular Applications: Architectures and Algorithms (pp 1-4) 31 Fan, R., Xu, K., & Zhao, J (2017) A GPU-based solution for fast calculation of the betweenness centrality in large weighted networks PeerJ Computer Science, 3, e140 32 McLaughlin, A., & Bader, D A (2018) Accelerating gpu betweenness centrality Communications of the ACM, 61(8), 85-92 33 Brandes, U (2001) A faster algorithm for betweenness centrality Journal of mathematical sociology, 25(2), 163-177 34 Mahmoody, A., Tsourakakis, C E., & Upfal, E (2016, August) Scalable betweenness centrality maximization via sampling In Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (pp 1765-1773) 35 Riondato, M., & Kornaropoulos, E M (2016) Fast approximation of betweenness centrality through sampling Data Mining and Knowledge Discovery, 30(2), 438-475 36 Wei, J., Chen, K., Zhou, Y., Zhou, Q., & He, J (2016, March) Benchmarking of distributed computing engines spark and graphlab for big data analytics In 2016 IEEE Second International Conference on Big Data Computing Service and Applications (BigDataService) (pp 1013) IEEE 37 Kwak, H., Lee, C., Park, H., & Moon, S (2010, April) What is Twitter, a social network or a news media? In Proceedings of the 19th international conference on World wide web (pp 591-600) 38 Haveliwala, T H (2002) Topic-sensitive pagerank In Proceedings of the 11th International Conference on World Wide Web (pp 517-526) 91 39 Weng, J., Lim, E P., Jiang, J., & He, Q (2010, February) Twitterrank: finding topic-sensitive influential twitterers In Proceedings of the third ACM international conference on Web search and data mining (pp 261270) 40 Myers, S A., Zhu, C., & Leskovec, J (2012, August) Information diffusion and external influence in networks In Proceedings of the 18th ACM SIGKDD international conference on Knowledge discovery and data mining (pp 33-41) 41 Wu, D., Li, C., & Lau, R Y (2015, October) Topic based information diffusion prediction model with external trends In 2015 IEEE 12th International Conference on e-Business Engineering (pp 29-36) IEEE 42 Szabo, G., & Huberman, B A (2010) Predicting the popularity of online content Communications of the ACM, 53(8), 80-88 43 Yang, J., & Leskovec, J (2010, December) Modeling information diffusion in implicit networks In 2010 IEEE International Conference on Data Mining (pp 599-608) IEEE 44 Ma, Z., Sun, A., & Cong, G (2013) On predicting the popularity of newly emerging hashtags in T witter Journal of the American Society for Information Science and Technology, 64(7), 1399-1410 45 Bakshy, E., Karrer, B., & Adamic, L A (2009, July) Social influence and the diffusion of user-created content In Proceedings of the 10th ACM conference on Electronic commerce (pp 325-334) 46 Jenders, M., Kasneci, G., & Naumann, F (2013, May) Analyzing and predicting viral tweets In Proceedings of the 22nd international conference on world wide web (pp 657-664) 47 Kupavskii, A., Ostroumova, L., Umnov, A., Usachev, S., Serdyukov, P., Gusev, G., & Kustarev, A (2012, October) Prediction of retweet cascade size over time In Proceedings of the 21st ACM international conference on Information and knowledge management (pp 2335-2338) 92 48 Zhang, L , Luo, M & Boncella, R J (2020) Product information diffusion in a social network, Electronic Commerce Research, 20(1), pp 3-19 49 Hinz, O., Skiera, B., Barrot, C & Becker, J U (2011) Seeding strategies for viral marketing: An empirical comparison, Journal of Marketing, 75(6), pp 55-71 50 Trudeau, R J (1994) Introduction to graph theory Dover Pubns 51 Wilson, R J (1979) Introduction to graph theory Pearson Education India 52 Sakr, S., & Pardede, E (2011) Graph data management: techniques and applications Information Science Reference-Imprint of: IGI Publishing 53 Buluỗ, A., Fineman, J T., Frigo, M., Gilbert, J R., & Leiserson, C E (2009, August) Parallel sparse matrix-vector and matrix-transposevector multiplication using compressed sparse blocks In Proceedings of the twenty-first annual symposium on Parallelism in algorithms and architectures (pp 233-244) 54 Sedgewick, R., & Flajolet, P (2013) An introduction to the analysis of algorithms Pearson Education India 55 Grama, A., Gupta, A., Karypis, G., & Kumar, V (2003) Principles of parallel algorithm design Introduction to Parallel Computing, 2nd ed Addison Wesley, Harlow 56 Asanovic, K., Bodik, R., Catanzaro, B C., Gebis, J J., Husbands, P., Keutzer, K., & Yelick, K A (2006) The landscape of parallel computing research: A view from berkeley, EECS Technical Report UCB/EECS-2006-183 57 Adve, S., Adve, V S., Agha, G., Frank, M I., Garzarán, M J., Hart, J C., & Zilles, C (2008) Parallel computing research at Illinois: The UPCRC agenda Urbana, IL: Univ Illinois Urbana-Champaign 93 58 Trobec, R., Slivnik, B., Bulic, P., & Robic, B (2018) Introduction to Parallel Computing: From Algorithms to Programming on State-of-Art Platforms Springer 59 Asanovic, K., Bodik, R., Demmel, J., Keaveny, T., Keutzer, K., Kubiatowicz, J., & Yelick, K (2009) A view of the parallel computing landscape Communications of the ACM, 52(10), 56-67 60 Al-hayanni, M A N., Xia, F., Rafiev, A., Romanovsky, A., Shafik, R., & Yakovlev, A (2020) Amdahl's law in the context of heterogeneous many-core systems–a survey IET Computers & Digital Techniques, 14(4), 133-148 61 Lim, S., Jung, I., Lee, S., & Jung, K (2015) Analysis of information diffusion for threshold models on arbitrary networks The European Physical Journal B, 88(8), 1-14 62 Kim, J., Lee, W., & Yu, H (2014) CT-IC: Continuously activated and time-restricted independent cascade model for viral marketing Knowledge-Based Systems, 62, 57-68 63 Chen, W., Castillo, C., & Lakshmanan, L V (2013) Information and Influence Propagation in Social Networks Morgan & Claypool Publishers 64 Li, Y., Fan, J., Wang, Y., & Tan, K L (2018) Influence maximization on social graphs: A survey IEEE Transactions on Knowledge and Data Engineering, 30(10), 1852-1872 65 Saito, K., Kimura, M., Ohara, K., & Motoda, H (2009, November) Learning continuous-time information diffusion model for social behavioral data analysis In Asian Conference on Machine Learning (pp 322-337) Springer, Berlin, Heidelberg 66 Saito, K., Ohara, K., Yamagishi, Y., Kimura, M., & Motoda, H (2011, June) Learning diffusion probability based on node attributes in social networks In International Symposium on Methodologies for Intelligent Systems (pp 153-162) Springer, Berlin, Heidelberg 94 67 Rodriguez, M G., Balduzzi, D., & Schölkopf, B (2011) Uncovering the temporal dynamics of diffusion networks In Proceedings of the 28th International Conference on Machine Learning, ICML '11 (pp 561-568) 68 Chen, W., Collins, A., Cummings, R., Ke, T., Liu, Z., Rincon, D., & Yuan, Y (2011, April) Influence maximization in social networks when negative opinions may emerge and propagate In Proceedings of the 2011 siam international conference on data mining (pp 379-390) Society for Industrial and Applied Mathematics 69 Barbieri, N., Bonchi, F., & Manco, G (2013) Topic-aware social influence propagation models In Proceedings of the 12th International Conference in Data Mining (pp 81-90) IEEE 70 Li, Y., Chen, W., Wang, Y., & Zhang, Z L (2013, February) Influence diffusion dynamics and influence maximization in social networks with friend and foe relationships In Proceedings of the sixth ACM international conference on Web search and data mining (pp 657-666) 71 Du, N., Liang, Y., Balcan, M F., Gomez-Rodriguez, M., Zha, H., & Song, L (2017) Scalable Influence Maximization for Multiple Products in Continuous-Time Diffusion Networks J Mach Learn Res., 18(2), 1-45 72 Du, N., Song, L., Gomez-Rodriguez, M., & Zha, H (2013) Scalable influence estimation in continuous-time diffusion networks Advances in neural information processing systems, 26, 3147-3155 73 Li, Y., Zhang, D., & Tan, K L (2015) Real-time Targeted Influence Maximization for Online Advertisements Proceedings of the VLDB Endowment, 8(10), 1070-1081 74 Kurka, D B., Godoy, A., & Von Zuben, F J (2015) Online social network analysis: A survey of research applications in computer science arXiv preprint arXiv:1504.05655 75 Wasserman, S., & Faust, K (1994) Social Network Analysis: Methods and Applications., Cambridge University Press 95 76 Farooq, A., Joyia, G J., Uzair, M., & Akram, U (2018, March) Detection of influential nodes using social networks analysis based on network metrics In 2018 International Conference on Computing, Mathematics and Engineering Technologies (iCoMET) (pp 1-6) IEEE 77 Kumar, P & Sinha, A (2021) Information diffusion modeling and analysis for socially interacting networks, Social Network Analysis and Mining 11(1), pp 1-18 78 Alhajj, R., & Rokne, J (2014) Encyclopedia of social network analysis and mining Springer 79 Freeman, L C (1977) A set of measures of centrality based on betweenness Sociometry, 35-41 80 Cormen, T H., Leiserson, C E., Rivest, R L., & Stein, C (2009) Introduction to Algorithms, 3rd-edition MIT Press and McGraw-Hill 81 Even, S (2011) Graph algorithms Cambridge University Press 82 Goodrich, M T., Tamassia, R., & Goldwasser, M H (2014) Data structures and algorithms in Java John Wiley & Sons 83 Dijkstra, E W (1959) A note on two problems in connexion with graphs Numerische mathematik, 1(1), 269-271 84 Kaya, M., Kawash, J., Khoury, S., & Day, M Y (Eds.) (2018) Social Network Based Big Data Analysis and Applications Springer 85 Holte, R C., Felner, A., Sharon, G., Sturtevant, N R., & Chen, J (2017) MM: A bidirectional search algorithm that is guaranteed to meet in the middle Artificial Intelligence, 252, 232-266 86 Tsvetovat, M., & Kouznetsov, A (2011) Social Network Analysis for Startups: Finding connections on the social web " O'Reilly Media, Inc." 87 Boldi, P., & Vigna, S (2014) Axioms for centrality Internet Mathematics, 10(3-4), 222-262 88 Kim, J., & Lee, J G (2015) Community detection in multi-layer graphs: A survey ACM SIGMOD Record, 44(3), 37-48 96 89 Leist, A., & Gilman, A (2014) A comparative analysis of parallel programming models for c++, In The 9th International MultiConference on Computing in the Global Information Technology (pp 121-127) 90 Rossetti, G., Mill, L., Rinzivillo, S., Sirbu, A., Pedreschi, D & Giannotti, F (2018) NDlib: a python library to model and analyze diffusion processes over complex networks, International Journal of Data Science and Analytics 5(1), pp 61-79 91 Frigo, M., Halpern, P., Leiserson, C E., & Lewin-Berlin, S (2009, August) Reducers and other Cilk++ hyperobjects In Proceedings of the twenty-first annual symposium on Parallelism in algorithms and architectures (pp 79-90) 92 Yakovleva, O V., Rudakov, I V., & Stroganov, Y V (2019, December) Predict post spreading in online social networks based on independent cascade model In Journal of Physics: Conference Series (Vol 1419, No 1, p 012017) IOP Publishing 93 Newman, M E (2002) Spread of epidemic disease on networks Physical review E, 66(1), 016128 94 Chen, W., Wang, C., & Wang, Y (2010, July) Scalable influence maximization for prevalent viral marketing in large-scale social networks In Proceedings of the 16th ACM SIGKDD international conference on Knowledge discovery and data mining (pp 1029-1038) 95 Borgs, C., Brautbar, M., Chayes, J., & Lucier, B (2014, January) Maximizing social influence in nearly optimal time In Proceedings of the twenty-fifth annual ACM-SIAM symposium on Discrete algorithms (pp 946-957) Society for Industrial and Applied Mathematics 96 Nguyen, H T., Thai, M T., & Dinh, T N (2016, June) Stop-and-stare: Optimal sampling algorithms for viral marketing in billion-scale networks In Proceedings of the 2016 International Conference on Management of Data (pp 695-710) 97 97 Tang, Y., Shi, Y., & Xiao, X (2015, May) Influence maximization in near-linear time: A martingale approach In Proceedings of the 2015 ACM SIGMOD International Conference on Management of Data (pp 1539-1554) 98 Tang, Y., Xiao, X., & Shi, Y (2014, June) Influence maximization: Near-optimal time complexity meets practical efficiency In Proceedings of the 2014 ACM SIGMOD international conference on Management of data (pp 75-86) 99 Leskovec, J., Chakrabarti, D., Kleinberg, J., Faloutsos, C., & Ghahramani, Z (2010) Kronecker Graphs: An Approach to Modeling Networks Journal of Machine Learning Research, 11, 985-1042 100 Bi, B., Tian, Y., Sismanis, Y., Balmin, A., & Cho, J (2014, February) Scalable topic-specific influence analysis on microblogs In Proceedings of the 7th ACM international conference on Web search and data mining (pp 513-522) 101 Du, N., Song, L., Woo, H., & Zha, H (2013, April) Uncover topicsensitive information diffusion networks In Artificial Intelligence and Statistics (pp 229-237) PMLR 102 Pramanik, S., Wang, Q., Danisch, M., Guillaume, J L., & Mitra, B (2017) Modeling cascade formation in Twitter amidst mentions and retweets Social Network Analysis and Mining, 7(1), 1-18 103 Gomez-Rodriguez, M., Leskovec, J., & Krause, A (2012) Inferring networks of diffusion and influence ACM Transactions on Knowledge Discovery from Data (TKDD), 5(4), 1-37 104 Bakshy, E., Hofman, J M., Mason, W A., & Watts, D J (2011, February) Everyone's an influencer: quantifying influence on twitter In Proceedings of the fourth ACM international conference on Web search and data mining (pp 65-74) 105 Matsubara, Y., Sakurai, Y., Prakash, B A., Li, L., & Faloutsos, C (2012, August) Rise and fall patterns of information diffusion: model and 98 implications In Proceedings of the 18th ACM SIGKDD international conference on Knowledge discovery and data mining (pp 6-14) 106 Hui, C., Tyshchuk, Y., Wallace, W A., Magdon-Ismail, M., & Goldberg, M (2012, April) Information cascades in social media in response to a crisis: a preliminary model and a case study In Proceedings of the 21st International Conference on World Wide Web (pp 653-656) 107 Zhang, J., Liu, B., Tang, J., Chen, T., & Li, J (2013, August) Social influence locality for modeling retweeting behaviors In IJCAI (Vol 13, pp 2761-2767) 108 Suh, B., Hong, L., Pirolli, P., & Chi, E H (2010, August) Want to be retweeted? large scale analytics on factors impacting retweet in twitter network In 2010 IEEE Second International Conference on Social Computing (pp 177-184) IEEE ... ….***………… DƯƠNG NGỌC SƠN MỘT SỐ PHƯƠNG PHÁP NÂNG CAO HIỆU QUẢ DỰ BÁO LAN TRUYỀN THÔNG TIN TRÊN MẠNG XÃ HỘI LUẬN ÁN TIẾN SĨ NGÀNH MÁY TÍNH Chuyên ngành : Hệ thống thông tin Mã số: 48 01 04 Người hướng... lan truyền thông tin Đề tài ? ?Một số phương pháp nâng cao hiệu dự báo lan truyền thông tin mạng xã hội? ?? được thực hiện khuôn khổ Luận án tiến sỹ chuyên ngành Hệ thống thông tin góp phần... tiếp theo 1.1 Mạng xã hội lan truyền thông tin mạng xã hội 1.1.1 Mạng xã hội Có nhiều khái niệm khác mạng xã hội: - Về cơ bản, mạng xã hội tập hợp tác nhân có yếu tố xã hội kết nối với