Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 107 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
107
Dung lượng
2,95 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ …… ….***………… DƯƠNG NGỌC SƠN MỘT SỐ PHƯƠNG PHÁP NÂNG CAO HIỆU QUẢ DỰ BÁO LAN TRUYỀN THÔNG TIN TRÊN MẠNG XÃ HỘI LUẬN ÁN TIẾN SĨ NGÀNH MÁY TÍNH Hà Nội - 2022 VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ …… ….***………… DƯƠNG NGỌC SƠN MỘT SỐ PHƯƠNG PHÁP NÂNG CAO HIỆU QUẢ DỰ BÁO LAN TRUYỀN THÔNG TIN TRÊN MẠNG XÃ HỘI LUẬN ÁN TIẾN SĨ NGÀNH MÁY TÍNH Chun ngành : Hệ thống thơng tin Mã số: 48 01 04 Người hướng dẫn khoa học: TS Nguyễn Như Sơn TS Nguyễn Ngọc Cương Hà Nội - 2022 i LỜI CAM ĐOAN Tơi cam đoan cơng trình nghiên cứu riêng tôi, các số liệu, tài liệu được sử dụng Luận án được thu thập từ nghiên cứu thực tế; đó, bao gồm một số kết quả nghiên cứu đã được đăng ở các tạp chí khoa học nước cũng như thử nghiệm thực tế “Hệ thống phân tích liệu mạng xã hội” mà có cơ hội tham gia thực hiện Các nội dung viết chung với các tác giả khác được sự đồng ý các đồng tác giả trước đưa vào Luận án Ngoài ra, tài liệu tham khảo được trích dẫn nguồn đầy đủ Trân trọng, Dương Ngọc Sơn ii LỜI CẢM ƠN Để có kết quả hôm nay, xin cảm ơn Học viện Khoa học công nghệ, Viện Hàn lâm Khoa học công nghệ Việt Nam đã tổ chức, đào tạo hướng dẫn tơi hồn thành thủ tục hồn thiện Luận án Tơi xin bày tỏ lịng biết ơn sâu sắc đến TS Nguyễn Ngọc Cương - Phó Cục trưởng Cục An ninh mạng phịng chớng tội phạm sử dụng công nghệ cao, Bộ Công an TS.Nguyễn Như Sơn Trưởng Phịng Các hệ thớng phần mềm tích hợp, Viện Công nghệ thông tin, Viện Hàn lâm Khoa học cơng nghệ Việt Nam đã tận tình hướng dẫn, bảo giúp đỡ suốt trình thực hiện Luận án Xin chân thành cảm ơn sự giúp đỡ PGS.TS.Nguyễn Long Giang, TS.Nguyễn Việt Anh - Viện Cơng nghệ thơng tin, PGS.TS.Nguyễn Ngọc Hóa Trường Đại học Quốc gia Hà Nội đã truyền đạt cho kiến thức quý báu làm tiền đề cho tơi từ q trình bắt đầu nghiên cứu đến xây dựng hồn thiện Luận án Tơi cũng xin cảm ơn lãnh đạo đơn vị cơng tác Phịng Kỹ thuật Viện Nghiên cứu KTNV, Cục Kỹ thuật nghiệp vụ, Bộ Công an đã tạo điều kiện cho để vừa làm việc, vừa học tập thực hiện nghiên cứu Trong trình làm việc đã cho có điều kiện tiếp xúc với hệ thống kỹ thuật, tham dự hội thảo liên quan đến nội dung trình bày Luận án Ći cùng, xin gửi lời cảm ơn sâu sắc chân thành đến Gia đình, người đã ln ở bên ủng hộ, động viên để có được ngày hôm Trong q trình thực hiện Luận án, tơi cũng nhận được sự giúp đỡ nhiều người mà không tiện liệt kê ở đây, xin cảm ơn kính chúc tất cả mọi người sức khỏe, hạnh phúc thành công Dương Ngọc Sơn iii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii MỤC LỤC iii DANH MỤC CÁC TỪ VIẾT TẮT v DANH MỤC CÁC BẢNG vi DANH MỤC CÁC HÌNH vii MỞ ĐẦU 1 Phát biểu vấn đề .1 Lý chọn đề tài .3 Mục tiêu luận án Các đóng góp luận án Bố cục Luận án Chương I TỔNG QUAN VỀ LAN TRUYỀN THÔNG TIN TRÊN MẠNG XÃ HỘI 1.1 Mạng xã hội lan truyền thông tin mạng xã hội 1.1.1 Mạng xã hội 1.1.2 Lan truyền thông tin mạng xã hội 1.2 Các lĩnh vực nghiên cứu phân tích mạng xã hội 1.2.1 Khai phá liệu mạng xã hội 1.2.2 Phân tích mơ hình liệu đồ thị 10 1.2.3 Phát hiện cộng đồng .10 1.2.4 Dự báo lan truyền thông tin 11 1.2.5 An tồn thơng tin 12 1.3 Phát biểu tốn phát triển một sớ phương pháp nâng cao hiệu quả dự báo lan truyền thông tin mạng xã hội 13 1.4 Các hướng nghiên cứu liên quan 16 1.4.1 Nâng cao tốc độ dự báo lan truyền thông tin .16 1.4.2 Nâng cao độ xác dự báo lan truyền thông tin 18 1.5 Phương pháp đề xuất 20 1.6 Một số định nghĩa cơ bản 21 1.6.1 Đồ thị 21 1.6.2 Tính tốn song song .26 1.6.3 Mơ hình lan truyền thông tin 27 1.7 Kết luận Chương I 28 iv Chương II NÂNG CAO TỐC ĐỘ DỰ BÁO LAN TRUYỀN THÔNG TIN 30 2.1 Đặt vấn đề 30 2.2 Một số khái niệm liên quan .33 2.2.1 Các phép toán đồ thị .33 2.2.2 Độ trung tâm 37 2.2.3 Tính tốn song song .39 2.3 Nâng cao tốc độ dự báo lan truyền thông tin 43 2.3.1 Rút gọn đồ thị .43 2.3.2 Song song hóa quá trình tính toán độ trung tâm trung gian 47 2.3.3 Phương pháp kết hợp hai kỹ thuật .50 2.4 Thực nghiệm kết quả 53 2.4.1 Dữ liệu thực nghiệm 53 2.4.2 Cài đặt thực nghiệm .53 2.4.3 Kết quả thực nghiệm 54 2.5 Kết luận Chương II .58 Chương III NÂNG CAO ĐỘ CHÍNH XÁC DỰ BÁO LAN TRUYỀN THÔNG TIN 59 3.1 Đặt vấn đề 59 3.2 Một số khái niệm liên quan .61 3.2.1 Mô hình lan truyền thơng tin rời rạc 61 3.2.2 Mơ hình Ngưỡng tún tính (LT) 62 3.2.3 Mơ hình bậc độc lập (IC) .64 3.2.4 Mô hình cạnh trực tuyến (live-edge) 65 3.3 Nâng cao độ xác dự báo lan truyền thông tin 68 3.3.1 Ảnh hưởng quan hệ người dùng 69 3.3.2 Ảnh hưởng sở thích người dùng 71 3.3.3 Đo lường ảnh hưởng bên 73 3.3.4 Xây dựng lan truyền 74 3.4 Thực nghiệm kết quả 76 3.4.1 Dữ liệu thực nghiệm 76 3.4.2 Phương pháp thực nghiệm 77 3.4.3 Kết quả thực nghiệm 78 3.5 Kết luận chương III .81 KẾT LUẬN CHUNG 83 DANH MỤC CÁC CƠNG TRÌNH ĐÃ CÔNG BỐ 86 TÀI LIỆU THAM KHẢO 87 v DANH MỤC CÁC TỪ VIẾT TẮT STT Từ viết Viết đầy đủ tắt Dịch nghĩa Đường ngắn cặp đỉnh APSP All-Pairs Shortest Path bBFS bi-directional BFS Duyệt theo chiều rộng cả chiều BC Betweenness Centrality Độ trung tâm trung gian BFS Breadth-First Search Duyệt theo chiều rộng trước CC Closeness Centrality Độ trung tâm gần CPU Central Processing Unit Bộ xử lý trung tâm DC Degree Centrality Độ trung tâm bậc DFS Depth-First Search Duyệt theo chiều sâu trước DS Dataset Bộ liệu 10 EC Eigenvector Centrality Độ trung tâm vector riêng 11 GPU 12 IC Independent Cascade Bậc độc lập 13 LT Linear Threshold Ngưỡng tuyến tính 14 RM Regression Model Mơ hình hời quy 15 SDSP Single-Destination Đường ngắn đến đỉnh Shortest Path đích 16 SSSP 17 UI Graphic Processing Unit Bộ xử lý đồ họa Single-Source Shortest Đường ngắn từ đỉnh Path nguồn User Interaction Tương tác người dùng vi DANH MỤC CÁC BẢNG Bảng 2.1 So sánh thời gian lan truyền (s) 47 Bảng 2.2 Kết tính BC CC trước rút gọn .51 Bảng 2.3 Kết tính BC CC sau rút gọn 52 Bảng 2.4 Thông tin liệu thử nghiệm 53 Bảng 2.5 So sánh thời gian tính toán BC trước sau rút gọn .55 Bảng 2.6 Thời gian tính tốn BC giải thuật Red-Bet số luồng thay đổi (giây) 55 Bảng 2.7 Hệ số tăng tốc giải thuật Red-Bet số luồng thay đổi 56 Bảng 2.8 Thời gian tính tốn BC với liệu ba giải pháp (giây) 57 Bảng 2.9 Hệ số tăng tốc Red-Bet so với TeexGraph NetworKit tính tốn BC 58 Bảng 3.1 Ví dụ nhật ký hoạt động 69 Bảng 3.2 So sánh hiệu suất phương pháp chưa xét ảnh hưởng bên .79 Bảng 3.3 So sánh hiệu suất phương pháp xuất ảnh hưởng bên 80 vii DANH MỤC CÁC HÌNH Hình Thống kê số liệu người dùng năm 2020 .1 Hình Ứng dụng phân tích thơng tin mạng xã hội Hình 1.1 Lan truyền thơng tin Hình 1.2 Bài tốn phát cấu trúc cộng đồng học viên trường đại học 11 Hình 1.3 Cấu trúc đồ thị .21 Hình 1.4 Một số kiểu đồ thị 22 Hình 2.1 Ví dụ duyệt theo chiều rộng trước 34 Hình 2.2 Ví dụ duyệt theo chiều sâu trước 35 Hình 2.3 Mơ hình xử lý song song CilkPlus .43 Hình 2.4 Đồ thị ngẫu nhiên 500 đỉnh 46 Hình 2.5 Đồ thị ngẫu nhiên 400 đỉnh 46 Hình 2.6 Sơ đồ khối trình tính tốn Độ trung tâm trung gian theo giải thuật kết hợp 49 Hình 2.7 Đồ thị trước rút gọn .51 Hình 2.8 Đồ thị sau rút gọn 52 Hình 2.9 Đồ thị hóa thời gian tính toán BC giải thuật Red-Bet số luồng thay đổi 56 Hình 2.10 Biểu diễn thời gian tính toán BC với liệu ba giải pháp 57 Hình 3.1 Ví dụ cho mơ hình LT 63 Hình 3.2 Ví dụ cho mơ hình IC .64 Hình 3.3 Hình dạng hàm logistic 74 Hình 3.4 Sơ đồ khối trình xây dựng lan truyền .75 Hình 3.5 Hình dạng lan truyền 76 Hình 3.6 Biểu diễn chi tiết hiệu suất phương pháp chưa xét ảnh hưởng bên 80 Hình 3.7 Biểu diễn chi tiết hiệu suất phương pháp xuất ảnh hưởng bên .81 MỞ ĐẦU Phát biểu vấn đề Trong thời đại công nghệ thông tin phát triển hiện nay, việc sử dụng Internet trở nên phổ cập Thống kê Hootsuite We Are Social cho thấy, tính đến tháng 1/2020, tổng lượng người dùng Internet toàn thế giới đạt 4,54 tỷ1 Số lượng người dùng Internet ngày tăng nhanh, cụ thể, so với tháng 1/2019, số người dùng mới đã tăng thêm 298 triệu người dùng Ngày có nhiều người sử dụng Internet đờng nghĩa với việc gia tăng nhu cầu sử dụng mạng xã hội Các số thống kê cho thấy lượng người dùng mạng xã hội nói chung tồn thế giới đã chạm ngưỡng xấp xỉ 3,8 tỷ chiếm 49% dân sớ Hình Thống kê số liệu người dùng năm 2020 Con người dành nhiều thời gian ngày cho việc sử dụng Internet nói chung mạng xã hội nói riêng Cũng theo thống kê đối với người độ tuổi từ 16 đến 64 tuổi, trung bình một ngày, người sử dụng 6h43p cho việc truy cập Internet thời gian đó 2h24p để sử dụng tiện ích liên quan đến mạng xã hội https://wearesocial.com/blog/2020/01/digital-2020-3-8-billion-people-use-social-media 84 Việc duyệt đồ thị sử dụng phương pháp BFS được lồng ghép vào pha duyệt đồ thị Thuật toán Brandes Cuối cùng, chọn một đỉnh làm đại diện, hay tức xóa các đỉnh tương đương để lại một đỉnh Đới với kỹ thuật song song hóa, đó việc thi hành song song phép tính Độ trung tâm trung gian các đỉnh khác để khai thác được hiệu năng CPU đa lõi Sử dụng bộ thư viện Cilkplus với trọng tâm vector reducerBC[v] bộ thư viện Cilkplus để cập nhật tương tranh giá trị BC đỉnh v thi hành song song Ngồi ra, đới với liệu được biểu diễn theo phương pháp danh sách liền kề lưu trữ dưới dạng mảng Đới với tốn tính xác suất chấp nhận thông tin người dùng (hay xác suất lan truyền), đó việc xác định ảnh hưởng từ mối quan hệ người dùng (được xác định dựa lịch sử hoạt động) có xét đến lan truyền sơ cấp thứ cấp; ảnh hưởng từ sở thích, quan tâm người dùng đới với nội dung; ảnh hưởng từ bên đến quyết định người dùng Cuối xây dựng lan truyền “có khả năng nhất” cho một nội dung cụ thể dựa xác suất đã tính với xác suất tạo 𝑃(𝑇) = ∏(𝑢,𝑣)∈𝐸(𝑇) 𝑝𝑢𝑣 Tiến hành thực nghiệm cho thấy, phương pháp nâng cao tớc độ tính toán dự báo lan truyền Luận án đã mang lại hiệu quả hơn so với bộ công cụ TeexGraph từ 1,2 đến 1,41 lần so với bộ công cụ NetworKit từ 1,76 đến 2,55 lần thực nghiệm với một số bộ liệu được công bố bởi SNAP Phương pháp nâng cao độ chính xác dự báo lan truyền thông tin Luận án mang lại hiệu quả hơn, sai số thấp hơn hay độ chính xác cao hơn ba mơ hình phổ biến hiện mơ hình bậc độc lập IC, mơ hình tương tác người dùng UI, mơ hình hời quy RM việc dự đoán kích thước lan truyền tạo có khả năng đối với ba bộ liệu mô phỏng, Meme, Tencent Weibo Đặc biệt hiệu quả hơn xét đến ảnh hưởng từ bên Tồn bộ các cơng trình nghiên cứu Luận án được công bố chờ công bố xuất bản các kỷ yếu hội thảo, tạp chí có mục SCOPUS Hạn chế luận án Do hạn chế cả thời gian, nguồn lực lẫn sự giới hạn không 85 gian nghiên cứu, nghiên cứu Luận án cũng nhiều điểm chưa thể giải quyết chưa được đề cập đến Một số điểm hạn chế có thể được liệt kê dưới đây: - Nghiên cứu tăng tốc độ đờ thị Luận án cịn chưa thể tiến hành với đồ thị mạng xã hội có quy mô siêu lớn như Facebook với hơn hai tỷ đỉnh hơn nghìn tỷ cạnh Nguyên nhân xuất phát từ giới hạn các bộ liệu thực được công bớ cơng khai cịn hạn chế với liệu quy mô lớn năng lực hệ thống tính toán mà Nghiên cứu sinh có thể sử dụng cũng cho phép xử lý được với liệu quy mơ siêu lớn như vậy Ngồi ra, việc rút gọn tối ưu phạm vi Luận án - Nghiên cứu dự báo lan truyền thông tin ước tính ảnh hưởng bên một bước thời gian giả định ảnh hưởng vẫn có tác động giữ nguyên cho bước thời gian tiếp theo Do đó, nó chưa thể được sử dụng để dự đoán sớm với liệu lan truyền cập nhật liên tục phân tích liệu lớn Hướng phát triển tương lai Toàn bộ hạn chế đã nêu được Nghiên cứu sinh xác định nghiên cứu được trọng tiến hành thời gian tới, cụ thể: - Với vấn đề nâng cao tớc độ dự báo lan truyền thơng tin, tập trung mở rộng phương pháp để nâng cao tốc độ tính tốn phép đo khác phân tích đồ thị mạng xã hội như độ trung tâm gần, độ trung tâm eigenvector, độ trung tâm Pagerank , đờng thời tiến hành phân tích đờ thị phức tạp hơn ứng dụng vào toán phát hiện điểm nóng, phát hiện cộng đờng, hay tốn dự báo lan truyền thông tin, - Với vấn đề nâng cao hiệu quả dự báo lan truyền, tiếp tục nghiên cứu sâu hơn các khía cạnh ảnh hưởng bên ngồi có thể tác động đến quá trình lan truyền Tức kiểm tra ảnh hưởng bên làm thay đổi cấu trúc lan truyền sử dụng sự thay đổi cấu trúc để dự đoán hình dạng kích thước lan truyền - Chứng minh kết quả thực nghiệm Luận án có thể ứng dụng vào hệ thống phân tích thông tin mạng xã hội nghiên cứu phương án áp dụng kết quả nghiên cứu để nâng cao hiệu năng hệ thống 86 DANH MỤC CÁC CƠNG TRÌNH ĐÃ CƠNG BỐ C1 Duong Ngoc Son, Nguyen Ngoc Cuong, Nguyen Nhu Son (2019), Một phương pháp rút gọn đồ thị mạng xã hội dựa thay lớp đỉnh tương đương, The 22nd National Symposium of Selected ICT Problems, pp: 27 C2 Duong Ngoc Son, Nguyen Ngoc Cuong, Nguyen Nhu Son, Nguyen Ngoc Hoa (2020), Một phương pháp nâng cao hiệu tính tốn đồ thị, The 23rd National Symposium of Selected ICT Problems, pp: 60 C3 Du Phuong Hanh, Duong Ngoc Son, Nguyen Ngoc Cuong, Nguyen Ngoc Hoa (2020), A Fast Computation of Betweenness Centrality in Large-Scale Unweighted Graphs, International Journal on Emerging Technologies 11(2): 370377 C4 Duong Ngoc Son, Nguyen Ngoc Cuong, Nguyen Ngoc Hoa, Du Phuong Hanh (2021), A RED-BET Method to Improve the Information Diffusion on Social Networks, International Journal of Advanced Computer Science and Applications, 12(8): 867-875 C5 Nguyen Viet Anh, Duong Ngoc Son, Nguyen Thi Thu Ha, Sergey Kuznetsov, Nguyen Tran Quoc Vinh (2018), A Method for determining information diffusion cascades on social networks, Eastern-European Journal of Enterprise Technologies, Vol 6, No (96), pp: 61-69 87 TÀI LIỆU THAM KHẢO Kim, J., Leem, C., Kim, B., & Cheon, Y (2013) Evolution of online social networks: A conceptual framework Asian Social Science, 9(4), 208-220 Sajithra, K., & Patil, R (2013) Social media–history and components Journal of Business and Management, 7(1), 69-74 Howard, P N., Duffy, A., Freelon, D., Hussain, M M., Mari, W., & Maziad, M (2011) Opening closed regimes: what was the role of social media during the Arab Spring? Information Technology and Political Islam, 1-30 Hughes, A L., & Palen, L (2009) Twitter adoption and use in mass convergence and emergency events International journal of emergency management, 6(3-4), 248-260 Rogers, E M (1962) (1995) Diffusion of innovations New York: Free Press Kaya, M., & Alhajj, R (Eds.) (2019) Influence and Behavior Analysis in Social Networks and Social Media Springer Li, N., & Wu, D D (2010) Using text mining and sentiment analysis for online forums hotspot detection and forecast Decision support systems, 48(2), 354-368 Duggirala, S (2018) NewSQL databases and scalable in-memory analytics In Advances in Computers (Vol 109, pp 49-76) Elsevier Mondal, J., & Deshpande, A (2012) Managing large dynamic graphs efficiently In Proceedings of the 2012 ACM SIGMOD International Conference on Management of Data (pp 145-156) 10 Fortunato, S (2010) Community detection in graphs Physics reports, 486(3-5), 75-174 11 Newman, M E (2006) Modularity and community structure in networks Proceedings of the national academy of sciences, 103(23), 8577-8582 88 12 Guimerà, R., & Sales-Pardo, M (2009) Missing and spurious interactions and the reconstruction of complex networks Proceedings of the National Academy of Sciences, 106(52), 22073-22078 13 Domingos, P., & Richardson, M (2001, August) Mining the network value of customers In Proceedings of the seventh ACM SIGKDD international conference on Knowledge discovery and data mining (pp 57-66) 14 Yang, W., Brenner, L., & Giua, A (2018, April) Computation of activation probabilities in the independent cascade model In 2018 5th International Conference on Control, Decision and Information Technologies (CoDIT) (pp 791-797) IEEE 15 Cohen, E., Delling, D., Pajor, T., & Werneck, R F (2014, November) Sketch-based influence maximization and computation: Scaling up with guarantees In Proceedings of the 23rd ACM International Conference on Conference on Information and Knowledge Management (pp 629-638) 16 Kempe, D., Kleinberg, J., & Tardos, É (2003, August) Maximizing the spread of influence through a social network In Proceedings of the ninth ACM SIGKDD international conference on Knowledge discovery and data mining (pp 137-146) 17 Lucier, B., Oren, J., & Singer, Y (2015, August) Influence at scale: Distributed computation of complex contagion in networks In Proceedings of the 21th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (pp 735-744) 18 Dinh, T N., Shen, Y., & Thai, M T (2012, October) The walls have ears: optimize sharing for visibility and privacy in online social networks In Proceedings of the 21st ACM international conference on Information and knowledge management (pp 1452-1461) 19 Shen, Y., Syu, Y S., Nguyen, D T., & Thai, M T (2012, June) Maximizing circle of trust in online social networks In Proceedings of the 23rd ACM conference on Hypertext and social media (pp 155-164) 89 20 Wu, L., Morstatter, F., Hu, X., & Liu, H (2016) Mining misinformation in social media Big data in complex and social networks, 123-152 21 Budak, C., Agrawal, D., & El Abbadi, A (2011, March) Limiting the spread of misinformation in social networks In Proceedings of the 20th international conference on World wide web (pp 665-674) 22 Nguyen, D T., Nguyen, N P., & Thai, M T (2012, October) Sources of misinformation in online social networks: Who to suspect? In MILCOM 2012-2012 IEEE Military Communications Conference (pp 1-6) IEEE 23 Zhang, H., Zhang, H., Li, X., & Thai, M T (2015, August) Limiting the spread of misinformation while effectively raising awareness in social networks In International Conference on Computational Social Networks (pp 35-47) Springer, Cham 24 Saraswathi, S., Mukhopadhyay, A., Shah, H., & Ranganath, T S (2020) Social network analysis of COVID-19 transmission in Karnataka, India Epidemiology & Infection, 148 25 Feder, T., & Motwani, R (1995) Clique partitions, graph compression and speeding-up algorithms Journal of Computer and System Sciences, 51(2), 261-272 26 Adler, M., & Mitzenmacher, M (2001, March) Towards compressing web graphs In Proceedings DCC 2001 Data Compression Conference (pp 203-212) IEEE 27 Gilbert, A C., & Levchenko, K (2004, August) Compressing network graphs In Proceedings of the LinkKDD workshop at the 10th ACM Conference on KDD (Vol 124) 28 Nguyen Xuan Dung, Luận án rút gọn đồ thị mạng xã hội đề xuất thuật toán lan truyền nhãn đồ thị rút gọn để phát cấu trúc cộng đồng, 2019 29 Du, P H., Nguyen, H C., Nguyen, K K., & Nguyen, N H (2018, December) An efficient parallel algorithm for computing the closeness centrality in social networks In Proceedings of the Ninth International 90 Symposium on Information and Communication Technology (pp 456462) 30 Bernaschi, M., Carbone, G., & Vella, F (2015, November) Betweenness centrality on multi-GPU systems In Proceedings of the 5th Workshop on Irregular Applications: Architectures and Algorithms (pp 1-4) 31 Fan, R., Xu, K., & Zhao, J (2017) A GPU-based solution for fast calculation of the betweenness centrality in large weighted networks PeerJ Computer Science, 3, e140 32 McLaughlin, A., & Bader, D A (2018) Accelerating gpu betweenness centrality Communications of the ACM, 61(8), 85-92 33 Brandes, U (2001) A faster algorithm for betweenness centrality Journal of mathematical sociology, 25(2), 163-177 34 Mahmoody, A., Tsourakakis, C E., & Upfal, E (2016, August) Scalable betweenness centrality maximization via sampling In Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (pp 1765-1773) 35 Riondato, M., & Kornaropoulos, E M (2016) Fast approximation of betweenness centrality through sampling Data Mining and Knowledge Discovery, 30(2), 438-475 36 Wei, J., Chen, K., Zhou, Y., Zhou, Q., & He, J (2016, March) Benchmarking of distributed computing engines spark and graphlab for big data analytics In 2016 IEEE Second International Conference on Big Data Computing Service and Applications (BigDataService) (pp 10-13) IEEE 37 Kwak, H., Lee, C., Park, H., & Moon, S (2010, April) What is Twitter, a social network or a news media? In Proceedings of the 19th international conference on World wide web (pp 591-600) 38 Haveliwala, T H (2002) Topic-sensitive pagerank In Proceedings of the 11th International Conference on World Wide Web (pp 517-526) 91 39 Weng, J., Lim, E P., Jiang, J., & He, Q (2010, February) Twitterrank: finding topic-sensitive influential twitterers In Proceedings of the third ACM international conference on Web search and data mining (pp 261270) 40 Myers, S A., Zhu, C., & Leskovec, J (2012, August) Information diffusion and external influence in networks In Proceedings of the 18th ACM SIGKDD international conference on Knowledge discovery and data mining (pp 33-41) 41 Wu, D., Li, C., & Lau, R Y (2015, October) Topic based information diffusion prediction model with external trends In 2015 IEEE 12th International Conference on e-Business Engineering (pp 29-36) IEEE 42 Szabo, G., & Huberman, B A (2010) Predicting the popularity of online content Communications of the ACM, 53(8), 80-88 43 Yang, J., & Leskovec, J (2010, December) Modeling information diffusion in implicit networks In 2010 IEEE International Conference on Data Mining (pp 599-608) IEEE 44 Ma, Z., Sun, A., & Cong, G (2013) On predicting the popularity of newly emerging hashtags in T witter Journal of the American Society for Information Science and Technology, 64(7), 1399-1410 45 Bakshy, E., Karrer, B., & Adamic, L A (2009, July) Social influence and the diffusion of user-created content In Proceedings of the 10th ACM conference on Electronic commerce (pp 325-334) 46 Jenders, M., Kasneci, G., & Naumann, F (2013, May) Analyzing and predicting viral tweets In Proceedings of the 22nd international conference on world wide web (pp 657-664) 47 Kupavskii, A., Ostroumova, L., Umnov, A., Usachev, S., Serdyukov, P., Gusev, G., & Kustarev, A (2012, October) Prediction of retweet cascade size over time In Proceedings of the 21st ACM international conference on Information and knowledge management (pp 2335-2338) 92 48 Zhang, L , Luo, M & Boncella, R J (2020) Product information diffusion in a social network, Electronic Commerce Research, 20(1), pp 3-19 49 Hinz, O., Skiera, B., Barrot, C & Becker, J U (2011) Seeding strategies for viral marketing: An empirical comparison, Journal of Marketing, 75(6), pp 55-71 50 Trudeau, R J (1994) Introduction to graph theory Dover Pubns 51 Wilson, R J (1979) Introduction to graph theory Pearson Education India 52 Sakr, S., & Pardede, E (2011) Graph data management: techniques and applications Information Science Reference-Imprint of: IGI Publishing 53 Buluỗ, A., Fineman, J T., Frigo, M., Gilbert, J R., & Leiserson, C E (2009, August) Parallel sparse matrix-vector and matrix-transpose-vector multiplication using compressed sparse blocks In Proceedings of the twenty-first annual symposium on Parallelism in algorithms and architectures (pp 233-244) 54 Sedgewick, R., & Flajolet, P (2013) An introduction to the analysis of algorithms Pearson Education India 55 Grama, A., Gupta, A., Karypis, G., & Kumar, V (2003) Principles of parallel algorithm design Introduction to Parallel Computing, 2nd ed Addison Wesley, Harlow 56 Asanovic, K., Bodik, R., Catanzaro, B C., Gebis, J J., Husbands, P., Keutzer, K., & Yelick, K A (2006) The landscape of parallel computing research: A view from berkeley, EECS Technical Report UCB/EECS-2006-183 57 Adve, S., Adve, V S., Agha, G., Frank, M I., Garzarán, M J., Hart, J C., & Zilles, C (2008) Parallel computing research at Illinois: The UPCRC agenda Urbana, IL: Univ Illinois Urbana-Champaign 93 58 Trobec, R., Slivnik, B., Bulic, P., & Robic, B (2018) Introduction to Parallel Computing: From Algorithms to Programming on State-of-Art Platforms Springer 59 Asanovic, K., Bodik, R., Demmel, J., Keaveny, T., Keutzer, K., Kubiatowicz, J., & Yelick, K (2009) A view of the parallel computing landscape Communications of the ACM, 52(10), 56-67 60 Al-hayanni, M A N., Xia, F., Rafiev, A., Romanovsky, A., Shafik, R., & Yakovlev, A (2020) Amdahl's law in the context of heterogeneous manycore systems–a survey IET Computers & Digital Techniques, 14(4), 133148 61 Lim, S., Jung, I., Lee, S., & Jung, K (2015) Analysis of information diffusion for threshold models on arbitrary networks The European Physical Journal B, 88(8), 1-14 62 Kim, J., Lee, W., & Yu, H (2014) CT-IC: Continuously activated and time-restricted independent cascade model for viral marketing Knowledge-Based Systems, 62, 57-68 63 Chen, W., Castillo, C., & Lakshmanan, L V (2013) Information and Influence Propagation in Social Networks Morgan & Claypool Publishers 64 Li, Y., Fan, J., Wang, Y., & Tan, K L (2018) Influence maximization on social graphs: A survey IEEE Transactions on Knowledge and Data Engineering, 30(10), 1852-1872 65 Saito, K., Kimura, M., Ohara, K., & Motoda, H (2009, November) Learning continuous-time information diffusion model for social behavioral data analysis In Asian Conference on Machine Learning (pp 322-337) Springer, Berlin, Heidelberg 66 Saito, K., Ohara, K., Yamagishi, Y., Kimura, M., & Motoda, H (2011, June) Learning diffusion probability based on node attributes in social networks In International Symposium on Methodologies for Intelligent Systems (pp 153-162) Springer, Berlin, Heidelberg 94 67 Rodriguez, M G., Balduzzi, D., & Schölkopf, B (2011) Uncovering the temporal dynamics of diffusion networks In Proceedings of the 28th International Conference on Machine Learning, ICML '11 (pp 561-568) 68 Chen, W., Collins, A., Cummings, R., Ke, T., Liu, Z., Rincon, D., & Yuan, Y (2011, April) Influence maximization in social networks when negative opinions may emerge and propagate In Proceedings of the 2011 siam international conference on data mining (pp 379-390) Society for Industrial and Applied Mathematics 69 Barbieri, N., Bonchi, F., & Manco, G (2013) Topic-aware social influence propagation models In Proceedings of the 12th International Conference in Data Mining (pp 81-90) IEEE 70 Li, Y., Chen, W., Wang, Y., & Zhang, Z L (2013, February) Influence diffusion dynamics and influence maximization in social networks with friend and foe relationships In Proceedings of the sixth ACM international conference on Web search and data mining (pp 657-666) 71 Du, N., Liang, Y., Balcan, M F., Gomez-Rodriguez, M., Zha, H., & Song, L (2017) Scalable Influence Maximization for Multiple Products in Continuous-Time Diffusion Networks J Mach Learn Res., 18(2), 1-45 72 Du, N., Song, L., Gomez-Rodriguez, M., & Zha, H (2013) Scalable influence estimation in continuous-time diffusion networks Advances in neural information processing systems, 26, 3147-3155 73 Li, Y., Zhang, D., & Tan, K L (2015) Real-time Targeted Influence Maximization for Online Advertisements Proceedings of the VLDB Endowment, 8(10), 1070-1081 74 Kurka, D B., Godoy, A., & Von Zuben, F J (2015) Online social network analysis: A survey of research applications in computer science arXiv preprint arXiv:1504.05655 75 Wasserman, S., & Faust, K (1994) Social Network Analysis: Methods and Applications., Cambridge University Press 95 76 Farooq, A., Joyia, G J., Uzair, M., & Akram, U (2018, March) Detection of influential nodes using social networks analysis based on network metrics In 2018 International Conference on Computing, Mathematics and Engineering Technologies (iCoMET) (pp 1-6) IEEE 77 Kumar, P & Sinha, A (2021) Information diffusion modeling and analysis for socially interacting networks, Social Network Analysis and Mining 11(1), pp 1-18 78 Alhajj, R., & Rokne, J (2014) Encyclopedia of social network analysis and mining Springer 79 Freeman, L C (1977) A set of measures of centrality based on betweenness Sociometry, 35-41 80 Cormen, T H., Leiserson, C E., Rivest, R L., & Stein, C (2009) Introduction to Algorithms, 3rd-edition MIT Press and McGraw-Hill 81 Even, S (2011) Graph algorithms Cambridge University Press 82 Goodrich, M T., Tamassia, R., & Goldwasser, M H (2014) Data structures and algorithms in Java John Wiley & Sons 83 Dijkstra, E W (1959) A note on two problems in connexion with graphs Numerische mathematik, 1(1), 269-271 84 Kaya, M., Kawash, J., Khoury, S., & Day, M Y (Eds.) (2018) Social Network Based Big Data Analysis and Applications Springer 85 Holte, R C., Felner, A., Sharon, G., Sturtevant, N R., & Chen, J (2017) MM: A bidirectional search algorithm that is guaranteed to meet in the middle Artificial Intelligence, 252, 232-266 86 Tsvetovat, M., & Kouznetsov, A (2011) Social Network Analysis for Startups: Finding connections on the social web " O'Reilly Media, Inc." 87 Boldi, P., & Vigna, S (2014) Axioms for centrality Internet Mathematics, 10(3-4), 222-262 88 Kim, J., & Lee, J G (2015) Community detection in multi-layer graphs: A survey ACM SIGMOD Record, 44(3), 37-48 96 89 Leist, A., & Gilman, A (2014) A comparative analysis of parallel programming models for c++, In The 9th International Multi-Conference on Computing in the Global Information Technology (pp 121-127) 90 Rossetti, G., Mill, L., Rinzivillo, S., Sirbu, A., Pedreschi, D & Giannotti, F (2018) NDlib: a python library to model and analyze diffusion processes over complex networks, International Journal of Data Science and Analytics 5(1), pp 61-79 91 Frigo, M., Halpern, P., Leiserson, C E., & Lewin-Berlin, S (2009, August) Reducers and other Cilk++ hyperobjects In Proceedings of the twenty-first annual symposium on Parallelism in algorithms and architectures (pp 79-90) 92 Yakovleva, O V., Rudakov, I V., & Stroganov, Y V (2019, December) Predict post spreading in online social networks based on independent cascade model In Journal of Physics: Conference Series (Vol 1419, No 1, p 012017) IOP Publishing 93 Newman, M E (2002) Spread of epidemic disease on networks Physical review E, 66(1), 016128 94 Chen, W., Wang, C., & Wang, Y (2010, July) Scalable influence maximization for prevalent viral marketing in large-scale social networks In Proceedings of the 16th ACM SIGKDD international conference on Knowledge discovery and data mining (pp 1029-1038) 95 Borgs, C., Brautbar, M., Chayes, J., & Lucier, B (2014, January) Maximizing social influence in nearly optimal time In Proceedings of the twenty-fifth annual ACM-SIAM symposium on Discrete algorithms (pp 946-957) Society for Industrial and Applied Mathematics 96 Nguyen, H T., Thai, M T., & Dinh, T N (2016, June) Stop-and-stare: Optimal sampling algorithms for viral marketing in billion-scale networks In Proceedings of the 2016 International Conference on Management of Data (pp 695-710) 97 97 Tang, Y., Shi, Y., & Xiao, X (2015, May) Influence maximization in near-linear time: A martingale approach In Proceedings of the 2015 ACM SIGMOD International Conference on Management of Data (pp 15391554) 98 Tang, Y., Xiao, X., & Shi, Y (2014, June) Influence maximization: Nearoptimal time complexity meets practical efficiency In Proceedings of the 2014 ACM SIGMOD international conference on Management of data (pp 75-86) 99 Leskovec, J., Chakrabarti, D., Kleinberg, J., Faloutsos, C., & Ghahramani, Z (2010) Kronecker Graphs: An Approach to Modeling Networks Journal of Machine Learning Research, 11, 985-1042 100 Bi, B., Tian, Y., Sismanis, Y., Balmin, A., & Cho, J (2014, February) Scalable topic-specific influence analysis on microblogs In Proceedings of the 7th ACM international conference on Web search and data mining (pp 513-522) 101 Du, N., Song, L., Woo, H., & Zha, H (2013, April) Uncover topicsensitive information diffusion networks In Artificial Intelligence and Statistics (pp 229-237) PMLR 102 Pramanik, S., Wang, Q., Danisch, M., Guillaume, J L., & Mitra, B (2017) Modeling cascade formation in Twitter amidst mentions and retweets Social Network Analysis and Mining, 7(1), 1-18 103 Gomez-Rodriguez, M., Leskovec, J., & Krause, A (2012) Inferring networks of diffusion and influence ACM Transactions on Knowledge Discovery from Data (TKDD), 5(4), 1-37 104 Bakshy, E., Hofman, J M., Mason, W A., & Watts, D J (2011, February) Everyone's an influencer: quantifying influence on twitter In Proceedings of the fourth ACM international conference on Web search and data mining (pp 65-74) 105 Matsubara, Y., Sakurai, Y., Prakash, B A., Li, L., & Faloutsos, C (2012, August) Rise and fall patterns of information diffusion: model and 98 implications In Proceedings of the 18th ACM SIGKDD international conference on Knowledge discovery and data mining (pp 6-14) 106 Hui, C., Tyshchuk, Y., Wallace, W A., Magdon-Ismail, M., & Goldberg, M (2012, April) Information cascades in social media in response to a crisis: a preliminary model and a case study In Proceedings of the 21st International Conference on World Wide Web (pp 653-656) 107 Zhang, J., Liu, B., Tang, J., Chen, T., & Li, J (2013, August) Social influence locality for modeling retweeting behaviors In IJCAI (Vol 13, pp 2761-2767) 108 Suh, B., Hong, L., Pirolli, P., & Chi, E H (2010, August) Want to be retweeted? large scale analytics on factors impacting retweet in twitter network In 2010 IEEE Second International Conference on Social Computing (pp 177-184) IEEE ... ….***………… DƯƠNG NGỌC SƠN MỘT SỐ PHƯƠNG PHÁP NÂNG CAO HIỆU QUẢ DỰ BÁO LAN TRUYỀN THÔNG TIN TRÊN MẠNG XÃ HỘI LUẬN ÁN TIẾN SĨ NGÀNH MÁY TÍNH Chuyên ngành : Hệ thống thông tin Mã số: 48 01 04 Người hướng... I TỔNG QUAN VỀ LAN TRUYỀN THÔNG TIN TRÊN MẠNG XÃ HỘI 1.1 Mạng xã hội lan truyền thông tin mạng xã hội 1.1.1 Mạng xã hội 1.1.2 Lan truyền thông tin mạng xã hội ... lan truyền thơng tin Đề tài ? ?Một số phương pháp nâng cao hiệu dự báo lan truyền thông tin mạng xã hội? ?? được thực hiện khuôn khổ Luận án tiến sỹ chuyên ngành Hệ thớng thơng tin góp phần