Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 105 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
105
Dung lượng
800,95 KB
Nội dung
VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ …… ….***………… DƯƠNG NGỌC SƠN MỘT SỐ PHƯƠNG PHÁP NÂNG CAO HIỆU QUẢ DỰ BÁO LAN TRUYỀN THÔNG TIN TRÊN MẠNG XÃ HỘI LUẬN ÁN TIẾN SĨ NGÀNH MÁY TÍNH Chuyên ngành : Hệ thống thông tin Mã số: 48 01 04 Người hướng dẫn khoa học: TS Nguyễn Như Sơn TS Nguyễn Ngọc Cương Hà Nội - 2022 MỞ ĐẦU Phát biểu vấn đề Trong thời đại công nghệ thông tin phát triển hiện nay, việc sử dụng Internet trở nên phổ cập Thống kê Hootsuite We Are Social cho thấy, tính đến tháng 1/2020, tổng lượng người dùng Internet toàn thế giới đạt 4,54 tỷ1 Số lượng người dùng Internet ngày tăng nhanh, cụ thể, so với tháng 1/2019, số người dùng mới đã tăng thêm 298 triệu người dùng Ngày có nhiều người sử dụng Internet đờng nghĩa với việc gia tăng nhu cầu sử dụng mạng xã hội Các số thống kê cho thấy lượng người dùng mạng xã hội nói chung tồn thế giới đã chạm ngưỡng xấp xỉ 3,8 tỷ chiếm 49% dân sớ Hình Thống kê số liệu người dùng năm 2020 Con người dành nhiều thời gian ngày cho việc sử dụng Internet nói chung mạng xã hội nói riêng Cũng theo thống kê đối với người độ tuổi từ 16 đến 64 tuổi, trung bình một ngày, người sử dụng 6h43p cho việc truy cập Internet thời gian 2h24p để sử dụng tiện ích liên quan đến mạng xã hội https://wearesocial.com/blog/2020/01/digital-2020-3-8-billion-people-use-social-media Với sự quan tâm nhu cầu sử dụng mạng xã hội lớn như vậy, lượng thông tin mạng xã hội lớn Trong năm vừa qua, có nhiều nhà khoa học cũng như nhiều cơng trình nghiên cứu phân tích thơng tin mạng xã hội để khai thác ng̀n liệu lớn Một sớ hướng nghiên cứu phân tích thơng tin mạng xã hội kể đến khai phá liệu mạng xã hội (phân tích hành vi, phát hiện điểm nóng, tư vấn xã hội ); phân tích mơ hình liệu đồ thị (nghiên cứu lý thuyết đồ thị, phép đo, tính tốn đờ thị, ); phát hiện cộng đờng (phân tích cấu trúc cộng đờng mạng xã hội, mối quan hệ tương tác cộng đồng); an tồn thơng tin (bảo mật thơng tin, phát hiện thơng tin sai lệch ) phân tích, dự báo lan truyền thơng tin Ngồi việc nghiên cứu, phân tích thơng tin mạng xã hội cịn có ý nghĩa thực tiễn Hiện nay, nhiều cơ quan, doanh nghiệp có nhu cầu sử dụng hệ thớng phân tích thông tin mạng xã hội để phục vụ cho mục đích khác Ví dụ doanh nghiệp kinh doanh cần phân tích xu hướng lựa chọn hàng hóa người tiêu dùng, sở thích người dùng đối với sản phẩm thị trường Các cơ quan báo chí quan tâm đến chủ đề nóng được quan tâm hiện để tập trung khai thác Các doanh nghiệp cung cấp dịch vụ quan tâm đến thái độ, mức độ hài lòng người dùng đối với dịch vụ cụ thể Bộ Thông tin Truyền thơng có nhu cầu đới với việc đảm bảo an ninh thông tin quản lý luồng thông tin lan truyền mạng xã hội Bộ Công an cũng có nhu cầu đới với việc phân tích thông tin, phát hiện thông tin sai sự thật, tìm kiếm ng̀n phát tán thơng tin, dự báo thơng tin lan truyền để có phương án đấu tranh, xử lý Xuất phát từ nhu cầu thực tế công tác, Nghiên cứu sinh đã có điều kiện tiếp xúc với một sớ hệ thớng phân tích thơng tin mạng xã hội một số đơn vị, nhà cung cấp ngồi nước Hình một ví dụ một ứng dụng phân tích thơng tin mà Nghiên cứu sinh đã được vận hành thử nghiệm Qua đó, bật lên hai vấn đề cần phải nghiên cứu, xử lý: (1) phải giảm thời gian tính tốn, phân tích dự báo lan truyền thơng tin (2) nâng cao được độ xác việc dự báo lan truyền thông tin mạng xã hội Hình Ứng dụng phân tích thơng tin mạng xã hội Lý chọn đề tài Trong trình nghiên cứu, tìm hiểu, đã có một sớ cơng trình nghiên cứu được đề xuất để giải quyết hai vấn đề Tuy nhiên, lan truyền thông tin mạng xã hội một lĩnh vực rộng lớn, nghiên cứu hồn tồn tới ưu nghiên cứu mới một hướng bổ sung mới việc nâng cao hiệu quả phân tích lan truyền thông tin Đề tài “Một số phương pháp nâng cao hiệu dự báo lan truyền thông tin mạng xã hội” được thực hiện khuôn khổ Luận án tiến sỹ chun ngành Hệ thớng thơng tin góp phần đưa phương án xử lý hai vấn đề được nêu vừa để phục vụ công tác nghiên cứu khoa học, vừa có khả năng ứng dụng thực tế Mục tiêu luận án Như đã trình bày, mục tiêu Luận án nghiên cứu, phát triển, cải tiến một số phương pháp nâng cao hiệu quả việc dự báo lan truyền thông tin mạng xã hội, nằm chủ đề lớn nâng cao hiệu quả phân tích mạng xã hội phục vụ công tác nghiên cứu khả năng ứng dụng vào thực tế Kết quả Luận án giải quyết được 02 vấn đề nâng cao tớc độ (hay giảm thời gian) tính tốn, phân tích thơng tin phục vụ dự báo lan truyền thơng tin tăng độ xác (hay giảm thiểu sai số) dự báo lan truyền thông tin mạng xã hội Các đóng góp luận án Đóng góp thứ luận án đề xuất phương pháp nâng cao tốc độ tính tốn, phân tích phục vụ dự báo lan truyền thông tin mạng xã hội [C1], [C2], [C3], [C4] Cụ thể: - Đề xuất kỹ thuật rút gọn đồ thị dựa thay thế đỉnh tương đương bậc Kỹ thuật rút gọn loại bỏ đỉnh “không quan trọng”, giúp việc tính tốn đờ thị đơn giản hiệu quả hơn Thực nghiệm cũng cho thấy đồ thị sau rút gọn có kết quả tính tốn kích thước lan truyền nhanh hơn đờ thị chưa rút gọn Ngồi ra, việc rút gọn giảm quy mô đồ thị, chắn thay đổi kết quả tính toán phép đo Tuy nhiên, phương pháp loại bỏ đỉnh bậc 1, không quan trọng, không làm ảnh hưởng lớn đến đồ thị vẫn đảm bảo giữ nguyên tính chất “quan trọng” đỉnh trung tâm - Đề xuất kỹ thuật song song hóa q trình tính tốn Độ trung tâm trung gian (Betweenness Centrality), một giá trị quan trọng đã được chứng minh có ảnh hưởng lớn đến kết quả việc lan truyền thông tin mạng xã hội Bản chất phương pháp việc song song hóa phép tính SSSP thuật tốn Brandes với mơ hình lập trình l̀ng song song CPU sử dụng bộ thư viện CilkPlus Có thể nói tính tốn đồ thị với số lượng đỉnh cạnh lớn, có việc tính Độ trung tâm trung gian BC tốn tương đới khó việc song song Tuy nhiên, một số kỹ thuật xử lý, Luận án đã giải quyết được việc song song hóa giúp giảm thời gian tính tốn một cách hiệu quả - Kết quả thực nghiệm đánh giá một số bộ liệu thực tế cho thấy phương pháp đề xuất giúp nâng cao đáng kể tớc độ tính tốn Đóng góp thứ hai luận án đề xuất phương pháp nâng cao độ xác dự báo lan truyền thông tin [C5] Cụ thể: - Đề xuất phương pháp tính xác suất chấp nhận thơng tin người dùng (hay xác suất lan truyền) mạng xã hội theo mơ hình Bậc độc lập IC (Independent Cascade) dựa 03 thông số: quan hệ người dùng, sở thích với nội dung ảnh hưởng từ bên ngồi Việc kết hợp thông số giúp nâng cao đáng kể độ xác dự báo - Đờng thời, dựa xác suất đã tính, xây dựng Cây lan truyền “có khả năng nhất” cho một nội dung cụ thể để ước tính kích thước lan truyền thơng tin - Kết quả thực nghiệm đánh giá một số bộ liệu mô thực tế cho thấy phương pháp đề xuất giúp nâng cao độ xác (hay giảm sai sớ) ước tính kích thước lan truyền dự báo lan truyền thông tin Bố cục Luận án Bố cục Luận án được phân chia thành 03 chương bao gồm: Chương I Tổng quan lan truyền thông tin mạng xã hội Nội dung Chương giới thiệu chung mạng xã hội, phân tích thơng tin mạng xã hội tốn lan truyền thơng tin mạng xã hội, nghiên cứu liên quan phương pháp đề xuất Luận án Một số lý thuyết cơ bản phục vụ cho Luận án được trình bày ở cuối chương Chương II Nâng cao tốc độ dự báo lan truyền thơng tin Trình bày phương pháp nâng cao tớc độ phân tích, tính tốn phục vụ dự báo lan truyền thông tin kỹ thuật rút gọn đồ thị song song hóa q trình tính tốn Độ trung tâm trung gian Nội dung trình bày chương được tổng hợp từ kết quả nghiên cứu đã được công bố [C1], [C2], [C3], [C4] Chương III Nâng cao độ xác dự báo lan truyền thơng tin Trình bày phương pháp nâng cao độ xác dự báo lan truyền cách tính xác suất lan truyền thông tin dựa một số yếu tố ảnh hưởng xây dựng lan truyền Nội dung trình bày chương được tổng hợp từ kết quả nghiên cứu đã được công bố [C5] Chương I TỔNG QUAN VỀ LAN TRUYỀN THÔNG TIN TRÊN MẠNG XÃ HỘI Mục tiêu chương trình bày vấn đề tổng quan mạng xã hội, lĩnh vực phân tích thơng tin mạng xã hội, tốn lan truyền thơng tin mạng xã hội, một số nghiên cứu, cách tiếp cận liên quan, phân tích rõ hạn chế, tờn tại phương pháp Trên cơ sở đó, đưa hướng nghiên cứu cụ thể Luận án Những kết quả nghiên cứu Luận án được trình bày ở chương tiếp theo 1.1 Mạng xã hội lan truyền thông tin mạng xã hội 1.1.1 Mạng xã hội Có nhiều khái niệm khác mạng xã hội: - Về cơ bản, mạng xã hội tập hợp tác nhân có yếu tố xã hội kết nối với nhiều quan hệ xã hội - Về mặt dịch vụ, mạng xã hội trực tuyến (online social network) dịch vụ kết nối thành viên Internet với nhiều mục đích khác khơng phân biệt khơng gian thời gian - Trong phân tích (lý thút đờ thị), mạng xã hội cấu trúc xã hội bao gồm cá nhân hay tổ chức, thường biểu diễn nút, với quan hệ xã hội, tương ứng với cạnh/liên kết nút Mạng xã hội xuất hiện lần đầu tiên năm 1995 với sự đời trang Classmate [1], [2] nhằm mục đích kết nới bạn học tại Mỹ Canada với 50 triệu người dùng, tiếp theo sự xuất hiện SixDegrees [1], [2] vào năm 1997 nhằm mục đích giao lưu kết bạn dựa theo sở thích với 3,5 triệu người dùng Đến nay, thế giới có hàng trăm mạng mạng xã hội khác nhau, đó, phổ biến kể đến Facebook (2,45 tỷ người dùng), Youtube (2 tỷ người dùng), Whatsapp, Instagram, Twitter Ngoài ra, tại nước khu vực cũng có mạng xã hội được sử dụng riêng như Weibo2 (Trung Quốc), CyWorld3 (Hàn Quốc), Mixi4 (Nhật Bản) hay Zalo5 (Việt Nam) Mạng xã hội đóng vai trị quan trọng việc truyền bá thông tin ở quy mô lớn Đến nay, nhiều nghiên cứu đã được thực hiện để tìm hiểu q trình này, từ tốn khai phá liệu để phát hiện chủ đề được quan tâm, phát hiện điểm nóng, nhận diện người dùng có ảnh hưởng mạng xã hội đến việc phân tích, nghiên cứu mơ hình lan truyền thơng tin Mạng xã hội cho phép hàng tỷ người dùng Internet tồn thế giới kết nới, đăng truyền tải nội dung Người dùng được tiếp xúc một thành phần tạo nguồn thông tin lớn Việc truyền bá thông tin tạo tác động mạnh mẽ, ví dụ như việc tạo sóng cách mạng Facebook vụ việc mùa xuân Ả Rập năm 2010 [3] hay gây tác động Twitter cuộc bầu cử tổng thống Hoa Kỳ năm 2008 [4], Do tác động mạng xã hội đối với đời sống thực, trọng tâm nghiên cứu gần tập trung vào việc phát hiện cộng đồng khai thác thơng tin có giá trị từ lượng liệu khổng lồ Các sự kiện diễn phát triển nhanh mạng xã hội, việc nắm bắt, tìm hiểu dự đốn sự kiện vấn đề quan tâm nhiều đối tượng khác từ tổ chức, doanh nghiệp đến nhà nghiên cứu Thực tế cũng cho thấy việc nắm bắt được mối quan hệ cộng đồng mạng xã hội sự phát triển mạng xã hội giúp điều chỉnh hành vi dự báo sự kiện tiếp theo tốt hơn như việc phân tích tới ưu hóa hiệu quả kinh doanh cách tạo chiến dịch tiếp thị xã hội; điều chỉnh hành vi cộng đồng người dùng thơng qua cá nhân có sức ảnh hưởng xã hội; hay việc phân tích cuộc biểu tình từ giải quyết vấn đề an ninh như ngăn chặn cuộc công khủng bố, dự báo ng̀n thơng tin có tác động xấu đến xã hội Do đó, phát triển kỹ thuật mơ hình để phát hiện cộng đờng, nắm https://weibo.com/overseas http://www.cyworld.com/42book/ https://mixi.jp/ https://zalo.me/ bắt sự phát triển mạng xã hội lan truyền thông tin mạng xã hội cũng chủ đề mà nhà nghiên cứu quan tâm năm gần 1.1.2 Lan truyền thông tin mạng xã hội Theo [5], lan truyền một trình mà một sự cập nhật thông tin được truyền đạt qua kênh định theo thời gian người dùng một mạng xã hội Có ba ́u tớ quan trọng trình là: thành viên mạng xã hội, sự tương tác lẫn kênh truyền tải Việc nghiên cứu trình lan truyền hoàn cảnh cụ thể tảng giúp người giải quyết vấn đề liên quan đến sự lan truyền thực tế như: sự lan truyền dịch bệnh (trong y học, dịch tễ học), sự lan truyền ý kiến, tư tưởng cá nhân một xã hội, sự phát tán virus một mạng máy tính, sự lan truyền thơng tin mạng xã hội Hình 1.1 Lan truyền thông tin Trong mạng xã hội, thông tin được lan truyền từ người dùng đến người dùng khác thông qua nhiều hoạt động tương tác người dùng như: đăng bài, chia sẻ, bình luận Q trình diễn tương đới nhanh có đặc điểm khác với sự lan truyền thông tin truyền thớng Việc hiểu rõ q trình 84 Việc duyệt đồ thị sử dụng phương pháp BFS được lờng ghép vào pha duyệt đờ thị Thuật tốn Brandes Cuối cùng, chọn một đỉnh làm đại diện, hay tức xóa đỉnh tương đương để lại một đỉnh Đối với kỹ thuật song song hóa, việc thi hành song song phép tính Độ trung tâm trung gian đỉnh khác để khai thác được hiệu năng CPU đa lõi Sử dụng bộ thư viện Cilkplus với trọng tâm vector reducerBC[v] bộ thư viện Cilkplus để cập nhật tương tranh giá trị BC đỉnh v thi hành song song Ngồi ra, đới với liệu được biểu diễn theo phương pháp danh sách liền kề lưu trữ dưới dạng mảng Đối với tốn tính xác suất chấp nhận thơng tin người dùng (hay xác suất lan truyền), việc xác định ảnh hưởng từ mối quan hệ người dùng (được xác định dựa lịch sử hoạt động) có xét đến lan truyền sơ cấp thứ cấp; ảnh hưởng từ sở thích, quan tâm người dùng đới với nội dung; ảnh hưởng từ bên ngồi đến quyết định người dùng Cuối xây dựng lan truyền “có khả năng nhất” cho một nội dung cụ thể dựa xác suất đã tính với xác suất tạo ( ) = ∏( , )∈ ( ) Tiến hành thực nghiệm cho thấy, phương pháp nâng cao tớc độ tính tốn dự báo lan truyền Luận án đã mang lại hiệu quả hơn so với bộ công cụ TeexGraph từ 1,2 đến 1,41 lần so với bộ công cụ NetworKit từ 1,76 đến 2,55 lần thực nghiệm với một số bộ liệu được công bố bởi SNAP Phương pháp nâng cao độ xác dự báo lan truyền thông tin Luận án mang lại hiệu quả hơn, sai sớ thấp hơn hay độ xác cao hơn ba mơ hình phổ biến hiện mơ hình bậc độc lập IC, mơ hình tương tác người dùng UI, mơ hình hời quy RM việc dự đốn kích thước lan truyền tạo có khả năng đối với ba bộ liệu mô phỏng, Meme, Tencent Weibo Đặc biệt hiệu quả hơn xét đến ảnh hưởng từ bên Toàn bộ cơng trình nghiên cứu Luận án được công bố chờ công bố xuất bản kỷ ́u hội thảo, tạp chí có mục SCOPUS Hạn chế luận án Do hạn chế cả thời gian, nguồn lực lẫn sự giới hạn không 85 gian nghiên cứu, nghiên cứu Luận án cũng nhiều điểm chưa thể giải quyết chưa được đề cập đến Một số điểm hạn chế được liệt kê dưới đây: - Nghiên cứu tăng tốc độ đờ thị Luận án cịn chưa thể tiến hành với đờ thị mạng xã hội có quy mơ siêu lớn như Facebook với hơn hai tỷ đỉnh hơn nghìn tỷ cạnh Nguyên nhân xuất phát từ giới hạn bộ liệu thực được công bố công khai cịn hạn chế với liệu quy mơ lớn năng lực hệ thớng tính tốn mà Nghiên cứu sinh sử dụng cũng khơng thể cho phép xử lý được với liệu quy mô siêu lớn như vậy Ngoài ra, việc rút gọn tối ưu phạm vi Luận án - Nghiên cứu dự báo lan truyền thơng tin ước tính ảnh hưởng bên một bước thời gian giả định ảnh hưởng vẫn có tác động giữ nguyên cho bước thời gian tiếp theo Do đó, chưa thể được sử dụng để dự đốn sớm với liệu lan truyền cập nhật liên tục phân tích liệu lớn Hướng phát triển tương lai Toàn bộ hạn chế đã nêu được Nghiên cứu sinh xác định nghiên cứu được trọng tiến hành thời gian tới, cụ thể: - Với vấn đề nâng cao tốc độ dự báo lan truyền thơng tin, tập trung mở rộng phương pháp để nâng cao tớc độ tính tốn phép đo khác phân tích đờ thị mạng xã hội như độ trung tâm gần, độ trung tâm eigenvector, độ trung tâm Pagerank , đồng thời tiến hành phân tích đờ thị phức tạp hơn ứng dụng vào tốn phát hiện điểm nóng, phát hiện cộng đờng, hay tốn dự báo lan truyền thông tin, - Với vấn đề nâng cao hiệu quả dự báo lan truyền, tiếp tục nghiên cứu sâu hơn khía cạnh ảnh hưởng bên ngồi tác động đến q trình lan truyền Tức kiểm tra ảnh hưởng bên làm thay đổi cấu trúc lan truyền sử dụng sự thay đổi cấu trúc để dự đốn hình dạng kích thước lan truyền - Chứng minh kết quả thực nghiệm Luận án ứng dụng vào hệ thớng phân tích thơng tin mạng xã hội nghiên cứu phương án áp dụng kết quả nghiên cứu để nâng cao hiệu năng hệ thống 86 DANH MỤC CÁC CƠNG TRÌNH ĐÃ CƠNG BỐ C1 Duong Ngoc Son, Nguyen Ngoc Cuong, Nguyen Nhu Son (2019), Một phương pháp rút gọn đồ thị mạng xã hội dựa thay lớp đỉnh tương đương, The 22nd National Symposium of Selected ICT Problems, pp: 27 C2 Duong Ngoc Son, Nguyen Ngoc Cuong, Nguyen Nhu Son, Nguyen Ngoc Hoa (2020), Một phương pháp nâng cao hiệu tính tốn đồ thị, The 23rd National Symposium of Selected ICT Problems, pp: 60 C3 Du Phuong Hanh, Duong Ngoc Son, Nguyen Ngoc Cuong, Nguyen Ngoc Hoa (2020), A Fast Computation of Betweenness Centrality in LargeScale Unweighted Graphs, International Journal on Emerging Technologies 11(2): 370-377 C4 Duong Ngoc Son, Nguyen Ngoc Cuong, Nguyen Ngoc Hoa, Du Phuong Hanh (2021), A RED-BET Method to Improve the Information Diffusion on Social Networks, International Journal of Advanced Computer Science and Applications, 12(8): 867-875 C5 Nguyen Viet Anh, Duong Ngoc Son, Nguyen Thi Thu Ha, Sergey Kuznetsov, Nguyen Tran Quoc Vinh (2018), A Method for determining information diffusion cascades on social networks, Eastern-European Journal of Enterprise Technologies, Vol 6, No (96), pp: 61-69 87 TÀI LIỆU THAM KHẢO Kim, J., Leem, C., Kim, B., & Cheon, Y (2013) Evolution of online social networks: A conceptual framework Asian Social Science, 9(4), 208-220 Sajithra, K., & Patil, R (2013) Social media–history and components Journal of Business and Management, 7(1), 69-74 Howard, P N., Duffy, A., Freelon, D., Hussain, M M., Mari, W., & Maziad, M (2011) Opening closed regimes: what was the role of social media during the Arab Spring? Information Technology and Political Islam, 1-30 Hughes, A L., & Palen, L (2009) Twitter adoption and use in mass convergence and emergency events International journal of emergency management, 6(3-4), 248-260 Rogers, E M (1962) (1995) Diffusion of innovations New York: Free Press Kaya, M., & Alhajj, R (Eds.) (2019) Influence and Behavior Analysis in Social Networks and Social Media Springer Li, N., & Wu, D D (2010) Using text mining and sentiment analysis for online forums hotspot detection and forecast Decision support systems, 48(2), 354-368 Duggirala, S (2018) NewSQL databases and scalable in-memory analytics In Advances in Computers (Vol 109, pp 49-76) Elsevier Mondal, J., & Deshpande, A (2012) Managing large dynamic graphs efficiently In Proceedings of the 2012 ACM SIGMOD International Conference on Management of Data (pp 145-156) 10 Fortunato, S (2010) Community detection in graphs Physics reports, 486(3-5), 75-174 11 Newman, M E (2006) Modularity and community structure in networks Proceedings of the national academy of sciences, 103(23), 8577-8582 88 12 Guimerà, R., & Sales-Pardo, M (2009) Missing and spurious interactions and the reconstruction of complex networks Proceedings of the National Academy of Sciences, 106(52), 22073-22078 13 Domingos, P., & Richardson, M (2001, August) Mining the network value of customers In Proceedings of the seventh ACM SIGKDD international conference on Knowledge discovery and data mining (pp 57-66) 14 Yang, W., Brenner, L., & Giua, A (2018, April) Computation of activation probabilities in the independent cascade model In 2018 5th International Conference on Control, Decision and Information Technologies (CoDIT) (pp 791-797) IEEE 15 Cohen, E., Delling, D., Pajor, T., & Werneck, R F (2014, November) Sketch-based influence maximization and computation: Scaling up with guarantees In Proceedings of the 23rd ACM International Conference on Conference on Information and Knowledge Management (pp 629-638) 16 Kempe, D., Kleinberg, J., & Tardos, É (2003, August) Maximizing the spread of influence through a social network In Proceedings of the ninth ACM SIGKDD international conference on Knowledge discovery and data mining (pp 137-146) 17 Lucier, B., Oren, J., & Singer, Y (2015, August) Influence at scale: Distributed computation of complex contagion in networks In Proceedings of the 21th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (pp 735-744) 18 Dinh, T N., Shen, Y., & Thai, M T (2012, October) The walls have ears: optimize sharing for visibility and privacy in online social networks In Proceedings of the 21st ACM international conference on Information and knowledge management (pp 1452-1461) 19 Shen, Y., Syu, Y S., Nguyen, D T., & Thai, M T (2012, June) Maximizing circle of trust in online social networks In Proceedings of the 23rd ACM conference on Hypertext and social media (pp 155-164) 89 20 Wu, L., Morstatter, F., Hu, X., & Liu, H (2016) Mining misinformation in social media Big data in complex and social networks, 123-152 21 Budak, C., Agrawal, D., & El Abbadi, A (2011, March) Limiting the spread of misinformation in social networks In Proceedings of the 20th international conference on World wide web (pp 665-674) 22 Nguyen, D T., Nguyen, N P., & Thai, M T (2012, October) Sources of misinformation in online social networks: Who to suspect? In MILCOM 2012-2012 IEEE Military Communications Conference (pp 1-6) IEEE 23 Zhang, H., Zhang, H., Li, X., & Thai, M T (2015, August) Limiting the spread of misinformation while effectively raising awareness in social networks In International Conference on Computational Social Networks (pp 35-47) Springer, Cham 24 Saraswathi, S., Mukhopadhyay, A., Shah, H., & Ranganath, T S (2020) Social network analysis of COVID-19 transmission in Karnataka, India Epidemiology & Infection, 148 25 Feder, T., & Motwani, R (1995) Clique partitions, graph compression and speeding-up algorithms Journal of Computer and System Sciences, 51(2), 261-272 26 Adler, M., & Mitzenmacher, M (2001, March) Towards compressing web graphs In Proceedings DCC 2001 Data Compression Conference (pp 203-212) IEEE 27 Gilbert, A C., & Levchenko, K (2004, August) Compressing network graphs In Proceedings of the LinkKDD workshop at the 10th ACM Conference on KDD (Vol 124) 28 Nguyen Xuan Dung, Luận án rút gọn đồ thị mạng xã hội đề xuất thuật toán lan truyền nhãn đồ thị rút gọn để phát cấu trúc cộng đồng, 2019 29 Du, P H., Nguyen, H C., Nguyen, K K., & Nguyen, N H (2018, December) An efficient parallel algorithm for computing the closeness centrality in social networks In Proceedings of the Ninth International 90 Symposium on Information and Communication Technology (pp 456462) 30 Bernaschi, M., Carbone, G., & Vella, F (2015, November) Betweenness centrality on multi-GPU systems In Proceedings of the 5th Workshop on Irregular Applications: Architectures and Algorithms (pp 14) 31 Fan, R., Xu, K., & Zhao, J (2017) A GPU-based solution for fast calculation of the betweenness centrality in large weighted networks PeerJ Computer Science, 3, e140 32 McLaughlin, A., & Bader, D A (2018) Accelerating gpu betweenness centrality Communications of the ACM, 61(8), 85-92 33 Brandes, U (2001) A faster algorithm for betweenness centrality Journal of mathematical sociology, 25(2), 163-177 34 Mahmoody, A., Tsourakakis, C E., & Upfal, E (2016, August) Scalable betweenness centrality maximization via sampling In Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (pp 1765-1773) 35 Riondato, M., & Kornaropoulos, E M (2016) Fast approximation of betweenness centrality through sampling Data Mining and Knowledge Discovery, 30(2), 438-475 36 Wei, J., Chen, K., Zhou, Y., Zhou, Q., & He, J (2016, March) Benchmarking of distributed computing engines spark and graphlab for big data analytics In 2016 IEEE Second International Conference on Big Data Computing Service and Applications (BigDataService) (pp 1013) IEEE 37 Kwak, H., Lee, C., Park, H., & Moon, S (2010, April) What is Twitter, a social network or a news media? In Proceedings of the 19th international conference on World wide web (pp 591-600) 38 Haveliwala, T H (2002) Topic-sensitive pagerank In Proceedings of the 11th International Conference on World Wide Web (pp 517-526) 91 39 Weng, J., Lim, E P., Jiang, J., & He, Q (2010, February) Twitterrank: finding topic-sensitive influential twitterers In Proceedings of the third ACM international conference on Web search and data mining (pp 261-270) 40 Myers, S A., Zhu, C., & Leskovec, J (2012, August) Information diffusion and external influence in networks In Proceedings of the 18th ACM SIGKDD international conference on Knowledge discovery and data mining (pp 33-41) 41 Wu, D., Li, C., & Lau, R Y (2015, October) Topic based information diffusion prediction model with external trends In 2015 IEEE 12th International Conference on e-Business Engineering (pp 2936) IEEE 42 Szabo, G., & Huberman, B A (2010) Predicting the popularity of online content Communications of the ACM, 53(8), 80-88 43 Yang, J., & Leskovec, J (2010, December) Modeling information diffusion in implicit networks In 2010 IEEE International Conference on Data Mining (pp 599-608) IEEE 44 Ma, Z., Sun, A., & Cong, G (2013) On predicting the popularity of newly emerging hashtags in T witter Journal of the American Society for Information Science and Technology, 64(7), 1399-1410 45 Bakshy, E., Karrer, B., & Adamic, L A (2009, July) Social influence and the diffusion of user-created content In Proceedings of the 10th ACM conference on Electronic commerce (pp 325-334) 46 Jenders, M., Kasneci, G., & Naumann, F (2013, May) Analyzing and predicting viral tweets In Proceedings of the 22nd international conference on world wide web (pp 657-664) 47 Kupavskii, A., Ostroumova, L., Umnov, A., Usachev, S., Serdyukov, P., Gusev, G., & Kustarev, A (2012, October) Prediction of retweet cascade size over time In Proceedings of the 21st ACM international conference on Information and knowledge management (pp 2335-2338) 92 48 Zhang, L , Luo, M & Boncella, R J (2020) Product information diffusion in a social network, Electronic Commerce Research, 20(1), pp 3-19 49 Hinz, O., Skiera, B., Barrot, C & Becker, J U (2011) Seeding strategies for viral marketing: An empirical comparison, Journal of Marketing, 75(6), pp 55-71 50 Trudeau, R J (1994) Introduction to graph theory Dover Pubns 51 Wilson, R J (1979) Introduction to graph theory Pearson Education India 52 Sakr, S., & Pardede, E (2011) Graph data management: techniques and applications Information Science Reference-Imprint of: IGI Publishing 53 Buluỗ, A., Fineman, J T., Frigo, M., Gilbert, J R., & Leiserson, C E (2009, August) Parallel sparse matrix-vector and matrix-transposevector multiplication using compressed sparse blocks In Proceedings of the twenty-first annual symposium on Parallelism in algorithms and architectures (pp 233-244) 54 Sedgewick, R., & Flajolet, P (2013) An introduction to the analysis of algorithms Pearson Education India 55 Grama, A., Gupta, A., Karypis, G., & Kumar, V (2003) Principles of parallel algorithm design Introduction to Parallel Computing, 2nd ed Addison Wesley, Harlow 56 Asanovic, K., Bodik, R., Catanzaro, B C., Gebis, J J., Husbands, P., Keutzer, K., & Yelick, K A (2006) The landscape of parallel computing research: A view from berkeley, EECS Technical Report UCB/EECS-2006-183 57 Adve, S., Adve, V S., Agha, G., Frank, M I., Garzarán, M J., Hart, J C., & Zilles, C (2008) Parallel computing research at Illinois: The UPCRC agenda Urbana, IL: Univ Illinois Urbana-Champaign 93 58 Trobec, R., Slivnik, B., Bulic, P., & Robic, B (2018) Introduction to Parallel Computing: From Algorithms to Programming on State-of-Art Platforms Springer 59 Asanovic, K., Bodik, R., Demmel, J., Keaveny, T., Keutzer, K., Kubiatowicz, J., & Yelick, K (2009) A view of the parallel computing landscape Communications of the ACM, 52(10), 56-67 60 Al-hayanni, M A N., Xia, F., Rafiev, A., Romanovsky, A., Shafik, R., & Yakovlev, A (2020) Amdahl's law in the context of heterogeneous many-core systems–a survey IET Computers & Digital Techniques, 14(4), 133-148 61 Lim, S., Jung, I., Lee, S., & Jung, K (2015) Analysis of information diffusion for threshold models on arbitrary networks The European Physical Journal B, 88(8), 1-14 62 Kim, J., Lee, W., & Yu, H (2014) CT-IC: Continuously activated and time-restricted independent cascade model for viral marketing Knowledge-Based Systems, 62, 57-68 63 Chen, W., Castillo, C., & Lakshmanan, L V (2013) Information and Influence Propagation in Social Networks Morgan & Claypool Publishers 64 Li, Y., Fan, J., Wang, Y., & Tan, K L (2018) Influence maximization on social graphs: A survey IEEE Transactions on Knowledge and Data Engineering, 30(10), 1852-1872 65 Saito, K., Kimura, M., Ohara, K., & Motoda, H (2009, November) Learning continuous-time information diffusion model for social behavioral data analysis In Asian Conference on Machine Learning (pp 322-337) Springer, Berlin, Heidelberg 66 Saito, K., Ohara, K., Yamagishi, Y., Kimura, M., & Motoda, H (2011, June) Learning diffusion probability based on node attributes in social networks In International Symposium on Methodologies for Intelligent Systems (pp 153-162) Springer, Berlin, Heidelberg 94 67 Rodriguez, M G., Balduzzi, D., & Schölkopf, B (2011) Uncovering the temporal dynamics of diffusion networks In Proceedings of the 28th International Conference on Machine Learning, ICML '11 (pp 561-568) 68 Chen, W., Collins, A., Cummings, R., Ke, T., Liu, Z., Rincon, D., & Yuan, Y (2011, April) Influence maximization in social networks when negative opinions may emerge and propagate In Proceedings of the 2011 siam international conference on data mining (pp 379-390) Society for Industrial and Applied Mathematics 69 Barbieri, N., Bonchi, F., & Manco, G (2013) Topic-aware social influence propagation models In Proceedings of the 12th International Conference in Data Mining (pp 81-90) IEEE 70 Li, Y., Chen, W., Wang, Y., & Zhang, Z L (2013, February) Influence diffusion dynamics and influence maximization in social networks with friend and foe relationships In Proceedings of the sixth ACM international conference on Web search and data mining (pp 657666) 71 Du, N., Liang, Y., Balcan, M F., Gomez-Rodriguez, M., Zha, H., & Song, L (2017) Scalable Influence Maximization for Multiple Products in Continuous-Time Diffusion Networks J Mach Learn Res., 18(2), 1-45 72 Du, N., Song, L., Gomez-Rodriguez, M., & Zha, H (2013) Scalable influence estimation in continuous-time diffusion networks Advances in neural information processing systems, 26, 3147-3155 73 Li, Y., Zhang, D., & Tan, K L (2015) Real-time Targeted Influence Maximization for Online Advertisements Proceedings of the VLDB Endowment, 8(10), 1070-1081 74 Kurka, D B., Godoy, A., & Von Zuben, F J (2015) Online social network analysis: A survey of research applications in computer science arXiv preprint arXiv:1504.05655 75 Wasserman, S., & Faust, K (1994) Social Network Analysis: Methods and Applications., Cambridge University Press 95 76 Farooq, A., Joyia, G J., Uzair, M., & Akram, U (2018, March) Detection of influential nodes using social networks analysis based on network metrics In 2018 International Conference on Computing, Mathematics and Engineering Technologies (iCoMET) (pp 1-6) IEEE 77 Kumar, P & Sinha, A (2021) Information diffusion modeling and analysis for socially interacting networks, Social Network Analysis and Mining 11(1), pp 1-18 78 Alhajj, R., & Rokne, J (2014) Encyclopedia of social network analysis and mining Springer 79 Freeman, L C (1977) A set of measures of centrality based on betweenness Sociometry, 35-41 80 Cormen, T H., Leiserson, C E., Rivest, R L., & Stein, C (2009) Introduction to Algorithms, 3rd-edition MIT Press and McGraw-Hill 81 Even, S (2011) Graph algorithms Cambridge University Press 82 Goodrich, M T., Tamassia, R., & Goldwasser, M H (2014) Data structures and algorithms in Java John Wiley & Sons 83 Dijkstra, E W (1959) A note on two problems in connexion with graphs Numerische mathematik, 1(1), 269-271 84 Kaya, M., Kawash, J., Khoury, S., & Day, M Y (Eds.) (2018) Social Network Based Big Data Analysis and Applications Springer 85 Holte, R C., Felner, A., Sharon, G., Sturtevant, N R., & Chen, J (2017) MM: A bidirectional search algorithm that is guaranteed to meet in the middle Artificial Intelligence, 252, 232-266 86 Tsvetovat, M., & Kouznetsov, A (2011) Social Network Analysis for Startups: Finding connections on the social web " O'Reilly Media, Inc." 87 Boldi, P., & Vigna, S (2014) Axioms for centrality Internet Mathematics, 10(3-4), 222-262 88 Kim, J., & Lee, J G (2015) Community detection in multi-layer graphs: A survey ACM SIGMOD Record, 44(3), 37-48 96 89 Leist, A., & Gilman, A (2014) A comparative analysis of parallel programming models for c++, In The 9th International MultiConference on Computing in the Global Information Technology (pp 121-127) 90 Rossetti, G., Mill, L., Rinzivillo, S., Sirbu, A., Pedreschi, D & Giannotti, F (2018) NDlib: a python library to model and analyze diffusion processes over complex networks, International Journal of Data Science and Analytics 5(1), pp 61-79 91 Frigo, M., Halpern, P., Leiserson, C E., & Lewin-Berlin, S (2009, August) Reducers and other Cilk++ hyperobjects In Proceedings of the twenty-first annual symposium on Parallelism in algorithms and architectures (pp 79-90) 92 Yakovleva, O V., Rudakov, I V., & Stroganov, Y V (2019, December) Predict post spreading in online social networks based on independent cascade model In Journal of Physics: Conference Series (Vol 1419, No 1, p 012017) IOP Publishing 93 Newman, M E (2002) Spread of epidemic disease on networks Physical review E, 66(1), 016128 94 Chen, W., Wang, C., & Wang, Y (2010, July) Scalable influence maximization for prevalent viral marketing in large-scale social networks In Proceedings of the 16th ACM SIGKDD international conference on Knowledge discovery and data mining (pp 1029-1038) 95 Borgs, C., Brautbar, M., Chayes, J., & Lucier, B (2014, January) Maximizing social influence in nearly optimal time In Proceedings of the twenty-fifth annual ACM-SIAM symposium on Discrete algorithms (pp 946-957) Society for Industrial and Applied Mathematics 96 Nguyen, H T., Thai, M T., & Dinh, T N (2016, June) Stop-andstare: Optimal sampling algorithms for viral marketing in billion-scale networks In Proceedings of the 2016 International Conference on Management of Data (pp 695-710) 97 97 Tang, Y., Shi, Y., & Xiao, X (2015, May) Influence maximization in near-linear time: A martingale approach In Proceedings of the 2015 ACM SIGMOD International Conference on Management of Data (pp 1539-1554) 98 Tang, Y., Xiao, X., & Shi, Y (2014, June) Influence maximization: Near-optimal time complexity meets practical efficiency In Proceedings of the 2014 ACM SIGMOD international conference on Management of data (pp 75-86) 99 Leskovec, J., Chakrabarti, D., Kleinberg, J., Faloutsos, C., & Ghahramani, Z (2010) Kronecker Graphs: An Approach to Modeling Networks Journal of Machine Learning Research, 11, 985-1042 100Bi, B., Tian, Y., Sismanis, Y., Balmin, A., & Cho, J (2014, February) Scalable topic-specific influence analysis on microblogs In Proceedings of the 7th ACM international conference on Web search and data mining (pp 513-522) 101Du, N., Song, L., Woo, H., & Zha, H (2013, April) Uncover topicsensitive information diffusion networks In Artificial Intelligence and Statistics (pp 229-237) PMLR 102Pramanik, S., Wang, Q., Danisch, M., Guillaume, J L., & Mitra, B (2017) Modeling cascade formation in Twitter amidst mentions and retweets Social Network Analysis and Mining, 7(1), 1-18 103Gomez-Rodriguez, M., Leskovec, J., & Krause, A (2012) Inferring networks of diffusion and influence ACM Transactions on Knowledge Discovery from Data (TKDD), 5(4), 1-37 104Bakshy, E., Hofman, J M., Mason, W A., & Watts, D J (2011, February) Everyone's an influencer: quantifying influence on twitter In Proceedings of the fourth ACM international conference on Web search and data mining (pp 65-74) 105 Matsubara, Y., Sakurai, Y., Prakash, B A., Li, L., & Faloutsos, C (2012, August) Rise and fall patterns of information diffusion: model and 98 implications In Proceedings of the 18th ACM SIGKDD international conference on Knowledge discovery and data mining (pp 6-14) 106 Hui, C., Tyshchuk, Y., Wallace, W A., Magdon-Ismail, M., & Goldberg, M (2012, April) Information cascades in social media in response to a crisis: a preliminary model and a case study In Proceedings of the 21st International Conference on World Wide Web (pp 653-656) 107Zhang, J., Liu, B., Tang, J., Chen, T., & Li, J (2013, August) Social influence locality for modeling retweeting behaviors In IJCAI (Vol 13, pp 2761-2767) 108 Suh, B., Hong, L., Pirolli, P., & Chi, E H (2010, August) Want to be retweeted? large scale analytics on factors impacting retweet in twitter network In 2010 IEEE Second International Conference on Social Computing (pp 177-184) IEEE ... Đề tài ? ?Một số phương pháp nâng cao hiệu dự báo lan truyền thông tin mạng xã hội? ?? được thực hiện khuôn khổ Luận án tiến sỹ chun ngành Hệ thớng thơng tin góp phần đưa phương án xử... Nâng cao độ xác dự báo lan truyền thơng tin Trình bày phương pháp nâng cao độ xác dự báo lan truyền cách tính xác suất lan truyền thông tin dựa một số yếu tố ảnh hưởng xây dựng lan. .. CilkPlus 2.3 Nâng cao tốc độ dự báo lan truyền thơng tin Như đã trình bày ở trên, phương pháp nâng cao tớc độ tính tốn, phân tích dự báo lan truyền thơng tin được trình bày Luận án việc