59 Trang 8 DANH SÁCH BẢNG Trang 9 DANH MỤC CÁC TỪ VIẾT TẮT Từ viết tắt Tiếng Anh Tiếng Việt BCIM Budgeted Competitive Influence Maximization problem Bài toán tối đa ảnh hưởng cạnh tr
ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG VONGPRATHOUM Phouthasone BÀI TOÁN TỐI ƯU TỔ HỢP VÀ ỨNG DỤNG TRÊN MỘT SỐ MÔ HÌNH LAN TRUYỀN THÔNG TIN LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Thái Nguyên, năm 2021 ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG VONGPRATHOUM Phouthasone BÀI TOÁN TỐI ƯU TỔ HỢP VÀ ỨNG DỤNG TRÊN MỘT SỐ MÔ HÌNH LAN TRUYỀN THÔNG TIN Chuyên ngành : Khoa học máy tính Mã số chuyên ngành : 848 01 01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH NGƯỜI HƯỚNG DẪN KHOA HỌC: TS Trương Hà Hải, TS Nông Thị Hoa Thái Nguyên, năm 2021 LỜI CAM ĐOAN Tôi xin được cam đoan: luận văn trên đề tài “Bài toán tối ưu tổ hợp và ứng dụng trên một số mô hình lan truyền thông tin” là kết quả nghiên cứu của tôi, được thực hiện dưới sự hướng dẫn nhiệt tình của TS Trương Hà Hải và TS Nông Thị Hoa Các kết quả và số liệu trình bày trong luận văn là hoàn toàn trung thực, các nội dung trích dẫn từ các nghiên cứu của các tác giả khác mà tôi trình bày trong luận văn này đã được ghi rõ nguồn trong phần tài liệu tham khảo Thái Nguyên, ngày 30 tháng 11 năm 2021 Người thực hiện VONGPRATHOUM Phouthasone i LỜI CẢM ƠN Trước hết, tôi xin bày tỏ lòng biết ơn chân thành và sâu sắc tới tập thể các Cô hướng dẫn, TS Trương Hà Hải và TS Nông Thị Hoa Tôi vô cùng biết ơn TS Trương Hà Hải, mặc dù rất bận rộn nhưng luôn dành thời gian quan tâm và hướng dẫn tôi hoàn thành các nghiên cứu của mình Cô luôn động viên và khích lệ tôi vượt qua những thử thách trong khoa học cũng như trong cuộc sống Nhờ có những động viên, khích lệ, và những tài liệu quý báu mà cô cung cấp, tôi mới có thể hoàn thành luận văn của mình Các cô đã cho tôi nhiều kinh nghiệm quý báu trong nghiên cứu và cuộc sống giúp tôi vững tin vượt qua những khó khăn trong suốt quá trình nghiên cứu Tôi xin chân thành cảm ơn các thầy, cô thuộc khoa Công nghệ thông tin, trường Đại học Công nghệ Thông tin và Truyền thông, Thái Nguyên đã tận tình giảng dạy cho tôi trong quá trình học tập Trong thời gian học tập tôi cũng đã nhận được sự quan tâm, góp ý, hỗ trợ quý báu của quý thầy cô, bạn bè và người thân Cuối cùng, luận văn này sẽ không hoàn thành được nếu thiếu sự động viên về mọi mặt của gia đình Từ tận đáy lòng, tôi xin gửi lời cảm ơn chân thành đến bố mẹ tôi, những người đã vất vả để tôi có được ngày hôm nay Tôi xin gửi lời cảm ơn và biết ơn chân thành tới bố mẹ của tôi, những người đã luôn ủng hộ, giúp đỡ và khích lệ tôi vượt qua những khó khăn trong học tập cũng như trong cuộc sống, những người luôn là động lực về tinh thần giúp tôi vững bước trong quá trình học tập, nghiên cứu và mọi khó khăn trong cuộc cuộc sống Tôi xin cảm ơn tất cả những người thân trong gia đình đã luôn ủng hộ, chia sẻ những khó khăn đối với tôi Do giới hạn kiến thức và khả năng lý luận của bản thân còn nhiều thiếu sót và hạn chế, kinh mong sự chỉ dẫn và đóng góp của các thầy, cô để bài luận văn của tôi được hoàn thiện hơn Tôi xin chân thành cảm ơn VONGPRATHOUM Phouthasone ii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii MỤC LỤC iii DANH SÁCH HÌNH VẼ .v DANH MỤC CÁC TỪ VIẾT TẮT vii MỞ ĐẦU 1 CHƯƠNG 1 : CƠ SỞ LÝ THUYẾT .4 1.1 Bài toán tối ưu tổ hợp 4 1.2 Phân loại các bài toán tối ưu tổ hợp .5 1.2.1 Quy hoạch tuyến tính 6 1.2.2 Quy hoạch tham số 7 1.2.3 Quy hoạch phi tuyến 8 1.2.4 Quy hoạch rời rạc .9 1.2.5 Quy hoạch đa mục tiêu 9 1.3 Tổng quan về mạng xã hội 11 1.3.1 Đặc điểm của mạng xã hội .13 1.3.2 Những lợi ích của mạng xã hội 14 1.3.3 Những tác hại của mạng xã hội 16 1.4 Các mô hình phát tán (lan truyền) thông tin trên mạng xã hội 18 1.5 Kết luận chương 19 CHƯƠNG 2 : MỘT SỐ PHƯƠNG PHÁP GIẢI BÀI TOÁN TỐI ƯU TỔ HỢP 20 2.1 Thuật toán xấp xỉ 20 2.1.1 Mô tả thuật toán 20 2.1.2 Khái niệm phủ đỉnh 22 2.1.3 Bài toán tập phủ và các phương pháp giải .22 2.2 Phương pháp Monte-Carlo 25 2.2.1 Bài toán tìm giá trị cực đại .25 2.2.2 Bài toán ước lượng kỳ vọng của một biến ngẫu nhiên 26 2.2.3 Thuật toán heuristic cấu trúc 28 2.2.4 Thuật toán Metaheuristic 28 2.3 Kết luận chương 29 CHƯƠNG 3 : MỘT SỐ BÀI TOÁN LAN TRUYỀN THÔNG TIN TRÊN MẠNG XÃ HỘI 31 iii 3.1 Bài toán tối ưu hóa ảnh hưởng 31 3.1.2 Các thuật toán cho bài toán tối đa ảnh hưởng (IM) 33 3.1.3 Một số biến thể của bài toán tối đa ảnh hưởng 38 3.2 Bài toán ngăn chặn ảnh hưởng (IB) 39 3.2.1 Loại bỏ tập người dùng và liên kết 40 3.2.2 Tẩy nhiễm thông tin 41 3.3 Một số mô hình phát tán thông tin trên MXH 42 3.3.1 Mô hình bậc độc lập (Indepedence Cascade : IC) .42 3.3.2 Mô hình ngưỡng tuyến tính (Linear Threshold : LT) 45 3.3.3 Thử nghiệm mô hình lan truyền ngưỡng tuyến tính LT 47 3.4 Thuật toán SIMPATH trên mô hình ngưỡng tuyến tính 50 3.4.1 Quá trình thực hiện thuật toán SIMPATH .51 3.4.2 Kết quả thử nghiệm [14] 57 3.5 Kết luận chương 61 KẾT LUẬN 63 TÀI LIỆU THAM KHẢO .65 iv DANH SÁCH HÌNH VẼ Hình 1.1: Một mô hình đồ thị của mạng xã hội 12 Hình 2.1: Một số thí dụ về phủ đỉnh 22 Hình 3.1: Mô tả bài toán 31 Hình 3.2: Ví dụ quá trình lan truyền thông tin trên mô hình IC 44 Hình 3.3: Ví dụ quá trình lan truyền thông tiin trên mô hình LT 46 Hình 3.4: Ma trận kề của mạng đồ thị 47 Hình 3.5: Thủ tục chính của chương trình 48 Hình 3.6: Chương trình ảnh hưởng của việc lan truyền thông tin trên MXH dựa vào mô hình LT 49 Hình 3.7: Kết quả các đỉnh đã được kích hoạt 49 Hình 3.8: Mô hình lan truyền thông tin từ hai đỉnh hạt giống ban đầu 50 Hình 3.9: Ảnh hưởng của Tối ưu hóa lớp phủ đỉnh (Vertex Cover Optimization) trên thời gian chạy của lần lặp đầu tiên của SIMPATH (logarithmic scale) 59 Hình 3.10: Kích thước của Vertex Covers cho bốn tập dữ liệu (logarithmic scale) 60 v DANH SÁCH BẢNG Bảng 3.1: Thống kê của dữ liệu 58 Bảng 3.2: Hiệu quả của thuật toán SIMPATH 59 Bảng 3.3: Ngưỡng η |𝑺|=50 61 vi DANH MỤC CÁC TỪ VIẾT TẮT Từ viết tắt Tiếng Anh Tiếng Việt BCIM Budgeted Competitive Bài toán tối đa ảnh hưởng cạnh Influence tranh với ngân sách và thời gian CIM Maximization problem giới hạn Competitive Influence Bài toán tối đa ảnh hưởng cạnh IC Maximization problem tranh IM Independence Cascade LT Influence Maximization Mô hình bậc độc lập MXH Linear Threshold Cực đại ảnh hưởng OPT Social Network Mô hình nghưỡng tuyến tính QHD Optimal Solution Mạng xã hội QHDMT Dynamic Programming Lời giải tối ưu QHPT Multi - purpose Programming Quy hoạch động QHTS Non Linear programming Quy hoạch đa mục tiêu QHTT Parameter Programming Quy hoạch phi tuyến TTSL Linear Programming Quy hoạch tham số TUTH Wrong information Quy hoạch tuyến tính Combinatorial Optimization Thông tin sai lệch Tối ưu tổ hợp Bảng giải thích ký hiệu 𝑏𝑢,𝑣 Ảnh hưởng đến trọng lượng trên cạnh (𝑢, 𝑣) 𝛶𝑆,𝑣 Xác suất 𝑣 kích hoạt nếu 𝑆𝑆 là tập hạt ban đầu Mức độ lan truyền ảnh hưởng dự kiến đạt được bởi tập σ(S) hạt giống 𝑆𝑆 Tập những hàng xóm - trong của 𝑣 Nin (v) Tập những hàng xóm - ngoài của 𝑣 Nout (v) Đường đi đơn giản từ 𝑣1 đến 𝑣𝑚 P = (v1 , , vm Tập của tất cả các đường đi đơn giản từ nút 𝑢 đến nút P(u, v) Ngưỡng cắt tỉa 𝜂 Giá trị nhìn trước ℓ vii MỞ ĐẦU Tối ưu tổ hợp là lớp các bài toán thường gặp trong đời sống cũng như trong các hệ thống thông tin và là một trong những đối tượng nghiên cứu chính của Khoa học máy tính Chẳng hạn như: tìm đường đi ngắn nhất nối hai điểm trên một đồ thị đã cho, lập kế hoạch phân phối nguồn hàng tới nơi tiêu thụ với chi phí cực tiểu, lập thời khóa biểu cho giáo viên và học sinh thuận lợi nhất, định tuyến cho các gói dữ liệu trong Internet hay các bài toán trong lĩnh vực tin sinh học v.v Đây là bài toán có nhiều ứng dụng trong thực tiễn và lý thuyết tổ hợp đã đóng góp một phần đáng kể trong việc xây dựng những thuật toán hữu hiệu Trong thời đại bùng nổ thông tin hiện nay, mỗi người đều có thể tiếp nhận một lượng thông tin rất lớn, có thể trao đổi thông tin với nhau một cách nhanh chóng bất chấp khoảng cách về địa lý và thời gian Trong bối cảnh đó, các chủ đề nghiên cứu về bài toán tối ưu tổ hợp trên các mô hình lan truyền thông tin với nhu cầu của người dùng mạng xã hội như: sự tương tác thông tin, cập nhật thông tin nhanh chóng, thời gian lan truyền tin ngắn,…dẫn tới nhóm các bài toán lan truyền thông tin (information diffusion problem) trên các mạng xã hội được xây dựng dưới dạng các bài toán tối ưu tổ hợp Việc nghiên cứu các bài toán này và ứng dụng của nó là rất thiết thực Hơn nữa, với sự mở rộng qui mô các mạng xã hội (hàng tỷ người dùng) cần có những thuật toán hoặc cách tiếp cận hiệu quả cho các bài toán này để nâng cao tính thực tiễn của chúng Vì vậy, đề tài luận văn được lựa chọn là nghiên cứu về lớp các bài toán tối ưu tổ hợp và ứng dụng trên một số mô hình lan truyền thông tin với mục đích tối ưu hóa ảnh hưởng của đối tượng trên mạng xã hội để lan truyền thông tin một cách hiệu quả nhất Đây là một bài toán thời sự, có ý nghĩa và trong quá trình nghiên cứu bài toán này, các nhà khoa học đã tìm ra nhiều kết quả có ý nghĩa: 1