Mô hình và định nghĩa bài toán

Một phần của tài liệu Luận văn Thạc sĩ Nghiên cứu phương pháp ngăn chặn phát tán thông tin sai lệch đa chủ đề trên mạng xã hội (Trang 37 - 41)

3. Cấu trúc luận văn

2.2.1 Mô hình và định nghĩa bài toán

Mô hình LT là một trong số những mô hình được sử dụng rộng rãi trong nghiên cứu vấn đề lan truyền thông tin trên MXH. Trong mô hình LT, mọi đỉnh

28

đều đóng góp vào việc kích hoạt các đỉnhlân cận của chúng. Vì vậy, mô hình LT có thể được coi là mô hình trung tâm thu. Sự tác động của tập hợp các đỉnhđang hoạt động trong việc kích hoạt các đỉnh lân cận của chúng trong mô hình LT có thể được coi là hiệu ứng bầy đàn, rất gần với cơ chế phát tán tin đồn sai lệch trong đó quyết định có nhiều khả năng được đưa ra bằng cách bắt chước quyết định của người khác.

Trong bài báo của Dũng và các cộng sự [11], nghiên cứu nhắm vào việc chặn một tập hợp các đỉnh trong biểu đồ NS để giảm thiểu số lượt bị nhiễm cuối cùng. Mục tiêu tối ưu hóa tương tự này có thể được tìm thấy trong các công trình khác [20, 24, 26].

Một đỉnh bị chặn không thể bị lây nhiễm bởi bất kỳ đỉnh nào khác và nó cũng không thể lây nhiễm cho bất kỳ đỉnh nào khác. Để chặn một đỉnh 𝑣 trong một biểu đồ chỉ cần đặt trọng số cho tất cả các cạnh đến 𝑣 và các cạnh đi ra từ𝑣 về 0.

Định nghĩa bài toán

Cho một đồ thị G, chúng ta ký hiệu G A là đồ thị sau khi chặn một tập hợp các đỉnh A. Số lượt kích hoạt của tất cả các chủ đề sau khi chặn tập hợp các đỉnh Ađược cho bởi 𝒟(G A, S) = ∑𝑞𝑖=1𝒟𝑖(𝐺 ⊙ 𝐴, 𝑆). Mục tiêu ở đây là giảm thiểu 𝒟(G ⊙A, S). Điều này tương đương với việc tối đa hóa số lượng sau:

𝜎(G, S, A) = 𝒟(𝐺, 𝑆)−𝒟(G ⊙ A, S) (2)

Giả sử rằng việc chặn một đỉnh 𝑣 chi phí 𝑐(𝑢) và tổng chi phí không được vượt quá giới hạn ngân sách B . Vấn đề MMTB bây giờ có thể được xây dựng như sau:

Định nghĩa 1:

(MMTB) Cho một mạng xã hội được biểu thị bằng biểu đồ có trọng số G (V, E, 𝑤), một nguồn thông tin sai lệch với q chủ đề được đưa ra bởi S

29

tập hợp các đỉnh A để chặn sao cho số lượng σ(G , S, A) được tối đa hóa trong giới hạn ngân sách B, 𝑐(𝐴) = ∑𝑢∈𝐴𝑐(𝑢) ≤ 𝐵.

Có thể chứng minh rằng MMTB là NP-Khó theo mô hình MT-LT.

Định lý 1:

- MMTB là một bài toán NP-Khó. Chứng minh:

Để chứng minh MMTB là một bài toán NP-Khó, tiến hành xây dựng một bài toán đạo hàm từ bài toán Knapsack nổi tiếng cũng là bài toán NP- đầy đủ.

Bài toán Knapsack: Cho một tập hợp 𝑸 gồm 𝑛 phần tử, mỗi phần tử 𝑖có trọng số 𝑤𝑖 và một giá trị 𝑐𝑖 (𝑐𝑖 và 𝑤𝑖 là số nguyên) và hai số nguyên dương: 𝑊, 𝐶 . Vấn đề là tìm một vectơ 𝑥 = (𝑥1, 𝑥2, … , 𝑥𝑛) để thỏa mãn (𝑄) = ∑ 𝑥𝑛𝑖=1 𝑖𝑐𝑖 ≥ 𝐶 và ∑𝑛𝑖=1𝑥𝑖𝑤𝑖 ≤ 𝑊.

Lấy 𝐼1 = (𝑄, 𝑊) là một trường hợp của Knapsack và 𝐼2 = (𝐺, 𝑆, 𝐵) là một ví dụ của vấn đềMMTB trong đó 𝑆 là tập hợp các đỉnh nguồn thông tin sai lệch, 𝐵 là giới hạn ngân sách, tiến hành xây dựng cắt giảm từ 𝐼1 đến 𝐼2 như trong Hình 2.2.1.1.

Giảm: Để xây dựng sự giảm, tạo ra một đồ thị 𝐺( 𝑉, 𝐸, 𝑤) đáp ứng mô hình MT-LT như sau. Đưa ra tập 𝑆 với một đỉnh duy nhất 𝑆 = {𝑠} . Cho mỗi 𝐶𝑖 (giá trị của phần tử thứ 𝑖) tạo ra một đường dẫn 𝐶𝑖 + 1 đỉnh: 𝑠 → 𝑢𝑖,1 → 𝑢𝑖,2… → 𝑢𝑖,𝐶𝑖 với trọng số của mỗi cạnh thuộc đường dẫn là 1. Chi phí của các đỉnh được đặt như sau: 𝑐(𝑢𝑖,1) = 𝑤𝑖 = 1, 𝑐(𝑢𝑖,𝑗>1) = 𝐵 + 1 . Số lượng chủ đề là 𝑞 = 1 và ngân sách 𝐵 = 𝑊 . Đặt 𝐵 = 𝑊 và 𝐾 = 𝐶 . Chứng minh rằng 𝐼1 có giải pháp 𝑥 = (𝑥1, 𝑥2, … , 𝑥𝑛) khi và chỉ khi 𝐼2 có giải pháp tương ứng 𝐴 = {𝑢𝑖,1|𝑥𝑖=1}, nhờ vậy mà 𝜎(𝐺, 𝑆, 𝐴) ≥ 𝐾 và ngược lại.

30

𝐴 = {𝑢𝑖,1|𝑥𝑖 = 1}. Ta có 𝑐(𝐴) = ∑𝑖|𝑥𝑖𝑥𝑖𝑤𝑖 = ∑𝑛𝑖=1𝑤𝑖 ≤ 𝑊 = 𝐵. Theo mô hình MT-LT, khi chặn đỉnh𝑢𝑖,1 tất cả các đỉnh chuỗi con trên đường dẫn 𝑢𝑖,2 … 𝑢𝑖,𝑐𝑖 bị ảnh hưởng. Vì vậy, 𝜎(𝐺, 𝑆, 𝐴) = ∑𝑖|𝑥𝑖=1𝑥𝑖𝑐𝑖 = ∑𝑛𝑖=1𝑐𝑖 ≥ 𝐶 = 𝐾, sau đó 𝐴 là kết quả của 𝐼2.

( ← ) Ngược lại, nếu 𝐴 là một giải pháp của 𝐼2 sau đó 𝐴 không thể chứa đỉnh𝑢𝑖,𝑗≥2, bởi vì chi phí chặn các đỉnh sẽ vượt quá mức 𝐵 . Trên 𝐼1 chọn một vectơ 𝑥 = {𝑥1, 𝑥2, … , 𝑥𝑛}với điều kiện: 𝑥𝑖 = 1 nếu như 𝑢𝑖,1 ∈ 𝐴 hoặc 𝑥𝑖 = 0 , nếu 𝑢𝑖,1 ∉ 𝐴. Chúng ta có 𝑐(𝐴) = ∑𝑖|𝑢𝑖,1∈𝐴𝑤𝑖 = ∑𝑛𝑖=1𝑥𝑖 𝑤𝑖 ≤ 𝐵 và 𝜎(𝐺 , 𝑆, 𝐴) = ∑𝑖|𝑢𝑖,1∈𝐴𝑐𝑖 = ∑𝑛𝑖=1𝑥𝑖 𝑐𝑖 ≥ 𝐾 = 𝐶, Điều đó có nghĩa là 𝑥 là kết quả của 𝐼1 . Nói cách khác, nếu có thể tìm ra lời giải tối ưu của bài toán MMTB thì có thể tìm thấy lời giải tối ưu của bài toán Knapsack. Vì vậy, vấnđề MMTB là NP-Khó.

Hình 2.2.1.1. Xây dựng mô hình suy giảm từ Knapsack thành MMTB

Bây giờ tiến hành chứng minh rằng bài toán tính hàm mục tiêu trong công thức 𝜎(G, S, A) = 𝒟(𝐺, 𝑆)−𝒟(G ⊙ A, S) là # P-Khó.

31

Định lý 2:

Bài toán tính hàm 𝜎(⋅) là # P-Khó trong MT-LT ngay cả khi tập 𝐴 chỉ có một đỉnh.

Chứng minh:

Chứng minh rằng phép tính của hàm mục tiêu là # P-Khó ngay cả đối với trường hợp tập 𝑆 chỉ có một đỉnh. Lấy 𝑃(𝐺, 𝑠) là tập hợp của tất cả các đường dẫn đơn giản của 𝐺 bắt đầu từ 𝑠 (các đường dẫn đơn giản là các đường dẫn chỉ truy cập vào mỗi đỉnhmột lần), 𝑃(𝐺 ⊙ 𝐴 , 𝑠) là tập hợp của tất cả các con đường đơn giản của 𝐺 bắt đầu từ 𝑠 khi 𝐴 bị chặn. Ta có 𝜎(𝐺, 𝑆, 𝐴) = 𝐷(𝐺, 𝑆) − 𝐷(𝐺 ⊙ 𝐴, 𝑆) chính xác là số đỉnh trong 𝑃(𝐺, 𝑠) trừđi sốđỉnh trong 𝑃(𝐺 ⊙ 𝐴 , 𝑠). Nếu có thể tính toán số lượng đỉnh trong 𝑃(𝐺, 𝑠)thì cũng có thể đếm số lượng đường dẫn đơn giản trong 𝑃(𝐺, 𝑠). Đếm tất cả các đường dẫn đơn giản như vậy chính xác là bài toán đường dẫn s-t được chứng minh là #P-Khó của Valiant [28]. Do đó, Bài toán tính hàm 𝜎(⋅) là # P-Khó trong MT-LT ngay cả khi tập 𝐴 chỉ có một đỉnh.

Một phần của tài liệu Luận văn Thạc sĩ Nghiên cứu phương pháp ngăn chặn phát tán thông tin sai lệch đa chủ đề trên mạng xã hội (Trang 37 - 41)

Tải bản đầy đủ (PDF)

(69 trang)