CHƯƠNG 1 CƠ SỞ LÝ THUYẾT
1.4 Mơ hình Ngưỡng tuyến tính đa chủ đề (Multiple Topics Linear Threshold
-– MT-LT)
-
- Mơ hình LT đã được sử dụng trong rãi trong các cơng bố quốc tế về các bài tốn trong lan truyền thông tin trên MXH [14, 20]. Tuy nhiên, mơ hình LT khơng thể áp dụng trực tiếp để giải quyết bài tốn lan truyền thơng tin đa chủ đề. Với mơ hình LT, một kịch bản thực tế hơn được nghiên cứu là giả định rằng có nhiều chủ đề hiện có đang được lan truyền. Các chủ đề có thể có các đặc điểm khác nhau, chẳng hạn như nội dung và sự lan truyền của chúng. Khi có nhiều chủ đề, ta cần xác định lại kết quả của mơ hình khi hai hoặc nhiều thơng tin chủ đề tiếp cận một người dùng cùng một lúc. Mơ hình LT khơng thể được áp dụng trực tiếp để giải quyết vấn đề lan truyền thơng tin đa chủ đề vì khó nắm bắt được các mối tương quan phức tạp giữa các chủ đề.
- Các nghiên cứu trước đó đã làm việc trên một kịch bản trong đó có nhiều hơn một chủ đề đang được phân tán. Khi nhiều chủ đề tồn tại, vấn đề tối đa hóa ảnh hưởng có thể khó nắm bắt vì chúng thậm chí khơng đơn điệu [21]. Khi một đỉnh có thể áp dụng nhiều lớp, nó thể hiện rằng hàm ảnh hưởng tổng thể đếm các đỉnh đã kích hoạt khơng cịn là mơ-đun nhỏ nữa. Vì vậy, cần giải
- này bằng cách phát triển một mơ hình chặn lan truyền thông tin sai lệch mới với nhiều chủ đề và xác định hàm ảnh hưởng tổng thể tính số lượt được kích hoạt thay vì các đỉnh được kích hoạt.
- Trên cơ sở mơ hình LT [3], mơ hình lan truyền thông tin MT-LT
(Multiple Topics Linear Threshold) được xây dựng bằng việc cập nhật các thông
số cần thiết để phù hợp với bài tốn lan truyền thơng tin đa chủ đề.
- Trong mơ hình MT-LT, một MXH được biểu diễn bằng đồ thị (((((((((((((((, �, �) trong đó tập đỉnh �, tập cạnh �, | ||||||||||||||| = �, | ||||||||||||||| = �; � ��(((((((((((((((), ���� ((((((((((((((() lần lượt là tập đỉnh vào và tập đỉnh ra của đỉnh �; mỗi cạnh xác định (((((((((((((((, �) ∈ được gán một trọng số �(�, �) ∈ [0,1] biểu diễn độ ảnh hưởng của đỉnh � đến đỉnh �, Nếu (((((((((((((((, �) ∉ thì , ((((((((((((((( �) = 0, được phân bố sao cho tổng trọng số các đỉnh � - đỉnh � thỏa mãn điều kiện:
-
- ∑ , ((((((((((((((( �) ≤ 1 - ∈∈∈∈∈∈∈∈∈∈∈∈∈∈∈��((((((((((((((()
- Giả sử có � chủ đề thơng tin sai lệch (VD: Chính trị, Văn hóa, Thể thao,
…) và tập các đỉnh phát tán thông tin sai lệch � = {{{{{{{{{{{{{{{ 1, �2, … , ��}, mỗi tập �� chứa các đỉnh phát tán thông tin chủ đề � (gọi tắt là đỉnh nguồn), trên thực tế thì người quản trị MXH luôn biết được đâu là nguồn phát tán thông tin sai lệch. Ta có tập các
- đỉnh nguồn phát tán
thông tin sai lệch trên � chủ đề là: � = ⋃� ��. -
- Mỗi đỉnh � ∈ � có thể khơng bị kích hoạt hoặc bị kích hoạt một hoặc nhiều lần bởi nhiều chủ đề. Nghĩa là đỉnh � có một hoặc nhiều trạng thái trong tập hợp
-� + 1 trạng thái sau: Q= {inactive, active_1, active_2,..., active_q} cho biết hành vi và hoạt động của �. Nếu đỉnh � có trạng thái inactive là � khơng bị kích hoạt bởi bất kỳ chủ đề thơng tin nào; Nếu đỉnh � có trạng thái active_i thì nó đã bị kích hoạt bởi chủ đề �. Nếu đỉnh � có trạng thái {active_1, active_2,...,
active_k} với 1 ≤ ≤ thì nó đã bị kích hoạt bởi � chủ đề. �= 1
- Trong thực tế, trọng số tác động giữa các đỉnh phụ thuộc vào các chủ đề. Ví dụ: chủ đề lan truyền về bệnh dịch có thể có tác động lớn hơn chủ đề về trị chơi, thể thao đối với người dùng. Do đó, một đỉnh � được gán với một vectơ
- ngưỡng kích hoạt �� = (((((((((((((( (1 , �2, … , �), trong đó �� ∈ [0,1]. �� đại diện cho
- � � � � �
- ngưỡng kích hoạt của đỉnh � trên chủ đề �. Hơn nữa, một đỉnh � cũng được gán - với một vectơ ((((((((((((((( = (� 1, 2, … , �), trong đó �� ∈ [0,1] đại diện cho độ ảnh
- � � � � �
- hưởng của người dùng � với đỉnh lân cận theo chủ đề �.
- Q trình lan truyền thơng tin theo mơ hình MT-LT diễn ra trên các bước rời rạc -� = 1, 2, … , �, với � ∈ �. Ta coi khoảng thời gian được phép như nhau cho mỗi bước lan truyền thơng tin. Đó là bởi vì tất cả các đỉnh lân cận của một đỉnh có thể khơng ảnh hưởng đến nó đồng thời, nhưng chỉ trong một khoảng thời gian nhất định. Thực tế cho thấy, mọi thông tin tác động của đỉnh lân cận không phải là cùng lúc, mà nằm trong một giới hạn thời gian nào đó. Lấy ��(((((((((((((((, �) là tập hợp
- các đỉnh được kích hoạt bởi �� tại thời điểm � trong đồ thị �. -
- Tại thời điểm � = 0, tất cả các đỉnh trong tập �� đều có trạng thái active -i
- -
- Hình 1.4.1. Mơ tả q trình lan truyền thơng tin trên mơ hình MT- LT với t = 0
- Tại thời điểm � ≥ 1, tất cả các đỉnh chịu ảnh hưởng bởi tập �� trong bước thời gian � − 1 vẫn giữ nguyên trạng thái kích hoạt. Một đỉnh � đang không chịu
� �
ảnh hưởng bởi �� sẽ bị kích hoạt active-i nếu thỏa mãn: - ∑ �( , � �). �� ≥ �� - �∈� - - � � - ( ) �∩� �−1 ) (�,� - � � �
- -
- Hình 1.4.2. Mơ tả q trình lan truyền thơng tin trên mơ hình MT- LT với t = 1
- Quá trình lan truyền kết thúc khi sau mỗi bước khơng cịn một đỉnh nào được kích hoạt thêm.
- -
- Hình 1.4.3. Mơ tả q trình lan truyền thơng tin trên mơ hình MT- LT với t = 2
- Khi �� = 1, � = 1, … , �, với mọi � ∈ �. Mơ hình MT-LT trở thành mơ hình LT. Gọi ��(�, �) là tổng số đỉnh được kích hoạt theo chủ đề � sau khi
quá trình lan truyền kết thúc. ��(�, �) được tính bằng tổng của ��,((((((((((((((( �) qua tất cả các ��
� �
- bước. Tổng số lượt các đỉnh bị kích hoạt theo tất cả các chủ đề sau quá trình lan truyền kết thúc, được ký hiệu là �(, � ), ta có:
- � - �(� , �) = ∑ ��, ((((((((((((((( �) - �= 1 - - (1)
- Trong cài đặt này, một đỉnh có thể được kích hoạt nhiều lần theo nhiều chủ đề chứ không chỉ một lần như trong các nghiên cứu trước. Bằng cách thiết lập này, ta có thể chứng minh các thuộc tính đơn điệu và mơ đun của hàm ảnh hưởng tổng thể. Các thuộc tính này rất quan trọng vì chúng có thể giúp đưa ra các thuật tốn xấp xỉ hiệu quả.