Mơ hình ngưỡng tuyến tính (Linear Threshold – LT)

Một phần của tài liệu Nghiên cứu phương pháp ngăn chặn phát tán thông tin sai lệch đa chủ đề trên mạng xã hội. (Trang 39 - 43)

CHƯƠNG 1 CƠ SỞ LÝ THUYẾT

1.3 Mơ hình ngưỡng tuyến tính (Linear Threshold – LT)

Bản chất của lan truyền thông tin sai lệch cũng chính là lan truyền thơng tin. Các mơ hình lan truyền thơng tin được sử dụng rộng rãi có thể sử dụng để mơ hình hóa q trình lan truyền thơng tin nói chung và thơng tin sai lệch nói riêng.

Để có thể đưa ra giải pháp hiệu quả trong việc ngăn chặn sự lan truyền của thông tin sai lệch, trước tiên chúng ta phải hiểu được cơ chế thông tin sai lệch lan truyền trên MXH.

Thông tin được phát tán trên các MXH từ người dùng này đến người dùng khác thông qua nhiều hoạt động đăng bài, chia sẻ, bình luận. Kempe và các cộng sự [3] là người đầu tiên đưa ra các mơ hình phát tán thơng tin, trong đó đã đưa ra hai mơ hình phát tán thơng tin cơ bản là Mơ hình tầng độc lập (Independent Cascade – IC) và Mơ hình ngưỡng tuyến tính (Linear Threshold – LT).

Đối với mơ hình Ngưỡng tuyến tính LT, một MXH được biểu diễn bằng đồ thị �(, , ) trong đó có tập đỉnh �, tập cạnh �, | |� = , |||||||||||||||| = �;

� �((�),

���((((((((((((((() lần lượt là tập đỉnh vào và tập đỉnh ra của đỉnh �.

Trong mơ hình này, mỗi cạnh được xác định ( (� � �, ) ∈ được gán một trọng số �(, � ) ∈ [0,1] biểu diễn độ ảnh hưởng của đỉnh � đến đỉnh �, nếu �(�, �) ∉ thì �(, � ) = 0, trọng số được phân bố sao cho tổng tất trọng số các đỉnh � đến đỉnh � thỏa mãn điều kiện:

∑ (((((((((((((((, �) ≤ 1 ∈ ∈ ∈ ∈ ∈ ∈ ∈ ∈ ∈ ∈ ∈ ∈ ∈ ∈ ∈ ��((((((((((((((()

Giả sử �0 ⊆ , là tập được cho là phát tán thơng tin sai lệch (cịn gọi là tập

Mỗi đỉnh ∈ � có ngưỡng kích hoạt �� ∈ [0,1], nếu �� lớn thì cần nhiều đỉnh lân cận để có thể kích hoạt �, nếu �� bé thì đỉnh � dễ bị kích hoạt bởi các đỉnh lân cận. Do có rất nhiều yếu tố ảnh hưởng dẫn đến việc thiếu thông xác định ngưỡng kích hoạt của người dùng (đỉnh), nên �� được xác định ngẫu nhiên, độc lập và phân bố đều trên đoạn [0,1]. Trong thực tế, các giá trị ngưỡng có thể được học thơng qua các kỹ thuật khai thác dữ liệu dựa trên các hành động của người dùng trong quá khứ. Do đó, các giá trị ngưỡng kích hoạt có thể được xem như một đầu vào cho mơ hình thay vì giả định là một hàm ngưỡng ngẫu nhiên. Lấy ��(((((((((((((((, �) là một tập các đỉnh được kích hoạt bởi S tại thời điểm t trong đồ thị , ((((((((((((((( �, �) .

Mơ hình LT hoạt động theo các bước thời gian rời rạc như sau:

- Tại thời điểm � = 0, tập đỉnh ở trạng thái kích hoạt chính là tập nguồn phát tán thông tin ban đầu �0 (tập hạt giống).

Hình 1.3.1. Mơ tả q trình lan truyền thơng tin trên mơ hình với t = 0

- Tại thời điểm � ≥ 1, Tất cả các đỉnh được kích hoạt bởi � trong bước thời gian � − 1 vẫn đang hoạt động. Mỗi đỉnh � ở trạng thái khơng kích hoạt bởi

-� sẽ bị kích hoạt nếu tổng ảnh hưởng của các đỉnh lân cận kích hoạt tới nó vượt ngưỡng �� , nghĩa là: - ∑ , ((((((((((((((( �) ≥ �� - ∈∈∈∈∈∈∈∈∈∈∈∈∈∈∈ ��( ∩(∩(∩(∩(∩(∩(∩(∩(∩(∩(∩(∩(∩(∩(∩) �−1(,(,(,(,(,(,(,(,(,(,(,(,(,(,(,) - - - - - -

- Hình 1.3.2. Mơ tả q trình lan truyền thơng tin trên mơ hình LT với t = 1

- Nếu một đỉnh được kích hoạt nó sẽ giữ trạng thái kích hoạt trong những bước tiếp theo. Quá trình lan truyền sẽ kết thúc khi khơng có đỉnh nào được kích hoạt ở những bước tiếp theo.

- -

- Hình 1.3.3. Mơ tả q trình lan truyền thơng tin trên mơ hình LT với t = 2

Một phần của tài liệu Nghiên cứu phương pháp ngăn chặn phát tán thông tin sai lệch đa chủ đề trên mạng xã hội. (Trang 39 - 43)

Tải bản đầy đủ (DOCX)

(105 trang)
w