BÀI TOÁN PHÁT HIỆN CỘNG ĐỒNG TRÊN ĐỒ THỊ MẠNG XÃ HỘI

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu độ đo trung gian và thuật toán phát hiện cộng đồng trên mạng xã hội (Trang 34 - 35)

Bài toán: Phát hiện cộng đồng trong mạng xã hội và đưa ra danh sách những

đỉnh mạng thuộc từng cộng đồng đó.

Đầu vào: Đồ thị mạng xã hội G = (V, E) gồm tập V có các đỉnh: v1, v2,…, vn

và tập E các liên kết E = {(vi,vj)}.

Đầu ra: Tập các cộng đồng Ci và tập hợp các đỉnh thuộc các cộng đồng đó:

{C1, C2,..., Ck}.

Mục tiêu của bài toán là từ các mạng xã hội cho trước, phát hiện được các cấu trúc cộng đồng nằm trong đó và tìm hiểu về mối liên hệ bên trong các cộng đồng cũng như giữa các cộng đồng với nhau, mối liên hệ đó có ảnh hưởng thế nào đến cấu trúc của toàn mạng xã hội. Một tập hợp các đỉnh trên đồ thị được coi là một cộng đồng nếu mật độ cạnh bên trong nó cao hơn so với mật độ của các cạnh giữa đỉnh của nó và những cạnh bên ngoài.

Phát hiện cộng đồng mạng xã hội là một trong những lĩnh vực nghiên cứu quan trọng nhất trong bài toán phân tích mạng xã hội. Phát hiện cộng đồng mạng xã hội có tầm quan trọng lớn trong xã hội học, sinh học và khoa học máy tính. Phát hiện cộng đồng mạng xã hội gặp thách thức lớn đặc biệt sự phức tạp

tính toán bị chi phối bởi hai yếu tố chính. Yếu tố đầu tiên phải kể đến là kích thước của mạng xã hội rất lớn. Yếu tố thứ hai liên quan đến bản chất của mạng xã hội là động, có cấu trúc phát triển tăng dần theo thời gian. Chính những thách thức này đã thu hút được một số lượng lớn các nhà nghiên cứu.

Phát hiện cộng đồng nhằm mục đích nhóm các đỉnh liên kết mạnh theo các mối quan hệ giữa chúng để tạo thành các đồ thị con từ đồ thị ban đầu. Các mạng xã hội thường được mô hình hoá dưới dạng đồ thị nên việc phát hiện cộng đồng trên mạng xã hội dựa trên cơ sở lý thuyết đồ thị còn được gọi là bài toán phân vùng đồ thị hay phân cụm đồ thị.

Trong nhiều thập kỷ qua, số các giải pháp phát hiện cấu trúc cộng đồng trên mạng xã hội đã được nghiên cứu là rất nhiều và thường xuyên [1], [2], [3], [20], [25].

Về cơ bản các thuật toán này được chia thành bốn nhóm thuật toán chính và dưới đây sẽ trình bày các thuật toán chính của các phương pháp này.

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu độ đo trung gian và thuật toán phát hiện cộng đồng trên mạng xã hội (Trang 34 - 35)

Tải bản đầy đủ (PDF)

(66 trang)