Vấn đề quan trọng trong phân tích mạng xã hội là xác định nhóm. Nhóm là tập rời nhau của các cá nhân được liên kết với nhau bằng một số loại liên quan hoặc tương tác. Mỗi thành viên của nhóm có thể có vị trí khác nhau: vị trí trung tâm, ngoại vi hoặc một nơi nào đó giữa chúng. Một nhóm có thể có một hoặc nhiều phần tử chính yếu.
Trong phân tích mạng xã hội, Centrality thường được sử dụng để mô tả vị trí “quan trọng” cả các tác nhân (actor) trong mạng. Mỗi độ đo centrality sẽ cho ta thấy ý nghĩa “quan trọng” khác nhau của từng thực thể trong mạng xã hội. Một trong các ứng dụng phổ biến về độ đo centrality là xác định tập key player trong mạng xã hội.
Keyplayer là các phần tử (thực thể) trong mạng được xem là quan trọng, đó là những node có khả năng điều khiển luồng thông tin, là những node nổi bật nhất và có tầm ảnh hưởng đáng kể đến các node khác.
Định nghĩa chính thức của bài toán tìm phần tử chính yếu Key player như sau:
Cho trước mạng xã hội (đồ thị vô hướng), tìm tập K-node (kp-set) sao cho:
Nếu xóa tập này đi sẽ gây ra việc phá vỡ liên kết lớn nhất trong mạng, nghĩa là tìm những node mà khi xóa các node đó đi thì mạng sẽ tách ra thành nhiều mạng con nhất hoặc tạo ra khoảng cách giữa các node còn lại trong mạng xa nhất.
Tập này được gọi là KPP-1 hay KPP-Neg (Key Player Problem/Negative).
Có nhiều kết nối đến tất cả các phần tử trong mạng, nghĩa là tìm những node có thể kết nối đến các node còn lại nhiều nhất thông qua liên kết trực tiếp hoặc qua đường đi ngắn nhất.
Tập này được gọi là KPP-2 hay KPP-Pos (Key Player Problem/Positive).
Ví dụ: Cho mạng xã hội được mô tả sau:
Vấn đề ở đây là hãy chỉ ra thực thể nào sẽ đóng vai trò Key player trong mạng:
Cách tiếp cận để tìm ra phần tử/ nhóm phần tử chính yếu (key player) là dựa vào các độ đo Centrality đã được trình bày phần trên trong đó:
o Ta xét Betweenness Centrality: phần tử nào có giá trị Betweenness Centrality cao nhất sẽ chịu trách nhiệm về việc kết nối nhiều cặp node khác trong mạng thông qua đường đi tốt nhất. Nếu xóa node có betweenness cao nhất sẽ gây nên việc nhiều cặp node trong mạng sẽ cách xa nhau hơn (có thể bị ngắt kết nối hoặc không). Do đó, betweenness đƣợc chọn để t m KPP-1.
o Xét degree centrality và closeness centrality. Một node có degree cao có nhiều khả năng ảnh hưởng trực tiếp đến các node khác. Một node có closeness tốt (theo công thức I là số lớn nhất, theo công thức II là số nhỏ nhất ) sẽ có thể ảnh hưởng trực tiếp hoặc gián tiếp đến nhiều node khác. Do đó, degree centrality và closeness centrality đƣợc chọn để t m KPP-2.
o Sau khi tính toán, các giá trị Degree Centrality, Betweenness Centrality, Closeness Centrality như sau:
Dựa vào các giá trị Centrality đã tìm được, dễ dàng nhận thấy noke v4 có các giá trị Centrality cao nhất. Như vậy, node v4 sẽ là key player:
Tất nhiên, những định nghĩa này giới thiệu lại những gì là có nghĩa là chính xác bởi "sự gắn kết ít nhất có thể" và "kết nối tối đa". Một phần của quá trình giải quyết những vấn đề này được cung cấp định nghĩa của các khái niệm này dẫn đến các giải pháp khả thi và kết quả hữu ích. Tuy nhiên, có thể nói lúc đầu KPP-NEG liên quan đến việc phân mảnh một mạng lưới thành các thành phần, làm cho độ dài đường dẫn giữa các nút quá lớn để được thực tế bị ngắt kết nối. Ngược lại, KPP-Pos liên quan đến việc tìm kiếm các nút có thể đạt đến các nút còn lại như nhiều càng tốt thông qua các liên kết trực tiếp hoặc đường đi ngắn nhất. Tuy nhiên, mục tiêu tiếp cận của đề tài là xây dựng các giải pháp chung cho từng vấn đề như vậy mà họ có thể được sử dụng cho dù sự gắn kết hoặc nối kết được xác định. Nội dung chi tiết cho việc giải quyết các vấn đề sẽ được trình bài trong chương 3.
CHƢƠNG 3: BÀI TOÁN TÌM PHẨN TỬ CHÍNH YẾU TRONG MXH