và giả sử các đỉnh được chia vào trong các cụm với đỉnh v sẽ thuộc cụm cv. Theo đó, số phép phân chia các cạnh vào trong các cụm, tức là kết nối các đỉnh nằm cùng cụm là: ∑𝑣𝑤𝐴𝑣𝑤𝛿(𝑐𝑣, 𝑐𝑤) ∑𝑣𝑤𝐴𝑣𝑤 = 1 2𝑚∑ 𝐴𝑣𝑤𝛿(𝑐𝑣, 𝑐𝑤) 𝑣𝑤 (2.4)
với hàm 𝛿 nhận giá trị như sau: 𝛿(𝑖, 𝑗) = 1 nếu i=j và 𝛿(𝑖, 𝑗) =0 trong trường hợp còn lại.
m = 1
2∑𝑣𝑤𝐴𝑣𝑤 là số cạnh của đồ thị. (2.5) Bậc kv của đỉnh v được đỉnh nghĩa là số cạnh gắn với v:
kv = ∑ 𝐴𝑤 𝑣𝑤 (2.6)
Nếu các kết nối giữa các đỉnh được tạo ra ngẫu nhiên thì xác suất tồn tại một cạnh kết nối hai đỉnh v và w liên quan đến bậc của đỉnh sẽ là: kvkw/2m.
Khi đó giá trị modularity Q được tính như sau:
𝑄 = 1
2𝑚∑ [𝐴𝑣𝑤−𝑘𝑣𝑘𝑤 2𝑚 ]
𝑣𝑤
𝛿(𝑐𝑣, 𝑐𝑤) (2.7)
Một giá trị Q cao tức là thể hiện một phép phân hoạch cụm tốt. Do đó nhiệm vụ của bài toán là đi tìm giá trị Q cao nhất có thể. Tuy nhiên, với một không gian tìm kiếm vô cùng lớn (độ phức tạp NP-khó) khiến cho việc tìm phương án tối ưu của Q là không khả thi.
2.3.2. Độ đo trung gian
• Khái niệm:
Độ đo trung gian của một đỉnh được tính bằng tổng số các đường đi ngắn nhất ngang qua đỉnh đang xét chia cho tổng số các đường đi ngắn nhất của toàn mạng. Nói cách khác, độ đo trung gian dùng để xác định vị trí của tác nhân trong mạng mà nó có khả năng kết nối đến những cặp tác nhân hay những nhóm tác nhân khác.
• Công thức tính:
- Cho đồ thị G = (V, E) có n đỉnh.
- Công thức tính Độ đo trung gian của đỉnh v :
(2.8) Trong đó:
: Tổng số đường đi ngắn nhất từ đỉnh s đến t và có qua đỉnh v (s ≠ v ≠ t). : Tổng số các đường đi ngắn nhất từ đỉnh s đến t (s ≠ v ≠ t).
-Công thức tính độ đo trung gian của đỉnh v theo dạng chuẩn:
𝐶𝐵′(𝑣) = 𝜎𝐵(𝑣)
(𝑛−1)(𝑛− 2) / 2 (2.9)
• Miền giá trị:
Độ đo này có miền giá trị nằm trong khoảng [0..1], node có giá trị càng lớn thì node đó sẽ có sự ảnh hưởng tới việc phân bổ cấu trúc của các cụm hay nhóm trong mạng càng lớn. Một tác nhân có vai trò trung tâm càng lớn trong mạng thì sẽ có tầm ảnh hưởng lớn trong việc kiểm soát mọi thông tin trao đổi giữa các tác nhân khác trong mạng.