STT Chỉ số G GT GN 1 Số cụm 130 136 131 2 Kích thước lớn nhất 1265 1265 1265 3 Kích thước nhỏ nhất 49 28 30 4 Kích thước trung bình 237.022901 229 235.022901 5 Chỉ số mô đun 0.9517116 0.95175572 0.9514205
62 Trong phần này, tơi sử dụng năm chỉ số chính để so sánh phân vùng
của ba mạng đầu vào. Thứ nhất là số cụm đầu ra của mỗi mạng G, GT, GN.
Ta thấy, mạng GT là mạng đưa ra số cụm đầu ra lớn nhất; mạng GN là mạng
đưa ra chỉ số cụm lớn thứ hai và gần xấp xỉ số cụm mạng G đưa ra. Điều này đúng như phần trên ta đã phân tích.
Thứ hai là kích thước của cộng đồng lớn nhất được phát hiện. Cả ba mạng đều đưa ra cộng đồng có kích thước là 1265 là cộng đồng lớn nhất. Thực tế, so sánh trực tiếp trên kết quả đầu ra, tôi nhận thấy cộng đồng đưa ra bởi ba mạng này là giống nhau.
Thứ ba kích thước của cộng đồng bé nhất được phát hiện. Mạng GT có
xu hướng chia nhỏ cộng đồng hơn là hai mạng kia. Qua ba chỉ số đầu tiên, ta thấy mạng G và GN kết quả đưa ra gần giống nhau hơn mạng GT. Điều này
có thể giải thích ngun do dữ liệu đầu vào có số lượng lớn các nút đều có trọng số về tần suất là 1.
Thứ tư là số lượng nút trung bình của mỗi cụm. Mạng G có giá trị
trung bình lớn nhất, sau đó tới mạng GN và cuối cùng là mạng GT.
Thứ năm tôi so sánh đến chỉ số modularity được tối ưu với từng mạng. Những chỉ số này đều được chạy lại 10 lần và tối ưu trên mơ hình. Modularity có giá trị trong khoảng [-1;1]. Giá trị càng gần -1 tức điểm phân chia không thuộc về vùng dự kiến phân chia. Cịn điểm modularity có giá trị tiến tới 1 nghĩa là điểm phân chia khả năng cao thuộc về vùng phân chia. Giá trị modularity bằng 0 có nghĩa là điểm phân chia khơng khác gì khi ta phân cụm ngẫu nhiên. Ta thấy nhìn ba mơ hình mạng đều có giá trị modularity gần như nhau.
Qua bảng so sánh các chỉ số sau phân cụm của cả ba mơ hình mạng, ta thấy mạng GT là mạng có chỉ số modularity tốt và các chỉ số khác cũng tốt
hơn. Mạng G và GN có các chỉ số gần tương tự nhau. Điều này giải thích
rằng, trọng số tần suất trọng mạng này có thể chưa có nhiều ý nghĩa trong việc phát hiện cộng đồng mới. Trọng số về tổng số tiền giao dịch có vẻ có ý
63 nghĩa để phát hiện cộng đồng hơn. Thật vậy, trên hình mơ tả 30 (trái), ta thấy giá trị trọng số tần suất của đồ thị bằng 01 chiếm phần lớn. Do đó, đây có thể
là nhiễu trong việc phát hiện cộng đồng với mạng GT. Để tránh điều này,
trong tương lai, tơi định hướng xây dựng đồ thị trên tồn bộ dữ liệu lịch sử giao dịch của khách hàng. Khi đó, ta sẽ có cái nhìn tổng qt hơn về mối quan hệ giữa các khách hàng.
3.5. Phát hiện nút quan trọng
3.5.1. Phát hiện nút quan trọng trên toàn bộ mạng
Trong ngân hàng cũng như doanh nghiệp, việc phát hiện vai trò quan trọng của một nút có ý nghĩa rất lớn. Việc phát hiện này giúp doanh nghiệp có thể xác định khách hàng quan trọng trong mạng lưới. Từ đó ta có những chính sách ưu đãi hoặc chiến lược phù hợp.
Trong mơ hình mạng này, tơi xác định danh sách khách hàng quan trọng từ mạng qua những chỉ số thống kê cơ bản của mạng là bậc của nút. Chỉ số bậc sẽ cho thấy số lượng liên kết tới một nút. Hay nói cách khác là có bao nhiêu quan hệ với một khách hàng nhất định.
Bảng dưới đây thể hiện top những khách hàng có vai trị quan trọng trong mạng qua chỉ số bậc và bậc vào, bậc ra của mạng: