STT Chỉ số G
1 Đường kính mạng 38
2 Mật độ 6.89.e-05
Theo như bảng thống kê trên, ta thấy đường kính của đồ thị bằng 38. Tức khoảng cách lớn nhất giữa các cặp đỉnh trong đồ thị là 38 cạnh. Trong khi đó, mật độ của đồ thị khá nhỏ.
57 Để hiểu thêm về cấu trúc mạng, tôi xây dựng thêm hình vẽ mơ tả khoảng cách trung bình của một nút tới tất cả các nút cịn lại trong mạng. Trục hồnh là khoảng cách trung bình từ một đỉnh tới các đỉnh cịn lại trong mạng. Trục tung là số lượng nút có khoảng cách tương ứng.
Hình 3.2. Số lượng nút trung bình ứng với mỗi khoảng cách l
Khoảng cách giữa hai đỉnh trong một đồ thị là số cạnh trên đường đi ngắn nhất. Các chỉ số về khoảng cách trung bình kết hợp với chỉ số đường kính phía trên, ta thấy mạng khá thưa. Cụ thể khoảng cách bình quân của một nút tới tất cả nút còn lại trong mạng là khoảng 25. Mật độ trong mạng cũng nhỏ.
Tiếp theo, ta tiếp tục xem xét phân bố lũy của bậc trong mạng.
Hình 3.3. Phân bố bậc trong mạng. Hình trái là hình vẽ số lượng nút với bậc tương ứng trong mạng G. Hình phải là số lượng nút với bậc vào và bậc ra tương ứng trong mạng G
Đường màu xanh trong hình bên phải hiển thị in-degree – bậc vào, màu cam là out_degree – bậc ra. Ta thấy bậc vào có số lượng ít hơn so với bậc ra. Trong mạng hiện tai, ta chưa tính tốn được phân phối lũy thừa chính xác của mạng những ta thấy mạng này có phân phối bậc giảm nhanh chóng.
58 Như vậy, mạng tập trung vào những trung tâm trong mạng. Điều này hợp lý vì khi ta vẽ ví dụ mẫu về mạng phía trên, ta đã thấy được tính chất này.
Để hiểu rõ hơn, ta có biểu đồ biểu diễn bậc vào và ra của mạng như sau:
Hình 3.4. Hình vẽ mơ tả bậc vào và ra của mạng
Hình vẽ cho thấy khơng có sự tương quan giữa số bậc vào và ra của một nút. Hệ số tương quan Spearman là −0,15. Điều này hợp lý vì hầu hết các tài khoản có nhiều hoạt động chuyển ra hơn chuyển vào.
Với hai mạng có trọng số GT và GN, ta có hình vẽ mơ ta phân phối trọng số của cạnh:
Hình 3.5. Hình vẽ mơ tả phân phối cạnh của đồ thị GT và GN
Ngồi ra, tơi phân tích tương quan giữa hai trọng số là số tiền và số lần chuyển tiền, hệ số tương quan Spearman của cả hai loại trọng số cạnh là 0,42. Kết quả cho thấy rằng những người dùng có thể có mối tương quan giữa tổng số tiền đã chuyển và số lượng giao dịch theo thời gian. Về thực tế, điều này đúng. Tổng số tiền sẽ ngày càng nhiều nếu ta chuyển nhiều lần.
59
Hình 3.6. Hình vẽ mơ tả tương quan số lần chuyển tiền và số tiền
Mơ hình mạng có trọng số có chứa nhiều thơng tin hơn. Do đó, tơi tính tốn sức mạnh vào: in-strength sin(i) và sức mạnh ra: out-strength sout(i) của
nút i với tổng trọng số của cạnh đi vào và đi ra tương ứng.
Hình 3.7. Phân phối của bậc vào và bậc ra
Ta thấy ở mạng GT, sức mạnh ra thấp hơn sức mạnh vào. Ta có thể
phân tích tại thời điểm tháng 12 này, hầu hết công ty đều đang trong giai đoạn thu hồi các khoản tiền còn tồn trong năm để kết tốn năm. Do đó, in- strength thấp hơn out-strength.
Còn với mạng GN, sức mạnh vào thấp hơn sức mạnh ra. Điều này chứng tỏ công ty chuyển đi với số lượng lớn. Điều này có thể giải thích qua việc phát và thưởng lương nhân viên, hoặc những phúc lợi vào tháng này.
3.4. Phát hiện cộng đồng trong mơ hình mạng
Trong doanh nghiệp, việc phát hiện một những khách hàng cùng nhóm có ý nghĩa rất lớn. Ta khơng chỉ có thể xây dựng những chiến lược kinh
60 doanh phù hợp với nhóm khách hàng, cịn đẩy mạnh doanh thu sản phẩm từ khách hàng.
Trong bài luận này, tơi thực hiện phân tích trên mơ hình mạng G, GT,
GN nhằm so sánh ba mạng này.
Đầu tiên, ta xem xét thống kê mô tả ba mạng như sau: