Thống kê mô tả các tham số của ba mạng đầu vào

Một phần của tài liệu Nghiên cứu bài toán phân tích mạng xã hội (Trang 71 - 72)

Mạng Chỉ số Min Max Mean

G Bậc vào 0 120 1.08 Bậc ra 0 1274 2.01 Chỉ số phân cụm 0 1 0.02 GT Sức mạnh vào 0 192.080.400.060 411.350.200 Sức mạnh ra 0 494.651.970.000 400.350.200 Trọng số của cạnh 6 263.848.700.000 442.162.900 Chỉ số phân cụm theo trọng số 0 0.0027 2.7* 7 10− GN Sức mạnh ra 0 2253 2.22167 Sức mạnh vào 0 3205 2.132174 Trọng số của cạnh 1 934 1.906043 Chỉ số phân cụm theo trọng số 0 0.054 5 1.83*10−

Ta thấy, với mạng G thì bậc vào thấp nhất là 0 và cao nhất là 120.

Trung bình bậc vào của mạng G là 1.08. Điều này có nghĩa trung bình mỗi nút của mạng G chỉ có xấp xỉ một liên kết vào. Mặt khác, bậc ra của mạng

G có giá trị thấp nhất là 0 vào cao nhất là 1264. Giá trị trung bình bậc là 2.01.

Điều này có nghĩa là trung bình mỗi một nút sẽ có chứa xấp xỉ hai liên kết đi ra. Như vậy, trong tháng 12 này, các doanh nghiệp có xu hướng chuyển đi nhiều hơn chuyển về.

Trên mạng GT, ta thấy sức mạnh vào của một nút trong mạng dao động

trong khoảng từ 0 VNĐ tới 192.080.400.060 VNĐ; giá trị sức mạnh trung bình của một nút là khoảng 411.350.200. Sức mạnh ra trung bình của một

61 nút trong mạng dao động khoảng từ 0 VNĐ tới 494.651.970.000 VNĐ; giá trị trung bình là 400.350.200 VNĐ. Kết hợp với mạng G, ta thấy mặc dù số lượng liên kết vào với một nút thấp, nhưng số tiền chuyển vào là tương đối lớn. Ta có thể thấy giá trị trung bình sức mạnh vào lớn hơn trung bình sức

mạnh ra của mạng GT. Như vậy, ta có thể kết luận rằng khách hàng trong

tháng 12 này có chi rất nhiều các việc với số lượng tiền ít. Đó có thể là chi hỗ trợ tết, thưởng tế cho người lao động,…. Còn những giá trị vào có thể là thu hồi nợ cuối năm.

Trên mạng GN, ta thấy sức mạnh ra trung bình của nút dao động khoảng từ 0 đến 2253; giá trị trung bình là 2,22. Sức mạnh vào trung bình dao động từ 0 đến 3205; giá trị trung bình là 2,13. Như vậy, ta thấy số lần giao dịch đi của một nút nhiều hơn số lần giao dịch vào. Điều này hợp lý với những phân tích phía trên.

Tiếp tới, ta so sánh chỉ số phân cụm trung bình của ba mạng đã dựng. Ta thấy, chỉ số phân cụm của mạng G có giá trị cao nhất so với mạng GN

GT. Điều này có nghĩa là trong mạng khơng có trọng số, nút sẽ có xu hướng tập hợp với nhau nhiều hơn so với mạng GN và GT. Như vậy, có khả năng số cộng đồng phát hiện được bởi mạng G sẽ ít nhất so với mạng GT và GN.

Để chứng thực điều trên, tôi thực hiện phát hiện cộng đồng với thuật toán Leiden với bộ dữ liệu G, GT, GN. Tơi thực hiện tối ưu hóa modularity và chạy lại với khoảng 10 lần chạy.

Kết quả tôi thu được như sau:

Một phần của tài liệu Nghiên cứu bài toán phân tích mạng xã hội (Trang 71 - 72)

Tải bản đầy đủ (PDF)

(86 trang)