Kết quả tính BC và CC sau khi rút gọn

Một phần của tài liệu (Luận án tiến sĩ) một số phương pháp nâng cao hiệu quả dự báo lan truyền thông tin trên mạng xã hội (Trang 61 - 62)

Sau khi rút gọn, H vẫn là đỉnh có độ trung tâm trung gian cao nhất

BC[H]=140 (sau đó đến đỉnh J và K), J cũng vẫn là đỉnh có độ trung tâm gần cao

nhất CC[J]=0,48 (sau đó đến đỉnh H và K). Ngoài ra, NCS cũng đặt ra ngưỡng cho phép chênh lệch giá trị độ trung tâm Δ=30%. Với kết quả từ bảng 2.2 và bảng 2.3 cho thấy, độ chênh lệch độ trung tâm sau khi rút gọn của các đỉnh đều <30% (ΔH=20,5%, ΔJ=20,9%, ΔK=26,3%,...), chỉ có duy nhất ΔG=38,9%.

Như vậy, có thể kết luận việc rút gọn đờ thị bằng phương pháp đề xuất mặc dù làm thay đổi giá trị độ trung tâm nhưng không làm ảnh hưởng đến tính chất và những đỉnh quan trọng của đờ thị. Trong q trình nghiên cứu, NCS cũng đã thử nghiệm một số phương pháp rút gọn đồ thị như rút gọn đỉnh sườn, rút gọn đỉnh bậc 2, tuy nhiên, sai số Δ rất lớn (lớn hơn 30%), khơng phù hợp với bài tốn tính toán Độ trung tâm trung gian phục vụ dự báo lan truyền thông tin. Với những đồ thị lớn hơn ở phần Thực nghiệm 2.4, giá trị Δ đều nằm trong khoảng từ 10-20%.

2.4. Thực nghiệm và kết quả

2.4.1. Dữ liệu thực nghiệm

Để kiểm nghiệm giải thuật trên, Luận án đã thu thập các bộ dữ liệu mạng xã hội được công bố bởi SNAP13 bao gồm:

- ego-Facebook: Bộ dữ liệu được xây dựng từ các danh sách bạn (friends lists) của Facebook. Các danh sách này được thu thập từ các thành viên tham gia khảo sát dựa trên ứng dụng Facebook (DS1).

- gemsec-Facebook: Bộ dữ liệu gồm 8 mạng con được xây dựng để biểu

diễn những trang Facebook đã được kiểm tra chính thống. Các trang Facebook này được mơ hình hoá bằng các đỉnh và các cạnh thể hiện liên kết giữa các trang đó. Do giới hạn quy mô và thời gian nên Nghiên cứu sinh chỉ chọn hai mạng lớn trong bộ dữ liệu gemsec-Facebook để tiến hành thử nghiệm là: Politician (DS2) và Artist (DS3).

- com-DBLP: Bộ dữ liệu thể hiện mạng đồng tác giả DBLP (DS4). - com-Youtube: Bộ dữ liệu thu thập từ cộng đồng MXH Youtube (DS5). Các bộ dữ liệu trên đều là đồ thị có kết nới, thơng tin cụ thể các tham sớ chính được minh hoạ ở Bảng 2.4 dưới đây:

Bộ dữ liệu Số cạnh Số đỉnh Đường kính ego-Facebook (DS1) 88.234 4.039 8 gemsec-Facebook Politician (DS2) 41.729 5.908 14 gemsec-Facebook Artist (DS3) 819.306 50.515 11 DBLP (DS4) 1.049.866 425.957 23 Youtube (DS5) 2.987.624 1.157.828 24

Một phần của tài liệu (Luận án tiến sĩ) một số phương pháp nâng cao hiệu quả dự báo lan truyền thông tin trên mạng xã hội (Trang 61 - 62)