Thông tin các bộ dữ liệu thử nghiệm

Một phần của tài liệu (Luận án tiến sĩ) một số phương pháp nâng cao hiệu quả dự báo lan truyền thông tin trên mạng xã hội (Trang 62 - 64)

2.4.2. Cài đặt thực nghiệm

Giải thuật nâng cao hiệu năng tính toán trên đồ thị được cài đặt bằng ngôn ngữ C++ trên môi trường tính toán của Trường Đại học Cơng nghệ, với cấu hình 2 x Intel(R) Xeon(R) CPU E5-2697 v4 @ 2.30GHz (45MB Cache, 18-cores per CPU), bộ nhớ chính 128GB, CentOS Linux release 7.2.1511, gcc 6.3.0. Hệ thống

tính toán này được cấu hình cho phép thi hành tới đa 36 l̀ng song song (do cấu hình tắt chức năng hyperthreading trên 2 CPU).

Để đánh giá hiệu năng của giải pháp, Nghiên cứu sinh đã tiến hành cài đặt hai bộ công cụ tiêu biểu trong phân tích đồ thị mạng xã hội quy mô lớn là TeexGraph và NetworKit cùng giải thuật đề xuất (với tên gọi Red-Bet) trên hạ tầng phần cứng. Tồn bộ mã ng̀n của giải thuật đã được đăng tải trên trang Github.

2.4.3. Kết quả thực nghiệm

Như đã trình bày, giải pháp nâng cao tớc độ tính toán là việc kết hợp 02 ý tưởng: rút gọn đồ thị và song song hóa quá trình tính toán độ trung tâm trung gian BC. Việc rút gọn đồ thị đã chứng minh hiệu quả trong việc tăng tớc dự báo lan truyền như đã trình bày ở trên. Kết quả thực nghiệm sẽ phải chứng minh 03 nội dung: (1) việc rút gọn đồ thị một lần nữa mang lại hiệu quả tăng tớc độ tính tốn Độ trung tâm trung gian so với khi chưa rút gọn; (2) hiệu quả tăng tốc khi song song hóa càng cao khi thực hiện càng nhiều luồng song song và (3) phương pháp của Luận án mang lại hiệu năng tính toán tốt hơn (hay thời gian tính toán nhỏ hơn) so với hai bộ công cụ TeexGraph và NetworKit.

Đầu tiên là việc đánh giá hiệu quả tăng tớc của rút gọn trong việc tính tốn Độ trung tâm trung gian. Trong quá trình nghiên cứu, ban đầu Nghiên cứu sinh chỉ đưa ra phương án song song hóa quá trình tính toán độ trung tâm trung gian BC và đề xuất giải pháp với tên gọi bigGraph. Sau đó, kết hợp với ý tưởng rút gọn đồ thị để tạo thành giải pháp tổng hợp với tên gọi Red-Bet. Do đó, để chứng minh hiệu quả của việc rút gọn, Nghiên cứu sinh sẽ tiến hành thử nghiệm giải thuật bigGraph và Red-Bet trên ba bộ dữ liệu DS1, DS2, DS3 với 4 trường hợp 1, 4, 16, 36 luồng song song, kết quả tổng hợp dựa trên việc tính thời gian thi hành trung bình sau 10 lần chạy thử nghiệm đới với mỗi giải pháp và được thể hiện ở Bảng 2.5 (giải thuật bigGraph cũng được cài đặt trên môi trường phần cứng nêu trên). Tương tự như thử nghiệm ở phần chứng mình rút gọn đờ thị ảnh hưởng đến làn truyền thong tin, thời gian rút gọn rất nhanh, trong các lần thử nghiệm, thời

gian rút gọn đối với các bộ dữ liệu đều <1% thời gian tính tốn. Vì vậy, NCS cũng khơng xét đến thời gian rút gọn đồ thị.

Số luồng DS1 DS2 DS3

bigGraph Red-Bet bigGraph Red-Bet bigGraph Red-Bet

1 3.03 2.85 8.20 7.74 1129.47 1065.53

4 1.51 1.42 4.52 4.25 556.46 524.98

16 0.54 0.51 1.60 1.51 196.46 185.34

36 0.23 0.22 0.74 0.70 99.85 94.20

Một phần của tài liệu (Luận án tiến sĩ) một số phương pháp nâng cao hiệu quả dự báo lan truyền thông tin trên mạng xã hội (Trang 62 - 64)