Kết luận chương 4

Một phần của tài liệu Họ thuật toán Ginvan - Newman trong phát hiện cộng đồng và cài đặt thử nghiệm trên mạng xã hội trực tuyến Twitter (Trang 48 - 50)

Chương 4 đã nêu lên thực nghiệm xây dựng mô hình mạng xã hội và cài đặt thử nghiệm thuật toán CONGA trên mô hình mạng xã hội đó, trong đó bao gồm các bước như mô tả dữ liệu, các công cụ và phần mềm sử dụng, thực nghiệm và một số phương pháp đánh giá thuật toán.Khi đánh giá thuật toán trên mạng chúng tôi xây dựng được, sử dụng phân lớp SVM, kết quả đạt được tính trung bình cho 10 folds là 80.75%, có thể coi là chấp nhận được.

40

KT LUN VÀ PHƯƠNG HƯỚNG

Mạng xã hội và bài toán phát hiện cộng đồng trong mạng xã hội là những vấn đềđược nhiều nhà nghiên cứu quan tâm trong thời đại hiện nay.Các bài toán phát hiện cộng đồng được ứng dụng rộng rãi trong nhiều lĩnh vực của đời sống như kinh tế, chính trị, xã hội, khoa học công nghệ,...

Khóa luận đã đưa ra tổng quan về mạng xã hội và bài toán phát hiện cộng đồng trong mạng xã hội, cũng như những hướng tiếp cận điển hình cho bài toán phát hiện cộng đồng.Khóa luận chú trọng trình bày chi tiết về họ thuật toán Girvan-Newman trong đó bao gồm thuật toán Girvan-Newman nguyên thủy và các cải tiến của nó nhằm tối ưu hiệu quả tính toán.Trong đó khóa luận chọn thuật toán CONGA được phát triển từ GN bởi Steve Gregory năm 2007 làm thuật toán để cài đặt thử nghiệm trên mô hình mạng xã hội chúng tôi xây dựng được.

Khóa luận đưa ra mô hình cũng như thực nghiệm về xây dựng mô hình mạng xã hội dựa trên mạng xã hội trực tuyến Twitter và cài đặt thuật toán phát hiện cộng đồng trên mô hình xây dựng được.Kèm theo đó chúng tôi cũng cài đặt thử nghiệm thuật toán GN và thuật toán CONGA với một số mạng xã hội trên thực tế và đưa ra đánh giá.

Hướng phát triển nghiên cứu tiếp theo của khóa luận là mở rộng mô hình mạng xã hội, tính toán trọng số cũng như bổ sung hướng cho đồ thị cho phù hợp.Tiếp theo chúng tôi cũng dự định tìm hiểu và cài đặt thêm một số thuật toán thuộc họ GN cho mạng xã hội và đưa ra phương án phát triển thuật toán CONGA một cách hợp lý cho đồ thị có trọng số và có hướng.

41

TÀI LIU THAM KHO Tài liệu tiếng Anh

[1].Jiyang Chen, Community Mining-Discovery Communities in Social Network, Thesis, University of Alberta, 2010

[2]. Santo Fortunato (2010), Community detection in graphs, Technical Report, Complex Networks and Systems Lagrange Laboratory, ISI Foundation, Torino, ITALY, arXiv:0906.0612v2 (2010).

[3]. M. Girvan, M. E. J. Newman (2002). Community structure in social and biological networks, Proc. Natl. Acad. Sci., 99(12), 7821 (2002)

[4].Steve Gregory: An Algorithm to Find Overlapping Community Structure in Networks. PKDD 2007

[5].A. Lancichinetti, S. Fortunato, et F. Radicchi, “Benchmark graphs for testing community detection algorithms,” Physical Review E, vol. 78,. Oct. 2008, p. 046110.

[6].M. E. J. Newman (2004). "Fast algorithm for detecting community structure in networks". Phys. Rev. E 69 (6): 066133.doi:10.1103/PhysRevE.69.066133

[7].M. E. J. Newman and M. Girvan, Finding and evaluating community structure in networks. Preprint cond-mat/0308217 (2003)

[8].Matthew J.Rattigan, Marc Maier, David Jensen (2007), Graph clustering with netword structure indices, ICML 2007, 783-790

Website

[9]. http://www.cs.bris.ac.uk/~steve/networks/ [10]. http://twitter4j.org/en/

Một phần của tài liệu Họ thuật toán Ginvan - Newman trong phát hiện cộng đồng và cài đặt thử nghiệm trên mạng xã hội trực tuyến Twitter (Trang 48 - 50)