Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 66 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
66
Dung lượng
1,87 MB
Nội dung
ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THƠNG TIN VÀ TRUYỀN THƠNG DƯƠNG THỊ TÌNH NGHIÊN CỨU ĐỘ ĐO TRUNG GIAN VÀ THUẬT TOÁN PHÁT HIỆN CỘNG ĐỒNG TRÊN MẠNG XÃ HỘI LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Thái Nguyên - 2020 LỜI CAM ĐOAN Tôi xin cam đoan kết nghiên cứu luận văn tự thân tơi tìm hiểu hướng dẫn PGS TS Đoàn Văn Ban Các chương trình thực nghiệm thân tơi lập trình, kết hồn tồn trung thực Các thơng tin trích dẫn luận văn rõ nguồn gốc TÁC GIẢ LUẬN VĂN Dương Thị Tình LỜI CẢM ƠN Để hồn thành luận văn này, nhận nhiều quan tâm, giúp đỡ góp ý quý báu cá nhân tập thể Trước hết xin bày tỏ lòng biết ơn sâu sắc tới thầy giáo PGS.TS Đoàn Văn Ban quan tâm, định hướng đưa góp ý chỉnh sửa q báu cho tơi trình làm luận văn tốt nghiệp Đồng thời tơi xin chân thành cảm ơn góp ý chân thành thầy, cô giáo Viện Công nghệ thông tin, thầy, cô giáo Trường Đại học Công nghệ thông tin Truyền thông Thái Nguyên tạo điều kiện thuận lợi cho tơi hồn thành đề tài Dù cố gắng chắn khơng tránh khỏi thiếu sót mong nhận góp ý thầy, bạn để luận văn hoàn thiện Tôi xin chân thành cảm ơn! Thái Nguyên, tháng 08 năm 2020 Dương Thị Tình MỤC LỤC Trang MỞ ĐẦU CHƯƠNG MẠNG XÃ HỘI VÀ CÁC ĐỘ ĐO TRÊN ĐỒ THỊ MẠNG XÃ HỘI 1.1 MẠNG XÃ HỘI 1.2 CẤU TRÚC CỘNG ĐỒNG MẠNG XÃ HỘI 1.3 CÁC ĐỘ ĐO TRÊN ĐỒ THỊ MẠNG XÃ HỘI 11 1.3.1 Hệ số cố kết mạng 12 1.3.2 Hệ số trung tâm vector đặc trưng 13 1.3.3 Độ đo trung tâm đỉnh 14 1.3.4 Hệ số trung gian đỉnh 18 1.3.5 Độ đo trung gian cạnh 20 1.4 THUẬT TỐN TÍNH ĐỘ TRUNG GIAN 22 1.5 KẾT LUẬN CHƯƠNG 26 CHƯƠNG THUẬT TOÁN PHÁT HIỆN CỘNG ĐỒNG MẠNG XÃ HỘI 27 2.1 BÀI TOÁN PHÁT HIỆN CỘNG ĐỒNG TRÊN ĐỒ THỊ MẠNG XÃ HỘI 27 2.2 THUẬT TOÁN PHÂN CỤM PHÂN CẤP 28 2.3 THUẬT TOÁN PHÁT HIỆN CỘNG ĐỒNG DỰA TRÊN TỐI ƯU HOÁ ĐỘ ĐO ĐƠN THỂ 30 2.4 THUẬT TOÁN PHÁT HIỆN CỘNG ĐỒNG DỰA VÀO ĐỘ ĐO TRUNG GIAN 30 2.5 PHÁT HIỆN CÁC CỘNG ĐỒNG GỐI NHAU 33 2.5.1 Phát k-cliques mạng xã hội 34 2.5.2 Thuật toán phát k-clique 36 2.5.3 Thuật toán EAGLE 38 2.5.4 Đánh giá thuật toán 43 2.6 KẾT LUẬN CHƯƠNG 44 CHƯƠNG ỨNG DỤNG THUẬT TOÁN GIRVAN-NEWMAN TRONG PHÁT HIỆN CỘNG ĐỒNG MẠNG XÃ HỘI 45 3.1 MÔ TẢ BÀI TOÁN PHÁT HIỆN CỘNG ĐỒNG MẠNG XÃ HỘI 45 3.2 CHƯƠNG TRÌNH PHÁT HIỆN CỘNG ĐỒNG MẠNG XÃ HỘI 45 3.2.1 Bộ sở liệu 45 3.2.2 Môi trường thử nghiệm 47 3.2.3 Thử nghiệm đánh giá 49 3.3 KẾT LUẬN CHƯƠNG 54 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 55 TÀI LIỆU THAM KHẢO 56 DANH MỤC CÁC HÌNH VẼ Hình 1.1 Mạng xã hội Facebook Hình 1.2 Mạng xã hội Zing me Hình 1.3 Mơ hình mạng lưới cộng tác nhà khoa học làm việc SFI Hình 1.4 Đồ thị có đỉnh cạnh 15 Hình 1.5 Những đồ thị hình sao, bánh xe có số đỉnh 3, 4, 5, 6, 17 Hình 1.6 Đồ thị mạng xã hội đơn giản gồm nút 21 Hình 2.1 Phát cộng đồng mạng sử dụng Girven-Newman 32 Hình 2.2 Ví dụ 1-clique, 2-clique 3-clique 35 Hình 2.3 2-cliques, 2-clan 2-club 36 Hình 2.4 (a), (b) Mạng ban đầu 40 Hình 2.5 (c) Các cộng đồng phát thuận tốn Newman 41 Hình 2.6.(d) Các cộng đồng phát thuật toán k-clique 41 Hình 2.7.(e) Các cộng đồng thể chồng chéo phân cấp rõ ràng phát thuật toán EAGLE 42 Hình 3.1 Mơ số cộng đồng tìm đồ thị simple_network 49 Hình 3.2 Mơ số cộng đồng tìm liệu dolphin 50 Hình 3.3 Mơ số cộng đồng tìm liệu karate 50 Hình 3.4 Mơ số cộng đồng tìm liệu football 51 Hình 3.5 Mơ kết tìm kiếm cộng đồng liệu amazon_small 51 DANH MỤC CÁC BẢNG Bảng 3.1 Mô tả chi tiết liệu sử dụng phát cộng đồng mạng 47 Bảng 3.2 Thông tin phần cứng sử dụng 48 Bảng 3.3 Bảng tổng hợp kết thuật toán Girvan-Newman k-cliques liệu khác 53 MỞ ĐẦU Lý chọn đề tài Sự phát triển vượt bậc công nghệ thông tin làm cho lượng thông tin lưu trữ thiết bị nhớ không ngừng tăng lên Những đồ thị lớn mạng (networks) mơ hình tốn học tự nhiên cho đối tượng tương tác với mối quan hệ người mạng xã hội, cấu trúc phân tử mạng sinh học, mạng biểu diễn gene, Trong thực tế, cỡ mạng lớn mà khả phân tích, khai thác tính chất chúng lại hạn chế Mặt khác, xu phát triển công nghệ ngày xuất nhiều loại hình truyền thơng mạng xã hội dẫn đến thay đổi hành vi người xã hội hình thành cộng đồng trực tuyến Hành vi người thay đổi dẫn đến nhiều hình thức kinh doanh, tiếp thị, dịch vụ kể lĩnh vực giáo dục, an ninh, trị thay đổi theo từ cách tiếp cận việc quản lý người dùng Sự phát triển nhanh chóng mạng xã hội kéo theo bùng nổ liệu mạng xã hội Đây nguồn thông tin hữu ích, liên tục cập nhật Một đặc trưng chất mạng xã hội tính cộng đồng Mạng xã hội tốn phát cộng đồng mạng xã hội nội dung nghiên cứu mang tính thời sự, nhu cầu thiết thời điểm thu hút nhiều quan tâm nhà khoa học thuộc lĩnh vực khác xã hội học, khoa học máy tính, kinh tế, sinh học, … Do đó, việc đánh giá vật, tượng theo cộng đồng có ý nghĩa to lớn việc xác định mối quan tâm nhóm đối tượng Vì em định lựa chọn đề tài “Nghiên cứu độ đo trung gian thuật toán phát cộng đồng mạng xã hội” để nghiên cứu làm luận văn thạc sĩ 2 Mục đích nghiên cứu Những mục tiêu nghiên cứu luận văn: - Tìm hiểu mạng xã hội, cấu trúc cộng đồng đồ thị mạng xã hội phương pháp tìm kiếm cấu trúc cộng đồng mạng xã hội - Nghiên cứu độ đo đồ thị mạng xã hội tìm hiểu thuật tốn phát cấu trúc cộng đồng mạng xã hội - Xây dựng ứng dụng phát cộng đồng mạng xã hội tập liệu công bố mạng Đối tượng nghiên cứu - Lý thuyết đồ thị - Mạng xã hội mơ hình cộng đồng mạng xã hội - Thuật toán Girvan-Newman phát cộng đồng mạng Phạm vi nghiên cứu + Lý thuyết: - Kỹ thuật khai phá liệu đồ thị, - Các thuật toán phát cấu trúc cộng đồng mạng xã hội + Thực nghiệm: - Thực nghiệm chương trình phát cộng đồng mạng dựa họ thuật tốn Girvan-Newman k-cliques - Áp dụng chương trình để phát cộng đồng mạng số liệu mạng xã hội trực tuyến Ý nghĩa khoa học Đây hướng nghiên cứu lý thuyết ứng dụng phân tích phát cộng động mạng xã hội Phương pháp nghiên cứu - Phương pháp nghiên cứu lý thuyết: Sưu tập tài liệu có liên quan đến đề tài, nghiên cứu để hiểu sâu nội dung vấn đề cần nghiên cứu - Phương pháp nghiên cứu thực nghiệm: Cài đặt thử nghiệm kiểm thử chương trình - Phương pháp trao đổi khoa học: Trao đổi nội dung nghiên cứu với giáo viên hướng dẫn, với đồng nghiệp để đề xuất giải nội dung luận văn đề Cấu trúc đề tài Luận văn chia thành phần sau: Chương 1: Mạng xã hội độ đo đồ thị mạng xã Chương 2: Thuật toán xác định cấu trúc cộng đồng mạng Chương 3: Ứng dụng thuật toán GN phát cộng đồng mạng xã hội Kết luận hướng phát triển 45 CHƯƠNG ỨNG DỤNG THUẬT TOÁN GIRVAN-NEWMAN TRONG PHÁT HIỆN CỘNG ĐỒNG MẠNG XÃ HỘI 3.1 Mô tả toán phát cộng đồng mạng xã hội Bài toán: Phát cộng đồng mạng xã hội đưa danh sách nút mạng thuộc cộng đồng Đầu vào: Đồ thị mạng xã hội G = (V, E) gồm tập V có đỉnh: v1, v2,…,vn tập E liên kết E = {(vi,vj)} Đầu ra: Tập cộng đồng Ci tập hợp đỉnh thuộc cộng đồng đó: {C1, C2, ,Cn} Mục tiêu toán từ mạng xã hội cho trước biểu diễn đồ thị, phát cấu trúc cộng đồng nằm tìm hiểu mối liên hệ bên cộng đồng cộng đồng với nhau, mối liên hệ có ảnh hưởng đến cấu trúc tồn mạng xã hội 3.2 Chương trình phát cộng đồng mạng xã hội 3.2.1 Bộ sở liệu Hiện có nhiều sở liệu mạng xã hội cung cấp miễn phí Trong luận văn này, tơi sử dụng sở liệu sau: - Simple_network p_n: Đây liệu gồm 14 đỉnh 17 cạnh tạo nhằm mục dích demo mối quan hệ cộng đồng mạng - Karate: Mạng xã hội mối quan hệ bạn bè 34 thành viên câu lạc karate trường đại học Hoa Kỳ vào năm 1977 Bộ liệu gồm 34 đỉnh 78 cạnh Bộ liệu Zachary cộng xây dựng vào năm 1977 [28] 46 - Dolphins: mạng xã hội vô hướng mối quan hệ 62 cá heo cộng đồng sống New Zealand Lusseau cộng xây dựng năm 2003 [10] Bộ liệu gồm 62 đỉnh 159 cạnh - Football: mạng trận bóng đá trường đại học kỳ mùa thu năm 2000 Mỹ Bộ liệu Girvan Newman xây dựng năm 2002 [19] bao gồm 115 đỉnh 613 cạnh - Amazon: mạng mua sắm sản phẩm trực tuyến Bộ liệu Amazon xây dựng dựa việc theo dõi sản phẩm thường mua với Trong liệu này, đỉnh đại diện cho sản phẩm cạnh tương ứng sảm phẩm thường mua với Bộ liệu bao gồm loại, Amazon_small bao gồm 3,225 đỉnh 10,262 cạnh - Youtube: mạng chia sẻ video tiếng giới xây dựng Google Trong liệu Youtube, người sử dụng đại diện đỉnh, thành viên thuộc nhiều nhóm quan hệ bạn bè biểu diễn cạnh Bộ liệu bao gồm 4,890 đỉnh, 20,787 cạnh - DBLP: mạng cộng tác nhà khoa học, mạng này, đỉnh thể tác giả cạnh kết nối tác giả với họ có chung báo Bộ liệu bao gồm 10824 đỉnh, 38732 cạnh DBLP_small Các liệu: Amazon, Youtube, DBLP Jaewon Yang Jure Leskovec xây dựng năm 2015 [30] 47 Bảng 3.1 Mô tả chi tiết liệu sử dụng phát cộng đồng mạng Bộ liệu Số đỉnh Số cộng đồng Số cạnh Simple_network 14 17 P_n 14 24 - dolphins 62 1,159 115 613 12 34 78 3,225 10,262 - 10,824 38,732 - 4,890 20,787 - Amazon_big 334,863 925,872 75,149 Dblp_big 317,080 1,049,866 13,477 football_network karate Amazon_small Dblp_small Youtube_small 3.2.2 Môi trường thử nghiệm Thuật toán Girvan-Newman, thuật toán Louvian thuật tốn tìm EAGLE phát cộng đồng sử dụng chung môi trường thử nghiệm sau: - Phần cứng: Các thông tin phần cứng sử dụng luận văn thể bảng 3.2 48 Bảng 3.2 Thông tin phần cứng sử dụng Thông tin phần cứng Chỉ số CPU i7-4790 24 core 2.4GHz RAM 64GB DDR4 tốc độ bus:2666Mhz GPU Không SSD 1TB NVME tốc độ 3GB/s OS Ubuntu 20.04 phiên 64bit - Phần mềm ngơn ngữ lập trình Các thuật toán sử dụng để phát cộng đồng mạng lập trình ngơn ngữ Python phiên 3.7 Trình biên dịch python thư viện mặc định cài đặt thông qua phần mềm Anaconda tải địa chỉ: https://www.anaconda.com/distribution/ Chúng sử dụng trình hỗ trợ soạn thảo lập trình (IDE) Pycharm Community (Free) tải tại: https://www.jetbrains.com/pycharm/download - Thư viện hỗ trợ Để hỗ trợ cho việc đọc, ghi biểu diễn đồ thị sử dụng thư viện có sẵn networkx python, chưa có thư viên cài thông qua lệnh: “pip install networkx” Phiên networkx sử dụng luận văn 2.4 Để hiển thị đồ thị lưu lại dạng tệp tin ảnh chúng tơi sử dụng thư viên matplotlib có sẵn Anaconda Nếu chưa có, 49 cài đặt thư viện matplotlib theo dịng lệnh “conda install matplotlib” Phiên sử dụng luận văn 3.2.0 3.2.3 Thử nghiệm đánh giá - Đối với sở liệu nhỏ (3000 đỉnh): Hình 3.5 Mơ kết tìm kiếm cộng đồng liệu amazon_small 52 Như hình 3.5 thấy kết tìm kiếm cộng đồng thuật tốn Girvan-Newman (hình (a)) cho cộng đồng rõ ràng xác so với thuật tốn EAGLE (hình (b)) Việc hiển thị đồ thị lớn vấn đề khó khăn, thách thức lớn nhà khoa học Để so sánh cách chi tiết rõ ràng hai thuật toán GirvanNewman EAGLE Chúng ta theo dõi bảng 3.3 53 Bảng 3.3 Bảng tổng hợp kết thuật toán Girvan-Newman k-cliques liệu khác Girvan-Newman Bộ liệu Số đỉnh Số cạnh Cộng đồng Thời gian (giây) EAGLE Cộng đồng Thời gian (giây) Cộng đồng simple_network 14 17 ~0 ~0 p_n 14 24 ~0 ~0 karate 34 78 ~0 ~0 dolphins 62 159 ~0 ~0 football 115 613 12 0.02 ~0 amazon_small 3,225 10,262 - 1.27 57 0.18 205 youtube_small 4,890 20,787 - 23.17 95 6.7 63 10,824 38,732 - 27.23 241 0.278 1,441 dblp_big 317,080 1,049,866 13,477 1199 112,043 4.2 109,192 amazon_big 334,863 925,872 75,149 541.17 215,108 5.45 213,951 dblp_small 54 Nhìn bảng 3.3 thấy thời gian chạy thuật toán EAGLE nhanh nhiều so với thuật toán Girvan-Newman Do thuật toán EAGLE tìm kiếm cộng đồng gối nhau, số lượng cộng đồng tìm thuật tốn thường lớn so với thuật toán Girvan-Newman Đối với liệu amazon_small, dblp_small youtube_small, chưa có cơng bố số lượng cộng đồng danh sách cộng đồng xác liệu này, đo cột “Cộng đồng đúng” liệu ký hiệu dấu “-” ~0 tương ứng thời gian thực thuật toán xấp xỉ giây 3.3 Kết luận chương Chương trình thử nghiệm thuật tốn phát cộng đồng Girvan-Newman EAGLE Qua trình thử nghiệm, rút số nhận xét sau: - Về độ xác: Thuật tốn Girvan-Newman cho kết tốt thuật toán EAGLE - Về thời gian chạy: Thuật toán Girvan-Newman chậm thuật toán tìm kiếm EAGLE - Với liệu chứa đồ thị có kích thước lớn (hơn triệu đỉnh triệu cạnh) thuật tốn Girvan-Newman xử lý 55 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN Kết luận Mạng xã hội toán phát cộng đồng mạng xã hội vấn đề nhiều nhà nghiên cứu quan tâm thời đại Luận văn tập trung nghiên cứu độ đo trung gian thuật toán phát cộng đồng mạng xã hội Các kết mà luận văn đạt sau: Trình bày mạng xã hội các độ đo đồ thị mạng xã hội Giới thiệu thuật toán phát cấu trúc cộng đồng mạng xã hội: thuật toán phân cụm đồ thị, thuật toán Girvan–Newman, thuật toán phát kcliques, thuật toán EAGLE phát cộng đồng gối Thử nghiệm thuật toán Girvan-Newman thuật tốn tìm EAGLE để phát cộng đồng mạng xã hội Các thuật toán chạy liệu chuẩn kích thước số đỉnh số cạnh khác Hướng phát triển - Áp dụng cho vùng liệu lớn tổng quan mạng xã hội Facebook, Twitter, Google… Nhưng địi hỏi cấu hình máy chủ phải lớn - Cài đặt thử nghiệm thuật toán khác CONGA 56 TÀI LIỆU THAM KHẢO Tài liệu Tiếng Việt [1] Đoàn Văn Ban (chủ nhiệm đề tài), PHÂN TÍCH, PHÁT HIỆN CẤU TRÚC CỘNG ĐỒNG TRÊN MẠNG XÃ HỘI, Báo cáo đề tài VAST01.09/14-15, 2015 [2] Hoàng Thị Thanh Giang, Nguyễn Thị Thúy Hạnh, Nguyễn Hoàng Huy, So sánh số thuật toán phân cụm phổ cho liệu biểu diễn gene, Tạp chí Khoa học Phát triển, tập 13, số 6: 1008-1015, 2015 [3] Lê Minh Tiến, Tổng quan phương pháp phân tích mạng xã hội nghiên cứu xã hội, Tạp chí Khoa học Xã hội, số 09, tr 66-77, 2006 Tài liệu tiếng Anh [4] Arif, T., The Mathematics of Social Network Analysis: Metrics for Academic Social Networks, International Journal of Computer Applications Technology and Research, Volume - Issue 12, 889 - 893, (2015), ISSN: 2319-8656 [5] Brandes, U., A faster algorithm for betweenness centrality Journal of Mathematical Sociology, 25(2):163-177 (2001) [6] Brandes, U., Pich, C., Centrality estimation in large networks International Journal of Bifurcation and Chaos (2007) [7] Cavique, Luís, Armando B Mendes, and Jorge MA Santos "An algorithm to discover the k-clique cover in networks." Portuguese Conference on Artificial Intelligence Springer, Berlin, Heidelberg, 2009 [8] Chuan Shi, Yanan Cai, Di Fu, Yuxiao Dong, Bin Wu, A link clustering based overlapping community detection algorithm, Data & Knowledge Engineering 87 (2013) 394–404 57 [9] Clauset, A., Newman, M E., and Moore, C.: Finding community structure in very large networks Physical Review E, 70(6):066111, (2004) [10] D Lusseau, K Schneider, O J Boisseau, P Haase, E Slooten, and S M Dawson, Behavioral Ecology and Sociobiology 54, 396-405 (2003) [11] Dutta, K.: Graph Theoretic Approach to Social Network Analysis, International Journal of Scientific Research in Science and Technology, (4) 2: 1550-1557, (2018) [12] Freeman, L.C A set of measures of centrality based on betweenness Sociometry 40, 35-41, 1977 [13] Girvan, M., Newman, M E J.: Community structure in social and biological networks, Proceedings of the National Academy of Sciences of the United States of America, Vol.99, No.12, pp 7821-7826 (2002) [14] Gregory, S.: An Algorithm to Find Overlapping Community Structure in Networks In: Kok, J.N., Koronacki, J., López de Mántaras, R., Matwin, S., Mladeni$, D., Skowron, A (eds.) PKDD 2007 LNCS (LNAI), vol 4702, pp 91–102 Springer, Heidelberg (2007) [15] Huawei Shen, Xueqi Cheng, Kai Cai, and Mao-Bin Hu, Detect overlapping and hierarchical community structure in networks, Physica A 388 (2009) 1706-1712 [16] Johnson D.S.: Approximation algorithms for combinatorial problems, Journal of Computer and System Science, 9, 256-278 (1974) [17] Kernighan, B W., and Lin, S.: An efficient heuristic procedure for partitioning graphs Bell system technical journal, 49(2), 291-307 (1970) [18] M E J Newman, Mixing patterns in networks Phys Rev E 67, 026126 (2003) 58 [19] M Girvan and M E J Newman, Proc Natl Acad Sci USA 99, 7821-7826 (2002) [20] M.E.J Newman and M Girvan (2003), Finding and evaluating community structure in networks Preprint cond-mat/0308217 [21] Nam, P Nguyen., Thang, N Dinh., Ying, Xuan., and My T Thai.: Adaptive algorithms for detecting community structure in dynamic social networks, in INFOCOM, 2011 Proceedings IEEE, pp 2282 - 2290, (2011) [22] Newman, Mark EJ "Fast algorithm for detecting community structure in networks." Physical review E 69.6 (2004): 066133 [23] Nicosia, Vincenzo, et al "Extending the definition of modularity to directed graphs with overlapping communities." Journal of Statistical Mechanics: Theory and Experiment 2009.03 (2009): P03024 [24] Ruhnau, B.: Eigenvector-centrality – a node-centrality? Social Networks 22(4): 357-365 (2000) [25] Santo Fortunato (2010), Community detection in graphs, Technical Report, Complex Networks and Systems Lagrange Laboratory, ISI Foundation, Torino, ITALY, arXiv:0906.0612v2 (2010) [26] Scott, J.: Social network analysis: a Handbook London: SAGE publications, (1991) [27] Soriano P., Gendreau M.: Tabu search algorithms for the maximum clique, In: Clique, Coloring and Satisfiability, Second Implementation Challenge DIMACS, Johnson D.S., Trick M.A (Eds.), 221-242 (1996) [28] W W Zachary, An information flow model for conflict and fission in small groups, Journal of Anthropological Research 33, 452-473 (1977) 59 [29] Wikipedia, Link: https://vi.wikipedia.org/wiki/Cư_dân_mạng, Truy cập ngày 14 tháng năm 2020 [30] Yang, Jaewon, and Jure Leskovec "Defining and evaluating network communities based on ground-truth." Knowledge and Information Systems 42.1 (2015): 181-213 [31] Zhang, T., Ramakrishnan, R., Livny, M.: "BIRCH: an efficient data clustering method for very large databases" Proceedings of the 1996 ACM SIGMOD international conference on Management of data - SIGMOD'96 pp 103-114 doi:10.1145/233269.233324, (1996) [32] Zhao, F and Tung, A K.: Large scale cohesive subgraphs discovery for social network visual analysis VLDB, pages 85-96, (2012) ... trình bày giới thiệu mạng xã hội đặc tính mạng xã hội, cộng đồng mạng xã hội phát cộng đồng mạng xã hội, độ đo mạng xã hội, thuật toán xác định độ đo trung gian mạng xã hội Ở chương luận văn... trúc cộng đồng mạng xã hội, số phương pháp phát cộng đồng tập trung vào thuật toán Girvan-Newman, sử dụng độ đo trung gian để phát cấu trúc cộng đồng mạng xã hội 27 CHƯƠNG THUẬT TOÁN PHÁT HIỆN CỘNG... phát cộng đồng đồ thị mạng xã hội thuật toán phân cụm đồ thị, thuật toán Girvan-Newman, sử dụng độ đo trung gian để phát cấu trúc cộng đồng mạng xã hội thuật toán phát cộng đồng gối 2.1 Bài toán