1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu bài toán phân tích mạng xã hội

86 46 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI LUẬN VĂN THẠC SĨ Nghiên cứu tốn Phân tích mạng xã hội ĐẶNG THỊ KIM DUNG Ngành Khoa học liệu Giảng viên hướng dẫn: PGS.TS Nguyễn Thị Kim Anh Viện: Công nghệ Thông tin Truyền thông HÀ NỘI, 2021 TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI LUẬN VĂN THẠC SĨ Nghiên cứu tốn Phân tích mạng xã hội ĐẶNG THỊ KIM DUNG Ngành Khoa học liệu Giảng viên hướng dẫn: PGS.TS Nguyễn Thị Kim Anh Chữ ký GVHD Viện: Công nghệ Thông tin Truyền thông HÀ NỘI, 2021 CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự – Hạnh phúc BẢN XÁC NHẬN CHỈNH SỬA LUẬN VĂN THẠC SĨ Họ tên tác giả luận văn: Đặng Thị Kim Dung Đề tài luận văn: Nghiên cứu tốn Phân tích mạng xã hội Chuyên ngành: Khoa học liệu Mã số SV: CA190041 Tác giả, Người hướng dẫn khoa học Hội đồng chấm luận văn xác nhận tác giả sửa chữa, bổ sung luận văn theo biên họp Hội đồng ngày …………………… với nội dung sau: Bổ sung ý nghĩa luận văn với nghiệp vụ ngân hàng Chương số 3, Mục 3.1, trang 52 Làm rõ thuật toán sử dụng Hiệu chỉnh bổ sung nội dung mục Tài liệu tham khảo Hiệu chỉnh đánh số tiêu đề Mục 2.3.3 chương trang 37 Hiệu chỉnh thuật ngữ luận văn Hiệu chỉnh lại số hình vẽ mờ trở nên rõ nét Hiệu chỉnh số lỗi soạn thảo luận văn Giáo viên hướng dẫn PGS.TS Nguyễn Thị Kim Anh Ngày tháng năm Tác giả luận văn Đặng Thị Kim Dung CHỦ TỊCH HỘI ĐỒNG PGS.TS Thân Quang Khốt LỜI CAM ĐOAN Tơi xin cam đoan: Luận văn thạc sỹ Khoa học liệu “Nghiên cứu tốn Phân tích mạng xã hội” tơi thực trình bày hướng dẫn PGS.TS Nguyễn Thị Kim Anh, Viện Công nghệ Thông tin Truyền thông – Trường Đại học Bách Khoa Hà Nội Đây cơng trình nghiên cứu hồn tồn trung thực, khơng vi phạm điều Luật Sở hữu trí tuệ Pháp luật Việt Nam Nếu sai, tơi hoàn toàn chịu trách nhiệm trước Pháp luật Tất báo, khóa luận, tài liệu, cơng cụ phần mềm tác giả khác sử dụng lại luận dẫn tường minh tác giả có danh mục tài liệu tham khảo Hà Nội, ngày 20 tháng 12 năm 2021 Tác giả Đặng Thị Kim Dung LỜI CẢM ƠN Theo học tìm hiểu sâu ngành Khoa học liệu mơ ước tơi Do đó, tơi đăng kí học cao học ngành Khoa học liệu trường Đại Học Bách Khoa Hà Nội Để hồn thành luận văn thạc sĩ này, tơi xin bày tỏ cảm kích đặc biệt tới Cơ giáo hướng dẫn PGS.TS Nguyễn Thị Kim Anh - người định hướng, trực tiếp dẫn dắt cố vấn cho suốt thời gian thực đề tài nghiên cứu khoa học Trong thời gian thực hiện, gặp nhiều vấn đề Tuy nhiên, động viên giúp đỡ cô Kim Anh, tơi hồn thành luận Đồng thời, tơi xin tỏ lòng biết ơn đến cha mẹ, người thân bạn bè bên cạnh ủng hộ, động viên sống thời gian hoàn thành luận văn thạc sĩ Xin chân thành cảm ơn tất người! Hà Nội, ngày 19 tháng 12 năm 2021 Tác giả Đặng Thị Kim Dung MỤC LỤC DANH MỤC HÌNH VẼ iii DANH MỤC BẢNG BIỂU v LỜI MỞ ĐẦU CHƯƠNG 1: CƠ SỞ LÝ THUYẾT 1.1 Khái niệm mạng xã hội 1.2 Lịch sử mạng xã hội 1.3 Một số lý thuyết đồ thị phân tích mạng xã hội 1.3.1 Định nghĩa đồ thị 1.3.2 Các loại đồ thị 1.3.3 Cấu phần đồ thị 1.4 Một số lý thuyết tính chất mạng xã hội 11 1.4.1 Lý thuyết ràng buộc yếu (strength of weak ties - SWT) 12 1.4.2 Lỗ trống cấu trúc (Structural holes) 13 1.4.3 Lý thuyết Coleman trung tâm xã hội (Coleman social capitalCSC) 14 1.4.4 Tính chất giới nhỏ (small- world) 14 1.4.5 Phân phối lũy thừa scale-free network 16 1.5 Thu thập thông tin mạng xã hội 17 1.6 Kết luận chương 18 CHƯƠNG 2: BÀI TỐN PHÂN TÍCH MẠNG XÃ HỘI 20 2.1 Phương pháp trích xuất mạng 20 2.1.1 Thành phần 21 2.1.2 Cliques 26 2.1.3 K-cores 27 2.2 Một số thước đo thống kê mô tả đặc trưng cho mạng xã hội 29 2.2.1 Khoảng cách mạng 29 2.2.2 Sức mạnh nút mạng 30 2.2.3 Hệ số phân cụm mạng 30 2.3 Bài toán phát cộng đồng mạng xã hội 31 i 2.3.1 Giới thiệu toán phát cộng đồng .31 2.3.2 Mục tiêu toán phát cộng đồng .36 2.3.3 Các thuật toán quan trọng toán “Phát cộng đồng” 37 2.4 Xác định nút quan trọng cộng đồng qua tính trung tâm 47 2.4.1 Mức độ trung tâm theo bậc (Degree centrality) 48 2.4.2 Khoảng cách trung tâm (Closeness centrality) 49 2.4.3 Vị trí trung tâm (Betweenness centrality) 50 2.5 Kết luận chương 50 CHƯƠNG 3: MÔ HÌNH THỰC NGHIỆM 52 3.1 Ý nghĩa toán ngân hàng 52 3.2 Dữ liệu đầu vào toán 53 3.3 Các đặc điểm mạng 56 3.4 Phát cộng đồng mơ hình mạng 59 3.5 Phát nút quan trọng 63 3.5.1 Phát nút quan trọng toàn mạng .63 3.5.2 Phát nút quan trọng ứng với cộng đồng 65 3.6 Kết luận chương 66 KẾT LUẬN 69 TÀI LIỆU THAM KHẢO 70 ii DANH MỤC HÌNH VẼ Hình 1.1.Ví dụ mơ hình mạng Hình 1.2.Một số hình ảnh đồ thị Hình 1.3.Sơ đồ mạng máy tính đa kênh thoại Hình 1.4.Các loại đồ thị Hình 1.5 Ví dụ đồ thị vòng, đồ thị đầy đủ, đồ thị hai phía, đồ thị bánh xe Hình 1.6 Hình ảnh ví dụ đồ thị Hình 1.7 Ví dụ minh họa tính chồng chéo 12 Hình 1.8 Ví dụ minh họa tính chất bắc cầu Liên kết A G gọi mối liên kết bắc cầu 13 Hình Hình ảnh minh họa lý thuyết cấu trúc lỗ 14 Hình 1.10 Hình vẽ biểu diễn tạo kết nối ngẫu nhiên mạng phân cụm 15 Hình 1.11 Hình ảnh mạng ngẫu nhiên (trái) mạng khơng có quy mô (phải) 17 Hình 2.1 Ví dụ thành phần mạng 22 Hình 2.2 Ví dụ khả tiếp cận 23 Hình 2.3 Hình ảnh ví dụ thành phần mạnh yếu đồ thị 24 Hình 2.4 Hình ảnh ví dụ thành phần liên thông mạnh 25 Hình 2.5 Hình ảnh ví dụ thành phần liên thơng yếu 25 Hình 2.6 Hình ảnh ví dụ Cliques 26 Hình 2.7 Hình ảnh ví dụ cliques thực tế chồng lên 27 Hình 2.8 Hình ảnh ví dụ k-cores 28 Hình 2.9 Hình ảnh ví dụ phân cộng đồng 32 Hình 2.10 Hình ảnh ví dụ tính tốn mơ đun mạng 39 Hình 2.11 Hình ảnh mơ tả cho hai giai đoạn thuật toán Đầu tiên tối ưu hóa mơ đun cộng đồng tìm thấy tổng hợp thành mạng 42 Hình 2.12 Chi tiết thuật toán Louvain[44] 44 Hình 2.13 Ví dụ cộng đồng không liên thông[44] 44 Hình 2.14 Chi tiết bước thuật tốn Leiden[44] 46 Hình 2.15 Hình ảnh ví dụ bậc 48 iii Hình 3.1 Hình ảnh phần mạng xây dựng liệu đầu vào 56 Hình 3.2 Số lượng nút trung bình ứng với khoảng cách l 57 Hình 3.3 Phân bố bậc mạng Hình trái hình vẽ số lượng nút với bậc tương ứng mạng G Hình phải số lượng nút với bậc vào bậc tương ứng mạng G 57 Hình 3.4 Hình vẽ mơ tả bậc vào mạng 58 Hình 3.5 Hình vẽ mơ tả phân phối cạnh đồ thị GT GN 58 Hình 3.6 Hình vẽ mơ tả tương quan số lần chuyển tiền số tiền 59 Hình 3.7 Phân phối bậc vào bậc 59 iv DANH MỤC BẢNG BIỂU Bảng 2.1 Ma trận kề đồ thị 39 Bảng 3.1 Bảng mô tả thành phần lớn mạng 54 Bảng 3.2 Bảng mô tả số lượng nút thành phần nhỏ 55 Bảng 3.3 Bảng mơ tả số lượng nút có bậc thành phần lớn 55 Bảng 3.4 Bảng tham số đường kính mật độ mạng G 56 Bảng 3.5 Thống kê mô tả tham số ba mạng đầu vào 60 Bảng 3.6 Bảng so sánh số phân cụm ba mạng đầu vào 61 Bảng 3.7 Cơng ty có số lượng quan hệ cao 63 Bảng 3.8 Khách hàng có số khoảng cách trung tâm tốt 64 Bảng 3.9 Bảng mô tả cộng đồng lớn phát nút quan trọng cộng đồng 65 v nút mạng dao động khoảng từ VNĐ tới 494.651.970.000 VNĐ; giá trị trung bình 400.350.200 VNĐ Kết hợp với mạng G, ta thấy số lượng liên kết vào với nút thấp, số tiền chuyển vào tương đối lớn Ta thấy giá trị trung bình sức mạnh vào lớn trung bình sức mạnh mạng GT Như vậy, ta kết luận khách hàng tháng 12 có chi nhiều việc với số lượng tiền Đó chi hỗ trợ tết, thưởng tế cho người lao động,… Còn giá trị vào thu hồi nợ cuối năm Trên mạng GN, ta thấy sức mạnh trung bình nút dao động khoảng từ đến 2253; giá trị trung bình 2,22 Sức mạnh vào trung bình dao động từ đến 3205; giá trị trung bình 2,13 Như vậy, ta thấy số lần giao dịch nút nhiều số lần giao dịch vào Điều hợp lý với phân tích phía Tiếp tới, ta so sánh số phân cụm trung bình ba mạng dựng Ta thấy, số phân cụm mạng G có giá trị cao so với mạng GN GT Điều có nghĩa mạng khơng có trọng số, nút có xu hướng tập hợp với nhiều so với mạng GN GT Như vậy, có khả số cộng đồng phát mạng G so với mạng GT GN Để chứng thực điều trên, thực phát cộng đồng với thuật toán Leiden với liệu G, GT, GN Tơi thực tối ưu hóa modularity chạy lại với khoảng 10 lần chạy Kết thu sau: Bảng 3.6 Bảng so sánh số phân cụm ba mạng đầu vào STT Chỉ số GT G GN Số cụm 130 136 131 Kích thước lớn 1265 1265 1265 Kích thước nhỏ 49 28 30 Kích thước trung bình 237.022901 229 235.022901 Chỉ số mơ đun 0.9514205 0.9517116 0.95175572 61 Trong phần này, sử dụng năm số để so sánh phân vùng ba mạng đầu vào Thứ số cụm đầu mạng G, GT, GN Ta thấy, mạng GT mạng đưa số cụm đầu lớn nhất; mạng GN mạng đưa số cụm lớn thứ hai gần xấp xỉ số cụm mạng G đưa Điều phần ta phân tích Thứ hai kích thước cộng đồng lớn phát Cả ba mạng đưa cộng đồng có kích thước 1265 cộng đồng lớn Thực tế, so sánh trực tiếp kết đầu ra, nhận thấy cộng đồng đưa ba mạng giống Thứ ba kích thước cộng đồng bé phát Mạng GT có xu hướng chia nhỏ cộng đồng hai mạng Qua ba số đầu tiên, ta thấy mạng G GN kết đưa gần giống mạng GT Điều giải thích ngun liệu đầu vào có số lượng lớn nút có trọng số tần suất Thứ tư số lượng nút trung bình cụm Mạng G có giá trị trung bình lớn nhất, sau tới mạng GN cuối mạng GT Thứ năm so sánh đến số modularity tối ưu với mạng Những số chạy lại 10 lần tối ưu mơ hình Modularity có giá trị khoảng [-1;1] Giá trị gần -1 tức điểm phân chia không thuộc vùng dự kiến phân chia Cịn điểm modularity có giá trị tiến tới nghĩa điểm phân chia khả cao thuộc vùng phân chia Giá trị modularity có nghĩa điểm phân chia khơng khác ta phân cụm ngẫu nhiên Ta thấy nhìn ba mơ hình mạng có giá trị modularity gần Qua bảng so sánh số sau phân cụm ba mơ hình mạng, ta thấy mạng GT mạng có số modularity tốt số khác tốt Mạng G GN có số gần tương tự Điều giải thích rằng, trọng số tần suất trọng mạng chưa có nhiều ý nghĩa việc phát cộng đồng Trọng số tổng số tiền giao dịch có ý 62 nghĩa để phát cộng đồng Thật vậy, hình mơ tả 30 (trái), ta thấy giá trị trọng số tần suất đồ thị 01 chiếm phần lớn Do đó, nhiễu việc phát cộng đồng với mạng GT Để tránh điều này, tương lai, định hướng xây dựng đồ thị toàn liệu lịch sử giao dịch khách hàng Khi đó, ta có nhìn tổng qt mối quan hệ khách hàng 3.5 Phát nút quan trọng 3.5.1 Phát nút quan trọng toàn mạng Trong ngân hàng doanh nghiệp, việc phát vai trị quan trọng nút có ý nghĩa lớn Việc phát giúp doanh nghiệp xác định khách hàng quan trọng mạng lưới Từ ta có sách ưu đãi chiến lược phù hợp Trong mơ hình mạng này, tơi xác định danh sách khách hàng quan trọng từ mạng qua số thống kê mạng bậc nút Chỉ số bậc cho thấy số lượng liên kết tới nút Hay nói cách khác có quan hệ với khách hàng định Bảng thể top khách hàng có vai trị quan trọng mạng qua số bậc bậc vào, bậc mạng: Bảng 3.7 Cơng ty có số lượng quan hệ cao STT ID Bậc Bậc vào Bậc 4897 1264 1263 23608 666 665 28226 641 640 31183 314 312 32797 284 283 26755 277 276 26195 209 208 18757 185 184 6666 181 181 10 13503 177 176 63 Ta thấy, khách hàng có bậc 1264 khách hàng có số bậc cao hệ thống Tuy nhiên, theo lý thuyết, nút có bậc cao chưa nút quan trọng mạng Do đó, ta xét thêm hai số khoảng cách trung tâm vị trí trung tâm Chỉ số khoảng cách trung tâm mô tả khoảng cách nút với nút khác mạng lưới Nút có vai trị trung tâm cao có tầm quan trọng phạm vi mức đô ̣ảnh hưởng việc khuếch tán thông tin mạng lưới Nếu nút có khoảng cách trung tâm thấp để giao tiếp với nút khác, nút phải qua nhiều nút khác mạng Vi ̣trí trung tâm xác định tầm quan trọng tương đối nút cách đo lưu lượng liên kết chảy qua nút đến nút khác mạng Vị trí trung tâm nút cao có xác suất lớn qua nút lựa chọn ngẫu nhiên đường ngắn hai đỉnh Do đó, nút tạo kiểm sốt nguồn thơng tin liên lạc nút khác mạng lưới Trong thực tế, tác nhân bên ngồi mạng lưới giao tiếp trao đổi thông tin với nút khác mạng cách qua đỉnh trung tâm Bảng mô tả top cơng ty có số độ đo vị trí trung tâm khoảng cách trung tâm tốt Trong mạng, công ty ghi nhận nút quan trọng Bảng Khách hàng có số khoảng cách trung tâm tốt STT ID Bậc Bậc vào Bậc Vị trí trung tâm Khoảng cách trung tâm 4897 1264 1263 4.61718E-06 0.003971849 8827 158 158 1.13692E-06 0.000197269 23588 10 9.96878E-07 0.000185513 26510 27 25 9.79762E-07 0.000178378 31757 57 56 9.13373E-07 0.000154594 64 9084 73 72 6.95533E-07 0.000134196 1812 49 45 4.68875E-07 0.000157815 26195 209 208 4.56427E-07 6.44143E-05 31628 4.54352E-07 0.00014054 10 19563 26 25 3.62548E-07 0.000110425 Ta thấy, nút 4897 có bậc cao nhất, đồng thời nút có vị trí trung tâm mạng Một số nút có số vị trí trung tâm cao số khoảng cách trung tâm thấp Điều chứng tỏ nút nút quan trọng, xa trung tâm mạng Có thể nút nút quan trọng nhóm cộng đồng gắn kết chặt chẽ Để chứng thực điều này, tơi thực trích xuất nút quan trọng cộng đồng thu từ phần 3.5.2 Phát nút quan trọng ứng với cộng đồng Trong phần này, xác định khách hàng quan trọng cộng đồng phát từ mạng GT Việc xác định nút quan trọng mạng thực theo đánh giá số tính trung tâm mục 5.1 Trích xuất 05 cộng đồng lớn sau phân tích, ta có: Bảng 3.9 Bảng mơ tả cộng đồng lớn phát nút quan trọng cộng đồng STT Số nút Số cạnh ID nút Bậc Khoảng cách cộng trong cộng quan nút quan trung tâm đồng cộng đồng đồng trọng trọng nút quan trọng 1265 1264 4897 1264 798216.0 994 973 18514 662 395869.5 644 705 2940 55 77924.8 632 631 25005 631 198765.0 554 623 2014 59 112439.1 65 Kết thực tế, ta thấy, cộng đồng phân chia lớn nhóm có 1265 nút Tuy nhiên, cộng đồng cộng đồng bao quanh nút (nút 4897) Những nút khác chưa có mối quan hệ với Tương tự, cộng đồng số có đặc điểm Đây mạng Ego - nút liên kết với nút trung tâm Việc gắn cộng đồng cho nút vấn đề quan trọng Ngoài ra, cộng đồng ta cịn trích xuất nút quan trọng cộng đồng Bài tốn có ý nghĩa Khi ta biết nút quan trọng, có nghĩa khách hàng quan trọng việc xây dựng sách chăm sóc khách hàng giữ chân lượng khách hàng có mối quan hệ với khách hàng Trong phần trên, tơi trích xuất khách hàng quan trọng theo hai hướng Hướng thứ khách hàng quan trọng tồn mạng tơi phân tích Hướng thứ hai, tơi trích xuất khách hàng quan trọng cộng đồng tơi tìm thuật tốn Leiden Tơi nhận thấy khách hàng coi quan trọng tồn mạng có số điểm khác so với khách hàng quan trọng cộng đồng phát Nguyên xét số trung tâm toàn mạng, số mang tính tổng quát tính tính tồn nút mạng Điều vơ hình chung làm nút quan trọng nhóm nhỏ Việc phát cộng đồng riêng biệt, sau ta xác định nút quan trọng có ý nghĩa Ta xem xét tính quan trọng nút theo địa phương 3.6 Kết luận chương Từ liệu giao dịch khách hàng ngân hàng VietinBank, xây dựng ba mạng để so sánh với Một mạng có hướng khơng có trọng số ký hiệu G Mạng thứ hai mạng có hướng, trọng số cạnh mạng tổng số tiền giao dịch hai khách hàng ký hiệu GT Mạng thứ ba mạng có hướng, trọng số cạnh mạng tổng số lần giao dịch hai khách hàng ký hiệu GN 66 Mạng xây dựng liệu có đặc điểm mạng lớn thưa Tơi phân tích thấy mạng chứa 8980 thành phần liên thông riêng Nhưng hầu hết nút tập trung thành phần (trên 50% nút 50% cạnh đầu tập trung đây) Thành phần gọi thành phần thứ Do đó, tơi trích xuất thành phần làm mạng đầu vào cho tốn phân tích Phân tích đặc điểm thống kê mạng, tơi thấy mạng thưa với số mật độ cục thấp; khoảng cách trung bình hai nút cao (khoảng 25 bước) Đánh giá phân bố bậc mạng, thấy số lượng nút có bậc thấp nhiều so với nút có bậc thấp Như vậy, số nút mạng có nhiều liên kết nút khác Điều liệu khách hàng đầu vào thuộc vào nhiều ngành công nghiệp khác Trong ngành công nghiệp, ta thường thấy cơng ty lớn thâu tóm thị trường nhiều Do vậy, cơng ty có nhiều mối quan hệ công ty khác Tiếp theo tơi đánh giá bậc vào tồn mạng thời gian phân tích Tơi thấy khách hàng có xu hướng chuyển nhiều chuyển vào Tôi đánh giá sức mạnh trọng số tổng số tiền giao dịch, tơi thấy giá trị trung bình sức mạnh vào nút lại thấp so với trung bình sức mạnh Điều lý giải rằng, vào thời điểm phân tích tháng 12 năm 2020, khách hàng có xu hướng chuyển khoản nhỏ lẻ nhiều Những khoản tiền hỗ trợ tết cho người lao động, số tiền thu tiền thu hồi nợ cuối năm Tôi đánh giá tiếp sức mạnh trọng số tổng số lần giao dịch, tơi thấy sức mạnh trung bình cao sức mạnh trung bình vào Điều có nghĩa trung bình khách hàng chuyển nhiều Điều hợp lý với kết luận phía Sau đó, tơi phân tích cộng đồng với ba mạng xây dựng Tơi thấy mạng GT có số modularity tốt nhất, số lượng cụm phân nhiều so 67 với hai mạng G GN Điều chứng tỏ thuộc tính tổng số tiền giao dịch giúp ta phân chia mạng tốt Thuộc tính tần suất giao dịch phần khơng có ý nghĩa tổng số tiền giao dịch Nguyên do thời gian lấy liệu q số lượng cạnh có trọng số chiếm phần lớn Trong thời gian này, cơng ty có tương tác với thời điểm đầu năm Để khắc phục điều này, ta xem xét mạng xây dựng từ toàn liệu giao dịch khách hàng Cuối cùng, từ cộng đồng thu được, tơi trích xuất khách hàng quan trọng nhóm So sánh với tập khách hàng quan trọng trích xuất từ tồn mạng, tơi thấy tập khách hàng trích xuất từ nhóm mang tính xác ta tập trung vào nhóm ngành nghề khác Mỗi nhóm hay cộng đồng này, ta xem xét tính chất riêng nhóm Đây coi đặc trưng mối quan hệ khách hàng Đặc trưng áp dụng cho tốn phân tích khác 68 KẾT LUẬN Đi với phát triển khoa học công nghệ, liệu ngày có nhiều Dữ liệu nhiều định dạng, từ có cấu trúc tới phi cấu trúc Vấn đề trích xuất kiến thức từ liệu Phân tích mạng xã hội phương pháp giúp ta trích xuất kiến thức Trong phân tích mạng xã hội, ta xem xét khía cạnh mối quan hệ nút với nút khác Trong ngân hàng, việc xem xét mơ hình mạng biểu diễn mối quan hệ mạng lưới khách hàng có ý nghĩa vô lớn Việc xem xét giúp ta có nhìn tổng quan hệ thống khách hàng Từ ta xác định khách hàng quan trọng hệ thống giúp có sách ưu đãi tốt cho khách hàng Trong luận văn này, xây dựng mạng biểu diễn mối quan hệ khách hàng qua tần số giao dịch tổng số tiền giao dịch hai khách hàng Dữ liệu lấy vào tháng 12 năm 2020 Tôi nhận thấy với liệu này, thuộc tính tổng số tiền giao dịch hai khách hàng có tính phân loại so với thuộc tính tổng số lần giao dịch hai khách hàng Nguyên vấn đề tính bảo mật liệu ngân hàng, thời gian lấy liệu ngắn ta chưa có nhìn tổng quan mối quan hệ khách hàng Trong tương lai, định hướng xây dựng mạng toàn lịch sử giao dịch khách hàng để có nhìn tổng quan khách hàng Đồng thời, sử dụng để trích xuất tập khách hàng quan trọng, hỗ trợ cơng tác chăm sóc khách hàng hệ thống Về việc phát cộng đồng, ứng dụng trình bày luận xác định khách hàng quan trọng theo cộng đồng, tơi cịn sử dụng thuộc tính mơ tả đặc điểm mối quan hệ khách hàng cho phân tích hệ thống 69 TÀI LIỆU THAM KHẢO [1] John Scott (2000) The Development of Social Network Analysis Social Network Analysis_ A Handbook, second edition, SAGE Publications Ltd, London, 7-33 [2] John Scott and Peter J Carrington (2011) Social Network Analysis: An Introduction The SAGE Handbook of Social Network Analysis, SAGE Publications Ltd, London, 11 [3] Edward O Laumann, Peter V Marsden, and Joseph Galaskiewicz (1977) Community-Elite Influence Structures: Extension of a Network Approach American Journal of Sociology, Vol 83, Number DOI:10.1086/226596 [4] Stephen P Borgatti, Ajay Mehra, Daniel Brass, Giuseppe Labianca (2009) Network Analysis in the Social Sciences DOI: 10.1126/science.1165821 SCIENCE , Vol 323, pp 892-895 [5] Tiziana Casciaro,l Kathleen M Carley, David Krackhardt 1999 Positive Affectivity and Accuracy in Social Network Perception Motivation and Emotion, Vol 23, No [6] Freeman, Linton C (2004) The development of social network analysis: a study in the sociology of science Empirical Press ; BookSurge ISBN 9781-59457-714-7 OCLC 429594334 [7] Linton Freeman (2004) The Development of Social Network Analysis Vancouver: Empirical Press BookSurge, LLC, North Charleston, South Carolina ISBN 1-59457-714-5 [8] Paradowski, Michał B.; Jarynowski, Andrzej; Jelińska, Magdalena; Czopek, Karolina (January 2021) "Selected poster presentations from the American Association of Applied Linguistics conference, Denver, USA, March 2020: Out-of-class peer interactions matter for second language acquisition during short-term overseas sojourns: The contributions of Social 70 Network Analysis" Language Teaching 54 (1): 139–143 doi:10.1017/S0261444820000580 S2CID 228863564 [9] Mark S Granovetter 1973 The Strength of Weak Ties American Journal of Sociology Vol 78, No (May, 1973), pp 1360-1380 [10] Heider, F (1958) The psychology of interpersonal relations New York: John Wiley & Sons Inc DOI: 10.1037/10628-000 [11] Ronald S Burt (1992) Structural Holes: The Social Structure of Competition University of Illinois at Urbana-Champaign's Academy for Entrepreneurial Leadership Historical Research Reference in Entrepreneurship, Available at SSRN: https://ssrn.com/abstract=1496205 [12] Coleman, James Samuel (1988) Social Capital in the Creation of Human Capital The American Journal of Sociology 94, S95-S120 [13] Ronald S Burt (2005) Brokerage & Closure: An Introduction to Social Capital New York: Oxford University Press, 2005 279 pp [14] De Sola Pool/Kochen (1978): Contacts and Influence Contacts and Influence Social Networks, pp 5-51 DOI 10.1016/0378-8733(78)90011-4 [15] J Travers and S Milgram (1969) An experimental study of the small world problem American Sociological Association, Vol 32, No 4, pp 425443 DOI: 10.2307/2786545 [16] Watts, D J.; Strogatz, S H (1998) "Collective dynamics of 'smallworld' networks" (PDF) Nature.393(6684):440–442 Bibcode:1998 Natur.393 440W Doi:10.1038/30918 PMID 9623998 [17] D J Watts (1999) Small worlds: The dynamics of networks between order and randomness Princeton Studies in Complexity Princeton University Press, Princeton, NJ ISBN-13: 978-0691117041 [18] Derek de Solla Price (1965) Networks of Scientific Papers Science, Vol 149, Issue 3683, pp 510-515 Science: 149.3683.510 71 [19] Derek de Solla Price (1976) A general theory of bibliometric and other cumulative advantage processes Journal of the American Society for Information Science 27 (5): 292–306 CiteSeerX 10.1.1.161.114 DOI:10.1002/asi.4630270505 [20] Reka Albert, Hawoong Jeong, Albert-Laszlo Barabasi (1999) The diameter of the world wide web Nature, Vol 401, pp 130-131 DOI: 10.1038/43601 [21] Cohen, Reuven; Erez, Keren; ben-Avraham, Daniel; Havlin, Shlomo (2000) "Resilience of the Internet to Random Breakdowns" Phys Rev Lett 85, 4626 (2000) DOI: 10.1103/PhysRevLett.85.4626 [22] Watts, D J (1999) Networks, dynamics, and the small-world phenomenon American Journal of Sociology, Vol 105, No DOI: 10.1086/210318 [23] Davis, et al., 1941 Deep South, Chicago: The University of Chicago Press Southern Women Data Set Via UCINET http://www.networkdata.ics.uci.edu [24] Fleischer, Lisa K.; Hendrickson, Bruce; Pınar, Ali (2000), "On Identifying Strongly Connected Components in Parallel" (PDF), Parallel and Distributed Processing, Lecture Notes in Computer Science, 1800, pp 505– 511, doi:10.1007/3-540-45591-4_68, ISBN 978-3-540-67442-9 [25] Erdős, Paul; Szekeres, George (1935) A combinatorial problem in geometry Compositio Mathematica, tome 2, pp 463–470 http://www.numdam.org/item?id=CM_1935 463_0 [26] Luce, R Duncan; Perry, Albert D (1949), "A method of matrix analysis of group structure", Psychometrika, 14 (2), pp 95–116 DOI: 10.1007/BF02289146, hdl: 10.1007/BF02289146, PMID 18152948, S2CID 16186758 [27] Bader, Gary D.; Hogue, Christopher W V (2003), "An automated method for finding molecular complexes in large protein interaction 72 networks", BMC Bioinformatics, (1): DOI:10.1186/1471-2105-4-2, PMC 149346, PMID 12525261 [28] Bouttier, Jérémie; Di Francesco,P.; Guitter, E (July 2003) "Geodesic distance in planar graphs" Nuclear Physics B 663 (3): 535–567 arXiv:cond-mat/0303272 DOI:10.1016/S0550-3213(03)00355-9 [29] Alex Fornito, Andrew Zalesky and Edward T Bullmore (2016) Fundamentals of Brain Network Analysis Chapter - Node Degree and Strength Academic Press; 1st edition ISBN-13: 978-0124079083 [30] P W Holland & S Leinhardt (1971) Transitivity in structural models of small groups Comparative Group Studies, Vol 2, pp 107–124 DOI:10.1177/104649647100200201 S2CID 145544488 [31] M Girvan; M E J Newman (2002) Community structure in social and biological networks Proc Natl Acad Sci USA 99 (12): 7821–7826 DOI: 10.1073 [32] M A Porter; J.-P Onnela; P J Mucha (2009) Communities in Networks Notices of the American Mathematical Society, Vol 56: 1082– 1097, 1164–1166 https://arxiv.org/abs/0902.3788v2 [33] Fani, Hossein; Bagheri, Ebrahim (2017) Community detection in social networks Encyclopedia with Semantic Computing and Robotic Intelligence, 1, pp 1630001 DOI:10.1142/S2425038416300019 [34] M E J Newman (2004) Detecting community structure in networks The European Physical Journal B Vol 38, pp 321–330 (2004) DOI:10.1140 [35] Maimon Oded; Rokach Lior (2006) Chapter 15: Clustering methods The Data Mining and Knowledge Discovery Handbook Springer, 1st edition DOI: 10.1007/0-387-25465-X_15 [36] Everitt B (2011) Cluster analysis 5th edition Chichester, West Sussex, U.K: Wiley, pp 330 ISBN 9780470749913 73 [37] Sorensen T (1948) A method of establishing groups of equal amplitude in plant sociology based on similarity of species and its application to analyses of the vegetation on Danish commons Biologiske Skrifter 5: 1–34 ISSN 0366-3612 [38] L Danon and J Duch and A Díaz-Guilera and A Arenas (2005) Comparing community structure identification J Stat Mech P09008 DOI:10.1088/1742-5468/2005/09/P09008/arXiv:condmat/0505245 [39] Holland Paul W and Kathryn Blackmond Laskey and Samuel Leinhardt (June 1983) Stochastic blockmodels: First steps Social Networks, Vol 5, pp 109–137 DOI:10.1016/0378-8733(83)90021-7 [40] Blondel and et al (9 October 2008) Finding community structure in very large networks Physical Review E 70(6 Pt 2):066111 DOI: 10.1103/PhysRevE.70.066111 [41] Aaron Clauset, M E J Newman, Cristopher Moore (2004) Finding community structure in very large networks Phys Rev E 70, 066111 https://arxiv.org/abs/cond-mat/0408187 [42] Blondel, Vincent D and Guillaume, Jean-Loup and Lambiotte, Renaud and Lefebvre, Etienne (9 October 2008) Fast unfolding of communities in large networks Journal of Statistical Mechanics: Theory and Experiment, Volume 2008 DOI: 10.1088/1742-5468/2008/10/P10008 [43] Fortunato, S & Barthélemy, M (2007) Resolution Limit in Community Detection Proc Natl Acad Sci USA 104, 36 DOI: 10.1073/pnas.0605965104 [44] V.A.Traag , L.Waltman & N J van Eck 2019 From Louvain to Leiden: guaranteeing well-connected communities Scientific Reports, vol (9), pp 1– 12 DOI: 10.1038/s41598-019-41695-z 74 [45] Lloyd-Smith, JO; Schreiber, SJ; Kopp, PE; Getz, WM (2005) Superspreading and the effect of individual variation on disease emergence Nature volume 438, pages355–359 DOI: 10.1038/nature04153 [46] Borgatti, Stephen P (2005) Centrality and Network Flow Social Networks Vol 27, pp 55–71 DOI: 10.1016/j.socnet.2004.11.008 [47] Borgatti, Stephen P.; Everett, Martin G (2006) A Graph-Theoretic Perspective on Centrality Social Networks Vol 28, pp 466-484 DOI: 10.1016/j.socnet.2005.11.005 [48] Bonacich, Phillip (1987) Power and Centrality: A Family of Measures American Journal of Sociology, Vol 92, No 5, pp 1170-1182 https://www.jstor.org/stable/2780000 [49] Freeman, Linton C (1979) Centrality in social networks conceptual clarification Social networks Vol 1, pp 215–239 DOI: 10.1016/03788733(78)90021-7 [50] Alex Bavelas (1950) Communication patterns in task-oriented groups J Acoust Soc Am, Vol 22, pp 725–730 DOI: 10.1121/1.1906679 [51] Freeman, Linton (1977) A set of measures of centrality based upon betweenness Sociometry, Vol 40, pp 35–41 DOI:10.2307/3033543 75 ... việc sử dụng phân tích mạng xã hội có hệ thống[7] Phân tích mạng xã hội sử dụng rộng rãi nghiên cứu việc tiếp thu ngơn ngữ thứ hai nước ngồi[8] Ngay nghiên cứu văn học, phân tích mạng Anheier,... kỉ XX nhà xã hội học Theo thời gian, nhà nghiên cứu mạng xã hội đưa hệ thống lý thuyết, tính chất phương pháp phân tích mạng xã hội Trong chương đầu tiên, sâu vào khái niệm mạng xã hội, phương... luồng mối quan hệ xảy mối quan hệ xã hội khác ta thường giả định chúng tồn 1.2 Lịch sử mạng xã hội Phân tích mạng xã hội có nguồn gốc lý thuyết công việc nhà xã hội học thời kì đầu Georg Simmel

Ngày đăng: 02/06/2022, 17:19

HÌNH ẢNH LIÊN QUAN

Hình 1.2.Một số hình ảnh về đồ thị - Nghiên cứu bài toán phân tích mạng xã hội
Hình 1.2. Một số hình ảnh về đồ thị (Trang 17)
Hình 1.4.Các loại đồ thị cơ bản - Nghiên cứu bài toán phân tích mạng xã hội
Hình 1.4. Các loại đồ thị cơ bản (Trang 19)
Hình 1.6. Hình ảnh ví dụ về đồ thị - Nghiên cứu bài toán phân tích mạng xã hội
Hình 1.6. Hình ảnh ví dụ về đồ thị (Trang 20)
Hình 1.5. Ví dụ về đồ thị vòng, đồ thị đầy đủ, đồ thị hai phía, đồ thị bánh xe - Nghiên cứu bài toán phân tích mạng xã hội
Hình 1.5. Ví dụ về đồ thị vòng, đồ thị đầy đủ, đồ thị hai phía, đồ thị bánh xe (Trang 20)
Hình 1. 9. Hình ảnh minh họa lý thuyết cấu trúc lỗ - Nghiên cứu bài toán phân tích mạng xã hội
Hình 1. 9. Hình ảnh minh họa lý thuyết cấu trúc lỗ (Trang 25)
Hình 1.10. Hình vẽ biểu diễn khi tạo một kết nối ngẫu nhiên trong mạng được phân cụm - Nghiên cứu bài toán phân tích mạng xã hội
Hình 1.10. Hình vẽ biểu diễn khi tạo một kết nối ngẫu nhiên trong mạng được phân cụm (Trang 26)
Hình 2.1. Ví dụ về thành phần trong mạng - Nghiên cứu bài toán phân tích mạng xã hội
Hình 2.1. Ví dụ về thành phần trong mạng (Trang 33)
Hình 2.2. Ví dụ khả năng tiếp cận - Nghiên cứu bài toán phân tích mạng xã hội
Hình 2.2. Ví dụ khả năng tiếp cận (Trang 34)
Hình 2.3. Hình ảnh ví dụ thành phần mạnh và yếu trong đồ thị - Nghiên cứu bài toán phân tích mạng xã hội
Hình 2.3. Hình ảnh ví dụ thành phần mạnh và yếu trong đồ thị (Trang 35)
Hình 2.5. Hình ảnh ví dụ thành phần liên thông yếu - Nghiên cứu bài toán phân tích mạng xã hội
Hình 2.5. Hình ảnh ví dụ thành phần liên thông yếu (Trang 36)
Hình 2.6. Hình ảnh ví dụ về Cliques - Nghiên cứu bài toán phân tích mạng xã hội
Hình 2.6. Hình ảnh ví dụ về Cliques (Trang 37)
Hình 2.7. Hình ảnh ví dụ cliques thực tế chồng lên nhau - Nghiên cứu bài toán phân tích mạng xã hội
Hình 2.7. Hình ảnh ví dụ cliques thực tế chồng lên nhau (Trang 38)
Hình 2.8. Hình ảnh ví dụ về k-cores - Nghiên cứu bài toán phân tích mạng xã hội
Hình 2.8. Hình ảnh ví dụ về k-cores (Trang 39)
Một mạng có đặc trưng thế giới nhỏ là mô hình mạng có L tương đối - Nghiên cứu bài toán phân tích mạng xã hội
t mạng có đặc trưng thế giới nhỏ là mô hình mạng có L tương đối (Trang 42)
Hình 2.9. Hình ảnh ví dụ phân cộng đồng - Nghiên cứu bài toán phân tích mạng xã hội
Hình 2.9. Hình ảnh ví dụ phân cộng đồng (Trang 43)
Bảng 2.1. Ma trận kề của đồ thị - Nghiên cứu bài toán phân tích mạng xã hội
Bảng 2.1. Ma trận kề của đồ thị (Trang 50)
Hình 2.10. Hình ảnh ví dụ tính toán mô đun mạng - Nghiên cứu bài toán phân tích mạng xã hội
Hình 2.10. Hình ảnh ví dụ tính toán mô đun mạng (Trang 50)
Hình 2.11. Hình ảnh mô tả cho hai giai đoạn của thuật toán. Đầu tiên tối ưu hóa mô đun và các cộng đồng được tìm thấy được tổng hợp thành một mạng  - Nghiên cứu bài toán phân tích mạng xã hội
Hình 2.11. Hình ảnh mô tả cho hai giai đoạn của thuật toán. Đầu tiên tối ưu hóa mô đun và các cộng đồng được tìm thấy được tổng hợp thành một mạng (Trang 53)
Hình 2.14. Chi tiết các bước thuật toán Leiden[44] - Nghiên cứu bài toán phân tích mạng xã hội
Hình 2.14. Chi tiết các bước thuật toán Leiden[44] (Trang 57)
Ta có bảng mô tả số nút và số cạnh của 05 thành phần lớn nhất: - Nghiên cứu bài toán phân tích mạng xã hội
a có bảng mô tả số nút và số cạnh của 05 thành phần lớn nhất: (Trang 65)
Bảng 3.2. Bảng mô tả số lượng nút của các thành phần nhỏ nhất - Nghiên cứu bài toán phân tích mạng xã hội
Bảng 3.2. Bảng mô tả số lượng nút của các thành phần nhỏ nhất (Trang 66)
Hình dưới là hình vẽ hiển thị đồ thị con của mạng. Phương pháp lấy mẫu là snowball sampling [57]  - Nghiên cứu bài toán phân tích mạng xã hội
Hình d ưới là hình vẽ hiển thị đồ thị con của mạng. Phương pháp lấy mẫu là snowball sampling [57] (Trang 67)
Hình 3.4. Hình vẽ mô tả bậc vào và ra của mạng - Nghiên cứu bài toán phân tích mạng xã hội
Hình 3.4. Hình vẽ mô tả bậc vào và ra của mạng (Trang 69)
Hình 3.6. Hình vẽ mô tả tương quan số lần chuyển tiền và số tiền - Nghiên cứu bài toán phân tích mạng xã hội
Hình 3.6. Hình vẽ mô tả tương quan số lần chuyển tiền và số tiền (Trang 70)
Trong bài luận này, tôi thực hiện phân tích trên mô hình mạng G, GT, - Nghiên cứu bài toán phân tích mạng xã hội
rong bài luận này, tôi thực hiện phân tích trên mô hình mạng G, GT, (Trang 71)
Bảng 3.6. Bảng so sánh các chỉ số phân cụm của ba mạng đầu vào - Nghiên cứu bài toán phân tích mạng xã hội
Bảng 3.6. Bảng so sánh các chỉ số phân cụm của ba mạng đầu vào (Trang 72)
Trong mô hình mạng này, tôi xác định danh sách khách hàng quan trọng từ mạng qua những chỉ số thống kê cơ bản của mạng là bậc của nút - Nghiên cứu bài toán phân tích mạng xã hội
rong mô hình mạng này, tôi xác định danh sách khách hàng quan trọng từ mạng qua những chỉ số thống kê cơ bản của mạng là bậc của nút (Trang 74)
Bảng dưới đây mô tả top những công ty có chỉ số độ đo vị trí trung tâm và khoảng cách trung tâm tốt nhất - Nghiên cứu bài toán phân tích mạng xã hội
Bảng d ưới đây mô tả top những công ty có chỉ số độ đo vị trí trung tâm và khoảng cách trung tâm tốt nhất (Trang 75)
3.5.2. Phát hiện nút quan trọng ứng với từng cộng đồng - Nghiên cứu bài toán phân tích mạng xã hội
3.5.2. Phát hiện nút quan trọng ứng với từng cộng đồng (Trang 76)
Bảng 3.9. Bảng mô tả 5 cộng đồng lớn nhất được phát hiện và những nút quan trọng trong cộng đồng  STT  cộng  đồng Số nút trong cộng đồng Số cạnh trong cộng đồng ID nút quan trọng nhất Bậc của nút quan trọng nhất Khoảng cách trung tâm của nút quan trọng  - Nghiên cứu bài toán phân tích mạng xã hội
Bảng 3.9. Bảng mô tả 5 cộng đồng lớn nhất được phát hiện và những nút quan trọng trong cộng đồng STT cộng đồng Số nút trong cộng đồng Số cạnh trong cộng đồng ID nút quan trọng nhất Bậc của nút quan trọng nhất Khoảng cách trung tâm của nút quan trọng (Trang 76)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w