Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 71 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
71
Dung lượng
2,85 MB
Nội dung
i ĐẠI HỌC THÁI NGUYÊN ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG THÁI NGUYÊN MỘTSỐTHUẬTTOÁNTÌMCOREVÀỨNGDỤNGTRONGPHÂNTÍCHMẠNGXÃHỘI ĐỖ KHẮC HOÀN THÁI NGUYÊN 2017 ii LỜI CAM ĐOAN Tôi xin cam đoan: Luận văn thạc sỹ Khoa học máy tính “Một sốthuậttoántìmcoreứngdụngphântíchmạngxã hội” thực trình bày hướng dẫn TS Trương Hà Hải, Trường Đại học Công nghệ Thông tin Truyền thông – Đại học Thái Nguyên công trình nghiên cứu hoàn toàn trung thực, không vi phạm điều Luật Sở hữu trí tuệ Pháp luật Việt Nam Nếu sai, hoàn toàn chịu trách nhiệm trước Pháp luật Tất báo, khóa luận, tài liệu, công cụ phần mềm tác giả khác sử dụng lại khóa luận dẫn tường minh tác giả có danh mục tài liệu tham khảo Thái Nguyên, ngày tháng Tác giả Đỗ Khắc Hoàn năm 2017 iii LỜI CẢM ƠN Trước tiên, tác giả xin gửi lời cảm ơn tới tất quý thầy cô giảng dạy quản lý chương trình Cao học chuyên ngành Khoa học máy tính Trường Đại học Công nghệ thông tin Truyền thông Các thầy cô truyền đạt cho tác giả kiến thức chuyên ngành khoa học máy tính để tác giả làm sở hoàn thành luận văn Tác giả xin gửi lời cảm ơn chân thành đến TS Trương Hà Hải, Cô định hướng đề tài tận tình hướng dẫn, bảo tác giả suốt trình thực luận văn cao học Sau cùng, tác giả xin dành tình cảm đặc biệt biết ơn tới gia đình người thân tác giả, người ủng hộ, khuyến khích hỗ trợ tác giả nhiều trình học tập, nghiên cứu thực luận văn Do thời gian có hạn kinh nghiệm nghiên cứu khoa học chưa nhiều nên luận văn nhiều thiếu sót, mong đóng góp ý kiến quý thầy cô bạn học viên để đề tài đạt kết cao Xin chân thành cảm ơn! Thái Nguyên, ngày tháng Tác giả Đỗ Khắc Hoàn năm 2017 iv MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN iii MỤC LỤC iv DANH MỤC CÁC BẢNG vi DANH MỤC CÁC HÌNH vii MỞ ĐẦU CHƯƠNG CƠ SỞ LÝ THUYẾT ĐỒ THỊ VÀMẠNGXÃHỘI 1.1 Mộtsố khái niệm liên quan đến đồ thị 1.1.1 Định nghĩa đồ thị [1] 1.1.2 Các loại đồ thị 1.1.3 Các khái niệm liên quan 1.2 Mộtsố khái niệm liên quan mạngxãhội 10 1.2.1 Phântích cấu trúc mạngxãhội 11 1.2.2 Biểu diễn độ phân rã mạngxãhội đồ thị 19 1.3 Mộtsố khái niệm Core 25 1.3.1 Khái niệm Core, k-core 25 1.3.2 Tính chất Core [7] 26 CHƯƠNG MỘTSỐTHUẬTTOÁN NHANH TÌM K-CORE TRONGMẠNGXÃHỘI 29 2.1 Thuậttoántìm Cores [7] 29 2.1.1 Mô tả thuậttoán 30 2.1.2 Đánh giá độ phức tạp thuậttoán 35 2.2 Thuậttoántìm p-core [8] 36 2.2.1 Hàm đơn điệu p core 36 2.2.2 Mộtsố ví dụ hàm đơn điệu p 36 2.2.3 Core tổng quát tính chất 37 2.2.4 Thuậttoántìm p-core 38 2.3 Thuậttoántìm k-core địa phương [10] 43 2.3.1 Mô tả thuậttoán 44 v 2.3.2 Thuậttoán k-core địa phương 46 CHƯƠNG ỨNGDỤNG CỦA CORETRONGPHÂNTÍCHMẠNGXÃHỘI 50 3.1 Mô tả toánphântíchmạngmạngxãhội 50 3.2 Phântíchmạngxãhộithuậttoán k-core địa phương 51 3.2.1 Đặt toán 51 3.2.2 So sánh thuậttoán địa phương với corecore lân cận 51 3.3 So sánh hệ sốphân nhóm thuậttoán k-core 55 KẾT LUẬN 62 TÀI LIỆU THAM KHẢO 63 vi DANH MỤC CÁC BẢNG Bảng 3.1: Lấy Cơ sở liệu thử nghiệm; davg mức độ trung bình mạng; dmax mức độ tối đa mạng; r phân cụm; c hệ số cụm[11] 50 Bảng 3.2: So sánh với thuậttoán k-core lân cận k-core sở liệu; kLmax max k-core số lân cận tối đa; kmax số lượng tối đa k-core; |KL( kL )| max số đỉnh đồ thị k-core lân cận k= kL ; |K (kmax)| số đỉnh k- core đồ thị k=kmax [11] 52 vii DANH MỤC CÁC HÌNH Hình 1: Mô hình k-core phân rã thành k-core nhỏ khác phác thảo đồ thị nhỏ [7] Hình 2: Độ phân rã K-core phântíchmạngxãhội [9] Hình 1.1: Ví dụ mô hình đồ thị [1] Hình 1.2: Phân loại đồ thị [1] Hình 1.3: Các dạng đồ thị đặc biệt [1] Hình 1.4: Các khái niệm liên quan đến đồ thị [1] Hình 1.5 Đỉnh rẽ nhánh bắc cầu [1] Hình 1.6 Đồ thị đồ thị đẳng cấu [1] Hình 1.7: Ma trận mạngxãhội 11 Hình 1.8: Biểu diễn độ phân rã đồ thị [9] 20 Hình 1.9 Một luồng mạng cho thấy lưu lượng công suất dòng chảy [9] 24 Hình 1.10 Luông mạng hiển thị khả dư [9] 25 Hình 2.1: 0, 1, corephân hủy đồ thị [7] 30 Hình 2.2: Mảng truyền liệu [7] 34 Hình 2.3: Coremạngphântích hình học [8] 36 Hình 2.4: Ps-core mạng mô hình học tính toán 46 mức [8] 37 Hình 2.5: Thứ tự xóa biểu diễn hàm đơn điệu p-core [8] 41 Hình 2.6: k-core vs k-core lân cận; số lượng tối thiểu core đỉnh cạnh; số lượng lân cận tối thiểu core đỉnh cạnh [10] 45 Hình 2.7: Một ví dụ biểu đồ nhỏ cho việc tìm kiếm địa phương – core từ 48 thuậttoán {A, B, C, D} thuộc địa phương – core [10] 48 Hình 3.1: Cơ sở liệu số đỉnh k –core hàm FangYao, NetScience, CA-AstroPh, CA-CondMat, CA-GrQc CA-Hepth 53 Hình 3.2: Cơ sở liệu số đỉnh k-core hàm Email-Enro, AsJuly06, Football Dolphin 54 viii Hình 3.3: Cơ sở liệu số cạnh k-core hàm FangYao, AsJuly06, CA-CondMat Dolphins 54 Hình 3.4: Cơ sở liệu thu gọn hệ số k –core chức CA-AstroPh, Email-Enron, NetScience CA-HepTh 55 Hình 3.5: Cơ sở liệu kích thước thành phần khổng lồ kích thước kcore chức CA-HepTh, As-July06, Football Dolphins 56 Hình 3.6: 8-core lân cận mạng lưới Footboall 63 đỉnh hợp thành 21 đỉnh Biểu đồ hiển thị Java Jung package [12] 57 Hình 3.7: 3-core lân cận coremạng lưới Dolphins 36 đỉnh hợp thành 20 đỉnh Biểu đồ hiển thị gói Java Jung package [12] 58 Hình 3.8: 8-Core lân cận mạng CA-HepTh 206 đỉnh hợp cụm 57 đỉnh lớn Biểu đồ hiển thị gói Java Jung package [12] 60 MỞ ĐẦU Từ kỷ 20, lý thuyết đồ thị trở nên phổ biến ứngdụng rộng rãi nhiều khía cạnh đời sống sinh học, xãhội học, công nghệ thông tin, mạng thông tin,…Vào năm 1930 toánphântíchmạngxãhội đời trở thành chủ đề quan trọngxãhội học Trong thời đại bùng nổ thông tin nay, số lượng kích thước mạngxãhội trực tuyến tăng lên không ngừng Vì vậy, việc dự đoán liên kết mạngxãhội trực tuyến nhu cầu thiết thời điểm nay, ứngdụng quan trọng cộng đồng lĩnh vực đời sống xã hội, khoa học máy tính, sinh học, … Mạngxãhội mô hình mạng có tính chất xãhội cấu tạo đỉnh cung, đỉnh liên kết với nhiều cung, thể mối quan hệ cụ thể Mỗi đỉnh thực thể mạng, thực thể cá nhân, tổ chức hay quốc gia bất kỳ… Các thực thể mạng tương tác với thông qua liên kết Các liên kết quan hệ bạn bè, đồng nghiệp, quan hệ đối đầu thù địch hay trao đổi tài chính, giao dịch… Nhu cầu phântíchmạngxãhội sớm từ năm 1930 ngày trở thành chủ đề quan trọng Đặc biệt với phát triển mạngxãhội sản sinh khối lượng liệu khổng lồ, toánphântíchmạngxãhội trở thành toánphântíchmạng miền liệu lớn Đây toán khó nhận nhiều quan tâm nhà khoa học Một mối quan tâm lớn mạngxãhộiphântích xác định nhóm gắn kết (cohesive groups) mạngMộtsố khái niệm đưa để mô tả tính kết hợp nhóm này, là: cliques, n–cliques, n–clans, n–clubs, k–plexes, k–cores,… Bài toántìm nhóm kết hợp toán NP- hard Khái niệm k-lõi (k-core) Seidman đưa vào năm 1983 [7] cách phân tách mạng lớn thành mạng nhỏ để dễ xử lý Các thuậttoán k-core đưa để tìm nhóm nhỏ mạngphân chúng thành mạng nhỏ hơn, đến đạt kết nhóm nhỏ Đã có nhiều thuậttoán đề xuất để tìm k-core, có thuậttoán hiệu quả, có độ phức tạp đa thức [3, 4, 5, 6, 7] Với ứngdụng thực tế ý nghĩa mạngxã hội, thời đại bùng nổ thông tin nay, số lượng kích thước mạngxãhội trực tuyến tăng lên không ngừng Vì vậy, việc phântíchmạngxãhội nhu cầu thiết thời điểm nay, ứngdụng quan trọng cộng đồng lĩnh vực đời sống xã hội, khoa học máy tính, sinh học, kinh tế, trị,…Nội dung luận văn nghiên cứu sốthuậttoántìm k-core ứngdụng k-core phântíchmạngxã hội, từ áp dụng giải toán thực tế Thuậttoán k-core đưa để phântích cấu trúc tính toán nhóm nhỏ mạngphân chúng thành mạng nhỏ hơn, đến đạt kết nhóm nhỏ Nhưng nhóm mạng có mối liên kết chặt chẽ với thông qua nút mạng nhóm Ngoài thuậttoán kcore sử dụng để mô tả lưới mạng lưới, cách tìm mật độ mạng trực tiếp, chuỗi đỉnh xác định số lượng nút đồ thị Hình 1: Mô hình k-core phân rã thành k-core nhỏ khác phác thảo đồ thị nhỏ [7] 49 Kết chứng minh tính đắn thuậttoán Các thuậttoán k-core địa phương tập trung vào nội dung kết nối mà thuậttoán k-core thường bỏ qua Như ta chứng minh trước đây, thuậttoán k-core địa phương bao gồm thông tin cấu trúc cộng đồng Mặc dù thuậttoán k-core địa phương thuậttoán phát cộng đồng, cho thấy số cấu trúc clique giống biểu đồ, liên quan đến cấu trúc mạng cộng đồng lợi ích phântíchmạng Từ định nghĩa k-core địa phương, đồ thị lân cận có thành phần kết nối, thuậttoán giống k-core Với gia tăng k k-core địa phương, k-core địa phương trở nên dày đặc nhiều có thành phần kết nối; thuậttoán k-core địa phương chuyển hóa thành thuậttoán k-core Nó xảy số k tương đối lớn đồ thị Để đánh giá mức độ liên kết hay liên thông cấu trúc cộng đồng mạngxã hội, nhà nghiên cứu đưa sốthuậttoán xử lý phântích mối quan hệ liên kết cộng đồng với Như chương việc tìm hiểu phântíchsốthuậttoán nhanh tìmcore tiền để việc tìm hiểu xây dựngtoánứngdụngphântíchmạngxãhội cho chương 50 CHƯƠNG ỨNGDỤNG CỦA CORETRONGPHÂNTÍCHMẠNGXÃHỘI Nội dung chương này: Giải toán thực tế sử dụng lý thuyết đồ thị thuậttoántìmcore Hiện thực hóa chương trình ứngdụng 3.1 Mô tả toánphântíchmạngmạngxãhội Ở chương ta có khái niệm liên quan mạngxãhội Lịch sử trang mạngxãhội đời trước trang web truyền thống xãhội hàng loạt trang mạngxãhội Bài toánphântíchmạngxãhội lấy từ bảng số liệu thử nghiệm hệ thống sốmạngxãhội phổ biến Trung Quốc, sốmạngxãhội phổ giới theo số liệu 2013 trình bày sở lý thuyết đồ thị (chương1), xây dựng dựa thuậttoán nhanh phân rã k-core địa phương (chương 2) Trongtoán tác giả tìm hiểu lấy từ thực tế sốmạngxãhội sau phântích để đánh giá mức độ liên thông mạngxãhội với Trongphần này, kết phântích thí nghiệm trình bày thử nghiệm cấu hình máy tính Core i5 có tốc độ CPU 1,60GHz; DDR3 4Gb; chạy hệ điều hành Windows 8.1 Pro; liệu tìm thấy bảng 3.1 Bảng 3.1: Lấy Cơ sở liệu thử nghiệm; davg mức độ trung bình mạng; dmax mức độ tối đa mạng; r phân cụm; c hệ số cụm[11] Mạng Đỉnh Cạnh davy dmax r C FangYao 383 3944 20.595 212 -0.1324 0.7467 Net Science 1589 2742 3.451 34 0.4616 0.6378 Dolphin 62 159 5.129 12 -0.0436 0.2590 AS-JULY06 22963 48436 4.2 2390 -0.1984 0.2304 EMAIL-Enron FOOTBALL 36692 183831 10.02 1383 -0.1108 0.4970 115 613 10.66 11 0.1624 0.4032 CA-ContMa 23133 93497 8.08 280 0.1364 0.6336 CA-AstroPh 18772 198,110 21.10 504 0.2053 0.6308 CA-GrQc 5242 14496 5.53 81 0.6594 0.5302 CA-HepTh 9877 25998 5.26 65 0.2685 0.4717 51 3.2 Phântíchmạngxãhộithuậttoán k-core địa phương 3.2.1 Đặt toán Xuất phát từ thực tế tìm hiểu mạngxã hội, tác giả luận văn muốn áp dụng nội dung kiến thức tìm hiểu lý thuyết đồ thị nói chung khái niệm core nói riêng để giải toán Ngoài việc mô tả cài đặt thuậttoán từ thực tế, thực câu hỏi có giá trị Chẳng hạn việc mô tả lân cận mạngxãhội liên quan đến lý thuyết đồ thị: Các lân cận gần nhất, mật độ trung bình, bao trùm Trong bảng liệu 3.1 tìm thấy trang web SNAP [11], để đơn giản hóa, tất tập liệu coi đồ thị vô hướng đồ thị đối xứng có hướng Các đồ thị không theo vòng thứ tự Trong bảng 3.1, ta thấy có nhiều loại sở liệu mạng khác nhau: Mạng lưới cộng tác: mạng này, nút đại diện cho người đối tượng; cạnh biểu thị mối quan hệ thông tin liên lạc (như mạng Football, EmailEnron) phối hợp (như CA-Hepth, NetScience) Mạng thường có hệ số kết cụm so sánh cao Mạng chuyển hóa: nút DNA chất chuyển hóa; cạnh cho thấy chúng có chức tích cực phảnứng hóa học với tính chất chuyển hóa loại phụ thuộc khác Mộtsốmạng siêu đồ thị (như FangYao) Mạng công nghệ: nút router máy chủ Các cạnh đại diện cho truyền thông kết nối vật lý chúng 3.2.2 So sánh thuậttoán địa phương với corecore lân cận Trước tiên, ta so sánh thuậttoán k–core lân cận k-core dựa theo số đỉnh k-core có mức k khác Bảng 3.2 cho biết số k-core lân cận tối đa, kLmax số k tối đa, kmax số lượng đỉnh hai đồ thị k-core Ta có kLmax tương đương với kmax Trong thực tế thuậttoán k- core lân cận dần loại bỏ kết nối cục đồ thị (mức độ cộng đồng lân cận) mà thuộc (mức độ) liên kết toàn cầu Với gia tăng k, đỉnh kết nối với đồ thị lại Cuối k-core lân cận thuậttoán k-core tương đương Một quan sát khác số đỉnh đồ thị k-core lân cận |KL( kLmax )| 52 đỉnh k-core đồ thị |K(kmax)| giống Đối với việc sở liệu tồn mạng phổ biến |KL( kLmax )| |K(kmax)| có khả xảy giống Mặt khác |K(kmax)| |KL( kLmax )| có xu hướng khác với sở liệu vốn hay có mức độ lân cận mức độ cộng đồng lân cận không Thông tin k-core lân cận cho biết thêm cấu trúc đồ thị Hình 3.1 cho thấy so sánh số đỉnh k-core hàm số hai thuậttoán Đối với mạng FangYao toàn hình dạng giống hệt Ta biết k-core địa phương có liên hệ với hình tam giác, tham số hệ sốphân nhóm Mạng FangYao có hệ sốphân nhóm cao (c = 0,7467) mà hầu hết đỉnh kết nối với Trong điều kiện k-core thuậttoán k-core lân cận có kết Bảng 3.2: So sánh với thuậttoán k-core lân cận k-core sở liệu; kLmax max k-core số lân cận tối đa; kmax số lượng tối đa k-core; |KL( kL )| max số đỉnh đồ thị k-core lân cận k= kL ; |K (kmax)| số đỉnh k- core đồ thị k=kmax [11] Mạng FangYao NetScience Dolphin AS-JULY06 EMAIL-Enron FOOTBALL CA-AstroPh CA-ContMa CA-GrQc CA-HepTh kLmax 22 19 25 43 56 25 43 31 kmax 22 19 25 43 56 25 43 31 dmax 212 34 12 2390 1383 11 504 280 81 65 |KL( kLmax )| |K(kmax)| 53 53 20 20 19 36 71 71 275 275 63 114 57 57 26 26 44 44 32 32 Kết quả: Khi ta nhìn vào bốn liệu: CA-Astroph, CA-ContMa, CA-GrQc, CAHepTh: Hình dạng đường cong cho k-core lân cận tất k-core Điều có nghĩa từ bước đi, số đỉnh k-core địa phương nhỏ so với k-core Ta nhận quan sát tương tự hình 3.2 Qua quan sát để thấy phân biệt lớn đường cong cho mạng Football Dolphins 53 Hình 3.1 3.2 chứng minh k-core lân cận có đỉnh so sánh với k–core mức k Hình 3.3 cho thấy việc so sánh số cạnh k-core hàm số có hai thuậttoán Hình dạng đường cong cho mạng FangYao có tỷ lệ chồng chéo cao Trong ba sở liệu khác, dễ thấy thuậttoán k-core dài Hình 3.1: Cơ sở liệu số đỉnh k –core hàm FangYao, NetScience, CA-AstroPh, CA-CondMat, CA-GrQc CA-Hepth 54 Hình 3.2: Cơ sở liệu số đỉnh k-core hàm Email-Enro, AsJuly06, Football Dolphin Hình 3.3: Cơ sở liệu số cạnh k-core hàm FangYao, AsJuly06, CA-CondMat Dolphins 55 Thuậttoán cho thấy số cạnh k-core số điểm lân cận điều với việc phậntích đồ thị trước 3.3 So sánh hệ sốphân nhóm thuậttoán k-core Ở phần ta chứng minh mối quan hệ k-core lân cận với xen kẽ 3clique Hình 3.4 cho thấy biến đổi hệ sốphân lớp k–core với k khác hai thuậttoánThuậttoán k–core lân cận có hệ sốphân cụm cao mức k so với thuậttoán k–core Tức thuậttoán k-core lân cận giữ cho thông tin cấu trúc tốt so sánh với k-core Ở k-core lân cận chắn k-core điều ngược lại không Một quan sát khác k = 2, k-core lân cận thường có bước nhảy lớn đường cong Như đề cập trên, k = 2, tất cấu trúc tam giác loại bỏ hệ sốphân cụm có liên quan đến số hình tam giác đồ thị Hệ sốphân cụm tăng cách loại bỏ cấu trúc hình tam giác Ngoài ra, k = 56 CA-Astroph, k = NetScience k = mạng CAHepTh, hệ sốphân lớp cuối trở thành 1, có nghĩa đồ thị k-core trở thành tập hợp nhóm Khi đồ thị k-core trở thành liên quan, thường không cần phải phân hủy thêm điều kiện cân cho biểu đồ Rõ ràng k-core địa phương sớm đạt điều kiện cân k-core Hình 3.4: Cơ sở liệu thu gọn hệ số k –core chức CA-AstroPh, Email-Enron, NetScience CA-HepTh 56 Hình 3.5: Cơ sở liệu kích thước thành phần khổng lồ kích thước kcore chức CA-HepTh, As-July06, Football Dolphins Cấu trúc k-core cộng đồng địa phương Từ hai thí nghiệm trên, cho thấy thuậttoán k-core địa phương có yêu cầu nghiêm ngặt k-core Trongsở liệu ta tập trung vào đồ thị phụ kcore Hình 4-5 cho biết đa dạng kích thước thành phần hai thuậttoán mức độ k khác Ở thành phần có kết nối lớn 57 Hình 3.6: 8-core lân cận mạng lưới Footboall 63 đỉnh hợp thành 21 đỉnh Biểu đồ hiển thị Java Jung package [12] 58 Hình 3.7: 3-core lân cận coremạng lưới Dolphins 36 đỉnh hợp thành 20 đỉnh Biểu đồ hiển thị gói Java Jung package [12] Liên kết biểu đồ hình 3.5 ta nhận thấy rằng, thuậttoán k-core thành phần lớn gần kích cỡ với đồ thị k-core, có nghĩa k-core tốt cấu trúc cộng đồng đồ thị Đối với Thuậttoán k-core địa phương, đặc biệt mạng CA-HepTh, Football Dolphins thành phần lớn nhỏ nhiều so với k-core, cho phép ta xem cấu trúc đồ thị cộng đồng Hình 3.6 hiển thị mạng nội 5-core mạng lưới bóng đá có thành phần kết nối; Mỗi thành phần kết nối cấu trúc giống clique Rõ ràng Giant Component (đánh dấu 2) dễ dàng chia thành thành phần kết nối, ta sử dụngthuậttoánphân cụm 59 đồ thị Các địa phương 5-core có 63 đỉnh kích thước thành phần cụm lớn 21; Trong 5–core có 114 đỉnh kích thước thành phần cụm lớn 114 Hình 3.6 cho thấy đỉnh có kết nối tương tự nên nằm cộng đồng; so sánh với kết phân loại thực mạng football, giả sử đỉnh hợp phần thuộc phân cụm PAC, đỉnh Component thuộ SEC, thuộc ACC, thuộc B10 Cũng hợp phần, đỉnh thuộc phân cụm B12 C-USA Các tượng tương tự trình bày hình 3.7 cho mạng lưới Dolphins hình 3.8 cho mạng CA-HepTh Đồ thị k-core có số đỉnh lớn kích thước thành phần khổng lồ so với k core địa phương mức k: 45 đỉnh cỡ thành phần khổng lồ 45 so với 36 đỉnh 20 k = mạng Dolphins; 255 đỉnh cỡ thành phần khổng lồ 172 so với 206 đỉnh 57 k = mạng CA-HepTh Ở thuậttoán k core địa phương hiển thị cấu trúc cộng đồng k-core mà không hiển thị thuậttoán kcore bình thường 60 Hình 3.8: 8-Core lân cận mạng CA-HepTh 206 đỉnh hợp cụm 57 đỉnh lớn Biểu đồ hiển thị gói Java Jung package [12] Trong chương này, đồ thị khu phố có xu hướng nhìn hay phát cấu trúc cộng đồng biểu diễn biểu đồ; Khái niệm mức độ cộng đồng địa phương xác định kích thước thành phần kết nối biểu đồ khu phố Sự kết nối xa k-core lân cận, đảm bảo mức độ cộng đồng địa phương k đồ thị phụ, góc nhìn đồ thị, xen kẽ Clique, giống cấu trúc cộng đồng clique với mật độ cao Ngoài ra, thuậttoán k-core lân cận đồ thị lân cận có thành phần kết nối cần mật độ cao đồ thị k –core địa phương ý tưởng mở rộng k-core với điều kiện hạn chế Thông qua thử nghiệm, chứng minh thuậttoán k-core địa phương có cạnh đỉnh thuậttoán k-core, giúp đồ thị có mật độ cao Đồng thời, thuậttoán k-core địa phương cho thấy cấu trúc cộng 61 đồng tốt trình phân rã k-core, cách tốt để xem cấu trúc đồ thị K-core địa phương có mối quan hệ với xen kẽ 3-clique Có cấu trúc cộng đồng khác k-core khu vực lân cận đỉnh thỏa mãn điều kiện xen kẽ 4-clique điều kiện liên quan đến đồ thị k kết nối Tóm lại, với mạng phức tạp, thuậttoántìmcoresốthuậttoán lý thuyết đồ thị cho thấy tính hiệu giúp ta hiểu sâu sắc hơn, rút nhiều ý nghĩa từ tập liệu mạng phức tạp 62 KẾT LUẬN Dưới hướng dẫn Giáo viên hướng dẫn – TS Trương Hà Hải với nỗ lực thân, luận văn đạt số kết sau: Tìm hiểu kiến thức Lý thuyết đồ thị, mạngxãhội Học hỏi nắm bắt sốthuậttoán xử lý đồ thị, đặc biệt thuậttoánphân rã đồ thị, tìm k-core, p-core với thời gian đa thức Nghiên cứu cài đặt thuậttoántìm hiểu, phát biểu giải sốtoán thực tế áp dụng kiến thức nghiên cứu Các lý thuyết thí nghiệm trình bày chương chương sơ cần phải mở rộng nghiên cứu thực tương lai Thứ nhất, lý thuyết thí nghiệm k-core địa phương tập trung vào liệu mạng thực; nghiên cứu, chẳng hạn mạng ngẫu nhiên giới hạn thấp cho xuất k-core địa phương, không đề cập luận án Tốt nên xây dựngsởmạng k-core cục ngẫu nhiên tham số k hệ sốphân cụm Một lĩnh vực khác là, thay tập trung vào mức độ cộng đồng địa phương (kích cỡ thành phần kết nối đồ thị lân cận), số lượng thành phần kết nối tranh luận cho nghiên cứu sâu hơn; k-core liên quan đến cấu trúc cộng đồng phương pháp lân cận tốt cho đồ thị Nếu đồ thị lân cận đỉnh có nhiều thành phần kết nối, có nghĩa đỉnh điểm nóng, thay thành viên cộng đồng Trong thời gian tới luận văn làm tảng để phát triển thêm: Nghiên cứu cải tiến thuậttoán cho tốt hơn; Tìm tòi toán thực tế để vận dụng giải mang lại ý nghĩa thực tế Mặc dù nỗ lực, thời gian kiến thức hạn chế nên chắn luận văn nhiều thiếu sót kết đạt chưa nhiều Kính mong Thầy Cô góp ý để luận văn hoàn thiện Trân trọng cảm ơn 63 TÀI LIỆU THAM KHẢO Tài liệu Tiếng Việt [1] Nguyễn Cam, Chu Đức Khánh, Lý thuyết đồ thị, NXB Thành phố Hồ Chí Minh, 1999 [2] Trần Minh Đức, Nghiên cứu, thiết kế, thử nghiệm mạngxãhội phục vụ phát triển nông thôn, Học viện Công nghệ bưu viễn thông Hà Nội, 2012 Tài liệu tiếng Anh [3] Kayhan Erciyes, Complex Networks: An Algorithmic Perspective Sep 6, 2014 [4] Niklaus Wirth, Algorithms + Data Structures = Programs (Prentice-Hall [5] Series in Automatic Computation) Feb 1976 Nasrullah Memon and Reda Alhajj (Editor), From Sociology to Computing in Social Networks: Theory, Foundations and Applications (Lecture Notes [6] in Social Networks) 2010 th Edition VladimirBatagelj, and Matjazˇ Zaversnikˇ, Cores Decomposition of [7] Networks, UniversityofLjubljana,Slovenia, September 24–27, 2001 Vladimir Batagelj and Matjaz Zaversnik, An O(m) Algorithm for Cores Decomposition of Networks, University of Ljubljana, 25 Oct 2003 [8] Vladimir Batagelj, and Matjaz Zaversnik, Fast algorithms for determining (generalized) core groups in social networks, November 2011 [9] Online, Mon, 03 Jan 2011, Social Network Analysis Theory and Applications [10] Chen Lu, Local K-Core Algorithm in Complex Networks , Master of Compute Science, Harbin University of Science and Technology, Harbin, ChiNa, 2002 [11] Jure Leskovec (2, May, 2013) SNAP http://snap.stanford.edu/data/index.html [12] The JUNG Framework Development Team (24, May, 2013) JUNG http://jung.sourceforge.net/index.html ... 2: Một số thuật toán nhanh tìm k -core mạng xã hội Tìm hiểu số thuật toán tìm Cores phân tích mạng xã hội, mổ tả thuật toán, đánh giá độ phức tạp thuật toán Chương Ứng dụng core phân tích mạng xã. .. nghiên cứu số thuật toán tìm k -core ứng dụng k -core phân tích mạng xã hội, từ áp dụng giải toán thực tế Thuật toán k -core đưa để phân tích cấu trúc tính toán nhóm nhỏ mạng phân chúng thành mạng nhỏ... TRONG PHÂN TÍCH MẠNG XÃ HỘI 50 3.1 Mô tả toán phân tích mạng mạng xã hội 50 3.2 Phân tích mạng xã hội thuật toán k -core địa phương 51 3.2.1 Đặt toán 51 3.2.2 So sánh thuật toán