Bài viết này sẽ mô hình hóa bộ dữ liệu email bằng một mạng lƣới và phân tích hệ thống theo tiếp cận mạng lưới bằng các thuật toán phân cụm K-core và modularity cực đại. Tìm ra các cụm dữ liệu, phân tích tính môđun để tìm ra các tri thức mới. Đây là một kỹ thuật phân tích mới giúp hiểu rõ về kiến trúc hệ thống và hỗ trợ thiết kế quy trình nghiệp vụ.
Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XIII Nghiên cứu ứng dụng Công nghệ thông tin (FAIR), Nha Trang, ngày 8-9/10/2020 DOI: 10.15625/vap.2020.00224 ỨNG DỤNG MẠNG PHỨC HỢP TRONG KHAI PHÁ DỮ LIỆU TƢƠNG TÁC NGƢỜI DÙNG Nguyễn Minh Tân1, Trần Tiến Dũng2 Trung tâm Thông tin thƣ viện, Trƣờng Đại học Công nghiệp Hà Nội Khoa Công nghệ thông tin, Trƣờng Đại học Cơng nghiệp Hà Nội minhtan@triz.edu.vn, trantd@haui.edu.vn TĨM TẮT: Một hệ thống thông tin quản lý sản phẩm tin học hóa quy trình nghiệp vụ tổ chức, doanh nghiệp Bằng việc sử dụng phương pháp mơ hình hố phân tích hệ thống theo tiếp cận mạng lưới, báo phân tích mạng phức hợp liệu tương tác người dùng hệ thống thông tin quản lý Dữ liệu mạng có hướng gồm 1292 nốt 968706 cạnh Kết phân tích thu 16 mơđun, 19 lớp core, số bậc trung bình nốt 19,15, với phương sai = 409,37, độ lệch chuẩn = 20,23, hệ số phân cụm trung bình 0.482 Từ đưa phân tích cấu trúc mơđun, mối liên hệ môđun đặc điểm lõi mạng liệu Chúng phát từ liệu tương tác email xác định nhóm chức cấu trúc tổ chức trường đại học thuật tốn modularity cực đại Ngồi kết qủa phân tích K-core hệ thống dùng để tham khảo cho việc xếp lương cho người lao động theo lớp lõi hệ thống Kết thu dùng để thẩm định tính hợp lý hệ thống hỗ trợ thiết kế quy trình Từ khóa: Mạng phức hợp, khai phá đồ thị, tính mơđun, K-core, phân bố bậc, hệ số phân cụm I MỞ ĐẦU Mạng phức hợp đồ thị đại diện cho kết nối phức tạp yếu tố nhiều hệ thống tự nhiên nhân tạo [1] Cách tiếp cận mạng lƣới không hữu ích cho việc đơn giản hóa hình dung số lƣợng liệu khổng lồ mà hiệu việc tìm yếu tố quan trọng tìm tƣơng tác quan trọng chúng Các ứng dụng gần phƣơng pháp mạng phức hợp bao gồm lĩnh vực đa dạng nhƣ khí hậu học, động lực học chất lỏng, sinh lý thần kinh, kỹ thuật, kinh tế từ chứng minh đƣợc tiềm to lớn mạng lƣới thời gian để giải vấn đề khoa học đƣơng đại giới thực [2] Andor Háznagy cộng sử dụng phƣơng pháp mạng phức hợp để phân tích hệ thống giao thơng cơng cộng thị thành phố Hungary Kết phân tích cho thấy đƣợc đặc điểm tƣơng đồng khác biệt cách tổ chức giao thông, điểm xung đột, hiệu từ đề xuất phƣơng án điều phối hoạt động giao thông đƣợc hiệu [3] Phân cụm kỹ thuật quan trọng khai phá liệu Từ sở liệu ta nhóm đối tƣợng có tính chất với nhau, từ ta đƣợc cụm liệu Việc phân cụm liệu đƣợc tiến hành sớm lĩnh vực nhân học sau đƣợc mở rộng sang lĩnh vực tâm lý học Zubin 1938 [4] Ngày kỹ thuật phân cụm đƣợc sử dụng phổ biến số hoạt động nhƣ: hỗ trợ tiền xử lý liệu, nhận dạng mẫu, phân loại khách hàng, nhận dạng đối tƣợng, phân đoạn hình ảnh [5] Trên thực tế tốn xử lý liệu liệu đầu vào thƣờng có nhiễu, nhiều tác giả sử dụng kỹ thuật phân cụm với tập mờ loại để giải vấn đề [6, 7] Chúng ta sử dụng kỹ thuật phân cụm để khai phá liệu, tìm đặc tính đặc trƣng cụm giúp cho việc phát tri thức Đặc biệt ngày có liệu siêu lớn nhƣ Facebook, Google, Twitter khai thác tốt mang lại nhiều tri thức quý giá [8] Hiện có nhiều thuật toán phân cụm liệu lớn dựa thuật toán ứng dụng khác đƣợc áp dụng [9] Bài báo mơ hình hố liệu email mạng lƣới phân tích hệ thống theo tiếp cận mạng lƣới thuật toán phân cụm K-core modularity cực đại Tìm cụm liệu, phân tích tính mơđun để tìm tri thức Đây kỹ thuật phân tích giúp hiểu rõ kiến trúc hệ thống hỗ trợ thiết kế quy trình nghiệp vụ II DỮ LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU ĐẦU 2.1 Dữ liệu xử lý liệu Bài báo khai phá liệu hệ thống email quản lý hành điện tử Trƣờng Đại học Công nghiệp Hà Nội (eGov) Tập liệu đơn giản có 02 trƣờng kiểu văn bản: ID ngƣời gửi ID ngƣời nhận giao dịch khoảng thời gian từ 01/01/2015 đến 16/9/2016 ID ngƣời gửi/nhận cho biết tên đơn vị nhƣ cho phép xác định chức năng, nhiệm vụ đơn vị ngƣời gửi/nhận công tác Từ liệu đơn giản này, xây dựng mạng liệu eGov đồ thị có hƣớng mơ tả thông tin ngƣời gửi gửi tin đến ngƣời nhận qua email Mỗi nút mạng (đỉnh) biểu diễn ngƣời gửi/nhận Hai nút mạng A B nối với 01 cung có hƣớng từ A B nhƣ A gửi email cho B Dữ liệu ban đầu chƣa qua tiền xử lý đồ thị có hƣớng, bao gồm 1.292 nút 1.000.000 cạnh Qua phân tích thấy liệu eGov tồn loại nhiễu, đƣợc mối quan hệ công việc: Loại 1: Ngƣời gửi ngƣời nhận trùng Loại 2: Ngƣời gửi gửi tin nhắn đại chúng (broadcast) ỨNG DỤNG MẠNG PHỨC HỢP TRONG KHAI PHÁ DỮ LIỆU TƢƠNG TÁC NGƢỜI DÙNG 650 Loại 3: Các thƣ lạc tƣơng tác có số lƣợng thƣ q ít, thƣ khơng thể đƣợc mối quan hệ công việc Nhiễu loại đƣợc xử lý nhƣ sau: So sánh Id ngƣời gửi Id ngƣời nhận để kiểm tra xem có trùng hay khơng Đánh dấu xố trƣờng hợp trùng Sau xử lý, liệu 968.706 cạnh Nhiễu loại đƣợc xử lý nhƣ sau: Đầu tiên, xác định số lƣợng ngƣời đơn vị Sau đó, tính xem lần gửi, ngƣời gửi gửi tin đến ngƣời Cuối cùng, loại trƣờng hợp gửi tin đến vƣợt số lƣợng ngƣời đơn vị ngƣời Nhiễu loại đƣợc xử lý nhƣ sau: Đầu tiên, tính xem số lần gửi tin cho cặp hai ngƣời Sau đƣa mạng liệu vừa xử lý vào phần mềm phân tích mạng Gephi để lọc trƣờng hợp tƣơng tác chiều cách sử dụng lọc Mutual Edge Sau loại bỏ trƣờng hợp tƣơng tác chiều, chúng tơi thu đƣợc mạng có hƣớng, có trọng số Sau loại bỏ tƣơng tác chiều, tạo mạng vô hƣớng cách cộng tổng trọng số hai chiều liên kết mạng có hƣớng Biểu đồ histogram phân bố trọng số mạng lƣới nhƣ Hình Sau loại bỏ tƣơng tác chiều, ta tạo mạng vô hƣớng cách cộng tổng trọng số hai chiều liên kết mạng có hƣớng Hình Biểu đồ histogram phân bố trọng số mạng lƣới sau cộng tổng trọng số hai chiều liên kết Mạng liệu eGov sau xử lý trƣờng hợp gây nhiễu bao gồm 1.163 nốt 11.136 cạnh Trong đó, ngƣời đại diện cho nốt, hai nốt mạng đƣợc kết nối với hệ thống eGov 2.2 Mơ hình hố liệu Để mơ hình hố mạng lƣới eGov ta sử dụng phần mềm Gephi, trƣớc tiên từ liệu ban đầu ta tạo hai file định dạng *.csv chứa danh sách nốt danh sách cạnh cần biểu diễn Sau lần lƣợt đƣa file chứa liệu nốt cạnh vào Gephi để tạo mạng lƣới Hình ảnh mạng lƣới eGov đƣợc mơ hình hóa cho kết nhƣ Hình Hình Mạng lƣới eGov đƣợc xây dựng từ liệu email gồm 02 trƣờng: ID người gửi, ID người nhận 2.3 Thuật tốn phân tích liệu email đồ thị Bài báo sử dụng thuật toán K-core để phân tích liệu Thuật tốn dùng để cài đặt đƣợc mô tả nhƣ sau: Khởi tạo danh sách chứa kết đầu L Nguyễn Minh Tân, Trần Tiến Dũng Tính số bậc 651 đỉnh v G, số lƣợng đỉnh kề với v mà chƣa có L Khởi tạo mảng D cho D[i] chứa danh sách đỉnh v L mà dv = i Khởi tạo biến k Lặp lại n lần: Quét giá trị mảng D[0], D[1],… tìm đƣợc i mà D[i] không rỗng Gán k = max(k, i) Chọn đỉnh v từ D[i] Thêm v vào đầu mảng L xoá đỉnh v khỏi D[i] Với đỉnh kề w v mà chƣa có L, trừ dw di chuyển đỉnh w tới vị trí mảng D tƣơng ứng với dw Kết thúc thuật toán, k chứa độ phân rã G (K-Core max), L chứa danh sách đỉnh đƣợc xếp theo thứ tự giá trị độ phân rã tăng dần III KẾT QUẢ VÀ THẢO LUẬN 3.1 Môđun hệ thống Sau mạng lƣới đƣợc tạo ra, chúng tơi dùng thuật tốn moduarity cực đại [10] để phát môđun (cụm) mạng lƣới eGov Kết có 16 mơđun đƣợc phát đánh số thứ tự từ đến 15 nhƣ Hình Hình 16 mơđun mạng eGgov đƣợc phát thuật toán modularity cực đại Bảng Bảng liệt kê môđun hệ thống Module ID 11 Nodes 199 167 103 96 Edges 1719 1037 675 889 % 17,11 14,36 8,86 8,25 12 14 13 10 15 96 75 72 64 55 53 44 39 39 32 20 630 527 359 364 212 316 140 128 387 190 76 14 8,25 6,45 6,19 5,50 4,73 4,56 1,26 3,35 3,35 2,75 1,72 0,77 Bảng liệt kê môđun hệ thống, kèm với số phần trăm số lƣợng nốt môđun theo thứ tự giảm dần Trong Bảng 1, thấy mơđun lớn môđun 11, lớn thứ hai môđun 8, nhỏ môđun 15 Sau đối chiếu môđun với danh sách cán đơn vị, nhận thấy hầu hết môđun mạng ỨNG DỤNG MẠNG PHỨC HỢP TRONG KHAI PHÁ DỮ LIỆU TƢƠNG TÁC NGƢỜI DÙNG 652 đơn vị chức trƣờng Điều cho thấy mơđun liệu email phát thuật tốn phản ánh chức hoạt động hệ thống thực tế Nói cách khác, từ liệu email xác định đƣợc nhóm chức hệ thống thực thuật toán modularity cực đại Đặc biệt, có vài mơđun nhƣ Mơđun 11 bao gồm đơn vị, số lƣợng ngƣời chiếm phần lớn từ khoa Ngoại ngữ với 195 ngƣời (Hình 4); mơđun bao gồm 25 đơn vị, số lƣợng ngƣời đƣợc phân bố chủ yếu trung tâm (Hình 5) Các mơđun khác biệt với mơn đun khác, đóng vai trị liên kết mơđun khác mạng lƣới Hình đồ thị vơ hƣớng có trọng số mô tả liên kết môđun với Trong nốt đại diện cho mơđun, hai mơđun đƣợc coi có liên kết với tồn đơn vị chung hai môđun, trọng số hai môđun liên kết với đƣợc tính số lƣợng đơn vị chung hai mơđun Các nốt có bậc cao có màu đậm nốt có bậc thấp hai mơđun có trọng số cạnh nối chúng cao cạnh đƣợc vẽ đậm Hình cho thấy, môđun môđun độc lập với môđun khác tách biệt khỏi hệ thống Môđun có số bậc cao (có số lƣợng mơđun chung với mơđun khác nhiều nhất), đóng vai trị trung tâm mạng có ảnh hƣởng phần lớn đến mơđun cịn lại mạng [11] Môđun 2, môđun môđun 14 tạo thành tam giác liên kết chặt chẽ với nhau, đặc biệt hai môđun môđun Môđun 11 bao gồm đơn vị, số lƣợng ngƣời chiếm phần lớn từ khoa Ngoại ngữ với 195 ngƣời (Hình 4) Hình Các đơn vị môđun 11 Môđun bao gồm 25 đơn vị, số lƣợng ngƣời đƣợc phân bố chủ yếu trung tâm (Hình 5) Hình Các đơn vị môđun 3.2 Kết phân tích K-core Core hệ thống cụm phận đại diện cho chức hệ thống Nói chung, mạng đƣợc phân tách thành lõi dày đặc ngoại vi đƣợc kết nối lỏng lẻo cách sử dụng phƣơng pháp phân rã mạng Phân rã lõi K dựa bậc nút thƣờng đƣợc sử dụng để xác định tập hợp cụ thể mạng, đƣợc gọi lõi k (k ≥ 1), k biểu thị mức lõi [12] Lõi k mạng G bao gồm tập hợp nút mạng G, đƣợc lấy theo quy tắc cắt tỉa sau Với mạng, tất nút có bậc < k đƣợc loại bỏ, với tƣơng tác qua chúng, khỏi mạng Quá trình loại bỏ đƣợc lặp lại bậc nút mạng lại ≥ k Lõi k biểu thị tập hợp nút cịn lại đó, lõi k1 tập lõi k2 k1 ≥ k2 Dựa định nghĩa K-Core mạng lƣới với K số bậc tối thiểu nút lõi, chúng tơi tìm mạng liệu eGov có số K-Core tối đa K=19 Nói cách khác, hệ thống liệu email có 19 cụm core nhƣ Hình Trong Hình 7, nốt có số K-Core thấp Nguyễn Minh Tân, Trần Tiến Dũng 653 nằm vị trí bên rìa hệ thống có màu tối Càng vào bên lõi hệ thống, nốt có số K-Core cao màu nóng Nói cách khác, nốt nằm bên lõi hệ thống có số bậc cao nốt xung quanh nắm vai trò chức hệ thống Bảng liệt kê danh sách 27/47 đơn vị xuất lõi hệ thống, đƣợc xếp theo thứ tự bảng chữ tỉ lệ % tham gia K-Core đơn vị Lõi gồm 27 đơn vị chức bao gồm: Ban Giám hiệu, Khoa, Phòng, Trung tâm, Viện nghiên cứu chức chủ chốt trƣờng đại học Nói cách khác, ngƣời nằm lõi đối tƣợng tác nghiệp chủ chốt trƣờng đại học Có thể ứng dụng kết phân tích để xếp lƣơng cho cán nhân viên trƣờng với 19 bậc lƣơng tƣơng ứng với 19 lớp lõi Hình Sự liên kết mơđun mạng liệu eGov Hình Mạng liệu Egov đƣợc phân lớp theo số K-Core Bảng Danh sách đơn vị thuộc vào lõi hệ thống STT 10 11 12 13 14 15 16 Tên đơn vị Ban Giám hiệu Khoa Công nghệ may & Thiết kế thời trang Khoa Cơ khí Khoa Cơng nghệ hố Khoa Cơng nghệ Ơ tơ Khoa Công nghệ thông tin Khoa Điện Khoa Điện tử Khoa Du lịch Khoa Giáo dục thể chất Khoa Kế toán - Kiểm tốn Khoa Lý luận trị - Pháp luật Khoa Ngoại ngữ Khoa Quản lý kinh doanh Phòng Đào tạo Phòng Hợp tác quốc tế % 25,00 2,90 3,80 8,10 2,70 5,00 2,70 4,60 4,10 7,60 2,20 2,40 1,40 1,90 68,40 50,00 ỨNG DỤNG MẠNG PHỨC HỢP TRONG KHAI PHÁ DỮ LIỆU TƢƠNG TÁC NGƢỜI DÙNG 654 STT 17 18 19 20 21 22 23 24 25 26 27 Tên đơn vị Phịng Khoa học cơng nghệ Phịng Tài - Kế tốn Phịng Thanh tra giáo dục Phịng Tổ chức - Hành Trung tâm Đánh giá Kỹ nghề Quan hệ doanh nghiệp Trung tâm Công nghệ thông tin Trung tâm Đào tạo quốc tế Trung tâm Đào tạo sau Đại học Trung tâm Quản lý chất lượng Trung tâm Việt - Hàn Viện Công nghệ - HaUI % 80,00 16,67 11,11 47,60 62,50 11,70 42,80 33,33 9,50 6,80 16,67 3.3 Kết phân tích phân bố số bậc Số bậc trung bình nốt 19,15, với phƣơng sai = 409,37, độ lệch chuẩn = 20,23, số bậc thấp cao tƣơng ứng 151 Nhƣ trung bình ngƣời tƣơng tác với khoảng 19 ngƣời khác, nhiều 151 Biểu đồ Scatter thể phân phối bậc mạng lƣới nhƣ Hình Trong biểu đồ hầu hết nốt có số bậc tập trung từ đến 30 Nhƣng có tồn số nốt có số bậc 60 Nhƣ vậy, theo biểu đồ lý thuyết đề cập mạng lƣới liệu eGov thuộc dạng mạng Scale-free với tính chất miễn dịch, khoảng cách, thẩm thấu đƣợc đề cập [13] Hình Biểu đồ scatter thể phân phối bậc mạng lƣới 3.4 Kết mối tương quan hệ số phân cụm số bậc Hệ số phân cụm (Ci) gắn kết cục nốt hay xác suất để hai ngƣời tƣơng tác với ngƣời thứ ba trực tiếp tƣơng tác với Một giá trị (Ci) lớn có nghĩa nốt i có kết nối chặt chẽ với hệ thống nốt kề Trong hệ số phân cụm trung bình (C) đo mật độ tồn nốt mạng Hệ số phân cụm trung bình (C) mạng liệu eGov 0,482 Hệ số phân cụm nốt phản ánh kết nối tới nốt kề với Nếu chọn hai nốt kề nốt mạng liệu eGov có khả hai nốt kề kết nối trực tiếp với 48,2 %, hệ số phân cụm trung bình (C) mạng liệu eGov 0,482 Hình Biểu đồ scatter mô tả tƣơng quan hệ số phân cụm số bậc Theo Hình 9, mạng lƣới đƣợc chia làm 02 phần Phần giá trị số bậc nhỏ 60, có kết nối dày đặc Phần thứ hai giá trị số bậc lớn 60, thể tƣơng quan âm hệ số phân cụm với số bậc, hệ số phân cụm giảm xuống cách nhanh chóng, nơi có kết nối thƣa có xu hƣớng tuyến tính Các nốt liên kết trực tiếp với nốt hub thƣờng tƣơng tác với Nguyễn Minh Tân, Trần Tiến Dũng 655 IV KẾT LUẬN Bài báo phân tích mạng liệu eGov phƣơng pháp tiếp cận mạng lƣới Trong đó, mạng liệu eGov đƣợc tạo thành kết hợp nốt đại diện cho cán giáo viên đƣợc liên kết cạnh đại diện cho tƣơng tác cán giáo viên trƣờng Đặc điểm tôpô mạng liệu cho thấy mạng liệu eGov thuộc dạng mạng Scale-Free, đƣợc đặc trƣng có hub lớn, nơi có nốt có bậc cao so với nốt khác mạng đại diện cho ngƣời có tầm ảnh hƣởng lớn trƣờng Các kết phân tích kiến trúc đƣợc tóm tắt nhƣ nhƣ sau: Mạng liệu eGov thuộc dạng mạng Scale-Free Mạng liệu đƣợc chia làm 16 mơđun, mơđun trung tâm, môđun môđun độc lập với hệ thống Mơđun 11 có số lƣợng ngƣời nhiều Mạng liệu có số K-Core lớn 19 Có 20/47 đơn vị thuộc vào vị trí lõi hệ thống Mỗi mơđun thƣờng có đến ngƣời “leader” quản lý mơđun đó, riêng mơđun 2, mơđun môđun 14 ngoại lệ; ba môđun có liên hệ mật thiết với có kiến trúc bền vững Trung bình ngƣời tƣơng tác với khoảng 19 ngƣời khác, nhiều 151 Xác suất để hai ngƣời tƣơng tác với ngƣời thứ ba tƣơng tác trực tiếp với 48,2 % V TÀI LIỆU THAM KHẢO [1] Hossain, M M and S Alam, “A complex network approach towards modeling and analysis of the Australian Airport Network” Journal of Air Transport Management, 60: pp 1-9, 2017 [2] Zou, Y., et al., “Complex network approaches to nonlinear time series analysis” Physics Reports, 787: pp 1-97, 2019 [3] Háznagy, A., et al “Complex network analysis of public transportation networks: A comprehensive study” in 2015 International Conference on Models and Technologies for Intelligent Transportation Systems (MT-ITS), 2015 [4] Zubin, J., “A technique for measuring like-mindedness” The Journal of Abnormal and Social Psychology, 33(4): pp 508-516, 1938 [5] Saxena, A., et al., “A review of clustering techniques and developments” Neurocomputing, 2017 267: pp 664681 [6] Linda, O and M Manic, “General Type-2 Fuzzy C-Means Algorithm for Uncertain Fuzzy Clustering” IEEE Transactions on Fuzzy Systems, 20(5): pp 883-897, 2012 [7] Melin, P and O Castillo, “A review on type-2 fuzzy logic applications in clustering, classification and pattern recognition” Applied Soft Computing, 21: pp 568-577, 2014 [8] Havens, T C., et al., “Fuzzy c-Means Algorithms for Very Large Data” IEEE Transactions on Fuzzy Systems, 20(6): pp 1130-1146, 2012 [9] Bharill, N., A Tiwari, and A Malviya, “Fuzzy Based Scalable Clustering Algorithms for Handling Big Data Using Apache Spark” IEEE Transactions on Big Data, 2(4): pp 339-352, 2016 [10] Tran, T.-D and Y.-K Kwon, “The relationship between modularity and robustness in signalling networks” Journal of The Royal Society Interface, 10(88): pp 20130771, 2013 [11] Truong, C.-D., T.-D Tran, and Y.-K Kwon, “MORO: a Cytoscape app for relationship analysis between modularity and robustness in large-scale biological networks” BMC Systems Biology, 10(4): pp 122, 2016 [12] Tran, T.-D and Y.-K Kwon, “Hierarchical closeness-based properties reveal cancer survivability and biomarker genes in molecular signaling networks” PLOS ONE, 13(6): pp e0199109, 2018 [13] Broido, A D and A Clauset, “Scale-free networks are rare” Nature Communications, 10(1): pp 1017.Author1_Name, Author2_Name, Web Caching and Replication, Addison-Wesley(Publication_ Name), USA, 2014, 2019 APPLYING COMPLEX NETWORK IN MINING USER INTERACTION DATA Nguyen Minh Tan, Tran Tien Dung ABSTRACT: A management information system is a computerized product of an organization's or enterprise's business processes By using the system modeling and analysis method according to network approach, the paper analyzes a complex network of user interaction data of management information system The data is a directed network of 1292 nodes and 968706 edges The analysis results obtained 16 modules, 19 core classes, the average order of each note is 19.15, with variance = 409.37, standard deviation σ = 20.23, average clustering coefficient is 0.482 From that, the analysis of the module structure, the relationship between the modules as well as the characteristics of the data network core The results can be used to validate the system and support the process design .. .ỨNG DỤNG MẠNG PHỨC HỢP TRONG KHAI PHÁ DỮ LIỆU TƢƠNG TÁC NGƢỜI DÙNG 650 Loại 3: Các thƣ lạc tƣơng tác có số lƣợng thƣ q ít, thƣ đƣợc mối quan hệ... dần Trong Bảng 1, thấy mơđun lớn môđun 11, lớn thứ hai môđun 8, nhỏ môđun 15 Sau đối chiếu môđun với danh sách cán đơn vị, nhận thấy hầu hết môđun mạng ỨNG DỤNG MẠNG PHỨC HỢP TRONG KHAI PHÁ DỮ LIỆU... Sau đƣa mạng liệu vừa xử lý vào phần mềm phân tích mạng Gephi để lọc trƣờng hợp tƣơng tác chiều cách sử dụng lọc Mutual Edge Sau loại bỏ trƣờng hợp tƣơng tác chiều, chúng tơi thu đƣợc mạng có