Bài toán đồ thị con đẳng cấu trong khai phá dữ liệu đồ thị và ứng dụng phát hiện đồ thị con phổ biến (Luận văn thạc sĩ)

66 14 0
Bài toán đồ thị con đẳng cấu trong khai phá dữ liệu đồ thị và ứng dụng phát hiện đồ thị con phổ biến (Luận văn thạc sĩ)

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Bài toán đồ thị con đẳng cấu trong khai phá dữ liệu đồ thị và ứng dụng phát hiện đồ thị con phổ biến (Luận văn thạc sĩ)Bài toán đồ thị con đẳng cấu trong khai phá dữ liệu đồ thị và ứng dụng phát hiện đồ thị con phổ biến (Luận văn thạc sĩ)Bài toán đồ thị con đẳng cấu trong khai phá dữ liệu đồ thị và ứng dụng phát hiện đồ thị con phổ biến (Luận văn thạc sĩ)Bài toán đồ thị con đẳng cấu trong khai phá dữ liệu đồ thị và ứng dụng phát hiện đồ thị con phổ biến (Luận văn thạc sĩ)Bài toán đồ thị con đẳng cấu trong khai phá dữ liệu đồ thị và ứng dụng phát hiện đồ thị con phổ biến (Luận văn thạc sĩ)Bài toán đồ thị con đẳng cấu trong khai phá dữ liệu đồ thị và ứng dụng phát hiện đồ thị con phổ biến (Luận văn thạc sĩ)Bài toán đồ thị con đẳng cấu trong khai phá dữ liệu đồ thị và ứng dụng phát hiện đồ thị con phổ biến (Luận văn thạc sĩ)Bài toán đồ thị con đẳng cấu trong khai phá dữ liệu đồ thị và ứng dụng phát hiện đồ thị con phổ biến (Luận văn thạc sĩ)Bài toán đồ thị con đẳng cấu trong khai phá dữ liệu đồ thị và ứng dụng phát hiện đồ thị con phổ biến (Luận văn thạc sĩ)Bài toán đồ thị con đẳng cấu trong khai phá dữ liệu đồ thị và ứng dụng phát hiện đồ thị con phổ biến (Luận văn thạc sĩ)Bài toán đồ thị con đẳng cấu trong khai phá dữ liệu đồ thị và ứng dụng phát hiện đồ thị con phổ biến (Luận văn thạc sĩ)Bài toán đồ thị con đẳng cấu trong khai phá dữ liệu đồ thị và ứng dụng phát hiện đồ thị con phổ biến (Luận văn thạc sĩ)Bài toán đồ thị con đẳng cấu trong khai phá dữ liệu đồ thị và ứng dụng phát hiện đồ thị con phổ biến (Luận văn thạc sĩ)Bài toán đồ thị con đẳng cấu trong khai phá dữ liệu đồ thị và ứng dụng phát hiện đồ thị con phổ biến (Luận văn thạc sĩ)Bài toán đồ thị con đẳng cấu trong khai phá dữ liệu đồ thị và ứng dụng phát hiện đồ thị con phổ biến (Luận văn thạc sĩ)Bài toán đồ thị con đẳng cấu trong khai phá dữ liệu đồ thị và ứng dụng phát hiện đồ thị con phổ biến (Luận văn thạc sĩ)Bài toán đồ thị con đẳng cấu trong khai phá dữ liệu đồ thị và ứng dụng phát hiện đồ thị con phổ biến (Luận văn thạc sĩ)Bài toán đồ thị con đẳng cấu trong khai phá dữ liệu đồ thị và ứng dụng phát hiện đồ thị con phổ biến (Luận văn thạc sĩ)Bài toán đồ thị con đẳng cấu trong khai phá dữ liệu đồ thị và ứng dụng phát hiện đồ thị con phổ biến (Luận văn thạc sĩ)Bài toán đồ thị con đẳng cấu trong khai phá dữ liệu đồ thị và ứng dụng phát hiện đồ thị con phổ biến (Luận văn thạc sĩ)Bài toán đồ thị con đẳng cấu trong khai phá dữ liệu đồ thị và ứng dụng phát hiện đồ thị con phổ biến (Luận văn thạc sĩ)Bài toán đồ thị con đẳng cấu trong khai phá dữ liệu đồ thị và ứng dụng phát hiện đồ thị con phổ biến (Luận văn thạc sĩ)Bài toán đồ thị con đẳng cấu trong khai phá dữ liệu đồ thị và ứng dụng phát hiện đồ thị con phổ biến (Luận văn thạc sĩ)Bài toán đồ thị con đẳng cấu trong khai phá dữ liệu đồ thị và ứng dụng phát hiện đồ thị con phổ biến (Luận văn thạc sĩ)Bài toán đồ thị con đẳng cấu trong khai phá dữ liệu đồ thị và ứng dụng phát hiện đồ thị con phổ biến (Luận văn thạc sĩ)Bài toán đồ thị con đẳng cấu trong khai phá dữ liệu đồ thị và ứng dụng phát hiện đồ thị con phổ biến (Luận văn thạc sĩ)Bài toán đồ thị con đẳng cấu trong khai phá dữ liệu đồ thị và ứng dụng phát hiện đồ thị con phổ biến (Luận văn thạc sĩ)Bài toán đồ thị con đẳng cấu trong khai phá dữ liệu đồ thị và ứng dụng phát hiện đồ thị con phổ biến (Luận văn thạc sĩ)Bài toán đồ thị con đẳng cấu trong khai phá dữ liệu đồ thị và ứng dụng phát hiện đồ thị con phổ biến (Luận văn thạc sĩ)Bài toán đồ thị con đẳng cấu trong khai phá dữ liệu đồ thị và ứng dụng phát hiện đồ thị con phổ biến (Luận văn thạc sĩ)Bài toán đồ thị con đẳng cấu trong khai phá dữ liệu đồ thị và ứng dụng phát hiện đồ thị con phổ biến (Luận văn thạc sĩ)Bài toán đồ thị con đẳng cấu trong khai phá dữ liệu đồ thị và ứng dụng phát hiện đồ thị con phổ biến (Luận văn thạc sĩ)Bài toán đồ thị con đẳng cấu trong khai phá dữ liệu đồ thị và ứng dụng phát hiện đồ thị con phổ biến (Luận văn thạc sĩ)Bài toán đồ thị con đẳng cấu trong khai phá dữ liệu đồ thị và ứng dụng phát hiện đồ thị con phổ biến (Luận văn thạc sĩ)Bài toán đồ thị con đẳng cấu trong khai phá dữ liệu đồ thị và ứng dụng phát hiện đồ thị con phổ biến (Luận văn thạc sĩ)

ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THƠNG PHẠM THỊ LIÊN BÀI TỐN ĐỒ THỊ CON ĐẲNG CẤU TRONG KHAI PHÁ DỮ LIỆU ĐỒ THỊ VÀ ỨNG DỤNG PHÁT HIỆN ĐỒ THỊ CON PHỔ BIẾN LUẬN VĂN THẠC SĨ: KHOA HỌC MÁY TÍNH Thái Nguyên - 2020 LỜI CAM ĐOAN Tôi xin cam đoan luận văn tự thân tơi tìm hiểu, nghiên cứu hướng dẫn PGS TS Đoàn Văn Ban Các chương trình thực nghiệm thân tơi lập trình, kết hồn tồn trung thực Các tài liệu tham khảo trích dẫn thích đầy đủ TÁC GIẢ LUẬN VĂN Phạm Thị Liên LỜI CẢM ƠN Tôi xin bày tỏ lời cảm ơn chân thành tới tập thể thầy cô giáo Viện công nghệ thông tin – Viện Hàn lâm Khoa học Công nghệ Việt Nam, thầy cô giáo Trường Đại học Công nghệ thông tin truyền thông - Đại học Thái Nguyên dạy dỗ chúng tơi suốt q trình học tập chương trình cao học trường Đặc biệt tơi xin bày tỏ lịng biết ơn sâu sắc tới thầy giáo PGS.TS Đoàn Văn Ban quan tâm, định hướng đưa góp ý, chỉnh sửa q báu cho tơi q trình làm luận văn tốt nghiệp Cũng bạn bè, đồng nghiệp, gia đình người thân quan tâm, giúp đỡ chia sẻ với suốt q trình làm luận văn tốt nghiệp Dù có nhiều cố gắng chắn không tránh khỏi thiếu sót mong nhận đóng góp ý kiến thầy, bạn để luận văn hồn thiện Tơi xin chân thành cảm ơn! Thái Nguyên, tháng 08 năm 2020 Phạm Thị Liên MỤC LỤC Trang MỞ ĐẦU CHƯƠNG 1: KHAI PHÁ ĐỒ THỊ 1.1 Cấu trúc đồ thị 1.2 Các dạng biểu diễn cấu trúc liệu đồ thị 1.2.1 Danh sách liên thuộc 1.2.2 Danh sách liền kề 1.2.3 Ma trận liên thuộc 1.2.4 Ma trận liền kề 1.2.5 Dạng tắc đồ thị 10 1.3 Các kỹ thuật khai phá đồ thị 14 1.3.1 Phát cấu trúc cộng đồng mạng xã hội 15 1.3.2 Khai phá đồ thị thường xuyên đóng 19 1.4 Tổng kết chương 20 CHƯƠNG 2: BÀI TOÁN ĐỒ THỊ ĐẲNG CẤU VÀ KHAI PHÁ ĐỒ THỊ CON PHỔ BIẾN 21 2.1 Bài toán đồ thị đẳng cấu 21 2.2 Thuật toán kiểm tra đồ thị đẳng cấu 24 2.2.1 Thuật toán Dijsktra tìm đường ngắn 24 2.2.2 Thuật tốn tính khoảng cách d(u, v) đồ thị phụ thêm đồ thị kết đôi 24 2.2.3 Thuật toán xác ma trận dấu dạng tắc 25 2.2.4 Thuật toán xếp đỉnh hai đồ thị để kiểm tra tính đẳng cấu chúng dựa vào dạng tắc 26 2.2.5 Một số tính chất đồ thị đẳng cấu 26 2.3 Bài toán đẳng cấu đồ thị SGI 30 2.3.1 Một số khái niệm sở ký hiệu 31 2.3.2 Cây định đồ thị 32 2.3.3 Thuật toán xây dựng định 36 2.4 Khai phá đồ thị phổ biến 40 2.4.1 Cây đồ thị dạng tắc 40 2.4.2 Phép kết nối N-Join hai đồ thị 41 2.4.3 Phép N-Extension 43 2.5 Thuật toán FFSM cho khai phá đồ thị phổ biến CSDL đồ thị 44 2.6 Kết luận chương 47 CHƯƠNG THỬ NGHIỆM VÀ ĐÁNH GIÁ 48 3.1 Dữ liệu môi trường thử nghiệm 48 3.1.1 Bộ liệu thử nghiệm 48 3.1.2 Môi trường thử nghiệm 49 3.2 Cài đặt thử nghiệm thuật tốn tìm kiếm tra đồ thị đẳng cấu 50 3.2.1 Mơ tả u cầu tốn kiếm tra đồ thị đẳng cấu 50 3.2.2 Kết thử nghiệm 50 3.3 Thử nghiệm thuật toán FFSM cho khai phá đồ thị phổ biến 53 3.3.1 Mơ tả u cầu tốn khai phá đồ thị phổ biến 53 3.3.2 Phân tích đánh giá kết 53 3.4 Kết luận chương 55 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 56 TÀI LIỆU THAM KHẢO 57 THUẬT NGỮ VÀ TỪ VIẾT TẮT Thuật ngữ Diễn giải CAM Canonical Adjacency Matrix Community Social Structure Cấu trúc cộng đồng mạng xã hội CSDL Cơ sở liệu FFSM FastFrequent Subgraph Mining GI Graph isomorphism - Đẳng cấu đồ thị Graph isomorphism problem Bài toán đồ thị đẳng cấu SFI Viện Santa Fe SGI SubGraph Isomorphism – Đẳng cấu đồ thị DANH MỤC CÁC HÌNH VẼ Hình 1.1 Các đồ thị vơ hướng có hướng Hình 1.2 Hợp hai đồ thị Hình 1.3 G1’ phần bù G1 Hình 1.4 Danh sách liên thuộc đồ thị Hình 1.5 Đồ thị vơ hướng Hình 1.6 Biểu diễn danh sách liền kề đồ thị hình 1.5 Hình 1.7 Ma trận liên thuộc đồ thị vô hướng Hình 1.8 Ma trận liền kề đồ thị ví dụ 1.6 Hình 1.9 Các đồ thị cực đại 11 Hình 1.10 Mạng lưới cộng tác nhà khoa học làm việc SFI [1] 17 Hình 2.1 Các phần tử hàng - cột ma trận liền kề 33 Hình 2.2 Cây định để phân lớp ma trận liền kề G 34 Hình 2.3 Cấu trúc từ điển mục cho định 35 Hình 2.4 Cây định G G’ 35 Hình 2.5 Cây định compact để phân lớp ma trận liền kề {A, B, …, F} {A’, B’, …, F’} đồ thị G G’ 37 Hình 2.6 Hai phép toán N-Join va N-Extension 43 Hình 3.1 Mơ tả cấu trúc liệu thử nghiệm với kho gồm đồ thị 48 Hình 3.2 Bộ liệu đơn giản thử nghiệm thuật toán kiểm tra đồ thị đẳng cấu 51 Hình 3.3 Kết đồ thị đẳng cấu với liệu đơn giản 51 Hình 3.4 Kết đồ thị đẳng cấu với đồ thị target có kích thước lớn 52 Hình 3.5 Ví dụ khơng tồn đẳng cấu đồ thị 52 Hình 3.6 Thời gian chạy thuật tốn FFSM liệu 10000 đồ thị 53 Hình 3.7 Số đồ thị tìm ứng với độ hộ trợ tối thiểu khác liệu 10.000 đồ thị 54 DANH MỤC CÁC BẢNG Bảng 3.1 Thông tin phần cứng sử dụng thử nghiệm 49 Bảng 3.2 Tổng hợp kết chạy thuật toán FFSM liệu 54 MỞ ĐẦU Lý chọn đề tài Khai phá liệu lĩnh vực nhiều người tập trung nghiên cứu phát triển nhiều ứng dụng phổ biến Trong đó, tốn khai phá đồ thị thường xun thu hút nhiều quan tâm nghiên cứu phạm vi ứng dụng quan trọng nhiều lĩnh vực khác tin-sinh (bioinformatics), tinhóa (cheminformatics) khai thác đăng nhập trang web, lập mục video, hay lập mục sở liệu hiệu quả, Vấn đề khai phá mẫu thường xuyên từ tập liệu đối tượng với ngưỡng độ hỗ trợ tối thiểu minsup Dữ liệu đa dạng từ liệu nhị phân, liệu số nguyên, số thực liệu có cấu trúc phức tạp cấu trúc cây, đồ thị, … Cho đến chưa có lời giải hiệu cho toán độ phức tạp tốn lớn đồ thị có số đỉnh lớn mật độ cạnh dày Tuy nhiên, phức tạp vấn đề giảm sở liệu (CSDL) đồ thị có thêm thông tin đỉnh cạnh gán nhãn Có thể sử dụng nhãn để hạn chế đỉnh tạo thành cặp trình kiểm tra đẳng cấu đồ thị Và lý em lựa chọn đề tài “Bài toán đồ thị đẳng cấu khai phá liệu đồ thị ứng dụng phát đồ thị phổ biến” để nghiên cứu làm luận văn thạc sĩ Mục đích nghiên cứu Nghiên cứu thuật toán đẳng cấu đồ thị thuật toán phát đồ thị phổ biến CSDL đồ thị Đối tượng nghiên cứu - Bài toán đồ thị đẳng cấu - Khai phá liệu đồ thị - Bài toán khai phá đồ thị phổ biến CSDL đồ thị - Thuật toán FFSM - Thuật toán SGI Decision Tree Phạm vi nghiên cứu + Lý thuyết: - Tìm hiểu lý thuyết đồ thị phương pháp khai phá liệu đồ thị - Nghiên cứu thuật tốn tìm đồ thị đẳng cấu thuật toán khai phá đồ thị phổ biến + Thực nghiệm: - Xây dựng chương trình thực nghiệm thuật tốn - Áp dụng chương trình số sở liệu khai phá liệu đồ thị Ý nghĩa khoa học Đây hướng nghiên cứu lý thuyết, xây dựng thuật tốn tìm kiếm đồ thị đẳng cấu đồ thị phổ biến kiểm thử liệu đồ thị Phương pháp nghiên cứu - Phương pháp nghiên cứu lý thuyết: Sưu tập tài liệu có liên quan đến đề tài, nghiên cứu để hiểu sâu nội dung vấn đề cần nghiên cứu - Phương pháp nghiên cứu thực nghiệm: Cài đặt chương trình thử nghiệm phương pháp tìm kiếm đồ thị đẳng cấu thuật toán FFSM để liệt kê đồ thị phổ biến liệu đánh giá hiệu suất phương pháp - Phương pháp trao đổi khoa học: Trao đổi nội dung nghiên cứu với giáo viên hướng dẫn, với đồng nghiệp để đề xuất giải nội dung luận văn đề Cấu trúc đề tài Luận văn chia thành phần sau: Chương 1: Khai phá liệu đồ thị Chương 2: Đồ thị đẳng cấu đồ thị phổ biến Chương 3: Thử nghiệm thuật tốn tìm đồ thị phổ biến Kết luận hướng phát triển 44 kiếm theo chiều sâu T G, đường bên phải G thể qua T đường bên phải T Thuật toán gSpan chọn T tìm kiếm theo chiều sâu để sinh dạng tắc G theo phép mở rộng Phép N-Extension thực sở cải tiến phép mở rộng cách chọn đỉnh dạng tắc CAM bổ sung cạnh liền kề với đỉnh cần bổ sung Phép N-Extension định nghĩa theo giả mã sau N-Extension Input: Ma trận liền kề A = {ai, j |  i, j  n} đồ thị G Output: S tập ma trận liền kề B = {bi, j |  i, j  n+1} cho A ma trận cực đại B Thuật toán N-Extension: if (A ma trận liền kề ngoại) for (nl, el) ∈ LV × LE Tạo lập ma trận B={bi, ai, bi,j = == j j then |1  i, j  n} cho < i, j ≤ n i = n + 1, < j < n el i = n + 1, j = n nl i = n + 1, j = n + S ← S ∪ {B} end for else S ←  end if 2.5 Thuật toán FFSM cho khai phá đồ thị phổ biến CSDL đồ thị Trong thuật toán sau sử dụng CAM(G) để ký hiệu cho tất CAM đồ thị G X.isCAM biến Boolean ma trận X có phải CAM mà biểu diễn hay khơng 45 Thuật tốn FFSM Input: CSDL đồ thị GD độ hỗ trợ  (0 <  ≤ 1) Output: Tập S tất đồ thị liên thông G 1: S ← { CAM phổ biến đỉnh cạnh} 2: P ← { CAM phổ biến cạnh } 3: FFSM-Explore(P, S); Thuật toán FFSM-Explore Input: U, danh sách CAM tối ưu cục W , tập CAM đồ thị phổ biến Output: Tập W chứa tất CAM đồ thị phổ biến tìm thấy for X ∈ P if (X.isCAM) then W ← W ∪ {X}, C ← Φ for Y ∈ P C ← C∪ FFSM-Join(X, Y ) C ← C∪ FFSM-Extension(X) Loại khỏi C CAM mà khơng phổ biến khơng tối ưu FFSM-Explore(C, W ) end if end for Định nghĩa 2.13 Cho trước ma trận liền kề A = {ai, j | i, j = n} đồ thị G = (V, E, L, l), danh sách đỉnh L = u1, u2, , un, ui  V gọi danh sách nhúng A vào G nếu: (i) ∀ i, (ai, i = l(ui)); (ii) ∀ i, j (ai, j  ⇒ ai,j = l(ui, uj )) với < j < i ≤ n Tập tất danh sách nhúng ma trận liền kề CSDL gọi tập đỉnh nhúng Cho trước hai CAM tối ưu cục hai tập nhúng tương ứng chúng, thay đổi hai phép tốn kết nối mở rộng để không thực 46 việc biểu diễn đồ thị ứng viên mà xác định tập nhúng Trước tiên ta xét trường hợp kết nối (join case 1) đồ thị Cho trước P Q hai ma trận liên kết nội tối ưu cục CAM tối ưu cục {A} = join(P, Q) Danh sách L đỉnh nhúng A G Hiển nhiên L danh sách nhúng P Q G Mặt khác, danh sách L đỉnh nhúng P Q L danh sách đỉnh nhúng A G A khơng chứa nhiều cạnh khác so với P Q) Từ suy ra, tập đỉnh nhúng OA A, kết nối từ P Q thông qua trường hợp kết nối 1, ta có OA = OP ∩ OQ, OP OQ tập đỉnh nhúng P Q tương ứng Tương tự trường hợp (join case 2), ({A} = join(P, Q), P ma trận nội Q ma trận ngoại, ta có OA = {L | L = u1, u2, , un−2, un−1, un, L ∈ OQ, L’ = u1, u2, , un−2, un−1∈ OP} Đối với trường hợp 3a (join case 3a) ({A} = join(P, Q), P Q ma trận ngoại (P Q có kích cỡ sau kết nối), ta có OA = OP ∩ OQ Trường hợp 3b (join case 3b) ({A} = join(P, Q), P Q ma trận ngoại, A có cỡ lớn so với P Q sau kết nối, ta có OA = {L | L = u1, u2, , un, L’ = u1, u2, , un−3, un−2, un−1 ∈ OP, L’’ = u1, u2, , un−3, un−2, un ∈ OQ} Đối với phép mở rộng, tính tập đỉnh nhúng theo thuật tốn sau: Tính tập đỉnh nhúng phép tốn N-Extension [15] Input: A ma trận CAM cỡ n × n Output: Tập S tất CAM tối ưu cục mở rộng từ A tập nhúng chúng for L = u1, u2, , un ∈ OA // Với danh sách nhúng L Đặt G đồ thị có đỉnh L for node v ∈ V [G] ∧ v  L ∧ (v, un) ∈ E[G] Tạo lập ma trận B = {bi, j |  i, j  n + 1}, 47 bi,j = ai, j < i, j ≤ n i = n + 1, < j < n lG(v, un) lG(v) i = n + 1, j = n i = n + 1, j = n + OB ← OB ∪ {(gi, Lv)} S ← S ∪ {B} end for end for Trong đó, lG ánh xạ G để xác định nhãn đỉnh, cạnh đồ thị Lv danh sách ghép L với đỉnh v 2.6 Kết luận chương Chương chia thành phần chính: Phần thứ trình bày khái niệm đẳng cấu, thuật toán kiểm tra đồ thị đẳng cấu thuật toán đẳng cấu đồ thị Phần thứ hai trình bày khai phá đồ thị phổ biến với thuật toán như: biểu diễn đồ thị dạng tắc, phép kết nối N-Join N-Extension, thuật toán FFSM 48 CHƯƠNG THỬ NGHIỆM VÀ ĐÁNH GIÁ 3.1 Dữ liệu môi trường thử nghiệm 3.1.1 Bộ liệu thử nghiệm Bộ liệu sử dụng luận văn bao gồm kho (cơ sở liệu) đồ thị lưu file dạng txt Kho đồ thị có cấu trúc hình 3.1 Hình 3.1 Mơ tả cấu trúc liệu thử nghiệm với kho gồm đồ thị Trong hình 3.1, “t # N” nghĩa đồ thị thứ N kho đồ thị, “v M L” tức đỉnh M đồ thị có nhãn L, "e P Q L" nghĩa cạnh nối đỉnh P Q có nhãn L Mỗi đồ thị ngăn cách với dấu xuống dòng Kết thúc file có cấu trúc "t # -1" Bộ liệu thứ “dataset.txt” gồm 10.000 đồ thị với đồ thị bé bao gồm đỉnh cạnh, đồ thị lớn bao gồm 214 đỉnh 217 cạnh Để thuận tiện cho việc đánh giá, chia liệu thành liệu nhỏ ký hiệu Q4.txt, Q8.txt, Q12.txt, Q16.txt, Q.20.xt Q24.txt Mỗi liệu 49 chứa 1.000 đồ thị Trong đó, “Qx.txt” chứa đồ thị có số cạnh nhỏ “x” cạnh Bộ liệu thứ hai tập liệu hợp chất hóa học (Chemical Compound Datasets) Tập liệu có 340 hợp chất hóa học, hợp chất mơ hình hóa đồ thị vơ hướng Trong tập liệu có 66 kiểu nguyên tử (atom) kiểu liên kết (single, double, triple, aromatic bond) Các thông tin nguyên tử liên kết lưu trữ file riêng biệt sử dụng thủ tục giới thiệu tài liệu [15] xây dựng đồ thị cho tập liệu Bộ liệu lưu tệp tin “Chemical_340.txt” bao gồm 340 đồ thị, với đồ thị bé gồm đỉnh cạnh, đồ thị lớn bao gồm 214 đỉnh 214 cạnh Toàn bộ liệu tải địa chỉ: https://drive.google.com/file/d/1_vyR1_C9kLTG1 3qJH3DoVnteNtL8Kx/view?u sp=sharing 3.1.2 Môi trường thử nghiệm - Phần cứng: Các thông tin phần cứng sử dụng luận văn thể bảng 3.1 Bảng 3.1 Thông tin phần cứng sử dụng thử nghiệm Thông tin phần cứng Chỉ số CPU i7-4790 core 3.6GHz RAM 20GB tốc độ bus:1666Mhz GPU Không HDD 1TB tốc độ 7200rpm OS Ubuntu 18.04 phiên 64bit - Phần mềm ngơn ngữ lập trình Các thuật toán sử dụng để phát cộng đồng mạng lập trình ngơn ngữ Python phiên 3.6 Trình biên dịch python thư viện mặc định cài đặt thông qua phần mềm Anaconda tải địa chỉ: https://www.anaconda.com/distribution/ 50 Trình hỗ trợ soạn thảo lập trình (IDE) Pycharm Community (Free) tải địa chỉ: https://www.jetbrains.com/pycharm/download - Thư viện hỗ trợ Để hỗ trợ cho việc đọc, ghi biểu diễn đồ thị sử dụng thư viện networkx Python cài thông qua lệnh: “pip install networkx” Phiên networkx sử dụng luận văn 2.4 Để hiển thị đồ thị lưu lại dạng tệp tin ảnh sử dụng thư viên matplotlib có sẵn Anaconda Nếu chưa có, cài đặt thư viện matplotlib theo dòng lệnh “conda install matplotlib” Phiên sử dụng luận văn 3.2.0 3.2 Cài đặt thử nghiệm thuật tốn tìm kiếm tra đồ thị đẳng cấu 3.2.1 Mơ tả yêu cầu toán kiếm tra đồ thị đẳng cấu Cho độ thị Graph A Graph B, kiểm tra xem đồ thị A có đẳng cấu với đồ thị B hay không Input: Graph A graph B Output:  Yes: Nếu graph A đẳng cấu với graph B đưa phép ánh xạ đẳng cấu  No: Nếu graph A không đẳng cấu với graph B 3.2.2 Kết thử nghiệm Đầu tiên, tiến hành thử nghiệm với kho gồm đồ thị hình 3.2 Trong đó, đồ thị Source Target có đỉnh cạnh 51 Hình 3.2 Bộ liệu đơn giản thử nghiệm thuật toán kiểm tra đồ thị đẳng cấu Kết kiểm tra đồ thị Source Target hình 3.2 thể hình 3.3 Ta thấy đồ thị đẳng cấu với thông qua ánh xạ là: 04, 11, 23, 30, 42 04, 11, 22, 30, 43 Trong hình 3.2 đồ thị Source thể bên trái với đỉnh màu đỏ cạnh màu xanh, đồ thị Target thể bên phải với đỉnh màu xanh cạnh màu vàng Hình 3.3 Kết đồ thị đẳng cấu với liệu đơn giản 52 Tiếp theo, xét trường hợp đồ thị có kích thước lớn Hình 3.4 mơ tả kết ánh xạ đồ thị Source với đồ thị đồ thị Target, đồ thị Source có đỉnh cạnh, cịn đồ thị target có 214 đỉnh 217 cạnh Hình 3.4 Kết đồ thị đẳng cấu với đồ thị target có kích thước lớn Hình 3.5 mơ tả kết khơng tồn đồ thị đẳng cấu đồ thị Source đồ thị Target Hình 3.5 Ví dụ không tồn đẳng cấu đồ thị 53 3.3 Thử nghiệm thuật toán FFSM cho khai phá đồ thị phổ biến 3.3.1 Mơ tả u cầu tốn khai phá đồ thị phổ biến Cho trước kho đồ thị độ hỗ trợ tối thiểu (minsupp), yêu cầu tìm liệt kê tất đồ thị phổ biến G (sup(G) > minsupp) Input: Một CSDL (kho) đồ thị D = {G1, G2, …Gn} độ hỗ trợ tối thiểu minsupp Output: D’ = {Gk, 0

Ngày đăng: 12/05/2021, 15:44

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan