Chương này trình bày các chương trình thử nghiệm thuật toán kiểm tra đẳng cấu đồ thị còn và thuật toán FFSM trên 2 bộ dữ liệu là 2 kho đồ thị chứa lần lượt 10.000 đồ thị và 340 đồ thị. Kết quả thử nghiệm thuật toán FFSM được trình bày chi tiết ở bảng 3.2 bao gồm số đồ thị con phổ biến tìm được và thời gian chạy tương ứng với mỗi độ hỗ trợ tối thiểu (minsupp) cho trước.
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN * Kết luận
Luận văn này tập trung nghiên cứu về bài toán kiếm tra đẳng cấu đồ thị và khai phá đồ thị con phổ biến. Các kết quả chính mà luận văn đạt được như sau: - Giới thiệu khái quát về cấu trúc, các dạng biểu diễn đồ thị và các kỹ thuật khai phá dữ liệu đồ thị
- Trình bày thuật toán kiểm tra đẳng cấu đồ thị, đồ thị con và thuật toán FFSM trong khai phá dữ liệu đồ thị con phổ biến
- Lập trình thử nghiệm thuật toán kiểm tra đẳng cấu đồ thị con và thuật toán FFSM trên một số bộ dữ liệu lớn.
* Hướng phát triển
- Nghiên cứu chi tiết hơn về thuật toán gSpan và so sánh 2 thuật toán FFSM và gSpan. - Nghiên cứu phát triển các độ đo trên đồ thị mạng xã hội và xây dựng thuật toán phát hiện cấu trúc cộng đồng trên các mạng xã hội lớn, phức tạp.
TÀI LIỆU THAM KHẢO Tiếng Việt
[1]. Đoàn Văn Ban (chủ nhiệm đề tài), PHÂN TÍCH, PHÁT HIỆN CẤU TRÚC CỘNG ĐỒNG TRÊN MẠNG XÃ HỘI, Báo cáo đề tài VAST01.09/14-15, 2015 [2]. Hoàng Minh Quang, Vũ Đức Thi, Phạm Quốc Hùng, MỘT SỐ VẤN ĐỀ VỀ
KHAI PHÁ ĐỒ THỊ CON THƯỜNG XUYÊN ĐÓNG, Kỷ yếu Hội nghị Khoa học Quốc gia lần thứ IX “Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR'9)”; Cần Thơ, ngày 4-5/8/2016 DOI: 10.15625/vap.2016.00057
[3]. Hoàng Việt Dũng, KHAI PHÁ ĐỒ THỊ CON PHỔ BIẾN VÀ ỨNG DỤNG, LV ThS Trường ĐH CNTT & TT, 2018
Tiếng Anh
[4]. A. Inokuchi, T. Washio, and H. Motoda. An apriori-based algorithm for mining frequent substructures from graph data. In Proc. of the 4th European Conf. on Principles and Practices of Knowledge Discovery in Databases (PKDD), pages 13–23, 2000.
[5]. Ashay Dharwadker, John-Tagore Tevet, The Graph Isomorphism Algorithm,
Proceeding of Mathematics & the Structure Semiotics Research Group SERR, Euroacademy, 2009.
[6]. B.T. Messmer and H. Bunke, Subgraph Isomorphism in Polynomial Time, Institut für Informatik und angewandte Mathematik, University of Bern, Neubrückstr. 10, Bern, Switzerland, 1995.
[7]. Christian Borgelt. Graph Mining: Overview, 2009,
[8]. Dutta, K.: Graph Theoretic Approach to Social Network Analysis, International Journal of Scientific Research in Science and Technology, (4) 2: 1550-1557, (2018).
[9]. Girvan, M., Newman, M. E. J.: Community structure in social and biological networks, Proceedings of the National Academy of Sciences of the United States of America, Vol.99, No.12, pp. 7821-7826 (2002).
[10].J. Huan, W.Wang, and J. Prins. Efficient mining of frequent subgraph in the presence of isomorphism. UNC computer science technique report
TR03-021, 2003.
[11].John Boaz Lee, Ryan Rossi, and Xiangnan Kong. 2018. Graph Classification using Structural Attention. 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, In KDD 2018.
[12].L. Dehaspe, H. Toivonen, and R. D. King. Finding fre-quent substructures in chemical componuds. Proc. of the 4th International Conference on Knowledge Discovery and Data Mining, pages 30–6, 1998.
[13].M. Kuramochi and G. Karypis. Frequent subgraph discovery. In ICDM’01, 2001. [14].S. Raghavan and H. Garcia-Molina. Representing web graphs. In Proceedings of
the IEEE Intl. Conference on Data Engineering, 2003.
[15].Saif Ur Rehman, Asmat Ullah Khan, Simon Fong, Graph Mining: A Survey of Graph Mining Techniques, https://www.researchgate.net/publication/233801707
[16].Vincenzo Bonnici1† , Rosalba Giugno2*† , Alfredo Pulvirenti , Dennis Shasha, Alfredo Ferro, A subgraph isomorphism algorithm and its application to biochemical data, Bonnici et al. BMC Bioinformatics 2013, 14(Suppl 7):S13