Kiến nghị và hướng nghiên cứu tiếp theo

Một phần của tài liệu (LUẬN văn THẠC sĩ) khai phá đồ thị con thường xuyên trên mô hình mapreduce (Trang 76 - 79)

Khai phá dữ liệu là một lĩnh vực rất quan trọng. Nhiều lĩnh vực hiện nay đòi hỏi khai phá mẫu thường xuyên trên tập dữ liệu có cấu trúc phức tạp hơn chẳng hạn như cấu trúc hóa học các hợp chất, cấu trúc gen tế bào, cấu trúc các thành phần thuốc, v.v... Hầu hết các cấu trúc phức tạp đều có thể được biểu diễn dưới dạng cây hoặc đồ thị. Vì vậy, việc nghiên cứu các thuật toán khai phá đồ thị con thường xuyên là một vấn đề đã, đang và tiếp tục được các nhà nghiên cứu trong và ngoài nước nghiên cứu để tối ưu hóa nhất các thuật toán.

Hướng nghiên cứu tiếp theo của luận văn sẽ tiếp tục nghiên cứu và cài đặt các thuật toán khai phá đồ thị con thường xuyên còn lại (Subdue, FSG, gSpan, FFSM) theo mô hình MapReduce để có thể so sánh, đánh giá và khẳng định tính hiệu quả của chúng trong khai phá dữ liệu đồ thị từ các dữ liệu đồ thị lớn.

DANH MỤC TÀI LIỆU THAM KHẢO

[1] Bismita Srichandan, Rajshekhar Sunderraman, (2011), OO-FSG: An Object- Oriented Approach to Mine Frequent Subgraphs, Proceedings of the 9-th Australasian Data Mining Conference (AusDM'11), Ballarat, Australia, pp.11-12

[2] Cheng-Tao Chu, Sang Kyun Kim, Gary Bradski, Andrew Y. Ng, Kunle Olukotun, (2007), Map-Reduce for Machine Learning on Multicore, Stanford University.

[3] Chuck Lam, (2010), Hadoop in Action, Manning Publications

[4] Holder L. B., Cook D. J., Djoko S., (1994), Substucture discovery in the SUBDUE system. Paper presented at the Proceedings of the AAAI Workshop on Knowledge Disscovery in Databases, pp.169-180

[5] Horst Bunke, Kim Shearer, (1998), A graph distance metric based on the maximal common subgraph, Pattern Recognition Letters.

[6] Huan J., Wang W., Prins J., (2003), Efficient mining of frequent subgraphsin the presence of isomorphism, Proceedings of the 2003 International Conference on Data Mining (ICDM 2003), pp.549-552 [7] Inokuchi, Washio and Motoda, (2003), A General Framework for

Mining Frequent Subgraphs from Labeled Graphs, IBM Research Report, RT0513.

[8] J. Cheng, Y. Ke, W. Ng, and A. Lu (2007), “Fg-index: towards verification-free query processing on graph databases,” in SIGMOD, pp. 857–872.

[9] Jeffrey Dean and Sanjay Ghemawat, (2004), Mapreduce: Simplified Data Processing on Large Clusters, OSDI 2004.

[10] Kuramochi M., Karypis G., (2004), An efficient algorithm for discoveringfrequent subgraphs, IEEE Transactions on Knowledge and DataEngineering, pp.1038-1051

[11] Lawrence B. Holder, Nikhil S. Ketkar, Diane J. Cook, (2005), Subdue: Compression-Based Frequent Pattern Discovery in Graph Data. Paper presented at the Proceedings of the ACM SIGKDD 1st International Workshop on Open source Data Mining, pp.5-6.

[12] Lawrence B. Holder, Diane J. Cook, (2006), Mining Graph Data, Wileyinterscience a john wiley & sons, inc., publication, pp.101-154. [13] Mansurul A. Bhuiyan and Mohammad Al Hasan, (2015), An Iterative

MapReduce Based Frequent Subgraph Mining Algorithm, Ieee transactions on knowledge and data engineer-ing, vol. 27, no. 3.

[14] T. Ramraja, R.Prabhakarb (2015), Frequent Subgraph Mining Algorithms – A Survey, Procedia Computer Science 47, page(s): 197 – 204.

[15] Xifeng Yan, Jiawei Han, (2002), gSpan: Graph-Based Substructure Pattern Mining, IEEE Intrnational Conference on Data Mining, pp.5-6.

Một phần của tài liệu (LUẬN văn THẠC sĩ) khai phá đồ thị con thường xuyên trên mô hình mapreduce (Trang 76 - 79)

Tải bản đầy đủ (PDF)

(79 trang)