1. Trang chủ
  2. » Luận Văn - Báo Cáo

Khai thác mẫu phổ biến và luật từ cơ sở dữ liệu chuỗi

131 13 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Khai Thác Mẫu Phổ Biến Và Luật Từ Cơ Sở Dữ Liệu Chuỗi
Tác giả Trần Minh Thái
Người hướng dẫn PGS.TS. Lê Hoài Bắc
Trường học Đại Học Quốc Gia Thành Phố Hồ Chí Minh
Chuyên ngành Khoa Học Máy Tính
Thể loại Luận Án Tiến Sĩ
Năm xuất bản 2016
Thành phố Tp. Hồ Chí Minh
Định dạng
Số trang 131
Dung lượng 2,54 MB

Nội dung

Ngày đăng: 11/07/2021, 16:37

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] M. Gupta and J. Han, "Applications of pattern discovery using sequential data mining," Pattern Discovery Using Sequence Data Mining: Applications and Studies, pp. 1-23, 2012 Sách, tạp chí
Tiêu đề: Applications of pattern discovery using sequential data mining
[2] M. J. Zaki and W. Meira Jr, "Data mining and analysis: fundamental concepts and algorithms," Cambridge University Press, 2014 Sách, tạp chí
Tiêu đề: Data mining and analysis: fundamental concepts and algorithms
[3] C. Wang and A. Lee, "Mining inter-sequence patterns," Expert Systems with Applications, 36(4), pp. 8649-8656, 2009 Sách, tạp chí
Tiêu đề: Mining inter-sequence patterns
[4] C. Wang, Y.-H. Liu and K. Chu, "Closed inter-sequence pattern mining," The Journal of Systems and Software, 86, pp. 1603-1612, 2013 Sách, tạp chí
Tiêu đề: Closed inter-sequence pattern mining
[5] B. Liu, "Web data mining: exploring hyperlinks, contents, and usage data," Springer Science & Business Media, 2011 Sách, tạp chí
Tiêu đề: Web data mining: exploring hyperlinks, contents, and usage data
[6] J. Han, M. Kamber and J. Pei, "Data mining: concepts and techniques", Elsevier, 2012 Sách, tạp chí
Tiêu đề: Data mining: concepts and techniques
[7] J. Yang, D. Evans, D. Bhardwaj, T. Bhat and M. Das, "Mining temporal API Rules from Imperfect Traces," Proceedings of International Conference on Software Engineering, pp. 282–291, 2006 Sách, tạp chí
Tiêu đề: Mining temporal API Rules from Imperfect Traces
[8] M. Zhang, W. Hsu and M. -L. Lee, "Mining progressive confident rules," Proceedings of SIGKDD Conference on Knowledge Discovery and Data Mining, pp. 803–808, 2006 Sách, tạp chí
Tiêu đề: Mining progressive confident rules
[9] E. Baralis, S. Chiusano and R. Dutto, "Applying Sequential Rules to Protein Localization Prediction," Computer and Mathematics with Applications 55 (5), pp. 867–878, 2008 Sách, tạp chí
Tiêu đề: Applying Sequential Rules to Protein Localization Prediction
[10] S. Jaroszewicz and D. A. Simovici, "Pruning redundant association rules using maximum entropy principle," In Advances in Knowledge Discovery and Data Mining. Springer Berlin Heidelberg, pp. 135-147, 2002 Sách, tạp chí
Tiêu đề: Pruning redundant association rules using maximum entropy principle
[11] M. J. Zaki, "Mining non-redundant association rules," Data mining and knowledge discovery, 9(3), pp. 223-248, 2004 Sách, tạp chí
Tiêu đề: Mining non-redundant association rules
[12] M. Z. Ashrafi, D. Taniar and K. Smith, "ODAM: An optimized distributed association rule mining algorithm," IEEE distributed systems online, (3), 1, 2004 Sách, tạp chí
Tiêu đề: ODAM: An optimized distributed association rule mining algorithm
[13] M. Z. Ashrafi, D. Taniar and K. Smith, "Redundant association rules reduction techniques," Advances in Artificial Intelligence. Springer Berlin Heidelberg, pp. 254-263, 2005 Sách, tạp chí
Tiêu đề: Redundant association rules reduction techniques
[14] D. Lo, S. C. Khoo and L. Wong, "Non-redundant sequential rules—Theory and algorithm," Information Systems, 34(4), pp. 438-453, 2009 Sách, tạp chí
Tiêu đề: Non-redundant sequential rules—Theory and algorithm
[15] R. Agrawal and R. Srikant, "Mining sequential patterns," Proc. of IEEE International Conference on Data Engineering, pp. 3-14, 1995 Sách, tạp chí
Tiêu đề: Mining sequential patterns
[16] D. Chiu, Y. Wu and A. L. P. Chen, "An efficient algorithm for mining frequent sequences by a new strategy without support counting," Proc. of the 20th International Conference on Data Engineering, pp. 375–386, 2004 Sách, tạp chí
Tiêu đề: An efficient algorithm for mining frequent sequences by a new strategy without support counting
[17] J. Han, J. Pei, B. Mortazavi-Asl, Q. Chen, U. Dayal and M. C. Hsu, "FreeSpan: frequent pattern-projected sequential pattern mining," In Proceedings of the sixth ACM SIGKDD international conference on Knowledge discovery and data mining, ACM, pp. 355-359, 2000 Sách, tạp chí
Tiêu đề: FreeSpan: frequent pattern-projected sequential pattern mining
[18] J. Pei, J. Han, B. Mortazavi-Asl, H. Pinto, Q. Chen, U. Dayal and M. C. Hsu, "Prefixspan: Mining sequential patterns efficiently by prefix-projected pattern growth," In 2013 IEEE 29th International Conference on Data Engineering (ICDE). IEEE Computer Society., pp. 0215-0215, 2001 Sách, tạp chí
Tiêu đề: Prefixspan: Mining sequential patterns efficiently by prefix-projected pattern growth
[19] R. Srikant and R. Agrawal, "Mining sequential patterns: Generalizations and performance improvements," Springer Berlin Heidelberg, pp. 1-17, 1996 Sách, tạp chí
Tiêu đề: Mining sequential patterns: Generalizations and performance improvements
[20] M. N. Garofalakis, R. Rastogi and K. Shim, "SPIRIT: Sequential pattern mining with regular expression constraints," In VLDB, vol. 99, pp. 7-10, 1999 Sách, tạp chí
Tiêu đề: SPIRIT: Sequential pattern mining with regular expression constraints

HÌNH ẢNH LIÊN QUAN

Hình 1.1. Quá trình xử lý và tương tác trong khám phá tri thức từ CSDL. - Khai thác mẫu phổ biến và luật từ cơ sở dữ liệu chuỗi
Hình 1.1. Quá trình xử lý và tương tác trong khám phá tri thức từ CSDL (Trang 22)
Hình 1.2. Phân loại các thuật toán khai thác mẫu tuần tự. - Khai thác mẫu phổ biến và luật từ cơ sở dữ liệu chuỗi
Hình 1.2. Phân loại các thuật toán khai thác mẫu tuần tự (Trang 28)
2007 LAPIN Phương pháp quy nạp theo vị trí đứng sau, sử dụng bảng đánh dấu vị trí xuất hiện của các sự kiện  - Khai thác mẫu phổ biến và luật từ cơ sở dữ liệu chuỗi
2007 LAPIN Phương pháp quy nạp theo vị trí đứng sau, sử dụng bảng đánh dấu vị trí xuất hiện của các sự kiện (Trang 35)
Bảng 2.3. Chuyển đổi vector bit trong Bảng 2.2 thành cấu trúc DBV - Khai thác mẫu phổ biến và luật từ cơ sở dữ liệu chuỗi
Bảng 2.3. Chuyển đổi vector bit trong Bảng 2.2 thành cấu trúc DBV (Trang 52)
Bảng 2.7. Thuật toán DBV-Pattern-Extension: mở rộng mẫu tuần tự Thuật toán: DBV-Pattern-Extension ( - Khai thác mẫu phổ biến và luật từ cơ sở dữ liệu chuỗi
Bảng 2.7. Thuật toán DBV-Pattern-Extension: mở rộng mẫu tuần tự Thuật toán: DBV-Pattern-Extension ( (Trang 59)
Bảng 2.9b), do đó các bit tương ứng cho những vị trí này được gán là ‘0’ và tập sự - Khai thác mẫu phổ biến và luật từ cơ sở dữ liệu chuỗi
Bảng 2.9b , do đó các bit tương ứng cho những vị trí này được gán là ‘0’ và tập sự (Trang 61)
Bảng 2.9. Mở rộng mẫu tuần tự cho tiền tố 〈 - Khai thác mẫu phổ biến và luật từ cơ sở dữ liệu chuỗi
Bảng 2.9. Mở rộng mẫu tuần tự cho tiền tố 〈 (Trang 62)
Hình 2.1. Cây CloFS-DBV chứa mẫu khai thác được từ CSDL Bảng 2.1. - Khai thác mẫu phổ biến và luật từ cơ sở dữ liệu chuỗi
Hình 2.1. Cây CloFS-DBV chứa mẫu khai thác được từ CSDL Bảng 2.1 (Trang 64)
Hình 2.2. So sánh thời gian thực thi với các giá trị minSup khác nhau trên các CSDL chuỗi (a) C6T5S4I4N1kD10k, (b) T10I4D100k và (c) N1kD10k. - Khai thác mẫu phổ biến và luật từ cơ sở dữ liệu chuỗi
Hình 2.2. So sánh thời gian thực thi với các giá trị minSup khác nhau trên các CSDL chuỗi (a) C6T5S4I4N1kD10k, (b) T10I4D100k và (c) N1kD10k (Trang 67)
Hình 2.3. So sánh bộ nhớ sử dụng với các giá trị minSup khác nhau trên các CSDL chuỗi (a) C6T5S4I4N1kD10k, (b) T10I4D100k và (c) N1kD10k - Khai thác mẫu phổ biến và luật từ cơ sở dữ liệu chuỗi
Hình 2.3. So sánh bộ nhớ sử dụng với các giá trị minSup khác nhau trên các CSDL chuỗi (a) C6T5S4I4N1kD10k, (b) T10I4D100k và (c) N1kD10k (Trang 69)
Bảng 2.11. Tỉ lệ giảm về thời gian và bộ nhớ khai thác của CloFS-DBV CSDL chuỗi Thời gian Bộ nhớ sử dụng  - Khai thác mẫu phổ biến và luật từ cơ sở dữ liệu chuỗi
Bảng 2.11. Tỉ lệ giảm về thời gian và bộ nhớ khai thác của CloFS-DBV CSDL chuỗi Thời gian Bộ nhớ sử dụng (Trang 70)
Bảng 3.7. Thuật toán JoinkPattern - Khai thác mẫu phổ biến và luật từ cơ sở dữ liệu chuỗi
Bảng 3.7. Thuật toán JoinkPattern (Trang 88)
Hình 3.3. So sánh thời gian thực thi với các giá trị maxSpan khác nhau cho CSDL C6T5S4I4N1kD10k (với minSup = 7%) - Khai thác mẫu phổ biến và luật từ cơ sở dữ liệu chuỗi
Hình 3.3. So sánh thời gian thực thi với các giá trị maxSpan khác nhau cho CSDL C6T5S4I4N1kD10k (với minSup = 7%) (Trang 93)
Hình 3.2. So sánh thời gian thực thi với các giá trị maxSpan khác nhau cho CSDL C6T5S4I4N1kD1k (với minSup = 9%). - Khai thác mẫu phổ biến và luật từ cơ sở dữ liệu chuỗi
Hình 3.2. So sánh thời gian thực thi với các giá trị maxSpan khác nhau cho CSDL C6T5S4I4N1kD1k (với minSup = 9%) (Trang 93)
Hình 3.4. So sánh thời gian thực thi với các giá trị maxSpan khác nhau cho CSDL Gazelle (với minSup = 5%) - Khai thác mẫu phổ biến và luật từ cơ sở dữ liệu chuỗi
Hình 3.4. So sánh thời gian thực thi với các giá trị maxSpan khác nhau cho CSDL Gazelle (với minSup = 5%) (Trang 94)
Hình 3.6. So sánh bộ nhớ sử dụng với các giá trị maxSpan khác nhau cho CSDL C6T5S4I4N1kD10k (với minSup = 7%) - Khai thác mẫu phổ biến và luật từ cơ sở dữ liệu chuỗi
Hình 3.6. So sánh bộ nhớ sử dụng với các giá trị maxSpan khác nhau cho CSDL C6T5S4I4N1kD10k (với minSup = 7%) (Trang 95)
Hình 3.5. So sánh bộ nhớ sử dụng với các giá trị maxSpan khác nhau cho CSDL C6T5S4I4N1kD1k (với minSup = 9%) - Khai thác mẫu phổ biến và luật từ cơ sở dữ liệu chuỗi
Hình 3.5. So sánh bộ nhớ sử dụng với các giá trị maxSpan khác nhau cho CSDL C6T5S4I4N1kD1k (với minSup = 9%) (Trang 95)
Hình 3.7. So sánh bộ nhớ sử dụng với các giá trị maxSpan khác nhau cho CSDL Gazelle (với minSup = 5%) - Khai thác mẫu phổ biến và luật từ cơ sở dữ liệu chuỗi
Hình 3.7. So sánh bộ nhớ sử dụng với các giá trị maxSpan khác nhau cho CSDL Gazelle (với minSup = 5%) (Trang 96)
Bảng 4.4. Thuật toán Generate-NRRule: sinh luật tuần tự không dư thừa Thuật toán: Generate-NRRule (root, minConf, nr-SeqRule)  - Khai thác mẫu phổ biến và luật từ cơ sở dữ liệu chuỗi
Bảng 4.4. Thuật toán Generate-NRRule: sinh luật tuần tự không dư thừa Thuật toán: Generate-NRRule (root, minConf, nr-SeqRule) (Trang 109)
Hình 4.2. So sánh thời gian thực thi cho các CSDL (a) C6T5S4I4N1kD1k và (b) - Khai thác mẫu phổ biến và luật từ cơ sở dữ liệu chuỗi
Hình 4.2. So sánh thời gian thực thi cho các CSDL (a) C6T5S4I4N1kD1k và (b) (Trang 112)
Hình 4.3. So sánh thời gian thực thi cho các CSDL (a) C6T5S4I4N1kD1k và (b) - Khai thác mẫu phổ biến và luật từ cơ sở dữ liệu chuỗi
Hình 4.3. So sánh thời gian thực thi cho các CSDL (a) C6T5S4I4N1kD1k và (b) (Trang 113)
Hình 4.4. So sánh bộ nhớ sử dụng cho các CSDL (a) C6T5S4I4N1kD1k và (b) - Khai thác mẫu phổ biến và luật từ cơ sở dữ liệu chuỗi
Hình 4.4. So sánh bộ nhớ sử dụng cho các CSDL (a) C6T5S4I4N1kD1k và (b) (Trang 114)
Hình 4.5. So sánh bộ nhớ sử dụng cho các CSDL (a) C6T5S4I4N1kD1k và (b) - Khai thác mẫu phổ biến và luật từ cơ sở dữ liệu chuỗi
Hình 4.5. So sánh bộ nhớ sử dụng cho các CSDL (a) C6T5S4I4N1kD1k và (b) (Trang 115)
Hình 4.6. So sánh thời gian thực thi và bộ nhớ sử dụng cho CSDL Gazelle với các - Khai thác mẫu phổ biến và luật từ cơ sở dữ liệu chuỗi
Hình 4.6. So sánh thời gian thực thi và bộ nhớ sử dụng cho CSDL Gazelle với các (Trang 117)
Hình 4.7. So sánh thời gian thực thi và bộ nhớ sử dụng cho CSDL Gazelle với các - Khai thác mẫu phổ biến và luật từ cơ sở dữ liệu chuỗi
Hình 4.7. So sánh thời gian thực thi và bộ nhớ sử dụng cho CSDL Gazelle với các (Trang 118)
Bảng 4.7. Tỉ lệ giảm về thời gian và bộ nhớ khai thác của NRD-DBV với sự - Khai thác mẫu phổ biến và luật từ cơ sở dữ liệu chuỗi
Bảng 4.7. Tỉ lệ giảm về thời gian và bộ nhớ khai thác của NRD-DBV với sự (Trang 119)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN