1. Trang chủ
  2. » Luận Văn - Báo Cáo

Khai thác k mẫu tuần tự phổ biến dựa trên roaring bitmap

76 13 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Khai Thác K-Mẫu Tuần Tự Phổ Biến Dựa Trên Roaring Bitmap
Tác giả Lê Hữu Nhơn
Người hướng dẫn PGS. TS. Lê Hoài Bắc
Trường học Trường Đại Học Công Nghệ TP. HCM
Chuyên ngành Công Nghệ Thông Tin
Thể loại luận văn thạc sĩ
Năm xuất bản 2015
Thành phố TP. HỒ CHÍ MINH
Định dạng
Số trang 76
Dung lượng 1,25 MB

Nội dung

Ngày đăng: 11/07/2021, 16:52

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Lê Hoài Bắc (2013), Bài giảng môn Data Mining, Đại học KHTN (Đại học Quốc gia Tp.HCM) Sách, tạp chí
Tiêu đề: Bài giảng môn Data Mining
Tác giả: Lê Hoài Bắc
Năm: 2013
[2] Agrawal, R. and Srikant, R. (1995), Mining Sequential Patterns, In Proceedings of the 11th Conference on Data Engineering (ICDE’95), 3–14 Sách, tạp chí
Tiêu đề: Mining Sequential Patterns
Tác giả: Agrawal, R. and Srikant, R
Năm: 1995
[3] Srikant, R., Agrawal, R. (1996), Mining Sequential Patterns:Generalizations and Performance Improvements, in: Proc. 5th Int’l Conf.Extending Database Technology, pp.3–17 Sách, tạp chí
Tiêu đề: Mining Sequential Patterns:"Generalizations and Performance Improvements
Tác giả: Srikant, R., Agrawal, R
Năm: 1996
[4] Ayres, J., Flannick, J., Gehrke, J., and Yiu, T. (2002), Sequential pattern mining using a bitmap representation, In Proceedings of the 8th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. 429–435 Sách, tạp chí
Tiêu đề: Sequential patternmining using a bitmap representation
Tác giả: Ayres, J., Flannick, J., Gehrke, J., and Yiu, T
Năm: 2002
[5] Zaki, M. J. (2001), SPADE: An efficient algorithm for mining frequent sequences, Mach. Learn. 42, 31–60 Sách, tạp chí
Tiêu đề: SPADE: An efficient algorithm for mining frequentsequences
Tác giả: Zaki, M. J
Năm: 2001
[6] Han, J., Pei, J., Mortazavi-Asl, B., Chen, Q., Dayal, U., and Hsu, M.C., (2000), Freespan: Frequent pattern-projected sequential pattern mining, in Proc. 2000 Int. Conf. Knowledge Discovery and Data Mining (KDD’00), pp. 355-359 Sách, tạp chí
Tiêu đề: Freespan: Frequent pattern-projected sequential pattern mining
Tác giả: Han, J., Pei, J., Mortazavi-Asl, B., Chen, Q., Dayal, U., and Hsu, M.C
Năm: 2000
[7] Pei, J., Han, J., Mortazavi-Asl, B., and Pinto, H. (2001), PrefixSpan: Mining sequential patterns efficiently by prefix-projected pattern growth, In Proceedings of the International Conference on Data Engineering. 215–224 Sách, tạp chí
Tiêu đề: PrefixSpan: Miningsequential patterns efficiently by prefix-projected pattern growth
Tác giả: Pei, J., Han, J., Mortazavi-Asl, B., and Pinto, H
Năm: 2001
[8] Mabroukeh, N. R. and Ezeife, C. I. (2010), A taxonomy of sequential pattern mining algorithms, ACM Computing Surveys, vol. 43, no. 1, pp. 1-41 Sách, tạp chí
Tiêu đề: A taxonomy of sequential patternmining algorithms
Tác giả: Mabroukeh, N. R. and Ezeife, C. I
Năm: 2010
[9] Pei, J., Han, J., Mortazavi-Asl, B., and Zhu, H. (2000), Mining access patterns efficiently from web logs, In Knowledge Discovery and Data Mining. Current Issues and New Applications. Lecture Notes Computer Science, vol. 1805, Springer, Berlin, 396–407 Sách, tạp chí
Tiêu đề: Mining accesspatterns efficiently from web logs
Tác giả: Pei, J., Han, J., Mortazavi-Asl, B., and Zhu, H
Năm: 2000
[10] El-Sayed, M., Riuz, C., and Rundensteiner, E. A. (2004), FS-Miner:Efficient and incremental mining of frequent sequence patterns in web logs, In Proceedings of the 6th Annual ACM International Workshop on Web Information and Data Management. ACM, New York, 128–135 Sách, tạp chí
Tiêu đề: FS-Miner:"Efficient and incremental mining of frequent sequence patterns in web logs
Tác giả: El-Sayed, M., Riuz, C., and Rundensteiner, E. A
Năm: 2004
[11] Carl H. Mooney, and John F. Roddick (2013), Sequential pattern mining – Approaches and algorithms, Journal ACM Computing Surveys, Volume 45 Issue 2, Article No. 19 Sách, tạp chí
Tiêu đề: Sequential pattern mining –Approaches and algorithms
Tác giả: Carl H. Mooney, and John F. Roddick
Năm: 2013
[12] Song, S., Hu, H., and Jin, S. (2005), HVSM: A new sequential pattern mining algorithm using bitmap representation. In Advanced Data Mining and Applications, Lecture Notes in Computer Science, vol. 3584, Springer, Berlin, 455–463 Sách, tạp chí
Tiêu đề: HVSM: A new sequential patternmining algorithm using bitmap representation. In Advanced Data Miningand Applications
Tác giả: Song, S., Hu, H., and Jin, S
Năm: 2005
[13] Chiu, D.-Y., Wu, Y.-H., and Chen, A. L. P. (2004), An efficient algorithm for mining frequent sequences by a new strategy without support counting, In Proceedings of the 20th International Conference on Data Engineering.375–386 Sách, tạp chí
Tiêu đề: An efficient algorithmfor mining frequent sequences by a new strategy without support counting
Tác giả: Chiu, D.-Y., Wu, Y.-H., and Chen, A. L. P
Năm: 2004
[14] Ezeife, C. I. and Lu, Y. (2005), Mining web log sequential patterns with position coded pre-order linked WAP-tree, Int. J. Data Mining Knowl.Discovery 10, 5–38 Sách, tạp chí
Tiêu đề: Mining web log sequential patterns withposition coded pre-order linked WAP-tree
Tác giả: Ezeife, C. I. and Lu, Y
Năm: 2005
[16] Samy Chambi, Daniel Lemire, Owen Kaser, Robert Godin. (2014), Better bitmap performance with Roaring bitmaps, arXiv:1402.6407 Sách, tạp chí
Tiêu đề: Betterbitmap performance with Roaring bitmaps
Tác giả: Samy Chambi, Daniel Lemire, Owen Kaser, Robert Godin
Năm: 2014

HÌNH ẢNH LIÊN QUAN

mỗi itemset gồm nhiều item được thảo luận theo CSDL của bài toá n2 (bảng 2.3). - Khai thác k mẫu tuần tự phổ biến dựa trên roaring bitmap
m ỗi itemset gồm nhiều item được thảo luận theo CSDL của bài toá n2 (bảng 2.3) (Trang 21)
Hình 2.1 Cây từ điển biểu diễn các chuỗi, với đường nét nhạt - Khai thác k mẫu tuần tự phổ biến dựa trên roaring bitmap
Hình 2.1 Cây từ điển biểu diễn các chuỗi, với đường nét nhạt (Trang 24)
2-sequence sở bảng 2.3 được trình bày trong bảng 2.4, được điền vào sau lần duyệt CSDL lần thứhai. - Khai thác k mẫu tuần tự phổ biến dựa trên roaring bitmap
2 sequence sở bảng 2.3 được trình bày trong bảng 2.4, được điền vào sau lần duyệt CSDL lần thứhai (Trang 27)
Bảng 2.4 S-Matrix để xây dựng chuỗi 2-sequences từ CSD Lở bảng 2.3 - Khai thác k mẫu tuần tự phổ biến dựa trên roaring bitmap
Bảng 2.4 S-Matrix để xây dựng chuỗi 2-sequences từ CSD Lở bảng 2.3 (Trang 27)
Bảng 2.6 Chạy PrefixSpan trên CSD Lở bảng 2.3 - Khai thác k mẫu tuần tự phổ biến dựa trên roaring bitmap
Bảng 2.6 Chạy PrefixSpan trên CSD Lở bảng 2.3 (Trang 29)
Bảng 2.7 Các mẫu phổ biến của CSDL truy cập web từ bảng 2.2 - Khai thác k mẫu tuần tự phổ biến dựa trên roaring bitmap
Bảng 2.7 Các mẫu phổ biến của CSDL truy cập web từ bảng 2.2 (Trang 30)
Hình 2.2 Khai thác cây WAP sử dụng thuật toán WAP-mine - Khai thác k mẫu tuần tự phổ biến dựa trên roaring bitmap
Hình 2.2 Khai thác cây WAP sử dụng thuật toán WAP-mine (Trang 31)
Hình 2.3 Cây FS và bảng đầu liên kết cho các web log của bảng 2.2 - Khai thác k mẫu tuần tự phổ biến dựa trên roaring bitmap
Hình 2.3 Cây FS và bảng đầu liên kết cho các web log của bảng 2.2 (Trang 32)
Bảng 2.8 CSDL và phần ở mức thứ nhất của bảng 2.3 - Khai thác k mẫu tuần tự phổ biến dựa trên roaring bitmap
Bảng 2.8 CSDL và phần ở mức thứ nhất của bảng 2.3 (Trang 36)
Bảng 2.9 CSDL chuỗi ví dụ cho SPADE, biến đổi từ CSDL chuỗi ở bảng 2.2 - Khai thác k mẫu tuần tự phổ biến dựa trên roaring bitmap
Bảng 2.9 CSDL chuỗi ví dụ cho SPADE, biến đổi từ CSDL chuỗi ở bảng 2.2 (Trang 40)
Hình 2.6 Các lớp tương đương {[a]θ1, [b]θ1, [e]θ1} sinh bởi quan hệ θk trê nS - Khai thác k mẫu tuần tự phổ biến dựa trên roaring bitmap
Hình 2.6 Các lớp tương đương {[a]θ1, [b]θ1, [e]θ1} sinh bởi quan hệ θk trê nS (Trang 41)
Hình 2.7 Khai thác cây trong thuật toán PLWAP - Khai thác k mẫu tuần tự phổ biến dựa trên roaring bitmap
Hình 2.7 Khai thác cây trong thuật toán PLWAP (Trang 43)
Hình 3.1 Thuật toán SPAM - Khai thác k mẫu tuần tự phổ biến dựa trên roaring bitmap
Hình 3.1 Thuật toán SPAM (Trang 49)
Hình 3.4 Mở rộng i-extension - Khai thác k mẫu tuần tự phổ biến dựa trên roaring bitmap
Hình 3.4 Mở rộng i-extension (Trang 50)
Hình 3.3 Mở rộng s-extension - Khai thác k mẫu tuần tự phổ biến dựa trên roaring bitmap
Hình 3.3 Mở rộng s-extension (Trang 50)
Hình 3.5 Thuật toán TKS - Khai thác k mẫu tuần tự phổ biến dựa trên roaring bitmap
Hình 3.5 Thuật toán TKS (Trang 52)
Hình 3.6 Thủ tục tạo ứng viên đã được sửa đổi - Khai thác k mẫu tuần tự phổ biến dựa trên roaring bitmap
Hình 3.6 Thủ tục tạo ứng viên đã được sửa đổi (Trang 53)
Ví dụ: Cấu trúc dữ liệu PMAP được xây dựng cho CSDL D4 ở bảng 3.1 - Khai thác k mẫu tuần tự phổ biến dựa trên roaring bitmap
d ụ: Cấu trúc dữ liệu PMAP được xây dựng cho CSDL D4 ở bảng 3.1 (Trang 56)
Hình 3.8 Cấu trúc của Roaring bitmap - Khai thác k mẫu tuần tự phổ biến dựa trên roaring bitmap
Hình 3.8 Cấu trúc của Roaring bitmap (Trang 58)
Hình 3.9 So sánh bộ nhớ được sử dụng cho mảng và bitmap (nguồn - Khai thác k mẫu tuần tự phổ biến dựa trên roaring bitmap
Hình 3.9 So sánh bộ nhớ được sử dụng cho mảng và bitmap (nguồn (Trang 59)
Hình 3.13 Thuật toán 3– Thủ tục tính toán phép giao của hai container bitmap - Khai thác k mẫu tuần tự phổ biến dựa trên roaring bitmap
Hình 3.13 Thuật toán 3– Thủ tục tính toán phép giao của hai container bitmap (Trang 63)
Hình 3.15 Mô tả cách thực hiện bước s-extension ngắn gọn - Khai thác k mẫu tuần tự phổ biến dựa trên roaring bitmap
Hình 3.15 Mô tả cách thực hiện bước s-extension ngắn gọn (Trang 68)
Hình 4.1 Giao diện chương trình - Khai thác k mẫu tuần tự phổ biến dựa trên roaring bitmap
Hình 4.1 Giao diện chương trình (Trang 69)
Bảng 4.1 Liệt kê đặc tính của các bộ dữ liệu thực nghiệm - Khai thác k mẫu tuần tự phổ biến dựa trên roaring bitmap
Bảng 4.1 Liệt kê đặc tính của các bộ dữ liệu thực nghiệm (Trang 70)
Bảng 4.2 Kết qủa thực nghiệm ứng với k= 1000, 2000 và 3000 - Khai thác k mẫu tuần tự phổ biến dựa trên roaring bitmap
Bảng 4.2 Kết qủa thực nghiệm ứng với k= 1000, 2000 và 3000 (Trang 70)
Hình 4.2 Biểu đồ so sánh thời gian thực hiện (a) và sử dụng bộ nhớ (b) củ a2 thuật - Khai thác k mẫu tuần tự phổ biến dựa trên roaring bitmap
Hình 4.2 Biểu đồ so sánh thời gian thực hiện (a) và sử dụng bộ nhớ (b) củ a2 thuật (Trang 71)
Hình 4.3 Biểu đồ so sánh thời gian thực hiện (a) và sử dụng bộ nhớ (b) củ a2 thuật - Khai thác k mẫu tuần tự phổ biến dựa trên roaring bitmap
Hình 4.3 Biểu đồ so sánh thời gian thực hiện (a) và sử dụng bộ nhớ (b) củ a2 thuật (Trang 71)
Hình 4.6 Biểu đồ so sánh thời gian thực hiện (a) và sử dụng bộ nhớ (b) củ a2 thuật - Khai thác k mẫu tuần tự phổ biến dựa trên roaring bitmap
Hình 4.6 Biểu đồ so sánh thời gian thực hiện (a) và sử dụng bộ nhớ (b) củ a2 thuật (Trang 72)
Hình 4.5 Biểu đồ so sánh thời gian thực hiện (a) và sử dụng bộ nhớ (b) củ a2 thuật - Khai thác k mẫu tuần tự phổ biến dựa trên roaring bitmap
Hình 4.5 Biểu đồ so sánh thời gian thực hiện (a) và sử dụng bộ nhớ (b) củ a2 thuật (Trang 72)
w