1. Trang chủ
  2. » Luận Văn - Báo Cáo

Khai thác mẫu phổ biến trên cơ sở dữ liệu tăng trưởng sử dụng cấu trúc node set

79 16 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Khai Thác Mẫu Phổ Biến Trên Cơ Sở Dữ Liệu Tăng Trưởng Sử Dụng Cấu Trúc Node-Set
Tác giả Lê Minh Tâm
Người hướng dẫn PGS. TS Võ Đình Bảy
Trường học Trường Đại Học Công Nghệ TP. HCM
Chuyên ngành Công Nghệ Thông Tin
Thể loại Luận Văn Thạc Sĩ
Năm xuất bản 2017
Thành phố TP. HỒ CHÍ MINH
Định dạng
Số trang 79
Dung lượng 1,26 MB

Nội dung

Ngày đăng: 11/07/2021, 16:52

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
(1) Burdick, D., Calimlim, M., Flannick, J., Gehrke, J., & Yiu, T. (2005). Mafia: a maximal frequent itemset algorithm. IEEE TKDE Journal, 17(11), 1490–1504 Khác
(2) Deng, Z. H. (2014). Fast mining Top-Rank-K frequent patterns by using Node-lists. Expert Systems with Applications, 41(4–2), 1763–1768 Khác
(3) Deng, Z. H., & Wang, Z. H. (2010). A new fast vertical method for mining frequent itemsets. International Journal of Computational Intelligence Systems, 3(6), 733–744 Khác
(4) Deng, Z. H., Wang, Z. H., & Jiang, J. J. (2012). A new algorithm for fast mining frequent itemsets using N-lists. Science China Information Sciences, 55(9), 2008–2030 Khác
(5) Deng, Z. H., & Xu, X. R. (2012). Fast mining erasable itemsets using NC_sets. Expert Systems with Applications, 39(4), 4453–4463 Khác
(6) Grahne, G., & Zhu, J. (2005). Fast algorithms for frequent itemset mining using FPtrees. IEEE TKDE Journal, 17(10), 1347–1362 Khác
(7) Han, J., Cheng, H., Xin, D., & Yan, X. (2007). Frequent itemset mining: current status and future directions. DMKD Journal, 15(1), 55–86 Khác
(8) Le, T., & Vo, B. (2014). MEI: an efficient algorithm for mining erasable itemsets. Engineering Applications of Artificial Intelligence, 27, 155–166 Khác
(9) Lee, A. J. T., Wang, C. S., Weng, W. Y., Chen, Y. A., & Wu, H. W Khác
(10) Li, X., & Deng, Z. H. (2010). Mining frequent itemsets from network flows for monitoring network. Expert Systems with Applications, 37(12), 8850–8860 Khác
(11) Liu, G., Lu, H., Lou, W., Xu, Y., & Yu, J. X. (2004). Efficient mining of frequent itemsets using ascending frequency ordered prefix-tree. DMKD Journal, 9(3), 249–274 Khác
(12) Woon, Y. K., Ng, W. K., & Lim, E. P. (2004). A support-ordered trie for fast frequent itemset discovery. IEEE TKDE Journal, 16(7), 875–879 Khác
(13) Zaki, M. J. (2000). Scalable algorithms for association mining. IEEE TKDE Journal, 12(3), 372–390 Khác
(14) Deng, Z.H, Lv, S.L (2014). Fast mining frequent itemsets using Node- sets. Expert Systems with Applications, 41(10), 4505–4512 Khác

HÌNH ẢNH LIÊN QUAN

Hình 1.1: Quy trình phát triển tri thức và khai thác dữ liệu - Khai thác mẫu phổ biến trên cơ sở dữ liệu tăng trưởng sử dụng cấu trúc node set
Hình 1.1 Quy trình phát triển tri thức và khai thác dữ liệu (Trang 19)
Bảng 2.2: Độ phổ biến của các tập 1-mục - Khai thác mẫu phổ biến trên cơ sở dữ liệu tăng trưởng sử dụng cấu trúc node set
Bảng 2.2 Độ phổ biến của các tập 1-mục (Trang 24)
Ví dụ 2.3: Xt cơ sở dữ liệu nhƣ trong bảng 2.1. Với minSupp= 40% (40*5/100 = 2). Ta thực hiện các bƣớc sau  - Khai thác mẫu phổ biến trên cơ sở dữ liệu tăng trưởng sử dụng cấu trúc node set
d ụ 2.3: Xt cơ sở dữ liệu nhƣ trong bảng 2.1. Với minSupp= 40% (40*5/100 = 2). Ta thực hiện các bƣớc sau (Trang 25)
Hình 2.12 t ht toán Apriori tìm tp ph in -m - Khai thác mẫu phổ biến trên cơ sở dữ liệu tăng trưởng sử dụng cấu trúc node set
Hình 2.12 t ht toán Apriori tìm tp ph in -m (Trang 26)
Bƣớc 6: Chọn ra các tập phổ biến 3-mục có độ phổ biến thỏa minSupp (hình 2.3). Bƣớc 7: Tính độ phổ biến cho các tập 4-mục - Khai thác mẫu phổ biến trên cơ sở dữ liệu tăng trưởng sử dụng cấu trúc node set
c 6: Chọn ra các tập phổ biến 3-mục có độ phổ biến thỏa minSupp (hình 2.3). Bƣớc 7: Tính độ phổ biến cho các tập 4-mục (Trang 27)
Tạo bảng Header có |F| dòng và đặt tất cả các node –link chỉ đến null For each giao tác T   D {                  Duyệt D lần 2  - Khai thác mẫu phổ biến trên cơ sở dữ liệu tăng trưởng sử dụng cấu trúc node set
o bảng Header có |F| dòng và đặt tất cả các node –link chỉ đến null For each giao tác T  D { Duyệt D lần 2 (Trang 29)
Ví dụ 2.4: Xt cơ sở dữ liệu mẫu nhƣ trên bảng 2.1. Với minSupp= 40% (40*5/100 = 2) ta có:  - Khai thác mẫu phổ biến trên cơ sở dữ liệu tăng trưởng sử dụng cấu trúc node set
d ụ 2.4: Xt cơ sở dữ liệu mẫu nhƣ trên bảng 2.1. Với minSupp= 40% (40*5/100 = 2) ta có: (Trang 31)
Hình 2.6: Tp ph b in 1-m c - Khai thác mẫu phổ biến trên cơ sở dữ liệu tăng trưởng sử dụng cấu trúc node set
Hình 2.6 Tp ph b in 1-m c (Trang 31)
Ví dụ 2.5: Xt cơ sở dữ liệu nhƣ trong bảng 2.1. Với minSupp= 40% (40*5/100 = 2). Ta thực hiện các bƣớc sau  - Khai thác mẫu phổ biến trên cơ sở dữ liệu tăng trưởng sử dụng cấu trúc node set
d ụ 2.5: Xt cơ sở dữ liệu nhƣ trong bảng 2.1. Với minSupp= 40% (40*5/100 = 2). Ta thực hiện các bƣớc sau (Trang 33)
Hình 2.9: Node-list ca tp ph b in - Khai thác mẫu phổ biến trên cơ sở dữ liệu tăng trưởng sử dụng cấu trúc node set
Hình 2.9 Node-list ca tp ph b in (Trang 34)
Hình 2.10: Node-list ca bc - Khai thác mẫu phổ biến trên cơ sở dữ liệu tăng trưởng sử dụng cấu trúc node set
Hình 2.10 Node-list ca bc (Trang 35)
Hình 2.11: Node-list ca bce - Khai thác mẫu phổ biến trên cơ sở dữ liệu tăng trưởng sử dụng cấu trúc node set
Hình 2.11 Node-list ca bce (Trang 36)
Ví dụ 2.6: Xt cơ sở dữ liệu mẫu nhƣ trên bảng 2.1. Với minSupp= 40% (40*5/100 = 2)  ta có:  - Khai thác mẫu phổ biến trên cơ sở dữ liệu tăng trưởng sử dụng cấu trúc node set
d ụ 2.6: Xt cơ sở dữ liệu mẫu nhƣ trên bảng 2.1. Với minSupp= 40% (40*5/100 = 2) ta có: (Trang 39)
Hình 2.13: Tp ph bi n ca N-list - Khai thác mẫu phổ biến trên cơ sở dữ liệu tăng trưởng sử dụng cấu trúc node set
Hình 2.13 Tp ph bi n ca N-list (Trang 40)
-Kiểm tra N-list ban đầu của lần nữa và hợp các nút theo hình thức <(        ):    >  <(       ):    >  …  <(       ):     >  để  tạo  một  nút  mới  <(        ): (     +              > - Khai thác mẫu phổ biến trên cơ sở dữ liệu tăng trưởng sử dụng cấu trúc node set
i ểm tra N-list ban đầu của lần nữa và hợp các nút theo hình thức <( ): > <( ): > … <( ): > để tạo một nút mới <( ): ( + > (Trang 41)
-Kiểm tra N-list ban đầu củ aP lần nữa và hợp các nút theo hình thức <(        ):    >  <(       ):    >  …  <(       ):     >  để  tạo  một  nút  mới  <(        ): (     +              > - Khai thác mẫu phổ biến trên cơ sở dữ liệu tăng trưởng sử dụng cấu trúc node set
i ểm tra N-list ban đầu củ aP lần nữa và hợp các nút theo hình thức <( ): > <( ): > … <( ): > để tạo một nút mới <( ): ( + > (Trang 43)
Hình 2.15: N-list ca bcf - Khai thác mẫu phổ biến trên cơ sở dữ liệu tăng trưởng sử dụng cấu trúc node set
Hình 2.15 N-list ca bcf (Trang 47)
Ví dụ 2.7: Xt cơ sở dữ liệu mẫu nhƣ trên bảng 2.1. Với minSupp= 40% (40*5/100 = 2) ta có: Tập phổ biến 1-itemset đƣợc thiết lập ={a, b, c, e, f} - Khai thác mẫu phổ biến trên cơ sở dữ liệu tăng trưởng sử dụng cấu trúc node set
d ụ 2.7: Xt cơ sở dữ liệu mẫu nhƣ trên bảng 2.1. Với minSupp= 40% (40*5/100 = 2) ta có: Tập phổ biến 1-itemset đƣợc thiết lập ={a, b, c, e, f} (Trang 49)
Nhƣ trình bày trong hình 2.16, Node-set củ af là {(7,1), (8,1)}. Cùng xem cách phát sinh Node-set của bf - Khai thác mẫu phổ biến trên cơ sở dữ liệu tăng trưởng sử dụng cấu trúc node set
h ƣ trình bày trong hình 2.16, Node-set củ af là {(7,1), (8,1)}. Cùng xem cách phát sinh Node-set của bf (Trang 51)
Hình 2.19: Node-set ca bcf - Khai thác mẫu phổ biến trên cơ sở dữ liệu tăng trưởng sử dụng cấu trúc node set
Hình 2.19 Node-set ca bcf (Trang 52)
Hình 2.20: Một ví d về cây liệt kê - Khai thác mẫu phổ biến trên cơ sở dữ liệu tăng trưởng sử dụng cấu trúc node set
Hình 2.20 Một ví d về cây liệt kê (Trang 54)
Cho CSD LD với các giao dịch trong bảng 3.1và dàn tập phổ biến đƣợc xây dựng nhƣ hình 3.2, với = 30% và = 50% - Khai thác mẫu phổ biến trên cơ sở dữ liệu tăng trưởng sử dụng cấu trúc node set
ho CSD LD với các giao dịch trong bảng 3.1và dàn tập phổ biến đƣợc xây dựng nhƣ hình 3.2, với = 30% và = 50% (Trang 66)
Hình 3.3: POC-tree đ ợc xây dựng{}b: 7f: 2e: 1c: 6d: 1d: 2h: 1 f: 4 d: 2e: 1a: 1 a: 3e: 1 h: 1e: 1 g: 3h: 1h: 101234 5867910111213 - Khai thác mẫu phổ biến trên cơ sở dữ liệu tăng trưởng sử dụng cấu trúc node set
Hình 3.3 POC-tree đ ợc xây dựng{}b: 7f: 2e: 1c: 6d: 1d: 2h: 1 f: 4 d: 2e: 1a: 1 a: 3e: 1 h: 1e: 1 g: 3h: 1h: 101234 5867910111213 (Trang 68)
Bảng 3.3: Số lƣợng của tất cả các tập trong giao dịch mới - Khai thác mẫu phổ biến trên cơ sở dữ liệu tăng trưởng sử dụng cấu trúc node set
Bảng 3.3 Số lƣợng của tất cả các tập trong giao dịch mới (Trang 69)
Bảng 3.5: Ba phân vùng của tập trong các giao dịch mới - Khai thác mẫu phổ biến trên cơ sở dữ liệu tăng trưởng sử dụng cấu trúc node set
Bảng 3.5 Ba phân vùng của tập trong các giao dịch mới (Trang 70)
Hình 3.4: Kt quả cuối cùng ca Prelarge tree - Khai thác mẫu phổ biến trên cơ sở dữ liệu tăng trưởng sử dụng cấu trúc node set
Hình 3.4 Kt quả cuối cùng ca Prelarge tree (Trang 71)
Bảng 4.1: Đặc điểm của các cơ sở dữ liệu thực nghiệm - Khai thác mẫu phổ biến trên cơ sở dữ liệu tăng trưởng sử dụng cấu trúc node set
Bảng 4.1 Đặc điểm của các cơ sở dữ liệu thực nghiệm (Trang 73)
Hình 4.1 :T ng thời gian khai thác và số l ợng tp ph b in khi thêm 10% dữ liệu - Khai thác mẫu phổ biến trên cơ sở dữ liệu tăng trưởng sử dụng cấu trúc node set
Hình 4.1 T ng thời gian khai thác và số l ợng tp ph b in khi thêm 10% dữ liệu (Trang 74)
Hình 4.2 :T ng thời gian khai thác và số l ợng tp ph b in khi thêm 10 lần dữ liệu - Khai thác mẫu phổ biến trên cơ sở dữ liệu tăng trưởng sử dụng cấu trúc node set
Hình 4.2 T ng thời gian khai thác và số l ợng tp ph b in khi thêm 10 lần dữ liệu (Trang 75)
Hình 4.3 :T ng thời gian khai thác và số l ợng tp ph b in khi thêm 10 lần dữ liệu - Khai thác mẫu phổ biến trên cơ sở dữ liệu tăng trưởng sử dụng cấu trúc node set
Hình 4.3 T ng thời gian khai thác và số l ợng tp ph b in khi thêm 10 lần dữ liệu (Trang 76)

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w