1. Trang chủ
  2. » Luận Văn - Báo Cáo

Khai thác luật kết hợp không dư thừa

67 29 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 67
Dung lượng 1,46 MB

Nội dung

Ngày đăng: 11/07/2021, 16:52

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Đỗ Phúc, “ Giáo trình khai thác dữ liệu”, NXB Đại học Quốc gia TP.HCM, 2008 [2] Lê Hoài Bắc, “Bài giảng môn Data Mining”, Đại học KHTN (Đại học Quốc gia Tp.HCM), 2013 Sách, tạp chí
Tiêu đề: Giáo trình khai thác dữ liệu"”, NXB Đại học Quốc gia TP.HCM, 2008 [2] Lê Hoài Bắc, “"Bài giảng môn Data Mining”
Nhà XB: NXB Đại học Quốc gia TP.HCM
[3] Nguyễn Tiến Trung, “Khai thác tập mục lợi ích cao bảo toàn tính riêng tư”, luận văn thạc sỹ, Đại học Công nghệ TP. HCM, 2015.Tiếng Anh Sách, tạp chí
Tiêu đề: Khai thác tập mục lợi ích cao bảo toàn tính riêng tư
[4] Fournier-Viger, P., Wu, C.-W., Tseng, V. S. “Mining Top-K Association Rules”, Proc. 25th Canadian Conf. on Artificial Intelligence (AI 2012), Springer, 2012, pp. 61-73 Sách, tạp chí
Tiêu đề: Mining Top-K Association Rules
[5] Bay Vo, Bac Le “ A Frequent Closed Itemsets Lattice-based Approach for Mining Minimal Non-Redundant Association Rules ”, International Journal of Database Theory and Application , Vol. 4, No 2, June 2011, pp. 23 – 33 Sách, tạp chí
Tiêu đề: A Frequent Closed Itemsets Lattice-based Approach for Mining Minimal Non-Redundant Association Rules”
[6] Philippe Fournier-Viger and Vincent S. Tseng. “Mining Top-K Non-Redundant Association Rules”. Foundations of Intelligent Systems Lecture Notes in Computer Science Volume 7661, 2012, pp 31-40 Sách, tạp chí
Tiêu đề: Mining Top-K Non-Redundant Association Rules
[7] X.Wu, V.Kumar, J.Ross Quinlan, J.Ghosh, Q.Yang, H.Motoda, G.J. McLachlan, A.Ng, B.Liu, P.S.Yu, Z.-H.Zhou, M.Steinbach, D.J.Hand, D. Steinberg (2008), Top 10 Algorithms in Data Mining, Knowl Inf Syst volume14, pp. 1–37 Sách, tạp chí
Tiêu đề: Top 10 Algorithms in Data Mining
Tác giả: X.Wu, V.Kumar, J.Ross Quinlan, J.Ghosh, Q.Yang, H.Motoda, G.J. McLachlan, A.Ng, B.Liu, P.S.Yu, Z.-H.Zhou, M.Steinbach, D.J.Hand, D. Steinberg
Năm: 2008

HÌNH ẢNH LIÊN QUAN

Hình 1.1. Quá trình khám phá tri thức [3] Trong đó, cụ thể của các bƣớc là:   - Khai thác luật kết hợp không dư thừa
Hình 1.1. Quá trình khám phá tri thức [3] Trong đó, cụ thể của các bƣớc là: (Trang 20)
mô hình cho phép dự đoán các mẫu, mô hình mới chƣa biết. Mô tả dữ liệu là tổng kết hoặc diễn  tả  những  đặc  điểm  chung  của  những  thuộc  tính  dữ  liệu  trong  kho  dữ  liệu  mà  con  ngƣời có thể hiểu đƣợc - Khai thác luật kết hợp không dư thừa
m ô hình cho phép dự đoán các mẫu, mô hình mới chƣa biết. Mô tả dữ liệu là tổng kết hoặc diễn tả những đặc điểm chung của những thuộc tính dữ liệu trong kho dữ liệu mà con ngƣời có thể hiểu đƣợc (Trang 22)
Hình 1.3. Liên kết vào và ra của 3 trang web - Khai thác luật kết hợp không dư thừa
Hình 1.3. Liên kết vào và ra của 3 trang web (Trang 27)
Bảng 2.1. Cơ sở dữ liệu giao dịch - Khai thác luật kết hợp không dư thừa
Bảng 2.1. Cơ sở dữ liệu giao dịch (Trang 30)
Hình 2.1. Minh họa thuật toán Apriori - Khai thác luật kết hợp không dư thừa
Hình 2.1. Minh họa thuật toán Apriori (Trang 33)
Hình 2.2. Thuật toán IT-Tree phát sinh tập phổ biến[2] - Khai thác luật kết hợp không dư thừa
Hình 2.2. Thuật toán IT-Tree phát sinh tập phổ biến[2] (Trang 35)
Bảng 2.2 CSDL giao dịch cho IT-Tree (bảng 2.1) - Khai thác luật kết hợp không dư thừa
Bảng 2.2 CSDL giao dịch cho IT-Tree (bảng 2.1) (Trang 36)
Hình 2.3. Kết quả khai thác với ngưỡng minsup=50% - Khai thác luật kết hợp không dư thừa
Hình 2.3. Kết quả khai thác với ngưỡng minsup=50% (Trang 37)
Hình 2.4. Thuật toán tìm luật kết hợp từ tập phổ biến[2] - Khai thác luật kết hợp không dư thừa
Hình 2.4. Thuật toán tìm luật kết hợp từ tập phổ biến[2] (Trang 38)
Bảng 2.3. Kết quả chạy thuật toán tìm AR với minconf= 80%. - Khai thác luật kết hợp không dư thừa
Bảng 2.3. Kết quả chạy thuật toán tìm AR với minconf= 80% (Trang 38)
Bảng 3.1a. CSDL giao dịch [6] Bảng 3.1b. Luật kết hợp tìm thấy [6] ID  Giao dịch  - Khai thác luật kết hợp không dư thừa
Bảng 3.1a. CSDL giao dịch [6] Bảng 3.1b. Luật kết hợp tìm thấy [6] ID Giao dịch (Trang 42)
Hình 3.1. Thuật toán TopKRules[4] - Khai thác luật kết hợp không dư thừa
Hình 3.1. Thuật toán TopKRules[4] (Trang 45)
Hình 3.2. Thủ tục SAVE[4] - Khai thác luật kết hợp không dư thừa
Hình 3.2. Thủ tục SAVE[4] (Trang 46)
Thủ tục SAVE(i→j,L,k,minsup) đƣợc mô tả chi tiết trong hình 3.2. Sau khi thêm luật r (i→j) vào L, nếu số lƣợng luật có trong L >=k và tồn tại luật s có sup(s) = minsup  thì loại s khỏi L - Khai thác luật kết hợp không dư thừa
h ủ tục SAVE(i→j,L,k,minsup) đƣợc mô tả chi tiết trong hình 3.2. Sau khi thêm luật r (i→j) vào L, nếu số lƣợng luật có trong L >=k và tồn tại luật s có sup(s) = minsup thì loại s khỏi L (Trang 46)
Bảng 3.4. Kết quả tìm các luật từ bảng 3.3 thỏa minsup - Khai thác luật kết hợp không dư thừa
Bảng 3.4. Kết quả tìm các luật từ bảng 3.3 thỏa minsup (Trang 47)
Bảng 3.5. Kết quả chọn các luật trong bảng 3.4 thỏa minconf - Khai thác luật kết hợp không dư thừa
Bảng 3.5. Kết quả chọn các luật trong bảng 3.4 thỏa minconf (Trang 48)
L. Tậ pL gồm tập các luật thỏa điều kiện.(kết quả trong bảng 3.5) - Khai thác luật kết hợp không dư thừa
p L gồm tập các luật thỏa điều kiện.(kết quả trong bảng 3.5) (Trang 48)
Bảng 3.6. Kết quả khai thác k=10 luật kết hợp - Khai thác luật kết hợp không dư thừa
Bảng 3.6. Kết quả khai thác k=10 luật kết hợp (Trang 49)
thỏa điều kiện lơn hơn minsup và minconf thì đƣa vào tập R. kết quả nhƣ bảng 3.9. Bảng 3.9 - Khai thác luật kết hợp không dư thừa
th ỏa điều kiện lơn hơn minsup và minconf thì đƣa vào tập R. kết quả nhƣ bảng 3.9. Bảng 3.9 (Trang 56)
Bảng 3.10. Kết quả khai thác luật kết hợp không dƣ thừa - Khai thác luật kết hợp không dư thừa
Bảng 3.10. Kết quả khai thác luật kết hợp không dƣ thừa (Trang 57)
Hình 3.3 So sánh kết quả củ a2 thuật toán TopKRules và TNR - Khai thác luật kết hợp không dư thừa
Hình 3.3 So sánh kết quả củ a2 thuật toán TopKRules và TNR (Trang 58)
của dữ liệu đƣợc mô tả trong bảng 4.1 - Khai thác luật kết hợp không dư thừa
c ủa dữ liệu đƣợc mô tả trong bảng 4.1 (Trang 59)
Hình 4.1. Màn hình chính - Khai thác luật kết hợp không dư thừa
Hình 4.1. Màn hình chính (Trang 60)
Bảng 4.2 Kết quả thực nghiệm với TopKRules và TNR - Khai thác luật kết hợp không dư thừa
Bảng 4.2 Kết quả thực nghiệm với TopKRules và TNR (Trang 61)
Hình 4.2. So sánh thời gian thực hiện (a) và sử dụng bộ nhớ (b) của hai thuật toán TopKRules và TNR trên CSDL Chess - Khai thác luật kết hợp không dư thừa
Hình 4.2. So sánh thời gian thực hiện (a) và sử dụng bộ nhớ (b) của hai thuật toán TopKRules và TNR trên CSDL Chess (Trang 62)
Ứng với bảng kết quả trên, chúng tôi vẽ đồ thị để so sánh thời gian chạy và bộ nhớ sử dụng tối đa đối với từng bộ CSDL - Khai thác luật kết hợp không dư thừa
ng với bảng kết quả trên, chúng tôi vẽ đồ thị để so sánh thời gian chạy và bộ nhớ sử dụng tối đa đối với từng bộ CSDL (Trang 62)
Hình 4.4. So sánh thời gian thực hiện (a) và sử dụng bộ nhớ (b) của hai thuật toán TopKRules và TNR trên CSDL Connect - Khai thác luật kết hợp không dư thừa
Hình 4.4. So sánh thời gian thực hiện (a) và sử dụng bộ nhớ (b) của hai thuật toán TopKRules và TNR trên CSDL Connect (Trang 63)
Đối với kết quả thực nghiệm trên CSDL Retail hình 4.3 chúng ta thấy, về thời gian thực hiện, thuật toán TNR tốt hơn đối với hệ số k thấp và cao hơn đối với hệ số k lớn hơn - Khai thác luật kết hợp không dư thừa
i với kết quả thực nghiệm trên CSDL Retail hình 4.3 chúng ta thấy, về thời gian thực hiện, thuật toán TNR tốt hơn đối với hệ số k thấp và cao hơn đối với hệ số k lớn hơn (Trang 63)