1. Trang chủ
  2. » Luận Văn - Báo Cáo

Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi

73 24 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 73
Dung lượng 5,57 MB

Nội dung

ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC SƯ PHẠM PHẠM THỊ KIM PHƯỢNG ỨNG DỤNG THUẬT TOÁN EFIM ĐỂ KHAI PHÁ TẬP MỤC HỮU ÍCH CAO TỪ CƠ SỞ DỮ LIỆU BÁN HÀNG TẠI SIÊU THỊ CO.OPMART QUẢNG NGÃI LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN Đà Nẵng – Năm 2017 ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC SƯ PHẠM PHẠM THỊ KIM PHƯỢNG ỨNG DỤNG THUẬT TOÁN EFIM ĐỂ KHAI PHÁ TẬP MỤC HỮU ÍCH CAO TỪ CƠ SỞ DỮ LIỆU BÁN HÀNG TẠI SIÊU THỊ CO.OPMART QUẢNG NGÃI Chuyên ngành: HỆ THỐNG THÔNG TIN Mã số: 61.49.01.06 LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN Người hướng dẫn khoa học: PGS.TSKH TRẦN QUỐC CHIẾN Đà Nẵng – Năm 2017 LỜI CAM ĐOAN Tôi xin cam đoan: - Đây cơng trình nghiên cứu riêng tơi - Nội dung, kết nêu luận văn trung thực chưa công bố cơng trình khác - Mọi tham khảo dùng luận văn trích dẫn rõ ràng trung thực tên tác giả, tên cơng trình, thời gian địa điểm công bố - Mọi chép không hợp lệ, vi phạm quy chế đào tạo, hay gian trá, tơi xin chịu hồn tồn trách nhiệm Tác giả luận văn Phạm Thị Kim Phượng MỤC LỤC MỞ ĐẦU 1 Lý chọn đề tài Mục tiêu nhiệm vụ Đối tượng phạm vi nghiên cứu Phương pháp nghiên cứu Ý nghĩa đề tài Kết dự kiến Bố cục luận văn CHƯƠNG CƠ SỞ LÝ THUYẾT VỀ KHAI PHÁ DỮ LIỆU 1.1 TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU 1.1.1 Sơ lược khai phá liệu 1.1.2 Quá trình khám phá tri thức từ sở liệu 1.1.3 Các dạng liệu khai phá 1.1.4 Một số kỹ thuật khai phá liệu 1.1.5 Một số ứng dụng khai phá liệu 1.1.6 Lợi khai phá liệu so với phương pháp khác 10 1.1.7 Những thách thức khai phá liệu 11 1.2 KỸ THUẬT KHAI PHÁ TẬP MỤC PHỔ BIẾN VÀ LUẬT KẾT HỢP12 1.2.1 Cơ sở liệu giao tác 12 1.2.2 Tập mục phổ biến luật kết hợp 13 1.2.3 Khai phá tập mục phổ biến - Frequent Itemset Mining 15 1.2.4 Khai phá luật kết hợp 16 1.3 KẾT CHƯƠNG 17 CHƯƠNG KHAI PHÁ TẬP MỤC HỮU ÍCH CAO TỪ CƠ SỞ DỮ LIỆU GIAO TÁC 18 2.1 ĐẶT VẤN ĐỀ 18 2.2 TỔNG QUAN VỀ TÌNH HÌNH NGHIÊN CỨU KHAI PHÁ TẬP MỤC HỮU ÍCH CAO 18 2.3 MỘT SỐ ĐỊNH NGHĨA CỦA BÀI TOÁN 20 2.4 MỘT SỐ THUẬT TOÁN KHAI PHÁ TẬP MỤC HỮU ÍCH CAO 22 2.4.1 Thuật tốn Two-Phase 22 2.4.2 Thuật toán FHM 23 2.5 THUẬT TOÁN EFIM 23 2.5.1 Một số khái niệm 24 2.5.2 Thuật toán EFIM 32 2.6 ÁP DỤNG THUẬT TOÁN 34 2.7 KẾT CHƯƠNG 36 CHƯƠNG CÀI ĐẶT THUẬT TOÁN EFIM VÀ ỨNG DỤNG KHAI PHÁ DỮ LIỆU BÁN HÀNG 37 3.1 GIỚI THIỆU HỆ THỐNG SIÊU THỊ 37 3.2 GIẢI PHÁP KHAI PHÁ TẬP MỤC HỮU ÍCH CAO TỪ CƠ SỞ DỮ LIỆU BÁN HÀNG TẠI SIÊU THỊ 38 3.3 THU THẬP VÀ XỬ LÝ DỮ LIỆU 38 3.3.1 Một số vấn đề liên quan đến lợi nhuận cao 38 3.3.2 Thu thập xử lý liệu 39 3.4 CÀI ĐẶT THUẬT TOÁN 42 3.4.1 Lớp Item 43 3.4.2 Lớp Transaction 43 3.4.3 Lớp DataAssistant 43 3.4.4 Lớp EFIM 44 3.5 THỬ NGHIỆM CHƯƠNG TRÌNH 44 3.6 ĐÁNH GIÁ THUẬT TOÁN 46 3.6.1 Kết đầu 46 3.6.2 Thời gian thực 46 3.6.3 Sử dụng nhớ 47 3.6.4 Tìm kiếm nút 48 3.7 KẾT CHƯƠNG 48 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 49 DANH MỤC TÀI LIỆU THAM KHẢO QUYẾT ĐỊNH GIAO ĐỀ TÀI (BẢN SAO) DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT CÁC KÝ HIỆU α Tập mục α–T Giao tác tham chiếu α–D CSDL tham chiếu conf(X→ Y) Độ tin cậy luật X→ Y D Cơ sở liệu giao tác D E(α) Các mục mở rộng H Tập hợp tập mục hữu ích cao I Tập mục CSDL giao tác ij Mục liệu thứ j lu(α, z ) Giá trị hữu ích cục z α minconf Độ tin cậy tối thiểu minutil Ngưỡng hữu ích tối thiểu minsup Độ hỗ trợ tối thiểu re(X, Td) Giá trị hữu ích cịn lại X giao tác Td su(α, z) Giá trị hữu ích z α sup(X) Độ hỗ trợ tập mục X sup(X→ Y) Độ hỗ trợ luật X→ Y T Giao tác Td Giao tác thứ d tu Độ hữu ích giao tác TWU(X) Độ hữu ích trọng số tập mục X u(ij, Td) Giá trị hữu ích tập mục ij giao tác u(X) Giá trị hữu ích tập mục X X→ Y Luật X→ Y z Mục ≻ Thứ tự xếp mục ≻T Thứ tự xếp giao tác  Và  Tập  Phép giao  Phép hợp CÁC CHỮ VIẾT TẮT CSDL Cơ Sở Dữ Liệu KPDL Khai Phá Dữ Liệu EFIM EFficient high-utility Itemset Mining EUCS Estimated Utility Co-Occurrence Structure FHM Fast High-utility Miner FUC Fast Utility Counting FUM Fast Utility Mining HDP High-utility Database Projection HTM High-utility Transaction Merging KDD Knowledge Discovery in Databases LUHF Low Utility and High Frequency LULF Low Utility and Low Frequency HUHF High Utility and High Frequency HULF High Utility and Low Frequency TWU Transaction Weighted Utilization HUIM High Utility Itemset Mining DANH MỤC CÁC BẢNG Số hiệu bảng Tên bảng Trang 1.1 Biểu diễn ngang 12 1.2 Biểu diễn dọc 13 1.3 Biểu diễn ma trận giao tác 13 1.4 Danh sách tập mục phổ biến 14 2.1 Cơ sở liệu giao tác 20 2.2 Biểu diễn giá trị lợi nhuận mục CSDL 20 2.3 Bảng độ hữu ích giao tác CSDL 24 2.4 TWU mục CSDL giao tác D 25 2.5 Giá trị TWU utility-bin 32 2.6 CSDL sau xếp giao tác 35 2.7 Hợp giao tác CSDL tham chiếu {A} –D 35 2.8 Tập mục hữu ích cao 36 3.1 Danh sách mặt hàng 39 3.2 Lợi nhuận mặt hàng 42 3.3 Kết trả hai thuật toán 46 DANH MỤC CÁC HÌNH Số hiệu hình Tên hình Trang 1.1 Quá trình khám phá tri thức 2.1 Biểu diễn tìm kiếm I 26 3.1 Dữ liệu làm 41 3.2 Màn hình đăng nhập hệ thống 44 3.3 Giao diện 45 3.4 Kết mặt hàng có giá trị lợi nhuận cao 46 3.5 Thời gian thực hai thuật toán 47 3.6 Dung lượng nhớ hai thuật toán 47 3.7 Số nút tìm kiếm thuật tốn 48 ... ? ?Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ sở liệu bán hàng siêu thị Co. opMart Quảng Ngãi? ?? Mục tiêu nhiệm vụ 2.1 Mục tiêu - Thu thập liệu bán hàng siêu thị Co. opMart Quảng Ngãi. .. Ngãi - Tìm hiểu thuật tốn EFIM để khai phá tập mục hữu ích cao từ CSDL giao tác - Ứng dụng thuật tốn EFIM để tìm tập mục hữu ích cao từ CSDL bán hàng siêu thị Co. opMart Quảng Ngãi 3 2.2 Nhiệm... - Thuật toán EFIM để khai phá tập mục hữu ích cao - Thơng tin liệu bán hàng siêu thị 3.2 Phạm vi nghiên cứu - Nghiên cứu thuật toán EFIM để khai phá tập mục hữu ích cao từ CSDL giao tác - Số liệu

Ngày đăng: 24/04/2022, 15:20

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[2] Nguyễn Hữu Trọng (2007), “Thuật toán khai phá tập mục dữ liệu thường xuyên trong cơ sở dữ liệu gia tăng dựa trên phân lớp dữ liệu”, tạp chí Khoa học và Công nghệ Sách, tạp chí
Tiêu đề: Thuật toán khai phá tập mục dữ liệu thường xuyên trong cơ sở dữ liệu gia tăng dựa trên phân lớp dữ liệu
Tác giả: Nguyễn Hữu Trọng
Năm: 2007
[3] TS. Đỗ Phúc (2006), “Giáo trình khai thác dữ liệu”, NXB Đại học quốc gia TP Hồ Chí Minh.Tiếng Anh Sách, tạp chí
Tiêu đề: Giáo trình khai thác dữ liệu”
Tác giả: TS. Đỗ Phúc
Nhà XB: NXB Đại học quốc gia TP Hồ Chí Minh. Tiếng Anh
Năm: 2006
[4] R. Agrawal, R. Srikant (1994) “Fast algorithms for mining association rules in large databases”, Proceedings of 20th international conference on very large databases, Vol. 1215, pp. 487-499 Sách, tạp chí
Tiêu đề: Fast algorithms for mining association rules in large databases
[5] H. Yao, H. J. Hamilton, C. J. Butz, “A foundation approach to mining itemset utilities from databases”, in: Proceedings of the Third SIAM International Conference on Data Mining, Orlando, Florida, 2004, pp.482-486 Sách, tạp chí
Tiêu đề: A foundation approach to mining itemset utilities from databases
[6] H. Yao, H. J. Hamilton, L. Geng, “A Unified Framework for Utility Based Measures for Mining Itemsets”, UBDM06, Philadelphia, Pennsyl-vania, USA, August 2006 Sách, tạp chí
Tiêu đề: A Unified Framework for Utility Based Measures for Mining Itemsets
[7] Jiawei Han, Micheline Kamber; Jian Pei (2012) “Data Mining Concepts and Techniques” Third Edition Sách, tạp chí
Tiêu đề: Data Mining Concepts and Techniques
[8] Liu, Y. Liao, W. Choudhary. A: (2005) “A two-phase algorithm for fast discovery of high utility itemsets”, In: Proc. 9th Pacic-Asia Conf. on Knowl. Discovery and DataMining, pp. 689-695 (2005) Sách, tạp chí
Tiêu đề: A two-phase algorithm for fast discovery of high utility itemsets
[9] Liu, M. J. Qu, “Mining high utility itemsets without candidate generation”, In Sách, tạp chí
Tiêu đề: Mining high utility itemsets without candidate generation
[11] T. Mitchell (1999) “Machine Learning and Data Mining”, Communications of the ACM, Vol. 42, No. 11, pp. 30-36 Sách, tạp chí
Tiêu đề: Machine Learning and Data Mining
[12] Sudip Bhattacharya, Deepty Dubey “High Utility Itemset Mining”International Journal of Emerging Technology and Advanced Engineering 2012 pp. 476-481 Sách, tạp chí
Tiêu đề: High Utility Itemset Mining
[13] S. Shankar, T. P. Purusothoman, S. Jayanthi, N. Babu, “A fast agorithm for mining high utility itemsets”, in: Proceedings of IEEE International Advance Computing Conference (IACC 2009), Patiala, India, pp.1459- 1464 Sách, tạp chí
Tiêu đề: A fast agorithm formining high utility itemsets
[14] S. Zida, P. Fournier-Viger, J. C. W. Lin, C. W. Wu, VS. Tseng (2015) “EFIM:A Highly Efficient Algorithm for Mining High-Utility Itemsets mining”, Mexican International Conference on Artificial. 530-546 Sách, tạp chí
Tiêu đề: EFIM:"A Highly Efficient Algorithm for Mining High-Utility Itemsets mining
[15] V. Philippe Fournier, C. W. Wu, S. Zida,V. S. Tseng “FHM: Faster High- Utility Itemset Mining using Estimated Utility Co-occurrence Pruning”, 2014, pp. 83-92Trang Web Sách, tạp chí
Tiêu đề: FHM: Faster High-Utility Itemset Mining using Estimated Utility Co-occurrence Pruning
Proc. 22nd ACM Intern. Conf. Info. and Know. Management, pp. 55{64 (2012) Khác
[16] Siêu thị Co.opMart <http://www.co-opmart.com.vn/trangchu/ gioithieu/ gioi- thieu-ve-coopmart_2209.html > (Truy cập: 19/04/17) Khác

HÌNH ẢNH LIÊN QUAN

DANH MỤC CÁC BẢNG - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi
DANH MỤC CÁC BẢNG (Trang 9)
Số hiệu bảng Tên bảng Trang - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi
hi ệu bảng Tên bảng Trang (Trang 9)
DANH MỤC CÁC HÌNH - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi
DANH MỤC CÁC HÌNH (Trang 10)
Hình 1.1. Quá trình khám phá tri thức - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi
Hình 1.1. Quá trình khám phá tri thức (Trang 16)
Bảng 1.1. Biểu diễn ngang - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi
Bảng 1.1. Biểu diễn ngang (Trang 22)
Bảng 1.2. Biểu diễn dọc - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi
Bảng 1.2. Biểu diễn dọc (Trang 23)
Bảng 1.3. Biểu diễn ma trận giao tác - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi
Bảng 1.3. Biểu diễn ma trận giao tác (Trang 23)
Ví dụ: Đối với CSDL giao tác trong bảng 1.1, xét tập mục {A, B},cho thấy: - Số giao tác chứa tập mục {A, B} là 2  - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi
d ụ: Đối với CSDL giao tác trong bảng 1.1, xét tập mục {A, B},cho thấy: - Số giao tác chứa tập mục {A, B} là 2 (Trang 24)
Bảng 2.1. Cơ sở dữ liệu giao tác - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi
Bảng 2.1. Cơ sở dữ liệu giao tác (Trang 30)
Ví dụ: Trong bảng 2.1 và bảng 2.2 tính độ hữu ích của giao tác T1, T2 trong trong CSDL giao tác D - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi
d ụ: Trong bảng 2.1 và bảng 2.2 tính độ hữu ích của giao tác T1, T2 trong trong CSDL giao tác D (Trang 34)
Hình: 2.1. Biểu diễn cây tìm kiếm củ aI - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi
nh 2.1. Biểu diễn cây tìm kiếm củ aI (Trang 36)
Bảng 2.5. Giá trị TWU bằng utility-bin - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi
Bảng 2.5. Giá trị TWU bằng utility-bin (Trang 42)
2.5.2. Thuật toán EFIM - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi
2.5.2. Thuật toán EFIM (Trang 42)
Bảng 2.6. CSDL sau khi sắp xếp các giao tác - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi
Bảng 2.6. CSDL sau khi sắp xếp các giao tác (Trang 45)
Bảng 2.8. Tập mục hữu ích cao - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi
Bảng 2.8. Tập mục hữu ích cao (Trang 46)
Bảng 3.1. Danh sách các mặt hàng - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi
Bảng 3.1. Danh sách các mặt hàng (Trang 49)
Dữ liệu trong hình 3.1. được biểu diễn gồm nhiều dòng và nhiều cột mỗi qua thuộc tính tên hàng và số lượng bán ra - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi
li ệu trong hình 3.1. được biểu diễn gồm nhiều dòng và nhiều cột mỗi qua thuộc tính tên hàng và số lượng bán ra (Trang 50)
Hình 3.1. Dữ liệu được làm sạch - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi
Hình 3.1. Dữ liệu được làm sạch (Trang 51)
Bảng 3.2. Lợi nhuận của từng mặt hàng - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi
Bảng 3.2. Lợi nhuận của từng mặt hàng (Trang 52)
Hình 3.2. Màn hình đăng nhập hệ thống - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi
Hình 3.2. Màn hình đăng nhập hệ thống (Trang 54)
Hình 3.3. Giao diện chính - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi
Hình 3.3. Giao diện chính (Trang 55)
Bảng 3.3. Kết quả trả về của hai thuật toán - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi
Bảng 3.3. Kết quả trả về của hai thuật toán (Trang 56)
Hình 3.4. Kết quả các mặt hàng có giá trị lợi nhuận cao - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi
Hình 3.4. Kết quả các mặt hàng có giá trị lợi nhuận cao (Trang 56)
Hình 3.5. Thời gian thực hiện của hai thuật toán - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi
Hình 3.5. Thời gian thực hiện của hai thuật toán (Trang 57)
Hình 3.6. Dung lượng bộ nhớ của hai thuật toán - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi
Hình 3.6. Dung lượng bộ nhớ của hai thuật toán (Trang 57)
Hình 3.7. Số nút tìm kiếm của 2 thuật toán - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi
Hình 3.7. Số nút tìm kiếm của 2 thuật toán (Trang 58)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w