Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi

73 21 0
Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC SƯ PHẠM PHẠM THỊ KIM PHƯỢNG ỨNG DỤNG THUẬT TOÁN EFIM ĐỂ KHAI PHÁ TẬP MỤC HỮU ÍCH CAO TỪ CƠ SỞ DỮ LIỆU BÁN HÀNG TẠI SIÊU THỊ CO.OPMART QUẢNG NGÃI LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN Đà Nẵng – Năm 2017 ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC SƯ PHẠM PHẠM THỊ KIM PHƯỢNG ỨNG DỤNG THUẬT TOÁN EFIM ĐỂ KHAI PHÁ TẬP MỤC HỮU ÍCH CAO TỪ CƠ SỞ DỮ LIỆU BÁN HÀNG TẠI SIÊU THỊ CO.OPMART QUẢNG NGÃI Chuyên ngành: HỆ THỐNG THÔNG TIN Mã số: 61.49.01.06 LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN Người hướng dẫn khoa học: PGS.TSKH TRẦN QUỐC CHIẾN Đà Nẵng – Năm 2017 LỜI CAM ĐOAN Tôi xin cam đoan: - Đây cơng trình nghiên cứu riêng tơi - Nội dung, kết nêu luận văn trung thực chưa công bố cơng trình khác - Mọi tham khảo dùng luận văn trích dẫn rõ ràng trung thực tên tác giả, tên cơng trình, thời gian địa điểm công bố - Mọi chép không hợp lệ, vi phạm quy chế đào tạo, hay gian trá, tơi xin chịu hồn tồn trách nhiệm Tác giả luận văn Phạm Thị Kim Phượng MỤC LỤC MỞ ĐẦU 1 Lý chọn đề tài Mục tiêu nhiệm vụ Đối tượng phạm vi nghiên cứu Phương pháp nghiên cứu Ý nghĩa đề tài Kết dự kiến Bố cục luận văn CHƯƠNG CƠ SỞ LÝ THUYẾT VỀ KHAI PHÁ DỮ LIỆU 1.1 TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU 1.1.1 Sơ lược khai phá liệu 1.1.2 Quá trình khám phá tri thức từ sở liệu 1.1.3 Các dạng liệu khai phá 1.1.4 Một số kỹ thuật khai phá liệu 1.1.5 Một số ứng dụng khai phá liệu 1.1.6 Lợi khai phá liệu so với phương pháp khác 10 1.1.7 Những thách thức khai phá liệu 11 1.2 KỸ THUẬT KHAI PHÁ TẬP MỤC PHỔ BIẾN VÀ LUẬT KẾT HỢP12 1.2.1 Cơ sở liệu giao tác 12 1.2.2 Tập mục phổ biến luật kết hợp 13 1.2.3 Khai phá tập mục phổ biến - Frequent Itemset Mining 15 1.2.4 Khai phá luật kết hợp 16 1.3 KẾT CHƯƠNG 17 CHƯƠNG KHAI PHÁ TẬP MỤC HỮU ÍCH CAO TỪ CƠ SỞ DỮ LIỆU GIAO TÁC 18 2.1 ĐẶT VẤN ĐỀ 18 2.2 TỔNG QUAN VỀ TÌNH HÌNH NGHIÊN CỨU KHAI PHÁ TẬP MỤC HỮU ÍCH CAO 18 2.3 MỘT SỐ ĐỊNH NGHĨA CỦA BÀI TOÁN 20 2.4 MỘT SỐ THUẬT TOÁN KHAI PHÁ TẬP MỤC HỮU ÍCH CAO 22 2.4.1 Thuật tốn Two-Phase 22 2.4.2 Thuật toán FHM 23 2.5 THUẬT TOÁN EFIM 23 2.5.1 Một số khái niệm 24 2.5.2 Thuật toán EFIM 32 2.6 ÁP DỤNG THUẬT TOÁN 34 2.7 KẾT CHƯƠNG 36 CHƯƠNG CÀI ĐẶT THUẬT TOÁN EFIM VÀ ỨNG DỤNG KHAI PHÁ DỮ LIỆU BÁN HÀNG 37 3.1 GIỚI THIỆU HỆ THỐNG SIÊU THỊ 37 3.2 GIẢI PHÁP KHAI PHÁ TẬP MỤC HỮU ÍCH CAO TỪ CƠ SỞ DỮ LIỆU BÁN HÀNG TẠI SIÊU THỊ 38 3.3 THU THẬP VÀ XỬ LÝ DỮ LIỆU 38 3.3.1 Một số vấn đề liên quan đến lợi nhuận cao 38 3.3.2 Thu thập xử lý liệu 39 3.4 CÀI ĐẶT THUẬT TOÁN 42 3.4.1 Lớp Item 43 3.4.2 Lớp Transaction 43 3.4.3 Lớp DataAssistant 43 3.4.4 Lớp EFIM 44 3.5 THỬ NGHIỆM CHƯƠNG TRÌNH 44 3.6 ĐÁNH GIÁ THUẬT TOÁN 46 3.6.1 Kết đầu 46 3.6.2 Thời gian thực 46 3.6.3 Sử dụng nhớ 47 3.6.4 Tìm kiếm nút 48 3.7 KẾT CHƯƠNG 48 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 49 DANH MỤC TÀI LIỆU THAM KHẢO QUYẾT ĐỊNH GIAO ĐỀ TÀI (BẢN SAO) DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT CÁC KÝ HIỆU α Tập mục α–T Giao tác tham chiếu α–D CSDL tham chiếu conf(X→ Y) Độ tin cậy luật X→ Y D Cơ sở liệu giao tác D E(α) Các mục mở rộng H Tập hợp tập mục hữu ích cao I Tập mục CSDL giao tác ij Mục liệu thứ j lu(α, z ) Giá trị hữu ích cục z α minconf Độ tin cậy tối thiểu minutil Ngưỡng hữu ích tối thiểu minsup Độ hỗ trợ tối thiểu re(X, Td) Giá trị hữu ích cịn lại X giao tác Td su(α, z) Giá trị hữu ích z α sup(X) Độ hỗ trợ tập mục X sup(X→ Y) Độ hỗ trợ luật X→ Y T Giao tác Td Giao tác thứ d tu Độ hữu ích giao tác TWU(X) Độ hữu ích trọng số tập mục X u(ij, Td) Giá trị hữu ích tập mục ij giao tác u(X) Giá trị hữu ích tập mục X X→ Y Luật X→ Y z Mục ≻ Thứ tự xếp mục ≻T Thứ tự xếp giao tác  Và  Tập  Phép giao  Phép hợp CÁC CHỮ VIẾT TẮT CSDL Cơ Sở Dữ Liệu KPDL Khai Phá Dữ Liệu EFIM EFficient high-utility Itemset Mining EUCS Estimated Utility Co-Occurrence Structure FHM Fast High-utility Miner FUC Fast Utility Counting FUM Fast Utility Mining HDP High-utility Database Projection HTM High-utility Transaction Merging KDD Knowledge Discovery in Databases LUHF Low Utility and High Frequency LULF Low Utility and Low Frequency HUHF High Utility and High Frequency HULF High Utility and Low Frequency TWU Transaction Weighted Utilization HUIM High Utility Itemset Mining DANH MỤC CÁC BẢNG Số hiệu bảng Tên bảng Trang 1.1 Biểu diễn ngang 12 1.2 Biểu diễn dọc 13 1.3 Biểu diễn ma trận giao tác 13 1.4 Danh sách tập mục phổ biến 14 2.1 Cơ sở liệu giao tác 20 2.2 Biểu diễn giá trị lợi nhuận mục CSDL 20 2.3 Bảng độ hữu ích giao tác CSDL 24 2.4 TWU mục CSDL giao tác D 25 2.5 Giá trị TWU utility-bin 32 2.6 CSDL sau xếp giao tác 35 2.7 Hợp giao tác CSDL tham chiếu {A} –D 35 2.8 Tập mục hữu ích cao 36 3.1 Danh sách mặt hàng 39 3.2 Lợi nhuận mặt hàng 42 3.3 Kết trả hai thuật toán 46 DANH MỤC CÁC HÌNH Số hiệu hình Tên hình Trang 1.1 Quá trình khám phá tri thức 2.1 Biểu diễn tìm kiếm I 26 3.1 Dữ liệu làm 41 3.2 Màn hình đăng nhập hệ thống 44 3.3 Giao diện 45 3.4 Kết mặt hàng có giá trị lợi nhuận cao 46 3.5 Thời gian thực hai thuật toán 47 3.6 Dung lượng nhớ hai thuật toán 47 3.7 Số nút tìm kiếm thuật tốn 48 ... ? ?Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ sở liệu bán hàng siêu thị Co. opMart Quảng Ngãi? ?? Mục tiêu nhiệm vụ 2.1 Mục tiêu - Thu thập liệu bán hàng siêu thị Co. opMart Quảng Ngãi. .. Ngãi - Tìm hiểu thuật tốn EFIM để khai phá tập mục hữu ích cao từ CSDL giao tác - Ứng dụng thuật tốn EFIM để tìm tập mục hữu ích cao từ CSDL bán hàng siêu thị Co. opMart Quảng Ngãi 3 2.2 Nhiệm... - Thuật toán EFIM để khai phá tập mục hữu ích cao - Thơng tin liệu bán hàng siêu thị 3.2 Phạm vi nghiên cứu - Nghiên cứu thuật toán EFIM để khai phá tập mục hữu ích cao từ CSDL giao tác - Số liệu

Ngày đăng: 24/04/2022, 15:20

Hình ảnh liên quan

DANH MỤC CÁC BẢNG - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi
DANH MỤC CÁC BẢNG Xem tại trang 9 của tài liệu.
Số hiệu bảng Tên bảng Trang - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi

hi.

ệu bảng Tên bảng Trang Xem tại trang 9 của tài liệu.
DANH MỤC CÁC HÌNH - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi
DANH MỤC CÁC HÌNH Xem tại trang 10 của tài liệu.
Hình 1.1. Quá trình khám phá tri thức - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi

Hình 1.1..

Quá trình khám phá tri thức Xem tại trang 16 của tài liệu.
Bảng 1.1. Biểu diễn ngang - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi

Bảng 1.1..

Biểu diễn ngang Xem tại trang 22 của tài liệu.
Bảng 1.2. Biểu diễn dọc - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi

Bảng 1.2..

Biểu diễn dọc Xem tại trang 23 của tài liệu.
Bảng 1.3. Biểu diễn ma trận giao tác - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi

Bảng 1.3..

Biểu diễn ma trận giao tác Xem tại trang 23 của tài liệu.
Ví dụ: Đối với CSDL giao tác trong bảng 1.1, xét tập mục {A, B},cho thấy: - Số giao tác chứa tập mục {A, B} là 2  - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi

d.

ụ: Đối với CSDL giao tác trong bảng 1.1, xét tập mục {A, B},cho thấy: - Số giao tác chứa tập mục {A, B} là 2 Xem tại trang 24 của tài liệu.
Bảng 2.1. Cơ sở dữ liệu giao tác - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi

Bảng 2.1..

Cơ sở dữ liệu giao tác Xem tại trang 30 của tài liệu.
Ví dụ: Trong bảng 2.1 và bảng 2.2 tính độ hữu ích của giao tác T1, T2 trong trong CSDL giao tác D - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi

d.

ụ: Trong bảng 2.1 và bảng 2.2 tính độ hữu ích của giao tác T1, T2 trong trong CSDL giao tác D Xem tại trang 34 của tài liệu.
Hình: 2.1. Biểu diễn cây tìm kiếm củ aI - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi

nh.

2.1. Biểu diễn cây tìm kiếm củ aI Xem tại trang 36 của tài liệu.
Bảng 2.5. Giá trị TWU bằng utility-bin - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi

Bảng 2.5..

Giá trị TWU bằng utility-bin Xem tại trang 42 của tài liệu.
2.5.2. Thuật toán EFIM - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi

2.5.2..

Thuật toán EFIM Xem tại trang 42 của tài liệu.
Bảng 2.6. CSDL sau khi sắp xếp các giao tác - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi

Bảng 2.6..

CSDL sau khi sắp xếp các giao tác Xem tại trang 45 của tài liệu.
Bảng 2.8. Tập mục hữu ích cao - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi

Bảng 2.8..

Tập mục hữu ích cao Xem tại trang 46 của tài liệu.
Bảng 3.1. Danh sách các mặt hàng - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi

Bảng 3.1..

Danh sách các mặt hàng Xem tại trang 49 của tài liệu.
Dữ liệu trong hình 3.1. được biểu diễn gồm nhiều dòng và nhiều cột mỗi qua thuộc tính tên hàng và số lượng bán ra - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi

li.

ệu trong hình 3.1. được biểu diễn gồm nhiều dòng và nhiều cột mỗi qua thuộc tính tên hàng và số lượng bán ra Xem tại trang 50 của tài liệu.
Hình 3.1. Dữ liệu được làm sạch - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi

Hình 3.1..

Dữ liệu được làm sạch Xem tại trang 51 của tài liệu.
Bảng 3.2. Lợi nhuận của từng mặt hàng - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi

Bảng 3.2..

Lợi nhuận của từng mặt hàng Xem tại trang 52 của tài liệu.
Hình 3.2. Màn hình đăng nhập hệ thống - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi

Hình 3.2..

Màn hình đăng nhập hệ thống Xem tại trang 54 của tài liệu.
Hình 3.3. Giao diện chính - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi

Hình 3.3..

Giao diện chính Xem tại trang 55 của tài liệu.
Bảng 3.3. Kết quả trả về của hai thuật toán - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi

Bảng 3.3..

Kết quả trả về của hai thuật toán Xem tại trang 56 của tài liệu.
Hình 3.4. Kết quả các mặt hàng có giá trị lợi nhuận cao - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi

Hình 3.4..

Kết quả các mặt hàng có giá trị lợi nhuận cao Xem tại trang 56 của tài liệu.
Hình 3.5. Thời gian thực hiện của hai thuật toán - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi

Hình 3.5..

Thời gian thực hiện của hai thuật toán Xem tại trang 57 của tài liệu.
Hình 3.6. Dung lượng bộ nhớ của hai thuật toán - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi

Hình 3.6..

Dung lượng bộ nhớ của hai thuật toán Xem tại trang 57 của tài liệu.
Hình 3.7. Số nút tìm kiếm của 2 thuật toán - Ứng dụng thuật toán EFIM để khai phá tập mục hữu ích cao từ cơ sở dữ liệu bán hàng tại siêu thị co opmart quảng ngãi

Hình 3.7..

Số nút tìm kiếm của 2 thuật toán Xem tại trang 58 của tài liệu.

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan