BÁO CÁO ĐỒ ÁN MÔN HỌC KHAI PHÁ DỮ LIỆU NHỜ VÀO PHẦN MỀM WEKA VÀ R SỬ DỤNG THUẬT TOÁN APRIORI ĐỂ SẮP XẾP SẢN PHẨM TRƯNG BÀY TẠI BÁCH HÓA XANH TRƯỜNG ĐẠI HỌC TÀI CHÍNH – MARKETING KHOA CÔNG NGHỆ THÔNG TIN
TRƯỜNG ĐẠI HỌC TÀI CHÍNH – MARKETING KHOA CƠNG NGHỆ THÔNG TIN BÁO CÁO ĐỒ ÁN ĐỀ TÀI: “SỬ DỤNG THUẬT TOÁN APRIORI ĐỂ SẮP XẾP SẢN PHẨM TRƯNG BÀY TẠI BÁCH HÓA XANH” Giảng viên hướng dẫn : Họ tên sinh viên : MSSV : Họ tên sinh viên : MSSV : Mã lớp học phần : ThS Thái Thị Ngọc Lý TP Hồ Chí Minh, tháng năm 2023 TRƯỜNG ĐẠI HỌC TÀI CHÍNH – MARKETING KHOA CƠNG NGHỆ THƠNG TIN BÁO CÁO ĐỒ ÁN ĐỀ TÀI: “SỬ DỤNG THUẬT TOÁN APRIORI ĐỂ SẮP XẾP SẢN PHẨM TRƯNG BÀY TẠI BÁCH HÓA XANH” Giảng viên hướng dẫn : Họ tên sinh viên : MSSV : Họ tên sinh viên : MSSV : Mã lớp học phần: : ThS Thái Thị Ngọc Lý TP Hồ Chí Minh, tháng năm 2023 NHẬN XÉT CỦA GIẢNG VIÊN Điểm số: Điểm chữ: Tp Hồ Chí Minh, ngày … tháng … năm 2022 Giảng viên phụ trách (Ký ghi rõ họ tên) NHẬN XÉT CỦA GIẢNG VIÊN Điểm số: Điểm chữ: Tp Hồ Chí Minh, ngày … tháng … năm 2022 Giảng viên phụ trách (Ký ghi rõ họ tên) LỜI CẢM ƠN Lời đầu tiên, nhóm em xin gửi lời cảm ơn chân thành đến Cô Thái Thị Ngọc Lý hướng dẫn giúp đỡ q trình làm báo cáo đồ án mơn Khai phá liệu Cơ dành thời gian tận tình để giúp đỡ em việc hiểu áp dụng kiến thức khai phá liệu vào tập báo cáo em Nhờ có dẫn cơ, em có hội nắm bắt rõ ràng phương pháp khai phá liệu làm quen với công cụ phân tích liệu Cơ hỗ trợ em việc giải đáp thắc mắc điểm hạn chế tập báo cáo, giúp em hồn thiện tốt cơng việc Một lần nữa, em xin chân thành cảm ơn cô truyền đạt kiến thức tạo điều kiện để em hồn thành báo cáo đồ án mơn học Em tôn trọng trân trọng giá trị mà dành cho em Xin kính chúc cô tất người hỗ trợ đóng góp ý kiến cho chúng em người thân lời chúc sức khỏe, hạnh phúc thành đạt Xin chân thành cảm ơn DANH MỤC BẢNG Bảng 4.1: Bảng liệu sản phẩm trưng bày Bách hóa Xanh 19 DANH MỤC HÌNH ẢNH Hình 2.1: Dữ liệu mẫu cửa hàng Bách hóa Xanh 12 Hình 2.2: Chọn tập hàng .12 Hình 2.3: Tạo tổ hợp hàng ứng tuyển C2 .13 Hình 2.4: Tạo L2 13 Hình 2.5: Tạo tổ hợp hàng ứng tuyển C3 .14 Hình 2.6: Tạo L3 14 Hình 2.7: Xác định luật kết hợp thỏa độ tin cậy tối thiểu .15 Hình 4.1: Tải tập tin liệu DLBachHoaXanh 20 Hình 4.2: Đổi thành dạng NumericToNominal 20 Hình 4.3: Chọn Apriori danh sách thuật toán 21 Hình 4.4: Chỉnh sửa thông số 21 Hình 4.5: Kết chạy thuật toán Apriori 22 Hình 4.6: Thêm file liệu arff 24 Hình 4.7: Add thuật toán 25 Hình 4.8: Run Experiment 25 Hình 4.9: Chỉnh sửa Comparison Field .25 Hình 4.10: Chọn thuật tốn phân tích .26 Hình 4.11: Kết phân tích Experiment 26 Hình 4.12: Thêm File liệu sản phẩm Bách hóa Xanh cho ArffLoader 27 Hình 4.13: Thiết lập modal chưa kết nối 28 Hình 4.14: Nạp liệu từ dataset vào mơ hình 28 Hình 4.15: Nạp liệu từ text vào mơ hình 28 Hình 4.16: Mơ hình khai phá liệu 28 Hình 4.17: Chạy mơ hình 29 Hình 4.18: Kết chạy Knowledge Flow 29 Hình 4.19: Đọc liệu từ tập tin 29 Hình 4.20: Chuyển đổi liệu áp dụng thuật toán 30 Hình 4.21: Chạy dịng lệnh thuật tốn 30 Hình 4.22: Tính tần suất xuất 30 Hình 4.23: Kết danh sách sản phẩm tần xuất 31 Hình 4.24: Hiển thị luật kết hợp 31 Hình 4.25: Hiện thị biểu đồ 32 Hình 4.26: Tạo database, nhúng liệu vào 33 Hình 4.27: Import liệu DLBachHoaXanh.csv 33 Hình 4.28: Hiển thị xem trước liệu 34 Hình 4.29: Sử đổi cột liệu 34 Hình 4.30: Chèn liệu vào SQL hoàn thành 34 Hình 4.31: Thiết lập Database URL 35 Hình 4.32: Kết nối SQL với Weka thành công 35 Hình 4.33: Truy vấn liệu 35 Hình 4.34: Hiển thị liệu Weka 36 DANH MỤC TỪ VIẾT TẮT Từ viết tắt Giải thích SVM Support Vector Machine PCA Principal Component Analysi RODBC R Open Database Connectivity SQL Uniform Resource Locator URL Structured Query Language DANH MỤC THUẬT NGỮ ANH - VIỆT Thuật ngữ Tiếng Anh Nghĩa Tiếng Việt Data Warehouse Quản lý rủi ro Dimension tables Kho liệu Snowflake Schema Bảng chiếu Hybrid Schema Mơ hình tuyết Galaxy Schema Mơ hình lai Value constraints Mơ hình vũ trụ Corporate analysis Ràng buộc giá trị Risk management Phân tích doanh nghiệp