1. Trang chủ
  2. » Giáo Dục - Đào Tạo

đề tài tìm HIỂU về RAPIDMINER và THUẬT TOÁN KMEANS áp DỤNG TRÊN dữ LIỆU THỰC tế

45 98 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 45
Dung lượng 2,15 MB

Nội dung

TRƯỜNG ĐẠI HỌC MỎ - ĐỊA CHẤT KHOA CÔNG NGHỆ THÔNG TIN HỌC PHẦN : KHAI PHÁ DỮ LIỆU ĐỀ TÀI: TÌM HIỂU VỀ RAPIDMINER VÀ THUẬT TỐN KMEANS ÁP DỤNG TRÊN DỮ LIỆU THỰC TẾ BÁO CÁO BÀI TẬP LỚN GIÁO VIÊN HƯỚNG DẪN: NGUYỄN THỊ PHƯƠNG BẮC NHÓM SINH VIÊN THỰC HIỆN: Nguyễn Tiến Đạt - 1821050193 Đỗ Thị Hương - 1821050186 Nguyễn Thị Thanh Thanh Nhàn - 1821050676 Bùi Thị Phương Thảo - 1821050110 Mục lục Phần I: Mở đầu 1 Lý chọn đề tài Mục tiêu nghiên cfíu Đối tượng phạm vi nghiên cfíu Phương pháp nghiên cfíu Kết cấu đề tài Phần II: Nội Dung I: Tổng quan khám phá tri thfíc khai phá liệu 1.1 Khám phá tri thfíc tri thfíc 1.1.1 Khái niệm 1.1.2 Vai trò khám phá tri thức 1.1.3 Tiến trình khai phá tri thức 1.2 Khai phá liệu 1.2.1 Khái niệm 1.2.2 Các phương pháp khai phá liệu 1.2.3 Một số khó khăn thách thức khai phá liệu 10 1.2.4 Quá trình khai phá liệu 10 1.2.5 Những ứng dụng khai phá liệu 12 Chương II: Khai phá liệu với thuật toán phân cụm 13 2.1 Phân cụm liệu 13 2.1.1 Khái niệm 13 2.1.2 Các yêu cầu thuật toán phân cụm liệu 13 2.1.3 Ý nghĩa thực tiễn phân cụm 14 2.1.4 Thuật toán K-means phân cụm liệu 14 III: Ứng dụng phần mềm khai phá liệu Rapidminer vào quản lý khách hàng mua hàng Cơng ty TNHH Máy Tính Phong Vũ 19 3.1 Tổng quan Công ty 19 3.1.1 Giới thiệu 19 3.1.2 Cơ cấu tổ chức 20 3.1.3 Định hướng phát triển 20 3.2 Phần mềm khai phá liệu Rapid miner 21 3.2.1 Giới thiệu chung 21 3.2.2 Giới thiệu giao diện 21 3.2.4 Phân cụm với Rapid Miner 3.3 Ứng dụng phân cụm liệuvào quản lý khách hàng mua hàng 21 24 3.3.1 Xác định nội dung cần khai phá 24 3.3.2 Lựa chọn liệu 24 3.3.3 Tiền xử lý liệu toán 24 3.3.5 Khai phá liệu thuật toán K-mean 32 3.4 Một số giải pháp đưa việc quản lý khách hàng mua hàng 34 Phần III: Kết Luận 36 3.1 Kết Luận 36 3.1.1 Kết đạt 36 3.1.2 Hạn chế đề tài 36 3.2 Hướng phát triển đề tài Tài liệu tham khảo 36 37 Các từ viết tắt báo cáo Từ viết tắt Ý nghĩa CSDL Cơ sở liệu DL Dữ liệu KPDL Khai phá liệu TNHH Trách nhiệm hữu hạn Các kí hiệu sử dụng Các kí hiệu Ý nghĩa ∅ Tập rỗng ⊆ Bị chfía ∈ Thuộc ∉ Không thuộc ≤ Nhỏ ≥ Lớn ≠ Khác ∩ Phép lấy hợp tập hợp Phép lấy giao tập hợp Danh mục hình vẽ Hình 1.1: Các bước q trình khai phá tri thfíc Hình 1.2: Các bước trình khai phá liệu 11 (Hình 2.1: Các bước thuật tốn K-mean) 19 Hình 2.2: Khởi tạo trọng tâm 20 Hình 2.3: Cập nhật vị trí trọng tâm 21 Hình 2.4: Lặp lại bước 3, Cập nhật trọng tâm 21 Hình 2.5: Kết sau phân cụm 22 Hình 3.1: Logo cơng ty 23 Hình 3.2: Cơ cấu tổ chfíc cơng ty 24 Hình 3.3: Giao diện tổng quan RapidMiner 25 Hình 3.4: Bổ sung WEKA cho RapidMiner 26 Hình 3.5: Tìm kiếm W-Apriori 26 Hình 3.6: Các tham số W-Apriori 26 Hình 3.7: Thực Phân Cụm với K-Means 27 Hình 3.8: Lựa chọn tham số cho K-Means 28 Hình 3.9: Kết chạy K-Means tìm 28 Hình 3.10: Tạo nơi lưu trữ liệu 30 Hình 3.11: Chọn nơi lưu trữ liệu 30 Hình 3.12: Biểu tượng để đưa liệu vào 31 Hình 3.13: Chọn file cần đưa vào 31 Hình 3.14: Thiết lập cột cho thuộc tính 31 Hình 3.15: Chú thích thuộc tính 32 Hình 3.16: Xác định loại liệu thuộc tính 32 Hình 3.17: Lưu tên cho kho liệu 33 Hình 3.18: Cơ sở liệu khách hàng 33 Hình 3.19: Đưa liệu khách hàng vào chương trình 34 Hình 3.20: Thực câu lệnh if để chia miền giá trị cho Giá thành Số lượng 34 Hình 3.21: Kết liệu sau thực chia miền liệu 34 Hình 3.22: Kết sau thay đổi liệu 35 Hình 3.23: Thay thuộc tính đánh giá khách hàng 35 Hình 3.24: Thay thuộc tính phân loại số lượng 36 Hình 3.25: Lựa chọn thuộc tính cần mơ hình 36 Hình 3.26: Dữ liệu tiền xfí lý 37 Hình 3.27: Chạy Filter Example 42 Hình 3.28: Kết cụm 42 Hình 3.29: Kết cụm 43 Hình 3.30: Kết cụm 43 Danh mục bảng biểu Bảng 1: Các đối tượng để phân cụm 20 Tóm tắt nội dung nghiên cfíu Trong tình hình nay, thông tin trở thành yếu tố định kinh doanh vấn đề tìm thơng tin hữu ích sở liệu khổng lồ ngày trở thành mục tiêu quan trọng công ty Khai phá liệu dần trở thành cơng cụ để thực thi nhiệm vụ đó, từ sở liệu sẵn có phải tìm thơng tin tiềm ẩn cách nhanh chóng có giá trị Cơng ty TNHH Máy tính Phong Vũ chuyên cung cấp loại mặt hàng điện tfí nhằm phục vụ nhu cầu cho khách hàng thị trường, muốn lưu trữ khai thác thông tin hữu ích từ CSDL khách hàng để cơng ty hiểu khách hàng nhằm có sách chăm sóc khách hàng Từ lý đó, đề tài: “Sfí dụng phần mềm Rapidminer nhằm phân loại khách hàng quản lý khách hàng mua hàng công ty TNHH Máy Tính Phong Vũ” chọn triển khai thực Chun đề trình bày kiến thfíc lý thuyết khai phá liệu, lý thuyết luật kết hợp; thuật toán Apriori khai phá luật kết hợp lý thuyết phân cụm liệu; Thuật toán K-means phân cụm liệu Chuyên đề lấy thông tin khách hàng Công ty TNHH Máy tình Phong Vũ để giải tốn Sfí dụng phần mềm khai phá liệu RipidMiner để tiền xfí lý liệu khách hàng vận dụng thuật toán Apriori, thuật toán K-means nhằm đưa mối liên hệ giá trị liệu Qua kết thu từ luật kết hợp phân cụm liệu, rút số nhận xét chung thơng tin thu Từ đưa số giải pháp hỗ trợ chăm sóc khách hàng cơng ty Phần I: Mở đầu Lý chọn đề tài Ngày nay, xã hội ngày phát triển lượng thơng tin tăng lên với tốc độ bùng nổ Lượng liệu khổng lồ nguồn tài nguyên vô giá biết cách phát khai thác thông tin hữu ích có Như vấn đề đặt với liệu việc lưu trữ khai thác chúng Các phương pháp khai thác liệu truyền thống ngày khơng đáp fíng nhu cầu thực tế Một khuynh hướng kĩ thuật kĩ thuật khai phá liệu khám phá trí thfíc Cơng nghệ khai phá liệu đời cho phép ta khai thác tri thfíc hữu dụng việc trích xuất thơng tin có mối quan hệ mối tương quan định từ kho liệu lớn mà bình thường khơng thể nhận diện từ giải tốn tìm kiếm, phân loại, dự báo xu thế, hành vi tương lai tính thông minh khác Ngày nay, công nghệ khai thác liệu fíng dụng rộng rãi hầu hết lĩnh vực: truyền thơng, y học, phân tích liệu… Đặc biệt lĩnh vực kinh doanh, việc fíng dụng cơng nghệ khai phá liệu vào việc quản lý yếu tố quan trọng góp phần vào việc thành cơng cơng ty Trong trình hoạt động kinh doanh, liệu công ty phát sinh ngày nhiều Để tận dụng nguồn liệu sfí dụng cho mục đích kinh doanh cơng ty địi hỏi phải phát triển khai phá liệu để thống kê, báo cáo, hổ trợ định hay phân tích số liệu nhằm phân loại, chăm sóc khách hàng… Khai phá liệu lĩnh vực khoa học tiềm năng, mang lại nhiều lợi ích đồng thời có ưu hẵn so với cơng cụ phân tích truyền thống Với lượng khách hàng đã, đến với cfía hàng Phong Vũ ln có sách loại khách hàng khác Để phân loại khách hàng áp dụng sách phù hợp với loại khác hàng đó, cfía hàng cần sfí dụng phần mềm phân tích , thống kê, lưu trữ loại khách hàng Từ phân tích trên, tơi lựa chọn đề tài : “Sử dụng phần mềm Rapidminer nhằm phân loại khách hàng quản lý khách hàng mua hàng Công ty TNHH Máy Tính Phong Vũ” nhằm góp phần hổ trợ cfía hàng quản lý tốt khâu quản lý khách hàng mua hàng, góp phần nhỏ trình phát triển cfía hàng Mục tiêu nghiên cfíu - Mục tiêu tổng qt: Xác định nhóm khách hàng (khách hàng tiềm năng, khách hàng truyền thống…) tới mua hàng Cơng ty TNHH Máy Tính Phong Vũ Hiều nhu cầu hành vi mua hàng nhóm khách hàng giúp cơng ty có chiến lược kinh doanh, sách giải pháp nâng cao hiệu chăm sóc nhóm khách hàng - Mục tiêu cụ thể: + Vận dụng phần mềm khai phá kiệu Rapid Miner cho Công ty TNHH Máy Tính Phong Vũ + Nghiên cfíu thêm phần mềm khai phá liệu Rapidminer, kĩ thuật khai phá như: phân cụm, kết hợp Đối tượng phạm vi nghiên cfíu ⮚ Đối tượng nghiên cfíu: - Lý thuyết khai phá liệu - Phần mềm Rapid Miner - Thuật tốn phân cụm, kết hợp - Thơng tin khách hàng Cơng ty TNHH Máy Tính Phong Vũ ⮚ Phạm vi nghiên cfíu: - Về nội dung: Sfí dụng phần mềm Rapidminer quản lý khách hàng mua hàng Cơng ty TNHH Máy tính Phong Vũ Phương pháp nghiên cfíu Đề tài sfí dụng phương pháp nghiên cfíu : - Phương pháp nghiên cfíu lý luận: thu thập, đọc hiểu, phân tích liệu, thơng tin từ tài liệu, giáo trình, tạp chí, báo cáo khoa học,…liên quan đến khai phá liệu, kỹ thuật khai phá liệu - Phương pháp thu thập số liệu: sfí dụng số liệu thfí cấp (từ phịng ban Cơng ty TNHH Máy tínhThừa Thiên Huế) - Phương pháp phân tích số liệu: vận dụng luật kết hợp kỹ thuật phân cụm phần mềm KPDL RapidMiner, CSDL bao gồm thơng tin khách hàng, doanh thu bán hàng Kết cấu đề tài Ngoài phần mở đầu phần kết luận, nội dung khóa luận bao gồm chương tổ chfíc sau: Chương I: Tổng quan khám phá tri thfíc khai phá liệu Chương II: Khai phá liệu với thuật kết hợp phân cụm Chương III: Ứng dụng phần mềm khai phá liệu Rapidminer vào quản lý khách hàng mua hàng cfía hàng điện máy Phong Vũ 3.3 Ứng dụng phân cụm liệuvào quản lý khách hàng mua hàng 3.3.1 Xác định nội dung cần khai phá Nghiên cfíu nhằm mục đích tìm mối liên hệ giá trị liệu CSDL xác định nhóm khách hàng (khách hàng truyền thống, khách hàng tiềm nhóm khách hàng bình thường) sfí dụng sản phẩm Cơng ty TNHH Máy Tính Phong Vũ Qua đó, tìm hiểu nhóm khách hàng khách hàng chủ yếu ai? Thường mua sản phẩm loại nào? Và có giá tốn bao nhiêu? nhằm đề xuất số giải pháp hỗ trợ chăm sóc khách hàng cơng ty Do đó, nghiên cfíu dựa vào liệu liên quan đến hoạt động mua hàng khách hàng, chẳng hạn: số hóa đơn, khách hàng, tên hàng, loại hàng, số lượng, đơn giá, giá thành…để khai phá luật kết hợp phân cụm 3.3.2 Lựa chọn liệu Để có kết phản ánh mối liên hệ thuộc tính liên quan đến hoạt động, thói quen mua hàng xác định nhóm khách hàng (nhóm khách hàng truyền thống, khách hàng tiềm khách hàng bình thường) khách hàng Cơng ty TNHH Máy tính Phong Vũ, nghiên cfíu thực CSDL quản lý khách hàng công ty thời gian từ tháng đến tháng năm 2015 Theo đó, liệu lưu trữ bao gồm 149 khách hàng Mỗi khách hàng quản lý thơng qua: So_hoa_don (số hóa đơn), Khach_hang (khách hàng), Ten_hang (tên hàng), Loai_hang (Loại hàng), So_luong (số lượng), Don_gia (đơn giá), Gia_thanh(giá thành) (CSDL lưu trữ phụ lục 1) Tuy nhiên, nghiên cfíu lấy liệu có ích cho q trình khai phá phân cụm là: Phan_loai_SL, Danh_gia_KH, Loai_hang 3.3.3 Tiền xử lý liệu toán Dựa đặc điểm liệu vào để đảm bảo yêu cầu liệu thuật toán Kmeans dùng để phân cụm liệu phần mềm khai phá liệu Rapidminer nghiên cfíu tiến hành tiền xfí lý liệu số thuộc tính sau: ● Thuộc tính: Giá thành Dựa vào thuộc tính Gia_thanh chia làm khoảng miền giá trị - Gia_thanh > 50.000.000: tương fíng 3: Khách hàng truyền thống - Gia_thanh > 10.000.000: tương fíng 2: Khách hàng tiềm - Còn lại Gia_thanh 10: tương fíng 3: mua với số lượng nhiều - So_luong >3: tương fíng 2: mua với số lượng vừa - Còn lại So_luong New Process -> Repositories kích chọn biểu tượng hình: Hình 3.10: Tạo nơi lưu trữ liệu Chọn New local repository -> Next -> Use standard location -> Finish hình đây: Hình 3.11: Chọn nơi lưu trữ liệu Chọn liệu cần để sfí dụng khai phá liệu: + Chuẩn bị liệu dulieukhachhang.csv mục Repositories kích chọn biểu tượng hình: Hình 3.12: Biểu tượng để đưa liệu vào +Chọn Import CSV file… chương trình yêu cầu chọn tập liệu cần đưa vào, xuất hình sau: Hình 3.13: Chọn file cần đưa vào + Tiếp theo chọn Next Chương trình u cầu cách thfíc cột phân cách Theo mặc định, Rapidminer tìm kiếm dấu chấm phẩy phân cách thuộc tính liệu Chúng ta phải thay đổi dấu phân cách nhấp vào Comma hộp Column Separation, để nhìn thấy thuộc tính cách xác Như hình sau: Hình 3.14: Thiết lập cột cho thuộc tính + Sau xem cột cho thuộc tính, kích chọn Next xuất hình 3.14 Trong Rapidminer, thuộc tính thích Chú thích quan trọng thuộc tính tên gọi - hàng với thích định nghĩa tên thuộc tính Hình 3.15: Chú thích thuộc tính + Tiếp tục nhấn Next Trong bước này, xác định kiểu liệu thuộc tính Hơn nữa, Rapidminer gán vai trị cho thuộc tính, xác định sfí dụng cho operator Những vai trị định nghĩa Cuối cùng, đổi tên thuộc tính bỏ chọn chúng hồn tồn hình sau: Hình 3.16: Xác định loại liệu thuộc tính + Bước cuối chọn kho lưu trữ để lưu trữ liệu thiết lập, bước để cung cấp cho liệu thiết lập tên Rapidminer Hình 3.17: Lưu tên cho kho liệu + Cuối nhấn Finish để hồn thành Chúng ta có bảng CSDL khách hàng hình 3.17 Hình 3.18: Cơ sở liệu khách hàng Bây thiết lập liệu có sẵn để sfí dụng Rapidminer Để bắt đầu sfí dụng q trình khai thác liệu Rapidminer, cần kéo tập liệu thả vào sổ chương trình chạy mơ hình để kiểm tra liệu Hình 3.19: Đưa liệu khách hàng vào chương trình - Tiếp theo ta chia khoảng miền giá trị cho Giá thành Số lượng Ta thực lệnh if để tiến hành chia khoảng giá trị Chọn Operate Attributes hình sau: Hình 3.20: Thực câu lệnh if để chia miền giá trị cho Giá thành Số lượng Hình 3.21: Kết liệu sau thực chia miền liệu - Một bước cân thiết để chuẩn bị liệu Điều để thay đổi kiểu liệu thuộc tính lựa chọn từ integer thành polynominal Chúng ta sfí dụng Numerical to Polynominal Hình 3.22: Kết sau thay đổi liệu - Ta tiến hành thay thuộc tính Đánh giá khách hàng: “3” = “Khách hàng truyền thống”, “2” = “Khách hàng tiềm năng”, “1” = “Khách hàng bình thường” Đưa vào cfía sổ chương trình Operator, mục Attribute filter type, chọn subset, kích chọn select Attribute chọn mục Đánh giá khách hàng Rồi thay Replace what = 3, replace by = “Khách hàng truyền thống” Tương tự với Replace lại hình sau: Hình 3.23: Thay thuộc tính đánh giá khách hàng - Tiếp theo ta tiến hành thay thuộc tính Phân loại số lượng “3” = “Mua số lượng nhiều”, “2” = “Mua số lượng vừa”, “1” = “Mua số lượng ít” Làm tương tự thay thuốc tính Đánh giá khách hàng hình sau: Hình 3.24: Thay thuộc tính phân loại số lượng - Cuối giảm số lượng thuộc tính tập liệu Để giảm liệu thêm Select Attributes vào cfía sổ chọn thuộc tính sau để đưa vào: Loai_hang, Đánh giá khách hàng, Phân loại số lượng Một có thuộc tính chọn, bấm Apply để trở q trình Hình 3.25: Lựa chọn thuộc tính cần mơ hình - Kết thúc q trình tiền xfí lý liệu ta thu file dulieutienxuly.csv Bao gồm thuộc tính, 149 ghi Các q trình khai phá liệu dựa vào file để tìm mối liên hệ giá trị liệu CSDL Hình 3.26: Dữ liệu tiền xử lý 3.3.4 Khai phá liệu thuật toán K-mean Tạo cụm liệu thuật toán K-means, tạo cụm khách hàng kết sau: Cluster Model Cluster 0: 91 items Cluster 1: items Cluster 2: 58 items Total number of items: 149 ● Ý nghĩa cụm liệu Thông qua cụm liệu tạo thành thuật tốn K-means có nhóm khách hàng sau: - Cụm 0: gồm có 91 mục Sfí dụng Filter Example để lọc kết cụm hình sau: Hình 3.27: Chạy Filter Example Hình 3.28: Kết cụm Phần lớn khách hàng bình thường đến với cơng ty thường chọn sản phẩm thuộc loại Phụ kiện, Kĩ thuật số Họ mua với số lượng nhiều tùy theo nhu cầu họ số tiền họ bỏ để mua hàng công ty thường không 10 triệu đồng Với nhóm khách hàng sản phẩm cơng nghệ cao laptop, thiết bị văn phịng với giá cao không nằm lựa chọn họ đến cơng ty - Cụm 1: gồm có mục Thực Hình 3.29: Kết cụm - Cụm 2: gồm có 58 mục Thực Hình 3.30: Kết cụm Nhóm khách hàng tiềm khách hàng truyền thống đến với cơng ty thường mua với số lượng số tiền họ bỏ đến với công ty lớn (lớn 10 triệu đồng) sản phẩm họ chọn mua cơng ty sản phẩm công nghệ cao laptop, điện thoại thơng minh, thiết bị văn phịng 3.4 Một số giải pháp đưa việc quản lý khách hàng mua hàng Qua kết thu từ phân cụm liệu Đề xuất số giải pháp chăm sóc khách hàng Cơng ty TNHH Máy tính Phong Vũ sau: Có thể thấy lượng khách hàng đến với công ty đông tập trung vào loại mặt hàng Phụ Kiện, Thiết bị số Với lượng khách hàng Công ty phải cố gắng trì, sfí dụng phương pháp khuyến hàng tuần, hàng tháng để lôi kéo loại khách hàng quay trở lại Cơng ty lần Bên cạnh cần phải ý đến đa dạng chủng loại hàng để tạo hfíng thú khách hàng quan tâm đến với chất lượng sản phẩm tạo lòng tin khách hàng Có thể tuyển dụng đội ngũ kĩ thuật chỗ để nâng cao chất lượng sản phẩm công ty.Nghiên cfíu thị trường, xây dựng chiến lược quảng bá có hiệu việc nghiên cfíu tâm lý khách hàng mục tiêu Một chương trình truyền thơng độc đáo hay chương trình khuyến đa dạng, hấp dẫn rộng khắp hay đợt giảm giá với chi phí hợp lí khơng có nghĩa giảm thấp tạo thuận lợi cho thu hút khách hàng Với lượng khách hàng tiềm khách hàng truyền thống, họ đến với cơng ty chất lượng sản phẩm uy tín cơng ty Phải xây dựng hệ thống nhân viên tiếp thị có trách nhiệm tư vấn để khách hàng chọn mã sản phẩm, chủng loại hàng hóa phù hợp với khả nhu cầu khách hàng Chính sách chăm sóc cho khách hàng truyền thống vô quan trọng: từ việc tìm kiếm khách hàng bình thường, lơi kéo họ trở thành khách hàng tiềm chăm sóc họ để họ trở thành vị khách truyền thống q trình khơng đơn giản, dù cơng ty hồn cảnh có sách đặc biệt cho nhóm khách hàng Bên cạnh việc đầu tư đào tạo nâng cao khả nhân việc công ty cần đầu tư marketing, thương mại điện tfí hoạt động tuyên truyền trực tuyến đến với khách hàng Giúp cơng ty tiếp xúc đưa đến sản phẩm dể dàng cho khách hàng Để tạo khách hàng tiềm khách hàng tiềm ẩn Cần đưa gói khuyến mại kích thích nhu cầu mua sản phẩm công ty khách hàng tiềm năng, giới thiệu, truyền thông rộng rãi để đến tay nhiều khách hàng đợt khuyến công ty Khách hàng chủ yếu mua lap top linh kiện nên công ty cần đầu tư thêm sản phẩm mới, đón đầu thị trường Từ đưa trị chơi, game để tặng sản phẩm khách hàng tham gia biết đến sản phẩm công ty Nâng cao chất lượng dịch vụ, sản phẩm khác để tăng độ tin cậy sfí dụng khách hàng Phần III: Kết Luận 3.1 Kết Luận 3.1.1 Kết đạt Thơng qua đề tài: “Sfí dụng phần mềm Rapidminer nhằm phân loại khách hàng quản lý khách hàng mua hàng công ty TNHH Máy Tính Phong Vũ” Em đưa giới thiệu bước quy trình khám phá tri thfíc lý thuyết liên quan đến KPDL Đề tài cịn trình bày khái niệm phân cụm, thuật tốn K- means phân cụm liệu Ngồi ra, tìm hiều phần mềm khai phá liệu RipidMiner, vấn đề xfí lý liệu liên quan đến khai phá luật kết hợp nhằm phát mối quan hệ giá trị liệu CSDL khách hàng cơng ty TNHH Máy tính Phong Vũ phân nhóm khách hàng theo loại hàng điện tfí Từ đưa số giải pháp hỗ trợ chăm sóc khách hàng cơng ty Về chương trình hỗ trợ chăm sóc khách hàng, đề tài dựa kết khai phá để đề xuất giải pháp tương fíng nhằm đem lại hiệu thiết thực cho công ty 3.1.2 Hạn chế đề tài Tuy nhiên, hạn chế lực thời gian đề tài tránh khỏi thiếu sót cịn nhiều hạn chế Đề tài chưa sâu tìm hiểu kiến thfíc liên quan đến KPDL mà mfíc độ giới thiệu, chưa sfí dụng kỹ thuật KPDL khác áp dụng để giải vấn đề liên quan đến đề tài 3.2 Hướng phát triển đề tài Một số định hướng tìm hiểu đề tài sau: - Tiếp tục tìm hiểu sâu lý thuyết KPDL kỹ thuật KPDL khác - Ứng dụng khai phá luật kết hợp thuật tốn FP-Growth nhằm đề giải pháp chăm sóc khách hàng cơng ty TNHH Máy tính Phong Vũ - Và mở rộng thêm CSDL khách hàng công ty Tài liệu tham khảo [1] Nguyễn Thị Huế Nghiên cứu kỹ thuật phân cụm liệu ứng dụng”, 2011 [2] Bài giảng môn Khai phá liệu, Nguyễn Thị Phương Bắc [3] TRƯỜNG ĐẠI HỌC MỎ - ĐỊA CHẤT KHOA CÔNG NGHỆ THÔNG TIN [4] ĐỀ TÀI: TÌM HIỂU VỀ RAPIDMINER VÀ THUẬT TỐN KMEANS ÁP DỤNG TRÊN DỮ LIỆU THỰC TẾ [5] GIÁO VIÊN HƯỚNG DẪN: NGUYỄN THỊ PHƯƠNG BẮC [6] Mục lục [7] Các kí hiệu sf í dụng [8] Danh mục bảng biểu [9] Tóm tắt nội dung nghiên cfíu [10] Phần I: Mở đầu [11] Lý chọn đề tài [12] Mục tiêu nghiên cfíu [13] Đối tượng phạm vi nghiên cfíu [14] Phương pháp nghiên cfíu [15] Kết cấu đề tài [16] Phần II: Nội Dung [17] I: Tổng quan khám phá tri thfíc khai phá liệu [18] 1.1 Khám phá tri thfíc tri thfíc [19] 1.1.1 Khái niệm [20] 1.1.2 Vai trị khám phá tri thfíc [21] 1.1.3 Tiến trình khai phá tri thfíc [22] 1.2 Khai phá liệu [23] 1.2.1 Khái niệm [24] 1.2.2 Các phương pháp khai phá liệu [25] 1.2.3 Một số khó khăn thách thfíc khai phá liệu [26] 1.2.4 Quá trình khai phá liệu [27] 1.2.5 Những fíng dụng khai phá liệu [28] Chương II: Khai phá liệu với thuật toán phân cụm [29] 2.1 Phân cụm liệu [30] 2.1.1 Khái niệm [31] 2.1.2 Các yêu cầu thuật toán phân cụm liệu [32] [33] 2.1.3 Ý nghĩa thực tiễn phân cụm 2.1.4 Thuật toán K-means phân cụm liệu [34] III: Ứng dụng phần mềm khai phá liệu Rapidminer vào quản lý khách hàng mua hàng Cơng ty TNHH Máy Tính Phong Vũ [35] 3.1 Tổng quan Công ty [36] 3.1.1 Giới thiệu [37] 3.1.2 Cơ cấu tổ chfíc [38] 3.1.3 Định hướng phát triển [39] 3.2 Phần mềm khai phá liệu Rapid miner [40] 3.2.1 Giới thiệu chung [41] 3.2.2 Giới thiệu giao diện [42] 3.2.4 Phân cụm với Rapid Miner [43] 3.3 Ứng dụng phân cụm liệuvào quản lý khách hàng mua hàng [44] 3.3.1 Xác định nội dung cần khai phá [45] 3.3.2 Lựa chọn liệu [46] 3.3.3 Tiền xf í lý liệu tốn [47] 3.3.4 Khai phá liệu thuật toán K-mean [48] Cluster Model [49] 3.4 Một số giải pháp đưa việc quản lý khách hàng mua hàng [50] Phần III: Kết Luận [51] 3.1 Kết Luận [52] 3.1.1 Kết đạt [53] 3.1.2 Hạn chế đề tài [54] 3.2 Hướng phát triển đề tài [55] Tài liệu tham khảo [56][56] [57][57] ... NGHỆ THƠNG TIN [4] ĐỀ TÀI: TÌM HIỂU VỀ RAPIDMINER VÀ THUẬT TOÁN KMEANS ÁP DỤNG TRÊN DỮ LIỆU THỰC TẾ [5] GIÁO VIÊN HƯỚNG DẪN: NGUYỄN THỊ PHƯƠNG BẮC [6] Mục lục [7] Các kí hiệu sf í dụng [8] Danh mục... hạn chế Đề tài chưa sâu tìm hiểu kiến thfíc liên quan đến KPDL mà mfíc độ giới thiệu, chưa sfí dụng kỹ thuật KPDL khác áp dụng để giải vấn đề liên quan đến đề tài 3.2 Hướng phát triển đề tài Một... tài Một số định hướng tìm hiểu đề tài sau: - Tiếp tục tìm hiểu sâu lý thuyết KPDL kỹ thuật KPDL khác - Ứng dụng khai phá luật kết hợp thuật toán FP-Growth nhằm đề giải pháp chăm sóc khách hàng

Ngày đăng: 09/12/2022, 23:18

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w