HỌC PHẦN KHAI PHÁ dữ LIỆU đề tài tìm HIỂU về RAPIDMINER và THUẬT TOÁN KMEANS áp DỤNG TRÊN dữ LIỆU THỰC tế

45 14 0
HỌC PHẦN  KHAI PHÁ dữ LIỆU đề tài tìm HIỂU về RAPIDMINER và THUẬT TOÁN KMEANS áp DỤNG TRÊN dữ LIỆU THỰC tế

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

TRƯỜNG ĐẠI HỌC MỎ - ĐỊA CHẤT KHOA CÔNG NGHỆ THÔNG TIN HỌC PHẦN : KHAI PHÁ DỮ LIỆU ĐỀ TÀI: TÌM HIỂU VỀ RAPIDMINER VÀ THUẬT TỐN KMEANS ÁP DỤNG TRÊN DỮ LIỆU THỰC TẾ BÁO CÁO BÀI TẬP LỚN GIÁO VIÊN HƯỚNG DẪN: NGUYỄN THỊ PHƯƠNG BẮC NHÓM SINH VIÊN THỰC HIỆN: Nguyễn Tiến Đạt - 1821050193 Đỗ Thị Hương - 1821050186 Nguyễn Thị Thanh Thanh Nhàn - 1821050676 Bùi Thị Phương Thảo - 1821050110 Mục lục Phần I: Mở đầu 1 Lý chọn đề tài Mục tiêu nghiên cứu Đối tượng phạm vi nghiên cứu Phương pháp nghiên cứu Kết cấu đề tài Phần II: Nội Dung I: Tổng quan khám phá tri thức khai phá liệu 1.1 Khám phá tri thức tri thức 1.1.1 Khái niệm 1.1.2 Vai trò khám phá tri thức 1.1.3 Tiến trình khai phá tri thức 1.2 Khai phá liệu 1.2.1 Khái niệm 1.2.2 Các phương pháp khai phá liệu 1.2.3 Một số khó khăn thách thức khai phá liệu 10 1.2.4 Quá trình khai phá liệu 10 1.2.5 Những ứng dụng khai phá liệu 12 Chương II: Khai phá liệu với thuật toán phân cụm 13 2.1 Phân cụm liệu 13 2.1.1 Khái niệm 13 2.1.2 Các yêu cầu thuật toán phân cụm liệu 13 2.1.3 Ý nghĩa thực tiễn phân cụm 14 2.1.4 Thuật toán K-means phân cụm liệu 14 III: Ứng dụng phần mềm khai phá liệu Rapidminer vào quản lý khách hàng mua hàng Cơng ty TNHH Máy Tính Phong Vũ 19 3.1 Tổng quan Công ty 19 3.1.1 Giới thiệu 19 3.1.2 Cơ cấu tổ chức 20 3.1.3 Định hướng phát triển 20 3.2 Phần mềm khai phá liệu Rapid miner 21 3.2.1 Giới thiệu chung 21 3.2.2 Giới thiệu giao diện 21 3.2.4 Phân cụm với Rapid Miner 3.3 Ứng dụng phân cụm liệuvào quản lý khách hàng mua hàng 21 24 3.3.1 Xác định nội dung cần khai phá 24 3.3.2 Lựa chọn liệu 24 3.3.3 Tiền xử lý liệu toán 24 3.3.5 Khai phá liệu thuật toán K-mean 32 3.4 Một số giải pháp đưa việc quản lý khách hàng mua hàng 34 Phần III: Kết Luận 36 3.1 Kết Luận 36 3.1.1 Kết đạt 36 3.1.2 Hạn chế đề tài 36 3.2 Hướng phát triển đề tài Tài liệu tham khảo 36 37 Các từ viết tắt báo cáo Từ viết tắt Ý nghĩa CSDL Cơ sở liệu DL Dữ liệu KPDL Khai phá liệu TNHH Trách nhiệm hữu hạn Các kí hiệu sử dụng Các kí hiệu Ý nghĩa ∅ Tập rỗng ⊆ Bị chứa ∈ Thuộc ∉ Không thuộc ≤ Nhỏ ≥ Lớn ≠ Khác ∩ Phép lấy hợp tập hợp � Phép lấy giao tập hợp Danh mục hình vẽ Hình 1.1: Các bước trình khai phá tri thức Hình 1.2: Các bước trình khai phá liệu 11 (Hình 2.1: Các bước thuật tốn K-mean) 19 Hình 2.2: Khởi tạo trọng tâm 20 Hình 2.3: Cập nhật vị trí trọng tâm 21 Hình 2.4: Lặp lại bước 3, Cập nhật trọng tâm 21 Hình 2.5: Kết sau phân cụm 22 Hình 3.1: Logo cơng ty 23 Hình 3.2: Cơ cấu tổ chức cơng ty 24 Hình 3.3: Giao diện tổng quan RapidMiner 25 Hình 3.4: Bổ sung WEKA cho RapidMiner 26 Hình 3.5: Tìm kiếm W-Apriori 26 Hình 3.6: Các tham số W-Apriori 26 Hình 3.7: Thực Phân Cụm với K-Means 27 Hình 3.8: Lựa chọn tham số cho K-Means 28 Hình 3.9: Kết chạy K-Means tìm 28 Hình 3.10: Tạo nơi lưu trữ liệu 30 Hình 3.11: Chọn nơi lưu trữ liệu 30 Hình 3.12: Biểu tượng để đưa liệu vào 31 Hình 3.13: Chọn file cần đưa vào 31 Hình 3.14: Thiết lập cột cho thuộc tính 31 Hình 3.15: Chú thích thuộc tính 32 Hình 3.16: Xác định loại liệu thuộc tính 32 Hình 3.17: Lưu tên cho kho liệu 33 Hình 3.18: Cơ sở liệu khách hàng 33 Hình 3.19: Đưa liệu khách hàng vào chương trình 34 Hình 3.20: Thực câu lệnh if để chia miền giá trị cho Giá thành Số lượng 34 Hình 3.21: Kết liệu sau thực chia miền liệu 34 Hình 3.22: Kết sau thay đổi liệu 35 Hình 3.23: Thay thuộc tính đánh giá khách hàng 35 Hình 3.24: Thay thuộc tính phân loại số lượng 36 Hình 3.25: Lựa chọn thuộc tính cần mơ hình 36 Hình 3.26: Dữ liệu tiền xử lý 37 Hình 3.27: Chạy Filter Example 42 Hình 3.28: Kết cụm 42 Hình 3.29: Kết cụm 43 Hình 3.30: Kết cụm 43 Danh mục bảng biểu Bảng 1: Các đối tượng để phân cụm 20 Tóm tắt nội dung nghiên cứu Trong tình hình nay, thơng tin trở thành yếu tố định kinh doanh vấn đề tìm thơng tin hữu ích sở liệu khổng lồ ngày trở thành mục tiêu quan trọng công ty Khai phá liệu dần trở thành cơng cụ để thực thi nhiệm vụ đó, từ sở liệu sẵn có phải tìm thơng tin tiềm ẩn cách nhanh chóng có giá trị Cơng ty TNHH Máy tính Phong Vũ chuyên cung cấp loại mặt hàng điện tử nhằm phục vụ nhu cầu cho khách hàng thị trường, muốn lưu trữ khai thác thông tin hữu ích từ CSDL khách hàng để cơng ty hiểu khách hàng nhằm có sách chăm sóc khách hàng Từ lý đó, đề tài: “Sử dụng phần mềm Rapidminer nhằm phân loại khách hàng quản lý khách hàng mua hàng công ty TNHH Máy Tính Phong Vũ” chọn triển khai thực Chuyên đề trình bày kiến thức lý thuyết khai phá liệu, lý thuyết luật kết hợp; thuật toán Apriori khai phá luật kết hợp lý thuyết phân cụm liệu; Thuật toán K-means phân cụm liệu Chuyên đề lấy thông tin khách hàng Công ty TNHH Máy tình Phong Vũ để giải toán Sử dụng phần mềm khai phá liệu RipidMiner để tiền xử lý liệu khách hàng vận dụng thuật toán Apriori, thuật toán K-means nhằm đưa mối liên hệ giá trị liệu Qua kết thu từ luật kết hợp phân cụm liệu, rút số nhận xét chung thơng tin thu Từ đưa số giải pháp hỗ trợ chăm sóc khách hàng công ty Phần I: Mở đầu Lý chọn đề tài Ngày nay, xã hội ngày phát triển lượng thơng tin tăng lên với tốc độ bùng nổ Lượng liệu khổng lồ nguồn tài nguyên vô giá biết cách phát khai thác thông tin hữu ích có Như vấn đề đặt với liệu việc lưu trữ khai thác chúng Các phương pháp khai thác liệu truyền thống ngày không đáp ứng nhu cầu thực tế Một khuynh hướng kĩ thuật kĩ thuật khai phá liệu khám phá trí thức Cơng nghệ khai phá liệu đời cho phép ta khai thác tri thức hữu dụng việc trích xuất thơng tin có mối quan hệ mối tương quan định từ kho liệu lớn mà bình thường khơng thể nhận diện từ giải tốn tìm kiếm, phân loại, dự báo xu thế, hành vi tương lai tính thơng minh khác Ngày nay, cơng nghệ khai thác liệu ứng dụng rộng rãi hầu hết lĩnh vực: truyền thông, y học, phân tích liệu… Đặc biệt lĩnh vực kinh doanh, việc ứng dụng công nghệ khai phá liệu vào việc quản lý yếu tố quan trọng góp phần vào việc thành cơng cơng ty Trong trình hoạt động kinh doanh, liệu công ty phát sinh ngày nhiều Để tận dụng nguồn liệu sử dụng cho mục đích kinh doanh cơng ty địi hỏi phải phát triển khai phá liệu để thống kê, báo cáo, hổ trợ định hay phân tích số liệu nhằm phân loại, chăm sóc khách hàng… Khai phá liệu lĩnh vực khoa học tiềm năng, mang lại nhiều lợi ích đồng thời có ưu hẵn so với cơng cụ phân tích truyền thống Với lượng khách hàng đã, đến với cửa hàng Phong Vũ ln có sách loại khách hàng khác Để phân loại khách hàng áp dụng sách phù hợp với loại khác hàng đó, cửa hàng cần sử dụng phần mềm phân tích , thống kê, lưu trữ loại khách hàng Từ phân tích trên, tơi lựa chọn đề tài : “Sử dụng phần mềm Rapidminer nhằm phân loại khách hàng quản lý khách hàng mua hàng Công ty TNHH Máy Tính Phong Vũ” nhằm góp phần hổ trợ cửa hàng quản lý tốt khâu quản lý khách hàng mua hàng, góp phần nhỏ trình phát triển cửa hàng Mục tiêu nghiên cứu - Mục tiêu tổng quát: Xác định nhóm khách hàng (khách hàng tiềm năng, khách hàng truyền thống…) tới mua hàng Cơng ty TNHH Máy Tính Phong Vũ Hiều nhu cầu hành vi mua hàng nhóm khách hàng giúp cơng ty có chiến lược kinh doanh, sách giải pháp nâng cao hiệu chăm sóc nhóm khách hàng - Mục tiêu cụ thể: + Vận dụng phần mềm khai phá kiệu Rapid Miner cho Công ty TNHH Máy Tính Phong Vũ + Nghiên cứu thêm phần mềm khai phá liệu Rapidminer, kĩ thuật khai phá như: phân cụm, kết hợp Đối tượng phạm vi nghiên cứu ⮚ Đối tượng nghiên cứu: - Lý thuyết khai phá liệu - Phần mềm Rapid Miner - Thuật toán phân cụm, kết hợp - Thơng tin khách hàng Cơng ty TNHH Máy Tính Phong Vũ ⮚ Phạm vi nghiên cứu: - Về nội dung: Sử dụng phần mềm Rapidminer quản lý khách hàng mua hàng Cơng ty TNHH Máy tính Phong Vũ Phương pháp nghiên cứu Đề tài sử dụng phương pháp nghiên cứu : - Phương pháp nghiên cứu lý luận: thu thập, đọc hiểu, phân tích liệu, thơng tin từ tài liệu, giáo trình, tạp chí, báo cáo khoa học,…liên quan đến khai phá liệu, kỹ thuật khai phá liệu - Phương pháp thu thập số liệu: sử dụng số liệu thứ cấp (từ phịng ban Cơng ty TNHH Máy tínhThừa Thiên Huế) - Phương pháp phân tích số liệu: vận dụng luật kết hợp kỹ thuật phân cụm phần mềm KPDL RapidMiner, CSDL bao gồm thơng tin khách hàng, doanh thu bán hàng Kết cấu đề tài Ngoài phần mở đầu phần kết luận, nội dung khóa luận bao gồm chương tổ chức sau: Chương I: Tổng quan khám phá tri thức khai phá liệu Chương II: Khai phá liệu với thuật kết hợp phân cụm Chương III: Ứng dụng phần mềm khai phá liệu Rapidminer vào quản lý khách hàng mua hàng cửa hàng điện máy Phong Vũ 3.3 Ứng dụng phân cụm liệuvào quản lý khách hàng mua hàng 3.3.1 Xác định nội dung cần khai phá Nghiên cứu nhằm mục đích tìm mối liên hệ giá trị liệu CSDL xác định nhóm khách hàng (khách hàng truyền thống, khách hàng tiềm nhóm khách hàng bình thường) sử dụng sản phẩm Cơng ty TNHH Máy Tính Phong Vũ Qua đó, tìm hiểu nhóm khách hàng khách hàng chủ yếu ai? Thường mua sản phẩm loại nào? Và có giá tốn bao nhiêu? nhằm đề xuất số giải pháp hỗ trợ chăm sóc khách hàng cơng ty Do đó, nghiên cứu dựa vào liệu liên quan đến hoạt động mua hàng khách hàng, chẳng hạn: số hóa đơn, khách hàng, tên hàng, loại hàng, số lượng, đơn giá, giá thành…để khai phá luật kết hợp phân cụm 3.3.2 Lựa chọn liệu Để có kết phản ánh mối liên hệ thuộc tính liên quan đến hoạt động, thói quen mua hàng xác định nhóm khách hàng (nhóm khách hàng truyền thống, khách hàng tiềm khách hàng bình thường) khách hàng Cơng ty TNHH Máy tính Phong Vũ, nghiên cứu thực CSDL quản lý khách hàng công ty thời gian từ tháng đến tháng năm 2015 Theo đó, liệu lưu trữ bao gồm 149 khách hàng Mỗi khách hàng quản lý thông qua: So_hoa_don (số hóa đơn), Khach_hang (khách hàng), Ten_hang (tên hàng), Loai_hang (Loại hàng), So_luong (số lượng), Don_gia (đơn giá), Gia_thanh(giá thành) (CSDL lưu trữ phụ lục 1) Tuy nhiên, nghiên cứu lấy liệu có ích cho q trình khai phá phân cụm là: Phan_loai_SL, Danh_gia_KH, Loai_hang 3.3.3 Tiền xử lý liệu toán Dựa đặc điểm liệu vào để đảm bảo yêu cầu liệu thuật toán Kmeans dùng để phân cụm liệu phần mềm khai phá liệu Rapidminer nghiên cứu tiến hành tiền xử lý liệu số thuộc tính sau: ● Thuộc tính: Giá thành Dựa vào thuộc tính Gia_thanh chia làm khoảng miền giá trị - Gia_thanh > 50.000.000: tương ứng 3: Khách hàng truyền thống - Gia_thanh > 10.000.000: tương ứng 2: Khách hàng tiềm - Còn lại Gia_thanh 10: tương ứng 3: mua với số lượng nhiều - So_luong >3: tương ứng 2: mua với số lượng vừa - Còn lại So_luong New Process -> Repositories kích chọn biểu tượng hình: Hình 3.10: Tạo nơi lưu trữ liệu Chọn New local repository -> Next -> Use standard location -> Finish hình đây: Hình 3.11: Chọn nơi lưu trữ liệu Chọn liệu cần để sử dụng khai phá liệu: + Chuẩn bị liệu dulieukhachhang.csv mục Repositories kích chọn biểu tượng hình: Hình 3.12: Biểu tượng để đưa liệu vào +Chọn Import CSV file… chương trình yêu cầu chọn tập liệu cần đưa vào, xuất hình sau: Hình 3.13: Chọn file cần đưa vào + Tiếp theo chọn Next Chương trình yêu cầu cách thức cột phân cách Theo mặc định, Rapidminer tìm kiếm dấu chấm phẩy phân cách thuộc tính liệu Chúng ta phải thay đổi dấu phân cách nhấp vào Comma hộp Column Separation, để nhìn thấy thuộc tính cách xác Như hình sau: Hình 3.14: Thiết lập cột cho thuộc tính + Sau xem cột cho thuộc tính, kích chọn Next xuất hình 3.14 Trong Rapidminer, thuộc tính thích Chú thích quan trọng thuộc tính tên gọi - hàng với thích định nghĩa tên thuộc tính Hình 3.15: Chú thích thuộc tính + Tiếp tục nhấn Next Trong bước này, xác định kiểu liệu thuộc tính Hơn nữa, Rapidminer gán vai trị cho thuộc tính, xác định sử dụng cho operator Những vai trị định nghĩa Cuối cùng, đổi tên thuộc tính bỏ chọn chúng hồn tồn hình sau: Hình 3.16: Xác định loại liệu thuộc tính + Bước cuối chọn kho lưu trữ để lưu trữ liệu thiết lập, bước để cung cấp cho liệu thiết lập tên Rapidminer Hình 3.17: Lưu tên cho kho liệu + Cuối nhấn Finish để hồn thành Chúng ta có bảng CSDL khách hàng hình 3.17 Hình 3.18: Cơ sở liệu khách hàng Bây thiết lập liệu có sẵn để sử dụng Rapidminer Để bắt đầu sử dụng q trình khai thác liệu Rapidminer, cần kéo tập liệu thả vào sổ chương trình chạy mơ hình để kiểm tra liệu Hình 3.19: Đưa liệu khách hàng vào chương trình - Tiếp theo ta chia khoảng miền giá trị cho Giá thành Số lượng Ta thực lệnh if để tiến hành chia khoảng giá trị Chọn Operate Attributes hình sau: Hình 3.20: Thực câu lệnh if để chia miền giá trị cho Giá thành Số lượng Hình 3.21: Kết liệu sau thực chia miền liệu - Một bước cân thiết để chuẩn bị liệu Điều để thay đổi kiểu liệu thuộc tính lựa chọn từ integer thành polynominal Chúng ta sử dụng Numerical to Polynominal Hình 3.22: Kết sau thay đổi liệu - Ta tiến hành thay thuộc tính Đánh giá khách hàng: “3” = “Khách hàng truyền thống”, “2” = “Khách hàng tiềm năng”, “1” = “Khách hàng bình thường” Đưa vào cửa sổ chương trình Operator, mục Attribute filter type, chọn subset, kích chọn select Attribute chọn mục Đánh giá khách hàng Rồi thay Replace what = 3, replace by = “Khách hàng truyền thống” Tương tự với Replace cịn lại hình sau: Hình 3.23: Thay thuộc tính đánh giá khách hàng - Tiếp theo ta tiến hành thay thuộc tính Phân loại số lượng “3” = “Mua số lượng nhiều”, “2” = “Mua số lượng vừa”, “1” = “Mua số lượng ít” Làm tương tự thay thuốc tính Đánh giá khách hàng hình sau: Hình 3.24: Thay thuộc tính phân loại số lượng - Cuối giảm số lượng thuộc tính tập liệu Để giảm liệu thêm Select Attributes vào cửa sổ chọn thuộc tính sau để đưa vào: Loai_hang, Đánh giá khách hàng, Phân loại số lượng Một có thuộc tính chọn, bấm Apply để trở trình Hình 3.25: Lựa chọn thuộc tính cần mơ hình - Kết thúc q trình tiền xử lý liệu ta thu file dulieutienxuly.csv Bao gồm thuộc tính, 149 ghi Các q trình khai phá liệu dựa vào file để tìm mối liên hệ giá trị liệu CSDL Hình 3.26: Dữ liệu tiền xử lý 3.3.4 Khai phá liệu thuật toán K-mean Tạo cụm liệu thuật toán K-means, tạo cụm khách hàng kết sau: Cluster Model Cluster 0: 91 items Cluster 1: items Cluster 2: 58 items Total number of items: 149 ● Ý nghĩa cụm liệu Thông qua cụm liệu tạo thành thuật tốn K-means có nhóm khách hàng sau: - Cụm 0: gồm có 91 mục Sử dụng Filter Example để lọc kết cụm hình sau: Hình 3.27: Chạy Filter Example Hình 3.28: Kết cụm Phần lớn khách hàng bình thường đến với cơng ty thường chọn sản phẩm thuộc loại Phụ kiện, Kĩ thuật số Họ mua với số lượng nhiều tùy theo nhu cầu họ số tiền họ bỏ để mua hàng công ty thường không 10 triệu đồng Với nhóm khách hàng sản phẩm cơng nghệ cao laptop, thiết bị văn phịng với giá cao không nằm lựa chọn họ đến công ty - Cụm 1: gồm có mục Thực Hình 3.29: Kết cụm - Cụm 2: gồm có 58 mục Thực Hình 3.30: Kết cụm Nhóm khách hàng tiềm khách hàng truyền thống đến với công ty thường mua với số lượng số tiền họ bỏ đến với công ty lớn (lớn 10 triệu đồng) sản phẩm họ chọn mua công ty sản phẩm cơng nghệ cao laptop, điện thoại thơng minh, thiết bị văn phịng 3.4 Một số giải pháp đưa việc quản lý khách hàng mua hàng Qua kết thu từ phân cụm liệu Đề xuất số giải pháp chăm sóc khách hàng Cơng ty TNHH Máy tính Phong Vũ sau: Có thể thấy lượng khách hàng đến với công ty đông tập trung vào loại mặt hàng Phụ Kiện, Thiết bị số Với lượng khách hàng Công ty phải cố gắng trì, sử dụng phương pháp khuyến hàng tuần, hàng tháng để lôi kéo loại khách hàng quay trở lại Cơng ty lần Bên cạnh cần phải ý đến đa dạng chủng loại hàng để tạo hứng thú khách hàng quan tâm đến với chất lượng sản phẩm tạo lòng tin khách hàng Có thể tuyển dụng đội ngũ kĩ thuật chỗ để nâng cao chất lượng sản phẩm công ty.Nghiên cứu thị trường, xây dựng chiến lược quảng bá có hiệu việc nghiên cứu tâm lý khách hàng mục tiêu Một chương trình truyền thơng độc đáo hay chương trình khuyến đa dạng, hấp dẫn rộng khắp hay đợt giảm giá với chi phí hợp lí khơng có nghĩa giảm thấp tạo thuận lợi cho thu hút khách hàng Với lượng khách hàng tiềm khách hàng truyền thống, họ đến với cơng ty chất lượng sản phẩm uy tín cơng ty Phải xây dựng hệ thống nhân viên tiếp thị có trách nhiệm tư vấn để khách hàng chọn mã sản phẩm, chủng loại hàng hóa phù hợp với khả nhu cầu khách hàng Chính sách chăm sóc cho khách hàng truyền thống vô quan trọng: từ việc tìm kiếm khách hàng bình thường, lơi kéo họ trở thành khách hàng tiềm chăm sóc họ để họ trở thành vị khách truyền thống q trình khơng đơn giản, dù cơng ty hồn cảnh có sách đặc biệt cho nhóm khách hàng Bên cạnh việc đầu tư đào tạo nâng cao khả nhân việc công ty cần đầu tư marketing, thương mại điện tử hoạt động tuyên truyền trực tuyến đến với khách hàng Giúp công ty tiếp xúc đưa đến sản phẩm dể dàng cho khách hàng Để tạo khách hàng tiềm khách hàng tiềm ẩn Cần đưa gói khuyến mại kích thích nhu cầu mua sản phẩm cơng ty khách hàng tiềm năng, giới thiệu, truyền thông rộng rãi để đến tay nhiều khách hàng đợt khuyến công ty Khách hàng chủ yếu mua lap top linh kiện nên công ty cần đầu tư thêm sản phẩm mới, đón đầu thị trường Từ đưa trị chơi, game để tặng sản phẩm khách hàng tham gia biết đến sản phẩm công ty Nâng cao chất lượng dịch vụ, sản phẩm khác để tăng độ tin cậy sử dụng khách hàng Phần III: Kết Luận 3.1 Kết Luận 3.1.1 Kết đạt Thông qua đề tài: “Sử dụng phần mềm Rapidminer nhằm phân loại khách hàng quản lý khách hàng mua hàng công ty TNHH Máy Tính Phong Vũ” Em đưa giới thiệu bước quy trình khám phá tri thức lý thuyết liên quan đến KPDL Đề tài cịn trình bày khái niệm phân cụm, thuật toán K- means phân cụm liệu Ngồi ra, tìm hiều phần mềm khai phá liệu RipidMiner, vấn đề xử lý liệu liên quan đến khai phá luật kết hợp nhằm phát mối quan hệ giá trị liệu CSDL khách hàng cơng ty TNHH Máy tính Phong Vũ phân nhóm khách hàng theo loại hàng điện tử Từ đưa số giải pháp hỗ trợ chăm sóc khách hàng cơng ty Về chương trình hỗ trợ chăm sóc khách hàng, đề tài dựa kết khai phá để đề xuất giải pháp tương ứng nhằm đem lại hiệu thiết thực cho công ty 3.1.2 Hạn chế đề tài Tuy nhiên, hạn chế lực thời gian đề tài tránh khỏi thiếu sót cịn nhiều hạn chế Đề tài chưa sâu tìm hiểu kiến thức liên quan đến KPDL mà mức độ giới thiệu, chưa sử dụng kỹ thuật KPDL khác áp dụng để giải vấn đề liên quan đến đề tài 3.2 Hướng phát triển đề tài Một số định hướng tìm hiểu đề tài sau: - Tiếp tục tìm hiểu sâu lý thuyết KPDL kỹ thuật KPDL khác - Ứng dụng khai phá luật kết hợp thuật tốn FP-Growth nhằm đề giải pháp chăm sóc khách hàng cơng ty TNHH Máy tính Phong Vũ - Và mở rộng thêm CSDL khách hàng công ty Tài liệu tham khảo [1] Nguyễn Thị Huế Nghiên cứu kỹ thuật phân cụm liệu ứng dụng”, 2011 [2] Bài giảng môn Khai phá liệu, Nguyễn Thị Phương Bắc [3] TRƯỜNG ĐẠI HỌC MỎ - ĐỊA CHẤT KHOA CÔNG NGHỆ THÔNG TIN [4] ĐỀ TÀI: TÌM HIỂU VỀ RAPIDMINER VÀ THUẬT TỐN KMEANS ÁP DỤNG TRÊN DỮ LIỆU THỰC TẾ [5] GIÁO VIÊN HƯỚNG DẪN: NGUYỄN THỊ PHƯƠNG BẮC [6] Mục lục [7] Các kí hiệu sử dụng [8] Danh mục bảng biểu [9] Tóm tắt nội dung nghiên cứu [10] Phần I: Mở đầu [11] Lý chọn đề tài [12] Mục tiêu nghiên cứu [13] Đối tượng phạm vi nghiên cứu [14] Phương pháp nghiên cứu [15] Kết cấu đề tài [16] Phần II: Nội Dung [17] I: Tổng quan khám phá tri thức khai phá liệu [18] 1.1 Khám phá tri thức tri thức [19] 1.1.1 Khái niệm [20] 1.1.2 Vai trò khám phá tri thức [21] 1.1.3 Tiến trình khai phá tri thức [22] 1.2 Khai phá liệu [23] 1.2.1 Khái niệm [24] 1.2.2 Các phương pháp khai phá liệu [25] 1.2.3 Một số khó khăn thách thức khai phá liệu [26] 1.2.4 Quá trình khai phá liệu [27] 1.2.5 Những ứng dụng khai phá liệu [28] Chương II: Khai phá liệu với thuật toán phân cụm [29] 2.1 Phân cụm liệu [30] 2.1.1 Khái niệm [31] 2.1.2 Các yêu cầu thuật toán phân cụm liệu [32] [33] 2.1.3 Ý nghĩa thực tiễn phân cụm 2.1.4 Thuật toán K-means phân cụm liệu [34] III: Ứng dụng phần mềm khai phá liệu Rapidminer vào quản lý khách hàng mua hàng Cơng ty TNHH Máy Tính Phong Vũ [35] 3.1 Tổng quan Công ty [36] 3.1.1 Giới thiệu [37] 3.1.2 Cơ cấu tổ chức [38] 3.1.3 Định hướng phát triển [39] 3.2 Phần mềm khai phá liệu Rapid miner [40] 3.2.1 Giới thiệu chung [41] 3.2.2 Giới thiệu giao diện [42] 3.2.4 Phân cụm với Rapid Miner [43] 3.3 Ứng dụng phân cụm liệuvào quản lý khách hàng mua hàng [44] 3.3.1 Xác định nội dung cần khai phá [45] 3.3.2 Lựa chọn liệu [46] 3.3.3 Tiền xử lý liệu toán [47] 3.3.4 Khai phá liệu thuật toán K-mean [48] Cluster Model [49] 3.4 Một số giải pháp đưa việc quản lý khách hàng mua hàng [50] Phần III: Kết Luận [51] 3.1 Kết Luận [52] 3.1.1 Kết đạt [53] 3.1.2 Hạn chế đề tài [54] 3.2 Hướng phát triển đề tài [55] Tài liệu tham khảo [56] [57] ... giảng môn Khai phá liệu, Nguyễn Thị Phương Bắc [3] TRƯỜNG ĐẠI HỌC MỎ - ĐỊA CHẤT KHOA CƠNG NGHỆ THƠNG TIN [4] ĐỀ TÀI: TÌM HIỂU VỀ RAPIDMINER VÀ THUẬT TOÁN KMEANS ÁP DỤNG TRÊN DỮ LIỆU THỰC TẾ [5]... thập, đọc hiểu, phân tích liệu, thơng tin từ tài liệu, giáo trình, tạp chí, báo cáo khoa học, …liên quan đến khai phá liệu, kỹ thuật khai phá liệu - Phương pháp thu thập số liệu: sử dụng số liệu thứ... đề tài 3.2 Hướng phát triển đề tài Một số định hướng tìm hiểu đề tài sau: - Tiếp tục tìm hiểu sâu lý thuyết KPDL kỹ thuật KPDL khác - Ứng dụng khai phá luật kết hợp thuật tốn FP-Growth nhằm đề

Ngày đăng: 08/12/2022, 16:42

Tài liệu cùng người dùng

Tài liệu liên quan