Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 17 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
17
Dung lượng
1,11 MB
Nội dung
LỜI MỞ ĐẦU Từ lâu, tiếp thị quảng cáo lĩnh vực vô thiết yếu nhà kinh doanh Việc xác định đối tượng, nhóm khách hàng để có phản hồi tương tác đắn đem lại giá trị cho công ty nhiệm vụ hàng đầu việc Marketing Ngày với bùng nổ liệu, gia tăng cơng cụ tính tốn, hỗ trợ, đưa nhiều giải pháp khách để hồn thành nhiệm vụ cách nhanh chóng hiệu Trong đề tài này, em lựa chọn xây dựng “Hệ thống hỗ trợ Marketing phân cụm khách hàng qua thuật toán K-mean” Mục lục Khảo sát trạng 1.1 Phân cụm khách hàng theo ba số R, F, M 1.2 Xếp loại số cụm theo thứ tự 1.3 Báo cáo thống kê .4 1.4 Mô tả liệu đầu vào Phân tích hệ thống 2.1 Biểu đồ phân cấp chức 2.2 Biều đồ luồng liệu .6 2.2.1 Biểu đồ mức ngữ cảnh .6 2.2.2 Biểu đồ mức đỉnh 2.2.3 Biểu đồ mức đỉnh chức Làm liệu 2.2.4 Biểu đồ mức đỉnh chức Phân cụm khách hàng theo số RFM 2.2.5 Biểu đồ mức đỉnh chức Báo cáo thống kê 2.3 Biểu đồ thực thể liên kết 2.3.1 Sơ đồ thực thể liên kết .8 2.3.2 Mô tả chi tiết thực thể 2.3.2.2 ORDER 10 2.3.2.3 RFM_CUSTOMER 10 2.3.2.4 BIG_CUSTOMER .11 2.3.2.5 MISS_ORDER .11 2.3.2.6 LABEL 12 Thiết kê hệ thống 13 3.1 Giới thiệu thuật toán K-mean 13 3.2 Thuật toán Elbow 13 3.3 Giao diện người dùng 14 Khảo sát trạng Các nghiệp vụ quan tâm: - Phân cụm khách hàng theo ba số F - frequency, R - recency, Mmonetary - Xếp loại số nhóm khách hàng theo thứ tự - Báo cáo thống kê: o Thống kê số lượng hóa đơn, hóa đơn lỗi, khách hàng, khách hàng bất thường o Số lượng khách hàng cụm o Biểu đồ tỷ trọng tổng giá trị mua hàng khách hàng theo cụm o Báo cáo số xếp hạng nhóm khách hàng (nhóm khách hàng có số lượng lớn nhất) 1.1 Phân cụm khách hàng theo ba số R, F, M - Tiền xử lý liệu - loại bỏ liệu không dầy đủ - Loại bỏ liệu bất thường - Tính số cụm phân tối ưu - Sử dụng thuật toán K-mean để phân cụm khách hàng theo số (R,F,M) 1.2.Xếp loại số cụm theo thứ tự - Sắp xếp thứ tự số R, F, M theo thứ tự tăng dần TT R F M Nhỏ - tốt Nhỏ - Nhỏ - … … … … … … … N Lớn - Lớn - tốt Lớn - tốt 1.3.Báo cáo thống kê - Báo cáo số khách hàng bất thường - Thống kê số lượng khách hàng theo cụm - Tính tỷ trọng số lượng khách hàng theo cụm - Tính tỷ trọng giá trị mua hàng cụm khách hàng - Biểu đồ tỷ trọng tổng giá trị mua hàng khách hàng theo cụm - Báo cáo số xếp hạng nhóm khách hàng (nhóm khách hàng có số lượng lớn nhất) 1.4 Mô tả liệu đầu vào - Dự liệu gồm trường TT Tên Kiểu liệu Mô tả ORDER_ID Text(30) Id hóa đơn ORDER_DATE Date (m/d/y) Ngày lập hóa đơn CUSTOMER_NAME Text(30) Tên KH GRAND_TOTAL Số nguyên Tổng giá trị hóa đơn - Đánh giá: ghi bị lỗi thiếu số trường Phân tích hệ thống 2.1.Biểu đồ phân cấp chức Phân cụm khách hàng Làm liệu Phân cụm khách hàng theo số RFM Xếp loại số cụm Báo cáo thống kê Phân loại liệu NAN Tính ma trận RFM Xếp loại số F Báo cáo doanh thu Phân loại liệu KH bất thường Tìm số cụm phân tối ưu Xếp loại số R Thông kê số KH theo cụm Phân cụm KH theo số RFM Xếp loại số M Tỷ trọng tổng giá trị mua hàng cụm Thông tin cụm khách hàng 2.2.Biều đồ luồng liệu 2.2.1 Biểu đồ mức ngữ cảnh 2.2.2 Biểu đồ mức đỉnh 2.2.3 Biểu đồ mức đỉnh chức Làm liệu 2.2.4 Biểu đồ mức đỉnh chức Phân cụm khách hàng theo số RFM 2.2.5 Biểu đồ mức đỉnh chức Báo cáo thống kê 2.3.Biểu đồ thực thể liên kết 2.3.1 Sơ đồ thực thể liên kết 2.3.2 Mô tả chi tiết thực thể 2.3.2.1 CUSTOMER TT Tên Kiểu liệu Mơ tả Ghi Khóa CUSTOMER_NAME Text(30) Tên khách hàng FREQUENCY Số hóa đơn ghi Not null Int nhận thời điểm RECENCY Date Ngày gần có hóa Not null đơn MONETARY Float Tổng giá trị hóa đơn Not null thời điểm phân tích ANALYSIS_DATE DATE Ngày lập phân tích Not null TT Tên Kiểu liệu Mơ tả Ghi ORDER_ID Text(16) Id hóa đơn Khóa ORDER_DATE Date Ngày lập hóa đơn Not null CUSTOMER_NAME Text(30) Tên KH Not null GRAND_TOTAL Tổng giá trị hóa đơn Not null Mơ tả Ghi 2.3.2.2 ORDER Float 2.3.2.3 RFM_CUSTOMER TT Tên Kiểu liệu CUSTOMER_NAME Text(30) Tên KH Khóa R Int Chỉ số R-recency Not null F Int Chỉ số F - frequency Not null M Int Chỉ số M - monetary Not null LABEL int Tên cụm liệu Not null phân 2.3.2.4 BIG_CUSTOMER TT Tên Kiểu liệu Mơ tả Ghi Khóa CUSTOMER_NAME Text(30) Tên khách hàng FREQUENCY Số hóa đơn ghi Not null Int nhận thời điểm RECENCY Date Ngày gần có hóa Not null đơn MONETARY Float Tổng giá trị hóa đơn Not null thời điểm phân tích ANALYSIS_DATE DATE Ngày lập phân tích Not null 2.3.2.5 MISS_ORDER TT Tên Kiểu liệu Mô tả Ghi ORDER_ID Text(16) Id hóa đơn Khóa ORDER_DATE Date Ngày lập hóa đơn CUSTOMER_NAME Text(30) Tên KH GRAND_TOTAL Tổng giá trị hóa đơn 2.3.2.6 LABEL Float TT Tên Kiểu liệu Mô tả Int LABEL_ID Ghi Nhãn cụm khách Khóa hàng FREQUENCY Int Số hóa đơn ghi Not null nhận thời điểm RECENCY Date Ngày gần có hóa Not null đơn MONETARY Float Tổng giá trị hóa đơn Not null thời điểm phân tích Thiết kê hệ thống 3.1 Giới thiệu thuật toán K-mean Phân cụm kỹ thuật rất quan trọng khai phá liệu, thuộc lớp phương pháp Unsupervised Learning trong Machine Learning Trong thuật tốn K-means clustering, khơng biết nhãn (label) điểm liệu Mục đích làm thể để phân liệu thành cụm (cluster) khác cho dữ liệu cụm có tính chất giống Ý tưởng: Với số cụm k cho trước, ta thực vòng lặp toán tối ưu: - Với tâm cụm cho trước (được chọn ngẫu nhiên), gắn nhãn cho điểm liệu cho khoảng cách từ điểm đến tâm nhã nhỏ - Với điểm liệu nhãn, tìm tâm cụm nhã cho khoảng cách từ tâm cụm đến điểm cụm nhỏ Thuật toán dừng tâm cụm sau vịng lặp liền khơng có thay đổi 3.2 Thuật toán Elbow Sử dụng thuật toán Elbow để lựa chọn số cụm phân tối ưu k cho liệu số WSS (within cluster sum of square) - tổng khoảng cách từ điểm liệu đến tâm nhóm mà chúng gắn nhãn Chỉ số WSS - nhỏ xem độ tốt phù hợp liệu nhóm phân Tuy nhiên, việc lựa chọn số WSS dựa tùy chọn người, thông thường ta chọn vị trí k mà biến thiên WSS trước sau không lớn 3.3 Giao diện người dùng - Trang chủ hệ thống - Trang phân tích ... Số lượng khách hàng cụm o Biểu đồ tỷ trọng tổng giá trị mua hàng khách hàng theo cụm o Báo cáo số xếp hạng nhóm khách hàng (nhóm khách hàng có số lượng lớn nhất) 1.1 Phân cụm khách hàng theo... 1.3.Báo cáo thống k? ? - Báo cáo số khách hàng bất thường - Thống k? ? số lượng khách hàng theo cụm - Tính tỷ trọng số lượng khách hàng theo cụm - Tính tỷ trọng giá trị mua hàng cụm khách hàng - Biểu... cụm khách hàng theo ba số F - frequency, R - recency, Mmonetary - Xếp loại số nhóm khách hàng theo thứ tự - Báo cáo thống k? ?: o Thống k? ? số lượng hóa đơn, hóa đơn lỗi, khách hàng, khách hàng