Hệ thống hỗ trợ Marketing bằng phân cụm khách hàng qua thuật toán Kmean

15 30 0
Hệ thống hỗ trợ Marketing bằng phân cụm khách hàng qua thuật toán Kmean

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

LỜI MỞ ĐẦU Tử xa xưa, việc tiếp thị quảng cáo lĩnh vực vô thiết yếu nhà kinh doanh Việc xác định đối tượng, nhóm khách hàng để có phản hồi tương tác đắn đem lại giá trị cho công ty nhiệm vụ hàng đầu việc Marketing Ngày với bùng nổ liệu, gia tăng cơng cụ tính tốn, hỗ trợ, đưa nhiều giải pháp khách để hồn thành nhiệm vụ cách nhanh chóng hiệu Trong đề tài này, em lựa chọn xây dựng “Hệ thống hỗ trợ Marketing phân cụm khách hàng qua thuật toán K-mean” Mục lục Khảo sát trạng 1.1 Phân cụm khách hàng theo ba số R, F, M 1.2 Xếp loại số cụm theo thứ tự 1.3 Báo cáo thống kê .4 1.4 Mô tả liệu đầu vào Phân tích hệ thống 2.1 Biểu đồ phân cấp chức 2.2 Biều đồ luồng liệu .6 2.2.1 Biểu đồ mức ngữ cảnh .6 2.2.2 Biểu đồ mức đỉnh 2.2.3 Biểu đồ mức đỉnh chức Làm liệu 2.2.4 Biểu đồ mức đỉnh chức Phân cụm khách hàng theo số RFM 2.2.5 Biểu đồ mức đỉnh chức Báo cáo thống kê 2.3 Biểu đồ thực thể liên kết 2.3.1 Sơ đồ thực thể liên kết .8 2.3.2 Mô tả chi tiết thực thể 2.3.2.2 ORDER 10 2.3.2.3 RFM_CUSTOMER 10 2.3.2.4 BIG_CUSTOMER .11 2.3.2.5 MISS_ORDER .11 2.3.2.6 LABEL 12 Thiết kê hệ thống 13 3.1 Giới thiệu thuật toán K-mean 13 3.2 Thuật toán Elbow 13 3.3 Giao diện người dùng 14 Khảo sát trạng Các nghiệp vụ quan tâm: - Phân cụm khách hàng theo ba số F - frequency, R - recency, Mmonetary - Xếp loại số nhóm khách hàng theo thứ tự - Báo cáo thống kê: o Thống kê số lượng hóa đơn, hóa đơn lỗi, khách hàng, khách hàng bất thường o Số lượng khách hàng cụm o Biểu đồ tỷ trọng tổng giá trị mua hàng khách hàng theo cụm o Báo cáo số xếp hạng nhóm khách hàng (nhóm khách hàng có số lượng lớn nhất) 1.1 Phân cụm khách hàng theo ba số R, F, M - Tiền xử lý liệu - loại bỏ liệu không dầy đủ - Loại bỏ liệu bất thường - Tính số cụm phân tối ưu - Sử dụng thuật toán K-mean để phân cụm khách hàng theo số (R,F,M) 1.2.Xếp loại số cụm theo thứ tự - Sắp xếp thứ tự số R, F, M theo thứ tự tăng dần TT … N R Nhỏ - tốt … … Lớn - F Nhỏ - … … Lớn - tốt M Nhỏ - … … Lớn - tốt 1.3.Báo cáo thống kê - Báo cáo số khách hàng bất thường - Thống kê số lượng khách hàng theo cụm - Tính tỷ trọng số lượng khách hàng theo cụm - Tính tỷ trọng giá trị mua hàng cụm khách hàng - Biểu đồ tỷ trọng tổng giá trị mua hàng khách hàng theo cụm - Báo cáo số xếp hạng nhóm khách hàng (nhóm khách hàng có số lượng lớn nhất) 1.4 Mô tả liệu đầu vào - Dự liệu gồm trường T Tên Kiểu liệu T ORDER_ID ORDER_DATE CUSTOMER_NAME GRAND_TOTAL Text(30) Date (m/d/y) Text(30) Số ngun Mơ tả Id hóa đơn Ngày lập hóa đơn Tên KH Tổng giá trị hóa đơn - Đánh giá: ghi bị lỗi thiếu số trường Phân tích hệ thống 2.1.Biểu đồ phân cấp chức Phân cụm khách hàng Làm liệu Phân cụm khách hàng theo số RFM Xếp loại số cụm Báo cáo thống kê Phân loại liệu NAN Tính ma trận RFM Xếp loại số F Báo cáo doanh thu Phân loại liệu KH bất thường Tìm số cụm phân tối ưu Xếp loại số R Thông kê số KH theo cụm Phân cụm KH theo số RFM Xếp loại số M Tỷ trọng tổng giá trị mua hàng cụm 2.2.Biều đồ luồng liệu 2.2.1 Biểu đồ mức ngữ cảnh 2.2.2 Biểu đồ mức đỉnh Thông tin cụm khách hàng 2.2.3 Biểu đồ mức đỉnh chức Làm liệu 2.2.4 Biểu đồ mức đỉnh chức Phân cụm khách hàng theo số RFM 2.2.5 Biểu đồ mức đỉnh chức Báo cáo thống kê 2.3.Biểu đồ thực thể liên kết 2.3.1 Sơ đồ thực thể liên kết 2.3.2 Mô tả chi tiết thực thể 2.3.2.1 CUSTOMER T Tên Kiểu liệu T CUSTOMER_NAME Text(30) FREQUENCY Int Mơ tả Ghi Tên khách hàng Số hóa đơn ghi Khóa Not null nhận thời RECENCY MONETARY Date điểm Ngày gần có hóa Not null Float đơn Tổng giá trị hóa đơn Not null thời điểm ANALYSIS_DATE 2.3.2.2 ORDER DATE phân tích Ngày lập phân tích Not null T Tên Kiểu liệu Mô tả Ghi T ORDER_ID ORDER_DATE CUSTOMER_NAME GRAND_TOTAL Text(16) Date Text(30) Float Id hóa đơn Ngày lập hóa đơn Tên KH Tổng giá trị hóa đơn Khóa Not null Not null Not null 2.3.2.3 RFM_CUSTOMER T Tên Kiểu liệu Mô tả Ghi T CUSTOMER_NAME R F M LABEL Text(30) Int Int Int int Tên KH Chỉ số R-recency Chỉ số F - frequency Chỉ số M - monetary Tên cụm liệu Khóa Not null Not null Not null Not null phân 2.3.2.4 BIG_CUSTOMER T Tên Kiểu liệu T CUSTOMER_NAME Text(30) FREQUENCY Int Mô tả Ghi Tên khách hàng Số hóa đơn ghi Khóa Not null nhận thời RECENCY MONETARY Date điểm Ngày gần có hóa Not null Float đơn Tổng giá trị hóa đơn Not null thời điểm ANALYSIS_DATE DATE phân tích Ngày lập phân tích Not null 2.3.2.5 MISS_ORDER T Tên Kiểu liệu Mô tả Ghi T ORDER_ID ORDER_DATE CUSTOMER_NAME GRAND_TOTAL Text(16) Date Text(30) Float Id hóa đơn Ngày lập hóa đơn Tên KH Tổng giá trị hóa đơn Khóa 2.3.2.6 LABEL T Tên Kiểu liệu Mơ tả Ghi T LABEL_ID Int Nhãn cụm khách Khóa Int hàng Số hóa đơn ghi Not null FREQUENCY nhận thời RECENCY MONETARY Date điểm Ngày gần có hóa Not null Float đơn Tổng giá trị hóa đơn thời điểm phân tích Not null Thiết kê hệ thống 3.1 Giới thiệu thuật toán K-mean Phân cụm kỹ thuật quan trọng khai phá liệu, thuộc lớp phương pháp Unsupervised Learning Machine Learning Trong thuật tốn K-means clustering, khơng biết nhãn (label) điểm liệu Mục đích làm thể để phân liệu thành cụm (cluster) khác cho liệu cụm có tính chất giống Ý tưởng: Với số cụm k cho trước, ta thực vòng lặp toán tối ưu: - Với tâm cụm cho trước (được chọn ngẫu nhiên), gắn nhãn cho điểm liệu cho khoảng cách từ điểm đến tâm nhã nhỏ - Với điểm liệu nhãn, tìm tâm cụm nhã cho khoảng cách từ tâm cụm đến điểm cụm nhỏ Thuật toán dừng tâm cụm sau vịng lặp liền khơng có thay đổi 3.2 Thuật toán Elbow Sử dụng thuật toán Elbow để lựa chọn số cụm phân tối ưu k cho liệu số WSS (within cluster sum of square) - tổng khoảng cách từ điểm liệu đến tâm nhóm mà chúng gắn nhãn Chỉ số WSS - nhỏ xem độ tốt phù hợp liệu nhóm phân Tuy nhiên, việc lựa chọn số WSS dựa tùy chọn người, thơng thường ta chọn vị trí k mà biến thiên WSS trước sau không lớn 3.3 Giao diện người dùng - Trang chủ hệ thống - Trang phân tích ... Số lượng khách hàng cụm o Biểu đồ tỷ trọng tổng giá trị mua hàng khách hàng theo cụm o Báo cáo số xếp hạng nhóm khách hàng (nhóm khách hàng có số lượng lớn nhất) 1.1 Phân cụm khách hàng theo... ghi bị lỗi thiếu số trường Phân tích hệ thống 2.1.Biểu đồ phân cấp chức Phân cụm khách hàng Làm liệu Phân cụm khách hàng theo số RFM Xếp loại số cụm Báo cáo thống kê Phân loại liệu NAN Tính ma... 1.3.Báo cáo thống kê - Báo cáo số khách hàng bất thường - Thống kê số lượng khách hàng theo cụm - Tính tỷ trọng số lượng khách hàng theo cụm - Tính tỷ trọng giá trị mua hàng cụm khách hàng - Biểu

Ngày đăng: 17/02/2022, 21:49

Mục lục

  • 1. Khảo sát hiện trạng

    • 1.1. Phân cụm khách hàng theo bộ ba chỉ số R, F, M

    • 1.2. Xếp loại các chỉ số của từng cụm theo thứ tự

    • 1.3. Báo cáo thống kê

    • 1.4. Mô tả dữ liệu đầu vào

    • 2. Phân tích hệ thống

      • 2.1. Biểu đồ phân cấp chức năng

      • 2.2. Biều đồ luồng dữ liệu

        • 2.2.1. Biểu đồ mức ngữ cảnh

        • 2.2.2. Biểu đồ mức đỉnh

        • 2.2.3. Biểu đồ mức dưới đỉnh chức năng Làm sạch dữ liệu

        • 2.2.4. Biểu đồ mức dưới đỉnh chức năng Phân cụm khách hàng theo chỉ số RFM

        • 2.2.5. Biểu đồ mức dưới đỉnh chức năng Báo cáo thống kê

        • 2.3. Biểu đồ thực thể liên kết

          • 2.3.1. Sơ đồ thực thể liên kết

          • 2.3.2. Mô tả chi tiết các thực thể

          • 3. Thiết kê hệ thống

          • 3.1. Giới thiệu về thuật toán K-mean

          • 3.3. Giao diện người dùng

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan