Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 17 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
17
Dung lượng
1,99 MB
Nội dung
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN TOÁN ỨNG DỤNG VÀ TIN HỌC PHÂN TÍCH VÀ THIẾT KẾ HỆ THỐNG PHÂN KHÚC KHÁCH HÀNG BẰNG PHÂN TÍCH RFM VÀ THUẬT TỐN K-MEANS Giảng viên hướng dẫn: TS LÊ CHÍ NGỌC Sinh viên thực hiện: NGUYỄN HỮU ĐẠT Lớp: Toán – Tin K61 HÀ NỘI – 2019 MỤC LỤC DSS Lời nói đầu CHƯƠNG I KHẢO SÁT HỆ THỐNG Khảo sát trạng Tổng quan phân tích RFM thuật toán K-Means Dữ liệu khảo sát CHƯƠNG II: PHÂN TÍCH HỆ THỐNG Các chức hệ thống trợ giúp nhà quản lý Sơ đồ luồng liệu 2.1 Biểu đồ mức ngữ cảnh 2.2 Biểu đồ luồng liệu mức CHƯƠNG III: THIẾT KẾ GIAO DIỆN HỆ THỐNG Ngôn ngữ viết chương trình Thiết kế giao diện website Kết luận Nguồn tài liệu tham khảo Sinh viên thực hiện: Nguyễn Hữu Đạt MSSV: 20160933 DSS LỜI MỞ ĐẦU Sự phát triển công nghệ thông tin việc ứng dụng công nghệ thông tin nhiều lĩnh vực đời sống, kinh tế xã hội nhiều năm qua đồng nghĩa với lượng liệu quan thu thập lưu trữ ngày tích lũy nhiều lên Một vấn đề đặt làm để tổ chức, khai thác khối liệu khổng lồ đa dạng thành tri thức có ích? Các kĩ thuật xuất nhắm đáp ứng nhu cầu Các kết nghiên cứu thành công với nhiều ứng dụng lĩnh vực đặc biệt từ việc phân cụm khách hàng Trong kinh doanh, yếu tố khách hang định đến thành bại doanh nghiệp, thông tin trở thành yếu tố định kinh doanh vấn đề tìm thơng tin hữu ích CSDL khổng lồ ngày trở thành mục tiêu quan trọng doanh nghiệp Vì vậy, giải pháp hữu hiệu nhằm khắc phục vấn đề nêu tiến hành xây dựng hệ thống khai phá liệu khai thác quản lý nguồn khách hàng nêu Đó hệ thống thiết kế giúp cho nhà quản lý nắm bắt nguồn thơng tin khách hàng hữu ích chiết xuất từ CSDL Qua đó, giúp nhà quản lý đưa định chiến dịch Marketing Chính lý đó, nên em chọn đề tài “ Phân khúc khách hàng phân tích RFM thuật toán K-Means” Sinh viên thực hiện: Nguyễn Hữu Đạt MSSV: 20160933 DSS CHƯƠNG I KHẢO SÁT HỆ THỐNG CHƯƠNG I KHẢO SÁT HIỆN TRẠNG Khảo sát trạng Phân khúc thị trường khách hàng số nhiệm vụ quan trọng công ty Việc phân khúc thực ảnh hưởng đến định tiếp thị bán hàng, có khả sống cịn cơng ty Trước lên kế hoạch chi tiết cho chương trình khuyến chi phí, nhà bán lẻ, công ty cần phải ý đến cách xác định khách hàng tiềm Sẽ thật lãng phí chiến dịch lại nhắm đến nhiều nhóm khách hàng khác Điều không giúp bạn bán nhiều sản phẩm mà ngược lại, gây ‘thương đau’ cho thương hiệu bạn Tổng quan phân tích RFM thuật tốn K-Means 2.1 RFM Ngày nay, nhiều nhà bán lẻ áp dụng phương thức phức tạp để phân loại & xác định khách hàng tiềm RFM phương pháp Điểm mạnh RFM giúp nhà bán lẻ tối đa hóa lợi tức đầu tư cơng sức họ bỏ vào chiến dịch marketing Sinh viên thực hiện: Nguyễn Hữu Đạt MSSV: 20160933 DSS Trong phương pháp phân tích RFM, khách hàng đánh giá dựa tiêu chí với tên gọi Sự Gần Đây (Recency), Mức Độ Thường Xuyên (Frequency) Mức Độ Chi Tiền (Moneytary) Phương pháp RFM giúp nhà bán lẻ xác định khách hàng tiềm có nhu cầu mua hay sử dụng sản phẩm/dịch vụ cao Hãy sâu vào phân tích tiêu chí Ma trận RFM Bước 1: Tính ma trận RFM cho khách hàng Bước 2: Chuyển số thành điểm xếp hạng Sinh viên thực hiện: Nguyễn Hữu Đạt MSSV: 20160933 DSS Bước 3: Sắp xếp bảng RFM để tiến hành phân khúc 2.2 Thuật toán K-Means 2.2.1 Thuật toán K-Means gì? Phân cụm kỹ thuật quan trọng khai phá liệu, thuộc lớp phương pháp Unsupervised Learning Machine Learning Có nhiều định nghĩa khác kỹ thuật này, chất ta hiểu phân cụm qui trình tìm cách nhóm đối tượng cho vào cụm (clusters), cho đối tượng Sinh viên thực hiện: Nguyễn Hữu Đạt MSSV: 20160933 DSS cụm tương tự (similar) đối tượng khác cụm khơng tương tự (Dissimilar) Mục đích phân cụm tìm chất bên nhóm liệu Các thuật toán phân cụm (Clustering Algorithms) sinh cụm (clusters) Tuy nhiên, khơng có tiêu chí xem tốt để đánh hiệu của phân tích phân cụm, điều phụ thuộc vào mục đích phân cụm như: data reduction, “natural clusters”, “useful” clusters, outlier detection 2.2.2 Tại phải phân cụm? Phân cụm khách hang đem lại thông số cụ thể, giúp hình thành nhóm rời Tuy nhiên, lại cụ thể dẫn tới khó khăn việc định ( Ví dụ thang có đến 125 nhóm, giả sử ta muốn chi tiết đánh giá điểm thang 10 1000 nhóm!) Phân cụm khách hang • Giảm số lượng nhóm cần phải xử lý • Tăng tính hiệu • Tìm ranh giới nhóm • Số lượng nhóm tùy ý 2.2.3 Thuật tốn phân cụm K-Means Ý tưởng: Chia liệu thành cụm tập hợp điểm gần khơng gian Mỗi cụm có điểm đại Sinh viên thực hiện: Nguyễn Hữu Đạt MSSV: 20160933 DSS diện, với điểm liệu, gần điểm đại diện thuộc cụm điểm đại diện Mơ tả thuật tốn: Thuật tốn: • B1: Chọn K điểm làm center ban đầu • B2: Phân điểm liệu cluster có center gần • B3: Nếu việc gán liệu vào cluster bước khơng thay đổi so với vịng lặp trước ta dừng thuật tốn Sinh viên thực hiện: Nguyễn Hữu Đạt MSSV: 20160933 DSS • B4: Cập nhập center cho cluster cách lấy trung bình cộng tất điểm liệu gán vào cluster sau bước 2, • B5: Quay lại B2 Định nghĩa khoảng cách với toán RFM Dữ liệu khảo sát Dữ liệu sử dụng liệu bán lẻ trực tuyến từ Kho lưu trữ UCI Bộ liệu Bán lẻ trực tuyến chứa tất giao dịch xảy cho cửa hàng bán lẻ trực tuyến khơng có cửa hàng có đăng ký Vương quốc Anh khoảng thời gian từ 01/12/2009 đến 09/12/2011 Công ty chủ yếu bán sản phẩm quà tặng độc đáo Nhiều khách hàng công ty người bán buôn Sinh viên thực hiện: Nguyễn Hữu Đạt MSSV: 20160933 DSS Hình 1: Dữ liệu khảo sát bán lẻ trực tuyến Chú thích liệu • InvoiceNo: Một số nguyên gồm chữ số gán cho giao dịch Nếu mã bắt đầu chữ 'c', biểu thị việc hủy bỏ • StockCode: Mã sản phẩm (vật phẩm) Một số nguyên gồm chữ số gán riêng cho sản phẩm riêng biệt • Description: Tên sản phẩm (vật phẩm) • Quantity: Số lượng sản phẩm (mặt hàng) giao dịch • InvoiceDate: Thời gian giao dịch tạo • UnitPrice: Đơn giá Số Giá sản phẩm đơn vị đồng bảng Anh Sinh viên thực hiện: Nguyễn Hữu Đạt MSSV: 20160933 10 DSS • CustomerID: Một số nguyên gồm chữ số gán riêng cho khách hàng • Country: Tên quốc gia nơi khách hàng cư trú Link nguồn liệu khảo sát: https://archive.ics.uci.edu/ml/datasets/Online+Retail+II CHƯƠNG II PHÂN TÍCH HỆ THỐNG Các chức hệ thống trợ giúp nhà quản lý Trên hệ thống thông tin với sở liệu bán hàng thu thập, lãnh đạo công ty cần định Việc định cơng tác quản lí lãnh đạo, hay nhà quản lí Hệ thống trợ giúp định cho phép thực trợ giúp liệt kê Các trợ giúp có ý nghĩa nhà quản lí, hay lãnh đạo cơng ty đưa định cuối Trong trường hợp này, phần mềm máy tính cơng cụ giúp cho người định quản lí Sinh viên thực hiện: Nguyễn Hữu Đạt MSSV: 20160933 11 DSS Hình Biểu đồ phân cấp chức Sơ đồ luồng liệu 2.1 Biểu đồ mức ngữ cảnh Hình 3: Biểu đồ mức ngữ cảnh Sinh viên thực hiện: Nguyễn Hữu Đạt MSSV: 20160933 12 DSS Biểu đồ luồng liệu 2.2 Hình 4: Biểu đồ luồng liệu CHƯƠNG III THIẾT KẾ HỆ THỐNG Ngơn ngữ viết chương trình HTML HTML từ viết tắt HyperText Markup Language (ngôn ngữ đánh dấu siêu văn bản) dùng mô tả cấu trúc trang Web tạo loại tài liệu xem trình duyệt HTML tạo phát triển tổ chức W3C (World Wide Web Consortium)Hiện phiên HTML HTML5 với nhiều tính ưu việt so với phiên cũ CSS Sinh viên thực hiện: Nguyễn Hữu Đạt MSSV: 20160933 13 DSS CSS (viết tắt Cascading Style Sheets) ngôn ngữ định dạng sử dụng để mơ tả trình bày trang Web, bao gồm màu sắc, cách bố trí phông chữ CSS cho phép chúng hiển thị nội dung tương thích loại thiết bị có kích thước hình khác nhau, chẳng hạn hình lớn, hình nhỏ điện thoại hay máy tính CSS độc lập với HTML sử dụng với ngôn ngữ đánh dấu xây dựng dựa XML CSS tuân theo chuẩn chung W3C quy định JavaScript JavaScript ngôn ngữ nhỏ nhẹ chạy môi trường máy chủ lưu trữ (ví dụ: trình duyệt web), JavaScript kết nối với đối tượng môi trường để cung cấp kiểm sốt chương trình chúng JavaScript cho phép bạn thực điều phức tạp trang web đồ tương tác… Javascript hỗ trợ tất trình duyệt Firefox, Chrome, … chí trình duyệt thiết bị di động có hỗ trợ Hiện dùng rộng rãi cho trang web (phía người dùng) phía máy chủ (với Nodejs) Giao diện Website Sinh viên thực hiện: Nguyễn Hữu Đạt MSSV: 20160933 14 DSS Hình 5: Giao diện bắt đầu Hình 6: Giao diện phân tích biểu đồ thống kê Sinh viên thực hiện: Nguyễn Hữu Đạt MSSV: 20160933 15 DSS Hình 7: Biểu đồ cơt, biểu đồ trịn đánh giá Hình 8: Gợi ý Marketing Sinh viên thực hiện: Nguyễn Hữu Đạt MSSV: 20160933 16 DSS Nguồn tài liệu tham khảo: http://bis.net.vn/forums/t/374.aspx https://archive.ics.uci.edu/ml/datasets/Online+Retail+II http://repository.vnu.edu.vn/bitstream/VNU_123/7964/1/010500 00814.pdf Sinh viên thực hiện: Nguyễn Hữu Đạt MSSV: 20160933 17 ... Tổng quan ph? ?n tích RFM thuật to? ?n K-Means 2.1 RFM Ngày nay, nhiều nhà b? ?n lẻ áp dụng ph? ?ơng thức ph? ??c tạp để ph? ?n loại & xác định khách hàng tiềm RFM ph? ?ơng ph? ?p Điểm mạnh RFM giúp nhà b? ?n lẻ... qu? ?n lý n? ??m bắt ngu? ?n thơng tin khách hàng hữu ích chiết xuất từ CSDL Qua đó, giúp nhà qu? ?n lý đưa định chi? ?n dịch Marketing Chính lý đó, n? ?n em ch? ?n đề tài “ Ph? ?n khúc khách hàng ph? ?n tích RFM. .. việc ph? ?n cụm khách hàng Trong kinh doanh, yếu tố khách hang định đ? ?n thành bại doanh nghiệp, thông tin trở thành yếu tố định kinh doanh v? ?n đề tìm thơng tin hữu ích CSDL khổng lồ ngày trở thành