Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 19 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
19
Dung lượng
1,91 MB
Nội dung
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN TOÁN ỨNG DỤNG VÀ TIN HỌC PHÂN TÍCH VÀ THIẾT KẾ HỆ THỐNG PHÂN KHÚC KHÁCH HÀNG BẰNG THUẬT TOÁN K-MEANS Giảng viên hướng dẫn: Lê Chí Ngọc Sinh viên thực Lại Thùy Linh 20162401 : Nguyễn Văn Hà 20161240 Lớp : Toán – Tin K61 HÀ NỘI – 12/2019 DSS DSS MỤC LỤC Lời nói đầu………………………………………………………………… CHƯƠNG I KHẢO SÁT HỆ THỐNG Khảo sát trạng Dữ liệu khảo sát Thuật toán K-Means phương pháp Elbow CHƯƠNG II: PHÂN TÍCH HỆ THỐNG Các chức hệ thống trợ giúp nhà quản lý Sơ đồ luồng liệu 2.1 Biểu đồ mức ngữ cảnh 2.2 Biểu đồ luồng liệu mức CHƯƠNG III: THIẾT KẾ GIAO DIỆN HỆ THỐNG Ngôn ngữ viết chương trình Thiết kế giao diện website Kết luận Nguồn tài liệu tham khảo DSS LỜI MỞ ĐẦU Kinh doanh lĩnh vực thiếu sống kể từ thời xa xưa, đặc biệt sống đại vai trò quan trọng khẳng định Ngày nay, đà công nghệ phát triển, đặc biệt công nghệ thơng tin, kinh doanh đẩy mạnh Song song với điều đó, tri thức tập liệu ngày lớn theo thời gian Vậy thì, vấn đề đặt là, khai thác hết lợi ích nguồn liệu để phục vụ cho mục đích kinh doanh, tạo giá trị thực tế Khách hàng yếu tố định đến 80% thành công kinh doanh Đã tham gia vào thị trường kinh tế phải quan tâm mặt khách hàng có hội phát triển vươn xa Người quản lí ln phải tìm cách để khai thác triệt để thơng tin khách hàng ứng dụng vào việc đẩy mạnh phát triển cho lĩnh vực kinh doanh Vì vậy, giải pháp tối ưu áp dụng tiến ngành công nghệ thông tin nhằm biến thông tin khách hàng-một tập CSDL khổng lồ để phục vụ cho trình đẩy mạnh tăng trưởng Có nghĩa xây dựng hệ thống khai phá liệu để giúp nhà quản lí đưa chiến lược marketing phù hợp Em chọn đề tài: “Phân khúc khách hàng thuật tốn KMeans” nhằm đưa mơ hình hỗ trợ nhà quản lí đưa chiến lược phù hợp để tiến hành marketing phù hợp, góp phần thúc đẩy việc kinh doanh phát triển DSS DSS CHƯƠNG I KHẢO SÁT HỆ THỐNG CHƯƠNG I KHẢO SÁT HIỆN TRẠNG Khảo sát trạng Phân khúc thị trường hay gọi marketing mục tiêu, khai niệm trái ngược với tiếp thị đại trà tiếp thị sản phẩm đa dạng Mục tiêu phân khúc thị trường công ty chia thị trường thành phân khúc nhỏ hơn, dễ nhận biết, nắm bắt đáp ứng hiệu Các công ty, sở bán lẻ, muốn thu lợi nhuận cao việc sản xuất kinh doanh mặt hàng phải xác định nhóm khách hàng tiềm minh Nếu chiến dịch tổ chức mà lại nhắm đến q nhiều nhóm khách hàng hiệu chắn khơng cao, phần chi phí tổn hao căng lớn Vậy nên, vấn đề đặt là, để xác định nhóm đối tượng cần tập trung hướng tới lợi ích có lớn Dữ liệu khảo sát Dữ liệu sử dụng liệu bán lẻ/ bán bn trực tuyến lấy từ google DSS Hình 1: Dữ liệu khảo sát bán lẻ/ bán buôn trực tuyến Thuật toán K-Means phương pháp Elbow 3.1 Thuật tốn K-Means 3.1.1 Thuật tốn K-Means gì? Phân cụm kỹ thuật quan trọng khai phá liệu, thuộc lớp phương pháp Unsupervised Learning Machine Learning Có nhiều định nghĩa khác kỹ thuật này, chất ta hiểu phân cụm quy trình tìm cách nhóm đối DSS tượng cho vào cụm (clusters), cho đối tượng cụm tương tự (similar) đối tượng khác cụm khơng tương tự (Dissimilar) Mục đích phân cụm tìm chất bên nhóm liệu Các thuật tốn phân cụm (Clustering Algorithms) sinh cụm (clusters) Tuy nhiên, khơng có tiêu chí xem tốt để đánh hiệu của phân tích phân cụm, điều phụ thuộc vào mục đích phân cụm như: data reduction, “natural clusters”, “useful” clusters, outlier detection 3.1.2 Tại phải phân cụm? Phân cụm khách hang đem lại thơng số cụ thể, giúp hình thành nhóm rời Tuy nhiên, lại cụ thể dẫn tới khó khăn việc định ( Ví dụ thang có đến 125 nhóm, giả sử ta muốn chi tiết đánh giá điểm thang 10 1000 nhóm!) Phân cụm khách hàng Giảm số lượng nhóm cần phải xử lý Tăng tính hiệu Tìm ranh giới nhóm Số lượng nhóm tùy ý 3.1.3 Thuật toán phân cụm K-Means Ý tưởng:K-Means thuật toán quan trọng sử dụng phổ biến kỹ thuật phân cụm Tư tưởng thuật tốn K-Means tìm cách phân nhóm đối DSS tượng (objects) cho vào K cụm (K số cụm xác đinh trước, K nguyên dương) cho tổng bình phương khoảng cách đối tượng đến tâm nhóm (centroid ) nhỏ Sơ đồ mơ tả thuật tốn: Thuật tốn: B1: Chọn K điểm làm tâm cụm ban đầu B2: Phân điểm liệu vào cụm có tâm gần DSS B3: Nếu việc gán liệu vào cụm bước không thay đổi so với vịng lặp trước ta dừng thuật tốn B4: Cập nhập tâm cụm cho cụm cách lấy trung bình cộng tất điểm liệu gán vào cụm sau bước B5: Quay lại B2 3.2 Phương pháp Elbow hỗ trợ cho thuật toán K-Means Trong thuật toán K-mean áp dụng để phân cụm phần mềm này, ta phải xác định số K cụm từ trước Vậy vấn đề đặt chọn K cho thích hợp, có nghĩa tối ưu nhất? Ta dùng đồ thị Elbow để xác định số K tối ưu để tiến hành trình phân cụm Tư tưởng phương pháp phân cụm phân hoạch (như k-means) định nghĩa cụm cho tổng biến thiên bình phương khoảng cách cụm nhỏ nhất, tham số WSS (Within-cluster Sum of Square) Elbow method chọn số sụm k cho thêm vào cụm khác khơng làm cho WSS thay đổi nhiều Quy trình triển khai Elbow method sau: Triển khai thuật toán phân cụm K-mean với số cụm k thay đổi (ví dụ từ đến 10) Với giá trị k, tính giá trị WSS DSS Vẽ Elbow curve theo giá trị k Dựa vào Elbow curve chọn số k thích hợp, vị trí khúc cua (bend|knee) Hình Đồ thị Elbow hỗ trợ tìm K cụm tối ưu DSS CHƯƠNG II PHÂN TÍCH HỆ THỐNG Các chức hệ thống trợ giúp nhà quản lý Việc nhà quản lí dựa thơng tin có khách hàng để đưa định Hệ thống trợ giúp định cho phép thực trợ giúp liệt kê Các trợ giúp có ý nghĩa nhà quản lí, hay lãnh đạo công ty đưa định cuối Trong trường hợp này, phần mềm máy tính cơng cụ giúp cho người định quản lí DSS Hình Biểu đồ phân cấp chức Sơ đồ luồng liệu 2.1 Biểu đồ mức ngữ cảnh Hình 3: Biểu đồ mức ngữ cảnh 2.2 Biểu đồ luồng liệu DSS Hình 4: Biểu đồ luồng liệu CHƯƠNG III THIẾT KẾ HỆ THỐNG Ngơn ngữ viết chương trình HTML HTML từ viết tắt HyperText Markup Language (ngôn ngữ đánh dấu siêu văn bản) dùng mô tả cấu trúc trang Web tạo loại tài liệu xem trình duyệt HTML tạo phát triển tổ chức W3C (World Wide Web Consortium)Hiện phiên HTML HTML5 với nhiều tính ưu việt so với phiên cũ CSS CSS (viết tắt Cascading Style Sheets) ngôn ngữ định dạng sử dụng để mơ tả trình bày trang Web, bao gồm màu sắc, cách bố trí phơng chữ CSS cho phép chúng DSS hiển thị nội dung tương thích loại thiết bị có kích thước hình khác nhau, chẳng hạn hình lớn, hình nhỏ điện thoại hay máy tính CSS độc lập với HTML sử dụng với ngôn ngữ đánh dấu xây dựng dựa XML CSS tuân theo chuẩn chung W3C quy định JavaScript JavaScript ngôn ngữ nhỏ nhẹ chạy môi trường máy chủ lưu trữ (ví dụ: trình duyệt web), JavaScript kết nối với đối tượng môi trường để cung cấp kiểm sốt chương trình chúng JavaScript cho phép bạn thực điều phức tạp trang web đồ tương tác… Javascript hỗ trợ tất trình duyệt Firefox, Chrome, … chí trình duyệt thiết bị di động có hỗ trợ Hiện dùng rộng rãi cho trang web (phía người dùng) phía máy chủ (với Nodejs) Giao diện Website DSS Hình 5: Giao diện bắt đầu DSS Hình 6: Giao diện phân tích biểu đồ thống kê DSS DSS Hình 7: Kết phân cụm biểu đồ đánh giá Nguồn tài liệu tham khảo: http://bis.net.vn/forums/p/1831/9526.aspx? fbclid=IwAR2mIQVb1n3vvfFMhgM4SifX6lQqofHS6aqwlC3NBTVQ_vTfBO_8Pm1qiU https://bl.ocks.org/rpgove/0060ff3b656618e9136b https://nguyenvanhieu.vn/thuat-toan-phan-cum-k-means/ https://github.com/awesomedata/awesome-public-datasets ... đầu………………………………………………………………… CHƯƠNG I KHẢO SÁT HỆ THỐNG Khảo sát trạng Dữ liệu khảo sát Thuật toán K-Means phương pháp Elbow CHƯƠNG II: PHÂN TÍCH HỆ THỐNG Các chức hệ thống trợ giúp nhà quản lý Sơ đồ luồng... hỗ trợ tìm K cụm tối ưu DSS CHƯƠNG II PHÂN TÍCH HỆ THỐNG Các chức hệ thống trợ giúp nhà quản lý Việc nhà quản lí dựa thơng tin có khách hàng để đưa định Hệ thống trợ giúp định cho phép thực trợ... thuật toán: Thuật toán: B1: Chọn K điểm làm tâm cụm ban đầu B2: Phân điểm liệu vào cụm có tâm gần DSS B3: Nếu việc gán liệu vào cụm bước không thay đổi so với vịng lặp trước ta dừng thuật