Hệ hỗ trợ dự báo khả năng khách hàng rời bỏ dịch vụ công ty viễn thông

21 313 3
Hệ hỗ trợ dự báo khả năng khách hàng rời bỏ dịch vụ công ty viễn thông

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI oOo BÁO CÁO MƠN HỌC Mơn: Hệ hỗ trợ định Đề tài Hệ hỗ trợ dự báo khả khách hàng rời bỏ dịch vụ công ty viễn thông Giảng viên hướng dẫn: TS Lê Chí Ngọc Sinh viên thực hiện: Bùi Hải Minh Hiếu MSSV: 20173515 Hà Nội - 2020 Mục lục Chương 1: Đặt vấn đề Chương 2: Giải pháp 2.1 Dữ liệu 2.2 Thuật toán 2.3 Kết Chương 3: Phân tích thiết kế hệ thống 3.1 Tổng quan hệ thống 3.1 Biều đồ phân cấp chức 3.3 Biểu đồ luồng liệu 11 3.4 Các công nghệ sử dụng 13 3.4.1 Front-end 13 3.4.2 Back-end 14 3.4.3 Module dự báo 15 3.5 Giao diện hệ thống 15 Chương 4: Kết luận 20 Tài liệu tham khảo 21 Chương 1: Đặt vấn đề Trong vài năm trở lại đây, phát triển nhanh chóng mặt thiết bị di dẫn đến thị trường công ty cung cấp dịch vụ viễn thông dần trở nên bão hòa, khách hàng ngày đòi hỏi cao chất lượng dịch cụ Bên cạnh đó, thị trường có nhiều nhà cung cấp dịch vụ để khách hàng lựa chọn dẫn đến cạnh tranh khốc liệt cơng ty viễn thơng Để trì phát triển hoạt động kinh doanh mình, nhà mạng chủ động thu hút khách hàng đồng thời phải tìm cách để giữ chân khách hàng có Theo nghiên cứu thực tế triển khai nhà mạng cho thấy, tổng chi phí cho hoạt động thu hút khách hàng cao nhiều so với việc giữ chân khách hàng có Chính vậy, hoạch định sách lược để giữ chân khách hàng trở thành phần sách phát triển nhà cung cấp dịch vụ viễn thông Một yếu tố quan trọng để giữ chân khách hàng dự đoán khách hàng có nguy rời bỏ cao để có chiến lược phịng chống khách hàng rời hiệu Một công ty viễn thông muốn phát triển lâu dài thời buổi phải thật hiểu rõ khách hàng Sự thấu hiểu khách hàng đạt thơng qua nghiên cứu thị trường kiến thức nghiệp vụ nhà quản lý Bên cạnh cách thức truyền thống, tri thức khách hàng ẩn giấu sở liệu khổng lồ công ty viễn thông Với đặc thù kinh doanh ngành viễn thông, cơng ty hẳn có kho liệu lớn thông tin khách hàng, lịch sử sử dụng dịch vụ… Kho liệu trợ giúp cho doanh nghiệp định cho hoạt động tập trung vào khách hàng phân tích mơ hình khách hàng, so sánh hiệu suất kinh doanh để điều chỉnh chiến lược sản xuất, phân tích hoạt động tìm kiếm nguồn lợi nhuận, quản lý mối quan hệ khách hàng, điều chỉnh môi trường quản lý chi phí tài sản cơng ty Sở hữu lượng liệu lớn lợi ích mà chúng mang lại không nhỏ, doanh nghiệp viễn thông lại chưa thực hiểu rõ liệu Điều dẫn đến chiến lược kinh doanh, marketing không hiệu quả, nhằm vào không đối tượng khách hàng, khiến công ty chịu nhiều tổn thất Chính lý trên, nhà mạng đặt yêu cầu hệ thống có khả phân tích khối lượng liệu khơng lồ mình, nhằm xác định yếu tố ảnh hưởng dự đốn sớm th bao có khả rời bỏ dịch vụ để có biện pháp tác động kịp thời nhằm trì th bao hoạt động Chương 2: Giải pháp Chương trình bày giải pháp cho toán dự báo khả khách hàng rời bỏ dịch vụ công ty viễn thông sử dụng thuật toán machine learning Random Forest 2.1 Dữ liệu Dữ liệu sử dụng để luyện mơ hình liệu lịch sử sử dụng dịch vụ khách hàng công ty viễn thông thu thập kaggle gồm 3333 ghi 21 thuộc tính Dữ liệu không bị mát cần tiền xử lý trường categorical (thuộc tính rời rạc) Tên trường Ý nghĩa state Bang account_length Số ngày thuê bao hoạt động area_code Mã vùng Phone_number Số điện thoại International_plan Có kế hoạch quốc tế khơng Voice_mail_plan Có dịch vụ thư thoại không Number_vmail_messages Số tin nhắn thư thoại Total_day_minutes Tổng số phút gọi ban ngày Total_day_calls Tổng số gọi ban ngày Total_day_charge Tổng cước phí ban ngày Total_eve_minutes Tổng số phút gọi buổi tối Total_eve_calls Tổng số gọi buổi tối Total_eve_charge Tổng cước phí buổi tối Total_night_minutes Tổng số phút gọi buổi đêm Total_night_calls Tổng số gọi buổi đêm Total_night_charge Tổng cước phí buổi đêm Total_intl_charge Tổng cước phí quốc tế Total_intl_minutes Tổng số phút gọi quốc tế Total_intl_calls Tổng số gọi quốc tế Customer_service_calls Số gọi đến tổng đài 2.2 Thuật toán Thuật toán machine learning sử dụng chương trình Random Forest Như tên gọi nó, random forest bao gồm tập có số lượng lớn định Mỗi định tạo ngẫu nhiên từ cách train mẫu bootstrap (lấy mẫu có hồn lại) từ liệu ban đầu Mơ hình đưa dự báo cách cho tổ chức vote, class vote nhiều dự báo cuối mơ hình Điểm mấu chốt random forest train liệu khác nhau, nên chúng kỳ vọng có tương quan thấp Vì thế, tiến hành dự báo, độc lập với khả mắc sai lầm nên bù trừ cho sai lầm nhau, miễn có độ xác cao tương đối Hình 2.1: Thuật tốn Random forest 2.3 Kết Mơ hình luyện tập train gồm 2733 quan sát đanh giá tập test gồm 600 quan sát Mơ hình đạt điểm recall 88.5% tập test, có nghĩa số khách hàng có khả rời bỏ, mơ hình dự đốn 88.5% số khách hàng Chương 3: Phân tích thiết kế hệ thống 3.1 Tổng quan hệ thống Hình 3.1: Các thành phân hệ thống 3.1 Biều đồ phân cấp chức Hình 3.2: Biểu đồ phân cấp chức Mô tả chi tiết chức • Đăng nhập: nhà quản lý cấp tài khoản để đăng nhập vào hệ thống Nhà quản lý nhập tên đăng nhập mật giao diện để đối chiếu với liệu có sở liệu Nếu xác vào hệ thống, khơng thơng báo lỗi • Tải liệu lên hệ thống: nhà quản lý tải liệu cần dự báo dạng file csv lên hệ thống Cơ sở liệu cập nhật liệu module dự đoán trả kết • Xóa liệu: nhà quản lý chọn xóa vài ghi sở liệu toàn liệu sở liệu • Xem danh sách khách hàng kết dự báo: Nhà quản lý xem bảng danh sách khách hàng gồm số thông tin sơ kết dự báo • Xem thống kê sơ bộ: Nhà quản lý xem thống kế sơ liệu • Xem chi tiết thơng tin khách hàng: Nhà quản lý click vào dòng tương ứng bảng thông tin khách hàng để xem thông tin chi tiết khách hàng 3.3 Biểu đồ luồng liệu Hình 3.3: Biểu đồ luồng liệu mức đỉnh Hình 3.4: Biểu đồ luồng liệu mức đỉnh cho chức thống kê, dự báo Hình 3.5: Biểu đồ luồng liệu mức đỉnh cho chức quản ly liệu 3.4 Các công nghệ sử dụng 3.4.1 Front-end • HTML HTML chữ viết tắt Hypertext Markup Language Nó giúp người dùng tạo cấu trúc thành phần trang web ứng dụng, phân chia đoạn văn, heading, links, blockquotes… HTML tạo Tim Berners-Lee, nhà vật lý học trung tâm nghiên cứu CERN Thụy Sĩ Hiện nay, HTML trở thành chuẩn Internet tổ chức W3C (World Wide Web Consortium) vận hành phát triển • CSS CSS chữ viết tắt Cascading Style Sheets, ngơn ngữ sử dụng để tìm định dạng lại phần tử tạo ngơn ngữ đánh dấu (ví dụ HTML) CSS thường sử dụng với HTML JavaScript hầu hết trang web để tạo giao diện người dùng cho ứng dụng web giao diện người dùng cho nhiều ứng dụng di động • Bootstrap Bootstrap framework cho phép thiết kế website reponsive nhanh dễ dàng Bootstrap bao gồm HTML templates, CSS templates Javascript tao có sẵn như: typography, forms, buttons, tables, navigation, modals, image carousels nhiều thứ khác Trong bootstrap có thêm plugin Javascript Giúp cho việc thiết kế reponsive bạn dễ dàng nhanh chóng • Javascript JavaScript ngơn ngữ lập trình ngơn ngữ kịch cho phép triển khai chức phức tạp trang web hiển thị cập nhật nội dung kịp thời, tương tác với đồ, hoạt cảnh 2D/3D vv - có hỗ trợ JavaScript Nó lớp thứ ba bánh tiêu chuẩn công nghệ web, hai số chúng (HTMLvà CSS) trình bày Javascript hỗ trợ tất trình duyệt Firefox, Chrome, … chí trình duyệt thiết bị di động có hỗ trợ Hệ thống sử dụng javascript để xử lý kiện bên phía client side render biểu đồ cung cấp thêm thông tin trực quan cho nhà quản lý 3.4.2 Back-end Back-end hệ thống lập trình ngơn ngữ Python sử dụng framework Flask Python ngơn ngữ lập trình hướng đối tương bậc cao, dùng để phát triển website nhiều ứng dụng khác Pytohn phát triển Guido van Rossum án mã nguồn mở Flask web frameworks, thuộc loại micro-framework xây dựng ngơn ngữ lập trình Python Flask cho phép bạn xây dựng ứng dụng web từ đơn giản tới phức tạp Nó xây dựng api nhỏ, ứng dụng web chẳng hạn trang web, blog, trang wiki website dựa theo thời gian hay chí trang web thương mại Flask cung cấp cho bạn công cụ, thư viện công nghệ hỗ trợ bạn làm công việc Flask micro-framework Điều có nghĩa Flask mơi trường độc lập, sử dụng thư viện khác bên ngồi Do vậy, Flask có ưu điểm nhẹ, có lỗi bị phụ thuộc dễ dàng phát xử lý lỗi bảo mật 3.4.3 Module dự báo Module dự báo xây dựng dựa framework Scikitlearn Scikit-learn thư viện mã nguồn mở miễn phí cho ngôn ngữ python, cho phép người dùng sử dùng thuật tốn machine learning cách dễ dàng, có thuật tốn Random Forest 3.5 Giao diện hệ thống Hình 3.6: Giao diện đăng nhập Hình 3.7: Giao diện bảng điều khiển Hình 3.8: Đồ thị thống kê khách hàng có kế hoạch quốc tế Hình 3.9: Đồ thị thống kê số gọi tới tổng đài Hình 3.10: Danh sách khách hàng kết dự báo Hình 3.11: Thơng tin chi tiêt khách hàng Hình 3.12: Đồ thị thống kê cước phí gọi khách hàng Chương 4: Kết luận Báo cáo trình bày thiết kế hệ thống hỗ trợ dự báo khả khách hàng rời bỏ dịch vụ công ty viễn thông Bằng cách sử dụng kỹ thuật machine learning đại, hệ thống cung cấp cho nhà quản lý nhìn tổng quát hiệu khách hàng có khả rời bỏ cao, từ giúp cho nhà quản lý hoạch định sách lược để đưa biện pháp hạn chế khách hàng rời bỏ Một điều cần lưu ý rằng, hệ thống giúp nhà quản lý định, khơng thể thay hồn tồn vai trò người Vai trò người trình định tối quan trọng Tài liệu tham khảo Efraim Turban; Jay E Aronson; Ting-Peng Liang Decision Support Systems and Intelligent Systems, 2014 Random Forest, Leo Breiman Statistics Department University of California Berkeley, CA 94720 ... có khả rời bỏ dịch vụ để có biện pháp tác động kịp thời nhằm trì th bao hoạt động Chương 2: Giải pháp Chương trình bày giải pháp cho toán dự báo khả khách hàng rời bỏ dịch vụ công ty viễn thông. .. giữ chân khách hàng dự đoán khách hàng có nguy rời bỏ cao để có chiến lược phịng chống khách hàng rời hiệu Một công ty viễn thông muốn phát triển lâu dài thời buổi phải thật hiểu rõ khách hàng Sự... sách khách hàng kết dự báo Hình 3.11: Thơng tin chi tiêt khách hàng Hình 3.12: Đồ thị thống kê cước phí gọi khách hàng Chương 4: Kết luận Báo cáo trình bày thiết kế hệ thống hỗ trợ dự báo khả khách

Ngày đăng: 29/07/2020, 20:37

Tài liệu cùng người dùng

Tài liệu liên quan