Xác định bài tốn

Một phần của tài liệu (LUẬN văn THẠC sĩ) một số thuật toán học máy trong phân loại hành vi sử dụng gói cước data viễn thông (Trang 49 - 50)

Mục tiêu bài tốn: Xây dựng mơ hình dự đốn tập khách hàng cĩ nhu cầu sử dụng gia tăng về lưu lượng, tiêu dùng dịch vụ. Song song với đĩ là xây dựng mơ hình đề xuất sản phẩm viễn thơng phù hợp với nhu cầu gia tăng tiêu dùng của khách hàng. Thử nghiệm xây dựng mơ hình dự đốn lần lượt với 3 thuật tốn là Hồi quy tuyến tính, Phân loại Nạve Bayes và Rừng ngẫu nhiên (RF). Từ đĩ so sánh hiệu năng để tìm ra thuật tốn phù hợp nhất với bộ dữ liệu đang xét. Sau đĩ ứng dụng kết quả dự đốn của mơ hình vào thực tế so sánh hiệu quả dựa trên các chỉ số và tỉ lệ dự đốn đúng tự nhiên.

Điều kiện lọc dữ liệu:

TB di động trả trước hoạt động 2 chiều, tuổi TB > 6 tháng, thuê bao sử dụng thiết bị smart phone;

Loại bỏ nhĩm thuê bao đặc biệt:

- Thuê bao nghi ngờ sử dụng multisim

- TB cĩ sử dụng bất kỳ gĩi Data/Combo/Thoại/SMS nào trong cả 2 tháng (tn-1, tn-2)

Nguồn dữ liệu: Dữ liệu được sử dụng từ bảng tổng hợp dữ liệu lịch sử xử dụng dịch vụ viễn thơng trong tháng của khách hàng. Bao gồm các nhĩm dữ liệu liên quan tới sử dụng dịch vụ data, thoại, nhắn tin, tiêu dùng. Các dữ liệu cĩ trong dataset:

- Dữ liệu về các thuê bao: trạng thái thuê bao.

- Dữ liệu hành vi sử dụng: lưu lượng thoại, tin nhắn, data, vas trong quá khứ. - Dữ liệu tiêu dùng: doanh thu thoại, tin nhắn, data, vas trong quá khứ.

- Dữ liệu nạp thẻ: số lần nạp thẻ, mệnh giá, tổng doanh thu nạp thẻ trong quá khứ

Đầu ra: Bảng dữ liệu chứa thơng tin khách hàng bao gồm: số thuê bao, xác suất sự kiện cĩ nhu cầu dùng tăng lưu lượng, xác suất từng sản phẩm mục tiêu tương ứng với mỗi khách hàng.

Một phần của tài liệu (LUẬN văn THẠC sĩ) một số thuật toán học máy trong phân loại hành vi sử dụng gói cước data viễn thông (Trang 49 - 50)