cao nhất:
Theo các báo cáo ở mục 3.2 có sự phụ thuộc nào đó giữa việc thanh toán bán lẻ và các đặc tính của khách hàng nhƣ giới tính, độ tuổi,… vậy điều này thực sự đúng không ? Chúng tôi tiến hành kiểm chứng điều này bằng cách xây dựng mô hình khai phá sau:
Hình 3.26. Mô hình khai phá dữ liệu
Mô hình trên đƣợc xây dựng với các thuộc tính khóa là TaiKhoanKey, thuộc tính dự đoán là sử dụng UsedRetail, thuộc tính đầu vào là: Annual income, asset class, country code, gender, marital status, nam tao, province code, trinhdokey, tuoitao, tuoi.
Chạy mô hình cho chúng tôi thu đƣợc kết quả nhƣ sau:
Hình 3.27. Mạng phụ thuộc thanh toán bán lẻ và các thuộc tính của khách hàng Kết quả này cho ta thấy có mối liên hệ nào đó giữa khách hàng sử dụng dịch vụ bán lẻ và các thuộc tính giới tính khách hàng, tuổi tạo, năm tạo tài khoản. Vậy cụ thể sự phụ thuộc này nhƣ thế nào, chúng tôi tiến hành phân tích cây phân nhánh.
Hình 3.28. Cây phân nhánh dự đoán nhóm khách hàng sử dụng thanh toán bán lẻ
Bảng 3.8.Chú thích các nút của cây phân nhánh
Tỷ lệ nam giới tham gia sử dụng dịch vụ thanh toán bán lẻ ở đây khá cao chiếm 12,88%, điều này chứng tỏ hình thức thanh toán bán lẻ trực tuyến cũng nhận đƣợc sự quan tâm của nam giới. Các chú thích trên cũng cho ta thấy có hai nhóm khách hàng có khả năng sử dụng dịch vụ thanh toán bán lẻ nhiều nhất là nhóm khách hàng có giới tính nữ có năm tạo tài khoản khác 2009 và nhóm khách hàng nam giới có tuổi tạo tài khoản khác 23 tuổi.
Hình 3.29. Biểu đồ so sánh độ chính xác
Mô hình cho kết quả dự báo khá cao, với 55% tập dữ liệu kiểm tra thì xác suất dự đoán đạt 84.14%.