Báo cáo thống kê việc sử dụng giao dịch ở hình 3.3 ở trên cho ta thấy việc sử dụng giao dịch không đồng đều tại các tỉnh thành phố, các giao dịch chủ yếu tập trung ở Hà Nội và Hồ Chí Minh, vậy có mối liên hệ nào giữa các loại dịch vụ này với các tỉnh thành phố không, để trả lời câu hỏi này tôi xây dựng mô hình khai phá nhƣ sau:
Hình 3.30. Mô hình khai phá dự đoán sự việc sử dụng giao dịch rút tiền Mô hình có khóa là: TaiKhoanKey
Các thuộc tính đầu vào: Siccode, TRANS_CITY, TRANS_COUNTRY, TRANS_AMOUNT
Hình 3.31. Mô hình khai phá dự đoán việc sử dụng giao dịch thanh toán điện thoại Mô hình có khóa là: TaiKhoanKey
Các thuộc tính đầu vào: Siccode, TRANS_CITY, TRANS_COUNTRY, TRANS_AMOUNT
Thuộc tính dự báo: Usedbill (tình trạng sử dụng thanh toán điện thoại)
Kết quả thu đƣợc của thuật toán cây quyết định
Hình 3.32. Cây phân nhánh dự báo tình hình sử dụng giao dịch rút tiền ATM
Hình 3.34. Mạng phụ thuộc khi dùng thuật toán cây quyết định dự báo việc rút tiền ATM
Hình 3.35. Mạng phụ thuộc dự báo việc thanh toán điện thoại
Việc thanh toán hóa đơn điện thoại và việc sử dụng giao dịch rút tiền tại máy ATM có sự phụ thuộc lẫn nhau và phụ thuộc vào tỉnh thành phố thực hiện giao dịch bán lẻ và nƣớc giao dịch.
Xác định độ chính xác của 3 thuật toán
Hình 3.36. Biểu đồ dự báo việc sử dụng giao dịch thanh toán hóa đơn điện thoại Kết quả dự báo của 3 thuật toán trùng nhau và trùng với đƣờng thẳng lý tƣởng, chứng tỏ với mô hình khai phá gồm đầu vào nhƣ hình 3.32 ta có thể sử dụng một trong 3 thuật toán: cây quyết định, NaiveBayes và mạng nơ ron để dự báo tình hình sử dụng giao dịch thanh toán điện thoại hoặc rút tiền tại ATM
Ma trận phân lớp
Ma trận phân lớp khi sử dụng 3 thuật toán trong việc dự báo tính hình sử dụng giao dịch thanh toán điện thoại ta có thể tính toán độ chính xác của từng thuật toán nhƣ sau, với thuật toán cây quyết định độ chính xác của mô hình dự báo đạt 77.44%, thuật toán naïve Bayes độ chính xác đạt 77.21%, với thuật toán mạng nơron tỷ lệ dự đoán đúng khá cao chiếm đến 76.28%. Vậy ta có thể sử dụng thuật toán cây quyết định để thực hiện dự báo tình hình sử dụng dịch vụ.
Hình 3.38. Ma trận phân lớp của việc sử dụng dịch vụ thanh toán điện thoại