Sự phụ thuộc giữa các loại dịch vụ

Một phần của tài liệu Nghiên cứu giải pháp quản lý khách hàng hiệu quả dựa trên hướng tiếp cận khai phá dữ liệu (Trang 41)

Hình 3.12. Mô hình khai phá dữ liệu sự phụ thuộc giữa các loại dịch vụ Khóa: TaiKhoanKey

Dữ liệu đầu vào gồm: UsedATM (sử dụng dịch vụ ATM: 1- có sử dụng dịch vụ, 0- không sử dụng dịch vụ), UsedBill (sử dụng dịch vụ thanh toán hóa đơn bán lẻ: 1-có sử dụng dịch vụ), UsedRetailM5 (đã sử dụng dịch vụ thanh toán bán lẻ tính đến tháng 5: 1-đúng, 0-sai)

Thuộc tính dự báo: UsedRetailM6

3.3.1.1. Kết quả thực nghiệm với thuật toán phân lớp cây quyết định

Bằng cách thay đổi tham số COMPLEXITY_PENALTY tiến hành chạy mô hình với các giá trị tham số khác nhau tôi có kết quả mô hình nhƣ bảng sau:

Tham số Mô hình Decisiontree

Score Population correct (%) Predict probability (%)

CP=0.1 0.96 47.57 96.66 CP=0.2 0.96 47.57 96.66 CP=0.3 0.96 47.57 96.66 CP=0.4 0.96 47.64 96.50 CP=0.5 0.96 47.64 96.50 CP=0.6 0.96 47.64 96.50 CP=0.7 0.96 47.64 96.50 CP=0.8 0.96 47.64 96.50 CP=0.9 0.95 47.44 96.50

Bảng 3.5. Kết quả mô hình khi thay đổi tham số COMPLEXITY_PENALTY Với việc thay đổi các giá trị của tham số hầu CP thì độ chính xác của mô hình hầu nhƣ không thay đổi, vì thế tôi lấy kết quả của mô hình với tham số mặc định CP=0.5 để phân tích.

a. Cây phân nhánh

Hình 3.13. Cây phân nhánh dự đoán sử dụng dịch vụ thanh toán bán lẻ tháng 6

Dựa vào kết quả của mô hình dự đoán ta thấy việc thanh toán bán lẻ sản phẩm hàng hóa/ dịch vụ tháng 6 vẫn chƣa phổ biến, sự không phổ biến này đƣợc thể hiện này đƣợc thể hiện ngay ở chú thích của nút All, chỉ có 530 trên tổng số 3607 tài khoản đã thanh toán bán lẻ tháng 6, chiếm 14.71%.

Hình 3.14. Chú thích của nút All

Sự phân chia tiếp theo của cây dựa trên việc sử dụng giao dịch rút tiền tại ATM. - Tại nút có sử dụng ATM=0, chủ tài khoản đã sử dụng tài khoản của mình cho việc thanh toán hóa đơn bán lẻ hoặc thanh toán dịch vụ điện thoại. Có thể nói tại nhánh này mục tiêu của ngân hàng là tăng số lƣợng giao dịch giao dịch thanh toán hóa đơn bán lẻ hoặc thanh toán điện thoại gần nhƣ đã đạt đƣợc. - Tại nút giao dịch sử dụng ATM = 1, tổng số có 2.753 trƣờng hợp chỉ có 138

trƣờng hợp sử dụng dịch vụ thanh toán hóa đơn bán lẻ trong tháng 6 chiếm 5.05%

Hình 3.15. Chú thích của nút sử dụng ATM=1 Used ATM = 1 and Used Retail M5 = '1'

Nút Used Retail M6 Trƣờng hợp Xác suất

Used ATM = 1 and Used Retail M5 = '1' 0 110 69.40%

1 48 30.60%

Used ATM = 1 and Used Retail M5 = '0' 0 2505 96.50%

1 90 3.50%

Kết luận: dựa vào phân tích ở trên ta có thể đƣa ra kết luận sau nếu mục tiêu là tăng lƣợng giao dịch bán thanh toán bán lẻ ta có thể quảng bá dịch vụ đến các khách hàng chƣa từng sử dụng dịch vụ thanh toán bán lẻ mà chỉ sử dụng giao dịch rút tiền.

b. Mạng phụ thuộc:

Hình 3.16. Mạng phụ thuộc thanh toán bán lẻ tháng 6 thuật toán cây quyết định Mạng phụ thuộc cho ta thấy sự phụ thuộc giữa việc sử dụng dịch vụ bán lẻ của tháng 6 với việc sử dụng ATM, thanh toán hóa đơn điện thoại và sử dụng dịch vụ bán lẻ tháng 5.

c. Độ chính xác

Độ chính xác của mô hình khi chạy với thuật toán cây quyết định là khá cao thể hiện ở hai đƣờng xanh và đỏ gần nhƣ trùng nhau.

3.3.1.2. Kết quả thực nghiệm với thuật toán phân lớp Navie Bayes

Hình 3.18. Mạng phụ thuộc khi dùng thuật toán Navie Bayes

Mạng phụ thuộc của mô hình khi sử dụng thuật toán Naïve Bayes cho kết quả khác với mô hình khi chạy thuật toán cây quyết định, thuật toán Naïve Bayes cho thấy giao dịch bán lẻ tháng 6 chỉ phụ thuộc vào giao dịch rút tiền tại ATM và giao dịch thanh toán tháng 5 chứ không phụ thuộc vào thanh toán điện thoại nhƣ đã thấy ở hình 3.18

Hình 3.19. Đặc điểm của các thuộc tính khi dùng thuật toán Naive Bayes

3.3.1.3. Kết quả thực nghiệm với thuật toán phân lớp Neural Network

Hình 3.20. Bảng thuộc tính của mạng nơron

Bảng thuộc tính này cho ta thấy khách hàng không sử dụng dịch vụ ATM hoặc đã từng sử dụng dịch vụ thanh toán bán lẻ thì thƣờng có khuynh hƣớng sử dụng dịch

vụ thanh toán bán lẻ tháng tiếp theo, khách hàng sử dụng dịch vụ ATM thƣờng có xu hƣớng không sử dụng dịch vụ thanh toán bán lẻ.

Hình 3.21. Biểu đồ dự báo thanh toán bán lẻ khi sử dụng 3 thuật toán

Với cùng một mô hình khai phá dữ liệu tìm sự phụ thuộc giữa các loại hình dịch vụ ta tiến hành phân lớp với ba thuận toán cây quyết định, Naïve bayes và mạng nơ ron. Kết quả sau khi chạy ba thuật toán đƣợc thể hiện ở hình 3.21. Ba thuật toán đều cho kết quả với độ chính xác khá cao gần với đƣờng chuẩn.

Xem xét tỷ lệ dự đoán chính xác của 3 thuật toán ta tiến hành tìm hiểu ma trận phân lớp của 3 thuật toán này.

Hình 3.22. Ma trận phân lớp dự báo tình hình sử dụng dịch vụ bán lẻ

Dựa trên kết quả của ma trận phân lớp ta có bảng tổng hợp tỷ lệ dự đoán đúng của từng thuật toán nhƣ sau:

Thuật toán Số trƣờng hợp dự đoán đúng Số trƣờng hợp dự đoán sai Tỷ lệ dự đoán đúng Tỷ lệ lỗi Cây quyết định 1.360 185 88.03% 11.97% Naïve Bayes 1.342 203 86.86% 13.14% Mạng nơron 1.360 185 88.03% 11.97%

Bảng 3.7. Bảng tỷ lệ dự đoán ba thuật toán dự báo tình hình sử dụng dịch vụ Tỷ lệ dự đoán của các mô hình khi sử dụng 3 thuật toán cây quyết định, NaïveBayes và mạng nơron đều khá cao chiếm trên 86% ở cả ba thuật toán. Trong bảng tổng kết trên cũng cho ta thấy việc sử dụng cây quyết định và mạng Nơ ron cho tỷ lệ dự đoán bằng nhau và đạt đến 88.03%.

3.3.1.4. Mô hình dự báo

Các phân tích ở trên đã chỉ ra rằng có thể dùng thuật toán cây quyết định để dự báo xem khách hàng có hay không sử dụng dịch vụ thanh toán bán lẻ tháng 6.

Để dự báo tình trạng sử dụng dịch vụ thanh toán bán lẻ tháng 6 cho từng khách hàng tiến hành xây dựng mô hình dự báo nhƣ sau:

Hình 3.23. Mô hình dự báo thanh toán bán lẻ tháng 6 của từng khách hàng Với giá trị khách hàng có thuộc tính đầu vào nhƣ hình 3.23 kết quả dự báo là 79% là khách sẽ sử dụng dịch vụ bán lẻ.

Hình 3.25. Kết quả dự báo thanh toán bán lẻ của khách hàng

Ba cột usedATM, usedBill, usedRetail_M5 là 3 cột thông tin của khách hàng, cột Prediction là cột kết quả dự báo khách hàng sử dụng dịch vụ thanh toán bán lẻ tháng 6 hay không (1: có sử dụng, 0: không sử dụng), cột thực tế là tình trạng thực tế khách hàng thanh toán dịch vụ bán lẻ tháng 6 (1: có sử dụng, 0: không sử dụng), cột cuối cùng Expression là cột xác suất dự báo. Ví dụ với khách hàng usedATM=1, usedBill=0, usedATM_m5=0 thì khả năng không sử dụng dịch vụ thanh toán hóa đơn bán lẻ tháng 6 là 96%.

Một phần của tài liệu Nghiên cứu giải pháp quản lý khách hàng hiệu quả dựa trên hướng tiếp cận khai phá dữ liệu (Trang 41)

Tải bản đầy đủ (PDF)

(60 trang)