3.1.2. Lƣợc đồ kho dữ liệu
Với mục đích tìm mối liên quan giữa khách hàng và các dịch vụ ngân hàng và để trả lời các câu hỏi nhƣ:
- Cĩ mối liên hệ nào giữa các loại hình dịch vụ khơng? - Xu hƣớng sử dụng dịch vụ tăng hay giảm?
- Làm thế nào để tăng giao dịch thanh tốn hĩa đơn sản phẩm, dịch vụ?
- Nhĩm khách hàng nào là nhĩm khách hàng tiềm năng sẽ sử dụng dịch vụ của ngân hàng?
- Hiệu suất sử dụng ATM tại các tỉnh thành cĩ số lƣợng giao dịch lớn liệu cĩ quá tải?
Dựa trên các yêu cầu quản lý nhƣ trên chúng tơi tiến hành xây dựng kho dữ liệu với lƣợc đồ nhƣ sau:
Hình 3.2. Lƣợc đồ kho dữ liệu Bảng fact gồm: FactATM, FactRetail, FactBill Bảng fact gồm: FactATM, FactRetail, FactBill
DimChucVu ChucVuKey TenChucVu DimDate DateKey date day day_name day_of_the_year DimLoaiDaiLy SER_CODE TenDichVu NhomDichVuKey DimNhomDichVu NhomDichVuKey TenNhomDichVu DimTinhThanh MaTinh TenTinhThanh VungKinhTeKey DimTrinhDo TrinhDoKey TenTrinhDo DimVungKinhTe VungKinhTeKey TenVungKinhTe DimTaiKhoan TaiKhoanKey ASSET_CLASS COUNTRY_CODE factATM IDATM TRANS_TYPE TRANS_DETAILS TRANS_AMOUNT TRANS_CURR factBill transCode BILL_NO PRO_CODE SER_CODE FROM_ACC factRetail TaiKhoanKey DateKey SER_CODE TRANS_COUNTRY
Bảng chiều gồm: DimDate, DimTinhThanh, DimVungKinhTe, DimLoaiDaiLy, DimNhomDaiLy, DimChucVu, DimTrinhDo.
3.2. Báo cáo thống kê
Trong khuơn khổ luận văn chúng tơi tiến hành tìm hiểu 3 loại giao dịch là giao dịch rút tiền tại ATM, giao dịch thanh tốn hàng hĩa/dịch vụ bán lẻ và giao dịch thanh tốn cƣớc điện thoại để tìm mối liên quan giữa khách hàng và các loại dịch vụ nhƣ: nhĩm khách hàng nào thƣờng sử dụng các loại giao dịch này, giao dịch nào đƣợc sử dụng nhiều nhất, xu hƣớng ngƣời dùng sử dụng các loại giao dịch, liệu cĩ mối liên quan nào giữa các loại dịch vụ, làm thế nào để tăng số lƣợng thanh tốn hàng hĩa dịch vụ,… . Trƣớc khi đi vào xây dựng các mơ hình khai phá để trả lời các câu hỏi mang tính dự báo tơi tiến hành tìm hiểu dữ liệu bằng cách sử dụng Report Servie để xây dựng các báo cáo thống kê động với mục đích trả lời các câu hỏi mang tính chất thống kê nhƣ: nhĩm khách hàng nào thƣờng sử dụng các loại giao dịch này, giao dịch nào đƣợc sử dụng nhiều nhất, tỉnh thành nào sử dụng dịch vụ nhiều nhất, các loại giao dịch bán lẻ đƣợc thanh tốn thƣờng xuyên nhất.
3.2.1. Thống kê việc sử dụng giao dịch:
Báo cáo đầu tiên mà lãnh đạo ngân hàng quan tâm đĩ là báo cáo về thống kê tình hình sử dụng các loại giao dịch tại các tỉnh thành nhằm mục đích xem chi nhánh nào phát triển khách hàng tốt nhất.
Hình 3.3. Báo cáo tần suất sử dụng các loại giao dịch theo tỉnh thành
Các con số trong báo cáo cho ta biết số lƣợng giao dịch đƣợc thực hiện tại các tỉnh thành và từ đĩ tính ra tỷ lệ giao dịch của từng loại trên tổng số giao dịch.
Báo cáo trên cho ta thấy hầu hết các giao dịch của chủ tài khoản với ngân hàng là giao dịch rút tiền, đa số các tỉnh thành cĩ tỷ lệ rút tiền tại ATM lớn hơn 70%, đại diện nhƣ Hà Nội cĩ số lƣợng giao dịch lớn nhất trong cả nƣớc tỷ lệ này cũng chiếm đến 82,18%. Điều này cũng chứng tỏ thĩi quen tiêu tiền mặt của ngƣời dân khơng hề thay đổi, chủ tài khoản sẽ rút tiền thay vì sử dụng các dịch vụ thanh tốn trực tuyến khác.
Đứng sau Hà Nội về số lƣợng giao dịch nhƣng tại TP.Hồ chí Minh độ chênh lệch giữa việc sử dụng các loại giao dịch loại khơng lớn, tỷ lệ thanh tốn bán lẻ đã đạt 25,59% trên tổng số giao dịch của thành phố, kết quả này cũng cho thấy một phần thành cơng về việc triển khai các dịch vụ thanh tốn hĩa đơn bán lẻ tại Hồ Chí Minh.
3.2.2. Thống kê lƣợng tiền thanh tốn bán lẻ theo tỉnh và độ tuổi
Hình 3.4. Thống kê lƣợng tiền thanh tốn bán lẻ theo tỉnh và độ tuổi
Báo cáo thống kê lƣợng tiền thanh tốn bán lẻ theo độ tuổi cho ta thấy lƣợng tiền thanh tốn tập trung chủ yếu ở nhĩm khách hàng cĩ độ tuổi từ 20-35. Nhĩm khách hàng này chiếm tới 95% lƣợng tiền thanh tốn tại Hà Nội và đến 48,5% tại Hồ Chí Minh. Điều này vẫn đúng với những tỉnh cĩ lƣợng giao dịch nhỏ nhƣ Thái Nguyên, Thừa Thiên Huế, An Giang, lƣợng tiền thanh tốn tuy nhỏ nhƣng lại tập trung 100% vào nhĩm khách hàng ở độ tuổi 26-30. Từ các con số trên phần nào nĩi rằng giới trẻ thích tham gia vào các dịch vụ cơng nghệ cao.
Nhìn vào biểu đồ ta cịn thấy các giao dịch chủ yếu thực hiện bởi nữ giới, cĩ thể nĩi chiếm đến 90% số tiền giao dịch. Tuy nhiên cũng cĩ một ngoại lệ với đàn ơng TP.Hồ Chí Minh ở độ tuổi 51-56.
3.2.3. 10 dịch vụ bán lẻ đƣợc thực hiện nhiều nhất tại Hồ Chí Minh và Hà Nội. Nội.
Hình 3.5. 10 Dịch vụ bán lẻ đƣợc thanh tốn nhiều nhất ở TP Hồ Chí Minh Báo cáo hình 3.4 cho ta thấy thống kê lƣợng tiền thanh tốn bán lẻ theo tỉnh và Báo cáo hình 3.4 cho ta thấy thống kê lƣợng tiền thanh tốn bán lẻ theo tỉnh và độ tuổi cho ta biết nhĩm khách hàng ở độ tuổi 20-35 sử dụng dịch vụ thanh tốn của ngân hàng nhiều nhất thì ở hình 3.5 và 3.6 cho ta thấy cĩ sự khác biệt về mức độ thanh tốn giữa các loại hình. Cụ thể trong 10 dịch vụ đƣợc thanh tốn nhiều nhất ở Hà Nội thì cĩ đến 6 loại khơng nằm trong top 10 dịch vụ đƣợc thanh tốn nhiều nhất ở Hồ Chí Minh, 4 loại dịch vụ cịn lại: Electronic Sales; Furniture, home Funishings; Jewelry Store – Watches; Grocery Stores, supermatkets là 4 dịch vụ đƣợc thanh tốn nhiều nhất ở cả hai vùng. Cĩ thể lý giải 4 loại dịch vụ thanh tốn nhiều ở cả 2 thành phố lớn đại diện cho 2 miền Bắc Nam là vì trị giá hàng hĩa của dịch vụ này cao hoặc các sản phẩm trong loại dịch vụ này thơng dụng.
Hình 3.6. 10 dịch vụ bản lẻ đƣợc thanh tốn nhiều nhất Hồ Chí Minh
3.2.4. Tƣơng quan giữa các top 10 loại dịch vụ của Hồ Chí Minh và Hà Nội
Hình 3.5 và 3.6 đã cho ta thấy Electronic Sales; Furniture, home Funishings; Jewelry Store – Watches; Grocery Stores, supermatkets là 4 dịch vụ đƣợc nằm trong 10 dịch vụ đƣợc thanh tốn nhiều nhất ở cả Hà Nội và Hồ Chí Minh. Sau đây chúng ta cùng xem xét tƣơng quan lƣợng thanh tốn của từng loại dịch vụ giữa 2 thành phố lớn
Hình 3.7. Tƣơng quan giữa 10 loại dịch vụ TT nhiều nhất của Hồ Chí Minh và Hà Nội Trƣớc tiên ta xét đến Electronic Sales, sức mua hàng hĩa ở đây khơng cĩ sự khác biệt nhiều giữa hai thành phố, Hà Nội chiếm 57.83%, Hồ Chí Minh chiếm 42.17%. Dịch vụ cĩ chênh lệch lớn nhất giữa Hà Nội và Hồ Chí Minh phải kể đến Furniture, home Funishings Hà Nội chiếm 78.51% trong khi đĩ Hồ Chí Minh chiếm 21.49% chỉ bằng ¼ của Hà Nội. Hai nhĩm cịn lại tỷ lệ thanh tốn giữa hai thành phố là tƣơng đƣơng nhau. Cụ thể, Jewelry Store – Watches Hà Nội chiếm 37.04 phần trăm
cịn Hồ Chí Minh là 62.96%. Grocery Stores, supermatkets Hà Nội chiếm 38.42% cịn Hồ Chí Minh là 61.58%.
Biểu đồ trên cũng cho ta thấy cĩ những dịch vụ cĩ thể đƣợc thanh tốn nhiều ở Hà Nội nhƣng lại khơng đƣợc quan tâm ở Hồ Chí Minh và ngƣợc lại nhƣ Men/Women/Child uniform chỉ xuất hiện ở Hà Nội với lƣợng tiền thanh tốn 318 triệu đồng và dịch vụ Office And Commercial Furni chỉ cĩ xuất hiện ở Hồ Chí Minh.
3.2.5. Tƣơng quan giữa lƣợng tiền thanh tốn và số dƣ tài khoản
Hình 3.8. Tƣơng quan giữa lƣợng tiền thanh tốn và số dƣ tài khoản
Biểu đồ trên cho ta thấy tƣơng quan giữa số dƣ tài khoản và lƣợng tiền thanh tốn đƣợc chia làm 2 nhĩm chính:
- Nhĩm 1 tiêu 100% số tiền cĩ trong tài khoản, đối tƣợng khách hàng nhĩm 1 này là 26-30 và 36-40, liệu họ cĩ tài khoản khác và chỉ dùng tài khoản này để thanh tốn dịch vụ của họ.
- Nhĩm cịn lại chủ yếu tiêu số tiền rất nhỏ so với số dƣ, thơng thƣờng nhĩm này chỉ tiêu ~15% số tiền họ cĩ, thậm chí con số này cịn nhỏ hơn rất nhiều tỷ lệ nhỏ nhất là 2.65%
3.2.6. Mức điện thoại theo chức vụ và tình trạng hơn nhân
Hình 3.9. Thống kê thanh tốn cƣớc điện thoại năm 2013
Hình 3.10. Thống kê thanh tốn cƣớc điện thoại năm 2014
Nếu năm 2013 chỉ cĩ hai nhĩm Nhân viên và T.Phịng/P.Phịng tham gia thanh tốn cƣớc điện thoại qua dịch vụ của ngân hàng thì đến năm 2014 đã thấy xuất hiện thêm nhĩm khách hàng là GĐ/Phĩ GĐ. Tuy số lƣợng giao dịch chƣa nhiều mới chỉ cĩ 1 giao dịch trong 2 tháng đầu năm 2014 nhƣng cĩ thể nĩi đây là nhĩm khách hàng tiềm năng của dịch vụ này vì số lƣợng tiền thanh tốn là 487,702 lớn hơn 2 lần so với nhĩm nhân viên đã lập gia đình (223,450).
Về mặt số lƣợng giao dịch nếu 7 tháng cuối năm 2003 mới cĩ 139 giao dịch với số lƣợng tiền thanh tốn xấp xỉ 45 triệu thì mới chỉ hai tháng đầu năm 2014 số lƣợng giao dịch đã đạt tới 86 lƣợt và số tiền thanh tốn đã lên xấp xỉ 25 triệu. Vậy chỉ với 2 tháng đầu năm lƣợng tiền thanh tốn đã đạt đƣợc hơn 50% so với lƣợng tiền giao dịch của 7 tháng cuối năm 2013.
Qua hai báo cáo trên ta thấy dịch vụ thanh tốn cƣớc điện thoại bằng các kênh trực tuyến của ngân hàng ngày càng thu hút đƣợc sự quan tâm của các chủ thuê bao một phần dịch vụ này thu hút khách hàng vì tính tiện dụng của nĩ một phần vì các chiến lƣợc khuyến mại của các ngân hàng kết hợp với nhà mạng nhƣ khuyến mại tiền hoặc thời gian gọi khi nạp tiền hoặc thanh tốn dịch vụ qua các kênh trực tuyến của
3.2.7. Thống kê lƣợng giao dịch ATM tại các thời điểm trong ngày
Hình 3.11.Số giao dịch ATM tại hai thành phố lớn theo thời gian
Biểu đồ trên cho ta thấy hoạt động rút tiền diễn ra nhiều nhất vào thời điểm từ 16-18 giờ, thời điểm này là thời điểm tan tầm, các điểm giao dịch của ngân hàng đã đĩng cửa vì vậy để rút tiền chỉ cĩ thể thực hiện ở cây ATM vì thế tổng số giao dịch của hai thành phố Hà Nội và Hồ Chí Minh trong hai ngày 11 và 12 là lớn nhất lên tới ~465 giao dịch trong một giờ. Thời gian từ 23h đến 5h hơm sau số giao dịch chiếm một phần rất nhỏ, chỉ từ 1 dịch đến ~20 giao dịch các máy ATM hầu nhƣ ở trạng thái nghỉ.
3.3. Dự báo, dự đốn
Với cấu trúc kho dữ liệu nhƣ đã mơ tả ở trên tơi tiến hành phân lớp dữ liệu dịch vụ theo các mục tiêu cụ thể:
- Tìm sự phụ thuộc giữa các loại dịch vụ,
- Tỉnh thành nào cĩ thể phát triển loại hình dịch vụ
- Làm thế nào để nâng cao hiệu suất sử dụng của các ATM
- Nhĩm khách hàng nào sử dụng dịch vụ thanh tốn bán lẻ lớn nhất - Xu hƣớng sử dụng dịch vụ của ngân hàng tăng hay giảm.
3.3.1. Sự phụ thuộc giữa các loại dịch vụ
Hình 3.12. Mơ hình khai phá dữ liệu sự phụ thuộc giữa các loại dịch vụ Khĩa: TaiKhoanKey Khĩa: TaiKhoanKey
Dữ liệu đầu vào gồm: UsedATM (sử dụng dịch vụ ATM: 1- cĩ sử dụng dịch vụ, 0- khơng sử dụng dịch vụ), UsedBill (sử dụng dịch vụ thanh tốn hĩa đơn bán lẻ: 1-cĩ sử dụng dịch vụ), UsedRetailM5 (đã sử dụng dịch vụ thanh tốn bán lẻ tính đến tháng 5: 1-đúng, 0-sai)
Thuộc tính dự báo: UsedRetailM6
3.3.1.1. Kết quả thực nghiệm với thuật tốn phân lớp cây quyết định
Bằng cách thay đổi tham số COMPLEXITY_PENALTY tiến hành chạy mơ hình với các giá trị tham số khác nhau tơi cĩ kết quả mơ hình nhƣ bảng sau:
Tham số Mơ hình Decisiontree
Score Population correct (%) Predict probability (%)
CP=0.1 0.96 47.57 96.66 CP=0.2 0.96 47.57 96.66 CP=0.3 0.96 47.57 96.66 CP=0.4 0.96 47.64 96.50 CP=0.5 0.96 47.64 96.50 CP=0.6 0.96 47.64 96.50 CP=0.7 0.96 47.64 96.50 CP=0.8 0.96 47.64 96.50 CP=0.9 0.95 47.44 96.50