1. Trang chủ
  2. » Công Nghệ Thông Tin

Một số ứng dụng máy học trong lĩnh vực ngân hàng

10 3 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 10
Dung lượng 478,96 KB

Nội dung

Bài viết Một số ứng dụng máy học trong lĩnh vực ngân hàng trình bày về một số ứng dụng thực tiễn của Công nghệ thông tin nói chung và Máy học nói riêng trong các hoạt động ngân hàng và những thách thức đối với chuyên gia Công nghệ thông tin khi nghiên cứu ứng dụng liên ngành. Mời các bạn cùng tham khảo!

MỘT SỐ ỨNG DỤNG MÁY HỌC TRONG LĨNH VỰC NGÂN HÀNG TS Tơn Thất Hồ An Trường Đại học Tài – Marketing TS Cao Thị Nhạn Trường Đại học Công nghệ Thông tin Đại học Quốc gia TP Hồ Chí Minh Tóm tắt: Hiện nay, việc phân tích liệu để ứng dụng lĩnh vực kinh tế xã hội nghiên cứu áp dụng ngày phát triển chiều rộng lẫn chiều sâu Các tổ chức, doanh nghiệp đặc biệt quan tâm đến ứng dụng Trí tuệ nhân tạo việc giải vấn đề nâng cao chất lượng dịch vụ chăm sóc khách hàng, có chiến lược marketing hiệu quả, hay phát rủi ro tiềm ẩn doanh nghiệp… nhằm giúp cho hoạt động ngân hàng giảm thiểu rủi ro phát triển lành mạnh Bài viết trình bày số ứng dụng thực tiễn Cơng nghệ thơng tin nói chung Máy học nói riêng hoạt động ngân hàng thách thức chuyên gia Công nghệ thông tin nghiên cứu ứng dụng liên ngành Từ khóa: máy học, ngân hàng, điểm tín dụng, giao dịch bất thường Một số toán hoạt động ngân hàng Các hoạt động lĩnh vực ngân hàng có ảnh hưởng nhiều đến xã hội Bên cạnh đó, số lượng giao dịch lớn, khối lượng công việc đồ sộ phát sinh lĩnh vực đòi hỏi phần mềm hỗ trợ cho công việc xử lý cách nhanh chóng, tiện lợi, xác an tồn Một số tốn điển hình lĩnh vực ngân hàng mà nghiên cứu công nghệ thông tin thực bao gồm: – Phát giao dịch thực thẻ tín dùng có bất thường (credit card fraud detection) – Đánh giá điểm tín dụng khách hàng (credit scoring) 1.1 Phát giao dịch thẻ tín dụng bất thường Giao dịch tài thực thẻ tín dụng ngày phổ biến nhanh chóng, tiện lợi Tuy nhiên bên cạnh cịn có nhiều thách thức mặt an toàn hệ thống mà ngân hàng cần đảm bảo Những điều quan trọng ảnh hưởng đến chất 190 - lượng dịch vụ, uy tín ngân hàng Theo thống kê Infosecurity (Parag Jain & Dhruv Dutta, n.d.), thiệt hại gian lận toàn cầu năm 2018 ước tính nghìn tỷ đô la Tuy số lượng gian lận giao dịch tài khơng chiếm tỉ lệ cao tổng số giao dịch lại gây tổn thất lớn với doanh nghiệp Và theo khảo sát PwC’s Global Economic Crime Fraud Survey (PwC, 2020), thực với 5.000 đối tượng cá nhân doanh nghiệp khảo sát vòng 24 tháng, cho thấy số ấn tượng sau: – Thiệt hại khoảng 42 tỉ đô la – 47% người khảo sát cho biết họ bị gian lận – Trung bình, cơng ty trải qua cố – loại gian lận hàng đầu liệt kê theo thứ tự bao gồm: Gian lận khách hàng (Customer Fraud), Tội phạm mạng (Cybercrime), Chiếm đoạt tài sản (Asset Misappropriation), Hối lộ tham (Bribery and Corruption) Hình cho thấy kết thống kê theo khảo sát chi tiết Hình Tỉ lệ loại gian lận khảo sát theo (PwC, 2020) Chính vậy, yêu cầu cấp thiết tìm kiếm giải pháp để kịp thời phát hiện, ngăn chặn, loại bỏ bất thường giao dịch nói chung Riêng lĩnh vực ngân hàng, có nhiều cách tiếp cận khác để giải toán phát giao dịch bất thường thực thẻ tín dụng Cách tiếp cận thứ chuyên gia - 191 lĩnh vực ngân hàng tập trung vào xây dựng quy tắc nhằm phát giao dịch bất thường cải tiến quy trình nghiệp vụ ngân hàng Cách tiếp cận thứ hai nhà nghiên cứu chun ngành cơng nghệ thơng tin tìm kiếm mơ hình phát bất thường ứng dụng giải toán liên ngành Các nghiên cứu tập trung vào thu thập, tiền xử lý liệu để lựa chọn liệu học phù hợp với toán; nghiên cứu tìm phương pháp máy học phù hợp, cho độ xác cao có khả ứng dụng thực tế (Padhi B.K công sự, 2020) 1.2 Đánh giá điểm tín dụng khách hàng Một hoạt động quan trọng khác ngân hàng hoạt động cho vay tín dụng Theo báo cáo SSI Securities Corporation (“Credit growth forecast to reach 13-14 percent this year: SSI”, n.d.), dự báo tăng trưởng tín dụng năm 2021 Việt Nam đạt 13 – 14% Thực tế việc tăng trưởng nhanh dẫn đến khối lượng công việc nhân viên ngân hàng nhiều rủi ro tín dụng tăng theo Một cơng việc quan trọng quy trình cho vay tín dụng đánh giá tín dụng khách hàng Theo “What Is a Good Credit Score?”, (n.d.), điểm tín dụng số đánh giá tình trạng tài khách hàng để từ định cho vay hay không Trên giới, tổ chức tín dụng thường sử dụng thang điểm tín dụng theo FICO (Fair Issac Coporation) với thang điểm từ 300 – 850, khách hàng đánh giá điểm tín dụng tốt có số điểm từ 670 đến 799, xuất sắc có điểm 800 Hình minh họa chi tiết thang điểm tương ứng với mức đánh giá khách hàng cụ thể sau: – 300 – 579 điểm: Poor  – 580 – 669 điểm: Fair – 670 – 739 điểm: Good – 740 – 799: Very good – 800 – 850: Exceptional 192 - Hình Thang điểm đánh giá theo FICO Theo SHB Finance (2020), Việt Nam, điểm tín dụng số thể lịch sử tín dụng cá nhân theo tiêu chuẩn quy tắc xếp hạng quốc tế dựa việc phân tích hồ sơ tín dụng cá nhân số điểm trung tâm thơng tin tín dụng quản lý (trung tâm trực thuộc Ngân hàng Nhà nước). Đơn giản điểm tín dụng điểm số mà thơng qua tổ chức tín dụng, cơng ty tài chính, ngân hàng thương mại đánh giá uy tín khách hàng sử dụng dịch vụ hình thức cho vay mà tổ chức cung cấp Như vậy, điểm tín dụng đóng vai trị công cụ giúp cho tổ chức cho vay tiêu dùng đánh giá mức độ uy tín khách hàng trước định có cho khách hàng vay hay khơng, hạn mức vay tối đa mà ngân hàng giải ngân khách hàng có nhu cầu vay vốn Theo SHB Finance (2020), thang điểm tín dụng sử dụng sau:  – 150 – 321 điểm: Rủi ro cao, không đủ điều kiện vay.  – 322 – 430 điểm: Rủi ro cao, không đủ điều kiện vay.  – 431 – 569 điểm: Rủi ro trung bình, đủ điều kiện vay lãi suất tương đối cao – 570 – 679 điểm: Rủi ro thấp, đủ điều kiện vay, lãi suất thấp ưu đãi – 680 – 750 điểm: Rủi ro thấp, đủ điều kiện vay, lãi suất thấp ưu đãi.  Đối với chuyên gia cơng nghệ thơng tin, có nghiên cứu ứng dụng máy học để xây dựng mơ hình chấm điểm tín dụng ElMasry (2019), Provenzano cộng (2020) Từ xây dựng nên hệ thống chấm điểm tín dụng cho khách hàng, cơng cụ hỗ trợ cho nhân viên ngân hàng trình định xét duyệt hồ sơ cho vay tín dụng - 193 Một số nghiên cứu chuyên ngành công nghệ thông tin ứng dụng hoạt động ngân hàng Như trình bày phần trên, nghiên cứu góc nhìn chun gia cơng nghệ thơng tin dạng tốn khai thác liệu doanh nghiệp Tiến trình bao gồm bước sau (như minh họa hình 3): – Data collection: Thu thập liệu Dữ liệu thu thập từ thực tế giao dịch doanh nghiệp liệu chia sẻ cộng đồng nghiên cứu lĩnh vực – Pre-processing and Extract feature: Tiền xử lý liệu trích xuất vector đặc trưng Bước bao gồm kỹ thuật tiền xử lý liệu nhằm rút trích đặc trưng phù hợp Thường bao gồm tích hợp liệu (Data integration), chuẩn hóa liệu (Data normalization), trích chọn đặc trưng (Feature selection) kỹ thuật giảm chiều liệu (Dimension reduction) – Training and testing: huấn luyện kiểm thử Áp dụng phương pháp máy học để huấn luyện kiểm thử mơ hình – Model evaluation and Result analysis: phân tích kết đạt để hiểu rõ liệu sử dụng, phương pháp máy học áp dụng đánh giá khả ứng dụng thực tế Data collection Preprocessing and Extract Feature Training and Testing Hình Tiến trình chung Model Evaluation and Result Analysis 2.1 Phát giao dịch thẻ tín dụng bất thường Theo nghiên cứu Padhi cộng (2020) Makki cộng (2019), toán có điểm cần lưu ý sau: – Data collection: Một số liệu chọn lựa tiến hành thực nghiệm Credit Card Fraud Detection theo nghiên cứu (Padhi cộng sự, 2020), liệu Credit Card Fraud theo nghiên cứu Makki cộng (2019) Trong đó: • Bộ liệu Credit Card Fraud Detection (Machine Learning Group – ULB, Credit Card Fraud Detection, 2018) ULB Machine Learning Group thu thập Bộ 194 - liệu bao gồm giao dịch thẻ tín dụng xảy hai ngày tháng 8.2013 châu âu, có 492 vụ lừa đảo số 284,807 giao dịch Bộ liệu cân bằng, lớp posstive (bất thường) chiếm 0,172% tất giao dịch Vì lý bảo mật mà số trường liệu biến đổi dùng PCA, khơng biết ý nghĩa giá trị thuộc tính Bảng mơ tả liệu Credit Card Fraud Detection Bảng Các thuộc tính dataset Credit Card Fraud Detection (Machine Learning Group – ULB, Credit Card Fraud Detection, 2018) STT Tên thuộc tính Mơ tả Class Có hai giá trị: giao dịch bình thường, giao dịch bất thường Amount Số tiền thực giao dịch V1, V2, , V28 Time Các thuộc tính bị biến đổi bảo mật Giá trị thuộc tính số, kết trình chuyển đổi PCA Lượng giây trôi qua giao dịch, giao dịch liệu • Bộ liệu Credit Card Fraud (Credit Card Fraud Dataset, 2013) bao gồm khoảng 10 triệu giao dịch thẻ tín dụng có thuộc tính bảng Đây liệu cân 5.96% giao dịch gian lận Bảng Các thuộc tính dataset Credit Card Fraud STT Tên thuộc tính CustID Gender State Cardholder Balance NumTrans NumIntTrans CreditLine FraudRish Mô tả Mã khách hàng, thuộc tính bị loại bỏ bước tiền xử lý liệu Giới tính Bang khách hàng sống USA Số lượng thẻ khách hàng có (tối đa 2) Số dư tài khoản tính USD Số lượng giao dịch thực tính đến thời điểm Số lượng giao dịch quốc tế thực tính thời thời điểm Hạn mức tín dụng khách hàng Có giá trị, giao dịch bình thường, giao dịch gian lận – Vì liệu thu thập cân (đa số thuộc lớp giao dịch bình thường) nên số kỹ thuật xử lý liệu cân áp dụng Random Oversampling (Makki cộng sự, 2019; Jason Brownlee, 2020) Ý tưởng Random Undersampling giảm phần tử lớp đa số để làm giảm tính cân liệu, loại bỏ phần tử lớp đa số cách ngẫu nhiên, cách có chủ đích (giảm phần tử nhiễu, giảm phần tử vùng biên) Với kỹ thuật Random Undersampling số lượng liệu - 195 giảm đáng kể sau áp dụng Trong ý tưởng Random Oversampling (hay gọi SMOTE – Synthetic Minority Over-sampling Technique) tạo điểm tổng hợp để có cân lớp SMOTE tạo liệu tổng hợp từ lớp thiểu số để đạt cân nhóm thiểu số đa số Và với cách nhiều thơng tin giữ lại khơng xóa liệu từ liệu ban đầu – Các phương pháp máy học thường áp dụng: Support Vector Machine (SVM), Quadratic Discriminant Analysis (QDA), Linear Discriminant Analysis (LDA), Classification and Regression Tree (CART), kỹ thuật boosting (XGBoost, CatBoots, LGBoots, Random Forest) (Padhi B.K cộng sự, 2020); Nghiên cứu thực nghiệm thuật toán máy học như: C5.0 (Decision tree), SVM, Artificial Neural Network (ANN), Naïve Bayes, Bayesian Belief Network, Logistics Regression (LG), Artificial Immune Systems (AIS) (S Makki cộng sự, 2019) – Đánh giá kết quả: Theo thực nghiệm Padhi cộng (2020) LGBoost cho kết tốt nhất; theo kết luận Makki cộng (2019) Logistics Regression cho kết tốt Các kết sử dụng kênh tham khảo tốt tiến hành thực nghiệm với nhiều phương pháp khác nhiên việc so sánh chi tiết độ xác, hiệu triển khai ứng dụng thực tế cần cân nhắc kỹ lưỡng thực tế chạy hai liệu khác 2.2 Đánh giá điểm tín dụng khách hàng Theo nghiên cứu ElMasry (2019), Provenzano cộng (2020), tốn có điểm cần lưu ý sau: – Data collection: Một số liệu chọn lựa tiến hành thực nghiệm Freddie Mac sample data theo nghiên cứu (ElMasry, 2019), Innovative Microfinance Limited (IML), a micro-lending institution in Ghana theo nghiên cứu (Provenzano cộng sự, 2020) Trong đó: • Bộ liệu Freddie Mac cung cấp Freddie Mac, gồm ngẫu nhiên 50,000 tài khoản vay trích từ 25.7 triệu mẫu tin từ thời gian 01/01/1999 đến 31/3/2017 Bộ liệu gồm 26 thuộc tính FICO (credit score), first payment date (dt_first_ pi), first time homebuyer flag (flag_fthb), maturity date (dt_matr) • Innovative Microfinance Limited (IML), thu thập micro-lending institution Ghana, khoảng thời gian từ 01/2012 đến 7/2018 với 4450 khách hàng Bộ liệu gồm có thuộc tính bao gồm: tuổi (age), giới tính (gender), tình trạng nhân (Marital status), nhật ký số tiền (Log amount), tần suất hoàn trả khoản vay (Frequency), lãi suất hàng năm (Annualized rate), số lần hoàn trả khoản vay (No of repayment) 196 - – Đây dạng liệu cân nên áp dụng kỹ thuật xử lý liệu cân – Các thuật toán máy học thường áp dụng: theo ElMasry (2019) thực nghiệm Logistic Regression, Decision tree, Random forest, K-NN, SVM, Multiple imputation by chained equation Trong Provenzano cộng (2020) thực nghiệm với Decision tree, Random Rorest, XGBoost, Adaboost, K-NN, Multilayer Perception – Đánh giá kết quả: Theo kết thực nghiệm (ElMasry, 2019) liệu thuật tốn cho kết tốt SVM Random Forest, theo Provenzano cộng (2020) phương pháp cho kết tốt XGBoost, Adaboost Random Forest Một lưu ý nghiên cứu ElMasry (2019) Provenzano cộng (2020) tiến hành thực nghiệm liệu khác cách tiền xử lý liệu, rút trích đặc trưng khác Chính kết xem kênh tham khảo cho nghiên cứu lĩnh vực khơng dùng so sánh độ xác hai nhóm nghiên cứu Một số vấn đề nghiên cứu ứng dụng ngân hàng Việt Nam Đây tốn ứng dụng cơng nghệ thơng tin nghiệp vụ ngân hàng, có vấn đề cần quan tâm sau: 3.1 Dữ liệu Dữ liệu để huấn luyện mơ hình quan trọng Tuy nhiên thực tế nghiên cứu liệu chia sẻ cơng khai đầy đủ thơng tin chi tiết Chính cịn có khó khăn sau: – Các liệu chia sẻ liệu có đặc trưng khác dù lĩnh vực nghiên cứu – Hơn nữa, liệu thường liệu cũ, ví dụ Freddie Mac thu thập liệu từ 1999 đến 2017, hay Innovative Microfinance Limited thu thập liệu từ năm 2012 đến 2018 Khi liệu học khơng cập nhật nên kết ứng dụng vào thực tế thường khơng cao – Vì lý bảo mật, khó có liệu thực từ tổ chức ngân hàng để tiến hành thực nghiệm, đánh giá hiệu phương pháp máy học 3.2 Kiến thức chuyên ngành ngân hàng Đây ứng dụng công nghệ thông tin lĩnh vực chuyên môn, cụ thể hoạt động phát bất thường gian lận giao dịch tài đánh giá điểm tín dụng - 197 khách hàng nhằm giảm thiểu rủi ro, cần ý kiến chuyên gia lĩnh vực ngân hàng để tư vấn cho việc lựa chọn đặc trưng đánh giá kết thực nghiệm Những ý kiến từ chuyên gia lĩnh vực ngân hàng vô quan trọng việc đánh giá, hiểu rõ ý nghĩa kết chạy thực nghiệm, cải tiến mơ hình học máy để đạt độ xác cao, hiệu triển khai ứng dụng thực tế tốt Hơn nữa, chuyên gia lĩnh vực ngân hàng có chiến lược phát triển tổ chức cách phù hợp dựa vào tri thức thu nhận sau q trình phân tích liệu Kết luận Như trình bày trên, hướng nghiên cứu ứng dụng Công nghệ thông tin lĩnh vực ngân hàng toán mang tính ứng dụng cao cịn nhiều thách thức Việc phát kịp thời giao dịch tài sử dụng thẻ tín dụng bất thường gian lận, hay đánh giá tín dụng cho khách hàng nhằm giảm thiểu rủi ro cho vay đồng thời rút ngắn thời gian duyệt hồ sơ cho vay tín dụng ln quan tâm cải tiến quy trình xử lý để ngày tốt Bài viết phân tích khó khăn thách thức chuyên gia lĩnh vực công nghệ thông tin nghiên cứu xây dựng mơ hình máy học ứng dụng lĩnh vực ngân hàng Đối với chuyên gia công nghệ thông tin, nghiên cứu hỗ trợ từ phía ngân hàng liệu thực tế, thơng tin chuyên môn nghiệp vụ ngân hàng, đánh giá kết thực nghiệm cộng tác đưa nghiên cứu ứng dụng vào thực tế, mang lại hiệu thiết thực cho hoạt động ngân hàng Tài liệu tham khảo Brownlee, J (2020) Random Oversampling and Undersampling for Imbalanced Classification, Machine Learning Mastery site https://machinelearningmastery.com/random-oversamplingand-undersampling-for-imbalanced-classification/ Credit growth forecast to reach 13-14 percent this year: SSI, (n.d.) https://en.vietnamplus.vn/ credit-growth-forecast-to-reach-1314-percent-this-year-ssi/194393.vnp Credit Card Fraud Dataset (2013) http://packages.revolutionanalytics.com/datasets/ ElMasry, M H A M T (2019). Machine learning approach for credit score analysis: a case study of predicting mortgage loan defaults (Doctoral dissertation) Makki, S., Assaghir, Z., Taher, Y., Haque, R., Hacid, M S., & Zeineddine, H (2019) An experimental study with imbalanced classification approaches for credit card fraud detection.  IEEE Access, 7, 93010-93022 doi: 10.1109/ACCESS.2019.2927266 Machine Learning Group – ULB, Credit Card Fraud Detection (2018) https://www.kaggle.com/ mlg-ulb/creditcardfraud 198 - Parag Jain, & Dhruv Dutta Filling Inter-Party Trust GAP in Online Transactions & Interactions (n.d.), ThynkBlynk https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RWxIVN PwC, PwC’s Global Economic Crime and Fraud Survey (2020) Fighting fraud: A never-ending battle, PwC, (2020) https://www.pwc.com/gx/en/services/forensics/economic-crimesurvey.html Padhi B K., Chakravarty S., Biswal B N (2020) Anonymized Credit Card Transaction Using Machine Learning Techniques In: Mohanty M., Das S (eds) Advances in Intelligent Computing and Communication Lecture Notes in Networks and Systems, vol 109 Springer, Singapore https://doi.org/10.1007/978-981-15-2774-6_49 Provenzano, A R., Trifirò, D., Datteo, A., Giada, L., Jean, N., Riciputi, A., Le Pera, G., Spadaccino, M., Massaron, L., & Nordio, C (2020) Machine learning approach for credit scoring. arXiv preprint arXiv:2008.01687 SHB Fincance (2020) Điểm tín dụng gì? Tại vai trị điểm tín dụng lại quan trọng? https://www.shbfinance.com.vn/tu-van/meo-quan-ly-tai-chinh/diem-tin-dung-la-gi-tai-saovai-tro-cua-diem-tin-dung-lai-quan-trong “What Is a Good Credit Score?”, (n.d.) https://www.experian.com/blogs/ask-experian/crediteducation/score-basics/what-is-a-good-credit-score - 199 ... thức chuyên gia lĩnh vực công nghệ thông tin nghiên cứu xây dựng mơ hình máy học ứng dụng lĩnh vực ngân hàng Đối với chuyên gia công nghệ thông tin, nghiên cứu hỗ trợ từ phía ngân hàng liệu thực... cứu ứng dụng Công nghệ thông tin lĩnh vực ngân hàng tốn mang tính ứng dụng cao nhiều thách thức Việc phát kịp thời giao dịch tài sử dụng thẻ tín dụng bất thường gian lận, hay đánh giá tín dụng. .. không dùng so sánh độ xác hai nhóm nghiên cứu Một số vấn đề nghiên cứu ứng dụng ngân hàng Việt Nam Đây tốn ứng dụng cơng nghệ thơng tin nghiệp vụ ngân hàng, có vấn đề cần quan tâm sau: 3.1 Dữ liệu

Ngày đăng: 31/12/2022, 12:30

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN