Bài nghiên cứu ứng dụng mô hình logistic chấm điểm 235.629 khách hàng cá nhân nộp hồ sơ vay vốn tại Lendungclub - một trong những tổ chức cho vay ngang hàng (Peer - to - Peer) đầu tiên tại Mỹ. Dữ liệu nghiên cứu được thực hiện trong hai năm 2014-2015 bao gồm 111 đặc điểm của khách hàng vay vốn. Nhóm nghiên cứu đã sử dụng mô hình Logistic để đo lường xác suất một khách hàng vay vốn là khách hàng tốt. Trên cơ sở đó, tổ chức tín dụng sẽ xác định được mức rủi ro tín dụng của khách hàng vay vốn nhằm đưa ra quyết định cho vay phù hợp.
Mã số: 461 Ngày nhận: 27/11/2017 Ngày gửi phản biện lần 1: /2017 Ngày gửi phản biện lần 2: Ngày hoàn thành biên tập: 29/1/2018 Ngày duyệt đăng: 29/1/2018 ỨNG DỤNG MƠ HÌNH LOGISTIC CHẤM ĐIỂM KHÁCH HÀNG CÁ NHÂN NỘP HỒ SƠ VAY TRÊN LENDINGCLUB Nguyễn Thị Thúy Quỳnh Trần Thị Xuân Anh2 Bùi Lê Trà Linh3 Tóm tắt:Bài nghiên cứu ứng dụng mơ hình logistic chấm điểm 235.629 khách hàng cá nhân nộp hồ sơ vay vốn Lendungclub - tổ chức cho vay ngang hàng (Peer - to - Peer) Mỹ Dữ liệu nghiên cứu thực hai năm 2014-2015 bao gồm 111 đặc điểm khách hàng vay vốn Nhóm nghiên cứu sử dụng mơ hình Logistic để đo lường xác suất khách hàng vay vốn khách hàng tốt Trên sở đó,tổ chức tín dụng xác định mức rủi ro tín dụng khách hàng vay vốn nhằm đưa định cho vay phù hợp Nếu người vay có xác suất khách hàng tốt thấp mức xác suất đưa bị từ chối khoản vay, ngược lại người vay có xác suất khách hàng tốt cao mức xác suất đưa chấp nhận khoản vayđó tuỳ vào mức độ sẵn sàng chấp nhận rủi ro tín dụng từ tổ chức cho vay Từ khóa: chấm điểm khách hàng, logistic, xếp hạng tín dụng, xếp hạng tín nhiệm Abstract:The paper applied logistics model for rating 235.629 individual borrowers in lendingclub - one of the first peer - to - peer lending institution in US The research is implemented based on date of two years from 2014 to 2015, including 111 characteristics of clients The paper used the logistic model to measure the probability that a customer is a good one Accordingly, the credit institution will determine the level of credit risk of the borrower to make appropriate loan decision If the borrower has a good probability of being well below the given probability, then the loan will be denied In contrast, if the borrower has a probability of being a good Học viện Tài chính, Email: nguyenthithuyquynh@hvtc.edu.vn Học viện Ngân hàng, Email: ttxahvnh@gmail.com Hiệp hội Doanh nghiệp Châu Âu Việt Nam, Email: tralinhbuile@gmail.com client higher than the given probability, then the loan is accepted The given probability depends on the willingness to accept credit risk from the lender Keywords: client rating, logistic, credit rating Giới thiệu chấp điểm khách hàng xếp hạng tín dụng Tín dụng hoạt động mang lại lợi nhuận cho ngân hàng thương mại(NHTM) Trong q trình cấp tín dụng, ngân hàng thường đối mặt với nguy rủi ro từ nhiều nguyên nhân khác thường chung hệ khách hàng không thực không thực đầy đủ nghĩa vụ tài đến hạn Những nguy rủi ro khó loại trừ hồn tồn mà hạn chế phòng ngừa Một biện pháp hạn chế rủi ro tín dụng hiệu phổ biến xây dựng mơ hìnhchấm điểm khách hàng nhằm xếp hạng tín dụng, phân loại khách hàng, hỗ trợ công tác định quản lý tín dụng Xếp hạng tín dụng (XHTD)phát mạnh từ nhiều năm Mỹ nước Châu Âu Ba cơng ty đánh giá tín dụng lớn giới công ty Standard & Poor's (S&P), Moody's Fitch Group S&P Moody's có trụ sở Mỹ, Fitch trụ sở Mỹ Anh FIMALAC Pháp kiểm sốt Trong q khứ, tổ chức tín dụng thườngsử dụng mơ hình chấm điểm khách hàng XHTDđể đánh giá phân loại khách hàng vay nợ.Abdou Pointon (2011) hệ thống hoá phương pháp XHTD sử dụng gồm phương pháp chuyên gia phương pháp thống kê Phương pháp chuyên gia phương pháp thu thập xử lý đánh giá dự báo cách tập hợp hỏi ý kiến chuyên gia giỏi lĩnh vực tài ngân hàng để xác định rủi ro chất lượng khoản tín dụng.Phương pháp nhiều chi phí thời gian cần số lượngchuyên gia lớn tham giađánh giá.Phương pháp thống kê dựa số liệu thực tiễn mức độ nợ, khả trả nợ… phương pháp kiểm định thống kê để phát biến số ảnh hưởng tới rủi ro tín dụng Sự phù hợp mơ hình thống kê phụ thuộc lớn vào chất lượng liệu thực nghiệm Bộ liệu cần đủ lớn xác mơ hình thống kê đưa kết có ý nghĩa Ở Việt Nam, hoạt động XHTD phát triển từ năm 2002 Trước đó, việc xem xét cấp tín dụng thơng thường dựa vào đánh giá chủ quan mang cảm tính lớn người xét cấp tín dụng nên dễ dẫn đến rủi ro khó lường hội người vay Những rủi ro gặp phải dẫn đến đổ vỡ ngân hàng… Năm 1988, Ủy ban Basel giám sát ngân hàng ban hành hiệp ước Basel II nhằm chuẩn mực hóa hoạt động ngân hàng theo xu hướng toàn cầu, thiết lập hệ thống ngân hàng quốc tế ổn định, thống nhất, bình đẳng, giảm cạnh tranh không lành mạnh tạo thay đổi quản trị rủi ro ngân hàng, giúp ngân hàng hoạt động an toàn Ở Việt Nam, việc áp dụng Basel II cácNHTM gặp khơng khó khăn chi phí tài chính, hệ thống sở liệu quy định ngân hàng nhà nước việc hiệu chỉnh quy định Basel II phù hợp với điều kiện thực tế Vì vậy, việc tìm kiếm mơ hình, phương thức đánh giá rủi ro tín dụng khách hàng vay NHTM cần thiết, đặc biệt bối cảnh tự hố tài Bài viết trình bày kết nghiên cứu ứng dụng mơ hình Logicstic sở liệu khách hàng vay vốn Lendingclub (LC), tổ chức cho vay ngang hàng lớn giới nay, nhằm đưa minh chứng thực nghiệm tính hiệu quả, khách quan mơ hình XHTD nói chung, mơ hình Logistic nói riêng, từ khuyến nghị tổ chức tín dụng Việt Nam việc áp dụng mơ hình logicstic xếp hạng khách hàng cá nhân vay vốn Cơ sở lý thuyết củamơ hình Logistic Mơ hình Logistic(Maddala[12], 1992) ứng dụng rộng rãi phân tích rủi ro tín dụng,ở dựa yếu tố ảnh hưởng đến mức độ tín nhiệm khách hàng dự báo xác suất (mức độ) xảy rủi ro tín dụng, quy mức điểm tương ứng nhằm XHTD khách hàng làm sở xác định khoản vay phù hợp Một khách hàng i có thơng tin đặc trưng vec tơ biến độc lập X i = (X 1i , X 2i , , X ki ) Mục tiêu với thông tin thu thập khách hàng cần dự báo khả vỡ nợ khách hàng (khách hàng xấu( Badsi )) xác suất xác định công thức P (Y = X = X i ) (probability of default - PD) xác suất để khách hàng tốt (Goodsi ) xác định công thức P (Y = X = X i ) Xác suất vỡ nợ cao điểm số tín dụng khách hàng thấp.Đểcó tốn tỷ lệ thuận xác suất điểm số tín dụng,bài viết tìm xác suất để khách hàng tốt, tức ước lượng: pi = P(Y = X = Xi ) = - ( b0 + b Xi ) Công thức (1) tương đương: L i = Ln 1- Y i Đặt fi (Y i ) = pi b0 Ỵ R; b = (b1, b2, , bk ); , 1+ e pi - pi (1) = Ln (Odds i ) = Z i = b + b X i (2) Y (1 - pi ) i hàm phân phối xác suất biến cố (Y i = 0) Khi hàm phân phối xác suất đồng thời (Likelihood function - LF) mẫu quan sát độc lập {Y ,Y , , Y n }được xác định: f (Y , Y , , Y n ) = n n Õ i=1 1- Y i fi (Y i ) = Õ pi (1 - Yi pi ) i=1 Lấy logarit tự nhiên hai vế: n LLF = ln f (Y 1,Y , ,Y n ) = å [ (1 - Y )ln p + Y i i i ln (1 - pi )] i=1 n [ ln pi + Y i ln (1 - pi )- Y i ln pi ] = å = i=1 Thay pi = n å i=1 é ù n êY ln (1 - pi ) ú+ å ln p i êi pi ú ú i=1 ëê û n thu được: ln f (Y 1,Y 2, ,Y n ) = - ( b + bX ) 1+ e i å ln[1 + e - ( b0 + b X i ) n ]- i=1 å Y i (b0 + b X i ) i=1 Bài toán: Tìm cực đại hàm LLF (hay LF) theo biến tham số b0, b biết giá trị X i , i = 1, n Giá trị ước lượng b¶0 , $b để hàm LFF đạt cực đại, ứng với µ X i , i = 1, n thay vào công thức (1) thu pi = 1+ e - ( b¶0 + $b X i ) xác suất dự đoán để khách hàng i khách hàng tốt Lựa chọn biến độc lập: Biến độc lập lựa chọn dựa liệu thu thập đặc trưng cho có tác động ảnh hưởng đến việc trả nợ khách hàng Thông tin cá nhân Lịch sử tín dụng gần Dữ liệu hành vi Tình trạng việc làm, nghề nghiệp, thu nhập, tình trạng nhà ở, ghi án số lượng người phụ thuộc… Chiều dài lịch sử tín dụng, số lượng giá trị khứ vay vốn, số lượng giá trị khoản vay trễ hạn khứ thường cung cấp tổ chức cung cấp thơng tin tín dụng Lịch sử sử dụng tín dụng sản phẩm trước đó: Số tiền chi tiêu, việc trả nợ thực tế… Hai công cụ sử dụng lựa chọn biến độc lập nhằm đảm bảo phân loại khách hàng tốt khách hàng xấu là: The Weight of Evidence (W OE ) Information Value (IV) W OE mô tả mối quan hệ biến giải thích biến phụ thuộc nhị phân; IV đo lường sức mạnh mối quan hệ Cụ thể ỉ p ÷ IV = W OE i = Ln ỗỗỗ i ữ ữ ốỗ1 - pi ÷ ø n å éêë(Distr Goods i=1 i - Distr Badsi ´ W OE i ù ú û ) Trong đó: Distr Goodsi tỷ số phần trăm tổng khách hàng tốt nhóm biến với tổng số khách hàng tốt tổng thể; Distr Badsi tỷ số phần trăm tổng khách hàng xấu nhóm biến với tổng số khách hàng xấu tổng thể Theo Siddiqi ([13]), IV < 0.02 biến độc lập khơng có quan hệ với biến phụ thuộc; IV từ 0.02 đến 0.1 biến độc lập khơng có quan hệ q chặt chẽ với biến phụ thuộc; IV từ 0.1 đến 0.3 biến độc lậpcó mối quan hệ kháchặt chẽ với biến phụ thuộc; IV ≥ 0.3 biến độc lậprất chặt chẽ với biến độc lập Đánh giá phù hợp mơ hình: Đối với mơ hình Logistic thơng thường có phương pháp kiểm định tỷ số hàm hợp lý (LR), đo độ phù hợp qua tỷ lệ phần trăm dự báo đúng, kiểm định phù hợp Goodness of Fit test,…Tuy nhiên sử dụng đường cong Receiver Operating Characteristic (ROC) hệ số Gini.Hệ số Gini từ 0.8-1 cho biết mơ hình tốt; từ 0.6-0.8 mơ hình tốt; từ 0.4-0.6 mơ hình khá; từ 0.2-0.4 mơ hình trung bình; từ 0.0-0.2 mơ hình yếu Ứng dụng mơ hình Logistic chấm điểm khách hàng cá nhân nộp hồ sơ vay Trên LC người vay cần điền thông tin vào đơn nộp trực tuyến Hệ thống LC tự động phân tích liệu, đánh giá rủi ro, chấm điểm tín dụng đưa mức lãi suất phù hợp.Sau cơng ty kết nối người vay với nhà đầu tư để nhà đầu tư lựa chọn khoản đầu tư thích hợp dựa thơng tin người vay XHTD, mục đích vay tiền, lịch sử tín dụng,… Đây hình thức cho vay mà người có tiền người cần tiền kết nối trực tiếp với mà không cần thông qua ngân hàng Bài viết sử dụng số liệu khách hàng cá nhân hai năm 2014 2015 website www.lendingclub.com để mơ tả bước ứng dụng mơ hình logistic nhằmđánh giá khả khách hàng tốt, chấm điểm khách hàng, chỉra điểm cắt làm giúp nhà đầu tư định khoản cho vay Các bước cụ thể sau: Phân chia biến thành cácnhóm Dữ liệu gồm 235.629 hồ sơ khách hàng vay, khách hàng kê khai 111 đặc điểm tương ứng với 111 biến độc lập Bảng Mô tả nhóm biến biến đưa vào mơ hình Các biến giống Id Thông tin cá nhân Các biến Hồ sơ tín trước dụng vay LC đánh giá id, member_id, địa chỉ, … Tình trạng nhà ở, cơng việc, thu nhập, tỷ lệ nợ/ thu nhập, mô tả khoản vay,… - Tháng sớm nhất/muộn đánh giá, mở hạn mức tín dụng, lần điều tra hồ sơ… - Số tháng kể từ lần công khai hồ sơ cuối cùng, lần hạn cuối cùng, điều tra gần đây, lần mở thẻ, tài khoản cuối cùng,… - Số lần điều tra, số tài khoản quay vòng mở, số tài khoản thẻ mở,…trong khoảng tháng/12 tháng/24 tháng - Số lượng tài khoản trả góp, số tài khoản quay vòng, số tài khoản thẻ… - Tổng số trung bình tổng số dư tại, tổng mức quay vòng tín dụng cao, tổng dư nợ tín dụng, … - Các biến tỷ lệ sử dụng quay vòng tín dụng, tỷ lệ tài khoản thẻ 75% hạn mức… Gồm biến grade sub_grade thể đánh giá LC mức độ rủi ro hồ sơ vay dựa thông tin cá nhân thông tin hồ sơ tín dụng người vay Grade có giá trị A,B,C,D,… , sub_grade có giá trị A1,A2…,B1,B2,… gần A1 đánh giá tốt lãi suất vay thấp biến 11 biến 74 biến biến Thông tin ban đầu Các khoản vay biến sau Nhà đầu tư vay theo dõi khoản vay Các biến thông tin ban đầu khoản vay, sau khoản vay tài trợ, như: tổng số tiền cho vay, lãi suất, khoản tiền phải tốn hàng tháng,… Các thơng tin tình trạng khoản vay thời điểm quan sát: Dư nợ gốc, khoản tiền nhà đầu tư nhận đến nay, tiền gốc đến nay, tiền lãi, chi phí thu hồi nợ, phí trả trễ, … biến 13 biến Nhóm tác giả thực Sử dụng phân tích định tính nghiên cứu lựa chọn 89 biến độc lập vào mơ hình Tiếp tục loại bỏ biến thiếu quan sát xóa bỏ vài quansát; Các biến có IV < 0.02 bị loại, biến có IV > 0.02 chọn vào mơ hình, biến có tương quan lớn 0.7 dựa IV biến cao giữ lại Sử dụng Stepwise lựa chọn biến đưa vào mơ hình Có 17 biến lựa chọn tính giá trị W OE tương ứng Bảng 2: Danh sách biến lựa chọn làm biến độc lập Step 10 Effect Entered dti3w (Tỷ lệ giá trị khoản vay/thu nhập khả dụng) acc_open_past_24mths (số TK giao dịch mở 24 tháng trước ngày nộp hồ sơ vay) bc_open_to_buyw (số tiền lại vay tài khoản thẻ ngân hàng quay vòng) inq_last_6mthsw (số lần điều tra tháng qua) mo_sin_old_rev_tl_op (số tháng kể từ mở tài khoản đầu tiên) Purposew (mục đích vay tiêu dùng, đảo nợ, tín dụng ) tyle_loanw (Giá trị khoản vay Lending Club/ Tổng dư nợ tại) Termw (thời hạn vay khoản vay) mo_sin_old_il_acctw (Số tháng kể từ tài khoản ngân hàng mở đầu tiên) mths_since_recent_bc (số tháng từ mở tài khoản thẻ gần đến nay) DF Score Pr > Chi-Square Chi_Square 1003.639