Với đề tài các nhân tố ảnh hưởng đến rủi ro nợ quá hạn thẻ tín dụng, rủi ro nợ quá hạn thẻ tín dụng chỉ nhận hai giá trị là rủi ro nợ quá hạn thẻ và không có rủi ro nợ quá hạn thẻ (trả đúng hạn) (0 và 1) nên mô hình định lương hồi quy dự kiến là Logit. Mô hình này có thể giúp ngân hàng xác định khả năng khách hàng sẽ có rủi ro nợ quá hạn thẻ tín dụng (biến phụ thuộc) trên cơ sở sử dụng các nhân tố ảnh hưởng đến khách hàng (biến độc lập). Nghĩa là, mô hình Logit có thể ước lượng xác suất khả năng nợ quá hạn thẻ tín dụng của một khách hàng là bao nhiêu trực tiếp từ mẫu.
Mô hình toán hồi quy Binary Logistic
Các mô hình đánh giá khả năng trả nợ của khách hàng cá nhân được nêu ở trên tuy có những ưu điểm riêng nhưng trong trường hợp biến quan sát chỉ có 2 trạng thái thì những mô hình trên vẫn chưa đưa ra một kết quả chính xác. Chẳng hạn, biến phụ thuộc là khả năng trả nợ của khách hàng cá nhân có 2 giá trị tương ứng với hai trường hợp
khách hàng có khả năng trả nợ và khách hàng không có khả năng trả nợ. Khi đó, mô hình thường được sử dụng để ước lượng là mô hình hồi quy nhị phân Binary Logistic.
Theo Hun Myoung Park (2010), khi biến phụ thuộc là một biến nhị phân, biến thứ bậc, hoặc biến định tính. Thậm chí những dữ liệu đếm được là rời rạc nhưng thường được xem như liên tục. Khi đó, phương pháp ước lượng bình phương nhỏ nhất (OLS) không còn là một ước lượng không chệch tuyến tính tốt nhất (BLUE) nữa, và OLS là ước lượng chệch và không hiệu quả. Do đó, những nhà nghiên cứu đã phát triển hàng loạt mô hình hồi quy mới đối với các biến phụ thuộc này và hồi quy Binary Logistic được sử dụng đến.
Theo Simon Jackman (2007), với hồi quy Binary Logistic, thông tin chúng ta cần thu thập về biến phụ thuộc là một sự kiện nào đó có xảy ra hay không, biến phụ thuộc Y lúc này có 2 giá trị là 0 và 1, với 0 là không xảy ra sự kiện ta quan tâm và 1 là có xảy ra, và tất nhiên là cả thông tin về các biến độc lập X. Từ biến phụ thuộc nhị phân này, một thủ tục sẽ được dùng để dự đoán xác suất sự kiện xảy ra quy tắc nếu xác suất được dự đoán lớn hơn 0.5 thì kết quả dự đoán sẽ cho là “có” xảy ra sự kiện, ngược lại thì kết quả dự đoán sẽ cho là “không”.
Theo Karl L.Wuensch (2014), hồi quy Binary Logistic được sử dụng để tiên đoán một biến xác thực (thường là biến nhị phân) từ một tập hợp biến. Với một biến phụ thuộc, phân tích biệt số thường được sử dụng nếu tất cả các dự báo đều là nhị phân và hồi quy logistic thường được chọn nếu những biến dự báo là một tập hợp liên tục và những biến nhị phân hoặc nếu chúng không phải là phân phối tốt. Trong hồi quy logistic, biến phụ thuộc được dự báo là một hàm xác suất và là một biến nhị phân.
Phương pháp này cũng giống như phương pháp hồi quy tuyến tính, song được xây dựng cho mô hình với biến được dự báo là biến nhị nguyên nhận 2 giá trị tương ứng với sự hiện diện hay vắng mặt của một đặc tính hay một kế quả cần quan tâm nào đó. Các
hệ số trong phương trình hồi quy có thể sử dụng để ước lượng các tỷ số chênh (odds ratios) cho từng biến độc lập trong mô hình.
Mô hình được thể hiện như sau: 𝐸(𝑌
𝑋) =
𝑒𝛽0+ 𝛽1𝑋 1 + 𝑒𝛽0+ 𝛽1𝑋
- Biến phụ thuộc Y là một biến nhị nguyên nhận giá trị 0 hoặc 1, hay ký tự ngắn.
- Các biến độc lập có thể là biến định lượng, có thể là biến định tính hoặc gồm cả biến định lượng và biến định tính.
- Trong công thức này, E(Y/X) là xác xuất để Y = 1 (tức là xác suất để sự kiện xảy ra) khi biến độc lập có giá trị cụ thể là Xi. Ký hiệu biểu thức (β0 + β1X) là z, ta có thể viết lại mô hình hàm Binary Logistic như sau:
𝑃(𝑌 = 1) = 𝑒
𝑧 1 + 𝑒𝑧 Vậy xác suất không xảy ra sự kiện là:
𝑃(𝑌 = 0) = 1 − 𝑃(𝑌 = 1) = 1 − 𝑒
𝑧 1 + 𝑒𝑧
Thực hiện phép so sánh giữa xác suất một sự kiện xảy ra với xác suất sự kiện đó không xảy ra, tỷ lệ chênh lệch này có thể dược thể hiện trong công thức:
𝑃(𝑌 = 1)
𝑃(𝑌 = 0) =
𝑒𝑧 1 + 𝑒𝑧 1 −1 + 𝑒𝑒𝑧 𝑧
Lấy log cơ số e hai vế của phương trình trên rồi thực hiện biến đổi vế phải ra được kết quả:
log [𝑃(𝑌 = 1)
𝑃(𝑌 = 0)] = 𝛽0+ 𝛽1𝑋
Ta có thể mở rộng mô hình Binary Logistic cho nhiều biến độc lập. • Kiểm định độ phù hợp của mô hình
Hồi quy Binary Logistic cũng đòi hỏi ta phải đánh giá độ phù hợp của mô hình. Đo lường độ phù hợp tổng quát của mô hình Binary Logistic được dựa trên chi tiêu -2LL (viết tắt của -2 log likelihood), thước đo này có ý nghĩa giống như SSE (Sum of square of error) nghĩa là càng nhỏ càng tốt. Giá trị -2LL càng nhỏ càng thể hiện độ phù hợp cao, giá trị nhỏ nhất của -2LL là 0 (tức là không có sai số) khi đó mô hình có một độ phù hợp hoàn hảo.
• Kiểm định ý nghĩa thống kê của các hệ số
Hồi quy Binary Logistic cũng đòi hỏi kiểm định giả thuyết hệ số hồi quy khác không. Đại lượng Wald Chi Square được sử dụng để kiểm định ý nghĩa thống kê của hệ số hồi quy tổng thể. Cách thức sử dụng mức ý nghĩa cho kiểm định Wald cũng theo quy tắc thông thường. Wald Chi Square được tính bằng cách lấy ước lượng của hệ số hồi quy biến độc lập trong mô hình (hệ số hồi quy mẫu) Binary Logistic chia cho sai số chuẩn của ước lượng hệ số hồi quy này, sau đó bình phương lên theo công thức:
𝑊𝑎𝑙𝑑 𝐶ℎ𝑖 𝑆𝑞𝑢𝑎𝑟𝑒 = [ 𝛽
𝑠𝑒(𝛽)]
2
• Kiểm định độ phù hợp tổng quát
Ở hồi quy Binary Logistic, tổ hợp tuyến tính của toàn bộ các hệ số trong mô hình hồi quy ngoại trừ hằng số cũng được kiểm định xem có thực sự có ý nghĩa trong việc giải thích cho biến phụ thuộc không. Ta cùng kiểm định Chi - bình phương cho giả thuyết: H0: 𝜌1 = 𝜌2 = ⋯ = 𝜌𝑘 = 0, căn cứ vào mức ý nghĩa quan sát để quyết định bác
Các tiêu chuẩn đo lường độ phù hợp của mô hình
- Omnibus Test of Model Coefficient (OB): kiểm định sự phù hợp tổng quát của mô hình hồi quy với giả thiết Ho là các hệ số hồi quy đồng thời bằng 0. Nếu Sig < 0 thì Ho bị bác bỏ hay mô hình phù hợp một cách tổng quát.
- Hosmer and Lemeshow Test (HL) : kiểm định giả thiết Ho là các giá trị dự báo phù hợp với giá trị quan sát. Nếu Sig > α thì chấp nhận Ho.
- Mức ý nghĩa của các kiểm định và của hệ số hồi quy (β) được chọn là 10% do mẫu dữ liệu nghiên cứu xấp xỉ gần bằng 200 quan sát. Mức ý nghĩa của biến độc lập có thể nhỏ hơn 25%
- Classification Table: cho biết độ chính xác của kết quả dự báo từ mô hình. - 2 Log likelihood (-2LL) càng nhỏ càng tốt.
- Dựa trên các tiêu chuẩn đo lường độ phù hợp của mô hình, thực hiện giảm tải biến độc lập theo phương pháp BackWalk: Wald, kiểm tra lại kết quả với các tiêu chuẩn đo lường phù hợp của mô hình
Mô hình nghiên cứu sử dụng trong nghiên cứu
Mô hình nghiên cứu dự kiến là mô hình định lượng hồi quy binary logistic vì biến phụ thuộc là rủi ro tín dụng chỉ nhận hai giá trị là có hoặc không có nợ xấu (0 và 1) và các biến ảnh hưởng sẽ là các biến số ở tầm vi mô (được phân tích cụ thể ở mục 1.5 và 1.6).
Mô hình hồi quy Binary Logistic phân tích những yếu tố tác động đến rủi ro nợ quá hạn thẻ tín dụng tại Ngân hàng TMCP Ngoại Thương Việt Nam trên địa bàn Thành phố Hồ Chí Minh như sau:
𝑌 = 𝛽0+ ∑ 𝛽𝐽𝑋𝐽+ 𝑢 𝑛
Trong đó, Y là biến giả, có giá trị bằng 1 cho quan sát trả nợ thẻ đúng hạn và bằng 0 cho quan sát không trả nợ thẻ đúng hạn; Xj là các yếu tố ảnh hưởng đến rủi ro quá hạn thẻ; và βj là hệ số của từng yếu tố đó.
Dạng tổng quát của mô hình hồi quy Binary Logstic:
𝑙𝑛 [𝑃(𝑌 = 1)
𝑃(𝑌 = 0)] = 𝛽0+ 𝛽1𝑋1+ 𝛽2𝑋2+ 𝛽3𝑋3+ ⋯ + 𝛽𝑛𝑋𝑛 Trong đó, P(Y = 1) = 𝑃0: Xác suất trả nợ đúng hạn
P(Y = 0) = 1 − 𝑃0: Xác suất không trả nợ đúng hạn
𝑙𝑛 [ 𝑃0 1 − 𝑃0] = 𝑙𝑛 [ 𝑃(𝑡𝑟ả 𝑛ợ đú𝑛𝑔 ℎạ𝑛) 𝑃(𝑡𝑟ả 𝑛ợ 𝑘ℎô𝑛𝑔 đú𝑛𝑔 ℎạ𝑛)] = 𝛽0+ 𝛽1𝑋1+ 𝛽2𝑋2+ ⋯ + 𝛽𝑛𝑋𝑛 Hệ số Odds: 𝑂0 = 𝑙𝑛 [ 𝑃0 1−𝑃0] = 𝑙𝑛 [ 𝑃(𝑡𝑟ả 𝑛ợ đú𝑛𝑔 ℎạ𝑛) 𝑃(𝑡𝑟ả 𝑛ợ 𝑘ℎô𝑛𝑔 đú𝑛𝑔 ℎạ𝑛)] 𝑙𝑛𝑂0 = 𝛽0+ 𝛽1𝑋1+ 𝛽2𝑋2+ 𝛽3𝑋3+ ⋯ + 𝛽𝑛𝑋𝑛 (1)
Do đó, log của hệ số Odds là một hàm tuyến tính với các biến độc lập 𝑋𝑗(𝑗 = 1; 2; … ; 𝑛). Phương trình (1) có dạng hàm logit. Do đó, ước lượng các hệ số hồi quy bằng phương pháp MX (Maximum Likelihood).
Dựa vào số liệu điều tra của 3 120 khách hàng sử dụng thẻ tín dụng của Vietcombank trên địa bàn TP.HCM giai đoạn 2016 – 2018, hàm hồi quy Binary Logistic về các yếu tố ảnh hưởng đến rủi ro quá hạn thẻ tín dụng tại Vietcombank TP.HCM như sau:
𝑙𝑛𝑂0 = 𝛽0+ 𝛽1𝑇𝑈𝑂𝐼 + 𝛽2𝐺𝑇 + 𝛽3𝐻𝑁 + 𝛽4𝐻𝑉 + 𝛽5𝑁𝐺𝐻𝐸 + 𝛽6𝑇𝑆𝐷𝐵 + 𝛽7𝐻𝑀
3.3. Phương pháp nghiên cứu
Tác giả sử dụng chương trình SPSS 18.0 và Excel để thực hiện xây dựng mô hình nghiên cứu nhằm:
- Xác định biến quan trọng: Đây là quy trình chọn từng bước để xác định các biến độc lập có ảnh hưởng nhất đối với các khách hàng có hoặc không có khả năng trả nợ.
- Phương pháp so sánh: Được sử dụng để phân tích số liệu qua các năm từ 2016- 2018 để phản ánh tình hình hoạt động kinh doanh và thực trạng kinh doanh thẻ tín dụng tại Vietcombank.
- Phương pháp thống kê mô tả: Dùng để phân tích các biến trong mẫu nghiên cứu
Phần mềm SPSS
SPSS (Statistical Product and Services Solutions) về bản chất là một phần mềm thống kê, thông thường dùng trong nghiên cứu xã hội đặc biệt là trong tâm lý học, tiếp thị và xã hội học. Ngoài ra SPSS còn được sử dụng trong nghiên cứu thị trường. SPSS cung cấp một hệ thống quản lý dữ liệu và khả năng phân tích thống kê với giao diện thân thiện cho người dùng trong môi trường đồ hoạ, sử dụng các trình đơn mô tả và các hộp thoại đơn giản.
Nội dung của SPSS rất phong phú và đa dạng bao gồm từ việc thiết kế các bảng biểu và sơ đồ thống kê, tính toán các đặc trưng mẫu trong thống kê mô tả, đến một hệ thống đầy đủ các phương pháp thống kê phân tích như:
+ So sánh các mẫu bằng nhiều tiêu chuẩn tham số và phi tham số (Nonparametric Test), các mô hình phân tích phương sai theo dạng tuyến tính tổng quát (General Linear Models), các mô hình hồi quy đơn biến và nhiều biến, các hồi quy phi tuyến tính (Nonlinear), các hồi quy Logistic;
+ Phân tích theo nhóm (Cluster Analysis); + Phân tích tách biệt (Discriminatory Analysis); + Và nhiều chuyên sâu khác (Advanced Statistics).