Tóm tắt các biến độc lập trong mơ hình hồi quy Logistic

Một phần của tài liệu (LUẬN văn THẠC sĩ) vận dụng mô hình logistic và neural network trong xếp hạng tín dụng doanh nghiệp tại ngân hàng TMCP công thương việt nam (Trang 46)

hiệu Tên biến Cơng thức tính Ý nghĩa

X1 Tỷ số thanh toán hiện thời

Tài sản ngắn hạn/ Nợ ngắn hạn

Đo lường khả năng thanh toán trong ngắn hạn của doanh nghiệp.

X2 Tỷ số thanh toán nhanh (Tài sản ngắn hạn – Hàng tồn kho)/ Nợ ngắn hạn

Đo lường khả năng huy động tài sản lưu động để thanh toán ngay các khoản nợ ngắn hạn của doanh nghiệp.

X3 Tỷ số nợ trên tổng tài sản

Nợ phải trả/Tổng tài sản

Thể hiện cơ cấu sử dụng đòn cân nợ và quy mơ tài chính của doanh nghiệp X4 Tỷ số nợ trên vốn chủ sở hữu Nợ phải trả/Vốn chủ sở hữu bình quân

Thể hiện cấu trúc tài chính của doanh nghiệp

X5 Vịng quay tổng tài sản

Doanh thu thuần /Tổng tài sản

Đánh giá hiệu quả sử dụng tài sản của doanh nghiệp X6 Vòng quay khoản phải thu Doanh thu thuần/Khoản phải thu bình quân

Thể hiện tốc độ biến đổi các khoản phải thu thành tiền mặt, là một thước đo để đánh giá hiệu quả hoạt động của doanh nghiệp

X7 Vòng quay

hàng tồn kho

Giá vốn/ Hàng tồn kho bình quân

Thể hiện hiệu quả trong quản trị ngân quỹ. Chỉ tiêu phản ánh hiệu quả của doanh nghiệp trong việc quản lý và bán hàng trong kho.

X8 Tỷ suất sinh lợi trên tài sản

Lợi nhuận sau thuế/ Tổng tài sản

Đánh giá hiệu quả trong khai thác và sử dụng tài sản

X9

Tỷ suất sinh lợi trên vốn chủ sở hữu

Lợi nhuận sau thuế/ Vốn chủ sở hữu bình qn

Đánh giá tính hiệu quả trong việc sử dụng vốn chủ sở hữu

X10

Tỷ suất sinh lợi trên doanh thu

Lợi nhuận sau thuế/ Doanh thu thuần

Đánh giá khả năng sinh lời của doanh nghiệp. Chỉ tiêu này phản ánh một đồng doanh thu mà doanh nghiệp thực hiện trong kỳ sẽ thu được bao nhiêu đồng lợi nhuận.

(Nguồn: Tác giả tự tổng hợp)

4.2 Phƣơng pháp nghiên cứu

Trong mơ hình dự báo tín dụng khách hàng, có thể xảy ra hai lỗi sau: dự báo một khách hàng xấu là khách hàng tốt (sai lầm loại 1) và ngược lại dự báo một khách hàng tốt là khách hàng xấu (sai lầm loại 2). Để đạt được mục tiêu dự báo khả năng trả được nợ của khách hàng nhằm xác định hạng rủi ro tương ứng, nghiên cứu

xây dựng và vận dụng đồng thời mơ hình Logistic và Neural Network để có thể tối thiểu hóa xác suất mắc hai sai lầm trên.

Dựa trên nghiên cứu của Soureshjani và Kimiagari (2012) về việc vận dụng mơ hình Logistic và Neural Network để tính tốn ngưỡng xác suất trong chấm điểm tín dụng khách hàng doanh nghiệp tại một NHTM, luận văn tiến hành xây dựng mơ hình hồi quy Logistic để xác định được các biến tài chính cần thiết có ảnh hưởng đến khả năng trả nợ, đồng thời sử dụng các biến số này để tính tốn xác suất vỡ nợ và xác định vùng an tồn tín dụng của một khách hàng vay, kiểm định mức độ phù hợp thơng qua mơ hình Neural Network. Mục tiêu của mơ hình là xác định ngưỡng xác suất tốt nhất hỗ trợ q trình xếp hạng, phê duyệt tín dụng khách hàng.

Xây dựng mơ hình Logistic

Mơ hình Logistic (Maddala, 1983) là mơ hình hồi quy mà trong đó biến phụ thuộc là biến giả. Mơ hình này được ứng dụng rộng rãi trong phân tích kinh tế nói chung và rủi ro tín dụng nói riêng. Cụ thể hơn, mơ hình giúp các TCTD xác định khả năng khách hàng có rủi ro tín dụng (biến phụ thuộc) trên cơ sở sử dụng các nhân tố tác động (biến độc lập).

Mơ hình Logistics có dạng tổng qt như sau:

{

[ ]

| | |

|

Xi là biến độc lập, thể hiện các nhân tố ảnh hưởng đến khách hàng, ví dụ như giới tính, thu thập, tình trạng nhà,… đối với khách hàng cá nhân, hoặc ROE, ROA, vốn chủ sở hữu,… đối với khách hàng doanh nghiệp. Biến phụ thuộc Y là biến nhị phân, nhận giá trị 0 – khơng có nợ xấu hoặc 1 – có nợ xấu, giá trị ước lượng của Y thu được khi hồi quy Y theo các biến độc lập.

Do là phi tuyến đối với X và các tham số , vì vậy khơng thể áp dụng trực tiếp phương pháp bình phương nhỏ nhất (OLS) để ước lượng, người ta dùng ước lượng hợp lý tối đa (maximum likelihood-ML) để ước lượng β. Hàm mục tiêu của phương pháp OLS là tối thiểu tổng bình phương phần dư cịn hàm mục tiêu của phương

pháp ML là tối đa xác suất quan sát được mẫu với thuộc tính cho trước. Do Y có phân bố nhị thức, chỉ nhận một trong hai giá trị 0 và 1, nên hàm hợp lý với mẫu kích thước n có dạng sau:

L = ∏

Trong mơ hình Logistic chúng ta khơng nghiên cứu ảnh hưởng trực tiếp của biến độc lập Xi đối với Y mà xem xét ảnh hưởng của Xi đến xác suất để Y nhận giá trị bằng 1 hay kỳ vọng của Y.

p =

(với exp là là hàm e mũ)

Bài nghiên cứu đưa ra phương trình hồi quy logit có dạng: Y = β0 + β1X1 + β2X2 + .. + β10X10 + ui (1)

Hay có thể viết lại (1) dưới dạng tổng quát như sau: Y = β0 + ∑

+ ui (2)

Kiểm định Wald Test các biến với mức ý nghĩa 5% để loại bỏ các biến khơng cần thiết hoặc có mức độ ảnh hưởng khơng đáng kể. Q trình kiểm định này được thực hiện bằng phần mềm Stata.

Biến phụ thuộc Y trong mơ hình là biến định tính dạng nhị phân (chỉ nhận 2 giá trị 0 và 1) nên mục tiêu của mơ hình là ước lượng xác suất để xảy ra Y=1 hoặc Y=0. Các biến độc lập Xi sẽ ảnh hưởng đến xác suất để Y nhận giá trị bằng 0 hoặc 1, xác xuất nhận được theo mơ hình logistic như sau:

p = ∑ ∑

Xây dựng mơ hình Neural Network

Mạng Neural Network (hay được gọi mạng thần kinh nhân tạo - Artificial Neural Network) là mơ hình xử lý thơng tin được mơ phỏng dựa trên hoạt động của hệ thống thần kinh của sinh vật, giống như bộ não để xử lý thông tin, thực hiện một số nhiệm vụ nhận thức và tính tốn nhất định (Angelini và cộng sự, 2008). Những năm gần đây mơ hình Neural Network đã được nghiên cứu ứng dụng trong các ngành: điện, điện tử, kỹ thuật chế tạo, y học, quân sự và đặc biệt là trong dự báo

kinh tế. Mục đích của mơ hình là so sánh dữ liệu q khứ với dữ liệu ước lượng trong quá khứ của mơ hình để từ đó thấy được xu hướng trong tương lai. Sau khi ước lượng từ những dữ liệu trong q khứ mơ hình sẽ cho ra kết quả tương lai dự kiến.

Theo Nguyễn Khắc Hiếu và Nguyễn Thị Vân Anh (2014), trong mạng thần kinh truyền thẳng, các neuron nhân tạo được sắp xếp thành 3 lớp: lớp vào, các lớp ẩn và lớp ra. Tại lớp ẩn, tín hiệu của lớp vào sẽ được xử lý bằng một hàm kích hoạt, thường là hàm Sigmoid f(x)= 1/(1+e-x) hoặc hàm Tan-hyperbolic f(x) = (ex

- e-x)/(ex + e-x) sau đó tín hiệu sẽ được truyền qua lớp ra thông qua bộ trọng số wjk.

Từ kết quả hồi quy mơ hình Logistic ta xác định được các biến số tài chính Xi có ảnh hưởng đến khả năng trả được nợ của khách hàng, đây chính là biến đầu vào của mơ hình Neural Network.

Xi

Hình 4.1: Mơ hình Neural Network dự báo xác suất khơng thanh tốn nợ

Quá trình huấn luyện mạng được thực hiện bằng phần mềm SPSS, tham khảo tài liệu IBM SPSS Neural Networks 21. Qua q trình hồi quy, mơ hình xác định được số lớp ẩn và trọng số của các biến đầu vào. Tiến hành kiểm định mức độ phù hợp của mơ hình bằng các cơng cụ ROC, đồng thời xác định vai trò của từng chỉ tiêu tài chính trong dự báo xác suất vỡ nợ của một khách hàng vay.

Mục tiêu của mơ hình nghiên cứu là tính tốn xác suất khơng trả được nợ của từng khách hàng đồng thời xác định được ngưỡng xác suất an toàn để hỗ trợ việc ra quyết định đồng ý hoặc từ chối cấp tín dụng. Tại giá trị ngưỡng xác suất, khả năng mắc sai lầm loại 1 và loại 2 là nhỏ nhất, nghĩa là tổng giá trị Specifity và Sensitivity đạt giá trị tối đa (Soureshjani và Kimiagari, 2012). Từ kết quả hồi quy của mơ hình, luận văn tiến hành tính tốn giá trị Specifity (phần trăm dự báo khách hàng trả nợ đúng hạn) và Sensitivity (phần trăm dự báo khách hàng có nợ quá hạn) tại các mức xác suất vỡ nợ khác nhau.

Bảng 4.2: Tính tốn giá trị Specifity và Sensitivity

Giá trị Y thực tế Giá trị dự báo Y Phần trăm dự báo đúng

Y=0 Y=1

Y=0 a b Specifity = a/(a+b)

Y=1 c d Sensitivity = d/(c+d)

4.3 Kết quả nghiên cứu

4.3.1 Thống kê mô tả dữ liệu

Dữ liệu được thu thập từ báo cáo tài chính của 100 khách hàng doanh nghiệp có quan hệ tín dụng trong giai đoạn 2011-2015 với các thông số thống kê được thể hiện ở bảng sau:

Bảng 4.3: Thống kê mô tả các biến độc lập

Biến Trung bình Độ lệch

chuẩn Min Max

X1- Tỷ số thanh toán hiện thời 1.22 0.43 0.39 2.95

X2- Tỷ số thanh toán nhanh 0.62 0.41 0.10 2.31

X3- Tỷ số nợ trên tổng tài sản 0.67 0.17 0.17 0.93

X4- Tỷ số nợ trên vốn chủ sở

hữu 2.89 2.11 0.21 9.40

X5- Vòng quay tổng tài sản 1.73 1.46 0.19 6.78

X6- Vòng quay khoản phải thu 10.08 6.77 1.67 33.24

X7- Vòng quay hàng tồn kho 4.96 2.70 1.18 13.84

X8- Tỷ suất sinh lợi trên tài

sản 0.07 0.06 0.02 0.34

X9- Tỷ suất sinh lợi trên vốn

chủ sở hữu 0.41 0.29 0.06 1.28

X10- Tỷ suất sinh lợi trên

Kết quả thống kê mô tả các biến cho thấy: Đối với Nhóm chỉ tiêu thanh khoản, giá trị trung bình X1 -Tỷ số thanh tốn hiện hành của tồn bộ 100 quan sát nghiên cứu là 1.22, với độ lệch chuẩn 0.43, giá trị nhỏ nhất là 0.39 và lớn nhất là 2.95. Tương tự, giá trị trung bình của X2 -Tỷ số thanh toán nhanh là 0.62 tương ứng với độ lệch chuẩn là 0.41. X2 có giá trị nhỏ nhất là 0.1 và lớn nhất là 2.31. Trong nhóm chỉ tiêu cân nợ, X3- Tỷ số nợ trên tổng tài sản có giá trị trung bình là 0.67, tương ứng với độ lệch chuẩn là 0.17, chênh lệch giữa giá trị nhỏ nhất và giá trị lớn nhất khá lớn, lần lượt là 0.17 và 0.93. Cũng giống như X3, X4 -Tỷ số nợ trên vốn chủ sở hữu cũng rất chênh lệch: giá trị nhỏ nhất là 0.21 trong khi giá trị lớn nhất lên tới 9.4 (đây là những doanh nghiệp sử dụng địn bẩy tài chính cao), độ lệch chuẩn của biến là 2.11. Đối với nhóm chỉ tiêu về hiệu quả hoạt động: Vòng quay tổng tài sản (X5) của mẫu quan sát nhận được giá trị trung bình là 1.73 với độ lệch chuẩn là 1.46, giá trị thấp nhất 0.19, giá trị cao nhất là 6.78. Đối với X6-Vịng quay khoản phải thu có giá trị trung bình là 10.08, độ lệch chuẩn 6.77, chênh lệch giữa giá trị nhỏ nhất và giá trị lớn nhất khá lớn, lần lượt là 1.67 và 33.24. Biến X7-Vịng quay hàng tồn kho có giá trị trung bình là 4.96 với độ lệch chuẩn 2.7.

Cịn với Nhóm chỉ tiêu thu nhập: X8-Tỷ suất sinh lợi trên tài sản trung bình là 0.07, đạt mức cao nhất 0.34 trong khi mức thấp nhất chỉ có 0.02. Chỉ tiêu tiếp theo trong nhóm là Tỷ suất sinh lợi trên vốn chủ sở hữu-X9 có giá trị trung bình là 0.41, tương ứng với độ lệch chuẩn là 0.29, đạt giá trị thấp nhất tại 0.06 và đạt giá trị cao nhất tại 1.28. X10- Tỷ suất sinh lợi trên doanh thu trung bình ở mức 0.1 với độ lệch chuẩn là 0.07, mức thấp nhất 0.02, mức cao nhất đạt 0.35.

Tiếp theo, luận văn xem xét tính tương quan giữa các biến độc lập tham gia vào mơ hình. Ma trận hệ số tương quan cho biết về mức độ tương quan giữa các biến độc lập được trình bày trong Bảng 4.5. Đa cộng tuyến chỉ nghiêm trọng khi hệ số tương quan quan trên mức 0,8 (Kennedy, 2008). Nhìn chung, hệ số tương quan giữa các biến độc lập không cao (đều thấp hơn 0,8), cho thấy vấn đề đa cộng tuyến khơng nghiêm trọng, vậy ta có thể đưa tất cả các biến dự kiến ban đầu vào mơ hình.

Bảng 4.4: Ma trận hệ số tƣơng quan giữa các biến độc lập X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X1 1.0000 X2 0.7892 1.0000 X3 -0.5916 -0.5895 1.0000 X4 -0.3402 -0.4276 0.7543 1.0000 X5 0.2736 0.0979 0.0552 0.0483 1.0000 X6 0.1892 0.0617 -0.0737 -0.1005 0.4610 1.0000 X7 0.2250 0.3477 -0.2504 -0.1744 0.5973 0.3499 1.0000 X8 0.1663 0.2830 -0.2932 -0.2739 -0.3064 0.0988 -0.0916 1.0000 X9 0.0951 -0.0414 0.3436 0.2966 0.6319 0.4034 0.3306 -0.1456 1.0000 X10 0.5283 0.3863 -0.3407 -0.2743 0.6326 0.6373 0.4439 0.3186 0.4461 1.0000

4.3.2 Kết quả ƣớc lƣợng

Tiến hành ước lượng mơ hình Logistic với đầy đủ 10 biến độc lập, kiểm định Wald Test các biến với mức ý nghĩa 5% để loại bỏ các biến khơng cần thiết hoặc có mức độ ảnh hưởng khơng đáng kể, kết quả xác định các biến có ý nghĩa thống kê của mơ hình như sau:

Bảng 4.5. Kết quả ƣớc lƣợng mơ hình Logistic với đầy đủ các biến số

Biến Hệ số hồi quy P - value Số quan

sát Log likelihood P-value (Chi2) X1 -21.21 0.012 100 -13.70 0.00 X2 3.43 0.323 X3 -32.60 0.030 X4 2.35 0.018 X5 -2.41 0.097 X6 -1.45 0.002 X7 -0.83 0.128 X8 -20.45 0.237 X9 -4.59 0.498 X10 196.95 0.001 _cons 35.78 0.025

Các hệ số của X2, X7, X8, X9 có p-value lớn hơn mức ý nghĩa α, trong đó ta thấy p- value của X2, X9 khá lớn nên hệ số của nó có khả năng khơng có ý nghĩa thống kê. Để

kiểm tra điều này thực hiện kiểm định Wald test như sau:

Bảng 4.6: Kiểm định Wald Test biến X2, X9

Wald Test

H0 β2 = β9 = 0

H1 Có ít nhất 1 hệ số khác 0

Nhận xét: giá trị p-value của chi-square là 0.5298 lớn hơn mức ý nghĩa α = 5%. Ta

kết luận biến giải thích X2, X9 khơng có ý nghĩa trong mơ hình. Tiến hành loại trừ 2 biến trên và hồi quy mơ hình với các biến cịn lại, kết quả như sau:

Bảng 4.7. Kết quả ƣớc lƣợng mơ hình Logistic sau khi loại trừ X2, X9

Hệ số hồi quy P - value

Số quan sát Log likelihood P-value (Chi2) X1 -18.30 0.006 100 -14.30 0.0000 X3 -33.66 0.013 X4 2.17 0.010 X5 -3.78 0.100 X6 -1.35 0.001 X7 -0.60 0.172 X8 -26.88 0.308 X10 187.07 0.001 _cons 35.83 0.014

Nguồn: Kết quả xử lý dữ liệu từ Stata

Các hệ số của X7, X8 có p-value lớn hơn mức ý nghĩa α, tiến hành kiểm định Wald test để loại bỏ các biến trong trường hợp khơng có ý nghĩa thống kê:

Bảng 4.8: Kiểm định Wald Test biến X7, X8

Wald Test

H0 β7 = β8 = 0

H1 Có ít nhất 1 hệ số khác 0

Nhận xét: giá trị p-value của chi-square là 0.3071 lớn hơn mức ý nghĩa α = 5%. Ta

kết luận biến giải thích X7, X8 khơng có ý nghĩa trong mơ hình. Tiến hành loại trừ 2 biến X7, X8 và hồi quy mơ hình với các biến cịn lại:

Bảng 4.9: Kết quả ƣớc lƣợng mơ hình Logistic sau khi loại trừ X7, X8

Hệ số hồi quy P - value

Số quan sát Log likelihood LR Chi 2 P-value (Chi2) X1 -13.91 0.002 100 -16.23 55.47 0.00 X3 -27.03 0.008 X4 2.13 0.009 X5 -1.97 0.006 X6 -1.24 0.002 X10 144.37 0.001 _cons 22.72 0.008

Nguồn: Kết quả xử lý dữ liệu từ Stata

Từ bảng trên ta thấy hệ số prob của biến X1 = 0.002, X3= 0.008, X4= 0.009, X5= 0.006, X6= 0.002, X10= 0.001 đều nhỏ hơn 0.05. Với mức ý nghĩa 5% thì các biến này

đều có ý nghĩa thống kê. Các giá trị của hệ số hồi quy β1 =13.91, β3 =-27.03, β4 =2.13, β5 =-1.97, β6 = -1.24, β10 = 144.37 tương ứng với X1, X3, X4, X5 , X6,X10 sẽ ảnh hưởng

Một phần của tài liệu (LUẬN văn THẠC sĩ) vận dụng mô hình logistic và neural network trong xếp hạng tín dụng doanh nghiệp tại ngân hàng TMCP công thương việt nam (Trang 46)

Tải bản đầy đủ (PDF)

(95 trang)