Điểm số F1 (F1-score)

Một phần của tài liệu (LUẬN văn THẠC sĩ) lựa chọn mô hình dự báo xác suất vỡ nợ của doanh nghiệp vừa và nhỏ tại các ngân hàng thương mại viêt nam dựa trên các chỉ số tài chính (Trang 46)

Điểm số F1-score được đưa ra nhằm khắc phục nhược điểm của việc đánh giá mức độ tin cậy của mô hình dựa trên các nhóm chỉ số được xây dựng dựa trên ma trận Confussion. Trong các bài toán phân loại các công ty thuộc lớp phá sản hoặc không phá sản, bộ dữ liệu được sử dụng để xây dựng và kiểm định mô hình thường có sự phân bố không đồng đều, trong trường hợp này dữ liệu về các công ty không phá sản sẽ chiếm một tỷ lệ lớn hơn rất nhiều so với dữ liệu của các công ty phá sản, từ đó dẫn đến các tỷ lệ sensitivity và tỷ lệ precision thường bị lệch và cho kết quả dự báo không thật sự chính xác. Vì vậy, điểm số F1 được đưa ra, nó là chỉ số được xây dựng dựa trên việc đánh giá đồng thời giữa 2 nhóm tỷ lệ sensitivity và precision, từ đó dẫn đến kết quả đánh giá tính hiệu quả của các mô hình xếp hạng sẽ cho kết quả đáng tin cậy hơn.

Điểm số F1 hay còn gọi là F-measure được xác định bởi công thức như sau:

F1 Score = 2 * (Precision*Sensitivity) / (Precision + Sensitivity)

Điểm số F1 càng tiệm cận với giá trị là 1 thì mức độ chính xác và hiệu quả của mô hình xếp hạng tín nhiệm càng cao và đáng tin cậy.

Kết luận chương 3: Chương này tác giả đã trình bày chi tiết nội dung của mô hình nghiên cứu – mô hình dự báo xác suất vỡ nợ được đề xuất, mô tả chi tiết các dữ liệu đã thu thập và các phương pháp nghiên cứu được sử dụng để cho thấy mức độ tin cậy của kết quả nghiên cứu được trình bày ở chương tiếp theo. Mô hình dự báo xác suất vỡ nợ được đề xuất sử dụng bao gồm mô hình tham số (với các mô hình logit, probit, complementary log-log) và mô hình phi tham số (gồm mô hình cây quyết định decision tree, mô hình random forest).

CHƯƠNG 4: KẾT QUẢ NGHIÊN CỨU 4.1 Kết quả thống kê mô tả

Bảng 4.1: Thống kê mô tả các biến độc lập Biến

độc lập Chỉ số tài chính Mean Median Min Max X1 Lợi nhuận gộp/Doanh thu thuần (%) -0.017 0.102 -5.818 0.897

X2 Thu nhập trước thuế/Doanh thu

thuần (%) -1.334 0.016 -12.558 9.208

X3 Thu nhập trước thuế/Tổng tài sản

(%) -0.003 0.005 -0.483 0.311

X4 Thu nhập trước thuế/Vốn chủ sở

hữu (%) -0.240 0.043 -20.215 16.667 X5 Tổng nợ phải trả/Tổng tài sản (%) 0.706 0.728 0.010 3.769 X6 Tổng nợ phải trả/Vốn chủ sở hữu (%) 9.546 2.266 -163.476 224.405 X7 Tài sản ngắn hạn/Nợ ngắn hạn (lần) 1.574 1.148 0.072 19.663 X8 (Tài sản ngắn hạn – Hàng tồn kho)/Nợ ngắn hạn (lần) 1.033 0.722 3.612 19.663

X9 Lợi nhuận trước thuế và lãi vay/Lãi

vay (lần) -46.372 1.396 -1546 1681.384

X10 Thu nhập trước thuế, lãi vay và

khấu hao/Nợ dài hạn(lần) 9.782 0.111 -6.065 1821.081

X11 Tiền, các khoản tương đương

tiền/Vốn chủ sở hữu (lần) 1.006 0.101 -10.749 173.189

X12 Giá vốn hàng bán/Hàng tồn kho

bình quân (vòng) 89.43 1.766 1.391 348

X13 Các khoản phải thu/Doanh thu bình

quân (lần) 0.694 0.923 0.003 5.189

Bảng 4.1 mô tả giá trị của 14 biến độc lập thông qua giá trị trung bình, trung vị, giá trị nhỏ nhất và lớn nhất giúp chúng ta hiểu khái quát về bộ dữ liệu được sử dụng để xây dựng các mô hình dự báo xác suất vỡ nợ.

Ma trận tương quan giữa các biến trong mô hình

Bảng 4.2: Ma trận tương quan X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 Loan Status X1 1.00 X2 0.40 1.00 X3 0.48 0.69 1.00 X4 0.28 0.35 0.60 1.00 X5 -0.27 -0.15 -0.39 -0.32 1.00 X6 -0.16 -0.04 -0.23 -0.62 0.59 1.00 X7 0.29 0.37 0.44 0.27 -0.64 -0.28 1.00 X8 0.17 0.28 0.48 0.28 -0.70 -0.36 0.72 1.00 X9 0.30 0.37 0.46 0.29 -0.23 -0.18 0.37 0.32 1.00 X10 0.25 0.25 0.49 0.27 -0.34 -0.19 0.34 0.43 0.57 1.00 X11 -0.12 0.10 0.14 -0.10 0.32 0.40 -0.07 -0.09 0.13 0.11 1.00 X12 -0.01 0.09 0.38 0.18 -0.37 -0.18 0.18 0.50 0.18 0.29 0.02 1.00 X13 -0.13 -0.62 -0.40 -0.19 0.08 0.00 -0.10 0.00 -0.36 -0.21 -0.19 -0.06 1.00 X14 -0.06 0.42 0.53 0.29 0.01 -0.05 0.06 0.14 0.35 0.29 0.31 0.25 -0.50 1.00

Bảng 4.2 cho thấy mối quan hệ giữa các biến trong mô hình dự báo xác suất vỡ nợ, trong ma trận tương quan trên có cặp biến độc lập có mức độ tương quan cao. Ví dụ: (i) biến X7 và X8: mức độ tương quan là 0,72; (ii) biến X2 và X3: mức độ tương quan là 0,69; (iii) biến X5 và X8: mức độ tương quan là - 0,70. Tuy nhiên, các mức độ tương quan này đều nhỏ hơn 0,8, do đó hiện tượng đa cộng tuyến giữa các biến trong mô hình có thể không tác động quá lớn đến kết quả hồi quy của mô hình.

4.2. Kết quả hồi quy

4.2.1 Kết quả hồi quy của các mô hình tham số

Bảng 4.3: Kết quả hồi quy của các mô hình tham số

Logit Model Probit Model

Complementary Log - Log Model

Coefficients: Estimate Std. Error Estimate Std. Error Estimate Std. Error (Intercept) -4.853 5.659 -2.818 3.054 -2.348 4.112 X1 -1.446 5.659 -1.366 3.206 -1.505 4.047 X2 -1.717 2.909 -1.101 1.483 -1.038 2.013 X3 -71.83 * 37.327 -4.10 ** 1.974 -50.03 ** 24.00 X4 -1.057 2.260 -6.389 1.273 -0.136 1.621 X5 12.35 * 6.370 6.79 ** 3.270 7.98 ** 3.938 X6 0.103 0.084 6.298 4.921 0.079 0.066 X7 -4.250 2.913 -2.302 1.481 -3.136 2.251 X8 3.600 4.543 2.062 2.399 0.798 3.143 X9 -0.281 0.399 -1.424 2.116 -0.283 0.320 X10 -27.47 * 14.783 -1.50 ** 7.554 -14.91 * 8.087 X11 -2.841 2.781 -1.669 1.552 -2.510 2.030 X12 0.731** 0.354 3.95 ** 1.783 0.681 0.269 X13 -0.002 0.003 -9.152 1.454 -0.000 0.001 X14 -8.827 ** 4.288 -4.76 ** 2.133 -7.453 3.052 Signif. codes: ‘***’ 0.01 ‘**’ 0.05 ‘*’ 0.1

Kết quả hồi quy cho thấy rằng, trong cả 3 mô hình dự báo xác suất vỡ nợ, các biến độc lập Lợi nhuận gộp/Doanh thu thuần (X1), Thu nhập trước thuế/Doanh thu thuần (X2), Thu nhập trước thuế/Tổng tài sản (X3), Thu nhập trước thuế/Vốn chủ sở hữu (X4), Tài sản ngắn hạn/Nợ ngắn hạn (X7), Lợi nhuận trước thuế và lãi vay/Lãi vay (X9), Thu nhập trước thuế, lãi vay và khấu hao/Nợ dài hạn (X10), Tiền và các khoản tương đương

tiền/Vốn chủ sở hữu (X11), Các khoản phải thu/Doanh thu bình quân (X13), Tổng doanh thu/Tổng tài sản (X14) có sự biến động ngược chiều với biến phụ thuộc. Sự biến động này phù hợp với các kỳ vọng về dấu của các biến độc lập được trình bày trong bảng 3.3. Tuy nhiên trong các biến độc lập trên, biến X13 có mức độ ảnh hưởng không thực sự rõ ràng với các hệ số đo được trong mô hình logit và mô hình complementary log-log lần lượt là – 0,002 và – 0,000. Ngược lại, các biến X3, X10 và X14 có mức độ ảnh hưởng khá lớn đến kết quả dự báo khả năng vỡ nợ của doanh nghiệp với các hệ số đo được rất lớn lần lượt là – 71,83; – 27,47 và – 8,827.

Điều này cho thấy rằng, nếu một doanh nghiệp có lợi nhuận gộp và thu nhập trước thuế đạt giá trị càng lớn trên doanh thu thuần và vốn chủ sở hữu tức là khả năng tạo ra lợi nhuận của doanh nghiệp càng lớn thì khả năng phá sản của doanh nghiệp đó càng thấp. Thêm nữa, chỉ số thanh toán hiện hành càng cao tức là tỷ lệ tài sản ngắn hạn trên nợ ngắn hạn càng lớn, đồng thời doanh nghiệp đó nắm giữ lượng tiền mặt trong công ty càng nhiều thì khả năng phá sản của doanh nghiệp đó càng thấp. Khả năng trả lãi vay được đo lường bởi tỷ lệ lợi nhuận trước thuế và lãi vay trên lãi vay chiếm tỷ lệ càng lớn thì xác suất phá sản của doanh nghiệp đó cũng sẽ giảm. Ngoài ra, vòng quay tổng tài sản càng lớn, tức là doanh nghiệp đó sử dụng các tài sản trong doanh nghiệp càng hiệu quả thì khả năng vỡ nợ của doanh nghiệp càng có xu hướng giảm.

Các biến độc lập Tổng nợ phải trả/Tổng tài sản (X5), Tổng nợ phải trả/Vốn chủ sở hữu (X6), (Tài sản ngắn hạn – Hàng tồn kho)/Nợ ngắn hạn (X8) và Giá vốn hàng bán/Hàng tồn kho bình quân (X12) biến động cùng chiều với biến phụ thuộc. Sự biến động cùng chiều này phù hợp với các kỳ vọng về dấu của các biến độc lập được dự báo trong các nghiên cứu trước đây. Trong đó, biến X5 có mức độ tác động lớn đến kết quả của mô hình dự báo xác suất vỡ nợ với các hệ số đo được trong mô hình logit, mô hình probit và mô hình complementary log-log lần lượt là 12,35; 6,79 và 7,98. Ngược lại, biến X6 có mức độ ảnh hưởng yếu hơn với hệ số đo được khá thấp lần lượt là 0,079 và 0,103.

Thông qua kết quả hồi quy có thể thấy một doanh nghiệp nếu sử dụng nợ vay càng nhiều thì khả năng tự chủ tài chính càng thấp, áp lực tài chính càng lớn dẫn đến khả năng phá

sản càng cao. Bên cạnh đó, việc quản lý hàng tồn kho cũng đóng vai trò hết sức quan trọng đến hiệu quả sinh lời của doanh nghiệp. Đặc biệt, các doanh nghiệp sản xuất phải luôn tồn trữ một lượng hàng hóa nhất định để đảm bảo việc sản xuất được diễn ra liên tục và giảm thiểu thiệt hại do biến động giá nguyên vật liệu.

Trong mô hình logit, có 5 trong số 14 biến độc lập có ý nghĩa thống kê, bao gồm các biến X3, X5, X10, X12 và X14; trong đó biến X12 và X14 có ý nghĩa thống kê tại mức 5%, các biến còn lại có ý nghĩa thống kê tại mức 10%. Do đó, xác suất vỡ nợ được ước lượng theo mô hình logit có thể được thể hiện như sau:

P(𝑌𝑖 = 1)= 𝑒

𝑌 ̂

1+𝑒𝑌̂= exp(−4,853−71,83𝑋3+12,35𝑋5− 27,47𝑋10+0,731𝑋12−8,847𝑋14)

1+ exp(−4,853−71,83𝑋3+12,35𝑋5− 27,47𝑋10+0,731𝑋12−8,847𝑋14)

Trong mô hình probit, 5 biến X3, X5, X10, X12 và X14 cũng là 5 trong số14 biến độc lập có ý nghĩa thống kê và toàn bộ đều có ý nghĩa thống kê tại mức 5%.Xác suất vỡ nợ được ước lượng theo mô hình probit có thể được thể hiện như sau:

P(𝑌𝑖 = 1) = ∫−∞− 2,818−4,10𝑋3+6,79𝑋5−1,50𝑋10+3,95𝑋12−4,76𝑋14√2𝜋1 𝑒𝑡22𝑑𝑡

Tuy nhiên, trong mô hình complementary log-log, chỉ có 3 trong số 14 biến độc lập có ý nghĩa thống kê, bao gồm các biến X3, X5 và X10; trong đó biến X10 có ý nghĩa thống kê tại mức 10%, hai biến còn lại có ý nghĩa thống kê tại mức 5%. Xác suất vỡ nợ được ước lượng theo mô hình complementary log-log có thể được thể hiện như sau:

F(−2,348 − 50,03𝑋3+ 7,98𝑋5− 14,91𝑋10) = 1−exp(−exp(−2,348 − 50,03𝑋3+ 7,98𝑋5− 14,91𝑋10))

Ma trận Confussion của mô hình tham số

Bảng 4.4: Ma trận Confussion của mô hình logit Logit Model Predicted class

Actual class Non-default Default Non-default 208 56 Default 18 68 Accuracy = 0.7886 Sensitivity = 0.8095 Specificity = 0.7879 Precision = 0.5484 F1 – Score = 0.6538

Bảng 4.5: Ma trận Confusion của mô hình probit Probit Model Predicted class

Actual class

Classes Non-default Default

Non-default 218 46 Default 18 68 Accuracy = 0.8171 Sensitivity = 0.8095 Specificity = 0.8258 Precision = 0.5965 F1 – Score = 0.6869

Bảng 4.6: Ma trận Confusion của mô hình Complementary log-log cloglog Model Predicted class

Actual class

Classes Non-default Default

Non-default 180 84 Default 12 74 Accuracy = 0.7257 Sensitivity = 0.8605 Specificity = 0.6818 Precision = 0.4684 F1 – Score = 0.6066

Thông qua bảng ma trận confusion của ba mô hình dự báo xác suất vỡ nợ tham số nêu trên, ta có thể đưa ra một vài nhận xét như sau:

 Accuracycủa mô hình probit là cao nhất, tương ứng với tỷ lệ chính xác là 0,8171. Điều này cho thấy rằng khả năng mô hình probit phân biệt được những công ty phá sản và không phá sản chính xác lên đến 81,71%.

 Sensitivity của mô hình complementary log-log đạt 0,8605 – cao nhất trong ba mô hình, cho thấy mô hình này có khả năng phát hiện trường hợp các công ty phá sản chính xác lên đến 86,05%.

 Specificitycủa mô hình probit là cao nhất, tương ứng với tỷ lệ chính xác là 0,8258, cho thấy mô hình này có khả năng phát hiện trường hợp các công ty không bị phá sản chính xác lên đến 82,58%.

 Mặc dù các mô hình có sự khác nhau về Accuracy, Sensitivity, Specificity hay Precision, nhưng nhìn chung mô hình probit mang lại kết quả tốt nhất khi có F1 Score đạt giá trị cao nhất, tương ứng với mức độ dự báo chính xác là 68,69%.

4.2.2 Kết quả hồi quy của mô hình phi tham số

Hình 4.1: Kết quả hồi quy của mô hình cây quyết định (Decision Tree)

Thông qua kết quả hồi quy của mô hình cây quyết định ta có thể thấy rằng mô hình này sử dụng ba biến X9, X4 và X8 để dự báo xác suất vỡ nợ của doanh nghiệp. Khả năng dự báo xác suất vỡ nợ qua ba biến độc lập trên được thực hiện thông qua các bước như sau:

- Bước 1: Sử dụng biến độc lập X9 để phân tách thành hai nhóm: phá sản và không phá sản. Nếu X9≥ 0,55 thì kết luận doanh nghiệp đó rơi vào trường hợp 78% các công ty có khả năng không bị phá sản. Ngược lại, thì xem xét đến bước tiếp theo. - Bước 2: Nếu X9 < 0,55 và X4 < - 0,18 thì doanh nghiệp rơi vào nhóm 12% công ty

- Bước 3: Nếu X9 < 0,55 và X4 ≥ - 0,18 và X8 < 0,34 thì doanh nghiệp rơi vào nhóm 3% các công ty có khả năng phá sản. Ngược lại X8 ≥ 0,34 thì doanh nghiệp rơi vào nhóm 7% các công ty có khả năng không bị phá sản.

Bảng 4.7: Ma trận Confusion của mô hình cây quyết định (Decision Tree) Decision Tree Predicted class

Actual class

Classes Non-default Default

Non-default 251 13 Default 41 45 Accuracy = 0.8457 Sensitivity = 0.5232 Specificity = 0.9508 Precision = 0.7759 F1 – Score = 0.6250

Hình 4.2: Kết quả của mô hình Random Forest

0 200 400 600 800 1000 0. 1 0. 2 0. 3 0. 4 random_forest_model trees E rro r

Bảng 4.8: Ma trận Confusion của mô hình Random forest Random Forest Predicted class

Actual class

Classes Non-default Default

Non-default 254 10 Default 28 58 Accuracy = 0.8914 Sensitivity = 0.6744 Specificity = 0.9621 Precision = 0.8529 F1 – Score = 0.7532

Thông qua bảng ma trận confusion của hai mô hình dự báo xác suất vỡ nợ phi tham số gồm mô hình cây quyết định và mô hình random forest, ta có thể nhận thấy rằng mô hình random forest mang lại kết quả tốt hơn khi tất cả chỉ số Accuracy, Sensitivity, Specificity, Precision và F1 – Score đều cao hơn so với mô hình cây quyết định. Điều đó cho thấy sự vượt trội của mô hình random forest so với mô hình cây quyết định.

Kết luận chương 4: Chương này tác giả đã thực hiện phân tích kết quả hồi quy từ các mô hình tham số và phi tham số, đồng thời dựa trên các chỉ tiêu được tính toán từ ma trận confusion (Accuracy, Sensitivity, Specificity, Precision, F1 - Score) để so sánh và đánh giá khả năng dự báo xác suất vỡ nợ của từng mô hình. Qua đó tìm ra mô hình phù hợp để dự báo xác suất vỡ nợ của các doanh nghiệp.

CHƯƠNG 5: KẾT LUẬN

Toàn bộ kết quả nghiên cứu của đề tài đã được đề cập trong chương 4 của luận văn, theo đó tác giả đã tìm được câu trả lời cho ba câu hỏi nghiên cứu được đề cập trong chương 1.

- Để giải quyết câu hỏi thứ nhất, tác giả đã sử dụng 14 biến độc lập tương ứng với 14 chỉ số tài chính quan trọng của doanh nghiệp để xác định khả năng vỡ nợ của các khách hàng. Kết quả tìm thấy trong mô hình tham số, 5 biến đóng vai trò quan trọng trong việc dự báo xác suất vỡ nợ của khách hàng, đó là các biến Thu nhập trước thuế/Tổng tài sản (X3), Tổng nợ phải trả/Tổng tài sản (X5), Thu nhập trước thuế, lãi vay và khấu hao/Nợ dài hạn (X10), Giá vốn hàng bán/Hàng tồn kho bình quân (X12) và Tổng doanh thu/Tổng tài sản (X14). Trong khi đó, mô hình phi tham số lại cho thấy 3 biến gồm Lợi nhuận trước thuế và lãi vay/Lãi vay (X9), Thu nhập

Một phần của tài liệu (LUẬN văn THẠC sĩ) lựa chọn mô hình dự báo xác suất vỡ nợ của doanh nghiệp vừa và nhỏ tại các ngân hàng thương mại viêt nam dựa trên các chỉ số tài chính (Trang 46)

Tải bản đầy đủ (PDF)

(66 trang)