Ta tiến hành kiểm định dựa trên mẫu đầy đủ bao gồm 104 công ty ở 2 thời kỳ t-1 và t- 2. Xét tập biến được lọc từ lý thuyết NSS:
Bảng dưới trình bày thống kê tính vững cho mô hình ở cả t-1 và t-2, bao gồm AUC, hệ số tương quan xếp hạng Gini, kiểm định log-likelihood, thống kê Pearson chi- square.
Bảng 4.17. Bảng thống kê tính vững cho mô hình thời kỳ t-1, t-2 dựa trên cách chọn biến NTH.
Biến số Thời điểm t-1 Thời điểm t-2
AUC 0.7791 0.9570
Hệ số GINI 0.7642 0.9140
Cox & Snell’s 𝑅2 0.5720 0.5550 Nagelkerke 𝑅2 0.6220 0.6170 Prob>Chi2 0.0000 0.8595
Số quan sát 104 104
Bảng trên thống kê tính vững của bộ lọc NTH trong 2 thời kỳ t-1 và t-2 Trong đó:
AUC (Area Under the ROC Curve) được sử dụng để kiểm định tính vững của mô hình và bằngvới tỷ lệ diện tích khu vực nằm dưới đường cong ROC, AUC có giá trị bằng 1 thể hiện sự hoàn hảo của mô hình.Trong hồi quy, giá trị AUC > 70% được coi là có tính chính xác cao trong việc dự báo.
Hệ số GINI được xây dựng gần giống với AUC, được tính bằng cách lấy phần diện tích nằm giữa đường cong ROC và đường bình đẳng tuyệt đối (đường góc 45°) chia cho phần diện tích nằm dưới đường bình đẳng tuyệt đối, hệ số GINI > 50% là tốt cho mô hình dự báo.
Cox & Snell’s R2và Nagelkerke R2là hai phương pháp cải tiến dựa trên kiểm định log-likelihood của mô hình, với giá trị kỳ vọng trong khoảng [0,1], trong khi đó kiểm định Chi-bình phương được coi là tốt khi có p > 0,05
Ta thấy trong bảng trên, ở cả 2 thời điểm t-1 và t-2 thì AUC đều lớn hơn 70%, hệ số Gini đều lớn hơn 50%, các kiểm định 𝑹𝟐cho giá trị cao (72,2% ở thời kỳ t-1 và 76.8% ở thời kỳ t-2) chứng tỏ mô hình chạy từ các biến NTH có tính dự báo cao.
Làm tương tự với các biến lấy từ lý thuyết TSS, ta có bảng thống kê như sau:
Bảng 4.18. Bảng thống kê tính vững cho mô hình thời kỳ t-1, t-2 dựa trên bô lọc TSS.
Biến số Thời điểm t-1 Thời điểm t-2
AUC 0.9534 0.9421
Hệ số GINI 0.9068 0.8842
Cox & Snell’s 𝑅2 0.5420 0.5350
Nagelkerke 𝑅2 0.7220 0.7130
Prob>Chi2 0.0000 0.8595
Số quan sát 104 104
Bảng trên thống kê tính vững của bộ lọc TSS trong 2 thời kỳ t-1 và t-2 Trong đó:
AUC (Area Under the ROC Curve) được sử dụng để kiểm định tính vững của mô hình và bằngvới tỷ lệ diện tích khu vực nằm dưới đường cong ROC, AUC có giá trị bằng 1 thể hiện sự hoàn hảo của mô hình.Trong hồi quy, giá trị AUC > 70% được coi là có tính chính xác cao trong việc dự báo.
Hệ số GINI được xây dựng gần giống với AUC, được tính bằng cách lấy phần diện tích nằm giữa đường cong ROC và đường bình đẳng tuyệt đối (đường góc 45°) chia cho phần diện tích nằm dưới đường bình đẳng tuyệt đối, hệ số GINI > 50% là tốt cho mô hình dự báo.
Cox & Snell’s R2và Nagelkerke R2là hai phương pháp cải tiến dựa trên kiểm định log-likelihood của mô hình, với giá trị kỳ vọng trong khoảng [0,1], trong khi đó kiểm định Chi-bình phương được coi là tốt khi có p > 0,05
Ta thấy trong bảng trên, ở cả 2 thời điểm t-1 và t-2 thì AUC đều lớn hơn 70%, hệ số Gini đều lớn hơn 50%, các kiểm định 𝑹𝟐cho giá trị cao (72,2% ở thời kỳ t-1 và 76.8% ở thời kỳ t-2) chứng tỏ mô hình chạy từ các biến TSS có tính dự báo cao. Làm tương tự với các biến lấy từ lý thuyết TSS, ta có bảng thống kê như sau:
Bảng 4.19. Bảng thống kê tính vững cho mô hình thời kỳ t-1, t-2 dựa trên cách chọn biến từ bộ lọc biến NSS.
Biến số Thời điểm t-1 Thời điểm t-2
AUC 0.9674 0.9570
Hệ số GINI 0.9348 0.9140
Nagelkerke 𝑅2 0.802 0.768
Prob>Chi2 0.9935 0.8993
Số quan sát 104 104
Bảng trên thống kê tính vững của bộ lọc NSS trong 2 thời kỳ t-1 và t-2 Trong đó:
AUC (Area Under the ROC Curve) được sử dụng để kiểm định tính vững của mô hình và bằngvới tỷ lệ diện tích khu vực nằm dưới đường cong ROC, AUC có giá trị bằng 1 thể hiện sự hoàn hảo của mô hình.Trong hồi quy, giá trị AUC > 70% được coi là có tính chính xác cao trong việc dự báo.
Hệ số GINI được xây dựng gần giống với AUC, được tính bằng cách lấy phần diện tích nằm giữa đường cong ROC và đường bình đẳng tuyệt đối (đường góc 45°) chia cho phần diện tích nằm dưới đường bình đẳng tuyệt đối, hệ số GINI > 50% là tốt cho mô hình dự báo.
Cox & Snell’s R2và Nagelkerke R2là hai phương pháp cải tiến dựa trên kiểm định log-likelihood của mô hình, với giá trị kỳ vọng trong khoảng [0,1], trong khi đó kiểm định Chi-bình phương được coi là tốt khi có p > 0,05
Tương tự như NTH và TSS ta thấy mô hình hồi quy từ các biến NSS cũng đưa ra kết quả kiểm định vững. Từ đó, các kết quả kiểm định cho thấy khả năng dự báo chính xác cao của mô hình. So sánh AUC và hệ số Gini của 3 mô hình, ta có bảng so sánh như sau:
Bảng 4.20. Bảng so sánh hệ số AUC và Gini theo 2 thời kỳ t-1 và t-2 dựa trên 3 bộ lọc NTH, TSS và NSS.
Biến số NTH(t-1) TSS (t-1) NSS (t-1) NTH(t-2) TSS (t-2) NSS(t-2)
AUC 0.7791 0.9534 0.9674 0.7202 0.9421 0.9570
Hệ số Gini 0.7642 0.9068 0.9348 0.8240 0.8842 0.9140 Bảng trên so sánh hê số AUC và Gini theo 3 bộ lọc NTH, TSS và NSS trong thời kỳ t-1, t-2.
Hình 4.1. Đường cong ROC của NTH, TSS và NSS trong t-1.
Hình 4.2. Đường cong ROC của NTH, TSS và NSS trong t-2.
Ta thấy cả AUC và hệ số Gini ở trong hai thời kỳ t-1 và t-2 của NSS đều lớn hơn so với các giá trị của NTH và TSS. Điều này cho thấy bộ lọc NSS cải tiến đã cho ra được những biến số mang ý nghĩa tốt hơn trong việc dự báo so với cách chọn biến NTH và TSS. Điều này cũng đúng với kì vọng của bài nghiên cứu.