Để tiến hành xác định tính chính xác của từng mô hình được sử dụng, bài nghiên cứu này phân tách 104 công ty thành hai tập hợp, trong đó: một tập hợp được sử dụng để chạy mô hình (gọi là tập hợp số liệu thử nghiệm – training data) và một tập hợp được sử dụng để kiểm định (gọi là tập hợp số liệu kiểm định – testing data). Với mỗi mô hình được xây dựng từ tập thử nghiệm, bài nghiên cứu sẽ tiến hành thay thế giá trị của từng biến bằng giá trị tương ứng lấy trong tập kiểm định để ra kết quả dự báo. Kết quả này sẽ được so sánh với kết quả thực tế của tập kiểm định nhằm tìm ra mức độ chính xác trong việc dự báo tình trạng kiệt quệ của từng mô hình. Bởi vì, tập kiểm định là một tập riêng biệt và không được dùng để hồi quy, nên những giá trị trong tập kiểm định sẽ không ảnh hưởng đến các hệ số được hồi quy dựa trên tập thử nghiệm. Việc phân tách này giúp xác định tính chính xác của mô hình dự báo và tránh trường hợp chính xác “ảo” bị gặp phải trong bài nghiên cứu của Tinoco, Wilson (2013) do việc giá trị của biến tác động đến các hệ số hồi
quy. Quy trình chia hai tập hợp được thực hiện như sau: Mẫu 104 công ty này sẽ được phân thành 10 phần, mỗi phần đều có các công ty khỏe mạnh và kiệt quệ với tỷ lệ bất kì, trong đó 9 phần sẽ được sử dụng như một tập thử nghiệm và phần còn lại sẽ đóng vai trò của tập kiểm định.
Bảng 3.7. Bảng mô tả quy trình phân loại số liệu và cách tính ACC
Nhóm phân loại thứ 1 Nhóm phân loại thứ 2 Nhóm phân loại thứ 3 … Nhóm phân loại thứ 10
… … … … … … … … … … Độ chính xác nhóm 1 Độ chính xác nhóm 2 Độ chính xác nhóm 3 … Độ chính xác nhóm 10
Độ chính xác trong mô hình dự báo (Accuracy - ACC) được tính như sau:
𝐴𝐶𝐶
= Độ 𝑐ℎí𝑛ℎ 𝑥á𝑐 𝑛ℎó𝑚 1 + Độ 𝑐ℎí𝑛ℎ 𝑥á𝑐 𝑛ℎó𝑚 2 + ⋯ + Độ 𝑐ℎí𝑛ℎ 𝑥á𝑐 𝑛ℎó𝑚 10
10
Ghi chú:
Dữ liệu kiểm định (Testing Data) Dữ liệu thực nghiệm (Training Data)