Sau khi xác định được mô hình hồi quy, bước tiếp theo tác giả thực hiện các kiểm định đánh giá mức độ phù hợp của mô hình hồi quy. Có hai phương pháp để giải quyết vấn đề trên, thứ nhất là phương pháp đo lường mức độ phù hợp của các biến giải thích đối với biến phụ thuộc hay còn gọi là đo lường sức mạnh dự báo
(Measures of predictive power); thứ hai là phương pháp đánh giá mức độ phù hợp của mô hình hồi quy với dữ liệu (Goodness of fit tests).
Đo lường sức mạnh dự báo (Measures of predictive power):
Sử dụng AUC (Area Under the ROC Curve): AUC (Area Under the ROC Curve) là vùng diện tích vùng từ dưới đường ROC cho đến điểm có tọa độ (1,0) ở góc phải của đồ thị. Altman và các cộng sự (2010) đã cho rằng “vùng dưới đường cong ROC (AUC) là một công cụ đo lường mức độ chính xác trong dự báo của mô hình, với giá trị bằng 1 đại diện cho một mô hình hoàn hảo”. Hay nói cách khác, nếu đường ROC càng gần điểm (0,1) ở góc trái của đồ thị thị khả năng dự báo của mô hình càng tốt. Kiểm định phi tham số Mann – Whitney được sử dụng nhằm xem xét sự khác nhau giữa các giá trị AUC có thực sự khác nhau về mặt thống kê giữa các mô hình hay không.
Sử dụng hệ số phân loại Gini: Theo Anderson (2007), hệ số Gini được các nhà phân tích đưa vào sử dụng như một công cụ để đo lường ―một bảng phân loại có thể phân biệt giữa các quan sát tốt và các quan sát xấu hiệu quả đến mức độ nào. Hệ số Gini được tính theo công thức (2*AUC – 1). Một mô hình lý tưởng, tức là một mô hình phân loại hoàn hảo các quan sát tốt và các quan sát xấu, có hệ số Gini bằng 1.
Sử dụng R-Squared: đây là thước đo mức độ phù hợp của hàm hồi quy, nó cho biết phần trăm tổng biến thiên của biến phụ thuộc được giải thích bởi biến giải thích. R-Squared được sử dụng trong việc lựa chọn các mô hình dự báo dựa trên cùng một tập dữ liệu.Trong luận văn, tác giả sẽ tiến hành so
sánh các giá trị R-Squared nhằm củng cố hơn cho những kết luận suy ra từ hai giá tri AUC và hệ số phân loại Gini.
Đo lường mức độ phù hợp của mô hình (Goodness of fit tests): Phương pháp Hosmer-Lemeshow được sử dụng để kiểm định sự phù hợp của mô hình. Phương pháp này so sánh mức độ khớp giữa giá trị tiên đoán và giá trị quan sát, nếu 2 giá trị càng khớp thì mô hình sẽ càng phù hợp, các thống kê được tính theo phương pháp chi bình phương Pearson. Giả thuyết H0 trong kiểm định này là giá trị quan sát bằng giá trị mong đợi do vậy mô hình được đánh giá là phù hợp nếu có giá trị p-value lớn (p-value > 0.05).