Mô hình hồi quy nhị phân là mô hình hồi quy đặc biệt được sử dụng trong
trường hợp biến phụ thuộc là một biến nhị phân chỉ nhận hai giá trị 0 hay 1. Mô hình hồi quy này dùng đểdự đoán xác suất xảy ra một sựviệc dựa vào thông tin của các biến độc lập trong mô hình.
Y đóng vai trò là biến phụthuộc, chỉcó hai lựa chọn 0 và 1, cụthểlà:
= 0 ô í
1 ó í
Xi là các biến độc lập, thểhiện các nhân tố ảnh hưởng khả năng bịhạn chếtín dụng, ví dụ như quan hệ tín dụng, doanh thu, lợi nhuận, đòn bẩy, khả năng thanh
là giá trị ước lượng của Y, thu được khi hồi quy Y theo các biến độc lập.
Hồi quy nhị phân có hai dạng mô hình là Logit và Probit, đây là hai dạng
khác nhau không đáng kể, nghiên cứu xác định mô hình tối ưu hơn dựa vào hiệu quảLog likelihood và chọn sửdụng mô hình Probit. Dạng của hai mô hìnhđược thể
hiện theo sơ đồsau:
Giả định mô hình hồi quy nhịphân có dạng:
P(Y=1|X) = Φ(X’ )
Với P là xác suất, Φ là hàm phân phối tích lũy (CDF) của phân phối chuẩn tiêu chuẩn. Các hệ số thường được ước tính bằng phương pháp tối đa hóa khả năng
(maximum likelihood).
Giảsửtồn tại một biến ngẫu nhiên Y*:
Y* = X’ + ε
Với ε ~ N(0,1). Khi đó Y được xem là dựbáo của biến Y* là dương: Y = 1 nếu Y* > 0 và Y = 0 nếu ngược lại
Kết quảnày xuất phát từbiến đổi như sau: P(Y=1|X) = P(Y* > 0) = P(X’ + ε > 0) = P(ε >-X’ )
= P(ε < X’ ) = Φ(X’ )
Để xác định xác suất doanh nghiệp bị hạn chếtín dụng, ta cần ước lượng các hệsố . Hàm xác suất trên gọi là hàm Probit. Do Y là phi tuyến đối với các tham số
X, chúng ta không thể áp dụng phương pháp bình phương nh ỏ nhất (OLS). Trong
trường hợp này chúng ta dùng phương pháp ước lượng hợp lý tối đa (maximum likelihood) để ước lượng . Ngày nay, phương pháp ước lượng các hệ số đãđư ợc tự động quá dựa trên một số phần mềm kinh tế lượng như Eview, Stata… Trong
nghiên cứu, chúng ta có thể bỏ đi một số biến mà vai trò giải thích cho biến Y
không đủ ý nghĩa thống kê nhằm tránh hiện tượng các biến độc lập có đa cộng tuyến làm sai lệch kết quảmô hình.
Sau khi ước lượng được các hệsố , cần tiến hành một sốkiểm định để đánh
giá mức độphù hợp của mô hình. Do mô hình sửdụng dữliệu chéo, không có chuỗi thời gian nên những kiểm định cần có là:
_ Kiểm định các biến đều phù hợp, không đưa biến không có ý nghĩa vào mô hình cũng như không bịthiếu biến. Đểkiểm định chúng ta dùng Wald test.
_ Kiểm định tính ngẫu nhiên của phần dư, các sai số thu được từmô hình ước lượng so với giá trịthực tếphải là sai sốngẫu nhiên và kiểm định định dạng đúng của mô hình. Nghiên cứu sửdụng phần mềm Eview đểhỗtrợcác kiểm định này.
Ngoài ra chúng ta còn kiểm tra tính chính xác của kết quả dự báo của mô hình. Do biến Y chỉ nhận giá trị 1 hoặc 0, người ta đưa vào một ngưỡng xác suất để
xếp doanh nghiệp vào 1 hoặc 0 tương ứng với bị hạn chế tín dụng và không bị hạn chếtín dụng. Ngưỡng xác suất thường là 0.5, tức là nếu xác suất của biến phụthuộc từ0.5 trởlên, thì doanh nghiệp được xếp vào bịhạn chếtín dụng.Ngược lại nếu xác suất của biến phụthuộc nhỏ hơn 0.5 thì doanh nghiệp được xếp vào nhóm không bị
hạn chế tín dụng. Sau đó so sánh việc xếp loại doanh nghiệp này với thực tế xem mức độchính xác của kết quảdựbáo là bao nhiêu.