Mô hình cơ sở cơ sở được tác giả lựa chọn để phân tích là mô hình hồi quy Binary Logistic. Hồi quy Binary Logistic sử dụng biến phụ thuộc dạng nhị phân để ước lượng xác suất một sự kiện sẽ xảy ra với những thông tin của biến độc lập mà ta có được. Thông tin chúng ta cần thu thập về biến phụ thuộc là một sự kiện nào đó xảy ra hay không, biến phụ thuộc Y lúc này có hai giá trị 0 và 1, với 0 là không xảy ra sự kiện ta quan tâm và 1 là có xảy ra, và tất nhiên là thông tin về các biến độc lập X.
Giả sử biến Y phụ thuộc vào chỉ số khả dụng Y*.
Trong đó:
Y* = β1 + β2X2i+…+ βkXki + ϵ i
Vì Y(x) là biến nhị phân có thể giải thích như sau:
Yi = 1 / Xi
Trong đó Pi = P (Yi=1/Xi), khi đó Yi là biến ngẫu nhiên phân phối theo quy luật Bernoulli, có nghĩa là fi(Yi) = PiYi (1-Pi)(1-Yi) trong đó Yi = 0,1,…,n. Khi đó, kỳ vọng toán và phương sai được tính như sau: E(Yi) = niPi, Var (Yi) = niPi(1-Pi). Vì Yi
là biến ngẫu nhiên theo quy luật Bernoulli nên có thể viết lại như sau:
Tỷ lệ chênh lệch: odds = Pi / (1 - Pi)
Pi = P(Yi = 1)
Pi = P(Yi*>0)
Pi = P(β1 + β2X2 + … + βkXk + ϵ i> 0) Pi = P(ε < (βi + ))
Mở rộng hơn nữa ta có thể viết như sau:
Trong mô hình trên Pi không phải hàm tuyến tính của các biến độc lập. Phương trình trên gọi là hàm phân bố Binary Logistic. Trong hàm này khi Xi nhận các giá trị từ -∞ đến +∞ thì Pi nhận giá trị từ 0 – 1.
Nếu kí hiệu:
β = ( β1 β2 β3 .. . βk ) X = ( X1 X2 X3 .. . Xk ) Khi đó chúng ta có β’X = β1 + β2X2i+…+ βkXki và
Để ước lượng β có thể sử dụng các phần mềm như SPSS, Eviews,…