Trong mô hình này, các pi được xác định bằng:
pi = = = (1.1)
X = (1,X2); Xi = (1,X2i); β = (β1,β2)
Trong mô hình trên, pi không phải là hàm tuyến tính của các biến độc lập. Phương trình (1.1) được gọi là hàm phân bố Logistic. Trong hàm này, khi X, β nhận các giá trị từ -∞ đến +∞ thì p nhận giá trị từ 0 đến 1. pi phi tuyến với cả X và các tham số β. Điều này có nghĩa là ta không thể áp dụng trực tiếp phương pháp bình phương nhỏ nhất (Ordinary Least Square - OLS) để ước lượng. Người ta dùng phương pháp ước lượng hợp lý tối đa để ước lượng β.
Vì Y chỉ nhận một trong hai giá trị 0 và 1, Y có phân bố nhị thức, nên hàm hợp lý với mẫu kích thước n dạng sau đây:
L =
L = =
Đặt t* = , t* là vectơ hai chiều (số hệ số hồi quy). Ta cần tìm ước lượng hợp lý tối đa của β, ta có:
Ln(L) = β’ t* -
S( ) = - + t*
Phương trình trên phi tuyến đối với β, người ta sử dụng phương pháp Newton Raphson để giải hệ phương trình này.
I( ) = E(- ) = E( )
=
=
I(β) được gọi là ma trận thông tin. Nếu như là nghiệm của S( ), khai triển Taylor tại β, ta có:
S( ) = + ( - β)
- β = - S(β) = S(β)
Ta có quá trình lặp như sau:
Bắt đầu với giá trị ban đầu nào đó của β, chẳng hạn , ta tính được S( ) và I( ), sau đó tìm β mới bằng công thức sau đây:
= + S( )
Quá trình lặp trên sẽ được thực hiện cho đến khi hội tụ. Do I(β) là dạng toàn phương xác định dương, nên quá trình trên sẽ cho ước lượng hợp lý cực đại. Tương ứng với , ta có + là ma trận hiệp phương sai của . Chúng ta sử dụng ma trận này để kiểm định giả thiết và thực hiện các suy đoán thống kê khác.
Sau khi ước lượng được , ta có thể tính được ước lượng xác suất = P(Y=1/ )
=
Kết hợp với (1.3) ta có: =
Phương trình này dùng đẻ kiểm nghiệm lại các
Như vậy trong mô hình Logit chúng ta không nghiên cứu ảnh hưởng trực tiếp của biến độc lập Xk đối với Y mà xem xét ảnh hưởng của Xk đến xác suất để Y nhận giá trị bằng 1 hay kỳ vọng của Y.
Ảnh hưởng của Xk đến pi được tính như sau:
= = pi(1-pi)βk