Mô hình Probit hay còn có tên gọi là mô hình normit. Tên gọi Probit bắt nguồn từ chữ Probability và unit. Mô hình này áp dụng đối với các biến phụ thuộc có dạng nhị phân. Ví dụ biến phụ thuộc là khả năng kết hôn của một người. Nếu người này kết hôn thì sẽ nhận giá trị 1 và ngược lại là 0.
Ý tưởng của mô hình Probit: Mô hình probit cho rằng quyết định kết hôn bị tác động bởi một biến tiềm ẩn nào đó. Biến tiềm ẩn này được gọi là chỉ số hữu dụng utility index I. Biến chỉ số này bị ảnh hưởng bởi các biến giải thích:
1 2
i i
I = + X
Một người sẽ quyết định kết hôn khi giá trị I này vượt qua một ngưỡng nào đó tạm gọi là I*. Giá trị I* này chúng ta không thể biết được nhưng giả định nó có phân
phối chuẩn.Xác suất để người đó không kết hôn sẽ có dạng:
( * )
1 2 1 2
( ) ( )
i i i i i i
P = P I I = P Z + X = F + X
Hàm F là hàm phân phối tích lũy chuẩn (CDF). Vì P là xác suất người đó kết hôn nên bạn phải tính nghịch đảo của F, do đó ta có công thức:
1
1 2
( )
i i i
I = F− P = + X
❖ Ước lượng biến tiềm ẩn
o Đối với dữ liệu theo nhóm
Từ thông tin từ mẫu, bạn có thể xác định được Pi. Ví dụ khảo sát 100 người và
có 40 người kết hôn thì Pi =0.4. Ii được ước lượng thông qua hàm CDF.
o Đối với dữ liệu cá biệt
Tương tự như mô hình xác suất tuyến tính, bạn vẫn phải sử dụng phương pháp ước lượng xác suất cực đại.
(Nguồn: amorfati.xyz) Hình 2. 3. Đồ thị mô hình Probit
− Ý tưởng phân tích Probit được xuất bản trong khoa học bởi Chester Bliss trong năm 1934. Năm 1952, một Giáo sư về thống kê tại Đại học Endiburgh là David Finney đã viết lại một cuốn sách với tên gọi là “Phân tích Probit”.
− Cấu trúc dữ liệu trong mô hình Probit cũng tương tự như mô hình Logit, mô hình ước lượng xác suất trả nợ của một khách hàng. Mô hình Probit có giả thiết sai số ngẫu nhiên có sai số chuẩn hóa: N(01).
Trong đó F là hàm phân phối xác suất tích lũy. Khi đó hàm hợp lệ có dạng:
Các biến và tham số trong mô hình Probit tương tự như mô hình Logit.