Mặc dù các nhược điểm này có thể Như vậy cần xây dựng mô hình thoả mãn hai điều kiện: • Khi Xi tăng thì Pi cũng tăng song Pi∈ [0,1] Có hai loại mô hình thoả mãn được các điều kiện trên l
Trang 1BÀI 1 (tiếp theo) HỒI QUY VỚI BIẾN GIẢ
3 HỒI QUY VỚI BIẾN PHỤ THUỘC LÀ ĐỊNH TÍNH
Có nhiều hiện tượng kinh tế mà biến phụ thuộc lại là định tính nên phải dùng biến giả để đặc
trưng cho chúng Chẳng hạn , có nhà hay không có nhà, có xe máy hay không có
3.1 Mô hình xác suất tuyến tính - LPM
a Mô hình:
Xét mô hình sau:
Yi = β1 + β2Xi + ui (1)
Y i là biến phụ thuộc rời rạc, chỉ nhận hai giá trị bằng 0 hoặc 1
Mô hình (1) gọi là mô hình LPM
Ký hiệu: Pi = P(Y = 1/Xi)
1 - Pi = P(Y = 0/Xi)
⇒ Yi ∼ A(Pi) Với giả thiết E(Ui) = 0
E( Y/Xi) = β1 + β2Xi
Mặt khác do Yi ∼ A(Pi) nên
E(Y/Xi) = Pi
⇒ Pi = β1 + β2Xi = E(Y/Xi)
b Các giả thiết của OLS trong mô hình LPM
• Trong mô hình LPM phương sai của sai số ngẫu nhiên không đồng đều
Thật vậy, ui = Yi - β1 - β2Xi
⇒ Var(ui) = Var( Yi - β1 - β2Xi) = Var(Yi)
Do Yi ∼ A(Pi) ⇒ Var(Yi) = Pi(1 - Pi)
⇒ Var(ui) = Pi(1 - Pi)
biến ngẫn nhiên rời rạc với bảng phân phối xác suất như sau:
Trang 2u i - β1 - β2X i 1 - β1 - β2X i
P i 1 - P i P i
Tuy nhiên dù ui không phân phối chuẩn thì các ước lượng OLS vẫn là không chệch, và với
* Các ước lượng của E(Y/Xi) là Yˆ i chưa chắc đã thoả mãn điều kiện 0 ≤ Yˆ i ≤ 1
c Ước lượng mô hình
Với các đặc điểm trên, thủ tục ước lượng mô hình LPM như sau
0 và Yˆ i > 1 và đặt:
W i = Yˆ i(1 - Yˆ i)
đổi biến số và ước lượng mô hình sau:
Yi/ Wi¦ = β1(1/ Wi) + β2(Xi/ Wi) + ui/ Wi (2)
Từ kết quả ước lượng (2) suy ra ước lượng của mô hình xuất phát
Ví dụ: điều tra ngẫu nhiên 40 gia đình theo hai chỉ tiêu:
Y = 1 nếu có nhà riêng
Y = 0 nếu không có nhà riêng
X là thu nhập ( ngàn USD/ năm)
1 0 8 21 1 22
2 1 16 22 1 16
3 1 18 23 0 12
4 0 11 24 0 11
5 0 12 25 1 16
6 1 19 26 0 11
7 1 20 27 1 20
Trang 38 0 13 28 1 18
9 0 9 29 0 11
10 0 10 30 0 10
11 1 17 31 1 17
12 1 18 32 0 13
13 0 14 33 1 21
Hãy ước lượng mô hình LPM và cho nhận xét
2 Mô hình logit
Như đã phân tích, mô hình LPM có nhiều nhược điểm Mặc dù các nhược điểm này có thể
Như vậy cần xây dựng mô hình thoả mãn hai điều kiện:
• Khi Xi tăng thì Pi cũng tăng song Pi∈ [0,1]
Có hai loại mô hình thoả mãn được các điều kiện trên là mô hình LOGIT và mô hình PROBIT
2.1 Mô hình LOGIT và phương pháp Berkson
( Phương pháp moment)
Trong mô hình LOGIT ta giả thiết rằng:
E(Y/Xi) = Pi = - (3)
1 + e -(β1 + β2Xi)
Nếu đặt Zi = β1 + β2Xi thì (11) có dạng
1
Trang 41 + e - Zi
Phương trình (4) được gọi là hàm phân bố Logistic
Biểu thức (4) có thể viết dưới dạng:
e Zi
Pi = -
1 + e Zi
1
⇒ 1 - Pi = -
1 + e Zi
Vì vậy Pi
1 - Pi
nghĩa là tỷ lệ cá cược là 4 ăn 1 cho việc chọn Y = 1
Từ (5) ta có:
Ln(Pi/(1 - Pi)) = Zi = β1 + β2Xi
Đặt Li = ln(Pi/(1 - Pi)) = β1 + β2Xi + ui (6)
các nhận xét sau:
• Khi Z biến thiên từ -∞ đến +∞ , P biến thiên từ 0 đến 1 và L biến thiên từ -∞ đến +∞ , như vậy
dù P phải thuộc [0,1] song L vẫn không bị giới hạn
• Dù L là hàm tuyến tính của X nhưng P không phải là hàm tuyến tính của X
* ƯƠC LƯƠNG MÔ HìNH
ni
Ni
Trang 5Dùng fi ước lượng được mô hình (6) Tuy nhiên do (6) có phương sai của sai số thay đổi vì fi
có phân phối nhị thức với E(fi) = Pi và Var(fi) = Pi(1 - Pi)/Ni và sẽ hội tụ chuẩn khi Ni khá
1/NiPi(1 - Pi)
Như vậy mô hình Logit cũng có phương sai của sai số thay đổi nên phải đổi biến số, trong
1
-
Nifi(1 - fi) Như vậy thủ tục ước lượng mô hình Logit bằng phương pháp Moment như sau:
Bước 1: Với mỗi Xi tính fi = ni/Ni , Li = Ln(fi/(1 - fi))
Và Wi = Nifi(1 - fi)
Bước 2: Dùng OLS hồi quy mô hình
Wi
¦ Li = β1 Wi + β2 WiXi + Wiui (8)
2.2 Phương pháp Golberger (phương pháp ước lượng hợp lý tối đa)
Phương pháp Berkson có hạn chế là đòi hỏi điều kiện 0 < fi < 1 Nếu có fi = 0 hoặc bằng 1
Trước hết viết lại mô hình Logit dưới dạng:
exp(β1 +β2X 2i )
P i = -
Trang 61 + exp(β1 + β2X 2i )
exp(X i , β)
= - (9)
1 + exp(X i , β)
Trong đó Xi = (1 , X2i) β = (β1 , β2)
1 1
⇒ 1 - Pi = - = -
1 + exp(β1 + β2X 2i ) 1 + exp(X i , β)
hợp lý có dạng:
=
−
−
i
i i
i
P
1
) 1 exp(
) 1 )(
exp(
n
=
i i
i Y X
=
+
i
i
X
1 exp(
1 (
Ký hiệu
Thì I(β) được gọi là ma trận thông tin
Từ đó phương pháp ước lượng hợp lý tối đa cho kết quả sau:
- β = [I(β)]
1
Pˆ i = - (13)
1 + exp(-βˆ1 - βˆ 2Xi)
∂Pˆ i/∂Xi = βˆexp(-(βˆ1 + βˆ2Xi))/[1 + exp(-(βˆ 1 +βˆ 2Xi))]2
Trang 7= βˆ2Pˆ i(1 - Pˆ i) (14)
Ví dụ: Giải lại bài toán về quan hệ Có nhà - Thu nhập bằng phương pháp Golberger, tìm ảnh hưởng biên khi
X = 10
3 Mô hình Probit
Để mô tả hành vi của biến phụ thuộc, mô hình Logit đã sử dụng hàm Logistic Trong một
số trường hợp khác có thể dùng hàm phân bố chuẩn và sẽ dẫn đến mô hình Probit ở đây ta sẽ không thay thế ngay hàm phân bố chuẩn vào chỗ của hàm phân bố Logistic mà kết hợp thêm với Lý thuyết về độ thoả dụng ( Utility Theory)
định bởi các biến giải thích Độ thoả dụng càng lớn thì xác suất để Y = 1 càng lớn
Giả sử tồn tại một giá trị tới hạn Ii* sao cho:
Yi = 1 nếu Ii > Ii*
Yi = 0 nếu Ii ≤ Ii*
với cùng kỳ vọng toán và phương sai thì không những có thể ước lượng được các tham số của
mô hình (15) mà còn khai thác được các thông tin liên quan đến chỉ số I
Với giả thiết Ii* phân phối chuẩn ta có:
Pi = P(Y = 1) = P(IIi i* < Ii) = F(Ii) =
∞
−
dU
∫exp( −U2 / 2 )dU
−∞
trong đó U là biến ngẫu nhiênphân phối N(0,1)
Từ đó Ii = F-1(Pi) = β1 + β2Xi (17)
3.1 Phương pháp Moment
Thủ tục ước lượng bằng phương pháp mô men như sau:
fi = ni/Ni
Trang 8Chú ý: Mô hình (18) có phương sai của sai số thay đổi:
Var(ui) = Pi(1 - Pi)/Nifi2
phục khuyết tật này có thể thực hiện phép đổi biến bằng cách hồi quy mô hình:
WiIi = β1Wi + β2WiXi + Wiui (19) 2
i
i f N
pˆi(1− pˆi)
Ví dụ: Tiến hành lại với các số liệu ghép nhóm của mô hình Logit
10 60 18 0.3 -0.52
25 65 39 0.6 0.25
40 25 20 0.8 0.84
• Do Ii < 0 khi Pi < 0.5 nên cộng thêm 5 vào Ii và kết quả gọi là Probit ( nếu không cộng thêm 5 thì kết quả gọi là Normit)
3.2 Phương pháp ước lượng hợp lý tối đa
Trước hết viết lại hàm thoả dụng dưới dạng:
Kí hiệu: Xi = (1,X2i)
β = (β1 , β2)
f là hàm mật độ phân phối chuẩn hoá
Lúc đó Hàm hợp lý có dạng:
=
n
i i
i
X
F( , ))exp( )(1 ( , ))exp(1 )
i 1
Ký hiệu S(β) = ∂lnL/∂β
I(β) = E(-∂2lnL/∂β2)
Trang 9⇒ ( - β) = -[∂βˆ 2lnL/∂β2]-1S(β) = [I(β)]-1S(β)
của β được tìm theo công thức:
Quá trình kết thúc khi hội tụ
Cũng giống như mô hình Logit, mô hình Probit không nghiên cứu sự ảnh hưởng trực tiếp của
toán của Y
i i
i i i
X F
P = ∂ ( ,β) = ( ,β)β = 1 exp(−( β)2/2)β
2
∂
∂
Ví dụ: ước lượng lại mô hình Probit với các số liệu của mô hình Logit bằng phương pháp Golberger
∂
(23)
Các mô hình trên có thể mở rộng theo các hướng
*Hướng mô hình Tobit, Chuẩn cụt
*Các mô hình có nhiều lựa chọn
Mô hình LPM, Logit, Probit
4 So sánh các mô hình LPM, Logit và Probit
Trong mô hình Logit các Pi được xác định từ hàm phân bố Logistic, còn trong mô hình Probit
thể so sánh trực tiếp
Amemiya nhận xét rằng nếu lấy các tham số ước lượng được tư mô hình Logit nhân với 0,625 thì sẽ cho kết quả xấp xỉ mô hình Probit
Đồng thời Amemiya cũng chỉ ra rằng mối liên hệ giữa các tham số của mô hình LPM và Logit như sau:
βLPM ≈ 0,25βLogit (trừ hệ số chặn)
βLPM ≈ βLogit + 0,5 đối với hệ số chặn
Chú ý: Nếu biến phụ thuộc có nhiều hơn hai trạng thái thì có thể sử dụng các lớp mô hình đa thức