Hồi qui tuyến tính từng khúc Hệ số góc của biến độc lập, X, có thể thay đổi khi X đạt một mức ngưỡng nào đó.. Phân tích mô hình có sự thay đổi về độ dốc, nhưng cũng chỉ giới hạn trong
Trang 1Biến giả và Ki ểm định tính ổn định cấu trúc của mô hình
Ta có mô hình hồi quy:
Yt = α1 + α2Dt + β1Xt + β2(DtXt) + ut
Trang 2Hồi qui tuyến tính từng khúc
Hệ số góc của biến độc lập, X, có thể thay đổi
khi X đạt một mức ngưỡng nào đó
Phân tích mô hình có sự thay đổi về độ dốc,
nhưng cũng chỉ giới hạn trong trường hợp đoạn thẳng được ước lượng vẫn là liên tục
Công ty trả hoa hồng cho các đại lý dựa vào
doanh thu, nếu doanh thu dưới mức x* thì cách tính tiền hoa hồng khác với cách tính tiền hoa hồng khi doanh thu trên mức x*
Trang 3
y
x*
Hình 7.3: Đường hồi qui tuyến tính từng
khúc
x doanh thu tiền hoa hồng
0
Trang 4 Ước lượng hàm:
Trong đó: y: tiền hoa hồng; x: doanh thu
x*: giá trị ngưỡng của doanh thu
Kiểm định = 0
1 nếu x > x *
0 nếu x x *
D
=
Trang 5Biến phụ thuộc là biến giả
Biến giả có thể có 2 hoặc nhiều giá trị nhưng
trong trường hợp này chúng ta chỉ xem xét trường hợp nó chỉ có 2 giá trị: 0 hoặc 1
mô hình xác suất tuyến tính (LPM)
Ví dụ:
1 nếu một sinh viên tốt nghiệp ra trường
0 nếu không tốt nghiệp
y =
1 nếu một gia đình có vay được vốn từ ngân hàng
0 nếu không vay được
y =
Trang 6Mô hình xác suất tuyến tính và hàm phân biệt tuyến tính
Chúng ta viết mô hình xác suất tuyến
tính dưới dạng hồi qui thông thường như sau:
yi = Pi = E(yi|xi) = i’xi + ui (7.9) với E(ui) = 0
Kỳ vọng có điều kiện E(yi|xi) = ’ixi được
giải thích như là xác suất có điều kiện để
sự kiện xảy ra khi biến xi đã xảy ra
Trang 7Mô hình xác suất tuyến tính
Vì E(yi|xi) là một xác suất nên:
0 E(yi|xi) 1
Tuy OLS không đòi hỏi ui phải có phân
phối chuẩn, nhưng ta vẫn giả định nó có phân phối chuẩn để phục vụ cho việc suy diễn.
Giả định này bị vi phạm, vì thực sự ui
theo phân phối Bernoulli.
Xét mô hình LPM 2 biến, ta có:
Trang 8Mô hình xác suất tuyến tính
ui = Yi - 1 - 2Xi Khi Yi = 1, ui = 1 - 1 - 2Xi, với xác suất pi,
Khi Yi = 0, ui = -1 -2Xi, với xác suất 1- pi,
Ước lượng OLS vẫn không chệch, nên nếu dùng để
ước lượng điểm, kết quả vẫn tin cậy.
Có hiện tượng phương sai sai số thay đổi, do ui
theo phân phối Bernoulli nên:
Var(ui) = Pi(1 – Pi) với Pi = ’iXi
E(yi|xi) có thể vượt khoảng (0,1) nếu Xi có giá trị lớn.
R2 sẽ rất nhỏ
Trang 9
y
Hình 7.4: Dự báo từ mô hình xác suất
tuyến tính
x
1
0
Đường hồi qui tuyến tính
Đường hồi qui thích hợp hơn
Trang 10Mô hình Probit và Logit
Trong mô hình LPM, ta có:
yi = Pi = E(yi|xi) = F( i ’ x i ) = i ’ x i + ui,
Trong đó: i ’ x i = 0 + 1x1 + 2x2 + … + kxk
Do yi là một xác suất nên thay vì ta dùng F(i’xi) là
hàm tuyến tính như LPM, ta có thể cho F(xi) là một
hàm tích lũy xác suất (c.d.f)
Khi đó, chắc chắn 0 E(yi|xi) = F( i ’ x i) 1
Tùy theo dạng của F( i ’ x i) được chọn, ta có các mô
hình: “lựa chọn nhị phân” (binary choice) khác
nhau:
Trang 11“Bi ến ẩn” và Mô hình Probit và
Logit
Gọi yi* là một “biến ẩn”, không quan sát được từ
quan sát i:
yi* = x i ’ + vi, Trong đó vi thỏa các giả định của CLRM
Giả sử ta quan sát được yi khi yi* vượt một ngưỡng
nào đó, chẳng hạn, 0, với:
yi = 1 khi yi* > 0, và
yi = 0 khi yi* 0
Do vi có p.d.f đối xứng nên: 1-F(-x i ’) = F(x i ’) Ta
có:
Trang 12Mô hình logit và probit
Tác động biên (marginal effect) của xi lên Pi
là:
Trong đó f(.) là p.d.f của F(.)
Ta thấy tác động từng phần này có cùng dấu
với i và phụ thuộc vào giá trị của xi, không giống như các mô hình tuyến tính
Do vậy, ta chỉ có thể tính tác động biên của xi
lên Pi ứng với các giá trị cụ thể của các xi
i i
i
' i
i
i
x
f x
x F x
P
Trang 13Mô hình logit và probit
'
i
' i
x
x '
i i
i i
e
e x
F P
x y
E
1
Hàm c.d.f trong các mô
hình:
Mô hình logit:
Mô hình probit: F(.)
là c.d.f của phân
phối chuẩn tắc.
' i
' i
x
/ x '
i
2 1
Đây là các mô hình phi tuyến tính nên ước lượng bằng phương pháp ML (Maximum Likelihood)