I Hiệu lực nội tại: các giả thuyết thống kê đối với các tham số ước lượng được là hợp lý đối với mẫu hay quần thể dữ liệu và bối cảnh được nghiên cứu.. I Hiệu lực ngoại vi: các giả thuyế[r]
(1)Hiệu lực nội hiệu lực ngoại vi (Internal validity and external validity)
Lê Việt Phú
Trường Chính sách Cơng Quản lý Fulbright
(2)Hồi quy tuyến tính cổ điển CLRM giả định
yi = β0+ β1xi1+ β2xi2+ + ui
1 Tuyến tính theo tham số
2 Chọn mẫu ngẫu nhiên
3 Không có cộng tuyến hồn hảo
4 Trung bình có điều kiện sai số 0:
E (u|x1, , xk) = ⇒ Ước lượng OLS không chệch
(3)5 Với giá trị biến giải thích cho trước, phương sai sai số số:
Var (u|x1, , xk) = σ2
I Với giả định 1-5, ước lượng OLS ước lượng tuyến tính, không chệch, hiệu (Best Linear Unbiased Estimator - BLUE)
6 Sai số u độc lập với biến giải thích, có phân phối chuẩn với giá trị trung bình phương sai σ2
(4)Mơ hình hồi quy tuyến tính cổ điển - CLRM
Nếu thỏa giả định 1-6 mơ hình coi mơ hình hồi quy tuyến tính cổ điển
I Ước lượng β BLUE
I Phân phối mẫu β là:
ˆ
β ∼ N(β, Var (β))
I Viết dạng chuẩn hóa:
ˆ β − β
sd ( ˆβ) ∼ N(0, 1)
(5)Khái niệm hiệu lực nội (internal validity) hiệu lực ngoại vi (external validity) mơ hình ước lượng
I Hiệu lực nội tại: giả thuyết thống kê tham số ước lượng hợp lý mẫu hay quần thể liệu bối cảnh nghiên cứu
I Hiệu lực ngoại vi: giả thuyết thống kê áp dụng liệu, quần thể hay bối cảnh khác so với bối cảnh nghiên cứu
(6)Khi giả định mơ hình CLRM khơng thỏa
(7)Hiệu lực nội mơ hình OLS
y = β0+ β1x1+ β2x2+ + u
Nếu điều kiện 1-6 thỏa:
I Ước lượng β không chệch (thiên lệch) quán:
E [ ˆβ] = β
plim( ˆβ) → β
(8)Thiên lệch quán - Bias and Consistency
I Không thiên lệch: giá trị kỳ vọng ước lượng với giá trị thực – ước lượng mơ hình với mẫu ngẫu nhiên lặp (repeated sampling) :
E ( ˆβ) = β
I Nhất quán: Phân phối ước lượng tham số hội tụ (còn gọi tiệm cận - asymptotic) giá trị thực cỡ mẫu tăng đến vô cùng:
plim( ˆβ) → β
(9)Bias and Consistency
P1 P2
I P1: Ước lượng không chệch quán
(10)Bias and Consistency
P3 P4
I P3: Ước lượng không chệch không quán
(11)Hiệu lực nội bị phá vỡ hậu xảy ra?
1 Phương sai sai số thay đổi tự tương quan (heteroskedasticy and autocorrelation)
2 Mơ hình bị thiếu biến quan trọng (omitted variables bias)
3 Sai cấu trúc hàm (functional form misspecification)
4 Mẫu liệu không ngẫu nhiên/hiện tượng tự lựa chọn mẫu (sample selection bias)
5 Quan hệ nhân đồng thời (simultaneous causality)
6 Sai số đo lường (measurement errors)
(12)1 Phương sai sai số thay đổi tự tương quan
y = β0+ β1x1+ β2x2+ u
Var (u|x ) 6= σ2
cov (ui, uj) 6=
I Ước lượng OLS không bị chệch quán
I Trị kiểm định sai, khoảng tin cậy sai ⇒ Ước lượng khơng có hiệu lực nội
(13)2 Mơ hình thiếu biến quan trọng
I Ví dụ mơ hình hồi quy chuẩn với hai biến giải thích:
y = β0+ β1x1+ β2x2+ u
thỏa điều kiện CLRM Tuy nhiên không quan sát x2,
do ước lượng mơ hình sau thực tế:
y = β0+ β1x1+ β2x2+ u
| {z }
v
I Trong v sai số gộp sai số ngẫu nhiên u biến không quan sát x2, v = u + β2x2
I Các đặc tính ước lượng ˆβ1:
ˆ
β1 = β1+ β2σ21
σ21là hệ số góc hồi quy biến x2 lên x1:
(14)Đánh giá hướng chệch mơ hình thiếu biến quan trọng
I Nếu β2 = (biến x2 biến quan trọng) ˆβ1
khơng chệch
I Nếu σ21= (x1 x2 không tương quan) ˆβ1 khơng
chệch
I Nếu khơng phải trường hợp β1 chệch, với hướng
mức độ chệch tùy thuộc vào giá trị β2 tương quan
(15)Ví dụ trường hợp thiếu biến quan trọng mơ hình tỷ suất thu nhập học
Giả sử hàm hồi quy chuẩn là:
log (wage) = β0+ β1educ + β2Ability + u
| {z }
v
I Tố chất cá nhân Ability kỳ vọng có tác động đến tiền lương
I Tố chất cá nhân tương quan với trình độ học vấn
I Tố chất cá nhân không quan sát
I Kỳ vọng β2> σ21> ⇒ Ước lượng tỷ suất thu nhập
(16)3 Sai cấu trúc hàm
Giả sử hàm hồi quy chuẩn là:
log (wage) = β0+ β1educ + β2educ2+ u
| {z }
v
I Nếu nhà nghiên cứu bỏ sót biến educ2 mơ hình, ước lượng tỷ suất thu nhập là:
ˆ
β1= β1+ β2
cov (educ, educ2) var (educ)
I Nếu học có quan hệ phi tuyến đến thu nhập (và kỳ vọng β2< 0), ước lượng β1 bị chệch xuống
(17)4 Dữ liệu không ngẫu nhiên tượng tự lựa chọn mẫu
(18)Dữ liệu bị thiếu ngẫu nhiên
(19)Dữ liệu không ngẫu nhiên
I Dữ liệu bị thiếu khơng ngẫu nhiên dựa biến giải thích:
o Không hưởng đến hiệu lực nội tại, ảnh hưởng đến hiệu lực ngoại vi
o Ví dụ: Mơ hình dựa điều tra thu nhập tình trạng học vấn nhóm cá nhân học không 12 năm áp dụng cho nhóm học đại học cao
I Dữ liệu có vấn đề lựa chọn mẫu dựa biến phụ thuộc:
o Ảnh hưởng đến hiệu lực nội tại, ước lượng bị chệch vấn đề lựa chọn mẫu
o Ví dụ: Ước lượng hàm tiền lương người độ tuổi lao động Những người khơng làm (do tiền lương khơng khơng ghi nhận) nhiều lý (tiền lương thấp kỳ vọng, có lựa chọn khác) Nếu không sử lý vấn đề chọn mẫu ước lượng bị sai lệch
(20)5 Quan hệ nhân đồng thời
Ví dụ với giá lượng tiêu thụ hàng hóa quan sát thị trường phụ thuộc đồng thời lẫn nhau:
Price = β0+ β1Quantity + β2x + u
và
Quantity = γ0+ γ1Price + γ2y + v
Ước lượng OLS bị chệch khơng có hiệu lực nội tại:
ˆ
β1 = β1+
γ1σ2u
(1 − γ1β1)σv2
(21)6 Sai số đo lường
Giả sử hàm hồi quy chuẩn là:
wage = β0+ β1educ + β2educ2+ u
Thế sai số đo lường?
I Sai số biến phụ thuộc (ví dụ khơng ghi nhớ đủ loại hình thu nhập tiền lương)
(22)Tác động sai số đo lường biến phụ thuộc đến ước lượng OLS
Sai số đo lường biến phụ thuộc:
]
wage = wage + v
với v white noise Khi thực ước lượng mơ hình:
]
wage = β0+ β1educ + β2educ2+ (u + v )
I Mơ hình thỏa điều kiện CLRM, ước lượng có hiệu lực nội
(23)(24)Sai số đo lường biến giải thích dẫn đến vi phạm các giả định CLRM ước lượng khơng có hiệu lực nội tại
I Giả sử hàm hồi quy chuẩn là:
log (wage) = β0+ β1educ + u
nhưng biến giải thích mơ hình bị nhiễu thông tin, quan sát educ∗ = educ + ω
I ω gọi nhiễu sai số đo lường cổ điển:
cov (educ, ω) = 0, cov (ω, u) = 0, E [ω] = 0, var (ω) = σω2
I Mơ hình ước lượng là:
(25)Tác động sai số đo lường đến ước lượng OLS
Nếu ước lượng mơ hình OLS:
plim( ˆβ1) = β1+
cov (educ∗, v ) var (educ∗)
= β1+
cov (educ + ω, u − β1ω)
var (educ + ω)
= β1− β1
cov (ω, ω) var (educ) + var (ω)
= β1
var(educ) var(educ) + σ2
ω
Do var(educ)+σvar(educ)2
ω < nên ước lượng | ˆβ1
| < |β1| Đây gọi vấn
(26)Mô Monte-Carlo để chứng minh đặc tính thống kê của ước lượng dựa liệu mô phỏng
I Tạo liệu mơ
I Tạo biến giải thích có sai số đo lường
(27)Trường hợp sai số đo lường có tính hệ thống
I Giả sử hàm hồi quy chuẩn là:
log (consumption) = β0+ β1wage + u
nhưng biến giải thích mơ hình bị báo cáo thiếu, quan sát wage∗= wage − ω, với ω >
I Mơ hình ước lượng là:
log (consumption) = β0+ β1wage∗+ u + β1ω
| {z }
v
plim( ˆβ1) = β1+
cov (wage∗, u + β1ω)
var (wage∗)
(28)Hình thức sử lý ước lượng khơng có hiệu lực nội tại?
Đã học kỳ trước
I Khi mơ hình thiếu biến quan trọng: Tìm biến đại diện (proxy) cho tố chất cá nhân (IQ, điểm học ) mơ hình tỷ suất thu nhập học
I Cấu trúc hàm: Thêm biến lũy thừa/biến tương tác kiểm định RESET
(29)Các phương pháp học học phần để đảm bảo hiệu lực nội ước lượng
I Hồi quy Tobit Heckman selection để xử lý vấn đề liệu bị chặn liệu không ngẫu nhiên
I Dùng liệu bảng với tác động cố định (fixed effects) để xử lý trường hợp thiếu biến quan trọng mơ hình giả định nhân tố không quan sát không thay đổi theo thời gian
I Phương pháp hồi quy hai bước với biến công cụ để xử lý trường hợp thiếu biến quan trọng mơ hình/biến nội sinh
I Phương pháp hồi quy hệ phương trình trường hợp biến có quan hệ nhân đồng thời