KIỂ ỂM Đ M ĐỊỊNH VÀ L NH VÀ LỰ ỰA CH A CHỌ ỌN MÔ HÌNH N MÔ HÌNH Các loCác loạại sai sót ci sai sót củủa da dạạng mô hình ng mô hình h hồồi quii qui HHậu quả của sai sót mô hìnhậu quả
Trang 1KIỂ ỂM Đ M ĐỊỊNH VÀ L NH VÀ LỰ ỰA CH A CHỌ ỌN MÔ HÌNH N MÔ HÌNH
Các loCác loạại sai sót ci sai sót củủa da dạạng mô hình ng mô hình h
hồồi quii qui
HHậu quả của sai sót mô hìnhậu quả của sai sót mô hình
PhPhươương pháp phát hing pháp phát hiệện các sai sót n các sai sót c
củủa da dạạng mô hình hng mô hình hồồi quii qui
Tiêu chuTiêu chuẩẩn ln lựựa cha chọọn mô hình n mô hình
Trang 2Các lo
Các loạ ại sai sót c i sai sót củ ủa d a dạ ạng mô ng mô
hình h hình hồ ồi qui i qui
C
Cáác dc dạạng sai sng sai sóót ct củủa da dạạng mô hng mô hìình nhnh nhưư
sau:
BBỏỏ ssóót bit biếến quan trn quan trọọng, ng,
ĐĐưưa bia biếến không liên quan vn không liên quan vàào mô o mô
h
hìình, nh,
SSửử ddụụng dng dạạng hng hààm sm sốố không đkhông đúúng, ng,
Sai sSai sốố trong đo ltrong đo lườường, vng, vàà
XXáác đc địịnh dnh dạạng cng củủa pha phầần sai sn sai sốố không không
đ
đúúng ng
Trang 3 Ví dVí dụụ vvềề hàm chi phí chàm chi phí củủa doanh nghia doanh nghiệệp, p, d
Trang 4 Sai l Sai lệ ệch v ch về ề đo l đo lườ ường ng
các biếến thay thn thay thếế là là Y Y ii * * và và X X ii * * có chcó chứứa a các sai s
Trang 5 Theo trTheo trườường phái trng phái trọọng ting tiềền, sn, sựự thay thay đ
đổổi ci củủa GDP ca GDP củủa na nềền kinh tn kinh tếế chchịịu u ảảnh nh h
hưởưởng bng bởởi si sựự thay thay đổi đổi ccủủa la lượượng cung ng cung ti
tiềền, trong khi đó, theo Keynes, sn, trong khi đó, theo Keynes, sựự
tuyếến tính tn tính tốốt nht nhấất” (BLUE) t” (BLUE)
chúng tôi chchúng tôi chỉỉ ttậập trung phát hip trung phát hiệện hai n hai lo
loạại sai sót đi sai sót đầầu tiên u tiên
Trang 6Hậu quả của sai sót mô hình
Để minh họa, ta dùng mô hình 3
biến và xem xét 2 loại sai sót đầu tiên:
1. Bỏ sót biến có liên quan:
Giả sử dạng đúng của mô hình là:
Yii = = 1 + + 2X2i + + 3X3i + uii (1)Nhưng ta lại sử dụng mô hình:
Yii = = 1 + + 2X2i + vii (2)
Trang 7Hậu quả của sai sót mô hình
Ta gặp những hậu quả sau:
1 Nếu biến bị bỏ sót có tương quan với biến sẵn
có trong mô hình, tức là r23 0 0, , 1 và và 2 sẽ bị
chệch và không vững.
2 Thậm chí nếu Thậm chí nếu X X2 và X3 không có tương quan thì
1 cũng bị chệch, mặc dù cũng bị chệch, mặc dù 2 không chệch.
3 Var(uii) = ) = 2 bị ước lượng sai.
4 Var( Var( 2) là ước lượng chệch của var( ) là ước lượng chệch của var( 2).
5 Do vậy, khoảng tin cậy và các kiểm định không
Trang 8Hậu quả của sai sót mô hình
Đưa vào mô hình biến không có liên quan
Giả sử mô hình đúng như sau:
Yii = = 1 + + 2X2i + uii (3) Nhưng ta lại ước lượng mô hình:
Yii = = 1 + + 2X2i + + 3X3i + vii (4)Những hậu quả:
1. Các ước lượng OLS sẽ không chệch và
Trang 9Hậu quả của sai sót mô hình
Phương sai sai số, Phương sai sai số, 2, được ước
lượng đúng;
Khoảng tin cậy và các kiểm định
vẫn đáng tin cậy;
Tuy nhiên, các ước lượng Tuy nhiên, các ước lượng không không
hiệu quả, tức là, phương sai của chúng có thể lớn hơn phương sai của
của
Trang 10t k k
Trang 11thểể tính đtính đượược mc mứức ý nghĩa thc ý nghĩa thựực sc sựự là là (15/5).(5) = 15%
llưưu ý ru ý rằằng khi ng khi c = k c = k thì sẽ không có thì sẽ không có hi
hiệện tn tượượng ng khai thác d khai thác dữ ữ li liệ ệu u
Trang 122.1 Kiể ểm tra ph m tra phầ ần d n dư ư
hàm chi phí chàm chi phí củủa doanh nghia doanh nghiệệp: p:
Y ii = b 1 + b 2 X ii + b 3 X ii 2 + b 4 X ii 3 + u 1i (1)
Y ii = a 1 + a 2 X ii + a 3 X ii 2 + u 2i (2)
Y ii = a 1 + a 2 X ii + u 3i (3)
Trang 142.2 Ki
H0: mô hình không có t : mô hình không có tự ự ttươ ương quan ng quan
Bác b bỏ ỏ Không Không qđ qđ Ch
Chấ ấp p nh nhậ ận n
0
0 < < d d < < d dL
dL dd d dU4
4 d dL < < d d < <4 4 4
4 d dU dd 4 4
dL
dU dd 4 4 d dU
Trang 15 Ước lượng mô hình này bằng OLS và
vẽ đồ thị của sai số theo giá trị, Yii
Hình vẽ sẽ cho ta thấy mối quan hệ
có hệ thống giữa eii và Yii
Các bước tiến hành:
Trang 17Kiể ểm đ m địịnh RESET c nh RESET củ ủa a
Ramsey
Chạy hồi quy mô hình (*), và tính
toán ước lượng của Yii, Yii
Chạy lại (*) và đưa thêm biến Yii
vào mô hình dưới dạng một biến nào đó, chẳng hạn, Yii2 và Yii3
Yii = = 1 + + 2Xii + + 3Yii2 + + 4Yii3 + uii (**)
Đặt R2 từ (**) là Rnew2 và từ (*) là
Rold2 Chúng ta dùng kiểm định F theo công thức:
Trang 19Kiể ểm đ m địịnh RESET c nh RESET củ ủa a
Ramsey: v í dụ
Trang 20Ví d
Ví dụ ụ::
H0: mô hình không b: mô hình không bỏỏ sót bisót biếếnn
Giá trGiá trịị kikiểểm đm địịnh F thu đnh F thu đượược trc trựực tic tiếếp p ttừừ phphầần mn mềềm Statam Stata
ovtest
Ramsey RESET test using powers of the
fitted values of chiphi
Ho: model has no omitted variables
F(3, 4) = 1.52 Prob > F = 0.3380
Trang 222.4 Ki
2.4 Kiể ểm đ m địịnh h nh hệ ệ s số ố Lagrange (LM) Lagrange (LM)
đ
đố ối v i vớ ới bi i biế ến thêm vào n thêm vào
NNếếu chúng ta so sánh hàm chi phí u chúng ta so sánh hàm chi phí
bịị gi giớ ới h i hạ ạn n ccủủa hàm ba hàm bậậc ba.c ba
H0: h: hệệ ssốố ccủủa bia biếến sn sảản ln lượượng bình ng bình
Trang 23Kiể ểm đ m địịnh h nh hệ ệ s số ố Lagrange Lagrange
Ước lượng “phiên bản bị giới hạn”
bằng OLS và thu thập sai số, eii
Nếu “phiên bản không bị giới hạn” là đúng thì ei ở trên sẽ có tương quan với X2 và X3
Chạy hồi quy eii theo tất cả các biến:
ei = = 1 + + 2Xii + + 3Xii2 + + 4X3 + vii
vi thỏa các giả định của mô hình CLRM
Khi cở mẫu lớn,
Trang 24Kiể ểm đ m địịnh h nh hệ ệ s số ố Lagrange Lagrange
Nếu nR 2 > > 2 tra bảng, ta bác bỏ H0: các hệ số của X 2 và X 3 bằng không; tức là chúng khác 0, hay mô hình bỏ sót biến.
Ví dụ: ta trở lại hàm chi phí tuyến tính:
nR 2 = 10.(0,9896)=9,896 > 2 2 tra bảng = 9,2 Kết quả này giống như kiểm định RESET.
Trang 253 Sai s
3 Sai số ố c củ ủa phép đo l a phép đo lườ ường ng
ddữữ liliệệu có thu có thểể thithiếu ếu chính xác do mchính xác do mộột t ssốố lý do nhlý do nhưư: :
• hay sai s hay sai số ố tính toán tính toán
gây ra nhgây ra nhữững mô hình sai lng mô hình sai lệệchch
Chúng ta có thể xem xét hậu quả
của việc này trong 2 trường hợp:
3.1 Sai số trong biến phụ thuộc Y:
Trang 263.1 Sai số trong biến phụ thuộc Y:
sai của ước lượng sẽ thay đổi sẽ thay đổi
Trang 273.1 Sai số trong biến phụ thuộc Y:
Ta thấy phương sai, và do đó sai số chuẩn
sẽ tăng lên khi có sai số trong đo lường Yii
Trang 283.2 Sai số trong đo lường biến độc
Bây giờ, thậm chí wii có trung bình bằng 0, độc
lập và không tương quan với uii, chúng ta cũng
không thể có zii độc lập với Xii
Trang 293.2 Sai số trong đo lường biến độc lập Xii::
Cov(zii, Xii) = E[zii – – E(z E(zii)][Xii – – E(X E(Xii – – E(X E(Xii)]
= E(uii w wii)wii=E( =E( w wii2 )= )= w2
0 0
Do v ậy, Xii và zii có tương quan và vi phạm các giả định của CLRM Các ước lượng OLS chẳng những bị chệch mà còn không
vững.
Hậu quả của loại sai sót nghiêm trọng
nhưng khó có thể khắc phục nó vì ta
không biết Xii được như thế nào cho đúng.
Ta có thể giả định w2 rr ất nhỏ nên xem như không có sai số này và dùng OLS bình
thường.
Trang 30nó không phảải là vii là việệc dc dễễ dàng.dàng.
Chúng ta xem lại phần sai số sau:
Yii = = XXiiuii (*) vvà Yà Yii = = XXii + uii (**)
NNếu (*) đúng nhưng lại ước lượng ếu (*) đúng nhưng lại ước lượng
(**), thì ước lượng
(**), thì ước lượng s sẽ chệch.ẽ chệch
Trang 31Tiêu chu
Tiêu chuẩ ẩn l n lự ựa ch a chọ ọn mô hình n mô hình
R 2,
R 2 điđiềều chu chỉỉnh, nh,
Tiêu chuTiêu chuẩẩn thông tin Akaike (AIC), n thông tin Akaike (AIC),
Tiêu chuTiêu chuẩẩn thông tin Schwarz n thông tin Schwarz
(SIC),
Tiêu chuTiêu chuẩẩn n C C p ccủủa Mallows, a Mallows,
và dvà dựự báo báo χ χ 2
Trang 34Tiêu chuẩn R2 điều chỉnh ( điều chỉnh ( R R2))
Ta thấyTa thấyRR2 RR2 RR2 chỉ tăng khi giá trị tuyệt đối của giá trị t của biến
được thêm vào mô hình lớn hơn 1
Do vậy,Do vậy,RR2 là tiêu chuẩn tốt hơn R2
Lưu ý, các biến phụ thuộc cũng phải giống nhau
Trang 35Tiêu chuẩn thông tin Akaike (AIC)
Trong đó k là số biến được ước lượng (gồm cả hệ
số tự do) và n là cở mẫu.
Ta thấy AIC phát hiện sai sót khắt khe hơn các tiêu chuẩn trên khi tăng thêm số biến.
M ô hình nào AIC thấp hơn thì tốt hơn
Để tiện lợi cho
việc tính toán, ta
lấy log:
Trang 36Tiêu chuẩn thông tin Schwarz (SIC)
SIC còn khắt khe hơn AIC
SIC càng nhỏ, mô hình càng tốt
hay
Trang 37Tiêu chuẩn Cp của Mallows