1. Trang chủ
  2. » Giáo Dục - Đào Tạo

KIỂM ĐỊNH VÀ LỰA CHỌN MÔ HÌNH pot

37 403 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 37
Dung lượng 3,07 MB

Nội dung

KIỂ ỂM Đ M ĐỊỊNH VÀ L NH VÀ LỰ ỰA CH A CHỌ ỌN MÔ HÌNH N MÔ HÌNH  Các loCác loạại sai sót ci sai sót củủa da dạạng mô hình ng mô hình h hồồi quii qui  HHậu quả của sai sót mô hìnhậu quả

Trang 1

KIỂ ỂM Đ M ĐỊỊNH VÀ L NH VÀ LỰ ỰA CH A CHỌ ỌN MÔ HÌNH N MÔ HÌNH

 Các loCác loạại sai sót ci sai sót củủa da dạạng mô hình ng mô hình h

hồồi quii qui

 HHậu quả của sai sót mô hìnhậu quả của sai sót mô hình

 PhPhươương pháp phát hing pháp phát hiệện các sai sót n các sai sót c

củủa da dạạng mô hình hng mô hình hồồi quii qui

 Tiêu chuTiêu chuẩẩn ln lựựa cha chọọn mô hình n mô hình

Trang 2

Các lo

Các loạ ại sai sót c i sai sót củ ủa d a dạ ạng mô ng mô

hình h hình hồ ồi qui i qui

C

Cáác dc dạạng sai sng sai sóót ct củủa da dạạng mô hng mô hìình nhnh nhưư

sau:

 BBỏỏ ssóót bit biếến quan trn quan trọọng, ng,

 ĐĐưưa bia biếến không liên quan vn không liên quan vàào mô o mô

h

hìình, nh,

 SSửử ddụụng dng dạạng hng hààm sm sốố không đkhông đúúng, ng,

 Sai sSai sốố trong đo ltrong đo lườường, vng, vàà

 XXáác đc địịnh dnh dạạng cng củủa pha phầần sai sn sai sốố không không

đ

đúúng ng

Trang 3

 Ví dVí dụụ vvềề hàm chi phí chàm chi phí củủa doanh nghia doanh nghiệệp, p, d

Trang 4

Sai l Sai lệ ệch v ch về ề đo l đo lườ ường ng

các biếến thay thn thay thếế là là Y Y ii * * và và X X ii * * có chcó chứứa a các sai s

Trang 5

 Theo trTheo trườường phái trng phái trọọng ting tiềền, sn, sựự thay thay đ

đổổi ci củủa GDP ca GDP củủa na nềền kinh tn kinh tếế chchịịu u ảảnh nh h

hưởưởng bng bởởi si sựự thay thay đổi đổi ccủủa la lượượng cung ng cung ti

tiềền, trong khi đó, theo Keynes, sn, trong khi đó, theo Keynes, sựự

tuyếến tính tn tính tốốt nht nhấất” (BLUE) t” (BLUE)

 chúng tôi chchúng tôi chỉỉ ttậập trung phát hip trung phát hiệện hai n hai lo

loạại sai sót đi sai sót đầầu tiên u tiên

Trang 6

Hậu quả của sai sót mô hình

 Để minh họa, ta dùng mô hình 3

biến và xem xét 2 loại sai sót đầu tiên:

1. Bỏ sót biến có liên quan:

Giả sử dạng đúng của mô hình là:

Yii = = 1 + + 2X2i + + 3X3i + uii (1)Nhưng ta lại sử dụng mô hình:

Yii = = 1 + + 2X2i + vii (2)

Trang 7

Hậu quả của sai sót mô hình

 Ta gặp những hậu quả sau:

1 Nếu biến bị bỏ sót có tương quan với biến sẵn

có trong mô hình, tức là r23   0 0, ,  1 và và  2 sẽ bị

chệch và không vững.

2 Thậm chí nếu Thậm chí nếu X X2 và X3 không có tương quan thì

1 cũng bị chệch, mặc dù cũng bị chệch, mặc dù  2 không chệch.

3 Var(uii) = ) =  2 bị ước lượng sai.

4 Var( Var( 2) là ước lượng chệch của var( ) là ước lượng chệch của var( 2).

5 Do vậy, khoảng tin cậy và các kiểm định không

Trang 8

Hậu quả của sai sót mô hình

 Đưa vào mô hình biến không có liên quan

Giả sử mô hình đúng như sau:

Yii = =  1 + +  2X2i + uii (3) Nhưng ta lại ước lượng mô hình:

Yii = = 1 + + 2X2i + + 3X3i + vii (4)Những hậu quả:

1. Các ước lượng OLS sẽ không chệch và

Trang 9

Hậu quả của sai sót mô hình

 Phương sai sai số, Phương sai sai số, 2, được ước

lượng đúng;

 Khoảng tin cậy và các kiểm định

vẫn đáng tin cậy;

 Tuy nhiên, các ước lượng Tuy nhiên, các ước lượng  không không

hiệu quả, tức là, phương sai của chúng có thể lớn hơn phương sai của

của 

Trang 10

tk k

Trang 11

thểể tính đtính đượược mc mứức ý nghĩa thc ý nghĩa thựực sc sựự là là (15/5).(5) = 15%

 llưưu ý ru ý rằằng khi ng khi c = k c = k thì sẽ không có thì sẽ không có hi

hiệện tn tượượng ng khai thác d khai thác dữ ữ li liệ ệu u

Trang 12

2.1 Kiể ểm tra ph m tra phầ ần d n dư ư

 hàm chi phí chàm chi phí củủa doanh nghia doanh nghiệệp: p:

Y ii = b 1 + b 2 X ii + b 3 X ii 2 + b 4 X ii 3 + u 1i (1)

Y ii = a 1 + a 2 X ii + a 3 X ii 2 + u 2i (2)

Y ii = a 1 + a 2 X ii + u 3i (3)

Trang 14

2.2 Ki

 H0: mô hình không có t : mô hình không có tự ự ttươ ương quan ng quan

Bác b bỏ ỏ Không Không qđ qđ Ch

Chấ ấp p nh nhậ ận n

0

0 < < d d < < d dL

dL  dd  d dU4

4 d dL < < d d < <4 4 4

4 d dU dd  4 4

dL

dU  dd  4 4 d dU

Trang 15

 Ước lượng mô hình này bằng OLS và

vẽ đồ thị của sai số theo giá trị, Yii

 Hình vẽ sẽ cho ta thấy mối quan hệ

có hệ thống giữa eii và Yii

 Các bước tiến hành:

Trang 17

Kiể ểm đ m địịnh RESET c nh RESET củ ủa a

Ramsey

 Chạy hồi quy mô hình (*), và tính

toán ước lượng của Yii, Yii

 Chạy lại (*) và đưa thêm biến Yii

vào mô hình dưới dạng một biến nào đó, chẳng hạn, Yii2 và Yii3

Yii = = 1 + + 2Xii + + 3Yii2 + + 4Yii3 + uii (**)

 Đặt R2 từ (**) là Rnew2 và từ (*) là

Rold2 Chúng ta dùng kiểm định F theo công thức:

Trang 19

Kiể ểm đ m địịnh RESET c nh RESET củ ủa a

Ramsey: v í dụ

Trang 20

Ví d

Ví dụ ụ::

 H0: mô hình không b: mô hình không bỏỏ sót bisót biếếnn

 Giá trGiá trịị kikiểểm đm địịnh F thu đnh F thu đượược trc trựực tic tiếếp p ttừừ phphầần mn mềềm Statam Stata

ovtest

Ramsey RESET test using powers of the

fitted values of chiphi

Ho: model has no omitted variables

F(3, 4) = 1.52 Prob > F = 0.3380

Trang 22

2.4 Ki

2.4 Kiể ểm đ m địịnh h nh hệ ệ s số ố Lagrange (LM) Lagrange (LM)

đ

đố ối v i vớ ới bi i biế ến thêm vào n thêm vào

 NNếếu chúng ta so sánh hàm chi phí u chúng ta so sánh hàm chi phí

bịị gi giớ ới h i hạ ạn n ccủủa hàm ba hàm bậậc ba.c ba

 H0: h: hệệ ssốố ccủủa bia biếến sn sảản ln lượượng bình ng bình

Trang 23

Kiể ểm đ m địịnh h nh hệ ệ s số ố Lagrange Lagrange

 Ước lượng “phiên bản bị giới hạn”

bằng OLS và thu thập sai số, eii

 Nếu “phiên bản không bị giới hạn” là đúng thì ei ở trên sẽ có tương quan với X2 và X3

 Chạy hồi quy eii theo tất cả các biến:

ei = = 1 + + 2Xii + + 3Xii2 + + 4X3 + vii

vi thỏa các giả định của mô hình CLRM

 Khi cở mẫu lớn,

Trang 24

Kiể ểm đ m địịnh h nh hệ ệ s số ố Lagrange Lagrange

 Nếu nR 2 > >  2 tra bảng, ta bác bỏ H0: các hệ số của X 2 và X 3 bằng không; tức là chúng khác 0, hay mô hình bỏ sót biến.

 Ví dụ: ta trở lại hàm chi phí tuyến tính:

nR 2 = 10.(0,9896)=9,896 >  2 2 tra bảng = 9,2 Kết quả này giống như kiểm định RESET.

Trang 25

3 Sai s

3 Sai số ố c củ ủa phép đo l a phép đo lườ ường ng

 ddữữ liliệệu có thu có thểể thithiếu ếu chính xác do mchính xác do mộột t ssốố lý do nhlý do nhưư: :

• hay sai s hay sai số ố tính toán tính toán

 gây ra nhgây ra nhữững mô hình sai lng mô hình sai lệệchch

 Chúng ta có thể xem xét hậu quả

của việc này trong 2 trường hợp:

3.1 Sai số trong biến phụ thuộc Y:

Trang 26

3.1 Sai số trong biến phụ thuộc Y:

sai của ước lượng   sẽ thay đổi sẽ thay đổi

Trang 27

3.1 Sai số trong biến phụ thuộc Y:

 Ta thấy phương sai, và do đó sai số chuẩn

sẽ tăng lên khi có sai số trong đo lường Yii

Trang 28

3.2 Sai số trong đo lường biến độc

 Bây giờ, thậm chí wii có trung bình bằng 0, độc

lập và không tương quan với uii, chúng ta cũng

không thể có zii độc lập với Xii

Trang 29

3.2 Sai số trong đo lường biến độc lập Xii::

 Cov(zii, Xii) = E[zii – – E(z E(zii)][Xii – – E(X E(Xii – – E(X E(Xii)]

= E(uii  w wii)wii=E( =E(  w wii2 )= )=  w2

 0 0

 Do v ậy, Xii và zii có tương quan và vi phạm các giả định của CLRM Các ước lượng OLS chẳng những bị chệch mà còn không

vững.

 Hậu quả của loại sai sót nghiêm trọng

nhưng khó có thể khắc phục nó vì ta

không biết Xii được như thế nào cho đúng.

 Ta có thể giả định w2 rr ất nhỏ nên xem như không có sai số này và dùng OLS bình

thường.

Trang 30

nó không phảải là vii là việệc dc dễễ dàng.dàng.

 Chúng ta xem lại phần sai số sau:

Yii = = XXiiuii (*) vvà Yà Yii = = XXii + uii (**)

 NNếu (*) đúng nhưng lại ước lượng ếu (*) đúng nhưng lại ước lượng

(**), thì ước lượng

(**), thì ước lượng  s sẽ chệch.ẽ chệch

Trang 31

Tiêu chu

Tiêu chuẩ ẩn l n lự ựa ch a chọ ọn mô hình n mô hình

R 2,

R 2 điđiềều chu chỉỉnh, nh,

 Tiêu chuTiêu chuẩẩn thông tin Akaike (AIC), n thông tin Akaike (AIC),

 Tiêu chuTiêu chuẩẩn thông tin Schwarz n thông tin Schwarz

(SIC),

 Tiêu chuTiêu chuẩẩn n C C p ccủủa Mallows, a Mallows,

 và dvà dựự báo báo χ χ 2

Trang 34

Tiêu chuẩn R2 điều chỉnh ( điều chỉnh ( R R2))

 Ta thấyTa thấyRR2  RR2 RR2 chỉ tăng khi giá trị tuyệt đối của giá trị t của biến

được thêm vào mô hình lớn hơn 1

 Do vậy,Do vậy,RR2 là tiêu chuẩn tốt hơn R2

 Lưu ý, các biến phụ thuộc cũng phải giống nhau

Trang 35

Tiêu chuẩn thông tin Akaike (AIC)

 Trong đó k là số biến được ước lượng (gồm cả hệ

số tự do) và n là cở mẫu.

 Ta thấy AIC phát hiện sai sót khắt khe hơn các tiêu chuẩn trên khi tăng thêm số biến.

 M ô hình nào AIC thấp hơn thì tốt hơn

Để tiện lợi cho

việc tính toán, ta

lấy log:

Trang 36

Tiêu chuẩn thông tin Schwarz (SIC)

 SIC còn khắt khe hơn AIC

 SIC càng nhỏ, mô hình càng tốt

hay

Trang 37

Tiêu chuẩn Cp của Mallows

Ngày đăng: 27/06/2014, 02:20

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w