1. Trang chủ
  2. » Giáo Dục - Đào Tạo

ôn tập kinh tế lượng căn bản

22 670 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 22
Dung lượng 643,88 KB

Nội dung

Các nội dung sẽ trình bày bao gồm:  Đặc điểm của các ước lượng OLS  Ý nghĩa của hệ số hồi quy riêng  Chọn biến giải thích  Chọn dạng hàm  Đa cộng tuyến  Tương quan chuỗi  Phương s

Trang 1

để lập lại những gì có lẽ bạn đã học hoặc có thể tự học từ các bài giảng hoặc giáo trình kinh tế lượng Qua hai buổi

ôn tập này, tôi muốn xoáy vào những điều mà bản thân tôi đã từng thắc mắc nhiều năm về trước Các nội dung sẽ trình bày bao gồm:

 Đặc điểm của các ước lượng OLS

 Ý nghĩa của hệ số hồi quy riêng

 Chọn biến giải thích

 Chọn dạng hàm

 Đa cộng tuyến

 Tương quan chuỗi

 Phương sai thay đổi

 Hướng dẫn một số lệnh trên Stata và Eviews

NỘI DUNG ÔN TẬP 1:

ĐẶC ĐIỂM CỦA CÁC ƯỚC LƯỢNG OLS

Trước hết, chúng ta xem xét mô hình hồi quy đơn với Yi là biến phụ thuộc và Xi là biến giải thích Để đảm bảo ui là

một hạng nhiễu ngẫu nhiên (error term) theo phân phối chuẩn

(normal distribution), chúng ta cần áp đặt một số giả định

và tạm thời chấp nhận các giả định này đúng Lưu ý rằng, để

Trang 2

tiện lợi cho việc đánh máy, tôi xin sử dụng các ký hiệu b1

và b2 thay cho ˆ và 1 ˆ , B2 1 và B2 thay cho 1 và 2, và ei

(phần dư, residuals) thay cho ui theo lối viết truyền thống trong các giáo trình kinh tế lượng

Yi = B1 + B2Xi + ui (1)

Yi = b1 + b2Xi + ei (2) OLS estimates (ordinary least squares) ?

Min ei2 (Yi Yˆi)2

= Yi b1 b2Xi)2 (3) Lấy đạo hàm bậc một theo b1 và b2:

0e

2)

Xbb

Y(2b

e

i i

2 1

i 1

2

0X

e2X

XbbY(2b

e

i i i

i 2 1 i 2

2

Yi = nb1 + b2 Xi (6)

YiXi = b1 Xi + b2 X2i (7) Phương trình (5) và (6) có thể được thể hiện dưới dạng ma trận như sau:

A

2 i i

i

X X

X n

1

B 2

i

XY

Y (8)

Theo quy tắc Cramer, ta có:

i

2 i

i i i i

2 i

XX

n

XYXY

X

(9)

Trang 3

i

2 i

i i i

i

XX

n

YXX

Yn

(10)

Ta có:

b1 = Y b2X (11) Thế b1 ở phương trình (11) vào phương trình (7) để tìm b2như sau:

YY)(

X

= XiYi Y X X Yi XY = XiYi nXY nXY nXY

Trang 4

Thế phương trình (13) và (14) vào phương trình (12) ta có:

2 i

2 i

i X)(Y ) b (X X)X

i

i i

)X

(

)Y

)(

XX

= 2

i

i i

x

yx

x

yx

2 i

i i

i 2

i

i i

XnX

)xYYx)

XX(

)YYx

2 i

i i 2

2 i

i i

i

XnX

YxX

nX

)X

(YYx

2 i

i i

XnX

Yx

= 2

i

i i

x

Yx

(16)

Các công thức ở phương trình (11) và (16) mách cho chúng ta

một điều rất thú vị rằng, b1 là một hàm tuyến tính theo b2,

và b2 là một hàm tuyến tính theo Yi, nên cả b1 và b2 đều là

các hàm tuyến tính theo Yi Và Yi là một hàm tuyến tính theo

ui, vậy b1 và b2 là các hàm tuyến tính theo ui Cho nên, nếu

ui có phân phối chuẩn (dựa theo các giả định CLRM) thì b1 và

b2 cũng sẽ có phân phối chuẩn

Mối quan hệ giữa ước lượng OLS và hạng nhiễu

Công thức ở phương trình (16) có thể được viết lại như sau:

Trang 5

b2 = 2

i

i i

x

Yx = kiYi (17)

b1 = Y b2X = Y X kiYi (19)

2 i 2

i

x

1.x

x

k ) (21)

4 kixi kiXi 1 (22) (do kixi kiXi ) kiXi X ki kiXi)

ui vào công thức (17), ta có

b2 = ki B1 B2Xi ui) = B1 ki B2 kiXi kiui = B2 kiui (23)

Trang 6

có phân phối theo ui (tức phân phối chuẩn) Vấn đề tiếp theo

là chúng ta cần phải xem xét giá trị kỳ vọng và phương sai của các ước lượng b1 và b2?

Đặc điểm của các ước lượng OLS

[tức phân phối xác suất của các ước lượng OLS]

Nhắc lại một số giả định CLRM (xem bài giảng 5 hoặc các

giáo trình kinh tế lượng):

3 Giả định 5: Hạng nhiễu ui có phương sai không đổi

4 Giả định 6: Không có tự tương quan giữa các hạng nhiễu

5 Giả định 10: Mô hình hồi quy được xác định đúng

Giá trị trung bình (kỳ vọng) của b 1 và b 2

Từ (23) và (24), nếu lấy giá trị trung bình của các ước lượng b2 và b1 ta sẽ có:

E(b1) = (B1 X kiui) = B1 (25)

Trang 7

E(b2) = (B2 kiui) = B2 (26) Như vậy, các ước lượng OLS có một tính chất rất quan trọng

là có giá trị trung bình đúng bằng giá trị thực của tổng thể Chính nhờ điều này mà người ta gọi các ước lượng OLS

là các ước lượng không chệch

Sai số chuẩn của b 1 và b 2

Từ định nghĩa về phương sai ta có:

Var(b2) = E[b2 – E(b2)]2

= E(b2 – B2)2 do E(b2) = B2 (27) Thế công thức (23) vào (27), ta có:

Var(b2) = E(B2 + kiui- B2)2 =

2 i

Var(b2) = 2

i

2

x (29) Thực hiện tương tự, ta có:

Var(b1) = E[b1 – E(b1)]2

= E(b1 – B1)2 do E(b1) = B1 (30)

Var(b1) = 2 2

i

2 i

xnX

Trang 8

Lấy căn bậc hai các phương trình (29) và (31) ta có các sai

số chuẩn của các hệ số hồi quy b1 và b2 như sau:

se(b2) =

2 i

x (32)

se(b1) = 2

i

2 i

xn

X (33)

Trong đó, 2 là một hằng số do ta giả định phương sai nhiễu không đổi Với một dữ liệu mẫu nhất định thì ta có thể dễ dàng tính được Xi2 và xi2, trừ 2 Nếu có được một giá trị phương sai nhất định thì các sai số chuẩn của các hệ số hồi quy sẽ có một giá trị xác định

Đặc điểm phương sai của các ước lượng OLS?

(1) Phương sai của b2 tỷ lệ thuận với phương sai nhiễu 2

nhưng tỷ lệ nghịch với x Điều này có nghĩa là, 2ivới giá trị 2 không đổi, các giá trị Xi càng biến thiên quanh giá trị trung bình, thì phương sai của b2

càng nhỏ và vì thế độ chính xác trong việc ước lượng giá trị thực của B2 càng cao Ngược lại, với giá trị 2

i

x không đổi, phương sai nhiễu 2 càng lớn, thì phương sai b2 càng lớn Lưu ý rằng, khi cỡ mẫu tăng,

số số hạng trong x sẽ tăng, nên i2 x sẽ tăng Như i2

vậy, khi n tăng, thì độ chính xác trong việc ước

lượng giá trị thực của B2 càng cao

(2) Phương sai của b1 tỷ lệ thuận với phương sai nhiễu 2

và X nhưng tỷ lệ nghịch với 2i x và cỡ mẫu n 2i

(3) Do các b1 và b2 là các ước lượng, tức là các biến

ngẫu nhiên, nên chúng không chỉ thay đổi từ mẫu này qua mẫu khác mà còn, trong một mẫu nhất định, chúng

có thể phụ thuộc lẫn nhau, và sự phụ thuộc này được

đo bằng hiệp phương sai giữa chúng Hiệp phương sai giữa b1 và b2 được xác định như sau:

Trang 9

b1 1 2 2 (35)Thế (35) vào (34) ta có:

đa cộng tuyến

Như vậy, khi đã có các sai số chuẩn của các ước lượng OLS, se(b1) và se(b2), ta có thể dễ dàng tính được các ước lượng khoảng của các ước lượng OLS

Các đặc điểm này vẫn đúng đối với các ước lượng OLS của mô hình hồi quy bội

NỘI DUNG ÔN TẬP 2:

Ý NGHĨA CỦA HỆ SỐ HỒI QUY RIÊNG

Để đơn giản, chúng ta xét mô hình hồi quy bội với hai biến giải thích X2 và X3:

PRF: Yi = B1 + B2X2i + B3X3i + ui (1)

Trang 10

SRF: Yi = b1 + b2X2i + b3X3i + ei (2) Với giả định bổ sung là không có đa cộng tuyến hoàn hảo (giả định 9), ước lượng OLS b2 và b3 (xem bài giảng 7 hoặc các giáo trình kinh tế lượng) được xác định như sau:

2 i i

2 i

2 i

i i i

i

2 i i

i 2

)xx()x)(

x(

)xx)(

xy()x)(

xy(

2 i i

2 i

2 i

i i i

i

2 i i

i 3

)xx()x)(

x(

)xx)(

xy()x)(

xy(

Theo tôi, bạn có thể không cần để ý đến các công thức “đơn giản” của các ước lượng b2 và b3 [hoặc bk trong mô hình với k biến giải thích] vì về bản chất chúng cũng có các đặc điểm tương tự như ước lượng OLS đã được đề cập rất chi tiết ở NỘI DUNG 1 Vấn đề quan trọng là chúng ta nên hiểu ý nghĩa của các ước lượng này như thế nào cho đúng? Tại sao lại gọi

b2, b3, …, bk là các hệ số hồi quy riêng (partial coefficients) hay ảnh hưởng của Xk lên Y gọi là ảnh hưởng riêng (partial effect)?

Thật ra, hệ số hồi quy b2 ở phương trình (2) có thể được viết lại một cách “quen thuộc” như sau:

Yi = b2 i + vi (5) Ước lượng OLS (như NỘI DUNG 1), ta có:

2 i

i i 2

x

xx

d (nếu chưa hiểu, xem lại NỘI DUNG 1)!

Trang 11

Ta nhận thấy, phần dư i là một phần của X2 không có liên quan gì đến X3 hay nó chính là X2 sau khi đã loại trừ ảnh hưởng của X3 Kết hợp (5) và (7), ta có thể hiểu ý nghĩa của

hệ số b2 như sau: b2 là ảnh hưởng của X2 lên Y khi đã loại trừ ảnh hưởng của X3 Chúng ta thực hiện tương tự cho b3 Đối với mô hình k biến thì i là phần dư của phương trình (ví dụ) x3 = d2x2i + d4x4i + … + dkxki + i

Để hiểu tường tận hơn về mối lien hệ giữa công thức (6) và (3), chúng ta cần một vài phép biến đổi như sau (dành cho những ai thích tìm hiểu sâu):

2 i

i i 2

e

ye

i i

i i i

)dxx

ydxx

=

i i

2 i 2

2 i

i i i

i

xxdx

dx

yxdy

x

=

i i 2

i

i i 2

i

2

2 i

i i 2

i

i i 2

i

i i i

i

xxx

xx2x

x

xxx

yxx

xxy

x

=

2 i

2 i i

2 i i

2 i

2 i

2 i

i i i

i

2 i i

i

x

xx2x

xx

x

x

yxx

xx

yx

i i

2 i

2 i

i i i

i

2 i i

i

xxx

x

xxyxx

yx

(3)

Qua phân tích trên, chúng ta rút ra hai điều thế này:

Trang 12

1 Chúng ta có thể xem i như xi trong hồi quy đơn, và các đặc điểm của ước lượng OLS b2, b3, …, bk được phân tích một cách tương tự như ở NỘI DUNG 1

2 Nếu có hiện tượng đa cộng tuyến hoàn hảo, thì i bằng

0, nên không thể ước lượng được bk Nếu có hiện tượng

đa cộng tuyến, thì giá trị i sẽ thay đổi (giảm), nên

bk có thể bị ước lượng thấp và/hoặc không có ý nghĩa thống kê

NỘI DUNG ÔN TẬP 3:

XÁC ĐỊNH MÔ HÌNH: CHỌN BIẾN GIẢI THÍCH

Hai vấn đề quan trọng khi chọn biến giải thích là bỏ sót biến thích hợp (omitted relevant variables) và thừa biến không thích hợp (included irrelevant variables) Phần này

sẽ giúp bạn hiểu rõ tại sao chúng ta thường quan tâm nhiều đến vấn đề bỏ sót biến quan trọng và đề xuất các tiêu chí

để xác định đúng mô hình khi thực hiện dự án nghiên cứu

Bỏ sót biến thích hợp

Giả sử mô hình đúng có dạng như sau:

Yi = B1 + B2X2i + B3X3i + ui (1) Tuy nhiên, vì lý do nào đó mà ta ước lượng mô hình sau đây:

Yi = b1 + b2X2i + u*i (2) (Yi = B1 + B2X2i + u*i => u*i = B3X3i + ui) (3) giả sử rằng:

X3i = a0 + a1X2i + ei (4)

và ước lượng OLS với phương trình (2), ta có:

b2 = kiYi= B2 + kiu*i (5)

Trang 13

thế (3) vào (5), ta có:

= B2 + ki ui B3X i] = B2 + kiui B3 kiX i]

(6) thế (4) vào (6), ta có:

= B2 + kiui B3 ki[a0 a1X i i] = B2 + kiui B3 kia0 B3a1 kiX i B3 ki i]

= B2 + kiui 0 B3a1.1 B3 ki i] (7)

Lấy giá trị kỳ vọng của b2 từ phương trình (7), ta có:

E(b2) = B2 + B3a1 (8)

Lưu ý: khi B3 = 0 hoặc a1 = 0?

Chỉ khi r23 = 0 (tức X2 và X3 độc lập) thì các ước lượng OLS

sẽ không bị chệch (unbiased) và phương sai của các ước lượng OLS không giảm

True Var(b2) = 2

i

2 3 2

2

x)r

1 ≥ false Var(b2) = 2i

2

x

Thừa biến không thích hợp

Giả sử mô hình đúng có dạng như sau:

Yi = B1 + B2X2i + ui (9)

Trang 14

Tuy nhiên, vì lý do nào đó mà ta ước lượng mô hình sau đây:

Yi = b1 + b2X2i + b3X3i + u*i (10) (Yi = B1 + B2X2i + B3X3i + ui

=> u*i = ui - B3X3i) (11) giả sử rằng: B3 = 0

Do B3 = 0, nên u*

i = ui, => E(b2) = B2 Tuy nhiên,

True Var(b2) = 2

i 2

2

x ≤ false Var(b2) = 2

i 2

2 3 2

2

x)r1

Như vậy, thừa biến không thích hợp không làm chệch các ước lượng OLS Tuy nhiên, điều này có thể làm tăng phương sai (và vì thế các sai số chuẩn) của các ước lượng OLS, và vì thế là tăng khả năng chấp nhận giả thiết H0

Tiêu chí quan trọng cần lưu ý khi xác định dạng mô hình:

- Graph, normality test!!!

NỘI DUNG ÔN TẬP 4:

Trang 15

 Forecast beyond the range of the sample data => greater error

Basic Functional Forms?

Problems with Incorrect Functional Forms?

NỘI DUNG ÔN TẬP 5:

ĐA CỘNG TUYẾN (MULTICOLLINEARITY)

SE(b2) =

) r 1 ( x

f.

d /

uˆ 2 23

2 i 2

2 i

(12)

Problems?

- Estimates will remain unbiased

- The Vars and S.E of the estimates will increase

- The computed t-scores will fall

- Estimates will become very sensitive to changes in specification (dạng hàm và dữ liệu) …

Detection?

- Correlation Coefficients (công thức? hạn chế gì?)

- VIF = 2

i R 1

1 (giải thích R2

i? rule of thumb: VIF > 5)

Remedies?

- Do nothing (mô hình dự trên cơ sở lý thuyết, các hệ số

có ý nghĩa thống kê, dấu như kỳ vọng; và tránh loại bỏ biến vì có thể dẫn đến ước lượng chệch do bỏ sót biến thích hợp)

- Drop a redundant variable (khi nào?)

- Transform the multicollinear variables (composite variable, dạng biến)

- Increase the size of the sample (tại sao?)

Trang 16

NỘI DUNG ÔN TẬP 6:

TƯƠNG QUAN CHUỖI (SERIAL CORRELATION)

Yt = B1 + B2Xt + εt (1)

εt = ρεt-1 + ut (2)

Yt = B1 + B2Xt + ρεt-1 + ut (3)

ρYt-1 = ρB1 + ρB2Xt-1 + ρεt-1 (4) Thế ρεt-1 ở (4) vào (3), ta có:

Yt - ρYt-1 = B1(1-ρ)+ B2(Xt - ρXt-1) + ut (5) Khi ρ ≠ 1, ta gọi dữ liệu chuyển đổi như ở (5) là quasi-

differenced data, và khi ρ = 1, ta gọi là first difference

2

2 u

1 ) ( Var

Pure v.s Impure Serial Correlation?

Durbin-Watson test for AR(1) [d statistic]/Breusch-Godfrey test for AR(q) [LM statistic]

[Feasible] GLS (quasi-difference: Cochrane-Orcutt method,

AR method, and first difference)

Conditions: Strictly exogeneous, and AR(1) only

 Cochrane-Orcutt method:

Bước 1: Yt = b1 + b2Xt + et (6)

Bước 2: et = ˆet-1 + ut (7) Bước 3: Yt - ˆYt-1 = b1(1-ˆ)+ b2(Xt - ˆXt-1) + ut (8)

 AR(1): tương tự, và hệ số theo AR(1) là ˆ

Yt = b1 + b2Xt + ˆAR(1) + et (9)

Trang 17

(see Wooldridge, p.408)

tsset year

prais inf unem, corc

Trang 18

Newey-West (1987) S.E? (Wooldridge, p.411-412)

[serial correlation-robust standard error for bk]

[use "D:\Wooldridge Data _ 2003\STATA\PRMINWGE.DTA", clear]

tsset time

newey y x, lag(#)

NỘI DUNG ÔN TẬP 7:

PHƯƠNG SAI THAY ĐỔI (HETEROSKEDASTICITY)

Nhắc lại công thức phương sai của ước lượng OLS (xem lại NỘI DUNG 1)

Trang 19

- Create log(e 2 )

- Run the regression log(e 2 ) on x 1 , x 2 , …, x k , and obtain the fitted values, g

- Exponentiate the fitted values: h = exp(g)

- Estimate the equation y = B 1 + B 2 X 2 + … + B k X k + u by WLS using weights 1/h

[see Wooldridge, p.264]

Trang 20

NỘI DUNG ÔN TẬP 8:

HƯỚNG DẪN STATA 11 VÀ EVIEWS 6

Hồi quy OLS

Sau khi hồi quy:

predict res, residuals

Trang 21

View\Residual tests\Serial correlation LM test

Kiểm định phương sai thay đổi

Ngày đăng: 25/11/2014, 09:46

TỪ KHÓA LIÊN QUAN

w