Ước lượng phương sai của hệ số hồi qui của một biến ñược ñưa vào nói chung sẽ bị thiên lệch, và vì vậy các kiểm ñịnh giả thuyết sẽ không có ý nghĩa.. Các ước lượng và trị dự báo sẽ bị t[r]
(1)CHƯƠNG 4
Mơ Hình Hồi Qui Bội
Trong Chương giới hạn trường hợp đơn giản mơ hình hồi qui hai biến Bây giờ, xem xét hồi qui bội, nghĩa liên hệ biến phụ thuộc Y cho trước với nhiều biến ñộc lập X1, X2, , Xk Mơ hình hồi qui tuyến tính đa biến có cơng
thức tổng qt sau:
Yt = β1 + β2Xt2 + + βkXtk + ut (4.1)
Xt1 ñược ñặt ñể có ñược “tung ñộ gốc” Chữ t nhỏ biểu thị số lần quan sát
và có giá trị từ đến n Các giả thiết số hạng nhiễu, ut, hoàn toàn giống giả
thiết ñã xác ñịnh Chương Trong đặc trưng tổng qt mơ hình hồi qui bội, Việc lựa chọn biến ñộc lập biến phụ thuộc xuất phát từ lý thuyết kinh tế, trực giác, kinh nghiệm q khứ Trong ví dụ ngành bất động sản Chương 3, biến phụ thuộc giá nhà hộ gia đình Chúng ta đề cập số giá
- hưởng thụ phụ thuộc vào ñặc ñiểm nhà Bảng 4.1 trình bày liệu bổ sung
cho 14 nhà mẫu ñã bán Lưu ý rằng, liệu cho X1 ñơn giản cột gồm
số tương ứng với số hạng khơng đổi Tính số hạng khơng đổi, có tất k biến
độc lập có k hệ số tuyến tính chưa biết cần ước lượng
Mơ hình tuyến tính bội ví dụ sau:
PRICE = β1 + β2SQFT + β3BEDRMS + β4BATHS + u (4.2)
Cũng trước, giá tính đơn vị ngàn la Ngồi diện tích sử dụng, giá liên hệ với số phòng ngủ số phòng tắm
Ảnh hưởng thay đổi Yt có Xti thay đổi ñược xác ñịnh ∆Yt
/∆Xti = βi Vì vậy, ý nghĩa hệ số hồi qui βi là, giữ giá trị tất biến khác
khơng đổi, Xti thay đổi ñơn vị Yt kỳ vọng thay ñổi, trung bình là, βi đơn vị Do
đó, β4 phương trình (4.2) diễn giải sau: Giữa hai nhà có diện
tích sử dụng (SQFT) số phịng ngủ (BEDRMS), nhà có thêm phịng tắm
được kỳ vọng bán với giá cao hơn, trung bình, khoảng β4 ngàn la Vì vậy, phân tích
hồi qui bội giúp kiểm sốt tập hợp biến giải thích kiểm tra
ảnh hưởng biến ñộc lập ñã chọn
Bảng 4.1 Dữ liệu nhà hộ gia đình (giá tính ngàn ñô la)
t
Giá (Y)
Hằng số (X1)
SQFT (X2)
BEDRMS (X3)
BATHS (X4)
1 199,9 1.065 1,75
(2)3 235 1.300
4 285 1.577 2,5
5 239 1.600
6 293 1.750
7 285 1.800 2,75
8 365 1.870
9 295 1.935 2,5
10 290 1.948
11 385 2.254
12 505 2.600 2,5
13 425 2.800
14 415 3.000
4.1 Phương trình chuẩn
Trong trường hợp mơ hình hồi qui bội, Giả thiết 3.4 hiệu chỉnh sau: Mỗi X cho
trước cho Cov(Xsi, ut) = E(Xsi ut) = với i từ ñến k s, t từ đến n Vì vậy, biến độc lập giả định khơng liên hệ với tất số hạng sai số Trong trường hợp thủ tục bình phương tối thiểu thơng thường (OLS), định nghĩa tổng bình phương sai số
ESS = Σn t = 1 ut
^2 = Σn
t = 1 (Yt - β
^
1 - β^2Xt2 - - β^kXtk)2
Thủ tục OLS cực tiểu ESS theo β^1, β^2 , β^k Bằng cách thực Phần 3.A.3, có phương trình chuẩn, số phương trình chuẩn số hệ số tuyến tính ước lượng Do có k phương trình k hệ số hồi qui chưa biết (các tổng tính theo số t – nghĩa số lần quan sát):
ΣYt = n(^)β
^
1 + β
^2Σ
Xt2 + + β
^kΣ
Xtk
ΣYtXt2 = β
^1Σ
Xt2 +β
^2Σ
X2t2 + + β
^kΣ
XtkXt2 ΣYtXti = β^1ΣXti + β^2Σ Xt2Xti + + β^kΣ XtkXti ΣYtXtk = β^1ΣXtk + β^2Σ Xt2Xtk + + β^kΣ X2tk
k phương trình chuẩn giải ñược nghiệm ñơn β (chỉ trừ vài trường hợp ngoại lệ trình bày Chương 5) Các chương trình máy tính chuẩn thực tính tốn nhập liệu vào xác ñịnh biến ñộc lập, biến phụ thuộc Phụ lục 4.A.1 mơ tả bước mơ hình ba biến Y hồi qui theo số hạng khơng đổi, X2 X3
Các tính chất 3.1 đến 3.3 trường hợp hồi qui tuyến tính bội Do đĩ, ước lượng OLS BLUE, khơng thiên lệch, hiệu quán Phần dư giá trị dự đốn cĩ từ liên hệ sau:
(3)Yt
^
= β^1 + β
^
2Xt2 + + β
^
kXtk = Yt - u^t
VÍ DỤ 4.1
ðối với mơ hình nêu Phương trình (4.2), liên hệ ước lượng (xem phần Thực hành máy tính 4.1)
PRICE = 129,062 + 0,1548SQFT – 21,588BEDRMS – 12,193BATHS
Lập tức lưu ý hệ số hồi qui BEDRMS BATHS ñều âm, trái với mong đợi Chúng ta cảm thấy theo trực giác thêm phòng tắm phòng ngủ tăng giá trị nhà Tuy nhiên, hệ số hồi qui có ý nghĩa mọi biến khác khơng thay đổi Do đó, tăng số phòng ngủ lên một, giữ
nguyên SQFT BATHS khơng đổi, giá trung bình kỳ vọng hạ xuống khoảng
$21.588 Nếu diện tích sử dụng chia nhỏ để có thêm phịng ngủ phịng ngủ có diện tích nhỏ Dữ liệu cho thấy là, trung bình, người mua đánh giá thấp việc chia nhỏ diện tích họ sẵn lịng trả mức giá thấp
Lý luận tương tự cho BATHS Giữ ngun SQFT BEDRMS khơng đổi, ta tăng thêm phịng tắm, giá trung bình kỳ vọng giảm khoảng $12.193 Một lần nữa, tăng thêm phịng tắm giữ ngun diện tích sử dụng có nghĩa phịng ngủ nhỏ Kết cho thấy khơng đồng ý khách hàng quan sát thấy giá trung bình giảm Từ lập luận lưu ý dấu khơng mong ñợi lúc ñầu (thường ñược gọi “dấu sai”) lại ñược giải thích hợp lý
Giả sử tăng thêm phịng ngủ tăng thêm diện tích sử dụng khoảng 300 (cho thêm hành lang yếu tố liên quan khác) BEDRMS tăng thêm SQFT tăng thêm 300 Thay ñổi giá trung bình (∆PRICE) kết tác động kết hợp sau:
∆ PRICE = β^2∆SQFT+ β
^
3∆BEDRMS = 300β
^
2 + β
^
3
Trong mơ hình, phần thể khoảng tăng $24.852 giá trung bình ước lượng [được tính sau (300 x 0,1548) – 21,588; đơn vị ngàn la], mức giá hợp lý
BÀI TẬP THỰC HÀNH 4.1
Giả sử tăng thêm phịng tắm phịng ngủ, với diện tích sử dụng tăng thêm 350 vuông Mức giá trung bình kỳ vọng tăng thêm bao nhiêu? Giá trị có đáng tin khơng?
BÀI TẬP THỰC HÀNH 4.2
(4)Một ước lượng không thiên lệch phương sai phần dư σ2 tính s2 = σ^2
= Σu^t2 /(n-k), với n số lần quan sát sử dụng ước lượng k số hệ số hồi qui ước lượng, gồm số hạng khơng đổi Chứng minh phát biểu ngun tắc tương tự như trình bày phần 3.A.7, phức tạp nhiều có đến k phương trình chuẩn ñây (xem Johnston, 1984, trang 180-181) Trong Chương chia tổng bình phương sai số cho n – để ước lượng khơng thiên lệch σ2 Ở đây, k phương trình chuẩn ñặt k ràng buộc, ñiều dẫn ñến việc “mất đi” k bậc tự Vì vậy, chia cho n – k Bởi σ^2 phải khơng âm, n phải lớn k Thủ tục để tính sai số chuẩn β^ tương tự, phép tính nhàm chán nhiều Các chương trình máy tính cung cấp phép tốn thống kê cần thiết để ước lượng thơng số kiểm định giả thuyết chúng Có thể thấy Σu^t2 / σ2 có phân phối Chi bình phương với bậc tự n – k (xem Johnston, 1984, trang 181) Các kết ñược tóm tắt tính chất 4.1
Tính Chất 4.1
a Một ước lượng không thiên lệch phương sai sai số (σ2) tính
s2 = σ^2 = ESS
n - k =
Σu^t
2
n - k
với ESS tổng bình phương phần dư
b ESS/σ2 có phân phối Chi bình phương với bậc tự n – k Lưu ý tính chất phụ thuộc ñặc biệt vào Giả thiết 3.8 số hạng sai số ut tuân theo phân phối chuẩn N(0,σ2)
Các Giá Trị Dự Báo Và Sai Số Chuẩn
Cũng mơ hình hồi qui ñơn biến, quan tâm ñến tạo dự báo có điều kiện biến phụ thuộc với giá trị cho trước biến ñộc lập Giả sử Xfi giá trị cho trước biến ñộc lập thứ i với i = 2, , k, t = f, với giá trị muốn dự báo Y ðịnh nghĩa
β = β1 + β2Xf2 + … + βkXfk
Và β^ = Y^f, định nghĩa trước t = f, dự báo cần có giá trị ước lượng β, sai số chuẩn tương ứng giúp xây dựng khoảng tin cậy cho dự báo Giải β1 từ phương trình thay vào mơ hình ban đầu, có
Yt = β - β2Xf2 - - βkXfk + β2Xt2 + +βkXtk + ut Nhóm số hạng cách thích hợp, ta viết lại sau:
(5)với Zti = Xti – Xfi, cho i = 2, , k Việc viết lại cơng thức bước sau để tiến hành dự báo
Bước Với giá trị Xfi cho trước biến ñộc lập thứ i t = f , tạo biến Zti = Xti – Xfi với i = 2, , k
Bước Hồi qui Yt theo số hạng biến Zt2, , Ztk
Bước Số hạng khơng đổi ước lượng dự báo ñiểm cần có Khoảng tin cậy
tương ứng (xem phần 3.8) tính β^ - t*sf, β
^
+ t*sf), với t* giá trị tới hạn phân phối t với bậc tự n – k mức ý nghĩa cho trước, sf sai số chuẩn số hạng khơng đổi ước lượng có từ bước
VÍ DỤ 4.2
Trong ví dụ bất động sản, đặt SQFT = 2.000, BEDRMS = BATHS = 2,5 Bước thứ tạo biến mới, SQFT2 = SQFT – 2000, BEDRMS2 = BEDRMS – BATHS2 = BATHS – 2,5 Kế ñến hồi qui PRICE theo số hạng khơng đổi SQFT2, BEDRMS2 BATHS2 Từ thực hành máy tính phần 4.1 lưu ý giá trung bình dự báo nhà $321.830 sai số chuẩn dự báo $13.865 ðiều cho khoảng tin cậy 95% 321.830 ± (2,201 x 13.865) tính khoảng tin cậy (291.313; 352.347)
4.2 ðộ Thích Hợp
Khi đánh giá mức độ thích hợp, tổng bình phương tồn phần, tổng bình phương hồi qui, tổng bình phương sai số có dạng trình bày trước, ñây có TSS = RSS + ESS (miễn mơ hình có số hạng khơng đổi) Vì vậy,
TSS = Σ (Yt - Y
_
)2 RSS = Σ(Y^t - Y
_
)2 ESS = Σu^t2
Mức độ thích hợp đo trước ñây R2 = – (ESS/TSS) Nếu có số hạng khơng đổi mơ hình, R2 với bình phương hệ số tương quan Yt Y
^
(6)ðể ngăn chặn tình trạng “có đưa thêm biến vào mơ hình” nêu trên, phép đo khác mức độ thích hợp sử dụng thường xun Phép ño gọi
R2 hiệu chỉnh R2 hiệu chỉnh theo bậc tự (chúng ta thấy kết kết
quả in máy tính Chương 3) ðể phát triển phép ño này, trước hết phải nhớ R2 ño lường tỷ số phương sai Y “ñược giải thích” mơ hình; cách tương đương, trừ tỷ số “khơng giải thích” phương sai sai số Var(u)
Phép ño tự nhiên gọi R–2 (R-ngang bình phương),
R–2 = – Var(u) Var(Y)
Chúng ta biết ước lượng không thiên lệch σ2 = Var (u) tính bằng ESS/(n – k), ước lượng khơng thiên lệch Var (Y) tính TSS/(n – 1) Thay vào phương trình ta có
R−2 = −ESS/(n − k) TSS/(n −1) = −
ESS(n − 1) TSS(n −k)
= −n −
n −k(1 − R
2
) = −σ ^2
(n − 1) TSS
Việc thêm vào biến dẫn ñến tăng R2 làm giảm ñi bậc tự do, ñang ước lượng thêm tham số R2 hiệu chỉnh phép đo độ thích hợp tốt cho phép đánh đổi việc tăng R2 giảm bậc tự Cũng cần lưu ý (n −1) / (n − k) khơng nhỏ R−2 không lớn R2 Tuy nhiên, R2 âm, R−2 nhỏ khơng Ví dụ, n = 26, k = 6, R2 = 0,1, có R−2 = − 0,125 R−2 âm cho thấy mơ hình khơng mơ tả đầy đủ q trình phát liệu
VÍ DỤ 4.3
(7)mơ hình giải thích thay đổi PRICE Nó đề cập có ích việc kiểm định giả thuyết (đề cập phần 4.4 )
Trong mơ hình A SQFT giải thích 80,6 phần trăm thay đổi giá nhà Tuy nhiên, tất ba biến đưa vào, mơ hình giải thích 78,7 phần trăm thay ñổi giá, ñiều hợp lý ñối với nghiên cứu chéo Nếu biến bổ sung thêm vào, khả giải thích mơ hình cao Ví dụ, kích thước, số lượng loại ñồ gia dụng … v.v biến thêm vào Tuy nhiên, liệu khơng có sẵn mẫu liệu, thêm nhiều biến vào Trong Chương 7, thảo luận tác ñộng hồ bơi ñến giá nhà
Bảng 4.2 Các Mơ Hình Ước Lượng Cho Dữ Liệu Giá Nhà
Biến số Mơ hình A Mơ hình B Mơ hình C Mơ hình D
HẰNG SỐ 52,351
(1,404)
121,179
(1,511)
129,062
(1,462)
317,493
(13,423)
SQFT 0,13875 0,14831 0,1548
(7,407) (6,993) (4,847)
BEDRMS − 23,911 − 21,588
(− 0,970) (− 0,799)
BATHS − 12,193
(− 0,282)
ESS 18.274 16.833 16.700 101.815
R2 0,821 0,835 0,836 0,000
R−2 0,806 0,805 0,787 0,000
F 54,861 27,767 16,989 180,189
d.f 12 11 10 13
SGMASQ 1.523* 1.530 1.670 7.832
AIC 1.737* 1.846 2.112 8.389
FPE 1.740* 1.858 2.147 8.391
HQ 1.722* 1.822 2.077 8.354
SCHWARZ 1.903* 2.117 2.535 8.781
SHIBATA 1.678* 1.718 1.874 8.311
GCV 1.777* 1.948 2.338 8.434
RICE 1.827* 2.104 2.783 8.485
Ghi chú: giá trị ngoặc trị thống kê t tương ứng, hệ số chia cho sai số chuẩn chúng
(8)
BÀI THỰC HÀNH 4.3
Chứng minh R−2 σ^2 chuyển ñộng ngược chiều nhau; nghĩa R−2 tăng, σ^2 thiết phải giảm (Vì vậy, chọn mơ hình có R−2 cao đồng nghĩa với chọn mơ hình có σ^2 thấp hơn.)
Tính R2 R−−−−2 khơng có số hạng khơng đổi *
Tổng bình phương gộp TSS = RSS + ESS có giá trị mơ hình có số hạng khơng đổi Nếu mơ hình khơng có số hạng khơng đổi, tổng bình phương gộp thích hợp ΣYt2 = ΣYt^2 + Σu^t2 Lưu ý giá trị trung bình Y
−
khơng trừ Một số chương trình máy tính tính R2 − (ESS/ΣYt2) khơng có số hạng tung độ gốc Cơng thức Viện Tiêu chuẩn Cơng nghệ Quốc gia đề nghị sử dụng Tuy nhiên, giá trị tính theo cách khơng tương thích với giá trị tính TSS mẫu số khác hai mơ hình Nếu mục tiêu so sánh mơ hình có khơng có số hạng khơng thay đổi, mặt mức độ thích hợp, cơng thức tính R2 khơng thể độc lập với mơ hình Tốt nên dùng − (ESS/TSS) hai trường hợp để so sánh R2 Nếu R2 tính TSS mẫu số, có giá trị âm số hạng khơng đổi khơng có mặt mơ hình Giá trị âm thể mơ hình khơng đặc trưng tốt Một lựa chọn khác có lẽ phép đo tốt R2 bình phương hệ số tương quan Yt Y^t, giá trị ln ln khơng âm
Chúng ta lập luận trước ñây R−2 = − [Var(u) / Var(Y)] phép ño tốt thay ñổi biến Y giải thích mơ hình ðiều cho cơng thức
R−2 = −ESS ÷ (n − k) TSS ÷(n − 1)
trong trường hợp
Vì chương trình máy tính khác cách tính R2 R−2 trường hợp khơng có số hạng khơng đổi, ñề nghị ñộc giả kiểm tra chương trình ñược sử dụng xác ñịnh xem phép đo có tương thích mơ hình hay khơng Các nhà điều tra thường loại số hạng khơng đổi khơng có ý nghĩa để làm tăng mức ý nghĩa thống kê biến lại (ví dụ, mơ hình giá tài sản vốn Ví dụ 1.3 khơng có số hạng khơng đổi), việc thực hành khơng khuyến khích dẫn đến mơ hình khơng đặc trưng (xem thêm phần 4.5)
4.3 Các Tiêu Chuẩn Chung ðể Chọn Mơ Hình
Chúng ta ñã chứng minh trước ñây cách tăng số biến mơ hình, tổng bình phương phần dư Σu^t2 giảm R2 tăng, ñổi lại bậc tự giảm R
−2
(9)Nhìn chung, mơ hình đơn giản ưa thích hai lý kỹ thuật sau Thứ nhất, đưa q nhiều biến vào mơ hình khiến cho độ xác tương đối riêng hệ số giảm ðiều ñược nghiên cứu kỹ Chương Thứ hai, việc giảm bậc tự giảm lực kiểm ñịnh hệ số Vì vậy, xác suất việc khơng bác bỏ giả thuyết sai (sai lầm loại II) tăng bậc tự giảm Các mơ hình đơn giản dễ hiểu mơ hình phức tạp Vì vậy, lý tưởng nên thiết lập tiêu chuẩn hạn chế mơ hình lớn khơng ln ln chọn mơ hình đơn giản
Trong năm gần đây, nhiều tiêu chuẩn chọn mơ hình đề nghị Tất tiêu chuẩn có dạng tổng bình phương phần dư (ESS) nhân với nhân tố bất lợi phụ thuộc vào mức ñộ phức tạp mơ hình Mơ hình phức tạp ESS giảm lại tăng tính bất lợi Các tiêu chuẩn phải cung cấp loại ñánh ñổi khác mức độ thích hợp độ phức tạp mơ hình Một mơ hình có trị thống kê tiêu chuẩn thấp ñược ưa chuộng Trong phần này, trình bày tóm tắt tổng qt nhân tố bất lợi mà khơng sâu vào phần kỹ thuật yếu tố Nếu ñộc giả quan tâm ñến tóm tắt đầy đủ chi tiết với ứng dụng, bạn tham khảo báo Engle Brown (1985)
Akaike (1970, 1974) xây dựng hai phương pháp, ñược gọi sai số hồn
tồn xác định trước (FPE) phương pháp thứ hai gọi tiêu chuẩn thông tin Akaike (AIC) Hannan Quinn (1979) ñề nghị phương pháp khác (ñược gọi tiêu chuẩn HQ) Các tiêu chuẩn khác gồm Schwarz (1978), Shibata (1981), Rice (1984),
phương pháp tính xác chéo tổng quát (GCV) ñược Craven Wahba (1979) phát triển ñược Engle, Graner, Rice, Weiss (1986) sử dụng Mỗi trị thống kê ñều dựa vài tính chất tối ưu, chi tiết phương pháp ñược ñề cập báo liệt kê (lưu ý báo địi hỏi kiến thức đại số tuyến tính) Bảng 4.3 tóm tắt tiêu chuẩn (n số lần quan sát k số thông số ước lượng)
Khơng cần thiết phải đưa R−2 vào tiêu chuẩn R−2 vàSGMASQ σ^2) quan hệ nghịch, giá trị SGMASQ thấp có nghĩa R−2 có giá trị cao R−2 có ích xác ñịnh tỷ số biến ñổi Y giải thích biến X
Bảng 4.3 Tiêu Chuẩn Chọn Mơ Hình
SGMASQ: ESS
n
–
k n
- HQ:
ESS
n (ln n) 2k/n AIC: ESS
n e
(2k/n) RICE:
ESS
n
–
2k n - FPE: ESS n
n + k n – k
SCHWARZ: ESS
n n k/n GVC: ESS
n
–
k n
- SHIBATA:
ESS n
(10)Một cách lý tưởng, muốn có mơ hình có giá trị trị thống kê ñều thấp, so sánh với mơ hình khác Mặc dù xếp hạng vài tiêu chuẩn ñối với giá trị ESS, n, k cho trước, thứ tự khơng cịn ý nghĩa bởi mơ hình có ESS k khác Ramanathan (1992) khảo sát kỹ số trường hợp ñặc biệt Trong trường hợp dặc biệt này, số tiêu chuẩn trở nên dư thừa – nghĩa là, mơ hình ưu việt theo tiêu chuẩn ưu việt xét theo tiêu chuẩn khác Tuy nhiên, cách tổng quát, tìm mơ hình ưu việt theo tiêu chuẩn lại không ưu việt theo tiêu chuẩn khác Ví dụ, tiêu chuẩn Schwarz coi trọng tính phức tạp mơ hình yếu tố khác dẫn đến kết luận khác Một mơ hình tốt mơ hình khác theo số tiêu chuẩn ñược ưa chuộng Tuy nhiên, tiêu chuẩn AIC tiêu chuẩn ñược sử dụng phổ biến phân tích chuỗi thời gian
VÍ DỤ 4.4
ðối với liệu giá nhà ở, Bảng 4.2 có trị thống kê lựa chọn mơ hình ba mơ hình Tất tiêu chuẩn đánh giá cao mơ hình đơn giản nhất, mơ hình có biến giải thích SQFT ðiều có nghĩa việc giảm ESS tính phức tạp mơ hình khơng đủ để đánh đổi với nhân tố bất lợi gắn liền với mơ hình phức tạp Kết thật khơng q bất ngờ Diện tích sử dụng phụ thuộc vào số phịng ngủ phịng tắm nhà Mơ hình A khơng trực tiếp đề cập đến BEDRMS BATHS Do đó, khơng nên kỳ vọng mơ hình B C tốt giảm ESS ñủ thấp
4.4 Kiểm ðịnh Giả Thuyết
Trong phần thảo luận ba loại kiểm ñịnh giả thuyết: (1) kiểm ñịnh mức ý nghĩa thống kê hệ số riêng lẻ, (2) kiểm ñịnh số hệ số hồi qui liên kết, (3) kiểm định tổ hợp tuyến tính hệ số hồi qui
Kiểm ðịnh Các Hệ Số Riêng Lẻ
Như Chương 3, kiểm ñịnh giả thuyết hệ số hồi qui ñơn ñược tiến hành kiểm ñịnh t Các tính chất mà β^i tuân theo phân phối chuẩn ESS/σ2 = (n – k) σ^2 /σ2 tuân theo phân phối chi bình phương mở rộng cho trường hợp đa biến Chỉ có hiệu chỉnh ESS/σ2 phân phối chi bình phương với n – k d.f Các bước tiến hành kiểm ñịnh hệ số riêng biệt sau:
KIỂMðỊNH T MỘTPHÍA
Bước Ho: β = β0, H1: β > β0
(11)Bước Tìm bảng tra t giá trị tương ứng với bậc tự n − k tìm điểm t*n-k
(α) cho diện tích phần bên phải ñiểm mức ý nghĩa (α)
Bước Bác bỏ giả thuyết không tc > t* Nếu trường hợp H1 : β < β0, H0 bị bác bỏ tc < − t* Một cách tương ñương cho hai trường hợp, bác bỏ |tc| > t*
ðể sử dụng phương pháp giá trị p, tính p = P(t > |tc|, với H0 cho trước) bác bỏ H0 giá trị p nhỏ mức ý nghĩa
VÍ DỤ 4.5
Chúng ta áp dụng với Mơ hình B C Bảng 4.2 Mơ hình B có bậc tự 11 d.f (14 − 3) Mơ hình C có bậc tự 10 Từ Bảng A.2, t*11(0,05) = 1,796 t*10 (0,05) = 1,812 ñối với kiểm ñịnh 5% Vì vậy, để hệ số hồi qui dương âm có ý nghĩa thống kê, giá trị tuyệt đối trị thống kê t cho Bảng 4.2 phải lớn 1,796 Mơ hình B lớn 1,812 Mơ hình C Chúng ta lưu ý mơ hình hệ số hồi qui SQFT có ý nghĩa ðiều có nghĩa trường hợp đó khơng thể bác bỏ giả thuyết không hệ số tương ứng khơng
Có hay khơng mức ý nghĩa khác phần trăm ta bác bỏ giả
thuyết khơng được? Sau cùng, khơng có đặc biệt mức phần trăm Nếu mức ý
nghĩa thực cao chút, sẵn sàng bác bỏ giả thuyết không Chúng ta lưu ý từ Bảng A.2 ñối với mức ý nghĩa 10 phần trăm, t*10 (0,1) = 1,372 Trị thống kê t BEDRMS Mơ hình C 0,799 trị tuyệt ñối, nhỏ 1,372 Do đó, kết luận BEDRMS khơng có ý nghĩa Mơ hình C, mức ý nghĩa 10 phần trăm
Sử dụng chương trình GRETL, ñã tính giá trị p cho hệ số BEDRMS BATHS (xem phần thực hành máy tính 4.1) Các hệ số xếp từ 0,175 ñến 0,39, ngụ ý bác bỏ giả thuyết khơng hệ số khơng, có hội từ 17,5 ñến 39 phần trăm phạm sai lầm loại I Khi hệ số cao mức chấp nhận thông thường, không bác bỏ H0 thay vậy, kết luận hệ số không khác không cách có ý nghĩa
KIểM ðịNH tHAI PHÍA
Bước H0: β = β0, H1: β≠β0
Bước Thiết lập trị thống kê t, tc = β^−β0)/ β^, với β^ giá trị ước lượng β^ sai số chuẩn Theo giả thuyết H0, β^ tuân theo phân phối t với bậc tự n−k Bước Tìm Bảng t A.2 giá trị tương ứng với bậc tự n − k tìm t*n-k(α/2)
cho diện tích bên phải phân nửa mức ý nghĩa
Bước Bác bỏ giả thuyết không |tc| > t*
ðể sử dụng giá trị p, tính giá trị p = 2P(t> |tc|, với H0 cho trước) bác bỏ H0 p nhỏ mức ý nghĩa
(12)β0 = 0) kết luận hệ số khác khơng đáng kể Nếu giá trị p cao, khơng thể bác bỏ giả thuyết khơng thay vào kết luận hệ số khơng có ý nghĩa thống kê
VÍ DỤ 4.6
Chúng ta áp dụng kiểm định hai phía với Mơ hình B C Trong Mơ hình B, bậc tự 11 t*11(0,025) 2,201 ñối với mức ý nghĩa phần trăm Trong Mơ hình C,
t*10(0,025) = 2,228 Vì vậy, để hệ số hồi qui khác khơng có ý nghĩa mức ý nghĩa 5 phần trăm, trị thống kê t cho bảng 4.2 phải lớn 2,201 giá trị tuyệt đối Mơ hình B lớn 2,228 giá trị tuyệt ñối Mơ hình C Chúng ta lưu ý mơ hình hệ số hồi qui SQFT có ý nghĩa, tất hệ số hồi qui khác khơng có ý nghĩa ðiều có nghĩa trường hợp khơng thể bác bỏ giả thuyết không hệ số tương ứng khơng
Có hay khơng mức ý nghĩa khác ngồi mức phần trăm bác bỏ
giả thuyết khơng? Giá trị p hai lần giá trị có trước (đó 0,35 đến
0,78) Khi giá trị cao, kết luận giá trị khác khơng quan sát hệ số hồi qui sai số mẫu ngẫu nhiên Vì vậy, với giá trị SQFT cho trước, biến BEDRMS BATHS khơng ảnh hưởng quan trọng đến giá nhà Kết khẳng ñịnh kết trước Mơ hình A đánh giá tốt theo tất tiêu chuẩn
BÀI TẬP THỰC HÀNH 4.4
Sử dụng chương trình hồi qui bạn, ước lượng Mơ hình B C, kiểm tra kết Bảng 4.2
Có thể thiết lập tính chất sau (xem Haitovsky, 1969):
Tính chất 4.2
Nếu giá trị tuyệt ñối trị thống kê t hệ số hồi qui nhỏ 1, việc loại hệ số khỏi mơ hình làm tăng R2 hiệu chỉnh Tương tự, bỏ biến có trị thống kê t lớn (về giá trị tuyệt ñối) làm giảm R−2
ðiều là, bên cạnh trị thống kê t tới hạn, sử dụng giá trị t hướng dẫn việc xác định xem bỏ bớt biến hay khơng Tuy nhiên, R−2 chỉ nhiều tiêu chuẩn nên giá trị p riêng lẻ, giá trị thống kê chọn mơ hình tầm quan trọng lý thuyết biến nên ñược dùng ñể xác ñịnh biến loại bỏ (xem ví dụ phần 4.6 4.7)
Kiểm ñịnh số hệ số liên kết (kiểm ñịnh Wald)
Kiểm ñịnh t hệ số riêng lẻ dùng cho mức ý nghĩa hệ số cụ thể Ta có thể kiểm ñịnh ý nghĩa liên kết số hệ số hồi qui, ví dụ mơ hình ñây:
(13)(R) PRICE = γ1 + γ2SQFT + v
Mơ hình U (là mơ hình C Bảng 4.2) ựược gọi mơ hình khơng giới hạn, Mơ hình R (là Mơ hình A Bảng 4.2) ựược gọi mơ hình giới hạn β3 β4 buộc phải khơng Mơ hình R Ta kiểm ựịnh giả thuyết liên kết β3 = β4 = với giả thuyết ựối hệ số không không Kiểm ựịnh giả thuyết liên kết ựược gọi kiểm ựịnh Wald (Wald, 1943) Thủ tục sau
Kiểm định Wald tổng qt ðặt mơ hình giới hạn không giới hạn (bỏ qua ký
hiệu t dưới):
(U) Y = β1 + β2X2 + … + βmXm + βm+1Xm+1 + … + βkXk + u (R) Y = β1 + β2X2 + … + βmXm + v
Mặc dù Mơ hình U khác hồn tồn giống Phương trình (4.1) Mơ hình R có cách bỏ bớt số biến Mơ hình U, Xm+1, Xm+2, …Xk Vì vậy, giả
thuyết không βm+1 = βm+2 = … = βk = Lưu ý (U) chứa k hệ số hồi qui chưa biết và (R) chứa m hệ số hồi qui chưa biết Do đó, Mơ hình R có k – m thơng số so với U Câu hỏi nêu k –m biến bị loại có ảnh hưởng liên kết có ý nghĩa Y hay không
Giả sử biến bị loại khơng có ảnh hưởng có ý nghĩa Y Chúng ta khơng kỳ vọng tổng bình phương sai số Mơ hình R (ESSR) q khác biệt với tổng bình phương sai số Mơ hình U (ESSU) Nói cách khác, sai biệt ESSR – ESSU nhỏ Nhưng giá trị nhỏ nào? Chúng ta biết ESS nhạy với ñơn vị đo lường, làm giá trị lớn hay nhỏ ñơn giản cách thay ñổi thang ño “Nhỏ” “lớn” ñược xác ñịnh cách so sánh sai biệt với ESSU, tổng bình phương sai số mơ hình hồn tồn khơng giới hạn Vì vậy, ESSR – ESSU so sánh với ESSU Nếu giá trị ñầu “nhỏ” tương ñối so với giá trị sau, kết luận việc loại bỏ biến Xm+1, Xm+2, …, Xk không thay đổi ESS đủ để tin hệ số chúng có ý nghĩa
Chúng ta biết tổng bình phương độc lập có phân phối chi bình phương (xem phần 2.7) Vì vậy, ESSU/σ2 phân phối chi bình phương với n – k bậc tự (n quan sát trừ k thơng số Mơ hình U) Có thể thấy giả thuyết khơng tính chất cộng chi bình phương (Tính chất 2.12b), (ESSR – ESSU)/σ2 phân phối chi bình phương với bậc tự số biến số loại bỏ (R) Trong phần 2.7, chúng ta thấy tỷ số hai phân bố chi bình phương độc lập có phân phối F có hai thơng số: bậc tự cho tử số tỷ số, bậc tự cho mẫu số Trị thống kê tỷ số F
Các bước thơng thường để kiểm ñịnh Wald (thường ñược gọi kiểm ñịnh F) sau:
Bước Giả thuyết không H0: βm+1 = βm+2 = … = βk = Giả thuyết ngược lại H1: có giá trị β không không Giả thuyết k −
m ràng buộc
(14)và tính ESSR Chúng ta biết từ Tính chất 4.1b ESSU/σ2 tuân theo phân phối chi bình phương với bậc tự DFU = n − k (nghĩa n số quan sát trừ k hệ số ước lượng) Tương tự, với giả thuyết không, ESSR/σ2 tuân theo phân phối chi bình phương với bậc tự DFR = n − m Có thể thấy chúng độc lập với
tính chất cộng phân phối chi bình phương, sai biệt chúng (ESSR − ESSU) / σ2 phân phối chi bình phương, với bậc tự sai biệt bậc tự do, nghĩa là, DFR − DFU Lưu ý DFR − DFU k − m, số ràng buộc
trong giả thuyết không (đó số biến bị loại bỏ) Trong phần 2.7, ñã ñịnh nghĩa phân phối F tỷ số hai biến ngẫu nhiên phân phối chi bình phương độc lập ðiều cho ta trị thống kê
Fc =
(ESSR − ESSU) ÷ (DFR − DFU)
ESSU ÷ DFU (4.3)
= (ESSR − ESSU) / (k − m) ESSU / (n – k)
= (sai biệt ESS ÷ số ràng buộc)
( tổng bình phương sai số Mơ hình U ÷ d.f Mơ hình U)
= (R
2 U − R
2
R)/ (k − m)
(1− RU2)/ (n – k)
với R2 số đo độ thích hợp khơng hiệu chỉnh Chia cho bậc tự ta tổng bình phương bậc tự Với giả thuyết khơng, Fc có phân phối F với k − m bậc tự ñối với tử số n − k bậc tự ñối với mẫu số
Bước Từ số liệu bảng F tương ứng với bậc tự k − m cho tử số n − k cho
mẫu số, với mức ý nghĩa cho trước (gọi α), ta có F*k-m,n-k (α) cho diện tích bên phải F* α
Bước Bác bỏ giả thuyết không mức ý nghĩa α Fc > F* ðối với phương pháp giá trị p, tính giá trị p = P(F > Fc|H0) bác bỏ giả thuyết không giá trị p
nhỏ mức ý nghĩa
VÍ DỤ 4.7
Trong ví dụ bất động sản chúng ta, H0: β3 = β4 = H1: có giá trị β khơng khơng Vì vậy, Mơ hình U giống Mơ hình C Bảng 4.2, Mơ hình R Mơ hình A Số ràng buộc Cũng vậy, ESSR = 18.274 ESSU = 16.700 (xem Bảng 4.2) Bậc tự Mơ hình U 10 Vì vậy, trị thống kê F tính
Fc =
(18.274 − 16.700) /
16.700 / 10 = 0,471
(15)hình biến, BEDRMS Trong trường hợp này, phân phối F có một bậc tự tử số Khi ñiều xảy ra, giá trị F đơn giản bình phương trị thống kê t ñối với BEDRMS (xem Tính chất 2.14b) Chứng minh điều dễ Mơ hình B khơng giới hạn
Fc = (18.274 − 16.700) /
16.700 / 11 = 0,942
Có bậc hai 0,97, với trị thống kê t Bảng 4.2 Vì vậy, kiểm định Wald
cần phải tiến hành có hai nhiều hai hệ số hồi qui không giả thuyết khơng
Giá trị p ví dụ P(F > 0,471) = 0,64 Bởi có 64 phần trăm hội bác bỏ giả thuyết ñúng H0 (là hệ số BEDRMS BATHS không) quá cao chấp nhận ñược, nên bác bỏ H0 thay vào ta kết luận hệ số có giá trị khác khơng, khơng có ý nghĩa thống kê
Chúng ta thấy từ Bảng 4.2 số hạng khơng ựổi khơng có ý nghĩa mơ hình (trừ Mơ hình D) Tuy nhiên, thật không khôn ngoan loại bỏ số hạng khơng ựổi khỏi mơ hình số hạng không ựổi thể cách không gián tiếp số ảnh hưởng trung bình biến bị loại bỏ (vấn ựề ựược thảo luận ựầy ựủ phần 4.5) Do ựó, việc loại bỏ số hạng khơng thay ựổi dẫn ựến sai nghiêm trọng ựặc trưng mơ hình
Kiểm định Wald đặc biệt độ thích hợp tổng qt Hãy xem xét trường hợp ñặc
biệt kiểm định Wald hai mơ hình sau:
(U) Y = β1 + β2X2 + … + βkXk + u (SR) Y = β1 + w
Mơ hình U mơ hình hồi qui bội phương trình (4.1), với X1 số hạng khơng thay đổi Trong Mơ hình SR (thật giới hạn), tất biến ngoại trừ số hạng khơng thay đổi đều bị loại khỏi mơ hình; nghĩa là, đặt k − ràng buộc β2 = β3 = … = βk = Giả thuyết kiểm ñịnh phát biểu “Khơng hệ số mơ hình (ngoại trừ số hạng khơng thay đổi) có ý nghĩa thống kê.” Có thể thực kiểm định Wald cho giả thuyết Nếu giả thuyết không bị bác bỏ, kết luận khơng có biến giải thích cách liên kết thay đổi Y ðiều có nghĩa có mơ hình xấu phải thiết lập lại mơ hình ESSU tổng bình phương sai số mơ hình ñầy ñủ
ðể có ESSSR, trước hết cực tiểu Σw2t = Σ (Yt − β1)2 theo β1 Dễ dàng chứng minh ñược β^1 = Y
−
(16)Fc =
(TSSU − ESSU) / (k –1) ESSU / (n – k) =
RSSU / (k –1) ESSU / (n – k) =
R2 / (k –1)
(1– R2)/ (n – k) (4.4) giá trị tính từ R2 khơng hiệu chỉnh mơ hình đầy đủ Các chương trình hồi qui cung cấp trị thống kê F phần tóm tắt thống kê mơ hình Nhiệm vụ phải đảm bảo giả thuyết khơng kiểm định F bị bác bỏ, nghĩa là, Fc > F*k-1, n-k(α) Nếu khơng, có mơ hình khơng có biến độc lập giải thích thay đổi biến phụ thuộc, mơ hình cần ñược thiết lập lại
VÍ DỤ 4.8
Bảng 4.2 cung cấp trị thống kê F kiểm ñịnh Wald, cho trước phương trình (4.4), đối với ví dụ giá nhà Với Mơ hình C, k = 4, k − = n − k = 14 − = 10 Bậc tự trị thống kê F ñối với tử số 10 ñối với mẫu số Từ bảng F, A.4b, giá trị tới hạn ñối với kiểm ñịnh phần trăm F*3,10(0,05) = 3,71 Vì giá trị F Bảng 4.2 16,989 Mơ hình C, bác bỏ giả thuyết không tất hệ số hồi qui ngoại trừ số hạng khơng đổi khơng Vì vậy, có hệ số hồi qui khác khơng có ý nghĩa thống kê Từ kiểm ñịnh t ñối với hệ số SQFT, ñã biết ñược trường hợp Dễ dàng chứng minh ñược F*2,11(0,05) = 3,98 Mơ hình B F*1,12 (0,05) = 4,75 Mơ hình A, tất mơ hình bác bỏ
giả thuyết khơng khơng có biến giải thích có ý nghĩa
Chúng ta lưu ý trị thống kê F Mơ hình B C thấp nhiều so với Mơ hình A ðiều sai biệt R2 nhỏ, tỷ số (n − 1) / (n − k) tăng ñáng kể k tăng Do thấy từ Phương trình (4.4) giải thích sai biệt lớn F Tuy nhiên, nói chung, sai biệt F mơ hình khơng quan trọng Chỉ có kết kiểm ñịnh Wald ñáng quan tâm
BÀI TẬP THỰC HÀNH 4.5
Trong Bảng 4.2, Mơ hình D mơ hình thật giới hạn hồi qui PRICE theo số hạng khơng đổi So sánh mơ hình với Mơ hình C mơ hình khơng giới hạn, chứng minh giá trị F kiểm ñịnh Wald ñược báo cáo Bảng 4.2 Mơ hình C Sau cho Mơ hình A B Cuối cùng, giải thích R2 = R−2 = Mơ hình D
Khác biệt hai loại kiểm ñịnh F cần ñược ghi cẩn thận Công thức cho
trong Phương trình (4.4) khơng thể ứng dụng số biến bị loại bỏ Nó có thể ứng dụng mơ hình giới hạn có số hạng khơng đổi Trị thống kê F in
từ chương trình máy tính kiểm ñịnh tính thích hợp chung, trị thống kê F tính từ Phương trình (4.3) kiểm định xem nhóm hệ số có khác khơng cách có ý nghĩa thống kê hay khơng Cũng lưu ý kiểm định F ln ln kiểm định phía
(17)đổi mơ hình thứ hai khơng có số hạng khơng đổi, lập luận sử dụng cơng thức cho hai trường hợp ñể so sánh mức ñộ thích hợp tương ñối chúng Tuy nhiên, tính tỷ số F cơng thức sử dụng khác ðể giải thích lại vậy, xem xét hai mơ hình sau:
(A) Y = β2X2 + β3X3 + … βkXk + u (B) Y = w
Với số hạng khơng thay đổi X1 (=1) bị loại bỏ Lưu ý Mơ hình khơng giới hạn A bây giờ có k − thơng số (có nghĩa số bậc tự n − k +1) Mơ hình giới hạn B
khơng có thơng số (với d.f n) ðể kiểm định độ thích hợp chung mơ hình, giả
thuyết khơng lại H0: β2 = β3 = … = βk = 0, giả thuyết ngược lại tương tự trước Kiểm định Wald áp dụng cơng thức thích hợp Phương trình (4.3) ðặt ESSA = Σu^t2 tổng bình phương sai số Mơ hình A Trong Mơ hình B, tổng bình phương sai số ESSB = ΣY2t Giá trị F tính bởi:
Fc =
(ESSB− ESSA) / (k –1)
ESSA / (n – k + 1) =
(ΣYt
– Σu^t
2
) / (k –1) ESSA / (n – k + 1) =
ΣYt
^2
/ (k –1)
ESSA / (n – k + 1) (4.4a)
bởi khai triển ΣYt2 = ΣYt^2 + Σu^t2 khơng có số hạng khơng đổi Với giả thuyết
khơng, tổng có phân phối F với k − n − k + bậc tự Tiêu chuẩn ñể chấp nhận/bác bỏ H0 tương tự Giá trị thống kê F đại diện cho Mơ hình D kiểm định giả thuyết số hạng khơng đổi khơng Vì có hệ số bị loại khỏi đây, giá trị F là bình phương trị thống kê t Do đó, F = 180,189 R2 = Lưu ý cơng thức dùng để kiểm định độ thích hợp chung hồn tồn khác với cơng thức Phương trình (4.4)
Kiểm ðịnh Tổ Hợp Tuyến Tính Của Các Hệ Số
Chúng ta thường gặp giả thuyết ñược phát biểu dạng tổ hợp tuyến tính hệ số hồi qui Một ví dụ minh họa hàm tiêu thụ tổng hợp sau:
Ct = β1 + β2Wt + β3Pt + ut
Với C chi tiêu cho tiêu dùng tổng hợp vùng cho trước, W tổng tiền lương thu nhập, P tất thu nhập khác, phần lớn từ lợi nhuận thu hồi từ vốn β2 xu hướng cận biên chi tiêu lương thu nhập, β3 xu hướng cận biên chi tiêu thu nhập khác Giả thuyết β2 = β3 ngụ ý la thêm vào thu nhập tiền lương la thêm vào thu nhập khác đóng góp khoảng
thêm vào tiêu thụ bình qn Kiểm định t hệ số riêng lẻ áp dụng
trường hợp giả thuyết tổ hợp tuyến tính hai hệ số hồi qui Giả thuyết H0: β2 = β3 ñối lại H1: β2 ≠β3 kiểm định ba cách khác nhau, cách ñều ñưa ñến kết luận
(18)hợp tuyến tính hệ số hồi qui Việc thực mơ hình (khơng giới hạn) sau, với hai biến ñộc lập (X2 X3):
(U) Yt = β1 + β2Xt2 + β3Xt3 + ut (4.5) PHƯƠNG PHÁP 1(KIểM ðịNH WALD)
Bước Sử dụng ràng buộc, giải để tìm hệ số theo hệ số lại,
thế vào mơ hình khơng giới hạn để có mơ hình giới hạn Vì vậy, để kiểm định β2 = β3, thay cho β3 Phương trình (4.5) có mơ hình sau:
(R) Yt = β1 + β2Xt2 + β2Xt3 + ut (4.6)
= β1 + β2(Xt2 + Xt3) + ut
Viết lại mơ hình giới hạn cách nhóm số hạng thích hợp Trong trường hợp chúng ta, tạo biến Zt = Xt2 + Xt3 viết mơ sau:
(R) Yt = β1 + β2Zt + ut
Bước Ước lượng mơ hình giới hạn khơng giới hạn, có tổng bình
phương sai số, ESSR ESSU
Bước Tính giá trị thống kê F Wald (Fc), dùng Phương trình (4.3), bậc tự ñối với tử số mẫu số
Bước Từ bảng F, có điểm F* cho diện tích phần bên phải mức ý nghĩa Một cách khác, tính giá trị p = P(F > Fc)
Bước Bác bỏ H0 Fc > F* giá trị p nhỏ mức ý nghĩa BÀI TẬP THỰC HÀNH 4.6
Xuất phát từ mơ hình giới hạn ñể kiểm ñịnh β2 + β3 = β2 + β3 = VÍ DỤ 4.9
Tập tin DATA 4-2 (xem Phụ lục D) chứa liệu hàng năm Hoa Kỳ thời kỳ 1959-1994 (với n = 36) Các ñịnh nghĩa biến sau:
CONS (Ct) = Chi tiêu thực cho tiêu dùng tính tỷ la năm 1992 GDP (Yt) = Tổng sản phẩm quốc dân thực tính tỷ la năm 1992
WAGES = Tổng tiền trả cho nhân viên (lương, khoản phụ trợ) tính tỷ la hành
PRDEFL = Giá giảm phát ñối với tiêu dùng, 1992 = 100 (ñây số giá hàng hóa tiêu dùng)
Mơ hình ước lượng hàm tiêu thụ sau trình bày phần trên: (U) Ct = β1 + β2Wt + β3Pt + ut (4.5)
(19)Tiêu dùng dạng thực ðể có thu nhập tiền lương dạng thực (Wt), chia WAGES với PRDEFL nhân với 100 Tổng lợi nhuận thu nhập khác từ vốn có cách trừ thu nhập tiền lương thực khỏi GDP
Wt =
100 WAGESt
PRDEFLt Pt = Yt – Wt Trong Phương trình (4.5), đặt ràng buộc β2 = β3 Chúng ta có
(R) Ct = β1 + β2Wt + β2Pt + ut = β1 + β2(Wt + Pt) + ut (4.6) = β1 + β2Yt + ut
với Yt = Wt + Pt thu nhập tổng hợp Phương trình (4.5) mơ hình khơng giới hạn (với n bậc tự do) Phương trình (4.6) mơ hình giới hạn Do tính trị thống kê F Wald cho Phương trình (4.3) (với k – m = có ràng buộc) Vì vậy,
Fc =
(ESSR – ESSU) / ESSU / (n – 3)
sẽ ñược kiểm ñịnh với F*1, n-3 (0,05) bác bỏ giả thuyết không Fc > F*
Ap dụng vào liệu tiêu dùng tổng hợp, ta có Phương trình ước lượng (4.5) (4.6) (Xem phần thực hành máy tính 4.2)
Ct^ = – 222,16 + 0,69Wt + 0,47Pt ESSU = 38.977 C^t = – 221,4 + 0,71Yt ESSR = 39.305
Fc =
(39.305 – 38.977)
38.977/ 33 = 0,278
Từ Bảng A.4c, F*1,33(0,10) nằm 2,84 2,88 Vì Fc < F*, khơng thể bác bỏ giả thuyết không kết luận xu hướng biên tế tiêu dùng lương lợi nhuận khơng khác cách có ý nghĩa mức ý nghĩa 10 phần trăm Vì vậy, giá trị số học chúng hoàn toàn khác nhau, mặt thống kê khác biệt ngẫu nhiên
PHƯƠNG PHÁP 2(KIểM ðịNH tGIÁN TIếP) Trong phương pháp thứ hai, mơ hình
thay ñổi theo cách khác kiểm ñịnh t gián tiếp ñược tiến hành Các bước thực sau:
Bước Xác định thơng số mới, gọi δ, có giá trị khơng giả thuyết khơng là Do H0 β2 = β3, ñịnh nghĩa δ = β2 – β3, giả thuyết H0 β2 + β3 = δ = β2 + β3 –
Bước Diễn tả tham số theo δ tham số lại, thay vào mơ hình nhóm số hạng cách hợp lý
Bước Tiến hành kiểm ñịnh t sử dụng δ^, ước lượng δ
(20)Trong trường hợp hàm tiêu thụ, δ = β2 – β3 Giả thuyết không trở thành H0: δ = 0 H1: δ≠ Cũng có β3 = β2 – δ Thay vào mơ hình ta có
Ct = β1 + β2Wt + (β2 – δ)Pt + ut = β1 + β2 (Wt + Pt) – δPt + ut Vì Yt = Wt + Pt, mơ hình trở thành
Ct = β1 + β2Yt – δPt + ut (4.7)
Mơ hình mặt khái niệm hồn tồn tương đương với Phương trình (4.5) Bây hồi qui C theo số hạng khơng đổi, Y, P, sử dụng trị thống kê t cho δ ñể kiểm ñịnh giả thuyết mong muốn Trong trường hợp này, kiểm ñịnh giảm đến kiểm định t chuẩn theo mơ hình hiệu chỉnh (Xem tập thực hành, áp dụng kỹ thuật ñối với β2 + β3 = 1)
ðối với liệu chúng ta, Phương trình ước lượng (4.7) (xem phần thực hành máy tính 4.2)
C^t = –222,16 + 0,69Yt + 0,04Pt (–11,4) (21,3) (0,5)
Các giá trị ngoặc ñơn trị thống kê t tương ứng ðối với δ^, giá trị t 0,5, nhỏ
t*33(0,05) 2,021 2,042 Do đó, không bác bỏ giả thuyết không
PHƯƠNG PHÁP 3(KIểM ðịNH t TRựC TIếP) Phương pháp cuối áp dụng kiểm định t trực tiếp khơng ñòi hỏi ước lượng hệ số hồi qui khác
Bước Như phương pháp 2, xác định thơng số – gọi δ – có giá trị khơng giả thuyết khơng Do H0 β2 = β3, ñịnh nghĩa δ = β2 – β3, giả thuyết H0 β2 + β3 = δ = β2 + β3 –
Bước Trực tiếp lấy phân phối thống kê δ, sử dụng để tính trị thống kê t
Bước Tiến hành kiểm ñịnh t δ sử dụng trực tiếp để tính trị thống kê
Kiểm ñịnh trước ñược minh họa ñây cho ví dụ sử dụng, H0: β2 = β3 (Xem tập thực hành, áp dụng phương pháp ñối với giả thuyết β2 + β3 = 1)
Vì ước lượng OLS tổ hợp tuyến tính quan sát biến phụ thuộc tổ hợp tuyến tính số hạng sai số phân phối chuẩn, biết
β^2 ~ N(β2, σ2β
^) β^3 ~ N(β3, σ2(β ^)
với σ2 phương sai tương ứng Hơn nữa, tổ hợp tuyến tính biến chuẩn phân phối chuẩn Do đó,
(21)Từ Tính chất 2.8a, phương sai β^2 – β^3 tính Var(β^2) + Var (β^3) – Cov (β^2,β^3) Chuyển số phân phối chuẩn chuẩn hóa (bằng cách trừ ñi giá trị trung bình chia cho ñộ lệch chuẩn), có
β2
^ –β3
^
– (β2 – β3 )
[Var(β^2) + Var(β^3) – Cov(β^2,β^3)]
1/2 ~ N(0,1)
Với giả thuyết không, H0: β2 – β3 = Cũng vậy, khơng biết xác phương sai đồng phương sai, ước lượng chúng (hầu hết chương trình máy tính có lựa chọn cung cấp giá trị này) Nếu thay ước lượng phương sai ñồng phương sai này, trị thống kê khơng cịn tn theo phân phối N(0,1) mà theo phân phối thống kê tn-k (n – ví dụ chúng ta) Vì vậy, sử dụng kiểm ñịnh t cho trị thống kê tính từ đẳng thức với ước lượng phù hợp ñược thay vào Trị thống kê t ñược tính
tc =
β^2 –β^3
[Var(β2
^
) + Var(β3
^
) – Cov(β2
^ ,β3
^ )]1/2
Vì β2 = β3 theo giả thuyết khơng Với mức ý nghĩ 5%, H0 bị bác bỏ giả thuyết H1: β2 - β3 > ñược củng cố giá trị tc lớn t*n-k(0,05) ðối với trường hợp giả thiết ngược lại có dạng hai phía, H1: β2 ≠β3, ta tra giá trị t*n-k(0,025) bác bỏ H0 |tc| > t* Vì phương pháp địi hỏi phải thực số tính tốn phụ, nên phương khác thường ñược ñề nghị sử dụng phương pháp
VÍ DỤ 4.11:
ðể minh họa, xem phương trình (4.5), phương trình ước lượng từ tập liệu DATA4-2 phụ lục D Phương trình ước lượng với trị phương sai đồng phương sai trình bày (xem Phần Thực Hành Máy Tính 4.2):
t t
t 22216 0693W 0736P
Cˆ =− , + , + ,
2
R = 0,999 d.f = 33 ESS = 38.977
2 0032606
Varβˆ =( , ) Varβˆ3 =(0,048822)2
001552
Cov(βˆ2,βˆ3)=− ,
Trị thống kê t tính theo:
53 001552
0 048822
032606
736 693
2
2 ( , ) ( , )] ,
) ,
[(
, ,
/ =− −
− +
− =
c
(22)Vì t*33(0,05) có giá trị nằm 2,021 2,042, giá trị lớn nhiều so với giá trị tính tốn nhiều nên không bác bỏ giả thuyết H0 cho khuynh hướng cận biên chi tiêu từ tiền lương thu nhập khác Kết giữ nguyên cho dù giả thuyết ngược lại H1 phía hay hai phía
Chúng ta thấy ba phương pháp ñều cho kết Trong ba phương pháp trình bày, Phương pháp thực dễ khơng địi hỏi tính tốn phụ lại sử dụng để kiểm định giả thuyết phép kiểm ñịnh t trực mơ hình điều chỉnh tí Tuy nhiên, kiểm định Wald trình bày phương pháp áp dụng nhiều trường hợp tổng quát
4.5 Các Sai Số ðặc Trưng
Như ñã ñề cập trước ñây, việc lựa chọn biến ñộc lập phụ thuộc mơ hình kinh tế lượng phải dựa lý thuyết kinh tế, kiến thức hành vi tiềm ẩn, kinh nghiệm khứ Tuy nhiên, chất quan hệ biến kinh tế khơng biết, mong đợi sai số việc xác định đặc trưng mơ hình kinh tế lượng Sai số ñặc trưng xảy xác định sai mơ hình theo loại chọn biến, dạng hàm số, cấu trúc sai số (nghĩa số hạng ngẫu nhiên ut tính chất nó) Trong phần khảo sát sai số ñặc trưng loại thứ Trong chương xem xét ñến việc lựa chọn dạng hàm số sai số ñặc trưng số hạng ngẫu nhiên ñược thảo luận chương
Khi chọn biến ñộc lập mơ hình, ta phạm phải hai loại sai số sau: (1) bỏ qua biến thuộc mơ hình (2) đưa vào biến khơng liên quan Trong hàm cầu, bỏ qua biến giá hàng hóa thu nhập hộ gia đình, gây trường hợp sai số đặc trưng loại thứ Trong ví dụ bất ñộng sản trước ñây, giả sử biến loại mái lợp thiết bị ñiện sử dụng khoảng cách đến trường học lân cận khơng tác động đáng kể đến giá bán ngơi nhà Nếu tiếp tục ñưa biến vào mơ hình, phạm phải sai số đặc trưng loại thứ hai, nghĩa là, ñưa thừa biến vào mơ hình Trong phần sau, xem xét hệ lý thuyết loại sai số đặc trưng đồng thời trình bày chứng thực nghiệm
Bỏ qua biến quan trọng
ðầu tiên khảo sát trường hợp biến thuộc mơ hình bị bỏ qua Giả sử mơ hình thật là:
Yt = β1 + β2Xt2 + β3Xt3 + ut Nhưng ước lượng mơ hình
(23)Nói cách khác, giá trị thật β3 khác 0, lại giả định loại bỏ biến X3 khỏi mơ hình Các số hạng sai số mơ hình thật ñược giả ñịnh ñáp ứng ñược giả thiết từ 3.2 ñến 3.8 Các hệ loại sai số xác định tóm tắt qua tính chất sau:
Tính chất 4.3
a Nếu biến ñộc lập mà hệ số hồi qui thật khác khơng bị loại khỏi mơ hình, giá trị ước lượng tất hệ số hồi qui lại bị thiên lệch biến bị loại không tương quan với biến ñược ñưa vào
b Ngay ñiều kiện ñược thỏa mãn, số hạng số ñược ước lượng nói chung bị thiên lệch, giá trị dự báo bị thiên lệch
c Ước lượng phương sai hệ số hồi qui biến đưa vào nói chung bị thiên lệch, kiểm định giả thuyết khơng có ý nghĩa
Có thể thấy từ Tính chất 4.3 hệ việc bỏ qua biến quan trọng nghiêm trọng Các ước lượng trị dự báo bị thiên lệch, kiểm định giả thuyết sẽ khơng cịn có ý nghĩa Nguyên nhân thiên lệch (ñược gọi thiên lệch
biến bị bỏ sót) dễ dàng nhận thấy So sánh hai mơ hình, thấy vt = β3Xt3 + ut Giá trị kỳ vọng số hạng sai số mơ hình sai E(vt) = β3Xt3 ≠ Vì vậy, vt vi phạm Giả sử 3.3 Nghiêm trọng hơn, đồng phương sai Xt2 vt tính theo (xem Phần 2.3 ñồng phương sai):
Cov(Xt2, vt) = Cov(Xt2, β3 Xt3 +ut) = β3 Cov(Xt2, Xt3) + Cov(Xt2, ut) = β3 Cov(Xt2, Xt3)
Vì X2 u khơng tương quan Như vậy, đồng phương sai X2 X3 – nghĩa là, X2 X3 không tương quan – ñồng phương sai X2 v khác không, vi phạm Giả thiết 3.4 Tính chất khơng thiên lệch qn phụ thuộc vào hai giả thiết Như vậy, βˆ không bị không thiên lệch quán 2
Khẳng ñịnh ñược nhận cách rõ ràng Gọi βˆ 1 βˆ 2 ước lượng số hạng số hệ số ñộ dốc Xt2 hồi qui Yt theo số hạng số biến Xt2, nghĩa loại bỏ Xt3 Các giá trị ước lượng thực hai ước lượng ñược chứng minh Phụ Lục Phần 4.2 sau:
β + β = β
22 23
2 S
S
E(ˆ )
− β
+ β = β
22 23 3
1 S
S X X E(ˆ )
Trong biến có gạch ngang đầu giá trị trung bình tương ứng, )
)(
( t2 t3
23 X X X X
S =∑ − − vàS22 =∑(Xt2 −X2)2 Từ ñây thấy
rằng, S23 = 0, tức là, X2 X3 không tương quan, E(βˆ ) 2 ≠β2 nói chung βˆ thiên lệch Cũng lưu ý 2 βˆ bao gồm số hạng liên quan ñến 2 β3, ảnh hưởng biến bị loại bỏ Vì vậy, khơng thể diễn dịch βˆ ảnh
(24)cũng ñược kể đến Như vậy, hệ số mơ hình ño lường ảnh hưởng trực tiếp biến ñược ñưa vào mơ ảnh hưởng gián tiếp biến bị loại bỏ ðiều ñúng với ước lượng số hạng số Lưu ý S23 = 0, βˆ 1 thiên lệch có thêm giá trị trung bình X3 = Bởi điều kiện đưa khó thỏa mãn, nên nhìn chung ước lượng giá trị dự báo thiên lệch
SỰNGUY HIỂM CỦA VIỆC LOẠI BỎ SỐ HẠNG HẰNG SỐ Như ñã thấy
1
βˆ βˆ có kể đến phần ảnh hưởng biến bị loại bỏ X3 Do cần thiết phải ñưa 2 số hạng số vào mơ hình Nếu số hạng số bị bỏ qua, ñường hồi qui bị ép phải ñi qua gốc tọa ñộ, ñiều dẫn ñến việc ñặc trưng sai nghiêm trọng hàm hồi qui Chúng ta thấy từ biểu đồ phân tán Hình 3.1 hay Hình 3.11 ràng buộc đường hồi qui ñi qua gốc tọa ñộ làm cho ước lượng ñộ dốc bị thiên lệch sai số lớn Một lần nữa, kết luận từ phần thảo luận số hạng số ln nên đưa vào mơ hình có lý lý thuyết vững để khơng làm ñiều ñó (trong Chương gặp trường hợp lý thuyết bắt buộc khơng có số hạng số)
BÀI TẬP THỰC HÀNH 4.7
Trong mơ hình tuyến tính đơn, giả sử bạn nhầm lẫn loại bỏ số hạng số; nghĩa là, giả sử mơ hình thật Yt = α + βXt + ut, bạn ước lượng thành Yt = βXt + vt ðầu tiên kiểm chứng ước lượng OLS β sử dụng mơ hình sai βˆ = [Σ(XtYt)]/[ Σ(Xt2)] Kế ñến thay vào Yt biểu thức Yt từ mơ hình thật, tính E(βˆ ) Và sau chứng minh βˆ thiên lệch Cuối tìm điều kiện để βˆ khơng thiên lệch sử dụng mơ hình sai Nêu diễn dịch trực giác ñiều kiện bạn tìm
[Trong tập dạng tương tự cuối chương, tiến hành sau: (1) sử dụng mơ hình ước lượng tìm biểu thức ñại số cho trị ước lượng thơng số; (2) thay vào Yt từ mơ hình thật theo số hạng Xt, ut, thông số mơ hình thật (chúng ta sử dụng mơ hình thật Yt xác định thơng qua mà khơng phải mơ hình sai); (3) tính giá trị kỳ vọng ước lượng; (4) so sánh giá trị kỳ vọng với giá trị thật, kiểm tra tính khơng thiên lệch, cần thiết, xác định điều kiện để có khơng thiên lệch]
Ví dụ 4.12:
(25)Mơ hình A: HOUSING = 687,898 + 0,905GNP – 169,658 INTRATE
(1,80) (3,64) (-3,87)
2
R = 0,375 F(2, 20) = 7,609 d.f = 20
Từ lý thuyết nhu cầu kỳ vọng nhu cầu nhà tăng thu nhập tăng Trái lại, lãi suất cầm cố tăng, chi phí sở hữu nhà tăng, nhu cầu nhà giảm Nhận thấy dấu hệ số ước lượng phù hợp với cảm nhận trực giác Chúng ta thấy từ trị thống kê t ngoặc ñơn GNP INTRATE có ý nghĩa Tuy nhiên, R có giá trị khơng cao ñối với tập liệu theo thời gian Giả sử bỏ qua biến quan trọng INTRATE Mơ hình ước lượng trở thành sau:
Mơ hình B: HOUSING = 1.442,209 + 0,058GNP
(3,39) (0,38)
2
R = - 0,04 F(1, 21) = 0,144 d.f = 21
Các kết thay ñổi lớn ðầu tiên, R có giá trị âm, cho thấy thích hợp ðiều củng cố thêm trị thống kê F với giá trị nhỏ ý nghĩa Trị thống kê t GNP khơng có ý nghĩa, cho thấy GNP có tác động khơng ñáng kể ñến việc mua nhà Cuối giá trị ước lượng hệ số GNP bị thay ñổi ñáng kể Các kết hồn tồn khơng chấp nhận ñược hậu việc bỏ qua lãi suất chấp, biến quan trọng tiên việc xác ñịnh nhu cầu nhà
ðưa Vào Mơ Hình Một Biến Khơng Liên Quan Giả sử mơ hình thật
Yt = β1 + β2Xt2 + ut
Nhưng thêm nhầm biến X3 ước lượng mơ hình
Yt = β1 + β2Xt2 + β3Xt3 + vt
Như trước ñây số dư thật ut ñược giả ñịnh tuân theo giả thiết 3.2 ñến 3.8 Chương Hậu loại ñặc trưng sai gì? Ước lượng β2 có thiên lệch hay khơng? Liệu BLUE? Các kiểm định giả thuyết có hợp lệ khơng? Câu trả lời cho câu hỏi tóm tắt tính chất sau:
Tính chất 4.4
a Nếu biến độc lập có giá trị hệ số hồi qui thật khơng (nghĩa là, biến thừa) đưa vào mơ hình, giá trị ước lượng tất hệ số hồi qui khác không thiên lệch quán
b Tuy nhiên phương sai chúng cao giá trị khơng có biến khơng liên quan, hệ số không hiệu
(26)Như hậu việc đưa vào mơ hình biến khơng liên quan nghiêm trọng so với trường hợp bỏ sót biến quan trọng
CHỨNG MINH*
Ở phần 4.A.3 ta ñã chứng minh ñược
E(βˆ ) = 2 β2 E(βˆ3) =
Như vậy, βˆ không thiên lệch kỳ vọng 2 βˆ3bằng Tính qn
giữ ngun Các kết tổng qt hóa cho trường hợp hồi qui bội với nhiều biến giải thích Do vậy, việc đưa vào biến khơng liên quan khơng làm thiên lệch ước lượng hệ số biến cịn lại Vì ước lượng không thiên lệch quán, giá trị dự báo dựa chúng
Bước tính phương sai βˆ để xác định tính chất hiệu Từ phần 2 4.A.3 (sử dụng ký hiệu đó) ta có:
) ( ) ˆ
( 2
22
2 S 1 r
Var
− σ = β
Trong r2 bình phương phương sai đơn (xem Phương trình 2.11) X2 X3 định nghĩa r2 = S223/(S22S33) Chúng ta so sánh kết với phương sai ước lượng theo OLS (gọi giá trị β*2) mà lẽ thu mơ hình thật sử dụng Từ phương trình (3.12) (3.19) chương ta có:
22 y S
S = β*
22
2 S
Var(β*)= σ
ðộ hiệu tương ñối (xem ñịnh nghĩa 2.8b) βˆ ñối với 2 *
2 β
1 r
1 Var
Var
2
2 ≥
− = β β
) (
) ˆ (
*
Vì rõ ràng ước lượng β2 sử dụng mơ hình sai khơng hiệu r2 = – nghĩa là, X2 X3 không tương quan với Vì tính khơng hiệu này, trị thống kê t có khuynh hướng nhỏ hơn, kết luận sai biến khơng có ý nghĩa mặt thống kê thực chúng lại hồn tồn khác khơng Có thể chứng minh (xem Johnston, 1984, trang 262) ước lượng phương sai βˆ không thiên lệch ñó kiểm ñịnh giả thuyết có hiệu lực 2
VÍ DỤ 4.13:
(27)UNEMP vào làm biến giải thích hợp lý Mơ hình hiệu chỉnh sau: (trị thống kê t ngoặc đơn)
Mơ hình C: HOUSING = 5.087,434 + 1,756GNP – 174,692 INTRATE
(0,5) (0,8) (-2,9)
– 33,434 POP + 79,720 UNEMP
(-0,4) (0,7)
2
R = 0,328 F(4, 18) = 3,681 d.f = 18
Khi so sánh với mơ hình A thấy cĩ nhiều khác biệt đáng kể GNP trước đĩ cĩ ý nghĩa khơng cịn ý nghĩa Trị thống kê t biến INTRATE giảm nĩ cịn cĩ ý nghĩa ðiều với điều phân tích lý thuyết dự đốn Tính chất 4.4b nĩi phương sai hệ số cĩ khả lớn hơn, điều hàm ý trị thống kê t cĩ thể nhỏ Các trị thống kê t biến POP INTRATE nhỏ, cho thấy biến cĩ thể khơng quan trọng vai trị biến thêm vào chi phối nhu cầu nhà ở, cho trước
GNP INTRATE đo lường quy mơ kinh tế chu kỳ kinh doanh Thực ra, thực kiểm định Wald việc loại bỏ POP UNEMP Xem Mơ hình C mơ hình khơng giới hạn Mơ hình A mơ hình giới hạn, trị thống kê F kiểm định Wald (xem Phương Trình 4.3) tính theo:
C C C A C A
c ESS df
f d f d ESS ESS F ) ( ) ( ÷ − ÷ − = 292 18 274 444 274 444 140 491 , / / ) ( = − =
Giá trị quan sát Fc nhỏ khơng có ý nghĩa mức 25% (p-value
0.75) Vì vậy, kiểm định Wald không bác bỏ giả thuyết không cho hệ số hồi
qui POP UNEMP không Chúng ta lưu ý dấu POP UNEMP ngược với ñã kỳ vọng Tuy nhiên, trường hợp hệ số khơng có nghĩa, dấu chúng khơng liên quan chọn tùy ý
Bài tập thực hành 4.8
Thay đưa hai biến POP UNEMP vào, ñã làm ñây, ñưa tỉ lệ thất nghiệp vào mơ hình A thơi (được gọi mơ hình D) Hãy so sánh kết nhận với kết mơ hình A Các kết có khác biệt nhiều khơng?
(28)thể chấp nhận ước lượng hiệu quả, việc xóa hay nhiều biến gây khó chịu dễ ñược chọn lựa Lý thuyết kinh tế học hiểu biết hành vi ñang diễn giúp khỏi tình trạng tiến thối lưỡng nan Các ràng buộc chọn lựa mơ hình thảo luận phần trước trợ giúp ñược Trong chương thấy kiểm ñịnh ñối với ñặc trưng trợ giúp cho Tất ñiều cần nhiều cân nhắc Sự gắn bó mù quáng ñối với tiêu chuẩn cứng nhắc phải ñược ngăn ngừa giá
4.6 Ứng dụng: Các Yếu Tố Quyết ðịnh Số Người ði Xe Buýt
Ứng dụng ñầu tiên liên quan ñến số ngưới di chuyển xe buýt với nhiều yếu tố ảnh hưởng khác DATA 4-4 mơ tả phụ lục D có liệu chéo cho 40 thành phố khắp nước Mỹ Các biến sau:
BUSTRAVL = Mức độ giao thơng xe bt thị tính theo ngàn hành khách
FARE = Giá vé xe buýt tính Mỹ kim
GASPRICE = Giá ga lông nhiên liệu tính Mỹ kim INCOME = Thu nhập bình qn đầu người tính Mỹ kim POP = Dân số thành phố tính ngàn người
DENSITY = Mật độ dân số tính (người/dặm vng) LANDAREA = Diện tích thành phố (dặm vng)
ðặc trưng tổng qt mơ hình, thường xem mơ hình “bồn rửa chén”, cho (khơng có số t):
BUSTRAV = β1 + β2FARE + β3GASPRICE + β4INCOME + β5POP + β6DENSITY + β7LANDAREA + u
Trước ước lượng mơ hình, xác ñịnh dấu biến, mức ñộ ưu tiên, cho hệ số hồi qui Trong phần thảo luận này, tiềm ẩn phía cung khơng ñược xem quan trọng Bởi gia tăng giá vé xe buýt làm giảm nhu cầu ñi xe buýt, nên kỳ vọng β2 âm Trong lĩnh vực di chuyển, xe thay xe bt, gia tăng giá nhiên liệu khiến số người tiêu thụ chuyển sang ñi xe buýt Vì kỳ vọng hiệu ứng tích cực đây; nghĩa là, β3 dương Khi thu nhập tăng, kỳ vọng nhu cầu ñối với hàng tiêu dùng tăng lên, thường lệ kỳ vọng β4 dương Tuy nhiên, hàng tiêu dùng thuộc loại hàng hóa “thấp cấp”, hiệu ứng thu nhập (nghĩa là, β4) âm Một gia tăng kích thước dân số hay mật ñộ dân số thường làm gia tăng nhu cầu di chuyển xe buýt Vì vậy, kỳ vọng β5 β6 dương Nếu diện tích ñất tăng cao, thành phố trải rộng người tiêu thụ thích dùng xe phương tiện giao thơng Nếu ñây tình huống, β7 ñược kỳ vọng âm
(29)ñược gắn kết lại với dự án thực nghiệm nhỏ này, Bảng 4.4 giúp bạn lắp ghép mảnh ráp hình khác thành hình ảnh hồn chỉnh Ngay bạn sử dụng chương trình riêng để kiểm tra lại kết quả, đáng để nghiên cứu lưu ý Bảng 4.4
Bảng 4.4 Trích phần kết chạy máy tính Số người xe buýt
MODEL 1: OLS estimates using the 40 observations 1-40 Dependent variable: BUSTRAVL
VARIABLE COEFFICIENT STDERROR T STAT 2PROB(t > |T|)
0) Const 2744.6797 2641.6715 1.039 0.306361
2) FARE -238.6544 451.7281 -0.528 0.600816
3) GASPRICE 522.1132 2658.2276 0.196 0.845491
4) INCOME -0.1947 0.0649 -3.001 0.005090 ***
5) POP 1.7114 0.2314 7.397 0.000000 ***
6) DENSITY 0.1164 0.0596 1.954 0.059189 *
7) LANDAREA -1.1552 1.8026 -0.641 0.526043
Mean of dep var 1933.175 S.D of dep variable 2431.757
Error Sum of Sp (ESS) 1.8213e+007 Std Err of Resid (sgmahat) 742.9113
Unadjusted R-squared 0.921 Adjusted R-squared 0.907
F-statistic (6,33) 64.1434 p-value for F() 0.000000
Durbin-Watson stat 2.083 First-order autocorr coeff -0.156
MODEL SELECTION STATISTICS
SGMASQ 551917 AIC 646146 FPE 648503
HQ 719020 SCHWARZ 868337 SHIBATA 614698
GCV 668991 RICE 700510
Excluding the constant, p-value was highest for variable (GASPRICE)
[R bình phương hiệu chỉnh 0,907, hiển thị 90,7% phương sai BUSTRAVL giải thích chung biến mơ hình ðối với nghiên cứu chéo, ñiều hoàn toàn tốt Cột cuối cho giá trị p-value kiểm định cho giả thuyết không tương ứng với hệ số hồi qui không Ba dấu (***) hiển thị giá trị p-value nhỏ 1%, ** có nghĩa nằm 5%, * ám p-value khoảng
đến 10%, khơng có * nghĩa p-value 10% Hãy nhớ giá trị p-value cao nghĩa xác suất sai lầm loại I bác bỏ giả thuyết không cao Nếu ñiều cao mức
ý nghĩa ñã chọn (0,10, chẳng hạn), khơng bác bỏ giả thuyết không
cho hệ số Nói cách khác, giữ biến khác cố định, biến khơng có ảnh hưởng có ý nghĩa lên BUSTRAVL Dựa theo điều này, INCOME, POP, DENSITY có hệ số có nghĩa mức 10% Hằng số hệ số FARE, GASPRICE, LANDAREA khơng có ý nghĩa mặt thống kê mức 25%
Sự phù hợp trị thống kê chọn lựa mô hình (đã thảo luận Phần 4.3) sau trở nên hiển nhiên Trị thống kê Durbin-Watson tự tương quan bậc ñược thảo luận chương 9, khơng liên quan cho mục đích
(30)các hiệu ứng trung bình biến bị loại bỏ Do đó, qui tắc chung bỏ qua ý nghĩa số khơng cần Tuy nhiên, FARE, GASPRICE, LANDAREA “ứng cử viên ñầu tiên” cho loại bỏ khỏi mơ hình khơng có chứng chứng tỏ chúng có ảnh hưởng có nghĩa lên BUSTRAVL Chúng ta thực bước lớn, bỏ tất chúng, ước lượng mơ hình ñược giới hạn, thực kiểm ñịnh Wald F-test mơ tả Phần 4.4 ðể tạo thuận lợi cho việc này, lấy tổng bình phương sai số số bậc tự cho mơ hình khơng giới hạn vừa ước lượng Tuy nhiên, bạn cẩn trọng, số biến ñồng thời bị loại bỏ việc làm khôn ngoan Bởi bạn nhìn thấy điều ví dụ ví dụ sau, việc lúc loại bỏ vài biến bỏ biến có ý nghĩa biến quan trọng mặt lý thuyết Do đó, cách làm thận trọng nhạy bén loại bỏ dần biến Có vài lý việc loại bỏ biến với hệ số nghĩa Thứ nhất, mơ hình đơn giản dễ diễn giải mơ hình phức tạp Thứ hai, việc bỏ bớt biến làm tăng bậc tự cải thiện xác hệ số lại Cuối cùng, thấy chương tiếp theo, biến giải thích có tương quan chặt với gây khó khăn cho diễn giải riêng hệ số Việc loại trừ biến làm giảm hội nảy sinh tương quan làm cho việc diễn giải có ý nghĩa
ðiểm bắt đầu cho q trình loại bỏ nhận diện biến có hệ số hồi qui có nghĩa ðiều thực cách nhìn vào giá trị p-value cao mơ hình
ước lượng khơng có số Về trung bình, hệ số tương ứng kỳ vọng gần khơng, tin thiên lệch bị gây loại bỏ nhỏ Từ kết mơ hình A, để ý hệ số cho GASPRICE có giá trị p-value
cao có ý nghĩa Do đó, biến bị loại bỏ khỏi đặc trưng mơ hình xem điều xảy Dựa loại bỏ nhiều biến Q trình gọi ðơn giản mơ hình dựa số liệu.]
Bảng 4.4 (Tiếp theo)
MODEL 2: OLS estimates using the 40 observations 1-40 Dependent variable: BUSTRAVL
VARIABLE COEFFICIENT STDERROR T STAT 2PROB(t > |T|)
0) const 3215.8565 1090.4692 2.949 0.005730 ***
2) FARE -225.6595 440.4936 -0.512 0.611762 ***
4) INCOME -0.1957 0.0638 -3.069 0.004203 ***
5) POP 1.7168 0.2265 7.581 0.000000 ***
6) DENSITY 0.1182 0.0580 2.037 0.049453 ***
7) LANDAREA -1.1953 1.7656 -0.677 0.502980 ***
Mean of dep var 1933.175 S.D of dep variable 2431.757
Error Sum of Sp (ESS) 1.8235e+007 Std Err of Resid (sgmahat) 732.3323
Unadjusted R-squared 0.921 Adjusted R-squared 0.909
F-statistic (5,34) 79.204 p-value for F() 0.000000
(31)MODEL SELECTION STATISTICS
SGMASQ 536311 AIC 615352 FPE 616757
HQ 674378 SCHWARZ 792765 SHIBATA 592623
GCV 630954 RICE 651234
Excluding the constant, p-value was highest for variable (FARE) of the model selection statistics, have improved
[Lưu ý tất ràng buộc lựa chọn mơ hình cải thiện, nghĩa là, giảm ñi Cũng vậy, việc loại bỏ GASPRICE ñã cải thiện độ xác hệ số cịn lại cách làm cho chúng có ý nghĩa nhiều – chẳng hạn, số DENSITY Biến có hệ số ý nghĩa nhất, nghĩa là, giá trị p-value cao nhất, FARE Nhưng vé xe buýt
là thước ño theo cách nói lý thuyết kinh tế yếu tố quan trọng nhu cầu Do đó, khơng nên loại bỏ giá trị p-value cho chúng
ta bỏ Do bước loại bỏ LANDAREA, biến có giá trị p-value cao
kế tiếp.]
MODEL 3: OLS estimates using the 40 observations 1-40 Dependent variable: BUSTRAVL
VARIABLE COEFFICIENT STDERROR T STAT 2PROB(t > |T|)
0) const 3111.1805 1071.0669 2.905 0.006330 ***
2) FARE -295.7306 424.8354 -0.696 0.490959oooo
4) INCOME -0.2022 0.0626 -3.232 0.002680 ***
5) POP 1.5883 0.1227 12.950 0.000000 ***
6) DENSITY 0.1490 0.0357 4.173 0.000189 ***
Mean of dep var 1933.175 S.D of dep variable 2431.757
Error Sum of Sp (ESS) 1.848e+007 Std Err of Resid (sgmahat) 726.6434
Unadjusted R-squared 0.920 Adjusted R-squared 0.911
F-statistic (5,34) 100.445 p-value for F() 0.000000
Durbin-Watson stat 1.995 First-order autocorr coeff -0.102
Bảng 4.4 (Tiếp theo)
MODEL SELECTION STATISTICS
SGMASQ 528011 AIC 593232 FPE 594012
HQ 640287 SCHWARZ 732670 SHIBATA 577512
GCV 603441 RICE 616012
Excluding the constant, p-value was highest for variable (FARE) of the model selection statistics, have improved
[Biến DENSITY ñã gia tăng đáng kể Tuy nhiên, biến FARE có giá trị p-value 49%,
(32)MODEL 4: OLS estimates using the 40 observations 1-40 Dependent variable: BUSTRAVL
VARIABLE COEFFICIENT STDERROR T STAT 2PROB(t > |T|)
0) const 2815.7032 976.3007 2.884 0.006589 ***
4) INCOME -0.2013 0.0621 -3.241 0.002566 ***
5) POP 1.5766 0.1206 13.071 0.000000 ***
6) DENSITY 0.1534 0.0349 4.396 0.000093 ***
Mean of dep var 1933.175 S.D of dep variable 2431.757
Error Sum of Sp (ESS) 1.8736e+007 Std Err of Resid (sgmahat) 721.4228
Unadjusted R-squared 0.919 Adjusted R-squared 0.912
F-statistic (5,34) 135.708 p-value for F() 0.000000
Durbin-Watson stat 1.879 First-order autocorr coeff -0.043
MODEL SELECTION STATISTICS
SGMASQ 520451 AIC 572112 FPE 572496
HQ 608137 SCHWARZ 677373 SHIBATA 562087
GCV 578279 RICE 585507
Of the model selection statistics, have improved
[Lưu ý mơ hình có trị thống kê lựa chọn mơ hình thấp tất hệ số có nghĩa lớn Cũng vậy, hệ số ñối với INCOME, POP, DENSITY không khác với hệ số mô hình mơ hình Vì thiên lệch việc loại bỏ FARE không nghiêm trọng
Vì lợi ích hồn tất, thật đáng để xem mơ mơ hình khơng giới hạn Mơ mơ hình giới hạn ñể thực kiểm ñịnh F-test ñể
kiểm tra xem liệu hệ số GASPRICE, LANDAREA, FARE ñồng thời khác với khơng Kết cho đây.]
F(3,33): area to the right of 0.315845 = 0.813800
[Giả thuyết khơng kiểm định F Wald phát biểu hệ số tất biến
bị loại bỏ khơng, nghĩa là, hệ số β2 = β3 = β7 = Vì giá trị p-value trường
hợp 0.8138, giá trị cao tiêu chuẩn hợp lý nào, bác bỏ giả thuyết không Sử dụng tính tốn phương trình (4.3), kiểm tra lại trị thống kê F cho biến bị loại bỏ ñã cho 0,315845 (lưu ý mơ hình mơ hình
khơng bị giới hạn mơ hình mơ hình giới hạn kiểm định này) Sau dùng bảng F với mức 10% ñược cho Bảng A.4c kiểm tra lại bạn bác
bỏ giả thuyết khơng mức 10% Vì vậy, hệ số FARE, GASPRICE,
LANDAREA đồng thời khơng có nghĩa mức Dựa tất ràng buộc, mơ hình dường “tốt nhất” chọn mơ hình cuối cho việc diễn dịch
(33)người ta có khuynh hướng sử dụng xe ñể di chuyển, lượng ñi xe buýt giảm xuống Nếu thu nhập ñầu người tăng lên khoảng 100 la, thì, trung bình, xe buýt ñược kỳ vọng giảm khoảng 100|βˆ4|, nghĩa là, khoảng 20,13 ngàn người Như kỳ vọng, hệ số POP DENSITY dương Nói cách khác, kích thước dân số hay mật ñộ dân số tăng lên, có nhiều người di chuyển xe bt Tuy nhiên, giá trị số DENSITY nhạy, POP lại khơng lớn (chú ý hai DENSITY POP ñều ñược ño lường ñơn vị) ðiều gợi ý khả đặc trưng sai mơ hình
Khi ước lượng mối quan hệ nhu cầu, người ta thường ñặt câu hỏi liệu nhu cầu “co giãn” hay “khơng co giãn” giá thu nhập Việc trả lời cho câu hỏi địi hỏi ước lượng mối quan hệ phi tuyến tính, chủ ñề ñược khảo sát chi tiết Chương 6.]
4.7 Ứng dụng: Sự tham gia lực lượng lao ñộng nữ giới
Ứng dụng thứ hai xuyên suốt ñược dùng ñây nghiên cứu kinh tế lượng xác ñịnh tỷ lệ tham gia lực lượng lao ñộng nữ giới – phần trăm nữ giới 16 tuổi lực lượng lao động thực làm việc hay tìm việc DATA4-5 mơ tả phụ lục D trình bày liệu ñiều tra dân số năm 1990 cho 50 bang nhiều biến (biến ñầu tiên biến phụ thuộc):
WLFP =
YF = YM = EDUC =
UE = MR = DR = URB = WH =
Tỷ lệ tham gia (%) phụ nữ 16 tuổi (phần trăm phụ nữ lực lượng lao ñộng)
Mức lương trung vị (ngàn đơ-la) nữ Mức lương trung vị (ngàn đơ-la) nam
Phần trăm nữ giới tốt nghiệp trung học 24 tuổi Tỷ lệ thất nghiệp (%)
Tỷ lệ kết hôn (%) nữ giới từ 16 tuổi trở lên Tỷ lệ ly hôn
Phần trăm dân số thành thị nước Phần trăm phụ nữ da trắng 16 tuổi
Mơ hình kinh tế lượng dùng tất biến giải thích sau:
WLFP = β1 + β2YF + β3YM + β4EDUC + β5UE + β6MR + β7DR + β8URB + β9WH + u
Trước thực ước lượng mơ hình, việc thảo luận dấu hệ số hồi qui kỳ vọng hữu ích Sự thảo luận ñược rút dựa “lý thuyết kinh tế” tương phản với “lý thuyết kinh tế lượng” Bạn ñọc tham khảo viết O’Neill (1981), Kelley Da Silva (1980), King (1978) ñể biết thêm chi tiết vài lý thuyết
(34)việc) Với tiền lương hành, hiệu ứng yếu; đó, cân bằng, ta kỳ vọng biến có hệ số dương
YM: Khi người chồng làm tiền nhiều hơn, người vợ khơng cần làm việc nhiều Do đó, ta kỳ vọng hệ số âm Cũng nhiều phụ nữ có khả chun mơn tốt, thu nhập nam giới cao khiến nhiều phụ nữ tìm việc Tuy nhiên, điều tác động đến loại cơng việc khơng tác động đến việc nhiều phụ nữ tham gia lực lượng lao động hay khơng
EDUC: Sự giáo dục nhiều ngụ ý có nhiều hội việc làm (mong ước) sẵn có cho nữ Vậy, ta kỳ vọng hệ số dương
UE: Tỷ lệ thất nghiệp có hiệu ứng âm dương “giả thuyết người lao ñộng chán nản” nói rõ tỷ lệ thất nghiệp cao dấu hiệu cho phụ nữ (và phận người thiểu số) biết tìm việc cơng việc vơ ích ðiều làm cho họ rời khỏi lực lượng lao động, hệ số có dấu âm Cũng có hiệu ứng dương Nếu người chồng việc, người vợ phải tham gia lao động ñể bù vào khoản tiền bị Nếu hiệu ứng khơng mạnh, dấu âm chiếm ưu
MR: Nếu phụ nữ kết hôn, cô ta có xu hướng có hội làm việc (đặc biệt họ có con) giảm mong muốn cần thiết có việc Vậy tỷ lệ kết cao giảm tỷ lệ tham gia lao ñộng nữ – WLFP
DR: Ta kỳ vọng dấu dương cho biến tỷ lệ ly cao, nhiều phụ nữ tham gia lực lượng lao ñộng nhằm tự chu cấp cho họ
URB: Tại khu vực thành thị hội việc làm nhiều nông thôn Ta kỳ vọng tiểu bang có phần dân số sống thành thị nhiều có tỷ lệ tham gia lao ñộng nữ cao Mặt khác, phụ nữ nơng thơn có chiều hướng tự sống ni thú ni gia cầm làm việc đồng khác Vậy, họ ñã phần lực lượng lao ñộng ðiều có nghĩa tiểu bang có dân số nơng thơn đơng (nghĩa URB), tham gia lao động nữ cao hơn, kết hệ số âm Hiệu ứng sau xác định theo kinh nghiệm
WH: Khơng có dấu rõ ràng kỳ vọng trước cho biến Nếu phụ nữ da màu tương ñối khơng giỏi chun mơn tìm loại việc giúp việc hay quản gia, ta kỳ vọng dấu âm cho hệ số tỷ lệ phụ nữ da trắng (WH) cao số phụ nữ da màu thấp Cũng vậy, phụ nữ da trắng tương đối giàu có, họ khơng tham gia lực lượng lao ñộng ðiều dẫn ñến dấu âm Nếu giả thiết khơng đúng, kết dấu dương
Bảng 4.5 cho thấy kết chạy máy tính phần với thích (xem Phần 4.5 Thực hành Máy tính) Dùng chương trình hồi qui bạn DATA 4-5 để mơ kết Sau nghiên cứu kỹ kết trước tiến hành tiếp
Bảng 4.5 Kết chạy máy tính phần có thích tỷ lệ tham gia lực lượng
lao ñộng nữ giới
(35)MODEL 1: OLS estimates using the 50 observations 1-50 Dependent variable: wlfp
VARIABLE COEFFICIENT STDERROR T STAT 2Prob(t > T)
0) const 44.5096 8.9750 4.959 0.000013 ∗∗∗
2) yf 0.9880 0.4076 2.424 0.019847 ∗∗
3) ym -0.1743 0.3062 -0.569 0.572212
4) educ 0.2851 0.0932 3.060 0.003888 ∗∗∗
5) ue -1.6106 0.3136 -5.136 0.000007 ∗∗∗
6) mr -0.0782 0.1731 -0.452 0.653835
7) dr 0.4374 0.2583 1.693 0.098035 ∗
8) urb -0.0926 0.0333 -2.776 0.008195 ∗∗∗
9) wh -0.0875 0.0398 -2.196 0.033819 ∗∗
Bảng 4.5 (tiếp theo)
Mean of dep var 57.474 S.D of dep variable 4.249
Error Sum of Sq (ESS) 193.9742 Std Err of Resid (sgmahat) 2.1751
Unadjusted R-squared 0.781 Adjusted R-squared 0.738
F-statistic (8, 41) 18.2459 p-value for F( ) 0.000000
Durbin-Watson stat 1.637 First-order autocorr coeff 0.179
MODEL SELECTION STATISTICS
SGMASQ 4.73108 AIC 5.56058 FPE 5.58267
HQ 6.33926 SCHMARZ 7.84492 SHIBATA 5.2761
GCV 5.76961 RICE 6.06169
Excluding the constant, p-value was highest for variable (mr)
[Lưu ý ym mr có giá trị p cao biến ưu tiên ñể loại khỏi mơ hình Bây ta bỏ biến lần biến, bắt đầu với mr, có giá trị p cao nhất]
MODEL 2: OLS estimates using the 50 observations 1-50 Dependent variable: wlfp
VARIABLE COEFFICIENT STDERROR T STAT 2Prob (t > T)
0) const 41.3460 5.5598 7.437 0.000000 ∗∗∗
2) yf 1.0671 0.3645 2.927 0.005497 ∗∗∗
3) ym -0.1984 0.2987 -0.664 0.510097
4) educ 0.2582 0.0709 3.643 0.000734 ∗∗∗
5) ue -1.5910 0.3076 -5.171 0.000006 ∗∗∗
7) dr 0.3916 0.2354 1.664 0.103626
8) urb -0.0876 0.0311 -2.814 0.007420 ∗∗∗
(36)Mean of dep var 57.474 S.D of dep variable 4.249
Error Sum of Sq (ESS) 194.9397 Std Err of Resid (sgmahat) 2.1544
Unadjusted R-squared 0.781 Adjusted R-squared 0.743
F-statistic (7, 42) 21.2255 p-value for F( ) 0.000000
Durbin-Watson stat 1.649 First-order autocorr coeff 0.173
MODEL SELECTION STATISTICS
SGMASQ 4.64142 AIC 5.36914 FPE 5.38405
HQ 6.03252 SCHMARZ 7.29064 SHIBATA 5.14641
GCV 5.5255 RICE 5.73352
Bảng 4.5 (tiếp theo)
Excluding the constant, p-value was highest for variable (ym) Of the model selection statistics, have improved
[Bỏ biến ym, biến giá trị p cao, ý dr trở nên có ý nghĩa mức 10 phần trăm]
MODEL 3: OLS estimates using the 50 obsetvations 1-50 Dependent variable: wlfp
VARIABLE COEFFICIENT STDERROR T STAT 2Prob (t > T)
0) const 41.8336 5.4753 7.640 0.000000 ∗∗∗
2) yf 0.8493 0.1582 5.370 0.000003 ∗∗∗
4) educ 0.2492 0.0691 3.606 0.000804 ∗∗∗
5) ue -1.6776 0.2769 -6.059 0.000000 ∗∗∗
7) dr 0.4341 0.2251 1.929 0.060390 ∗
8) urb -0.0942 0.0293 -3.212 0.002500 ∗∗∗
9) wh -0.0961 0.0352 -2.729 0.009156 ∗∗∗
Mean of dep var 57.474 S.D of dep variable 4.249
Error Sum of Sq (ESS) 196.9882 Std Err of Resid (sgmahat) 2.1404
Unadjusted R-squared 0.777 Adjusted R-squared 0.746
F-statistic (6, 43) 25.0145 p-value for F( ) 0.000000
Durbin-Watson stat 1.668 First-order autocorr coeff 0.165
MODEL SELECTION STATISTICS
SGMASQ 4.58112 AIC 5.21282 FPE 5.22248
HQ 5.77222 SCHMARZ 6.81281 SHIBATA 5.0429
GCV 5.32688 RICE 5.47189
Of the model selection statistics, have improved
(37)F(2, 41): area to the right of 0.318535 = 0.728997
[Dùng máy tính, thực thống kê kiểm ñịnh Wald bỏ biến ym dr Giả thuyết khơng cho kiểm định β3 = β7 = Như trên, giá trị p xác suất sai lầm loại I ta bác bỏ giả thuyết khơng Vì 0,279 q cao cho mức ý nghĩa hợp lý
nào, ta không nên bác bỏ giả thuyết không mà thay vào kết luận ym dr
khơng có ý nghĩa liên kết Bạn nên chứng minh ñiều cách dùng bảng F Phụ lục A.4c với mức ý nghĩa 10 phần trăm Tất trị thống kê chọn lựa mơ hình thấp Mơ hình Do đó, ta chọn Mơ hình mơ hình cuối “tốt nhất” ñể khảo sát tiếp ðể giải thích kết quả, xem đọc.]
Trong Mơ hình 3, chọn mơ hình cuối “tốt nhất”, dấu dương biến YF “hiệu ứng ñường cung bẻ ngược” lên lao ñộng – nghĩa là, tiền lương tăng người lao động thích thư nhàn tham gia vào lực lượng lao ñộng – yếu Mọi ñiều khác nhau, lương phụ nữ tăng lên $1.000 tỷ lệ tham gia lao động ta kỳ vọng tăng trung bình 0,849 phần trăm
Tiền lương nam giới (YM) ñã khơng có ý nghĩa ðiều biến ñược liên kết chặt chẽ với biến YF bị bao gộp hệ số biến YF
Như ñã kỳ vọng, giáo dục tăng làm cho nhiều phụ nữ tìm việc Tỷ lệ phụ nữ tốt nghiệp trung học tăng phần trăm tăng tỷ lệ tham gia lao động trung bình 0,249 phần trăm
Dấu âm biến UE xác nhận cho “giả thuyết người lao động chán nản”, nói rõ tỷ lệ thất nghiệp cao, phụ nữ tìm việc chán nản rời khỏi lực lượng lao động Mức quan trọng hệ số hồn tồn cao Biến UE tăng phần trăm đồng nghĩa với tỷ lệ tham gia lao ñộng WLFP giảm trung bình 1,678 phần trăm
Tỷ lệ ly có dấu dương Trung bình, tỷ lệ ly tăng phần trăm kỳ vọng làm cho tỷ lệ tham gia lao ñộng WLFP tăng 0,434 phần trăm Tuy nhiên, tỷ lệ kết (MR) khơng có ý nghĩa mặt thống kê
Hệ số âm biến URB (-0,094) xác nhận luận ñiểm trước ñây dân số nơng thơn cao (nghĩa là, URB thấp) làm cho WLFP cao phụ nữ nơng thơn làm nhiều cơng việc đồng nghĩa tham gia lực lượng lao ñộng
Phần trăm phụ nữ da trắng tăng phần trăm làm cho tỷ lệ tham gia lao động nữ giảm trung bình 0,096 phần trăm
Giá trị R2
cho biết khoảng 74 phần trăm thay ñổi tỷ lệ tham gia lao động liên bang giải thích Mơ hình C Vậy, ta bỏ vài biến để tăng khả giải thích mơ hình Tuy nhiên, liệu chéo lớp cho R2
thấp hồn tồn đặc trưng Bởi liệu theo chuỗi nói chung nhiều lần phát triển mức, mơ hình dựa liệu có chiều hướng cho độ thích hợp cách tương đối Có thể thấy ñiều qua giá trị R2
(0,999) hàm tiêu dùng trình bày Ví dụ 4.11 Với liệu thêm vào, ta có giải thích tốt tỷ lệ tham gia lao ñộng nữ giới Các biến tính đến hồi qui sau:
1 Quy mơ gia đình, tỷ lệ sinh sản, số trẻ em “ngưỡng” tuổi; yếu tố có chiều hướng làm giảm hội việc làm nữ giới
(38)3 Phân phối tuổi nữ giới
4 Trợ cấp trả cho phụ nữ độc thân có trẻ em; yếu tố khiến cho phụ nữ làm nhà (Tính sẵn có chăm sóc hàng ngày có hiệu ứng)
5 ðộ đo thể khác vùng; vùng trang trại vùng cơng nghiệp có kiểu hành vi khác
Những nhận xét quan trọng diễn giải hệ số hồi qui
Khi diễn giải hệ số hồi qui ước lượng cần phải thật thận trọng Trước hết, dấu hệ số hồi qui trái ngược với bạn kỳ vọng ban đầu Nếu hệ số khơng có ý nghĩa mặt thống kê (nghĩa là, bạn bác bỏ giả thuyết không cho
rằng hệ số khơng), sai dấu khơng thích hợp mặt thống kê, giá trị số mang dấu dương âm ngang đơn tình cờ ngẫu nhiên bạn thu dấu sai Trong nhận xét có thích bảng 4.4, ta nói rõ số lý hợp lý ñể loại bỏ biến có hệ số khơng có ý nghĩa (diễn giải dễ hơn, ý nghĩa xác hơn) Trong trường hợp vậy, ñơn giản bạn nên bỏ biến số ước lượng lại mơ hình với tin ñộ thiên lệch biến vừa loại bỏ khơng đáng kể Nên ý bỏ biến khơng có nghĩa bạn nói biến khơng có hiệu ứng lên biến Y, mà phải hiểu là, mọi thứ khác nhau, biến ñang bàn đến khơng có hiệu ứng riêng lẻ Hiệu ứng thể qua diện biến khác có tương quan
(Chương ñề cập nhiều hơn)
Khi ñịnh chọn ý nghĩa không thông số hồi qui, câu hỏi ñáng quan tâm “Với mức giá trị p ta cho cao để bác bỏ giả thuyết khơng hiệu ứng 0?” Hầu hết nhà phân tích dùng mức phần trăm (hoặc 0.05) làm chuẩn Mức ưa thích cá nhân 10 phần trăm Một ưu ñiểm dùng giá trị cao có nhiều biến giữ lại mơ hình (giải thích tình huống), giảm thiên lệch biến bỏ Khơng giống thí nghiệm y học, mà sai lầm trả giá đắt, hành vi kinh tế phải chịu nhiều yếu tố không chắn, mức dung sai phải cao Tuy nhiên, cỡ mẫu (n) lớn, ta nên dùng giá trị p ngặt Bởi n lớn, ñộ lệch chuẩn nhỏ, làm cho hầu hết hệ số có ý nghĩa
Ta nên làm hệ số có dấu ngược có ý nghĩa mặt thống kế? Ta nên tìm câu giải thích Lấy ví dụ, ví dụ 4.1 giá nhà, ta phát dấu âm khác thường biến BEDRMS BATHS Tuy nhiên, theo ý nghĩa hợp lý hệ số hồi qui – nghĩa hiệu ứng phần, khi tất biến khác khơng đổi giá trị – ta thấy hệ
số âm xét cho không q ngạc nhiên Ở ví dụ thứ hai, mơ hình du lịch xe buýt Phần 4.6 (xem Bảng 4.4), ta phát hệ số thu nhập có dấu âm, trái ngược với ñiều người thường kỳ vọng Trong trường hợp này, ta đến giải thích hợp lý nhận thấy dấu âm cho biết du lịch xe buýt “hàng hóa thấp cấp” Chương cung cấp ví dụ khác trường hợp mà ta bắt gặp dấu khác thường ñề xuất biện pháp xử lý Các ví dụ nên nghiên cứu kỹ lưỡng
(39)vậy theo phần trăm Lý dễ dàng diễn dịch hiệu ứng phần trăm thay 0,01 thay ñổi biến số Tuy nhiên, viết thực nghiệm nhà điều tra nghiên cứu biểu diễn vài biến dạng tỷ lệ Trong trường hợp thế, phải thật thận trọng diễn dịch giá trị số Ở phần này, bạn ñọc hiểu xem lại diễn dịch hệ số ước lượng biến dạng phần trăm ví dụ tham gia lực lượng lao ñộng nữ giới vừa thảo luận
4.8 Ví dụ thực nghiệm: Tỷ lệ di trú ròng chất lượng sống
Liu (1975) ñã nghiên cứu mối quan hệ thay ñổi tỷ lệ di trú ròng bang số biến giải thích, gồm “chất lượng sống” Dữ liệu chéo 50 bang, mô hình dùng sau:
MIGRATE = f(QOL, Y, E, IS, ES, AP, ED, HW)
Trong
MIGRATE = Tỷ lệ di trú rịng năm 1960 1970 (số chuyển ñến trừ số chuyển ñi chia cho dân số)
QOL = Chỉ số chất lượng sống
Y = Chỉ số thu nhập bang thu nhập quốc gia
E = Tỷ lệ số việc làm bang số việc làm quốc gia IS = Chỉ số tình trạng cá nhân
ES = Chỉ số tình trạng kinh tế AP = Chỉ số sản xuất nông nhgiệp ED = Chỉ số phát triển giáo dục
HW = Chỉ số trợ cấp phúc lợi chăm sóc sức khỏe
Dựa tiêu ñược phát triển Ủy ban Mục tiêu Quốc gia Chủ tịch Eisenhower Liu ñã xây dựng số liệt kê QOL trung bình số học số khác chất lượng sống Bảng 4.6 có hệ số ước lượng thống kê liên quan cho số mơ hình hồi qui bội liên kết tỷ lệ di trú với số chất-lượng-cuộc-sống ðể thưởng thức nghiên cứu di trú tác giả, sinh viên nên ñọc nguyên viết Mặc dù chủ ñề ñề cập chương đủ để hiểu rõ mơ hình kết quả, ta trình bày tóm tắt kết
Tác giả khơng cung cấp thơng tin tổng bình phương phần dư cho mơ hình, ta khơng thể so sánh mơ hình cách dùng tiêu chuẩn chung trình bày trước ðộ thích hợp đánh giá R2
Ta lưu ý thu nhập việc làm tự thân khơng giải thích thay ñổi biến di trú Giá trị R2
âm Mơ hình QOL tự thân giải thích khoảng phần trăm thay đổi biến di trú Nếu thu nhập việc làm ñược thêm vào QOL (Mơ hình 3), R2
(40)này ước lượng lại mơ hình để ước lượng hệ số lại hiệu Nhưng tác giả ñã ñịnh giữ biến số lại ñể tránh thiên lệch có biến bị bỏ ñi
Tất biến chất lượng-cuộc-sống có dấu kỳ vọng dương loại bỏ biến phát triển giáo dục (dấu âm biến HW bỏ qua khơng có ý nghĩa mặt thống kê) Sự hợp lý Liu kết khác thường ñược tái diễn lại ñây (Liu, 1975, trang 333):
Bảng 4.6 Tương quan ước lượng Di trú Chất lượng sống
Biến ñộc lập Mơ hình Mơ hình Mơ hình Mơ hình Mơ hình
CONSTANT
QOL
Y
E
IS
ES
AP
ED
HW
-23.05
24.06 (2.05)
104.62
0.36 (0.05)
103.47 (-0.48)
55.94
23.40 (1.93)
-0.74 (-0.10)
-77.26 (-0.37)
-16.46
28.68 (2.02)
20.03 (2.24)
18.73 (2.87)
-31.56 (-3.46)
-18.45 (-1.41)
-62.50
7.19 (1.11)
41.76 (0.23)
30.21 (2.14)
20.49 (2.28)
19.13 (2.89)
-33.48 (-3.59)
-21.69 (-1.57)
2
R 0.06 -0.03 0.02 0.37 0.36
D.F 48 47 46 44 42
Lưu ý: Các giá trị () thông kê t
f
Nguồn: Liu (1975), Tái với cho phép Hiệu trưởng hội viên trường Harvard
(41)
4.9 Dự án thực nghiệm
Nếu dự án thực nghiệm phần khóa học kinh tế lượng bạn, bạn nên theo hướng dẫn phần 1.3 thu thập vài liệu Nếu bạn có thơng tin ñủ biến, bạn nên nhập liệu vào máy tính liệu nhập cách xác (nếu bạn dùng GRELT, đọc sách hướng dẫn để đặt file liệu bạn) Sau bạn thử mơ hình đầu tiên, loại bỏ biến thực kiểm ñịnh Wald, áp dụng kỹ thuật ñơn giản hóa mơ hình dựa liệu để khử biến Tuy nhiên tất bước ñơn ñể thực hành hiểu rõ thêm chủ ñề ñược ñề cập chương Bạn không nên xem trọng kết quả, cần phải có nghiên cứu lý thuyết đáng kể trước đảm nhận mơ hình ý nghĩa phân tích
Tóm tắt
Trong mơ hình hồi qui tuyến tính bội, biến phụ thuộc (Y) hồi qui dựa vào k biến độc lập X1, X2,…, Xk X1 thơng thường đặt để bao gộp số hạng tung độ gốc khơng đổi Như trước đây, thủ tục OLS cực tiểu tổng bình phương sai số ∑
t
uˆ cho k phương trình chuẩn Những phương trình nói chung ñược giải cho hệ số, với ñiều kiện số quan sát lớn k
Ước lượng khơng thiên lệch phương sai sai số (σ2) xác ñịnh s2 = )
/( ) ˆ (
ˆ u2 n k
t
2 = ∑ −
σ Với giả thiết số hạng sai số ut phân phối ñộc lập ñồng N(0, σ2), trị thống kê n−k σ2 σ2
/ ] ˆ )
[( có phân phối chi bình phương với n-k bậc tự ðộ thích hợp đo lường theo cách tương đương Từ phương trình ước lượng, phần dư ñược ño uˆt =Yt −βˆ1−βˆ2Xt2 − −βˆkXtk Tổng bình phương sai số (ESS) ∑
t
uˆ , tổng bình phương tồn phần (TSS) ∑ − t Y
Y )
( ðộ lệch chuẩn hồi qui
ñược xác ñịnh ESS n k 1/2
)] /(
[
ˆ = −
σ so sánh với 12
Y TSS n
/
)] /( [
ˆ = −
σ ñể thấy ñộ
biến giảm Một ñộ ño lường không tự ñơn vị ñược xác ñịnh bình phương R có hiệu chỉnh (ký hiệu R2
), tính sau
TSS n R k n n k n TSS n ESS
R2 ˆ2( )
) ( ) ( ) ( σ − − = − − − − = − − − =
R diễn giải thay đổi Yt giải thích mơ hình Khơng giống R2, 1–(ESS/TSS), R2
có tính đến đánh đổi tăng thêm R2 biến ñược thêm vào giảm ñi bậc tự
(42)ðể kiểm ñịnh hệ số riêng lẻ (β) khác không cách ý nghĩa hay không, trước tiên ta tính thống kê t (tc), tỷ số hệ số ước lượng với ñộ lệch chuẩn ước lượng Nếu |tc|> t*n-k (α/2), với t* ñiểm phân phối t với bậc tự n-k theo xác suất ñể t > t* nửa mức ý nghĩa α, giả thuyết khơng H0: β = bị bác bỏ giả thuyết H1: β≠ ñược củng cố Nếu giả thuyết củng cố ñược kiểm ñịnh phía, ta thu t* mà vùng bên phải giá trị với mức ý nghĩa Vậy ta bác bỏ H0 chấp nhận β > tc > t* β< tc < -t*
ðể áp dụng phương pháp p-value, trước tiên tính tốn lần vùng bên phải |tc| phân phối t với bậc tự n-k Bác bỏ H0 giá trị p nhỏ mức ý nghĩa, kết luận hệ số có ý nghĩa
ðể kiểm định hệ số hồi qui có khơng hay khơng, phải thực kiểm định F-test, cịn ñược gọi kiểm ñịnh Wald Cụ thể hơn, ñể kiểm ñịnh H0: βm+1 = βm+2 = = βk = đối lại giả thuyết có hệ số khác không, trước tiên ta ước lượng mơ hình khơng giới hạn (U):
(U) Y = β1 + β2X2 + + βmXm + βm+1Xm+1 + + βkXk + u Tiếp theo ta bỏ k-m biến cuối ước lượng mơ hình giới hạn (R):
(R) Y = β1 + β2X2 + + βmXm + v Kế đến ta tính trị thống kê F Wald
) /( ) ( ) /( ) ( ) /( ) /( ) ( k n R m k R R k n ESS m k ESS ESS F 2 U R U U U R c − − − − = − − − =
Trong R2 độ thích hợp chưa hiệu chỉnh Giả thuyết không bị bác bỏ Fc > F*k-m, n-k (α), F* điểm phân phối F với k-m n-k bậc tự theo xác suất để F > F* α (ví dụ, 0,05 0,01) Kiểm định Wald khơng cần thực có hệ số hồi qui bị bỏ khỏi mơ hình Lý kiểm ñịnh t-test hệ số tương ứng tương ñương
Trị thống kê kiểm ñịnh Wald cho ñộ thích hợp tổng quát ñược xác ñịnh sau
) /( ) ( ) /( k n R 1 k R Fc 2
− −
− =
có phân phối F với bậc tự k-1 n-k
Kiểm ñịnh tổ hợp tuyến tính hệ số hồi qui thực theo cách tương ñương Thống kê t dựa tổ hợp tuyến tính ước lượng có bậc tự n-k dùng kiểm ñịnh t tương tự dựa hệ số hồi qui riêng lẻ Hoặc tổ hợp tuyến tính sáp nhập vào mơ hình thực kiểm ñịnh t F-test
(43)Nên tránh “khai thác liệu” khơng cẩn thận để tìm “độ thích hợp tốt nhất” điều thường dẫn ñến chứng minh giả thuyết mà ta nghĩ ñến nhiên chứng minh trái ngược Khơng nên áp dụng mù quáng tiêu cứng nhắc mà không xét ñến lý thuyết hiểu biết hành vi
Hệ việc ñưa vào biến khơng liên quan (nghĩa biến có hệ số hồi qui không) sau:
1 Các hệ số hồi qui ước lượng dùng mơ hình sai dự báo dựa ước lượng không thiên lệch quán
2 Những ước lượng không hiệu ước lượng khơng thiên lệch tuyến tính tốt (BLUE) ước lượng dựa mơ hình BLUE
3 Những kiểm ñịnh giả thuyết hợp lệ phương sai ước lượng không thiên lệch Tuy nhiên, khả kiểm định bị giảm Nói cách khác, khả chấp nhận giả thuyết sai lầm (sai lầm loại II) cao dùng mơ hình sai
Hệ việc loại bỏ biến ñáng thuộc mơ hình là:
1 Các hệ số hồi qui ước lượng dùng mơ hình sai dự báo dựa ước lượng thiên lệch không quán
2 Phương sai ước lượng thiên lệch, kiểm định giả thuyết khơng cịn hợp lệ
So sánh hệ theo lý thuyết việc thêm biến không liên quan với việc loại bỏ biến quan trọng, ta quan sát thấy có đánh ñổi Sai số ñặc trưng việc thêm biến vào làm cho ước lượng không hiệu quả, cho dù không thiên lệch Dạng sai số việc bỏ biến làm cho ước lượng kiểm ñịnh giả thuyết thiên lệch Bởi chưa thể biết mối quan hệ thực, ta lâm vào tình khó khăn để chọn cơng thức thích hợp Một nhà điều tra nghiên cứu cho tính khơng thiên lệch, tính thích hợp tin cậy kiểm định quan trọng giữ biến khơng liên quan nhận hậu việc loại bỏ biến quan trọng Ngược lại, nhà nghiên cứu chấp nhận ước lượng không hiệu quả, thích loại bỏ biến khơng liên quan Lý thuyết kinh tế hiểu biết hành vi thường giúp ích tình khó khăn vầy Tiêu chuẩn lựa chọn mơ hình thảo luận trước giúp ích Các kiểm ñịnh ñặc trưng (Chương 6) giúp ích
(44)Thuật ngữ
Adjusted R2
Akaike information criterion (AIC) Data-based model simplification Finite prediction error (FPE) F-test
Generalized cross validation (GCV) Hedonic price index
HQ criterion Joint significance Nodel in deviation form Multiple regression Omitted variable bias Restricted model
R2 adjusted for degrees of freedom Specification error
Unrestricted model Wald test
Bình phương R có hiệu chỉnh Tiêu chuẩn thông tin Akaike (AIC) ðơn giản hóa mơ hình dựa liệu Sai số dự báo hữu hạn (FPE)
Kiểm định F-test
Tính hợp lệ chéo suy rộng (GCV) Chỉ số giá hưởng thụ
Tiêu chuẩn HQ Ý nghĩa liên kết
Mơ hình dạng sai lệch Hồi qui bội
Thiên lệch biến bị loại bỏ Mơ hình giới hạn
Bình phương R có hiệu chỉnh bậc tự Sai số đặc trưng
Mơ hình khơng giới hạn Kiểm định Wald
4.A PHỤ LỤC
Các Kết Quả Tính Tốn Khác
4.A.1 Mơ Hình Hồi Quy Ba Biến
Mơ hình hồi quy biến diễn tả mối quan hệ biến phụ thuộc Y với số hai biến độc lập X2, X3 Mơ hình thức cho sau:
Yt = β1 + β2Xt2 + β3Xt3 + ut (4.A.1) Lấy trung bình số hạng mơ hình, ta có được:
u X X
Y=β1 +β2 2 +β3 3 + (4.A.2)
Lấy hiệu số với mơ hình (4.A.1), ta có mơ hình dạng sai lệch sau:
yt = β2Xt2 + β3Xt3 + et (4.A.3) Trong yt=Yt−Y, xt2 =Xt2−X2, xt3 =Xt3−X3, et =ut −u Các ký tự dạng chữ thường diễn tả giá trị sai lệch biến với giá trị trung bình tương ứng biến Lợi điểm việc biểu diễn mơ hình dạng sai lệch cịn hai thơng số cần ước lượng (β2 β3) Nếu β1
)
, β2 )
, β3 )
giá trị ước lượng hệ số tương quan hồi qui, β1
)
ñược ước lượng sau:
3 2
1 Y ˆ X ˆ X
ˆ = −β −β
β
giá trị ước lượng số dư
3 t t t
t Y ˆ ˆ X ˆ X
(45)Nguyên tắc OLS làm cực tiểu hố tổng bình phương sai số ESS = ∑uˆt2theo
1
ˆ
β , βˆ2, βˆ3 ðiều tương ñương với việc cực tiểu hố (khơng chứng minh) t t t
t X )
ˆ X ˆ y ( eˆ ∑
∑ = −β −β Cho ñạo hàm phần theo βˆ2, βˆ3 ñẳng thức 0, dễ dàng chứng minh ñiều kiện trở thành
∑
∑xt2eˆt=0= xt2(yt−βˆ2xt2−βˆ3xt3)
∑
∑xt3eˆt =0= xt3(yt−βˆ2xt2−βˆ3xt3) Kết dẫn ñến hai phương trình sau (bỏ qua số t nhỏ)
∑ ∑
∑ +β =
β 3
2
2 x ˆ x x yx
ˆ (4.A.4)
∑ ∑ ∑ +β = β 3 3
2 x x ˆ x yx
ˆ (4.A.5)
Dùng ký hiệu đơn giản hơn, hai phương trình viết lại sau:
2 y 23 22
2S ˆ S S
ˆ +β = β (4.A.6) y 33 23
2S ˆ S S
ˆ +β = β (4.A.7) Trong ñó ∑ ∑ = − = 2 t 2 t
22 x (X X )
S (4.A.8)
∑
∑ = − −
= x x (X X )(X X )
S23 t2 t3 t2 2 t3 3 (4.A.9)
∑ ∑ = − = 3 t t
33 x (X X )
S (4.A.10)
∑
∑ = − −
= yx (Y Y)(X X )
Sy2 t t2 t t2 2 (4.A.11)
∑
∑ = − −
= y x (Y Y)(X X )
Sy3 t t3 t t3 3 (4.A.12)
Lời giải cho phương trình (4.A.6) (4.A.7) sau ∆ −
=
βˆ2 (Sy2S33 Sy3S23)/ (4.A.13)
∆ −
=
βˆ3 (Sy3S22 Sy2S23)/ (4.A.14)
Với
2 23 33
22S S
S −
=
∆ (4.A.15)
Cách tính phương sai βs
)
được trình bày phụ lục 5.A
4.A.2 ðộ Thiên Lệch Do Việc Bỏ Qua Một Số Biến Liên Quan
Mơ hình ước lượng ñược cho sau
(46)Mơ hình ước lượng: Yt =β1 +β2Xt2 +vt
Các giá trị ước lượng theo phương pháp OLS ñối với thơng số mơ hình ước lượng cho sau (xem phương trình 3.9 3.10)
22 y
2 S /S
ˆ =
β βˆ1=Y−βˆ2X2 (4.A.16)
Trong Sy2 S22 định nghĩa theo phương trình (4.A.11) (4.A.8) Giá trị kỳ vọng β2
)
cho E(Sy2) / S22 S22 khơng ngẫu nhiên:
∑ ∑
∑ − − = − − −
= (Y Y)(X X ) Y(X X ) Y(X X )
Sy2 t t2 2 t t2 2 t2 2
=∑Yt(Xt2 −X2)
Vì giá trị Y rút từ phép tính tổng ∑(Xt2 −X2)=0 theo tính chất 2.A.4 Thay Yt từ mơ hình (vì q trình để tạo Yt):
∑ − β +β +β +
= (X X )( X X u )
Sy2 t2 2 1 2 t2 3 t3 t
t 2 t t 2 t t 2 t
2 (X X )X (X X )X (X X )u
0+β ∑ − +β ∑ − +∑ −
=
Số hạng ñầu tiên zero rút từ tính chất 2.A.4 Số hạng thứ hai sau:
∑
∑(Xt2−X2)Xt2 = (Xt2−X2)(Xt2−X2+X2)
=∑(Xt2 −X2)2 +X2(Xt2 −X2)=∑(Xt2 −X2)2
Vì số hạng thứ hai zero , theo cách tính tương tự, ta có:
∑
∑(Xt2 −X2)Xt3= (Xt2 −X2)(Xt3 −X3) Sử dụng kết này, ta có được:
t 2 t 3 t 2 t 2 t 2
y (X X ) (X X )(X X ) (X X )u
S =β ∑ − +β ∑ − − +∑ −
2 u 23 22
2S +β S +S
β =
Trong đó, việc ký hiệu ñối với số hạng S tương tự số hạng cho phương trình (4.A.8) phương trình (4.A.12) Vì X2 X3 khơng ngẫu nhiên khơng tương quan với u E(u) = nên ta có:
23 22 2 u 23 22 2
y ) S S E(S ) S S
S (
E =β +β + =β +β
Theo sau đẳng thức trên, ta có:
(47)Vì β3≠0 nên βˆ2sẽ có sai số trừ S23 = – nghĩa trừ X2 X3 không tương quan ðiều chứng minh cho phương trình 4.4a sử dụng mơ hình ðộ sai số biến bị bỏ qua ñược cho β3 (S23/S22) Hướng ñộ thiên lệch phụ thuộc vào giá trị âm hay dương β3 tương quan X2 X3 thuận hay nghịch Vì cỡ mẫu tăng lên cách khơng xác định nên βˆ2 khơng hội tụ β2 (nếu S23≠ 0), giá trị ước lượng có khơng qn
Từ phương trình (4.A.16), ta có βˆ1 =Y−βˆ2X2, E(βˆ1)=E(Y)−X2E(βˆ2) Vì Y=β1+β2X2+β3X3+u, nên suy E(Y)=β1+β2X2+β3X3 Thế giá trị kỳ vọng giá trị kỳ vọng βˆ2vào ñẳng thức trên, ta có:
β + β − β + β + β = β 22 23 2 3 2 1 S S X X X ) ˆ ( E − β + β = 22 23 3 S S X X
Lưu ý ñiều kiện cần ñủ cho βˆ1không bị thiên lệch S S X X 22 23
3 =
−
ðiều kiện hai biến X2 X3 không tương quan không ñủ ñể bảo ñảm cho giá trị ước lượng số hạng tung độ gốc khơng bị thiên lệch Ngồi ra, giá trị trung bình
3
X phải zero Từ giá trị ước lượng βˆ1 βˆ2, nhận thấy giá trị chịu phần ảnh hưởng việc loại bỏ biến X3 ðiểm nhận xét có ý nghĩa quan trọng nên ñược nhấn mạnh Do hệ mà giá trị số học hệ số tương quan hồi qui khác so với phát biểu trước ñây ðiều vấn ñề ñặt cho hệ số tương quan khơng tác động trực tiếp biến tương ứng mà cịn tác động biến bị lược bỏ có tương quan với biến ñang xem xét
Tác giả Kamenta (1986, p 394) ñã chứng minh S23 = giá trị phương sai ước lượng βˆ2(sβ2ˆ2) bị thiên lệch theo phía dương ðiều có nghĩa E(s2ˆ )
2
β = Var (βˆ2) + Q, giá trị Q khơng âm Vì mà kiểm tra giả
định thơng thường khơng đem lại kết Hậu cho việc lược bỏ biến có liên quan nghiêm trọng
4.A.3 Chứng Minh Tính Chất 4.4
Mơ hình ước lượng cho sau
Yt = β1 + β2Xt2 + β3Xt3 + vt
Từ phương trình (4.A.13) (4.A.14) – ñề cập lại với (4.A.15) – giá trị ước lượng β2 β3 theo phương pháp OLS là:
$ (S ) /
(48)$ (S ) /
β3 = y3 22S −S Sy2 23 ∆ (4.A.14)
Trong
2 23 33
22S S
S −
=
∆ (4.A.15)
ðể kiểm tra xem giá trị β$2 có bị thiên lệch hay khơng, ta cần có giá trị kỳ vọng đúng Sy2 Sy3 Mơ hình ñúng sau (dưới dạng ñộ lệch):
yt =β$2xt2 + −u ut
Thế giá trị yt từ mô hình vào Sy2, ta có:
∑ =∑ β + − =β +
= t t2 t2 t2 t 22 u2
2
y y x x ( x u u) S S
S
22 2
y ) S
S (
E =β
vì xt2 khơng ngẫu nhiên cho trước E(Su2) = Mô hình phải sử dụng yt phát mơ hình khơng phải phương trình ước lượng Tương tự, ta có:
∑ =∑ β + − =β +
= t t3 t3 t2 t 23 u3
3
y y x x ( x u u) S S
S
E(Sy3)=β2S23
Lấy giá trị kỳ vọng phương trình (4.A.13) (4.A.14) vào E(Sy2) E(Sy3), ta có được:
E($ ) [β2 = S33 22β S −S23 23β S ]/∆=β2
E($ ) [β3 = S22 23β S −S23 22β S ]/∆=0
Suy ra, giá trị β$2 không bị thiên lệch giá trị kỳ vọng β$3 khơng kết tắch chất 4.5a Theo nguyên tắc luật số ựông tắnh chất quán dễ dàng ựược thiết lập
Tính tốn phương sai β$2
Bước tính tốn giá trị phương sai β$2 Ta có:
Var (Sy2) = Var (β2S22 + Su2) = Var (Su2) = σ2S22 Var (Sy3) = Var (β2S23 + Su3) = Var (Su3) = σ2S33 Cov (Sy2, Sy3) = Cov (β2S22 + Su2, β2S23 + Su3) = σ2S23
Trong việc ñạo hàm vế trên, ta ñã sử dụng tính chất khơng ngẫu nhiên biến S22 S33 Áp dụng tính chất 2.4a, ta có
2 y y 23 33
y
23 y
33
2) [S Var(S ) S Var(S ) 2S S Cov(S ,S )]/
ˆ (
(49)2 23 23 33 33 23 22 33
2[S S +S S −2S S S ]/∆
σ =
) S / S ( S S S S
S
33 23 22
2
2 23 33 22
33
− σ =
− σ =
Do r2 =S232 / (S22 33S ) (r2 bình phương giá trị tương quan đơn biến x2 x3), phương trình rút gọn lại sau:
Var
S r
($ )
( )
β2 σ
2
22 =
−