Ước lượng phương sai của hệ số hồi quy của một biến được đưa vào nói chung sẽ bị thiên lệch, và vì vậy các kiểm định giả thuyết sẽ không có ý nghĩa.. Các ước lượng và trị dự báo sẽ bị t[r]
(1)C
Chhưươơnngg44
M
MÔÔ HHÌÌNNHH HHỒỒII QQUUYY BBỘỘII
Trong Chương giới hạn trường hợp đơn giản mơ hình hồi quy hai biến Bây giờ, xem xét hồi quy bội, nghĩa liên hệ biến phụ thuộc Y cho trước với nhiều biến độc lập X1, X2, , Xk Mơ hình hồi quy tuyến tính đa biến có cơng thức tổng qt sau:
Yt = 1 + 2Xt2 + + kXtk + ut (4.1)
Xt1 đặt để có “tung độ gốc” Chữ t nhỏ biểu thị số lần quan sát có
giá trị từ đến n Các giả thiết số hạng nhiễu, ut, hoàn toàn giống giả thiết xác định
trong Chương Trong đặc trưng tổng qt mơ hình hồi quy bội, việc lựa chọn biến độc lập biến phụ thuộc xuất phát từ lý thuyết kinh tế, trực giác, kinh nghiệm khứ Trong ví dụ ngành bất động sản Chương 3, biến phụ thuộc giá nhà hộ gia đình Chúng ta đề cập số giá - hưởng thụ phụ thuộc vào đặc điểm nhà Bảng 4.1 trình bày liệu bổ sung cho 14 nhà mẫu bán Lưu ý rằng, liệu cho X1
chỉ đơn giản cột gồm số tương ứng với số hạng khơng đổi Tính số hạng khơng đổi, có tất k biến độc lập có k hệ số tuyến tính chưa biết cần ước lượng
Mơ hình tuyến tính bội ví dụ sau:
PRICE = 1 + 2SQFT + 3BEDRMS + 4BATHS + u (4.2)
Cũng trước, giá tính đơn vị ngàn la Ngồi diện tích sử dụng, giá liên hệ với số phòng ngủ số phòng tắm
Ảnh hưởng thay đổi Yt có Xti thay đổi xác định Yt /Xti = i
Vì vậy, ý nghĩa hệ số hồi quy i là, giữ giá trị tất biến khác không đổi, Xti
thay đổi đơn vị Yt kỳ vọng thay đổi, trung bình là, i đơn vị Do đó, 4 phương trình
(4.2) diễn giải sau: Giữa hai nhà có diện tích sử dụng (SQFT) số phịng ngủ (BEDRMS), nhà có thêm phịng tắm kỳ vọng bán với giá cao hơn, trung bình, khoảng 4 ngàn đơ-la Vì vậy, phân tích hồi quy bội giúp kiểm sốt
một tập hợp biến giải thích kiểm tra ảnh hưởng biến độc lập chọn
Bảng 4.1 Dữ liệu nhà hộ gia đình (giá tính ngàn la)
t
Giá (Y)
Hằng số (X1)
SQFT (X2)
BEDRMS (X3)
BATHS (X4)
1 199,9 1.065 1,75
2 228 1.254
3 235 1.300
4 285 1.577 2,5
5 239 1.600
6 293 1.750
7 285 1.800 2,75
8 365 1.870
9 295 1.935 2,5
10 290 1.948
(2)12 505 2.600 2,5
13 425 2.800
14 415 3.000
4.1 Phương trình chuẩn
Trong trường hợp mơ hình hồi quy bội, Giả thiết 3.4 hiệu chỉnh sau: Mỗi X cho trước
sao cho Cov(Xsi, ut) = E(Xsi ut) = với i từ đến k s, t từ đến n Vì vậy, biến
độc lập giả định không liên hệ với tất số hạng sai số Trong trường hợp thủ
tục bình phương tối thiểu thơng thường (OLS), định nghĩa tổng bình phương sai số
ESS = n
t = ut^ =
n
t = 1 (Yt -
^
1 - ^2Xt2 - - ^kXtk)2
Thủ tục OLS cực tiểu ESS theo ^
1,
^
2 ,
^
k Bằng cách thực Phần 3.A.3,
có thể có phương trình chuẩn, số phương trình chuẩn số hệ số tuyến tính ước lượng Do có k phương trình k hệ số hồi quy chưa biết (các tổng tính theo số t – nghĩa số lần quan sát):
Yt = n^1 + ^2 Xt2 + + ^k Xtk
YtXt2 = ^1Xt2 + ^2 X2t2 + + ^k XtkXt2
YtXti = ^1Xti + ^2 Xt2Xti + + ^k XtkXti
YtXtk = ^1Xtk + ^2 Xt2Xtk + + ^k X2tk
k phương trình chuẩn giải nghiệm đơn (chỉ trừ vài trường hợp ngoại lệ trình bày Chương 5) Các chương trình máy tính chuẩn thực tính tốn nhập liệu vào xác định biến độc lập, biến phụ thuộc Phụ lục 4.A.1 mô tả bước mô hình ba biến Y hồi quy theo số hạng khơng đổi, X2 X3
Các tính chất 3.1 đến 3.3 trường hợp hồi quy tuyến tính bội Do đó, ước lượng OLS BLUE, không thiên lệch, hiệu quán Phần dư giá trị dự đốn có từ liên hệ sau:
u^ = Yt - t ^1 - ^2Xt2 - - ^kXtk
Yt ^
= ^1 + ^2Xt2 + + ^kXtk = Yt - u^ t VÍ DỤ 4.1
Đối với mơ hình nêu Phương trình (4.2), liên hệ ước lượng (xem phần Thực hành máy tính 4.1)
(3)Lập tức lưu ý hệ số hồi quy BEDRMS BATHS âm, trái với mong đợi Chúng ta cảm thấy theo trực giác thêm phòng tắm phòng ngủ tăng giá trị nhà Tuy nhiên, hệ số hồi quy có ý nghĩa biến khác khơng thay đổi Do đó, tăng số phòng ngủ lên một, giữ nguyên SQFT BATHS khơng
đổi, giá trung bình kỳ vọng hạ xuống khoảng $21.588 Nếu diện tích sử dụng
được chia nhỏ để có thêm phịng ngủ phịng ngủ có diện tích nhỏ Dữ liệu cho thấy là, trung bình, người mua đánh giá thấp việc chia nhỏ diện tích họ sẵn lịng trả mức giá thấp
Lý luận tương tự cho BATHS Giữ nguyên SQFT BEDRMS không đổi, ta tăng thêm phịng tắm, giá trung bình kỳ vọng giảm khoảng $12.193 Một lần nữa, tăng thêm phịng tắm giữ ngun diện tích sử dụng có nghĩa phịng ngủ nhỏ Kết cho thấy không đồng ý khách hàng quan sát thấy giá trung bình giảm Từ lập luận lưu ý dấu khơng mong đợi lúc đầu (thường gọi “dấu sai”) lại giải thích hợp lý
Giả sử tăng thêm phịng ngủ tăng thêm diện tích sử dụng khoảng 300 (cho thêm hành lang yếu tố liên quan khác) BEDRMS tăng thêm SQFT tăng thêm 300 Thay đổi giá trung bình (PRICE) kết tác động kết hợp sau:
PRICE = ^2 SQFT+ ^3BEDRMS = 300^2 + ^3
Trong mơ hình, phần thể khoảng tăng $24.852 giá trung bình ước lượng [được tính sau (300 x 0,1548) – 21,588; đơn vị ngàn la], mức giá hợp lý
BÀI TẬP THỰC HÀNH 4.1
Giả sử tăng thêm phòng tắm phòng ngủ, với diện tích sử dụng tăng thêm 350 vng Mức giá trung bình kỳ vọng tăng thêm bao nhiêu? Giá trị có đáng tin khơng?
BÀI TẬP THỰC HÀNH 4.2
Dự báo giá trung bình nhà với phòng ngủ, phòng tắm diện tích sử dụng 2.500 vng Dự báo có hợp lý so với liệu Bảng 4.1 không?
Một ước lượng không thiên lệch phương sai phần dư 2
tính s2 = ^2 = u^t2 /(n-k), với n số lần quan sát sử dụng ước lượng k số hệ số hồi quy ước lượng, gồm số hạng không đổi Chứng minh phát biểu nguyên tắc tương tự trình bày phần 3.A.7, phức tạp nhiều có đến k phương trình chuẩn (xem Johnston, 1984, trang 180-181) Trong Chương chia tổng bình phương sai số cho n – để ước lượng không thiên lệch 2
Ở đây, k phương trình chuẩn đặt k ràng buộc, điều dẫn đến việc “mất đi” k bậc tự Vì vậy, chia cho n – k Bởi ^2
phải khơng âm, n phải lớn hơn k Thủ tục để tính sai số chuẩn ^
tương tự, phép tính nhàm chán nhiều Các chương trình máy tính cung cấp phép tốn thống kê cần thiết để ước lượng thơng số kiểm định giả thuyết chúng Có thể thấy u^t2 / 2 có phân phối Chi bình phương với bậc tự n – k (xem Johnston, 1984, trang 181) Các kết tóm tắt tính chất 4.1
Tính Chất 4.1
a Một ước lượng không thiên lệch phương sai sai số (2) tính
s2 = ^2 = ESS
n - k =
u^t2
(4)với ESS tổng bình phương phần dư
b ESS/2 có phân phối Chi bình phương với bậc tự n – k Lưu ý tính chất phụ thuộc đặc biệt vào Giả thiết 3.8 số hạng sai số ut tuân theo phân phối chuẩn N(0,2)
Các Giá Trị Dự Báo Và Sai Số Chuẩn
Cũng mơ hình hồi quy đơn biến, quan tâm đến tạo dự báo có điều kiện biến phụ thuộc với giá trị cho trước biến độc lập Giả sử Xfi giá trị cho trước biến độc lập thứ i với i = 2, , k, t = f, với giá trị muốn dự báo Y Định nghĩa
= 1 + 2Xf2 + … + kXfk
Và ^ = Y^f, định nghĩa trước t = f, dự báo cần có giá trị ước lượng , sai số chuẩn tương ứng giúp xây dựng khoảng tin cậy cho dự báo Giải 1 từ phương trình thay vào mơ hình ban đầu, có
Yt = - 2Xf2 - - kXfk + 2Xt2 + +kXtk + ut
Nhóm số hạng cách thích hợp, ta viết lại sau:
Yt = + 2 (Xt2 – Xf2) + + k(Xtk – Xfk) + ut = + 2Zt2 + + kZtk + ut
với Zti = Xti – Xfi, cho i = 2, , k Việc viết lại công thức bước sau để tiến hành dự báo
Bước Với giá trị Xfi cho trước biến độc lập thứ i t = f , tạo biến Zti = Xti – Xfi với i = 2, , k
Bước Hồi quy Yt theo số hạng biến Zt2, , Ztk
Bước Số hạng không đổi ước lượng dự báo điểm cần có Khoảng tin cậy tương ứng (xem phần 3.8) tính ^
- t*sf, ^ + t*sf), với t* giá trị tới hạn phân phối
t với bậc tự n – k mức ý nghĩa cho trước, sf sai số chuẩn số hạng khơng đổi ước lượng có từ bước
VÍ DỤ 4.2
Trong ví dụ bất động sản, đặt SQFT = 2.000, BEDRMS = BATHS = 2,5 Bước thứ tạo biến mới, SQFT2 = SQFT – 2000, BEDRMS2 = BEDRMS – BATHS2 = BATHS – 2,5 Kế đến hồi quy PRICE theo số hạng không đổi SQFT2, BEDRMS2 BATHS2 Từ thực hành máy tính phần 4.1 lưu ý giá trung bình dự báo nhà $321.830 sai số chuẩn dự báo $13.865 Điều cho khoảng tin cậy 95% 321.830 (2,201 x 13.865) tính khoảng tin cậy (291.313; 352.347)
4.2 Độ Thích Hợp
(5)TSS = (Yt - Y _
)2 RSS = (Y^t - Y _
)2 ESS = u^t2 Mức độ thích hợp đo trước R2
= – (ESS/TSS) Nếu có số hạng khơng đổi mơ hình, R2 với bình phương hệ số tương quan Yt Y
^
t Tuy nhiên, định nghĩa R2
theo cách phát sinh vấn đề Có thể thấy việc thêm vào biến (dù biến có ý nghĩa hay khơng) R2
khơng giảm Chứng minh đại số phát biểu nhàm chán, lý luận theo trực giác Khi biến thêm vào ESS cực tiểu, cực tiểu theo tập nhiều biến số ESS nhỏ (ít không lớn hơn) Cụ thể hơn, giả sử số hạng k+1Xtk+1 thêm vào phương trình (4.1) ta có mơ hình Nếu giá trị
cực tiểu tổng bình phương mơ hình lớn giá trị mơ hình cũ, ta đặt
k+1 không sử dụng ước lượng cũ cho giá trị khác tốt hơn, ước lượng khơng thể có ESS cực tiểu Điều kéo theo biến thêm vào, giá trị R2
tương ứng khơng thể giảm mà cịn tăng thêm Do vậy, người ta thường cố gắng thêm biến vào để tăng R2
không kể đến mức độ quan trọng biến vấn đề giải
Để ngăn chặn tình trạng “có đưa thêm biến vào mơ hình” nêu trên, phép đo khác mức độ thích hợp sử dụng thường xuyên Phép đo gọi R2
hiệu chỉnh
hoặc R2
hiệu chỉnh theo bậc tự (chúng ta thấy kết kết in máy tính
Chương 3) Để phát triển phép đo này, trước hết phải nhớ R2
đo lường tỷ số phương sai Y “được giải thích” mơ hình; cách tương đương, trừ tỷ số “khơng được giải thích” phương sai sai số Var(u) Phép đo tự nhiên gọi R–2
(R-ngang bình phương),
R–2 = – Var(u) Var(Y)
Chúng ta biết ước lượng không thiên lệch 2
= Var (u) tính ESS/(n – k), ước lượng khơng thiên lệch Var (Y) tính TSS/(n – 1) Thay vào phương trình ta có
R2 = ESS/(n k) TSS/(n 1) =
ESS(n 1) TSS(n k)
= n
n k(1 R
2
) = ^2
(n 1) TSS Việc thêm vào biến dẫn đến tăng R2
làm giảm bậc tự do, ước lượng thêm tham số R2
hiệu chỉnh phép đo độ thích hợp tốt cho phép đánh đổi việc tăng R2
giảm bậc tự Cũng cần lưu ý (n 1)
/ (n k) không nhỏ R2 không lớn R2 Tuy nhiên, R2 khơng thể âm, R2
(6)VÍ DỤ 4.3
Bảng 4.2 trình bày hệ số hồi quy ước lượng trị thống kê liên quan bốn mơ hình khác (Phần thực hành máy tính 4.1 có hướng dẫn tạo số này) Các liệu thấp bậc tự (d.f.) thảo luận phần Mơ hình A giống mơ hình trình bày Chương Trong mơ hình B, BEDRMS thêm vào mơ hình C BEDRMS BATHS thêm vào Mơ hình D khơng có biến giải thích, có số hạng khơng thay đổi Nó sử dụng phần 4.4 Rõ ràng từ Bảng 4.2, nhiều
biến thêm vào, tổng bình phương phần dư giảm R2
tăng Tuy nhiên, R2 lại giảm thêm biến Điều có nghĩa lợi ích việc R2
tăng so với mát giảm bậc tự do, dẫn đến mát ròng “mức độ thích hợp” Mơ hình D có giá trị R2
khơng giá trị ESS TSS Điều khơng lạ khơng có phần mơ hình giải thích thay đổi PRICE Nó đề cập có ích việc kiểm định giả thuyết (đề cập phần 4.4 )
Trong mơ hình A SQFT giải thích 80,6 phần trăm thay đổi giá nhà Tuy nhiên, tất ba biến đưa vào, mơ hình giải thích 78,7 phần trăm thay đổi giá, điều hợp lý nghiên cứu chéo Nếu biến bổ sung thêm vào, khả giải thích mơ hình cao Ví dụ, kích thước, số lượng loại đồ gia dụng … v.v biến thêm vào Tuy nhiên, liệu khơng có sẵn mẫu liệu, thêm nhiều biến vào Trong Chương 7, thảo luận tác động hồ bơi đến giá nhà
Bảng 4.2 Các Mơ Hình Ước Lượng Cho Dữ Liệu Giá Nhà
Biến số Mô hình A Mơ hình B Mơ hình C Mơ hình D
HẰNG SỐ 52,351
(1,404)
121,179 (1,511)
129,062 (1,462)
317,493 (13,423)
SQFT 0,13875 0,14831 0,1548
(7,407) (6,993) (4,847)
BEDRMS 23,911 21,588
( 0,970) ( 0,799)
BATHS 12,193
( 0,282)
ESS 18.274 16.833 16.700 101.815
R2 0,821 0,835 0,836 0,000
R2 0,806 0,805 0,787 0,000
F 54,861 27,767 16,989 180,189
d.f 12 11 10 13
SGMASQ 1.523* 1.530 1.670 7.832
AIC 1.737* 1.846 2.112 8.389
FPE 1.740* 1.858 2.147 8.391
HQ 1.722* 1.822 2.077 8.354
SCHWARZ 1.903* 2.117 2.535 8.781
SHIBATA 1.678* 1.718 1.874 8.311
GCV 1.777* 1.948 2.338 8.434
RICE 1.827* 2.104 2.783 8.485
Ghi chú: giá trị ngoặc trị thống kê t tương ứng, hệ số chia cho sai số chuẩn chúng
(7) BÀI THỰC HÀNH 4.3
Chứng minh R2
^2 chuyển động ngược chiều nhau; nghĩa R2 tăng, ^2 thiết phải giảm (Vì vậy, chọn mơ hình có R2
cao đồng nghĩa với chọn mơ hình có ^2 thấp hơn.)
Tính R2 R2 khơng có số hạng khơng đổi *
Tổng bình phương gộp TSS = RSS + ESS có giá trị mơ hình có số hạng khơng đổi Nếu mơ hình khơng có số hạng khơng đổi, tổng bình phương gộp thích hợp Yt2 = Y^t2 + u^t2 Lưu ý giá trị trung bình Y
không trừ Một số chương trình máy tính tính R2 (ESS/Yt2) khơng có số hạng tung độ gốc Công thức Viện Tiêu chuẩn Công nghệ Quốc gia đề nghị sử dụng Tuy nhiên, giá trị tính theo cách khơng tương thích với giá trị tính TSS mẫu số khác hai mơ hình Nếu mục tiêu so sánh mơ hình có khơng có số hạng khơng thay đổi, mặt mức độ thích hợp, cơng thức tính R2
khơng thể độc lập với mơ hình Tốt nên dùng (ESS/TSS) hai trường hợp để so sánh R2
Nếu R2 tính TSS mẫu số, có giá trị âm số hạng khơng đổi khơng có mặt mơ hình Giá trị âm thể mơ hình khơng đặc trưng tốt Một lựa chọn khác có lẽ phép đo tốt R2 bình phương hệ số tương quan Yt Y^ , giá trị luôn không âm t
Chúng ta lập luận trước R2
= [Var(u) / Var(Y)] phép đo tốt thay đổi biến Y giải thích mơ hình Điều cho cơng thức
R2 = ESS (n k) TSS (n 1)
trong trường hợp
Vì chương trình máy tính khác cách tính R2
R2 trường hợp khơng có số hạng khơng đổi, đề nghị độc giả kiểm tra chương trình sử dụng xác định xem phép đo có tương thích mơ hình hay khơng Các nhà điều tra thường loại số hạng khơng đổi khơng có ý nghĩa để làm tăng mức ý nghĩa thống kê biến cịn lại (ví dụ, mơ hình giá tài sản vốn Ví dụ 1.3 khơng có số hạng khơng đổi), việc thực hành khơng khuyến khích dẫn đến mơ hình khơng đặc trưng (xem thêm phần 4.5)
4.3 Các Tiêu Chuẩn Chung Để Chọn Mơ Hình
Chúng ta chứng minh trước cách tăng số biến mơ hình, tổng bình phương
phần dư u^t2 giảm R2 tăng, đổi lại bậc tự giảm R 2
sai số chuẩn phần dư, [ESS / (n – k)]1/2, tính đến việc đánh đổi giảm ESS giảm bậc tự Đây tiêu chuẩn thơng dụng để so sánh mơ hình
(8)của kiểm định hệ số Vì vậy, xác suất việc khơng bác bỏ giả thuyết sai (sai lầm loại II) tăng bậc tự giảm Các mơ hình đơn giản dễ hiểu mơ hình phức tạp Vì vậy, lý tưởng nên thiết lập tiêu chuẩn hạn chế mơ hình lớn khơng ln ln chọn mơ hình đơn giản
Trong năm gần đây, nhiều tiêu chuẩn chọn mơ hình đề nghị Tất tiêu chuẩn có dạng tổng bình phương phần dư (ESS) nhân với nhân tố bất lợi phụ thuộc vào mức độ phức tạp mơ hình Mơ hình phức tạp ESS giảm lại tăng tính bất lợi Các tiêu chuẩn phải cung cấp loại đánh đổi khác mức độ thích hợp độ phức tạp mơ hình Một mơ hình có trị thống kê tiêu chuẩn thấp ưa chuộng Trong phần này, trình bày tóm tắt tổng quát nhân tố bất lợi mà không sâu vào phần kỹ thuật yếu tố Nếu độc giả quan tâm đến tóm tắt đầy đủ chi tiết với ứng dụng, bạn tham khảo báo Engle Brown (1985)
Akaike (1970, 1974) xây dựng hai phương pháp, gọi sai số hoàn toàn xác
định trước (FPE) phương pháp thứ hai gọi tiêu chuẩn thông tin Akaike (AIC) Hannan
và Quinn (1979) đề nghị phương pháp khác (được gọi tiêu chuẩn HQ) Các tiêu chuẩn khác gồm Schwarz (1978), Shibata (1981), Rice (1984), phương pháp tính xác
chéo tổng quát (GCV) Craven Wahba (1979) phát triển Engle, Graner, Rice,
và Weiss (1986) sử dụng Mỗi trị thống kê dựa vài tính chất tối ưu, chi tiết phương pháp đề cập báo liệt kê (lưu ý báo đòi hỏi kiến thức đại số tuyến tính) Bảng 4.3 tóm tắt tiêu chuẩn (n số lần quan sát k số thông số ước lượng)
Không cần thiết phải đưa R2
vào tiêu chuẩn R2 vàSGMASQ (^2) quan hệ nghịch, giá trị SGMASQ thấp có nghĩa R2
có giá trị cao R2 có ích xác định tỷ số biến đổi Y giải thích biến X
Bảng 4.3 Tiêu Chuẩn Chọn Mơ Hình
SGMASQ: ESS
n 1 – k n
- HQ:
ESS
n (ln n)
2k/n AIC: ESS
n e
(2k/n) RICE:
ESS
n 1 – 2k n - FPE: ESS n
n + k n – k
SCHWARZ: ESS
n n
k/n GVC: ESS
n 1 – k n
- SHIBATA:
ESS n
n + 2k n
(9) VÍ DỤ 4.4
Đối với liệu giá nhà ở, Bảng 4.2 có trị thống kê lựa chọn mơ hình ba mơ hình Tất tiêu chuẩn đánh giá cao mơ hình đơn giản nhất, mơ hình có biến giải thích SQFT Điều có nghĩa việc giảm ESS tính phức tạp mơ hình khơng đủ để đánh đổi với nhân tố bất lợi gắn liền với mơ hình phức tạp Kết thật không bất ngờ Diện tích sử dụng phụ thuộc vào số phịng ngủ phịng tắm nhà Mơ hình A khơng trực tiếp đề cập đến BEDRMS BATHS Do đó, khơng nên kỳ vọng mơ hình B C tốt giảm ESS đủ thấp
4.4 Kiểm Định Giả Thuyết
Trong phần thảo luận ba loại kiểm định giả thuyết: (1) kiểm định mức ý nghĩa thống kê hệ số riêng lẻ, (2) kiểm định số hệ số hồi quy liên kết, (3) kiểm định tổ hợp tuyến tính hệ số hồi qui
Kiểm Định Các Hệ Số Riêng Lẻ
Như Chương 3, kiểm định giả thuyết hệ số hồi quy đơn tiến hành kiểm định t Các tính chất mà ^i tuân theo phân phối chuẩn ESS/2 = (n – k) ^2 /2 tuân theo phân phối chi bình phương mở rộng cho trường hợp đa biến Chỉ có hiệu chỉnh ESS/2 phân phối chi bình phương với n – k d.f Các bước tiến hành kiểm định hệ số riêng biệt sau:
KIỂM ĐỊNH T MỘT PHÍA
Bước Ho: = 0, H1: > 0
Bước Thiết lập trị thống kê tc = (^ – 0) / ^, với ^ giá trị ước lượng ^ sai số chuẩn ước lượng Nếu 0 = 0, giá trị t giảm đến tỷ số hệ số hồi quy chia cho sai số chuẩn Với giả thuyết H0, tuân theo phân phối t với n – k d.f
Bước Tìm bảng tra t giá trị tương ứng với bậc tự n k tìm điểm t*n-k
() cho diện tích phần bên phải điểm mức ý nghĩa ()
Bước Bác bỏ giả thuyết không tc > t* Nếu trường hợp H1 : < 0, H0 bị bác bỏ nếu tc < t* Một cách tương đương cho hai trường hợp, bác bỏ |tc| > t* Để sử dụng phương pháp giá trị p, tính p = P(t > |tc|, với H0 cho trước) bác bỏ H0 giá trị p nhỏ mức ý nghĩa
VÍ DỤ 4.5
Chúng ta áp dụng với Mơ hình B C Bảng 4.2 Mơ hình B có bậc tự 11 d.f (14 3) Mơ hình C có bậc tự 10 Từ Bảng A.2, t*11(0,05) = 1,796 t*10 (0,05) = 1,812 kiểm định 5% Vì vậy, để hệ số hồi quy dương âm có ý nghĩa thống kê, giá trị tuyệt đối trị thống kê t cho Bảng 4.2 phải lớn 1,796 Mơ hình B lớn 1,812 Mơ hình C Chúng ta lưu ý mơ hình hệ số hồi quy SQFT có ý nghĩa Điều có nghĩa trường hợp khơng thể bác bỏ giả thuyết
không hệ số tương ứng khơng
Có hay khơng mức ý nghĩa khác phần trăm ta bác bỏ giả thuyết
(10)cao chút, sẵn sàng bác bỏ giả thuyết không Chúng ta lưu ý từ Bảng A.2 mức ý nghĩa 10 phần trăm, t*
10 (0,1) = 1,372 Trị thống kê t BEDRMS Mơ hình C 0,799 trị tuyệt đối, nhỏ 1,372 Do đó, kết luận BEDRMS khơng có ý nghĩa Mơ hình C, mức ý nghĩa 10 phần trăm
Sử dụng chương trình GRETL, tính giá trị p cho hệ số BEDRMS BATHS (xem phần thực hành máy tính 4.1) Các hệ số xếp từ 0,175 đến 0,39, ngụ ý bác bỏ giả thuyết khơng hệ số khơng, có hội từ 17,5 đến 39 phần trăm phạm sai lầm loại I Khi hệ số cao mức chấp nhận thông thường, khơng bác bỏ H0 thay vậy, kết luận hệ số không khác không cách có ý nghĩa
KIỂM ĐỊNH t HAI PHÍA
Bước H0: = 0, H1: 0
Bước Thiết lập trị thống kê t, tc = (^ 0)/ ^, với ^ giá trị ước lượng ^ sai số chuẩn Theo giả thuyết H0, ^ tuân theo phân phối t với bậc tự nk
Bước Tìm Bảng t A.2 giá trị tương ứng với bậc tự n k tìm t*n-k(/2)
cho diện tích bên phải phân nửa mức ý nghĩa
Bước Bác bỏ giả thuyết không |tc| > t*
Để sử dụng giá trị p, tính giá trị p = 2P(t> |tc|, với H0 cho trước) bác bỏ H0 p nhỏ mức ý nghĩa
Tóm tắt, giá trị p (giống xác suất sai lầm loại I bác bỏ giả thuyết đúng) thấp nghĩa “an toàn” bác bỏ giả thuyết không hệ số không (đối với 0 = 0) kết luận hệ số khác không đáng kể Nếu giá trị p cao, khơng thể bác bỏ giả
thuyết khơng thay vào kết luận hệ số khơng có ý nghĩa thống kê
VÍ DỤ 4.6
Chúng ta áp dụng kiểm định hai phía với Mơ hình B C Trong Mơ hình B, bậc tự 11 vậy t*
11(0,025) 2,201 mức ý nghĩa phần trăm Trong Mơ hình C, t*10(0,025) = 2,228 Vì vậy, để hệ số hồi quy khác khơng có ý nghĩa mức ý nghĩa phần trăm, trị thống kê t cho bảng 4.2 phải lớn 2,201 giá trị tuyệt đối Mơ hình B lớn 2,228 giá trị tuyệt đối Mơ hình C Chúng ta lưu ý mơ hình hệ số hồi quy SQFT có ý nghĩa, tất hệ số hồi quy khác khơng có ý nghĩa Điều có nghĩa những trường hợp bác bỏ giả thuyết không hệ số tương ứng khơng
Có hay khơng mức ý nghĩa khác mức phần trăm bác bỏ giả
thuyết khơng? Giá trị p hai lần giá trị có trước (đó 0,35 đến 0,78) Khi
(11) BÀI TẬP THỰC HÀNH 4.4
Sử dụng chương trình hồi quy bạn, ước lượng Mơ hình B C, kiểm tra kết Bảng 4.2
Có thể thiết lập tính chất sau (xem Haitovsky, 1969):
Tính chất 4.2
Nếu giá trị tuyệt đối trị thống kê t hệ số hồi quy nhỏ 1, việc loại hệ số khỏi mơ hình làm tăng R2
hiệu chỉnh Tương tự, bỏ biến có trị thống kê t lớn (về giá trị tuyệt đối) làm giảm R2
Điều là, bên cạnh trị thống kê t tới hạn, sử dụng giá trị t
như hướng dẫn việc xác định xem bỏ bớt biến hay khơng Tuy nhiên, R2 chỉ nhiều tiêu chuẩn nên giá trị p riêng lẻ, giá trị thống kê chọn mơ hình tầm quan trọng lý thuyết biến nên dùng để xác định biến loại bỏ (xem ví dụ phần 4.6 4.7)
Kiểm định số hệ số liên kết (kiểm định Wald)
Kiểm định t hệ số riêng lẻ dùng cho mức ý nghĩa hệ số cụ thể Ta kiểm định ý nghĩa liên kết số hệ số hồi qui, ví dụ mơ hình đây:
(U) PRICE = 1 + 2SQFT + 3BEDROOMS + 4BATHS + u (R) PRICE = 1 + 2SQFT + v
Mơ hình U (là mơ hình C Bảng 4.2) gọi mơ hình khơng giới hạn, Mơ hình R (là Mơ hình A Bảng 4.2) gọi mơ hình giới hạn Đó 3 4 buộc phải không Mơ hình R Ta kiểm định giả thuyết liên kết 3 = 4 = với giả thuyết đối hệ số không không Kiểm định giả thuyết liên kết gọi là kiểm định Wald (Wald, 1943) Thủ tục sau
Kiểm định Wald tổng quát Đặt mơ hình giới hạn khơng giới hạn (bỏ qua ký hiệu t
dưới):
(U) Y = 1 + 2X2 + … + mXm + m+1Xm+1 + … + kXk + u (R) Y = 1 + 2X2 + … + mXm + v
Mặc dù Mơ hình U khác hồn tồn giống Phương trình (4.1) Mơ hình R có cách bỏ bớt số biến Mơ hình U, Xm+1, Xm+2, …Xk Vì vậy, giả thuyết không m+1 = m+2 = … = k = Lưu ý (U) chứa k hệ số hồi quy chưa biết (R) chứa m hệ số hồi quy chưa biết Do đó, Mơ hình R có k – m thơng số so với U Câu hỏi nêu ra k –m biến bị loại có ảnh hưởng liên kết có ý nghĩa Y hay không
(12)với giá trị sau, kết luận việc loại bỏ biến Xm+1, Xm+2, …, Xk không thay đổi ESS đủ để tin hệ số chúng có ý nghĩa
Chúng ta biết tổng bình phương độc lập có phân phối chi bình phương (xem phần 2.7) Vì vậy, ESSU/2 phân phối chi bình phương với n – k bậc tự (n quan sát trừ k thông số Mơ hình U) Có thể thấy giả thuyết khơng tính chất cộng chi bình phương (Tính chất 2.12b), (ESSR – ESSU)/2 phân phối chi bình phương với bậc tự số biến số loại bỏ (R) Trong phần 2.7, thấy tỷ số hai phân bố chi bình phương độc lập có phân phối F có hai thông số: bậc tự cho tử số tỷ số, bậc tự cho mẫu số Trị thống kê tỷ số F
Các bước thông thường để kiểm định Wald (thường gọi kiểm định F) sau:
Bước Giả thuyết không H0: m+1 = m+2 = … = k = Giả thuyết ngược lại H1: có giá trị khơng khơng Giả thuyết khơng có k m ràng buộc
Bước Trước tiên hồi quy Y theo biến không đổi, X2, X3, …, Xk, tính tổng bình phương sai số ESSU Kế đến hồi quy Y theo biến không đổi, X2, X3, …, Xm tính ESSR Chúng ta biết từ Tính chất 4.1b ESSU/2 tuân theo phân phối chi bình phương với bậc tự DFU = n k (nghĩa n số quan sát trừ k hệ số ước lượng) Tương tự, với giả thuyết khơng, ESSR/2 tn theo phân phối chi bình phương với bậc tự DFR = n m Có thể thấy chúng độc lập với tính chất cộng phân phối chi bình phương, sai biệt chúng (ESSR ESSU) / 2 phân phối chi bình phương, với bậc tự sai biệt bậc tự do, nghĩa là, DFR DFU Lưu ý DFR DFU k m, số ràng buộc giả thuyết khơng (đó số biến bị loại bỏ) Trong phần 2.7, định nghĩa phân phối F tỷ số hai biến ngẫu nhiên phân phối chi bình phương độc lập Điều cho ta trị thống kê
Fc =
(ESSR ESSU) (DFR DFU)
ESSU DFU (4.3)
= (ESSR ESSU) / (k m) ESSU / (n – k)
= (sai biệt ESS số ràng buộc)
( tổng bình phương sai số Mơ hình U d.f Mơ hình U)
= (R
2 U R
2
R)/ (k m)
(1 RU2)/ (n – k) với R2
số đo độ thích hợp khơng hiệu chỉnh Chia cho bậc tự ta tổng bình phương một bậc tự Với giả thuyết khơng, Fc có phân phối F với k m bậc tự tử số n k
bậc tự mẫu số
Bước Từ số liệu bảng F tương ứng với bậc tự k m cho tử số n k cho mẫu
số, với mức ý nghĩa cho trước (gọi ), ta có F*k-m,n-k () cho diện tích bên phải F*
Bước Bác bỏ giả thuyết không mức ý nghĩa Fc > F* Đối với phương pháp giá trị p, tính giá trị p = P(F > Fc|H0) bác bỏ giả thuyết không giá trị p nhỏ mức ý nghĩa
VÍ DỤ 4.7
(13)Mơ hình A Số ràng buộc Cũng vậy, ESSR = 18.274 ESSU = 16.700 (xem Bảng 4.2) Bậc tự Mơ hình U 10 Vì vậy, trị thống kê F tính
Fc =
(18.274 16.700) /
16.700 / 10 = 0,471
Từ bảng F (Bảng A.4b), F*
2,10(0,05) = 4,1 Vì Fc khơng lớn F*, khơng thể bác bỏ giả thuyết khơng, kết luận 3 4 thật khơng có ý nghĩa mức 5 phần trăm Ngay mức ý nghĩa 10 phần trăm (xem Bảng A.4c), F*
2,10(0,1) = 2,92 > Fc Điều có nghĩa phương diện mức ý nghĩa biến độc lập, Mơ hình A đơn giản tốt Kiểm định tương tự thực để so sánh Mơ hình A B, việc khơng cần thiết sai biệt hai mơ hình biến, BEDRMS Trong trường hợp này, phân phối F có bậc tự tử số Khi điều xảy ra, giá trị F đơn giản bình phương trị thống kê t BEDRMS (xem Tính chất 2.14b) Chứng minh điều dễ Mơ hình B khơng giới hạn
Fc = (18.274 16.700) /
16.700 / 11 = 0,942
Có bậc hai 0,97, với trị thống kê t Bảng 4.2 Vì vậy, kiểm định Wald cần phải
tiến hành có hai nhiều hai hệ số hồi quy không giả thuyết không
Giá trị p ví dụ P(F > 0,471) = 0,64 Bởi có 64 phần trăm hội bác bỏ giả thuyết H0 (là hệ số BEDRMS BATHS không) cao không thể chấp nhận được, nên bác bỏ H0 thay vào ta kết luận hệ số có giá trị khác khơng, khơng có ý nghĩa thống kê
Chúng ta thấy từ Bảng 4.2 số hạng khơng đổi khơng có ý nghĩa mơ hình (trừ Mơ hình D) Tuy nhiên, thật không khôn ngoan loại bỏ số hạng khơng đổi khỏi mơ hình Đó số hạng không đổi thể cách không gián tiếp số ảnh hưởng trung bình biến bị loại bỏ (vấn đề thảo luận đầy đủ phần 4.5) Do đó, việc loại bỏ số hạng khơng thay đổi dẫn đến sai nghiêm trọng đặc trưng mơ hình
Kiểm định Wald đặc biệt độ thích hợp tổng quát Hãy xem xét trường hợp đặc biệt
kiểm định Wald hai mơ hình sau:
(U) Y = 1 + 2X2 + … + kXk + u (SR) Y = 1 + w
Mơ hình U mơ hình hồi quy bội phương trình (4.1), với X1 số hạng khơng thay đổi Trong Mơ hình SR (thật giới hạn), tất biến ngoại trừ số hạng không thay đổi bị loại khỏi mơ hình; nghĩa là, đặt k ràng buộc 2 = 3 = … = k = Giả thuyết kiểm định phát biểu “Không hệ số mô hình (ngoại trừ số hạng khơng thay đổi) có ý nghĩa thống kê.” Có thể thực kiểm định Wald cho giả thuyết Nếu giả thuyết không bị bác bỏ, kết luận khơng có biến giải thích cách liên kết thay đổi Y Điều có nghĩa có mơ hình xấu phải thiết lập lại mơ hình ESSU tổng bình phương sai số mơ hình đầy đủ
Để có ESSSR, trước hết cực tiểu w2t = (Yt 1)2 theo 1 Dễ dàng chứng minh ^1 = Y
(14)phương toàn phần (TSSU) Mơ hình U (đây tổng bình phương Mơ hình SR) Trị thống kê F trở thành
Fc =
(TSSU ESSU) / (k –1) ESSU / (n – k) =
RSSU / (k –1) ESSU / (n – k) =
R2 / (k –1)
(1– R2)/ (n – k) (4.4) giá trị tính từ R2
khơng hiệu chỉnh mơ hình đầy đủ Các chương trình hồi quy cung cấp trị thống kê F phần tóm tắt thống kê mơ hình Nhiệm vụ đầu tiên phải đảm bảo giả thuyết không kiểm định F bị bác bỏ, nghĩa là, Fc > F*k-1, n-k() Nếu khơng, có mơ hình khơng có biến độc lập giải thích thay đổi biến phụ thuộc, mơ hình cần thiết lập lại
VÍ DỤ 4.8
Bảng 4.2 cung cấp trị thống kê F kiểm định Wald, cho trước phương trình (4.4), ví dụ giá nhà Với Mơ hình C, k = 4, k = n k = 14 = 10 Bậc tự trị thống kê F tử số 10 mẫu số Từ bảng F, A.4b, giá trị tới hạn kiểm định phần trăm F*
3,10(0,05) = 3,71 Vì giá trị F Bảng 4.2 16,989 Mơ hình C, bác bỏ giả thuyết không tất hệ số hồi quy ngoại trừ số hạng khơng đổi khơng Vì vậy, có hệ số hồi quy khác khơng có ý nghĩa thống kê Từ kiểm định t đối với hệ số SQFT, biết trường hợp Dễ dàng chứng minh
F*2,11(0,05) = 3,98 Mơ hình B F*1,12 (0,05) = 4,75 Mơ hình A, tất các mơ hình bác bỏ giả thuyết khơng khơng có biến giải thích có ý nghĩa
Chúng ta lưu ý trị thống kê F Mô hình B C thấp nhiều so với Mơ hình A Điều sai biệt R2
nhỏ, tỷ số (n 1) / (n k) tăng đáng kể k tăng Do thấy từ Phương trình (4.4) giải thích sai biệt lớn F Tuy nhiên, nói chung, sai biệt F mơ hình khơng quan trọng Chỉ có kết kiểm định Wald đáng quan tâm
BÀI TẬP THỰC HÀNH 4.5
Trong Bảng 4.2, Mơ hình D mơ hình thật giới hạn hồi quy PRICE theo số hạng khơng đổi So sánh mơ hình với Mơ hình C mơ hình khơng giới hạn, chứng minh giá trị F kiểm định Wald báo cáo Bảng 4.2 Mơ hình C Sau
cho Mơ hình A B Cuối cùng, giải thích R2 = R2 = Mơ hình D
Khác biệt hai loại kiểm định F cần ghi cẩn thận Công thức cho
Phương trình (4.4) khơng thể ứng dụng số biến bị loại bỏ Nó ứng dụng được mơ hình giới hạn có số hạng khơng đổi Trị thống kê F in từ chương trình máy
tính kiểm định tính thích hợp chung, trị thống kê F tính từ Phương trình (4.3) kiểm định xem nhóm hệ số có khác khơng cách có ý nghĩa thống kê hay khơng Cũng lưu ý kiểm định F luôn kiểm định phía
Tính trị thống kê F mơ hình khơng có số hạng khơng đổi*
Trong phần 4.2, thảo luận sai biệt số đo R2
(15)số F công thức sử dụng khác Để giải thích lại vậy, xem xét hai mơ hình sau:
(A) Y = 2X2 + 3X3 + … kXk + u
(B) Y = w
Với số hạng không thay đổi X1 (=1) bị loại bỏ Lưu ý Mơ hình khơng giới hạn A có k thơng số (có nghĩa số bậc tự n k +1) Mơ hình giới hạn B khơng có thơng số
nào (với d.f n) Để kiểm định độ thích hợp chung mơ hình, giả thuyết khơng lại H0: 2 = 3 = … = k = 0, giả thuyết ngược lại tương tự trước Kiểm định Wald áp dụng cơng thức thích hợp Phương trình (4.3) Đặt ESSA = \s\up4(^(^)u^t2 tổng bình phương sai số Mơ hình A Trong Mơ hình B, tổng bình phương sai số ESSB = Y2t Giá trị F tính bởi:
Fc =
(ESSB ESSA) / (k –1) ESSA / (n – k + 1) =
(Yt2 – u^t2 ) / (k –1) ESSA / (n – k + 1) =
Y^t2 / (k –1)
ESSA / (n – k + 1) (4.4a)
bởi khai triển Yt2 = Yt^2 + u^t2 khơng có số hạng khơng đổi Với giả thuyết khơng, tổng có phân phối F với k n k + bậc tự Tiêu chuẩn để chấp nhận/bác bỏ H0 cũng tương tự Giá trị thống kê F đại diện cho Mơ hình D kiểm định giả thuyết số hạng không đổi khơng Vì có hệ số bị loại khỏi đây, giá trị F bình phương trị thống kê
t Do đó, F = 180,189 R2 = Lưu ý công thức dùng để kiểm định độ thích hợp chung hồn tồn khác với cơng thức Phương trình (4.4)
Kiểm Định Tổ Hợp Tuyến Tính Của Các Hệ Số
Chúng ta thường gặp giả thuyết phát biểu dạng tổ hợp tuyến tính hệ số hồi qui Một ví dụ minh họa hàm tiêu thụ tổng hợp sau:
Ct = 1 + 2Wt + 3Pt + ut
Với C chi tiêu cho tiêu dùng tổng hợp vùng cho trước, W tổng tiền lương thu nhập, P tất thu nhập khác, phần lớn từ lợi nhuận thu hồi từ vốn 2 xu hướng cận biên chi tiêu lương thu nhập, 3 xu hướng cận biên chi tiêu thu nhập khác Giả thuyết 2 = 3 ngụ ý đô la thêm vào thu nhập tiền lương đô la thêm vào thu nhập khác đóng góp khoảng thêm vào tiêu thụ bình quân Kiểm định t hệ số riêng lẻ áp dụng trường hợp giả thuyết tổ hợp tuyến tính hai hệ số hồi qui Giả thuyết H0: 2 = 3 đối lại H1: 2 3 kiểm định ba cách khác nhau, cách đưa đến kết luận
Trong phần sau, gặp phải loại tổ hợp tuyến tính khác 2 + 3 = 2 + 3 = Bây thiết lập thủ tục để kiểm định tổ hợp tuyến tính hệ số hồi qui Việc thực mơ hình (khơng giới hạn) sau, với hai biến độc lập (X2 X3):
(16)PHƯƠNG PHÁP (KIỂM ĐỊNH WALD)
Bước Sử dụng ràng buộc, giải để tìm hệ số theo hệ số cịn lại, vào mơ hình khơng giới hạn để có mơ hình giới hạn Vì vậy, để kiểm định 2 = 3, thay cho 3 Phương trình (4.5) có mơ hình sau:
(R) Yt = 1 + 2Xt2 + 2Xt3 + ut (4.6)
= 1 + 2(Xt2 + Xt3) + ut
Viết lại mơ hình giới hạn cách nhóm số hạng thích hợp Trong trường hợp chúng ta, tạo biến Zt = Xt2 + Xt3 viết mơ sau:
(R) Yt = 1 + 2Zt + ut
Bước Ước lượng mơ hình giới hạn khơng giới hạn, có tổng bình phương sai số, ESSR ESSU
Bước Tính giá trị thống kê F Wald (Fc), dùng Phương trình (4.3), bậc tự tử số mẫu số
Bước Từ bảng F, có điểm F*
cho diện tích phần bên phải mức ý nghĩa Một cách khác, tính giá trị p = P(F > Fc)
Bước Bác bỏ H0 Fc > F*
giá trị p nhỏ mức ý nghĩa
BÀI TẬP THỰC HÀNH 4.6
Xuất phát từ mơ hình giới hạn để kiểm định 2 + 3 = 2 + 3 = VÍ DỤ 4.9
Tập tin DATA 4-2 (xem Phụ lục D) chứa liệu hàng năm Hoa Kỳ thời kỳ 1959-1994 (với n = 36) Các định nghĩa biến sau:
CONS (Ct) = Chi tiêu thực cho tiêu dùng tính tỷ la năm 1992 GDP (Yt) = Tổng sản phẩm quốc dân thực tính tỷ đô la năm 1992
WAGES = Tổng tiền trả cho nhân viên (lương, khoản phụ trợ) tính tỷ la hành
PRDEFL = Giá giảm phát tiêu dùng, 1992 = 100 (đây số giá hàng hóa tiêu dùng)
Mơ hình ước lượng hàm tiêu thụ sau trình bày phần trên: (U) Ct = 1 + 2Wt + 3Pt + ut (4.5)
Với biến mơ tả trước Trước ước lượng mơ hình, phải thực số chuyển đổi liệu để có tất biến tài dạng “thực” (nghĩa đồng đô la không đổi hiệu chỉnh lạm phát)
Tiêu dùng dạng thực Để có thu nhập tiền lương dạng thực (Wt), chia WAGES với PRDEFL nhân với 100 Tổng lợi nhuận thu nhập khác từ vốn có cách trừ thu nhập tiền lương thực khỏi GDP
Wt = 100 WAGESt
PRDEFLt Pt = Yt – Wt
Trong Phương trình (4.5), đặt ràng buộc 2 = 3 Chúng ta có
(R) Ct = 1 + 2Wt + 2Pt + ut = 1 + 2(Wt + Pt) + ut (4.6)
(17)với Yt = Wt + Pt thu nhập tổng hợp Phương trình (4.5) mơ hình khơng giới hạn (với n bậc tự do) Phương trình (4.6) mơ hình giới hạn Do tính trị thống kê F Wald cho Phương trình (4.3) (với k – m = có ràng buộc) Vì vậy,
Fc =
(ESSR – ESSU) / ESSU / (n – 3) sẽ kiểm định với F*
1, n-3 (0,05) bác bỏ giả thuyết không Fc > F*
Áp dụng vào liệu tiêu dùng tổng hợp, ta có Phương trình ước lượng (4.5) (4.6) (Xem phần thực hành máy tính 4.2)
Ct^ = – 222,16 + 0,69Wt + 0,47Pt ESSU = 38.977 Ct^ = – 221,4 + 0,71Yt ESSR = 39.305
Fc =
(39.305 – 38.977)
38.977 / 33 = 0,278
Từ Bảng A.4c, F*
1,33(0,10) nằm 2,84 2,88 Vì Fc < F*, bác bỏ
giả thuyết không kết luận xu hướng biên tế tiêu dùng ngồi lương lợi nhuận khơng
khác cách có ý nghĩa mức ý nghĩa 10 phần trăm Vì vậy, giá trị số học chúng hoàn toàn khác nhau, mặt thống kê khác biệt ngẫu nhiên
PHƯƠNG PHÁP (KIỂM ĐỊNH t GIÁN TIẾP) Trong phương pháp thứ hai, mơ hình thay đổi theo cách khác kiểm định t gián tiếp tiến hành Các bước thực sau:
Bước Xác định thơng số mới, gọi , có giá trị không giả thuyết không đúng Do H0 2 = 3, định nghĩa = 2 – 3, giả thuyết H0 2 + 3 = = 2 + 3 –
Bước Diễn tả tham số theo tham số cịn lại, thay vào mơ hình nhóm số hạng cách hợp lý
Bước Tiến hành kiểm định t sử dụng ^, ước lượng
VÍ DỤ 4.10
Trong trường hợp hàm tiêu thụ, = 2 – 3 Giả thuyết không trở thành H0: = đối với H1: Cũng có 3 = 2 – Thay vào mơ hình ta có
Ct = 1 + 2Wt + (2 – )Pt + ut = 1 + 2 (Wt + Pt) – Pt + ut
Vì Yt = Wt + Pt, mơ hình trở thành
Ct = 1 + 2Yt – Pt + ut (4.7)
(18)Đối với liệu chúng ta, Phương trình ước lượng (4.7) (xem phần thực hành máy tính 4.2)
C^t = –222,16 + 0,69Yt + 0,04Pt
(–11,4) (21,3) (0,5)
Các giá trị ngoặc đơn trị thống kê t tương ứng Đối với ^, giá trị t 0,5, nhỏ
t*33(0,05) 2,021 2,042 Do đó, khơng bác bỏ giả thuyết khơng
PHƯƠNG PHÁP (KIỂM ĐỊNH t TRỰC TIẾP) Phương pháp cuối áp dụng kiểm định
t trực tiếp khơng địi hỏi ước lượng hệ số hồi quy khác
Bước Như phương pháp 2, xác định thơng số – gọi – có giá trị không giả thuyết không Do H0 2 = 3, định nghĩa = 2 – 3, và giả thuyết H0 2 + 3 = = 2 + 3 –
Bước Trực tiếp lấy phân phối thống kê , sử dụng để tính trị thống kê t
Bước Tiến hành kiểm định t sử dụng trực tiếp để tính trị thống kê
Kiểm định trước minh họa cho ví dụ sử dụng, H0: 2 = 3 (Xem tập thực hành, áp dụng phương pháp giả thuyết 2 + 3 = 1)
Vì ước lượng OLS tổ hợp tuyến tính quan sát biến phụ thuộc tổ hợp tuyến tính số hạng sai số phân phối chuẩn, biết
^2 ~ N(2, 2(
^) ^3 ~ N(3, 2( ^) với 2
phương sai tương ứng Hơn nữa, tổ hợp tuyến tính biến chuẩn phân phối chuẩn Do đó,
^2 – ^3 ~ [2 – 3, Var(^2 – ^3)]
Từ Tính chất 2.8a, phương sai ^2 –^3 tính Var(^2) + Var (^3) – Cov(^2,^3) Chuyển số phân phối chuẩn chuẩn hóa (bằng cách trừ giá trị trung bình chia cho độ lệch chuẩn), có
^2 –^3 – (2 – 3 )
[Var(^2) + Var(^3) – Cov(^2,^3)]1/2
~ N(0,1)
Với giả thuyết không, H0: 2 – 3 = Cũng vậy, khơng biết xác phương sai đồng phương sai, ước lượng chúng (hầu hết chương trình máy tính có lựa chọn cung cấp giá trị này) Nếu thay ước lượng phương sai đồng phương sai này, trị thống kê khơng cịn tuân theo phân phối N(0,1) mà theo phân phối thống kê tn-k (n – ví dụ chúng ta) Vì vậy, sử dụng kiểm định t cho trị thống kê tính từ đẳng thức với ước lượng phù hợp thay vào Trị thống kê t tính
tc =
^2 –^3
(19)Vì 2 = 3 theo giả thuyết khơng Với mức ý nghĩ 5%, H0 bị bác bỏ giả thuyết H1: 2 - 3 > củng cố giá trị tc lớn t*n-k(0,05) Đối với trường hợp giả thiết ngược lại có dạng hai phía, H1: 2 3, ta tra giá trị t*n-k(0,025) bác bỏ H0 tc > t* Vì phương pháp địi hỏi phải thực số tính tốn phụ, nên phương khác thường đề nghị sử dụng phương pháp
VÍ DỤ 4.11:
Để minh họa, xem phương trình (4.5), phương trình ước lượng từ tập liệu DATA4-2 phụ lục D Phương trình ước lượng với trị phương sai đồng phương sai trình bày (xem Phần Thực Hành Máy Tính 4.2):
t t
t 22216 0693W 0736P
Cˆ , , ,
2
R = 0,999 d.f = 33 ESS = 38.977
2 0032606
Varˆ ( , ) Varˆ3 (0,048822)2
001552
Cov(ˆ2,ˆ3) ,
Trị thống kê t tính theo:
53 001552
0 048822
032606
736 693
2
2 ( , ) ( , )] ,
) ,
[(
, ,
/
c
t
Vì t*33(0,05) có giá trị nằm 2,021 2,042, giá trị lớn nhiều so với giá trị tính tốn nhiều nên khơng bác bỏ giả thuyết H0 cho khuynh hướng cận biên chi tiêu từ tiền lương thu nhập khác Kết giữ nguyên cho dù giả thuyết ngược lại H1 phía hay hai phía
Chúng ta thấy ba phương pháp cho kết Trong ba phương pháp trình bày, Phương pháp thực dễ khơng địi hỏi tính tốn phụ lại sử dụng để kiểm định giả thuyết phép kiểm định t trực mơ hình điều chỉnh tí Tuy nhiên, kiểm định Wald trình bày phương pháp áp dụng nhiều trường hợp tổng quát
4.5 Các Sai Số Đặc Trưng
(20)đến việc lựa chọn dạng hàm số sai số đặc trưng số hạng ngẫu nhiên thảo luận chương
Khi chọn biến độc lập mơ hình, ta phạm phải hai loại sai số sau: (1) bỏ qua biến thuộc mơ hình (2) đưa vào biến không liên quan Trong hàm cầu, bỏ qua biến giá hàng hóa thu nhập hộ gia đình, gây trường hợp sai số đặc trưng loại thứ Trong ví dụ bất động sản trước đây, giả sử biến loại mái lợp thiết bị điện sử dụng khoảng cách đến trường học lân cận không tác động đáng kể đến giá bán nhà Nếu tiếp tục đưa biến vào mơ hình, phạm phải sai số đặc trưng loại thứ hai, nghĩa là, đưa thừa biến vào mơ hình Trong phần sau, xem xét hệ lý thuyết loại sai số đặc trưng đồng thời trình bày chứng thực nghiệm
Bỏ qua biến quan trọng
Đầu tiên khảo sát trường hợp biến thuộc mơ hình bị bỏ qua Giả sử mơ hình thật là:
Yt = 1 + 2Xt2 + 3Xt3 + ut Nhưng ước lượng mơ hình
Yt = 1 + 2Xt2 + vt
Nói cách khác, giá trị thật 3 khác 0, lại giả định loại bỏ biến X3 khỏi mơ hình Các số hạng sai số mơ hình thật giả định đáp ứng giả thiết từ 3.2 đến 3.8 Các hệ loại sai số xác định tóm tắt qua tính chất sau:
Tính chất 4.3
a Nếu biến độc lập mà hệ số hồi quy thật khác khơng bị loại khỏi mơ hình, giá trị ước lượng tất hệ số hồi quy lại bị thiên lệch biến bị loại không tương quan với biến đưa vào
b Ngay điều kiện thỏa mãn, số hạng số ước lượng nói chung bị thiên lệch, giá trị dự báo bị thiên lệch
c Ước lượng phương sai hệ số hồi quy biến đưa vào nói chung bị thiên lệch, kiểm định giả thuyết khơng có ý nghĩa
Có thể thấy từ Tính chất 4.3 hệ việc bỏ qua biến quan trọng nghiêm trọng Các ước lượng trị dự báo bị thiên lệch, kiểm định giả thuyết khơng cịn có ý nghĩa Nguyên nhân thiên lệch (được gọi thiên lệch biến bị bỏ sót) dễ dàng nhận thấy So sánh hai mơ hình, thấy vt = 3Xt3 + ut Giá trị kỳ vọng số hạng sai số mơ hình sai E(vt) = 3Xt3 Vì vậy, vt vi phạm Giả sử 3.3 Nghiêm trọng hơn, đồng phương sai Xt2 vt tính theo (xem Phần 2.3 đồng phương sai):
Cov(Xt2, vt) = Cov(Xt2, 3 Xt3 +ut) = 3 Cov(Xt2, Xt3) + Cov(Xt2, ut) = 3 Cov(Xt2, Xt3)
(21)vậy vi phạm Giả thiết 3.4 Tính chất khơng thiên lệch quán phụ thuộc vào hai giả thiết Như vậy, ˆ2 không bị không thiên lệch quán
Khẳng định nhận cách rõ ràng Gọi ˆ1 ˆ2 ước lượng số hạng số hệ số độ dốc Xt2 hồi quy Yt theo số hạng số biến Xt2, nghĩa loại bỏ Xt3 Các giá trị ước lượng thực hai ước lượng chứng minh Phụ Lục Phần 4.2 sau:
22 23
2 S
S
E(ˆ )
22 23 3
1 S
S X X E )(ˆ
Trong biến có gạch ngang đầu giá trị trung bình tương ứng, )
)(
( t2 t3
23 X X X X
S vàS22 (Xt2 X2)2 Từ thấy rằng, S23 = 0, tức là, X2 X3 không tương quan, E(ˆ2) 2 nói chung ˆ2 thiên lệch Cũng lưu ý ˆ2 bao gồm số hạng liên quan đến 3, ảnh hưởng biến bị loại bỏ Vì vậy, khơng thể diễn dịch ˆ2 ảnh hưởng cận biên riêng X2 Một phần ảnh hưởng biến bị loại bỏ khỏi mơ hình kể đến Như vậy, hệ số mơ hình đo lường ảnh hưởng trực tiếp biến đưa vào mơ ảnh hưởng gián tiếp biến bị loại bỏ Điều với ước lượng số hạng số Lưu ý S23 = 0, ˆ1 thiên lệch có thêm giá trị trung bình X3 = Bởi điều kiện đưa khó thỏa mãn, nên nhìn chung ước lượng giá trị dự báo thiên lệch
SỰ NGUY HIỂM CỦA VIỆC LOẠI BỎ SỐ HẠNG HẰNG SỐ Như thấy ˆ1 ˆ2 có kể đến phần ảnh hưởng biến bị loại bỏ X3 Do cần thiết phải đưa số hạng số vào mơ hình Nếu số hạng số bị bỏ qua, đường hồi quy bị ép phải qua gốc tọa độ, điều dẫn đến việc đặc trưng sai nghiêm trọng hàm hồi qui Chúng ta thấy từ biểu đồ phân tán Hình 3.1 hay Hình 3.11 ràng buộc đường hồi quy qua gốc tọa độ làm cho ước lượng độ dốc bị thiên lệch sai số lớn Một lần nữa, kết luận từ phần thảo luận số hạng số ln ln nên đưa vào mơ hình có lý lý thuyết vững để khơng làm điều (trong Chương gặp trường hợp lý thuyết bắt buộc khơng có số hạng số)
BÀI TẬP THỰC HÀNH 4.7
Trong mơ hình tuyến tính đơn, giả sử bạn nhầm lẫn loại bỏ số hạng số; nghĩa là, giả sử mơ hình thật Yt = + Xt + ut, bạn ước lượng thành Yt = Xt + vt Đầu tiên kiểm chứng ước lượng OLS sử dụng mơ hình sai ˆ = [(XtYt)]/[ (Xt2)] Kế đến thay vào Yt biểu thức Yt từ mơ hình thật, tính E(ˆ) Và sau chứng minh ˆ thiên lệch Cuối tìm điều kiện để ˆ khơng thiên lệch sử dụng mơ hình sai Nêu diễn dịch trực giác điều kiện bạn tìm
[Trong tập dạng tương tự cuối chương, tiến hành sau: (1) sử dụng mơ hình ước lượng tìm biểu thức đại số cho trị ước lượng thông số; (2) thay vào Yt từ mô
(22)ước lượng; (4) so sánh giá trị kỳ vọng với giá trị thật, kiểm tra tính khơng thiên lệch, cần thiết, xác định điều kiện để có khơng thiên lệch]
Ví dụ 4.12:
Đến cần phải có minh họa thực tiễn thiên lệch xác định việc loại bỏ biến quan trọng Tập tin DATA4-3 mô tả Phụ lục D chứa liệu hàng năm việc xây nhà Mỹ Quan hệ ước lượng việc mua nhà (HOUSING) (đơn vị nghìn la), GNP (theo tỉ đô la 1982), lãi suất cầm cố (%) sau (xem chi tiết Phần Thực Tập Máy Tính 4.3)
Mơ hình A: HOUSING = 687,898 + 0,905GNP – 169,658 INTRATE
(1,80) (3,64) (-3,87)
2
R = 0,375 F(2, 20) = 7,609 d.f = 20
Từ lý thuyết nhu cầu kỳ vọng nhu cầu nhà tăng thu nhập tăng Trái lại, lãi suất cầm cố tăng, chi phí sở hữu nhà tăng, nhu cầu nhà giảm Nhận thấy dấu hệ số ước lượng phù hợp với cảm nhận trực giác Chúng ta thấy từ trị thống kê t ngoặc đơn GNP INTRATE có ý nghĩa Tuy nhiên, R có giá trị khơng cao tập liệu theo thời gian Giả sử bỏ qua biến quan trọng INTRATE Mơ hình ước lượng trở thành sau:
Mơ hình B: HOUSING = 1.442,209 + 0,058GNP (3,39) (0,38)
2
R = - 0,04 F(1, 21) = 0,144 d.f = 21
Các kết thay đổi lớn Đầu tiên, R có giá trị âm, cho thấy thích hợp Điều củng cố thêm trị thống kê F với giá trị nhỏ khơng có ý nghĩa Trị thống kê t GNP khơng có ý nghĩa, cho thấy GNP có tác động không đáng kể đến việc mua nhà Cuối giá trị ước lượng hệ số GNP bị thay đổi đáng kể Các kết hoàn toàn không chấp nhận hậu việc bỏ qua lãi suất chấp, biến quan trọng tiên việc xác định nhu cầu nhà
Đưa Vào Mơ Hình Một Biến Khơng Liên Quan
Giả sử mơ hình thật
Yt = 1 + 2Xt2 + ut Nhưng thêm nhầm biến X3 ước lượng mơ hình
Yt = 1 + 2Xt2 + 3Xt3 + vt
Như trước số dư thật ut giả định tuân theo giả thiết 3.2 đến 3.8 Chương Hậu loại đặc trưng sai gì? Ước lượng 2 có thiên lệch hay khơng? Liệu BLUE? Các kiểm định giả thuyết có hợp lệ khơng? Câu trả lời cho câu hỏi tóm tắt tính chất sau:
Tính chất 4.4
(23)b Tuy nhiên phương sai chúng cao giá trị khơng có biến khơng liên quan, hệ số khơng hiệu
c Vì phương sai ước lượng hệ số hồi quy không thiên lệch, kiểm định giả thuyết có hiệu lực
Như hậu việc đưa vào mơ hình biến khơng liên quan nghiêm trọng so với trường hợp bỏ sót biến quan trọng
CHỨNG MINH*
Ở phần 4.A.3 ta chứng minh
E(ˆ2) = 2 E(ˆ ) = 3
Như vậy, ˆ2 không thiên lệch kỳ vọng ˆ 0.Tính quán giữ nguyên Các 3 kết tổng quát hóa cho trường hợp hồi quy bội với nhiều biến giải thích Do vậy, việc đưa vào biến không liên quan không làm thiên lệch ước lượng hệ số biến cịn lại Vì ước lượng khơng thiên lệch quán, giá trị dự báo dựa chúng
Bước tính phương sai ˆ2 để xác định tính chất hiệu Từ phần 4.A.3 (sử dụng ký hiệu đó) ta có:
) ( ) ˆ
( 2
22
2 S 1 r Var
Trong r2
bình phương phương sai đơn (xem Phương trình 2.11) X2 X3 định nghĩa r2
= S223/(S22S33) Chúng ta so sánh kết với phương sai ước lượng theo OLS (gọi giá trị *
2
) mà lẽ thu mơ hình thật sử dụng Từ phương trình (3.12) (3.19) chương ta có:
22 y S
S *
22
2 S Var(*)
Độ hiệu tương đối (xem định nghĩa 2.8b) ˆ2 *2
1 r
1 Var
Var
2
2
) (
) ˆ (
*
Vì rõ ràng ước lượng 2 sử dụng mơ hình sai khơng hiệu r2 = – nghĩa là, X2 X3 khơng tương quan với Vì tính khơng hiệu này, trị thống kê t có khuynh hướng nhỏ hơn, kết luận sai biến ý nghĩa mặt thống kê thực chúng lại hồn tồn khác khơng Có thể chứng minh (xem Johnston, 1984, trang 262) ước lượng phương sai ˆ2là khơng thiên lệch kiểm định giả thuyết có hiệu lực
VÍ DỤ 4.13:
(24)mua nhà Chính việc đưa biến POP UNEMP vào làm biến giải thích hợp lý Mơ hình hiệu chỉnh sau: (trị thống kê t ngoặc đơn)
Mơ hình C: HOUSING = 5.087,434 + 1,756GNP – 174,692 INTRATE (0,5) (0,8) (-2,9) – 33,434 POP + 79,720 UNEMP
(-0,4) (0,7)
2
R = 0,328 F(4, 18) = 3,681 d.f = 18
Khi so sánh với mơ hình A thấy có nhiều khác biệt đáng kể GNP trước có ý nghĩa khơng cịn ý nghĩa Trị thống kê t biến INTRATE giảm cịn có ý nghĩa Điều với điều phân tích lý thuyết dự đốn Tính chất 4.4b nói phương sai hệ số có khả lớn hơn, điều hàm ý trị thống kê t nhỏ Các trị thống kê t biến POP INTRATE nhỏ, cho thấy biến khơng quan trọng vai trò biến thêm vào chi phối nhu cầu nhà ở, cho trước GNP INTRATE đo lường quy mô kinh tế chu kỳ kinh doanh Thực ra, thực kiểm định Wald việc loại bỏ POP UNEMP Xem Mơ hình C mơ hình khơng giới hạn Mơ hình A mơ hình giới hạn, trị thống kê F kiểm định Wald (xem Phương Trình 4.3) tính theo:
C C C A C A
c ESS df
f d f d ESS ESS F ) ( ) ( 292 18 274 444 274 444 140 491 , / / ) (
Giá trị quan sát Fc nhỏ khơng có ý nghĩa mức 25% (p-value 0.75) Vì vậy, kiểm định Wald không bác bỏ giả thuyết không cho hệ số hồi quy POP UNEMP không Chúng ta lưu ý dấu POP UNEMP ngược với kỳ vọng Tuy nhiên, trường hợp hệ số khơng có nghĩa, dấu chúng khơng liên quan chọn tùy ý
Bài tập thực hành 4.8
Thay đưa hai biến POP UNEMP vào, làm đây, đưa tỉ lệ thất nghiệp vào mơ hình A thơi (được gọi mơ hình D) Hãy so sánh kết nhận với kết mơ hình A Các kết có khác biệt nhiều khơng?
(25)rất nhiều cân nhắc Sự gắn bó mù quáng tiêu chuẩn cứng nhắc phải ngăn ngừa giá
4.6 Ứng dụng: Các Yếu Tố Quyết Định Số Người Đi Xe Buýt
Ứng dụng liên quan đến số ngưới di chuyển xe buýt với nhiều yếu tố ảnh hưởng khác DATA 4-4 mô tả phụ lục D có liệu chéo cho 40 thành phố khắp nước Mỹ Các biến sau:
BUSTRAVL = Mức độ giao thông xe buýt đô thị tính theo ngàn hành khách FARE = Giá vé xe buýt tính Mỹ kim
GASPRICE = Giá ga lơng nhiên liệu tính Mỹ kim INCOME = Thu nhập bình qn đầu người tính Mỹ kim POP = Dân số thành phố tính ngàn người
DENSITY = Mật độ dân số tính (người/dặm vng) LANDAREA = Diện tích thành phố (dặm vng)
Đặc trưng tổng qt mơ hình, thường xem mơ hình “bồn rửa chén”, cho (khơng có số t):
BUSTRAV = 1 + 2FARE + 3GASPRICE + 4INCOME + 5POP + 6DENSITY + 7LANDAREA + u
Trước ước lượng mơ hình, xác định dấu biến, mức độ ưu tiên, cho hệ số hồi qui Trong phần thảo luận này, tiềm ẩn phía cung khơng xem quan trọng Bởi gia tăng giá vé xe bt làm giảm nhu cầu xe buýt, nên kỳ vọng 2 âm Trong lĩnh vực di chuyển, xe thay xe buýt, gia tăng giá nhiên liệu khiến số người tiêu thụ chuyển sang xe buýt Vì kỳ vọng hiệu ứng tích cực đây; nghĩa là, 3 dương Khi thu nhập tăng, kỳ vọng nhu cầu hàng tiêu dùng tăng lên, thường lệ kỳ vọng 4 dương Tuy nhiên, hàng tiêu dùng thuộc loại hàng hóa “thấp cấp”, hiệu ứng thu nhập (nghĩa là, 4) âm Một gia tăng kích thước dân số hay mật độ dân số thường làm gia tăng nhu cầu di chuyển xe buýt Vì vậy, kỳ vọng 5 6 dương Nếu diện tích đất tăng cao, thành phố trải rộng người tiêu thụ thích dùng xe phương tiện giao thơng Nếu tình huống, 7 kỳ vọng âm
Bảng 4.4 trích phần kết chạy máy tính sử dụng chương trình GRETL (Xem phần Thực hành máy tính 4.4) Các nhận xét cần tiết nên nghiên cứu cẩn thận trước phát triển xa Tất chủ đề mà nghiên cứu gắn kết lại với dự án thực nghiệm nhỏ này, Bảng 4.4 giúp bạn lắp ghép mảnh ráp hình khác thành hình ảnh hồn chỉnh Ngay bạn sử dụng chương trình riêng để kiểm tra lại kết quả, đáng để nghiên cứu lưu ý Bảng 4.4
Bảng 4.4 Trích phần kết chạy máy tính Số người xe buýt
MODEL 1: OLS estimates using the 40 observations 1-40 Dependent variable: BUSTRAVL
(26)0) Const 2744.6797 2641.6715 1.039 0.306361
2) FARE -238.6544 451.7281 -0.528 0.600816
3) GASPRICE 522.1132 2658.2276 0.196 0.845491
4) INCOME -0.1947 0.0649 -3.001 0.005090 ***
5) POP 1.7114 0.2314 7.397 0.000000 ***
6) DENSITY 0.1164 0.0596 1.954 0.059189 *
7) LANDAREA -1.1552 1.8026 -0.641 0.526043
Mean of dep var 1933.175 S.D of dep variable 2431.757
Error Sum of Sp (ESS) 1.8213e+007 Std Err of Resid (sgmahat) 742.9113
Unadjusted R-squared 0.921 Adjusted R-squared 0.907
F-statistic (6,33) 64.1434 p-value for F() 0.000000
Durbin-Watson stat 2.083 First-order autocorr coeff -0.156
MODEL SELECTION STATISTICS
SGMASQ 551917 AIC 646146 FPE 648503
HQ 719020 SCHWARZ 868337 SHIBATA 614698
GCV 668991 RICE 700510
Excluding the constant, p-value was highest for variable (GASPRICE)
[R bình phương hiệu chỉnh 0,907, hiển thị 90,7% phương sai BUSTRAVL giải thích chung biến mơ hình Đối với nghiên cứu chéo, điều hoàn toàn tốt Cột cuối cho giá trị p-value kiểm định đuôi cho giả thuyết không tương ứng với các hệ số hồi quy không Ba dấu (***) hiển thị giá trị p-value nhỏ 1%, ** có nghĩa nằm 5%, * ám value khoảng đến 10%, khơng có * nghĩa
p-value 10% Hãy nhớ giá trị p-p-value cao nghĩa xác suất sai lầm loại I bác bỏ giả thuyết không cao Nếu điều cao mức ý nghĩa chọn (0,10, chẳng hạn),
chúng ta không bác bỏ giả thuyết không cho hệ số Nói cách khác, giữ biến khác cố định, biến ảnh hưởng có ý nghĩa lên BUSTRAVL Dựa theo điều này, INCOME, POP, DENSITY có hệ số có nghĩa mức 10% Hằng số hệ số FARE, GASPRICE, LANDAREA khơng có ý nghĩa mặt thống kê mức 25%
Sự phù hợp trị thống kê chọn lựa mơ hình (đã thảo luận Phần 4.3) sau trở nên hiển nhiên Trị thống kê Durbin-Watson tự tương quan bậc thảo luận chương 9, không liên quan cho mục đích
(27)Cuối cùng, thấy chương tiếp theo, biến giải thích có tương quan chặt với gây khó khăn cho diễn giải riêng hệ số Việc loại trừ biến làm giảm hội nảy sinh tương quan làm cho việc diễn giải có ý nghĩa
Điểm bắt đầu cho trình loại bỏ nhận diện biến có hệ số hồi quy có nghĩa Điều được thực cách nhìn vào giá trị p-value cao mơ hình ước lượng khơng có số Về trung bình, hệ số tương ứng kỳ vọng gần khơng, tin thiên lệch bị gây loại bỏ nhỏ Từ kết mơ hình A, để ý hệ số cho GASPRICE có giá trị p-value cao có ý nghĩa Do đó, biến bị loại bỏ khỏi đặc trưng mơ hình xem điều xảy Dựa chúng ta loại bỏ nhiều biến Q trình gọi Đơn giản mơ hình dựa
số liệu.]
Bảng 4.4 (Tiếp theo)
MODEL 2: OLS estimates using the 40 observations 1-40 Dependent variable: BUSTRAVL
VARIABLE COEFFICIENT STDERROR T STAT 2PROB(t > |T|)
0) const 3215.8565 1090.4692 2.949 0.005730 ***
2) FARE -225.6595 440.4936 -0.512 0.611762 ***
4) INCOME -0.1957 0.0638 -3.069 0.004203 ***
5) POP 1.7168 0.2265 7.581 0.000000 ***
6) DENSITY 0.1182 0.0580 2.037 0.049453 ***
7) LANDAREA -1.1953 1.7656 -0.677 0.502980 ***
Mean of dep var 1933.175 S.D of dep variable 2431.757
Error Sum of Sp (ESS) 1.8235e+007 Std Err of Resid (sgmahat) 732.3323
Unadjusted R-squared 0.921 Adjusted R-squared 0.909
F-statistic (5,34) 79.204 p-value for F() 0.000000
Durbin-Watson stat 2.079 First-order autocorr coeff -0.155
MODEL SELECTION STATISTICS
SGMASQ 536311 AIC 615352 FPE 616757
HQ 674378 SCHWARZ 792765 SHIBATA 592623
GCV 630954 RICE 651234
Excluding the constant, p-value was highest for variable (FARE) of the model selection statistics, have improved
(28)MODEL 3: OLS estimates using the 40 observations 1-40 Dependent variable: BUSTRAVL
VARIABLE COEFFICIENT STDERROR T STAT 2PROB(t > |T|)
0) const 3111.1805 1071.0669 2.905 0.006330 ***
2) FARE -295.7306 424.8354 -0.696 0.490959oooo
4) INCOME -0.2022 0.0626 -3.232 0.002680 ***
5) POP 1.5883 0.1227 12.950 0.000000 ***
6) DENSITY 0.1490 0.0357 4.173 0.000189 ***
Mean of dep var 1933.175 S.D of dep variable 2431.757
Error Sum of Sp (ESS) 1.848e+007 Std Err of Resid (sgmahat) 726.6434
Unadjusted R-squared 0.920 Adjusted R-squared 0.911
F-statistic (5,34) 100.445 p-value for F() 0.000000
Durbin-Watson stat 1.995 First-order autocorr coeff -0.102
Bảng 4.4 (Tiếp theo)
MODEL SELECTION STATISTICS
SGMASQ 528011 AIC 593232 FPE 594012
HQ 640287 SCHWARZ 732670 SHIBATA 577512
GCV 603441 RICE 616012
Excluding the constant, p-value was highest for variable (FARE) of the model selection statistics, have improved
[Biến DENSITY gia tăng đáng kể Tuy nhiên, biến FARE có giá trị p-value 49%, cao chấp nhận với mức ý nghĩa hợp lý Điều gợi ý rằng, với có mặt biến khác, giá khơng ảnh hưởng lên nhu cầu xe buýt Nói cách khác, có nhu cầu xe buýt, người tiêu thụ không nhạy cảm với giá Do vậy, loại bỏ FARE cần thiết xem điều xảy ra.]
Bảng 4.4 (Tiếp theo)
MODEL 4: OLS estimates using the 40 observations 1-40 Dependent variable: BUSTRAVL
VARIABLE COEFFICIENT STDERROR T STAT 2PROB(t > |T|)
0) const 2815.7032 976.3007 2.884 0.006589 ***
4) INCOME -0.2013 0.0621 -3.241 0.002566 ***
5) POP 1.5766 0.1206 13.071 0.000000 ***
6) DENSITY 0.1534 0.0349 4.396 0.000093 ***
Mean of dep var 1933.175 S.D of dep variable 2431.757
Error Sum of Sp (ESS) 1.8736e+007 Std Err of Resid (sgmahat) 721.4228
Unadjusted R-squared 0.919 Adjusted R-squared 0.912
F-statistic (5,34) 135.708 p-value for F() 0.000000
Durbin-Watson stat 1.879 First-order autocorr coeff -0.043
MODEL SELECTION STATISTICS
SGMASQ 520451 AIC 572112 FPE 572496
HQ 608137 SCHWARZ 677373 SHIBATA 562087
(29)[Lưu ý mơ hình có trị thống kê lựa chọn mơ hình thấp tất hệ số có nghĩa lớn Cũng vậy, hệ số INCOME, POP, DENSITY khơng khác với hệ số mơ hình mơ hình Vì thiên lệch việc loại bỏ FARE không nghiêm trọng
Vì lợi ích hồn tất, thật đáng để xem mơ mơ hình khơng giới hạn Mơ hình mơ hình giới hạn để thực kiểm định F-test để kiểm tra xem liệu hệ số GASPRICE, LANDAREA, FARE đồng thời khác với không Kết cho đây.]
F(3,33): area to the right of 0.315845 = 0.813800
[Giả thuyết không kiểm định F Wald phát biểu hệ số tất biến bị loại bỏ không, nghĩa là, hệ số 2 = 3 = 7 = Vì giá trị p-value trường hợp 0.8138, giá trị cao tiêu chuẩn hợp lý nào, bác bỏ giả thuyết
khơng Sử dụng tính tốn phương trình (4.3), kiểm tra lại trị thống kê F cho biến bị loại bỏ
đã cho 0,315845 (lưu ý mô hình mơ hình khơng bị giới hạn mơ hình mơ hình giới hạn kiểm định này) Sau dùng bảng F với mức 10% cho Bảng A.4c kiểm tra lại bạn bác bỏ giả thuyết không mức 10% Vì vậy, hệ số FARE, GASPRICE, LANDAREA đồng thời khơng có nghĩa mức Dựa tất ràng buộc, mơ hình dường “tốt nhất” chọn mơ hình cuối cho việc diễn dịch
Các hệ số thu nhập, kích thước dân số, mật độ dân số có ý nghĩa lớn Lý thuyết kinh tế chuẩn cho ảnh hưởng thu nhập lên nhu cầu hàng hóa dương, hệ số ước lượng INCOME lại âm Điều này, khơng gây ngạc nhiên, gợi ý xe buýt loại hàng hóa “thấp cấp” Khi thu nhập tăng lên, người ta có khuynh hướng sử dụng xe để di chuyển, lượng xe buýt giảm xuống Nếu thu nhập đầu người tăng lên khoảng 100 la, thì, trung bình, xe bt kỳ vọng giảm khoảng 100|ˆ4|, nghĩa là,
khoảng 20,13 ngàn người Như kỳ vọng, hệ số POP DENSITY dương Nói cách khác, kích thước dân số hay mật độ dân số tăng lên, có nhiều người di chuyển xe buýt Tuy nhiên, giá trị số DENSITY nhạy, POP lại khơng lớn (chú ý hai DENSITY POP đo lường đơn vị) Điều gợi ý khả đặc trưng sai mơ hình
Khi ước lượng mối quan hệ nhu cầu, người ta thường đặt câu hỏi liệu nhu cầu “co giãn” hay “không co giãn” giá thu nhập Việc trả lời cho câu hỏi địi hỏi ước lượng mối quan hệ phi tuyến tính, chủ đề khảo sát chi tiết Chương 6.]
4.7 Ứng dụng: Sự tham gia lực lượng lao động nữ giới
Ứng dụng thứ hai xuyên suốt dùng nghiên cứu kinh tế lượng xác định tỷ lệ tham gia lực lượng lao động nữ giới – phần trăm nữ giới 16 tuổi lực lượng lao động thực làm việc hay tìm việc DATA4-5 mơ tả phụ lục D trình bày liệu điều tra dân số năm 1990 cho 50 bang nhiều biến (biến biến phụ thuộc):
WLFP =
YF =
Tỷ lệ tham gia (%) phụ nữ 16 tuổi (phần trăm phụ nữ lực lượng lao động)
(30)YM = EDUC =
UE = MR = DR = URB = WH =
Mức lương trung vị (ngàn đô-la) nam
Phần trăm nữ giới tốt nghiệp trung học 24 tuổi Tỷ lệ thất nghiệp (%)
Tỷ lệ kết hôn (%) nữ giới từ 16 tuổi trở lên Tỷ lệ ly hôn
Phần trăm dân số thành thị nước Phần trăm phụ nữ da trắng 16 tuổi
Mơ hình kinh tế lượng dùng tất biến giải thích sau:
WLFP = 1 + 2YF + 3YM + 4EDUC + 5UE + 6MR + 7DR + 8URB + 9WH + u
Trước thực ước lượng mơ hình, việc thảo luận dấu hệ số hồi quy kỳ vọng hữu ích Sự thảo luận rút dựa “lý thuyết kinh tế” tương phản với “lý thuyết kinh tế lượng” Bạn đọc tham khảo viết O’Neill (1981), Kelley Da Silva (1980), King (1978) để biết thêm chi tiết vài lý thuyết
YF: độ đo lường tiền trả cho người lao động nữ, ta kỳ vọng có hiệu ứng dương lên biến WLFP Nói cách khác, lương cao, nữ giới tham gia lao động Tuy nhiên, ta nên nhớ lý thuyết lao động nói “hiệu ứng thu nhập” lên lao động âm; nghĩa thu nhập tăng, người lao động mong muốn thư nhàn (ít việc) Với tiền lương hành, hiệu ứng yếu; đó, cân bằng, ta kỳ vọng biến có hệ số dương
YM: Khi người chồng làm tiền nhiều hơn, người vợ không cần làm việc nhiều Do đó, ta kỳ vọng hệ số âm Cũng nhiều phụ nữ có khả chuyên môn tốt, thu nhập nam giới cao khiến nhiều phụ nữ tìm việc Tuy nhiên, điều tác động đến loại công việc không tác động đến việc nhiều phụ nữ tham gia lực lượng lao động hay không
EDUC: Sự giáo dục nhiều ngụ ý có nhiều hội việc làm (mong ước) sẵn có cho nữ Vậy, ta kỳ vọng hệ số dương
UE: Tỷ lệ thất nghiệp có hiệu ứng âm dương “giả thuyết người lao động chán nản” nói rõ tỷ lệ thất nghiệp cao dấu hiệu cho phụ nữ (và phận người thiểu số) biết tìm việc cơng việc vơ ích Điều làm cho họ rời khỏi lực lượng lao động, hệ số có dấu âm Cũng có hiệu ứng dương Nếu người chồng việc, người vợ phải tham gia lao động để bù vào khoản tiền bị Nếu hiệu ứng khơng mạnh, dấu âm chiếm ưu
MR: Nếu phụ nữ kết hơn, ta có xu hướng có hội làm việc (đặc biệt họ có con) giảm mong muốn cần thiết có việc Vậy tỷ lệ kết cao giảm tỷ lệ tham gia lao động nữ – WLFP
DR: Ta kỳ vọng dấu dương cho biến tỷ lệ ly cao, nhiều phụ nữ tham gia lực lượng lao động nhằm tự chu cấp cho họ
(31)những việc đồng khác Vậy, họ phần lực lượng lao động Điều có nghĩa tiểu bang có dân số nơng thơn đơng (nghĩa URB), tham gia lao động nữ cao hơn, kết hệ số âm Hiệu ứng sau xác định theo kinh nghiệm
WH: Khơng có dấu rõ ràng kỳ vọng trước cho biến Nếu phụ nữ da màu tương đối khơng giỏi chun mơn tìm loại việc giúp việc hay quản gia, ta kỳ vọng dấu âm cho hệ số tỷ lệ phụ nữ da trắng (WH) cao số phụ nữ da màu thấp Cũng vậy, phụ nữ da trắng tương đối giàu có, họ khơng tham gia lực lượng lao động Điều dẫn đến dấu âm Nếu giả thiết không đúng, kết dấu dương
Bảng 4.5 cho thấy kết chạy máy tính phần với thích (xem Phần 4.5 Thực hành Máy tính) Dùng chương trình hồi quy bạn DATA 4-5 để mô kết Sau nghiên cứu kỹ kết trước tiến hành tiếp
Bảng 4.5 Kết chạy máy tính phần có thích tỷ lệ tham gia lực lượng lao
động nữ giới
[Mơ hình với tất biến (thường xem mơ hình “bồn rửa chén”)]
MODEL 1: OLS estimates using the 50 observations 1-50 Dependent variable: wlfp
VARIABLE COEFFICIENT STDERROR T STAT 2Prob(t T)
0) const 44.5096 8.9750 4.959 0.000013
2) yf 0.9880 0.4076 2.424 0.019847
3) ym -0.1743 0.3062 -0.569 0.572212
4) educ 0.2851 0.0932 3.060 0.003888
5) ue -1.6106 0.3136 -5.136 0.000007
6) mr -0.0782 0.1731 -0.452 0.653835
7) dr 0.4374 0.2583 1.693 0.098035
8) urb -0.0926 0.0333 -2.776 0.008195
9) wh -0.0875 0.0398 -2.196 0.033819
Bảng 4.5 (tiếp theo)
Mean of dep var 57.474 S.D of dep variable 4.249
Error Sum of Sq (ESS) 193.9742 Std Err of Resid (sgmahat) 2.1751
Unadjusted R-squared 0.781 Adjusted R-squared 0.738
F-statistic (8, 41) 18.2459 p-value for F( ) 0.000000
Durbin-Watson stat 1.637 First-order autocorr coeff 0.179
MODEL SELECTION STATISTICS
SGMASQ 4.73108 AIC 5.56058 FPE 5.58267
HQ 6.33926 SCHMARZ 7.84492 SHIBATA 5.2761
GCV 5.76961 RICE 6.06169
Excluding the constant, p-value was highest for variable (mr)
(32)MODEL 2: OLS estimates using the 50 observations 1-50 Dependent variable: wlfp
VARIABLE COEFFICIENT STDERROR T STAT 2Prob (t T)
0) const 41.3460 5.5598 7.437 0.000000
2) yf 1.0671 0.3645 2.927 0.005497
3) ym -0.1984 0.2987 -0.664 0.510097
4) educ 0.2582 0.0709 3.643 0.000734
5) ue -1.5910 0.3076 -5.171 0.000006
7) dr 0.3916 0.2354 1.664 0.103626
8) urb -0.0876 0.0311 -2.814 0.007420
9) wh -0.0851 0.0391 -2.175 0.035271
Mean of dep var 57.474 S.D of dep variable 4.249
Error Sum of Sq (ESS) 194.9397 Std Err of Resid (sgmahat) 2.1544
Unadjusted R-squared 0.781 Adjusted R-squared 0.743
F-statistic (7, 42) 21.2255 p-value for F( ) 0.000000
Durbin-Watson stat 1.649 First-order autocorr coeff 0.173
MODEL SELECTION STATISTICS
SGMASQ 4.64142 AIC 5.36914 FPE 5.38405
HQ 6.03252 SCHMARZ 7.29064 SHIBATA 5.14641
GCV 5.5255 RICE 5.73352
Bảng 4.5 (tiếp theo)
Excluding the constant, p-value was highest for variable (ym) Of the model selection statistics, have improved
[Bỏ biến ym, biến giá trị p cao, ý dr trở nên có ý nghĩa mức 10 phần trăm]
MODEL 3: OLS estimates using the 50 obsetvations 1-50 Dependent variable: wlfp
VARIABLE COEFFICIENT STDERROR T STAT 2Prob (t T)
0) const 41.8336 5.4753 7.640 0.000000
2) yf 0.8493 0.1582 5.370 0.000003
4) educ 0.2492 0.0691 3.606 0.000804
5) ue -1.6776 0.2769 -6.059 0.000000
7) dr 0.4341 0.2251 1.929 0.060390
8) urb -0.0942 0.0293 -3.212 0.002500
9) wh -0.0961 0.0352 -2.729 0.009156
Mean of dep var 57.474 S.D of dep variable 4.249
(33)F-statistic (6, 43) 25.0145 p-value for F( ) 0.000000
Durbin-Watson stat 1.668 First-order autocorr coeff 0.165
MODEL SELECTION STATISTICS
SGMASQ 4.58112 AIC 5.21282 FPE 5.22248
HQ 5.77222 SCHMARZ 6.81281 SHIBATA 5.0429
GCV 5.32688 RICE 5.47189
Of the model selection statistics, have improved
[Dùng Mơ hình làm mơ hình giới hạn Mơ hình làm mơ hình khơng giới hạn, ta thực F-test Kết cho sau.]
F(2, 41): area to the right of 0.318535 = 0.728997
[Dùng máy tính, thực thống kê kiểm định Wald bỏ biến ym dr Giả thuyết
không cho kiểm định 3 = 7 = Như trên, giá trị p xác suất sai lầm loại I ta bác bỏ giả thuyết khơng Vì 0,279 q cao cho mức ý nghĩa hợp lý nào, ta không nên bác bỏ
giả thuyết không mà thay vào kết luận ym dr khơng có ý nghĩa liên kết Bạn nên
chứng minh điều cách dùng bảng F Phụ lục A.4c với mức ý nghĩa 10 phần trăm Tất trị thống kê chọn lựa mơ hình thấp Mơ hình Do đó, ta chọn Mơ hình mơ hình cuối “tốt nhất” để khảo sát tiếp Để giải thích kết quả, xem đọc.]
Trong Mơ hình 3, chọn mơ hình cuối “tốt nhất”, dấu dương biến YF “hiệu ứng đường cung bẻ ngược” lên lao động – nghĩa là, tiền lương tăng người lao động thích thư nhàn tham gia vào lực lượng lao động – yếu Mọi điều khác nhau, lương phụ nữ tăng lên $1.000 tỷ lệ tham gia lao động ta kỳ vọng tăng trung bình 0,849 phần trăm
Tiền lương nam giới (YM) khơng có ý nghĩa Điều biến liên kết chặt chẽ với biến YF bị bao gộp hệ số biến YF
Như kỳ vọng, giáo dục tăng làm cho nhiều phụ nữ tìm việc Tỷ lệ phụ nữ tốt nghiệp trung học tăng phần trăm tăng tỷ lệ tham gia lao động trung bình 0,249 phần trăm
Dấu âm biến UE xác nhận cho “giả thuyết người lao động chán nản”, nói rõ tỷ lệ thất nghiệp cao, phụ nữ tìm việc chán nản rời khỏi lực lượng lao động Mức quan trọng hệ số hoàn toàn cao Biến UE tăng phần trăm đồng nghĩa với tỷ lệ tham gia lao động WLFP giảm trung bình 1,678 phần trăm
Tỷ lệ ly có dấu dương Trung bình, tỷ lệ ly tăng phần trăm kỳ vọng làm cho tỷ lệ tham gia lao động WLFP tăng 0,434 phần trăm Tuy nhiên, tỷ lệ kết (MR) khơng có ý nghĩa mặt thống kê
Hệ số âm biến URB (-0,094) xác nhận luận điểm trước dân số nơng thơn cao (nghĩa là, URB thấp) làm cho WLFP cao phụ nữ nơng thơn làm nhiều công việc đồng nghĩa tham gia lực lượng lao động
(34)Giá trị R2
cho biết khoảng 74 phần trăm thay đổi tỷ lệ tham gia lao động liên bang giải thích Mơ hình C Vậy, ta bỏ vài biến để tăng khả giải thích mơ hình Tuy nhiên, liệu chéo lớp cho R2
thấp hoàn tồn đặc trưng Bởi liệu theo chuỗi nói chung nhiều lần phát triển q mức, mơ hình dựa liệu có chiều hướng cho độ thích hợp cách tương đối Có thể thấy điều qua giá trị R2 (0,999) hàm tiêu dùng trình bày Ví dụ 4.11 Với liệu thêm vào, ta có giải thích tốt tỷ lệ tham gia lao động nữ giới Các biến tính đến hồi quy sau:
1 Quy mô gia đình, tỷ lệ sinh sản, số trẻ em “ngưỡng” tuổi; yếu tố có chiều hướng làm giảm hội việc làm nữ giới
2 Một biến đo lường số phụ nữ tốt nghiệp đại học Phân phối tuổi nữ giới
4 Trợ cấp trả cho phụ nữ độc thân có trẻ em; yếu tố khiến cho phụ nữ làm nhà (Tính sẵn có chăm sóc hàng ngày có hiệu ứng)
5 Độ đo thể khác vùng; vùng trang trại vùng cơng nghiệp có kiểu hành vi khác
Những nhận xét quan trọng diễn giải hệ số hồi quy
Khi diễn giải hệ số hồi quy ước lượng cần phải thật thận trọng Trước hết, dấu hệ số hồi quy trái ngược với bạn kỳ vọng ban đầu Nếu hệ số khơng có ý nghĩa mặt thống kê (nghĩa là, bạn bác bỏ giả thuyết khơng cho hệ số khơng), sai dấu khơng thích hợp mặt thống kê, giá trị số mang dấu dương âm ngang đơn tình cờ ngẫu nhiên bạn thu dấu sai Trong nhận xét có thích bảng 4.4, ta nói rõ số lý hợp lý để loại bỏ biến có hệ số khơng có ý nghĩa (diễn giải dễ hơn, ý nghĩa xác hơn) Trong trường hợp vậy, đơn giản bạn nên bỏ biến số ước lượng lại mơ hình với tin độ thiên lệch biến vừa loại bỏ không đáng kể Nên ý bỏ biến nghĩa bạn nói biến khơng có hiệu ứng lên biến Y, mà phải hiểu là, thứ khác nhau, biến bàn đến khơng có hiệu ứng riêng lẻ Hiệu ứng thể qua diện biến khác có tương quan (Chương đề cập nhiều hơn)
Khi định chọn ý nghĩa không thông số hồi qui, câu hỏi đáng quan tâm là “Với mức giá trị p ta cho cao để bác bỏ giả thuyết không hiệu ứng 0?” Hầu hết nhà phân tích dùng mức phần trăm (hoặc 0.05) làm chuẩn Mức ưa thích cá nhân tơi 10 phần trăm Một ưu điểm dùng giá trị cao có nhiều biến giữ lại mơ hình (giải thích tình huống), giảm thiên lệch biến bỏ Khơng giống thí nghiệm y học, mà sai lầm trả giá đắt, hành vi kinh tế phải chịu nhiều yếu tố không chắn, mức dung sai phải cao Tuy nhiên, cỡ mẫu (n) lớn, ta nên dùng giá trị p ngặt Bởi n lớn, độ lệch chuẩn nhỏ, làm cho hầu hết hệ số có ý nghĩa
Ta nên làm hệ số có dấu ngược có ý nghĩa mặt thống kế? Ta nên tìm câu giải thích Lấy ví dụ, ví dụ 4.1 giá nhà, ta phát dấu âm khác thường biến BEDRMS BATHS Tuy nhiên, theo ý nghĩa hợp lý hệ số hồi quy – nghĩa hiệu ứng phần,
tất biến khác không đổi giá trị – ta thấy hệ số âm xét cho không ngạc
(35)ta đến giải thích hợp lý nhận thấy dấu âm cho biết du lịch xe buýt “hàng hóa thấp cấp” Chương cung cấp ví dụ khác trường hợp mà ta bắt gặp dấu khác thường đề xuất biện pháp xử lý Các ví dụ nên nghiên cứu kỹ lưỡng
Một lưu ý quan trọng khác phải ý đến đơn vị đo biến diễn giải giá trị số hệ số hồi quy (xem Phần 3.6 chuyển đổi đơn vị để nhớ lại) Bạn thật thận trọng diễn giải biến thể phân số phần trăm (ví dụ, tỷ lệ thất nghiệp lãi suất) Nếu bạn thực dự án thực nghiệm bạn, nhìn chung nên tránh dạng phân số tỷ lệ mà biểu diễn biến theo phần trăm Lý dễ dàng diễn dịch hiệu ứng phần trăm thay 0,01 thay đổi biến số Tuy nhiên, viết thực nghiệm nhà điều tra nghiên cứu biểu diễn vài biến dạng tỷ lệ Trong trường hợp thế, phải thật thận trọng diễn dịch giá trị số Ở phần này, bạn đọc hiểu xem lại diễn dịch hệ số ước lượng biến dạng phần trăm ví dụ tham gia lực lượng lao động nữ giới vừa thảo luận
4.8 Ví dụ thực nghiệm: Tỷ lệ di trú ròng chất lượng sống
Liu (1975) nghiên cứu mối quan hệ thay đổi tỷ lệ di trú ròng bang số biến giải thích, gồm “chất lượng sống” Dữ liệu chéo 50 bang, mơ hình dùng sau:
MIGRATE = f(QOL, Y, E, IS, ES, AP, ED, HW)
Trong
MIGRATE = Tỷ lệ di trú rịng năm 1960 1970 (số chuyển đến trừ số chuyển chia cho dân số)
QOL = Chỉ số chất lượng sống
Y = Chỉ số thu nhập bang thu nhập quốc gia
E = Tỷ lệ số việc làm bang số việc làm quốc gia IS = Chỉ số tình trạng cá nhân
ES = Chỉ số tình trạng kinh tế AP = Chỉ số sản xuất nông nhgiệp ED = Chỉ số phát triển giáo dục
HW = Chỉ số trợ cấp phúc lợi chăm sóc sức khỏe
Dựa tiêu phát triển Ủy ban Mục tiêu Quốc gia Chủ tịch Eisenhower Liu xây dựng số liệt kê QOL trung bình số học số khác chất lượng sống Bảng 4.6 có hệ số ước lượng thống kê liên quan cho số mơ hình hồi quy bội liên kết tỷ lệ di trú với số chất-lượng-cuộc-sống Để thưởng thức nghiên cứu di trú tác giả, sinh viên nên đọc nguyên viết Mặc dù chủ đề đề cập chương đủ để hiểu rõ mơ hình kết quả, ta trình bày tóm tắt kết
Tác giả khơng cung cấp thơng tin tổng bình phương phần dư cho mơ hình, ta khơng thể so sánh mơ hình cách dùng tiêu chuẩn chung trình bày trước Độ thích hợp đánh giá R2 Ta lưu ý thu nhập việc làm tự thân khơng giải thích thay đổi biến di trú Giá trị R2
(36)được thêm vào QOL (Mơ hình 3), R2
giảm cách đáng kể Điều hàm ý biến không thuộc mơ hình Trong Mơ hình 4, tác giả loại trừ Y E Ta lưu ý rằng, loại bỏ yếu tố phúc lợi chăm sóc sức khỏe (HW), biến chất-lượng-cuộc-sống khác có ý nghĩa có ý nghĩa mức ý nghĩa phần trăm Bởi HW khơng có ý nghĩa mơ hình, tốt nên bỏ biến ước lượng lại mơ hình để ước lượng hệ số lại hiệu Nhưng tác giả định giữ biến số lại để tránh thiên lệch có biến bị bỏ Tất biến chất lượng-cuộc-sống có dấu kỳ vọng dương loại bỏ biến phát triển giáo dục (dấu âm biến HW bỏ qua khơng có ý nghĩa mặt thống kê) Sự hợp lý Liu kết khác thường tái diễn lại (Liu, 1975, trang 333):
Bảng 4.6 Tương quan ước lượng Di trú Chất lượng sống
Biến độc lập Mơ hình Mơ hình Mơ hình Mơ hình Mơ hình
CONSTANT
QOL
Y
E
IS
ES
AP
ED
HW
-23.05
24.06 (2.05)
104.62
0.36 (0.05)
103.47 (-0.48)
55.94
23.40 (1.93)
-0.74 (-0.10)
-77.26 (-0.37)
-16.46
28.68 (2.02)
20.03 (2.24)
18.73 (2.87)
-31.56 (-3.46)
-18.45 (-1.41)
-62.50
7.19 (1.11)
41.76 (0.23)
30.21 (2.14)
20.49 (2.28)
19.13 (2.89)
-33.48 (-3.59)
-21.69 (-1.57)
2
R 0.06 -0.03 0.02 0.37 0.36
D.F 48 47 46 44 42
Lưu ý: Các giá trị () thông kê t
f
Nguồn: Liu (1975), Tái với cho phép Hiệu trưởng hội viên trường Harvard
Trước hết, di trú biến động biến giáo dục đại diện cho khái niệm tĩnh Điều dẫn đến tiến trình hiệu chỉnh cân khối người giáo dục dòng di trú Mỹ, nghĩa bang biết có phát triển giáo dục đáng kể xuất nhân lực có trình độ cao sang bang mà nhân lực có kỹ cao tương đối khan kết là, di dân có trình độ cao tìm thấy bang hội nghề nghiệp nhiều nhiều công việc thích đáng Thứ hai, di dân khơng đồng trình giáo dục, định di trú họ thường bị tác động bạn bè hay người thân nơi đến, người thường có trình độ giáo dục họ Hệ là, bang có cư dân khơng đồng trình độ văn hóa kỳ vọng có tỷ lệ di trú ròng cao bang tương đối đồng Tuy nhiên, cần phải nghiên cứu bổ sung thêm để đánh giá hiệu ứng biến giáo dục lên di trú
4.9 Dự án thực nghiệm
(37)máy tính liệu nhập cách xác (nếu bạn dùng GRELT, đọc sách hướng dẫn để đặt file liệu bạn) Sau bạn thử mơ hình đầu tiên, loại bỏ biến thực kiểm định Wald, áp dụng kỹ thuật đơn giản hóa mơ hình dựa liệu để khử biến Tuy nhiên tất bước đơn để thực hành hiểu rõ thêm chủ đề đề cập chương Bạn không nên xem trọng kết quả, cần phải có nghiên cứu lý thuyết đáng kể trước đảm nhận mơ hình ý nghĩa phân tích
Tóm tắt
Trong mơ hình hồi quy tuyến tính bội, biến phụ thuộc (Y) hồi quy dựa vào k biến độc lập X1, X2,…, Xk X1 thông thường đặt để bao gộp số hạng tung độ gốc không đổi Như trước đây, thủ tục OLS cực tiểu tổng bình phương sai số
t
uˆ cho k phương trình chuẩn Những phương trình nói chung giải cho hệ số, với điều kiện số quan sát lớn k
Ước lượng không thiên lệch phương sai sai số (2) xác định s2
= ˆ ( uˆ2)/(n k) t
2
Với giả thiết số hạng sai số ut phân phối độc lập đồng N(0, 2), trị thống kê
2
k
n )ˆ ]/
[( có phân phối chi bình phương với n-k bậc tự
Độ thích hợp đo lường theo cách tương đương Từ phương trình ước lượng, phần dư đo
tk k t t
t Y X X
uˆ ˆ ˆ ˆ Tổng bình phương sai số (ESS) uˆ2t , tổng
bình phương tồn phần (TSS)
t Y
Y )
( Độ lệch chuẩn hồi quy xác định
2 k n ESS / )] /( [ ˆ
so sánh với 12
Y TSS n
/
)] /( [
ˆ
để thấy độ biến giảm Một độ đo lường khơng tự đơn vị xác định bình phương R có hiệu chỉnh (ký hiệu R2), tính sau
TSS n R k n n k n TSS n ESS
R2 ˆ2( )
) ( ) ( ) (
R diễn giải thay đổi Yt giải thích mơ hình Khơng giống R2, 1–(ESS/TSS), R2
có tính đến đánh đổi tăng thêm R2 biến thêm vào giảm bậc tự
Trong chương này, ta thảo luận tiêu chuẩn khác để chọn mơ hình tốt Một mơ hình đơn giản ưa thích (1) gộp q nhiều biến làm cho độ xác tương đối hệ số riêng lẻ (sẽ thấy chi tiết chương kế tiếp), (2) Thêm biến đồng nghĩa với giảm bậc tự do, làm cho khả kiểm định đi, (3) mơ hình đơn giản dễ hiểu mơ hình phức tạp Tiêu chuẩn chọn lựa mơ hình có dạng tổng bình phương sai số nhân với hệ số bất lợi, hệ số phụ thuộc vào tính phức tạp mơ hình Một mơ hình đánh giá tốt trị thống kê tiêu chuẩn phần lớn đặc trưng có giá trị thấp Tuy nhiên, vài trường hợp đặc biệt đó, hay vài tiêu chuẩn trở nên không cần thiết
Để kiểm định hệ số riêng lẻ () khác không cách ý nghĩa hay khơng, trước tiên ta tính thống kê t (tc), tỷ số hệ số ước lượng với độ lệch chuẩn ước lượng Nếu tc t*n-k (/2), với t* điểm phân phối t với bậc tự n-k theo xác suất để t t* nửa mức ý nghĩa , giả thuyết khơng H0: = bị bác bỏ giả thuyết H1: củng cố Nếu giả thuyết củng cố kiểm định phía, ta thu t*
(38)Để áp dụng phương pháp p-value, trước tiên tính tốn lần vùng bên phải tc phân phối t với bậc tự n-k Bác bỏ H0 giá trị p nhỏ mức ý nghĩa, kết luận hệ số có ý nghĩa
Để kiểm định hệ số hồi quy có khơng hay khơng, phải thực kiểm định F-test, cịn gọi kiểm định Wald Cụ thể hơn, để kiểm định H0: m+1 = m+2 = = k = đối lại giả thuyết có hệ số khác không, trước tiên ta ước lượng mô hình khơng giới hạn (U):
(U) Y = 1 + 2X2 + + mXm + m+1Xm+1 + + kXk + u Tiếp theo ta bỏ k-m biến cuối ước lượng mơ hình giới hạn (R):
(R) Y = 1 + 2X2 + + mXm + v Kế đến ta tính trị thống kê F Wald:
) /( ) ( ) /( ) ( ) /( ) /( ) ( k n R m k R R k n ESS m k ESS ESS F 2 U R U U U R
c
Trong R2
độ thích hợp chưa hiệu chỉnh Giả thuyết khơng bị bác bỏ Fc F*k-m, n-k (), F*
điểm phân phối F với k-m n-k bậc tự theo xác suất để F F* (ví dụ, 0,05 0,01) Kiểm định Wald không cần thực có hệ số hồi quy bị bỏ khỏi mơ hình Lý kiểm định t-test hệ số tương ứng tương đương
Trị thống kê kiểm định Wald cho độ thích hợp tổng quát xác định sau:
) /( ) ( ) /( k n R 1 k R F 2 c
có phân phối F với bậc tự k-1 n-k
Kiểm định tổ hợp tuyến tính hệ số hồi quy thực theo cách tương đương Thống kê t dựa tổ hợp tuyến tính ước lượng có bậc tự n-k dùng kiểm định t tương tự dựa hệ số hồi quy riêng lẻ Hoặc tổ hợp tuyến tính sáp nhập vào mơ hình thực kiểm định t F-test
Khoảng tin cậy cho hệ số riêng lẻ tương tự điều rút từ Chương Khoảng tin cậy cho dự báo Yˆ ˆ1ˆ2X2 ...ˆkXk dễ dàng có ước lượng mơ hình có sửa đổi nhỏ
Nên tránh “khai thác liệu” khơng cẩn thận để tìm “độ thích hợp tốt nhất” điều thường dẫn đến chứng minh giả thuyết mà ta nghĩ đến nhiên chứng minh trái ngược Không nên áp dụng mù quáng tiêu cứng nhắc mà không xét đến lý thuyết hiểu biết hành vi
(39)1 Các hệ số hồi quy ước lượng dùng mơ hình sai dự báo dựa ước lượng không thiên lệch quán
2 Những ước lượng không hiệu ước lượng không thiên lệch tuyến tính tốt (BLUE) ước lượng dựa mơ hình BLUE
3 Những kiểm định giả thuyết hợp lệ phương sai ước lượng khơng thiên lệch Tuy nhiên, khả kiểm định bị giảm Nói cách khác, khả chấp nhận giả thuyết sai lầm (sai lầm loại II) cao dùng mô hình sai
Hệ việc loại bỏ biến đáng thuộc mơ hình là:
1 Các hệ số hồi quy ước lượng dùng mô hình sai dự báo dựa ước lượng thiên lệch không quán
2 Phương sai ước lượng thiên lệch, kiểm định giả thuyết khơng hợp lệ
So sánh hệ theo lý thuyết việc thêm biến không liên quan với việc loại bỏ biến quan trọng, ta quan sát thấy có đánh đổi Sai số đặc trưng việc thêm biến vào làm cho ước lượng không hiệu quả, cho dù không thiên lệch Dạng sai số việc bỏ biến làm cho ước lượng kiểm định giả thuyết thiên lệch Bởi chưa thể biết mối quan hệ thực, ta lâm vào tình khó khăn để chọn cơng thức thích hợp Một nhà điều tra nghiên cứu cho tính khơng thiên lệch, tính thích hợp tin cậy kiểm định quan trọng giữ biến không liên quan nhận hậu việc loại bỏ biến quan trọng Ngược lại, nhà nghiên cứu chấp nhận ước lượng khơng hiệu quả, thích loại bỏ biến không liên quan Lý thuyết kinh tế hiểu biết hành vi thường giúp ích tình khó khăn vầy Tiêu chuẩn lựa chọn mơ hình thảo luận trước giúp ích Các kiểm định đặc trưng (Chương 6) giúp ích
Bởi số hạng khơng đổi bao gộp hiệu ứng trung bình biến bị loại bỏ, nên nhìn chung không nên bỏ số hạng khỏi đặc trưng, khơng có ý nghĩa / có dấu khơng kỳ vọng
Thuật ngữ
Adjusted R2
Akaike information criterion (AIC) Data-based model simplification Finite prediction error (FPE) F-test
Generalized cross validation (GCV) Hedonic price index
HQ criterion Joint significance Nodel in deviation form Multiple regression Omitted variable bias Restricted model
R2 adjusted for degrees of freedom
Specification error Unrestricted model Wald test
Bình phương R có hiệu chỉnh Tiêu chuẩn thơng tin Akaike (AIC) Đơn giản hóa mơ hình dựa liệu Sai số dự báo hữu hạn (FPE)
Kiểm định F-test
Tính hợp lệ chéo suy rộng (GCV) Chỉ số giá hưởng thụ
Tiêu chuẩn HQ Ý nghĩa liên kết Mơ hình dạng sai lệch Hồi quy bội
Thiên lệch biến bị loại bỏ Mơ hình giới hạn
Bình phương R có hiệu chỉnh bậc tự Sai số đặc trưng
(40)4.A PHỤ LỤC
Các Kết Quả Tính Tốn Khác 4.A.1 Mơ Hình Hồi Quy Ba Biến
Mơ hình hồi quy biến diễn tả mối quan hệ biến phụ thuộc Y với số hai biến độc lập X2, X3 Mơ hình thức cho sau:
Yt = 1 + 2Xt2 + 3Xt3 + ut (4.A.1) Lấy trung bình số hạng mơ hình, ta có được:
u X X
Y12 23 3 (4.A.2)
Lấy hiệu số với mơ hình (4.A.1), ta có mơ hình dạng sai lệch sau:
yt = 2Xt2 + 3Xt3 + et (4.A.3) Trong yt YtY, xt2 Xt2X2, xt3Xt3X3, et ut u Các ký tự dạng chữ thường diễn tả giá trị sai lệch biến với giá trị trung bình tương ứng biến Lợi điểm việc biểu diễn mơ hình dạng sai lệch cịn hai thơng số cần ước lượng (2 3) Nếu
1
, 2
, 3
giá trị ước lượng hệ số tương quan hồi qui, 1
được ước lượng sau:
3 2
1 Y ˆ X ˆ X
ˆ
giá trị ước lượng số dư
3 t t t
t Y ˆ ˆ X ˆ X
uˆ
Nguyên tắc OLS làm cực tiểu hoá tổng bình phương sai số ESS = uˆt2theo ˆ1, ˆ2, ˆ3 Điều tương đương với việc cực tiểu hố (khơng chứng minh)
2 t t t
t X )
ˆ X ˆ y ( eˆ
Cho đạo hàm phần theo ˆ2, ˆ3 đẳng thức 0, dễ dàng chứng minh điều kiện trở thành
xt2eˆt 0 xt2(ytˆ2xt2ˆ3xt3)
xt3eˆt 0 xt3(ytˆ2xt2ˆ3xt3)
Kết dẫn đến hai phương trình sau (bỏ qua số t nhỏ)
ˆ2 x22 ˆ3 x2x3 yx2 (4.A.4)
3
3 3
2 x x ˆ x yx
ˆ (4.A.5)
Dùng ký hiệu đơn giản hơn, hai phương trình viết lại sau:
2 y 23 22
2S ˆ S S
ˆ (4.A.6) y 33 23
2S ˆ S S
ˆ (4.A.7) Trong 2 t 2 t
22 x (X X )
S (4.A.8)
x x (X X )(X X )
(41)
3 t
3 t
33 x (X X )
S (4.A.10)
yx (Y Y)(X X )
Sy2 t t2 t t2 2 (4.A.11)
y x (Y Y)(X X )
Sy3 t t3 t t3 3 (4.A.12)
Lời giải cho phương trình (4.A.6) (4.A.7) sau
ˆ2 (Sy2S33 Sy3S23)/ (4.A.13)
ˆ3 (Sy3S22 Sy2S23)/ (4.A.14)
Với
2 23 33 22S S
S
(4.A.15)
Cách tính phương sai sđược trình bày phụ lục 5.A
4.A.2 Độ Thiên Lệch Do Việc Bỏ Qua Một Số Biến Liên Quan
Mơ hình ước lượng cho sau
Mơ hình đúng: Yt 12Xt23Xt3ut
Mơ hình ước lượng: Yt 12Xt2 vt
Các giá trị ước lượng theo phương pháp OLS thông số mơ hình ước lượng cho sau (xem phương trình 3.9 3.10)
22 y S /S
ˆ
ˆ1Yˆ2X2 (4.A.16)
Trong Sy2 S22 định nghĩa theo phương trình (4.A.11) (4.A.8) Giá trị kỳ vọng
2
cho E(Sy2) / S22 S22 khơng ngẫu nhiên:
(Y Y)(X X ) Y(X X ) Y(X X )
Sy2 t t2 2 t t2 2 t2 2
Yt(Xt2 X2)
Vì giá trị Y rút từ phép tính tổng (Xt2 X2)0 theo tính chất 2.A.4 Thay Yt từ mơ hình (vì q trình để tạo Yt):
(X X )( X X u)
Sy2 t2 2 1 2 t2 3 t3 t
02(Xt2 X2)Xt2 3(Xt2 X2)Xt3(Xt2 X2)ut
Số hạng zero rút từ tính chất 2.A.4 Số hạng thứ hai sau:
(Xt2 X2)Xt2 (Xt2X2)(Xt2X2X2)
(Xt2X2)2X2(Xt2X2)(Xt2X2)2
(42)
(Xt2 X2)Xt3 (Xt2 X2)(Xt3 X3)
Sử dụng kết này, ta có được:
t 2 t 3 t 2 t 2 t 2
y (X X ) (X X )(X X ) (X X )u
S
2 u 23 22
2S S S
Trong đó, việc ký hiệu số hạng S tương tự số hạng cho phương trình (4.A.8) phương trình (4.A.12) Vì X2 X3 không ngẫu nhiên không tương quan với u E(u) = nên ta có:
23 22 2 u 23 22 2
y ) S S E(S ) S S
S (
E
Theo sau đẳng thức trên, ta có:
22 23 2 S S ) ˆ ( E
Vì 30 nên ˆ2sẽ có sai số trừ S23 = – nghĩa trừ X2 X3 không tương quan Điều chứng minh cho phương trình 4.4a sử dụng mơ hình Độ sai số biến bị bỏ qua cho 3 (S23/S22) Hướng độ thiên lệch phụ thuộc vào giá trị âm hay dương 3 tương quan X2 X3 thuận hay nghịch Vì cỡ mẫu tăng lên cách không xác định nên ˆ2 không hội tụ 2 (nếu S23 0), giá trị ước lượng có khơng qn
Từ phương trình (4.A.16), ta có ˆ1 Yˆ2X2, E(ˆ1)E(Y)X2E(ˆ2) Vì
u X X
Y12 23 3 , nên suy E(Y)12X23X3 Thế giá trị kỳ vọng giá trị kỳ vọng ˆ2vào đẳng thức trên, ta có:
22 23 2 3 2 1 S S X X X ) ˆ ( E 22 23 3 S S X X
Lưu ý điều kiện cần đủ cho ˆ1không bị thiên lệch
S S X X 22 23
3
Điều kiện hai
biến X2 X3 không tương quan không đủ để bảo đảm cho giá trị ước lượng số hạng tung độ gốc khơng bị thiên lệch Ngồi ra, giá trị trung bình X3 phải zero Từ
giá trị ước lượng ˆ1 ˆ2, nhận thấy giá trị chịu phần ảnh
hưởng việc loại bỏ biến X3 Điểm nhận xét có ý nghĩa quan trọng nên nhấn mạnh Do hệ mà giá trị số học hệ số tương quan hồi quy khác so với phát biểu trước Điều vấn đề đặt cho hệ số tương quan không tác động trực tiếp biến tương ứng mà tác động biến bị lược bỏ có tương quan với biến xem xét
Tác giả Kamenta (1986, p 394) chứng minh S23 = giá trị phương sai ước lượng ˆ (s2 )
ˆ 2
bị thiên lệch theo phía dương Điều có nghĩa E(s2 )
ˆ
2
= Var (
2
ˆ
(43)4.A.3 Chứng Minh Tính Chất 4.4
Mơ hình ước lượng cho sau
Yt = 1 + 2Xt2 + 3Xt3 + vt
Từ phương trình (4.A.13) (4.A.14) – đề cập lại với (4.A.15) – giá trị ước lượng 2 3 theo phương pháp OLS là:
(S ) /
2 y2 33S S Sy3 23 (4.A.13)
(S ) /
3 y3 22S S Sy2 23 (4.A.14)
Trong
2 23 33 22S S
S
(4.A.15)
Để kiểm tra xem giá trị 2 có bị thiên lệch hay khơng, ta cần có giá trị kỳ vọng Sy2 Sy3 Mơ sau (dưới dạng độ lệch):
yt xt u ut
2
Thế giá trị yt từ mơ hình vào Sy2, ta có:
t t2 t2 2 t2 t 2 22 u2
2
y y x x ( x u u) S S
S
22 2 y ) S
S (
E
vì xt2 khơng ngẫu nhiên cho trước E(Su2) = Mơ hình phải sử dụng yt phát mơ hình khơng phải phương trình ước lượng Tương tự, ta có:
t t3 t3 2 t2 t 2 23 u3
3
y y x x ( x u u) S S
S
E(Sy3)2S23
Lấy giá trị kỳ vọng phương trình (4.A.13) (4.A.14) vào E(Sy2) E(Sy3), ta có được:
E( ) [2 S33 22 S S23 23 S ]/2
E( ) [3 S22 23 S S23 22 S ]/0
Suy ra, giá trị 2 không bị thiên lệch giá trị kỳ vọng 3 khơng Đó kết tích chất 4.5a Theo ngun tắc luật số đơng tính chất quán dễ dàng thiết lập
Tính toán phương sai 2
Bước tính tốn giá trị phương sai 2 Ta có:
(44)Trong việc đạo hàm vế trên, ta sử dụng tính chất khơng ngẫu nhiên biến S22 S33 Áp dụng tính chất 2.4a, ta có
2 y y 23 33
y
23 y
33
2) [S Var(S ) S Var(S ) 2S S Cov(S ,S )]/
ˆ (
Var
2 23 23 33 33 23 22 33
2[S S S S 2S S S ]/
) S / S ( S S S S
S
33 23 22
2
2 23 33 22
33
Do r2 S232 / (S22 33S )(r2 bình phương giá trị tương quan đơn biến x2 x3), phương trình rút gọn lại sau:
Var
S r
( )
( )
2 2 22