Bài giảng Kinh tế lượng - Chương 5: Phân tích hồi quy bội - Tính tiệm cận của OLS trình bày tính vững, tính tiệm cận chuẩn và suy luận trên mẫu lớn. Đây là một tài liệu tham khảo hữu ích dành cho các bạn sinh viên đang theo học và những ai quan tâm dùng làm tài liệu học tập và nghiên cứu.
Chương - Nhập môn Kinh tế lượng * Jeffrey M Wooldridge 02.01.2018 PHÂN TÍCH HỒI QUY BỘI: TÍNH TIỆM CẬN CỦA OLS Phân tích hồi quy bội: Tính tiệm cận OLS Giả thiết MLR.6 mơ hình tuyến tính cổ điển: sai số ngẫu nhiên u có phân phối chuẩn độc lập với biến giải thích Chương Điều cho phép ta rút phân phối mẫu xác ước lượng OLS (có điều kiện theo biến giải thích mẫu) Định lý 4.1 chứng tỏ ước lượng OLS mẫu có phân phối chuẩn, từ suy phân phối cho thống kê t F Wooldridge: Introductory Econometrics: A Modern Approach, 5e Nếu sai số u khơng có phân phối chuẩn thống kê t khơng xác phân phối t, thống kê F khơng xác phân phối F với cỡ mẫu © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội: Tính tiệm cận OLS PHÂN TÍCH HỒI QUY BỘI: TÍNH TIỆM CẬN CỦA OLS Cho đến tập trung vào tính chất OLS cho mẫu (hữu hạn) Các tính chất OLS cho mẫu/cỡ mẫu Giá trị kỳ vọng/tính khơng chệch giả thiết MLR.1 – MLR.4 Tính khơng chệch ước lượng, quan trọng, lúc đạt Các ước lượng OLS khơng chệch giả thiết từ MLR.1 đến MLR.4 thỏa Công thức phương sai giả thiết MLR.1 – MLR.5 Trong Phần sách này, gặp vài trường hợp ước lượng bị chệch hữu dụng Phân phối mẫu xác / kiểm định KTC giả thiết MLR.1 – MLR.6 Gần tất nhà kinh tế học đồng ý tính vững yêu cầu tối thiểu cần có ước lượng Định lý Gauss-Markov giả thiết MLR.1 – MLR.5 Các tính chất OLS với mẫu lớn (tính tiệm cận) Tính vững giả thiết MLR.1 – MLR.4 Mặc dù giả định nhiễu tính chuẩn! Tính tiệm cận chuẩn/kiểm định giả thiết MLR.1 – MLR.5 © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part https://sites.google.com/a/ueh.edu.vn/phamtricao/ Không phải tất ước lượng hữu dụng không chệch Chương - Nhập môn Kinh tế lượng * Jeffrey M Wooldridge 02.01.2018 Phân tích hồi quy bội: Tính tiệm cận OLS PHÂN TÍCH HỒI QUY BỘI: TÍNH TIỆM CẬN CỦA OLS Trường hợp đặc biệt mơ hình hồi quy đơn 5.1 Tính vững Một ước lượng g gọi vững cho tham số tổng thể Ký hiệu thay thế: Với Ước lượng hội tụ theo xác suất Giải thích: 5.2 tới giá trị tổng thể Tính vững có nghĩa xác suất mà ước lượng gần với giá trị thực tổng thể thực cao cách tùy ý cách gia tăng cỡ mẫu Tính vững yêu cầu tối thiểu ước lượng hợp lý © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội: Tính tiệm cận OLS Phân tích hồi quy bội: Tính tiệm cận OLS Định lý 5.1 (Tính vững OLS) Với tính vững OLS, có giả thiết yếu MLR.4‘ cần thiết Tính tiệm cận tương tự chệch biến bị bỏ sót Trường hợp đặc biệt mơ hình hồi quy đơn Giả định MLR.4‘ Mơ hình 5.3 Ta thấy ước lượng hệ số góc vững biến giải thích ngoại sinh, nghĩa không tương quan với sai số: Cov(x1,u) = Tất biến giải thích phải khơng tương quan với sai số Giả định yếu so với giả định kỳ vọng có điều kiện MLR.4 Giả thiết MLR.4 suy giả thiết MLR.4' © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part https://sites.google.com/a/ueh.edu.vn/phamtricao/ Lỗi định mơ hình (bỏ sót biến x2) Chệch (phần khơng vững) Khơng có chệch bỏ sót biến biến bỏ sót khơng thích hợp khơng tương quan với biến bao gồm © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Chương - Nhập môn Kinh tế lượng * Jeffrey M Wooldridge 02.01.2018 Phân tích hồi quy bội: Tính tiệm cận OLS Phân tích hồi quy bội: Tính tiệm cận OLS 5.2 Tính tiệm cận chuẩn suy luận mẫu lớn Hệ thực hành Trong thực hành, giả định tính chuẩn MLR.6 thường có vấn đề Với mẫu lớn, phân phối t tiến tới phân phối chuẩn tắc N(0,1) Nếu MLR.6 không đúng, kết kiểm định t F sai Như hệ quả, kiểm định t có hiệu lực với mẫu lớn mà khơng có MLR.6 May thay, kiểm định F t hiệu lực cỡ mẫu đủ lớn Ngoài ra, ước lượng OLS xấp xỉ phân phối chuẩn với mẫu lớn khơng có MLR.6 (theo định lý giới hạn trung tâm) Định lý 5.2 (Tính tiệm cận chuẩn OLS) 5.7 Quan trọng: MLR.1 – MLR.5 cần thiết, đặc biệt giả thiết phương sai khơng đổi Phân tích tiệm cận phương sai ước lượng OLS Dưới giả định MLR.1 – MLR.5: Với mẫu lớn, ước lượng chuẩn hóa có phân phối xấp xỉ chuẩn tắc Tương tự cho ước lượng khoảng tin cậy kiểm định F Ngồi Phân tích hồi quy bội: Tính tiệm cận OLS © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part PHÂN TÍCH HỒI QUY BỘI: TÍNH TIỆM CẬN CỦA OLS • Tập tin bwght.wf1 Dependent Variable: LOG(BWGHT) Method: Least Squares Sample: 1388 Included observations: 1388 Phân tích tiệm cận phương sai ước lượng OLS (tt) co lại với tốc độ 5.10 Đây lý mẫu lớn tốt Ví dụ 5.2: Sai số chuẩn phương trình cân nặng sinh Chỉ sử dụng nửa đầu quan sát © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part https://sites.google.com/a/ueh.edu.vn/phamtricao/ Hội tụ tới Hội tụ tới số cố định nằm Hội tụ tới © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part co lại với tốc độ 5.9 Variable C CIGS LOG(FAMINC) R-squared Adjusted R-squared S.E of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic) Coefficient 4.718594 -0.004082 0.016266 0.025759 0.024352 0.188326 49.12154 349.3905 18.30997 0.000000 Std Error 0.018244 0.000858 0.005583 t-Statistic 258.6311 -4.755904 2.913266 Mean dependent var S.D dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter Durbin-Watson stat Prob 0.0000 0.0000 0.0036 4.760031 0.190662 -0.499122 -0.487806 -0.494890 1.926523 12 Chương - Nhập môn Kinh tế lượng * Jeffrey M Wooldridge 02.01.2018 PHÂN TÍCH HỒI QUY BỘI: TÍNH TIỆM CẬN CỦA OLS CÁC KIỂM ĐỊNH KHÁC VỚI M ẪU LỚN: THỐNG KÊ NHÂN TỬ LAGRANGE (LM) • Thống kê phù hợp với mẫu lớn mà không cần giả thiết phân phối chuẩn Dependent Variable: LOG(BWGHT) Method: Least Squares Sample: 694 Included observations: 694 Variable • Ta dùng thống kê nhân tử Lagrange (LM) thực kiểm định ràng buộc loại bỏ biến Coefficient C CIGS LOG(FAMINC) 4.705583 -0.004637 0.019404 R-squared Adjusted R-squared S.E of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic) 0.029546 0.026738 0.196123 26.57871 147.2961 10.51908 0.000032 Std Error t-Statistic 0.027053 0.001332 0.008188 173.9394 -3.481208 2.369753 Mean dependent var S.D dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter Durbin-Watson stat Prob 5.11 0.0000 0.0005 0.0181 Kiểm định xem liệu q biến cuối có tham số tổng thể đồng thời hay khơng 4.757701 0.198798 -0.415839 -0.396203 -0.408245 1.859228 5.12 • 0.000858/0.001332 = 0.644144 • 694/1388 = 0.5 13 H1: H0 sai 14 CÁC KIỂM ĐỊNH KHÁC VỚI M ẪU LỚN: THỐNG KÊ NHÂN TỬ LAGRANGE (LM) CÁC KIỂM ĐỊ NH KHÁC VỚI MẪU L ỚN: THỐNG KÊ NHÂN TỬ LAGRANGE (LM) • Thống kê LM yêu cầu ước lượng mô hình gán ràng buộc • VD 5.3: Mơ hình kinh tế tội phạm • B1) Ta thực hồi quy 5.13 B2) Chạy hồi quy phụ: ta thu Ru u theo x1, x2,…, xk B3) Tính LM nRu2 5.14 B4) Với mức ý nghĩa , tra giá trị tới hạn ( q ) có phân phối Chi bình phương với q bậc tự Nếu LM > ( q ) : bác bỏ H0 H0: β2=0 , β3=0 Hoặc: p value P( ( q ) LM ) p-value < mức ý nghĩa (0,05) : bác bỏ H0 https://sites.google.com/a/ueh.edu.vn/phamtricao/ H1: H0 sai 15 16 Chương - Nhập môn Kinh tế lượng * Jeffrey M Wooldridge 02.01.2018 CÁC KIỂM ĐỊNH KHÁC VỚI M ẪU LỚN: THỐNG KÊ NHÂN TỬ LAGRANGE (LM) CÁC KIỂM ĐỊNH KHÁC VỚI M ẪU LỚN: THỐNG KÊ NHÂN TỬ LAGRANGE (LM) Dependent Variable: UNGA Method: Least Squares Included observations: 2725 • Tập tin crime1.wf1 Dependent Variable: NARR86 Method: Least Squares Included observations: 2725 Variable C PCNV PTIME86 QEMP86 R-squared Adjusted R-squared S.E of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic) Coefficient Lệnh Genr: unga=resid 0.711772 -0.149927 -0.034420 -0.104113 0.041323 0.040266 0.841603 1927.273 -3394.689 39.09581 0.000000 Variable Coefficient Std Error Std Error 0.033007 0.040865 0.008591 0.010388 t-Statistic 21.56453 -3.668819 -4.006509 -10.02274 Mean dependent var S.D dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter Durbin-Watson stat C PCNV PTIME86 QEMP86 AVGSEN TOTTIME Prob 0.0000 0.0002 0.0001 0.0000 R-squared 0.001494 0.404404 0.859077 2.494450 2.503126 2.497586 1.836205 C PCNV AVGSEN TOTTIME PTIME86 QEMP86 R-squared 0.706061 -0.151225 -0.007049 0.012095 -0.039259 -0.103091 0.042755 Prob 0.8632 0.9747 0.5874 0.9217 0.5702 0.2067 Mean dependent var -5.00E-17 Ta có LM < 0.1 (2) : chấp nhận H0 Hoặc: p-value = P(2(2) > 4.071) 0.1308 Ta có p-value > 0.1 : chấp nhận H0 18 CÁC KIỂM ĐỊNH KHÁC VỚI M ẪU LỚN: THỐNG KÊ NHÂN TỬ LAGRANGE (LM) • Dùng Wald Test: Coefficient t-Statistic -0.172259 -0.031749 -0.542651 0.098304 -0.567879 1.262977 CÁC KIỂM ĐỊ NH KHÁC VỚI MẪU L ỚN: THỐNG KÊ NHÂN TỬ LAGRANGE (LM) Variable 0.033152 0.040855 0.008917 0.010397 0.012412 0.009577 LM = 2725*0.001494 = 4.071 Với mức ý nghĩa 10% bật tự q = ta có 0.1 (2) = 4.61 17 Dependent Variable: NARR86 (EQ03) Method: Least Squares Included observations: 2725 -0.005711 -0.001297 -0.004839 0.001022 -0.007049 0.012095 • Dùng Wald Test: Wald Test: Equation: EQ03 Std Error 0.033152 0.040855 0.012412 0.009577 0.008917 0.010397 t-Statistic 21.29742 -3.701493 -0.567879 1.262977 -4.402863 -9.915238 Mean dependent var Test Statistic Prob F-statistic Chi-square 0.0000 0.0002 0.5702 0.2067 0.0000 0.0000 Value 2.033922 4.067843 Null Hypothesis: C(3)=0, C(4)=0 Null Hypothesis Summary: Normalized Restriction (= 0) C(3) C(4) 0.404404 df Probability Value Std Err -0.007049 0.012095 0.012412 0.009577 (2, 2719) Restrictions are linear in coefficients 19 https://sites.google.com/a/ueh.edu.vn/phamtricao/ p-value = 0,1308 > 0,1 : chấp nhận H0 0.1310 0.1308 20 Chương - Nhập môn Kinh tế lượng * Jeffrey M Wooldridge 02.01.2018 CÁC KIỂM ĐỊNH KHÁC VỚI M ẪU LỚN: THỐNG KÊ NHÂN TỬ LAGRANGE (LM) CÁC KIỂM ĐỊNH KHÁC VỚI M ẪU LỚN: THỐNG KÊ NHÂN TỬ LAGRANGE (LM) Trong EVIEWS: Cách tính phân vị p-value tính theo phía trái, ngược với Excel, tính theo phía phải Xác định phân vị 2 ( df ) sau: @qchisq(xác suất, bậc tự do) Thí dụ: Trong EXCEL: Xác định phân vị 2 ( df ) sau: =CHIINV(xác suất, bậc tự do) Thí dụ: =CHIINV(0.05,8) cho ta 0,05 (8) = 15.5073 Xác định p-value = P( @qchisq(0.95,8) cho ta công thức: scalar a=@qchisq(0.95,8) show a 0) =CHIDIST( 0 , bậc tự do) Thí dụ: =CHIDIST(15.5073, 8) cho kết p-value = P( >15.5073) = 0.05 Xác định p-value = P( 2 0,05 (8) = 15.5073 02 ) công thức: @chisq( bậc tự do) Thí dụ: @chisq(15.5073, 8) cho kết 0, p-value = P( >15.5073) = 0.05 21 scalar b=@chisq(15.5073,8) show b DÙNG KIỂM ĐỊNH F HAY KIỂM ĐỊNH LM? LƯU Ý: • Kiểm định F: • Log(x) = ln(x) – Nếu nhiễu u có phân phối chuẩn: 22 • Exp(x) = e^x (e mũ x) • 2.1E+5 = 2,1*105 Dùng với cỡ mẫu nhỏ hay lớn – Nếu nhiễu u khơng có phân phối chuẩn: • 4.5E-3 = 4,5*10-3 • Nếu câu hỏi kiểm định cho mức ý nghĩa không thông dụng (3,5%, 7,1%,…) nên suy nghĩ dùng phương pháp kiểm định Chỉ dùng cỡ mẫu lớn • Kiểm định LM: – Khơng quan tâm nhiễu u có phân phối chuẩn hay không – Chỉ dùng cỡ mẫu lớn 23 https://sites.google.com/a/ueh.edu.vn/phamtricao/ 24 Chương - Nhập môn Kinh tế lượng * Jeffrey M Wooldridge 02.01.2018 Mời ghé thăm trang web: 25 https://sites.google.com/a/ueh.edu.vn/phamtricao/ https://sites.google.com/site/phamtricao/ https://sites.google.com/a/ueh.edu.vn/phamtricao/ ... 0.0000 R-squared 0.001494 0.404404 0. 859 077 2.494 450 2 .50 3126 2.49 758 6 1.8362 05 C PCNV AVGSEN TOTTIME PTIME86 QEMP86 R-squared 0.706061 -0 . 151 2 25 -0 .007049 0.0120 95 -0 .039 259 -0 .103091 0.042 755 Prob... kết p-value = P( > 15. 5073) = 0. 05 Xác định p-value = P( 2 0, 05 (8) = 15. 5073 02 ) cơng thức: @chisq( bậc tự do) Thí dụ: @chisq( 15. 5073, 8) cho kết 0, p-value = P( > 15. 5073) = 0. 05. .. Test: Coefficient t-Statistic -0 .172 259 -0 .031749 -0 .54 2 651 0.098304 -0 .56 7879 1.262977 CÁC KIỂM ĐỊ NH KHÁC VỚI MẪU L ỚN: THỐNG KÊ NHÂN TỬ LAGRANGE (LM) Variable 0.033 152 0.040 855 0.008917 0.010397