Suy diễn thống kê trong mô hình hồi quy gồm 2 vấn đề: Kiểm định giả thuyết về tham số tổng thể Xây dựng các khoảng tin cậy Ước lượng OLS là các biến ngẫu nhiên Chúng ta đã biết về kỳ vọng và phương sai của các ước lượng này Tuy nhiên, chúng ta cần biết về phân phối của chúng để kiểm định giả thuyết thống kê Để suy luận về phân phối, chúng ta cần thêm giả thiế
Phân tích hồi quy bội: Vấn đề suy diễn thống kê Chương Wooldridge: Introductory Econometrics: A Modern Approach, 5e © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội Vấn đề suy diễn Suy diễn thống kê mơ hình hồi quy gồm vấn đề: Kiểm định giả thuyết tham số tổng thể Xây dựng khoảng tin cậy Phân phối mẫu ước lượng OLS Ước lượng OLS biến ngẫu nhiên Chúng ta biết kỳ vọng phương sai ước lượng Tuy nhiên, cần biết phân phối chúng để kiểm định giả thuyết thống kê Để suy luận phân phối, cần thêm giả thiết © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội Vấn đề suy diễn Giả thiết MLR.6 (Phân phối chuẩn sai số) độc lập với biến Giả sử phần sai số hồi quy tổng thể có phân phối chuẩn Dạng phân phối phương sai không phụ thuộc vào biến giải thích Suy ra: © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội Vấn đề suy diễn Thảo luận giả thiết phân phối chuẩn Phần sai số xem tổng „nhiều“ yếu tố không quan sát Tổng yếu tố độc lập có phân phối chuẩn(CLT) Tuy nhiên, vấn đề nảy sinh: • Có yếu tố khơng quan sát được? Có đủ lớn khơng? • Có thể phân phối yếu tố khơng đồng với • Các yếu tố độc lập với mức nào? Phân phối sai số vấn đề thuộc thực nghiệm Trong nhiều trường hợp, tính chuẩn khơng đảm bảo © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội Vấn đề suy diễn Thảo luận giả thiết phân phối chuẩn (tt) Ví dụ trường hợp mà giả thiết tính chuẩn khơng thể thỏa mãn: • Tiền lương (khơng âm, thường phải lớn tiền lương tối thiểu) • Số lần bắt giữ (chỉ nhận vài giá trị nguyên không âm) • Thất nghiệp (xét trường hợp biến giả, nhận giá trị 1) Trong vài trường hợp, phân phối chuẩn đạt thơng qua việc biến đổi dạng biến phụ thuộc (chẳng hạn dùng log(wage) thay cho wage) Dưới giả thiết phân phối chuẩn, OLS ước lượng không chệch tốt (kể ước lượng phi tuyến) Quan trong: Với mục đích suy diễn thống kê, giả thiết phân phối chuẩn thay cỡ mẫu lớn © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội Vấn đề suy diễn Một số thuật ngữ „các giả thiết Gauss-Markov“ Các giả thiết „mơ hình hồi quy tuyến tính cổ điển (CLM) “ Định lý 4.1 (Phân phối chuẩn mẫu) Dưới giả thiết MLR.1 – MLR.6: Các ước lượng OLS có phân phối mẫu với phương sai thiết lập chương trước Ước lượng chuẩn hóa tuân theo phân phối chuẩn tắc © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội Vấn đề suy diễn Định lý 4.1 (phân phối t cho ước lượng chuẩn hóa) Dưới giả thiết MLR.1 – MLR.6: Nếu việc chuẩn hóa thực dùng độ lệch chuẩn ước lượng (nghĩa dùng sai số chuẩn), phân phối chuẩn tắc thay phân phối t Lưu ý: (k+1) số tham số mơ hình hồi quy Phân phối t gần với phân phối chuẩn tắc bậc tự n-k-1 lớn Kiểm định giả thuyết tham số tổng thể 2.1.Giả thuyết khơng có dạng Tham số tổng thể 0, nghĩa sau kiểm soát biến độc lập khác, xj khơng tác động đến y © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội Vấn đề suy diễn Thống kê t (hay tỷ số t) Thống kê t sử dụng để kiểm định giả thuyết không đề cập Hệ số ước lượng xa giá trị giả thuyết khơng khả Nhưng gọi „xa“ giá trị 0? Điều phụ thuộc vào biến thiên hệ số ước lượng được, nghĩa phụ thuộc vào độ lệch chuẩn hệ số Thống kê đo lường xem liệu khoảng cách từ hệ số ước lượng đến giá trị lần độ lệch chuẩn Phân phối thống kê t giả thuyết không Mục tiêu: xác định quy tắc bác bỏ cho H0 khả H0 bị bác bỏ nhỏ (= mức ý nghĩa, ví dụ 5%) © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội : Vấn đề suy diễn Kiểm định với giả thuyết đối phía (lớn 0) Kiểm định Nếu t ˆ t( nk 1) j với giả thuyết đối bác bỏ H0 Giải thích: Bác bỏ giả thuyết không ủng hộ giả thuyết đối phía hệ số hồi quy ước lượng lớn (cụ thể lớn giá trị tới hạn) Xây dựng giá trị tới hạn cho, giả thuyết khơng khả giả thuyết không bị bác bỏ, chẳng hạn, 5% tổng số trường hợp Trong ví dụ cho, giá trị phân phối t với 28 bậc tự mà 5% số trường hợp lớn giá trị ! Bác bỏ thống kê t lớn 1.701 © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội Vấn đề suy diễn Ví dụ: Phương trình tiền lương Kiểm định liệu sau kiểm soát biến học vấn thâm niên, công nhân nhiều kinh nghiệm làm việc có nhận tiền lương cao hay khơng Sai số chuẩn Kiểm định với giả thuyết đối Người ta kỳ vọng tác động dương kinh nghiệm đến tiền lượng không tác động © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội Vấn đề suy diễn Khơng thể tính tốn với kết hồi quy bình thường Khơng có sẵn kết hồi quy thơng thường Cách làm khác Tính kiểm định Thêm đại lượng vào hàm hồi quy ban đầu với Biến độc lập (= tổng số năm học hai hệ) © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội Vấn đề suy diễn Kết ước lượng Tổng số năm học Giả thuyết bị bác bỏ mức ý nghĩa 10% không bị bác bỏ 5% Cách làm áp dụng với giả thuyết tuyến tính đơn © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội Vấn đề suy diễn Kiểm định nhiều ràng buộc tuyến tính (ràng buộc tuyến tính bội): Kiểm định F 3.1.Kiểm định ràng buộc loại trừ Tiền lương cầu thủ bóng chày giải nhà nghề Điểm đánh bóng trung bình Số năm thi đấu chun nghiệp Số trận tham gia thi đấu trung bình năm Số lần đánh bóng ghi điểm trực tiếp trung bình năm Số lần đánh bóng ghi điểm năm Kiểm định việc đại lượng đo lường hiệu thi đấu cầu thủ không tác động đến tiền lương Nếu H0 mơ hình gán ràng bc (r) là: © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội Vấn đề suy diễn Ước lượng mơ hình chưa gán ràng buộc (ur) Khơng có biến số biến có ý nghĩa thống kê kiểm định đơn lẻ Gợi ý : Mức độ phù hợp mơ hình biến bị loại bỏ khỏi mơ hình? © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội Vấn đề suy diễn Ước lượng mơ hình gán ràng buộc (r) RSS tăng lên, liệu gia tăng có ý nghĩa thống kê hay không? Thống kê kiểm định Số ràng buộc SSRr SSR mơ hình r SSRur : SSR mơ hình ur Sự tăng lên tương đối tổng bình phương phần dư từ H1 đến H0 tuân theo phân phối F (nếu H0 ) © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội Vấn đề suy diễn Cách viết khác F (ur) (r) có dạng biến phụ thuộc: Quy tắc bác bỏ: F R ur Rr2 / q 1 R / n k 1 ur SSRr : SSR mơ hình r SSRur : SSR mơ hình ur F > Fα (q, n-k-1) hay P(F- stat > F) ≤ α bác bỏ H0 Một biến ngẫu nhiên có phân phối F nhận giá trị dương Điều tương ứng với việc tổng bình phương phần dư tăng thêm từ H1 đến H0 Chọn giá trị tới hạn cho giả thuyết không bị bác bỏ, ví dụ, 5% số trường hợp © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội Vấn đề suy diễn Kiểm định vấn đề ví dụ Số ràng buộc cần kiểm định Bậc tự mơ hình chưa gán ràng buộc Ký hiệu : c0.01 giá trị tới hạn mức 1% Ký hiệu khác : Fα Giá trị tới hạn mức α thống kê F với bậc tự và 347 Bằng chứng bác bỏ giả thuyết khơng mạnh (thậm chí mức ý nghĩa nhỏ) Thảo luận Ba biến kiểm định „có ý nghĩa đồng thời“ Chúng khơng có ý nghĩa kiểm định riêng lẻ biến Có thể có đa cộng tuyến chúng © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội Vấn đề suy diễn 3.2 Kiểm định ý nghĩa (tồn cục) mơ hình hồi quy Giả thuyết khơng phát biểu biến giải thích hồn tồn khơng có tác dụng giải thích cho biến phụ thuộc, tức mơ hình khơng có ý nghĩa Mơ hình gán ràng buộc (hồi quy với hệ số chặn) Kiểm định ý nghĩa (tồn cục) mơ hình hồi quy trình bày hầu hết phần mềm hồi quy Giả thuyết khơng thường bị bác bỏ © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội Vấn đề suy diễn 3.3 Kiểm định ràng buộc tuyến tính tổng quát với kiểm định F Ví dụ: Kiểm định hợp lý việc định giá nhà Giá nhà thực tế Giá dự kiến (giá định trước nhà bán) Chiều dài Kích thước lơ đất (in feet) Số phịng ngủ Nếu nhà định giá hợp lý, 1% thay đổi giá dự kiến tương ứng với 1% thay đổi giá thực tế Hơn nữa, yếu tố khác thiết khơng có tác động đến giá thực tế kiểm sốt giá dự kiến © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội Vấn đề suy diễn Mơ hình chưa gán ràng buộc Mơ hình gán ràng buộc Mơ hình gán ràng buộc thực chất mơ hình hồi quy [y-x1] theo số Thống kê kiểm định Không thể bị bác bỏ © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội Vấn đề suy diễn Kết hồi quy mơ hình chưa gán ràng buộc When tested individually, there is also no evidence against the rationality of house price assessments Kiểm định F áp dụng với dạng tổng quát giả thuyết bội tuyến tính Với tất kiểm định khoảng tin cậy, giả thiết MLR.1 – MLR.6 giả định thoả mãn; không kiểm định khơng đáng cậy © 2013 Cengage Learning All Rights Reserved.tin May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội Vấn đề suy diễn > res.ur library(car) > # F test > H0 linearHypothesis(res.ur,H0) kiểm định nhiều ràng buộc Linear hypothesis test đồng thời kết kiểm định Cụ thể: H0: βeudc = 0.01, βeuxper = Hypothesis: educ = 0.1 exper = Model 1: restricted model Model 2: log(wage) ~ educ + exper + tenure Res.Df 524 522 RSS 103.30 101.46 Df Sum of Sq F 2 1.8399 4.7332 Signif codes: ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ Pr(>F) 0.00918 ** © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội: Tính tiệm cận OLS Kiểm định phân phối chuẩn: Có nhiều cách kiểm định phân phối chuẩn chuỗi liệu, số dùng thống kê kiểm định Jarque- Bera Để xem u phân phối chuẩn hay không, dùng liệu phần dư để tiến hành kiểm định H0: u phân phối chuẩn - Tính thống kê JB (các phần mềm tính sẵn) - Nếu JB > χ2α(2) hay p(JB) ≤ α bác bỏ H0 Chú ý: R có sẵn thủ tục kiểm định JB, nằm gói lệnh normtest Ví dụ: Cho mơ hình log(wage) = β0 + β1 educ+ β2 exper + u Dùng data file wage2 xem u có phân phối chuẩn hay khơng ? © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội: Tính tiệm cận OLS > library(foreign) > wage2 ketqua phandulibrary(normtest) # lệnh kiểm định Jarque- Bera xem phần dư có phân phối chuẩn hay khơng > jb.norm.test(phandu) Jarque-Bera test for normality data: phandu JB = 38.593, p-value < 2.2e-16 Theo kết R, ta có p- value nhỏ nên bác bỏ H0 Vậy u phân phối chuẩn © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part Phân tích hồi quy bội: Tính tiệm cận OLS Ngồi JB, cịn có cách kiểm định phân phối chuẩn khác R: # Kiem dinh Shapiro-Wilk >shapiro.test(phandu) Shapiro-Wilk normality test data: phandu W = 0.99053, p-value = 1.015e-05 # Kiem dinh Anderson-Darling >library(nortest) > ad.test(phandu) Anderson-Darling normality test data: phandu A = 2.2174, p-value = 1.257e-05 # Kiem dinh Kolmogorov-Smirnov > lillie.test(phandu) Lilliefors (Kolmogorov-Smirnov) normality test data: phandu = 0.040784, p-value = 0.0008911 © 2013 Cengage Learning All Rights Reserved May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part