Bài giảng Kinh tế lượng - Chương 6: Hiện tượng đa cộng tuyến cung cấp cho người học các kiến thức: Bản chất, nguyên nhân của đa cộng tuyến; ước lượng các tham số, hậu quả, phát hiện đa cộng tuyến, khắc phục đa cộng tuyến. Mời các bạn cùng tham khảo.
Thu nhập Sự giàu có Chi tiêu 80 810 70 100 1009 65 120 1273 90 140 1425 95 160 1633 110 180 1876 115 200 2052 120 220 2201 140 240 2435 155 260 2686 150 CHƯƠNG HIỆN TƯỢNG ĐA CỘNG TUYẾN (MULTICOLLINEARITY) Nguồn: Ramu Ramanathan 4 ĐA CỘNG TUYẾN Hiểu chất hậu đa cộng tuyến MỤC TIÊU Biết cách phát đa cộng tuyến biện pháp khắc phục 2 NỘI DUNG Bản chất, nguyên nhân đa cộng tuyến Ước lượng tham số Hậu Phát đa cộng tuyến Khắc phục đa cộng tuyến 3 6 6.1 Bản chất đa cộng tuyến VD X2 10 15 18 24 30 X3 50 75 90 120 150 X*3 V 52 75 97 129 152 X3i = 5X2i, có cộng tuyến hoàn hảo X2 X3 ; r23 = X2 X3* khơng có cộng tuyến hồn hảo, hai biến có tương quan chặt chẽ 7 10 10 6.1 Bản chất đa cộng tuyến 6.1 Bản chất đa cộng tuyến Khi lập mô hình hồi quy bội Yˆi ˆ1 ˆ X i ˆ3 X 3i ˆ k X ki Có phụ thuộc tuyến tính cao biến giải thích gọi đa cộng tuyến a Đa cộng tuyến hoàn hảo Tồn 2, 3,… k không đồng thời cho 2X2 + 3X3 + …+ kXk = Nói cách khác xảy trường hợp biến giải thích biểu diễn dạng tổ hợp tuyến tính biến lại Hình 6.1 Biểu đồ Venn mô tả tượng đa cộng tuyến 11 11 6.1 Bản chất đa cộng tuyến 6.1 Bản chất đa cộng tuyến b Đa cộng tuyến khơng hồn hảo 2X2 + 3X3 + …+ kXk + vi= Với vi sai số ngẫu nhiên ta có tượng đa cộng tuyến khơng hồn hảo biến giải thích Nói cách khác biến giải thích có tương quan với số biến giải thích khác Hình 6.1 Biểu đồ Venn mô tả tượng đa cộng tuyến 9 12 12 6.1 Nguyên nhân đa cộng tuyến 6.2 Ước lượng tham số có đa cộng tuyến Một số nguyên nhân gây tượng đa cộng tuyến - Khi chọn biến độc lập mối quan có quan hệ nhân hay có tương quan cao đồng phụ thuộc vào điều kiện khác - Khi số quan sát nhỏ số biến độc lập - Cách thu thập mẫu: mẫu không đặc trưng cho tổng thể - Chọn biến Xi có độ biến thiên nhỏ ˆ ˆ2 3i y x x y x x x x ( x x ) i 2i 2i i 3i 3i 2i 2i x3 i 3i yi x3i x32i yi x3i x3i x3i 2 x32i x32i 2 x32i x32i Các hệ số ước lượng không xác định: không tách rời tác động biến Xi lên Y giả định X2 thay đổi X3 không đổi 16 13 13 16 6.2 Ước lượng có đa cộng tuyến 6.2 Ước lượng tham số có đa cộng tuyến Trường hợp có đa cộng tuyến hồn hảo Xét mơ hình hồi qui biến dạng sau: Yi = 2 X2i + 3 X3i + ei giả sử X3i = X2i, mơ hình biến đổi thành: Yi = (2+ 3)X2i + ei = 0 X2i + ei Phương pháp OLS ˆo ( ˆ2 ˆ3 ) x2 i yi x 2i Trường hợp có đa cộng tuyến khơng hồn hảo • Đa cộng tuyến hồn hảo thường khơng xảy thực tế • Xét mơ hình hồi qui biến dạng sau: yi = 2 x2i + 3 x3i + ei Giả định x3i = x2i + vi Với vi sai số ngẫu nhiên • Trong trường hợp này, hệ số hồi qui 2 3 ước lượng được: ˆ2 , ˆ3 Khơng thể tìm lời giải cho 14 14 17 17 6.2 Ước lượng có đa cộng tuyến ˆ ˆ2 3i 6.2 Ước lượng tham số có đa cộng tuyến y x x y x x x x ( x x ) i 2i 2i i 3i 3i 2i 2i x3 i 3i yi x3i x32i yi x3i x3i x3i 2 x32i x32i 2 x32i x32i Ta ước lượng ˆ s.e lớn Các hệ số ước lượng không xác định Phương sai sai số chuẩn 2 3 vô hạn 15 15 18 18 6.3 Hậu đa cộng tuyến 6.3 Hậu đa cộng tuyến Nếu có cộng tuyến gần hồn hảo: • Nếu có cộng tuyến gần hồn hảo: Các ước lượng BLUE, nhưng: Tỉ số t "khơng có ý nghĩa" Phương sai hiệp phương sai ước lượng OLS lớn Khi kiểm định giả thuyết H0: 2 = 0, sử dụng tỷ số t t r23 hệ số tương quan X2 X3 ˆ se ( ˆ ) so sánh giá trị ước lượng t với giá trị tra bảng (tới hạn) t Trong trường hợp cộng tuyến cao sai số chuẩn lớn làm cho giá trị t nhỏ đi, kết làm tăng chấp nhận giả thuyết H0 Khi r23 1, giá trị 19 19 22 22 6.3 Hậu đa cộng tuyến 6.3 Hậu đa cộng tuyến Nếu có cộng tuyến gần hồn hảo: Nếu có cộng tuyến gần hoàn hảo: Khoảng tin cậy rộng R2 cao tỉ số t có ý nghĩa Khoảng tin cậy 2 3 (với độ tin cậy – ) là: ^ ^ 2 = t /2 se ( 2); ^ ^ 3 = t /2 se ( 3); đó: ^ ^ se ( 2) = se ( 3) = 2 2 • • (1 r23)x2i (1 r23)x3i Đa cộng tuyến cao: • - tham số tương quan (hệ số góc riêng) khơng có ý nghĩa mặt thống kê • - R2 trường hợp lại cao (trên 0,9) • - kiểm định F bác bỏ giả thuyết cho 2 = 3 = … = k = 20 20 23 23 6.3 Hậu đa cộng tuyến Nếu có cộng tuyến gần hồn hảo: Giá trị r23 Khoảng tin cậy 95% B2 ˆ2 1.96* 1.33* A 0.5 0.995 ˆ2 1.96* 100* A 0.999 ˆ2 1.96* 500* A A Dấu ước lượng hệ số hồi qui sai ˆ2 1.96* 10.26 * A 0.95 21 Các ước lượng OLS sai số chuẩn chúng trở nên nhạy với thay đổi nhỏ liệu ˆ2 1.96* A Thêm vào hay bớt biến cộng tuyến với biến khác, mơ hình thay đổi dấu thay đổi độ lớn ước lượng 2 x 2i 21 24 24 Ví dụ: Bảng nhập sai số liệu nên xảy đa cộng tuyến Bảng Y X2 X3 12 16 Bảng Y X2 6.4 Cách phát đa cộng tuyến R2 lớn tỷ số t nhỏ Nếu R2 cao, chẳng hạn, >0,8 F test bác bỏ giả thuyết 2 = 3 = … = k = 0, t test cho i lại chấp nhận H0 X3 12 16 Tương quan cặp biến giải thích cao Yˆi 193 446 X i 0.003 X 3i R 0.81; r23 5523 ; cov( ˆ2 , ˆ3 ) 00868 Yˆi 1.210 0.401X 2i 0.027X 3i R2 0.81; r23 0.8285; cov(ˆ2 , ˆ3 ) 0.0282 Se (0.7736) (0.1848) (0.0850) t (1.543) (2.415) (0.0358) Se (0.7480) (0.2720) (0.1252) t (1.618) (1.4752) (0.2152) (X (X rXZ i i X )( Z i Z ) X )2 (Zi Z )2 Trong X, Z biến giải thích mơ hình 25 25 28 28 6.4 Cách phát đa cộng tuyến Sử dụng mơ hình hồi quy phụ Hồi qui biến giải thích X theo biến lại Đa cộng tuyến tượng theo mẫu, nghĩa cho dù biến độc lập Xi không tương quan tuyến tính tổng thể chúng tương quan tuyến tính mẫu cụ thể Do cỡ mẫu lớn tượng đa cộng tuyến nghiêm trọng cỡ mẫu nhỏ Xˆ i ˆ1 ˆ3 X 3i ˆk X mi Tính R2 F cho mơ hình theo cơng thức: F R (n m ) ( R )( m ) Lập giả thiết H0: R2 = ~ H0: khơng có đa cộng tuyến Nếu F > F(m-1,n-m): bác bỏ H0 => có đa cộng tuyến Nếu F < F(m-1,n-m): chấp nhận H0 => khơng có đa cộng tuyến 26 26 29 29 6.4 Cách phát đa cộng tuyến 6.4 Cách phát đa cộng tuyến VD: Cho doanh số bán (Y), chi phí chào hàng (X2) chi phí quảng cáo (X3) năm 2001 12 khu vực bán hàng công ty Có tượng đa cộng tuyến khơng? Hồi quy biến chi phí chào hàng với chi phí quảng cáo, ta có kết X2 =42,012 + 0,387 *X3 R2 = 0,22922 F= 2,9738 Với mức ý nghĩa α=5%, tra bảng F0.05 (1,10)= 4,96 Ta thấy F < F0.05 (1,10) nên chấp nhận Ho hay khơng có đa cộng tuyến Hệ số R2 lớn tỷ số t nhỏ Tương quan cặp biến giải thích cao Sử dụng mơ hình hồi qui phụ Sử dụng yếu tố phóng đại phương sai (VIF) 27 27 30 30 6.4 Cách phát đa cộng tuyến 6.5 Cách khắc phục Sử dụng nhân tử phóng đại phương sai (VIF) Đối với hàm hồi quy biến giải thích, VIF định nghĩa sau: VIF Dùng thơng tin tiên nghiệm Ví dụ Yi=1 + 2X2i+ 3X3i + ui Biết 3=0.12 (1 r232 ) Đối với trường hợp tổng quát, có (k-1) biến giải thích thì: VIF Biến đổi (1 R 2j ) R2j: giá trị R2 hàm hồi quy Xj theo (k-1) biến giải thích lại Thơng thường VIF > 10, biến coi có cộng tuyến cao var( ˆ ) 2 x 2i Yi=1 + 2X2i+ 0.12X3i + ui Yi=1 + 2Xi+ ui Với Xi=X2i+ 0.1X3i VIF 31 34 31 34 Giá trị r23 0.5 0.7 0.8 0.9 0.95 0.97 0.99 0.995 0.999 A VIF 1.33 1.96 2.78 5.76 10.26 16.26 50.25 100 500 2 x 2i ;B Var ( ˆ ) Cov ( ˆ , ˆ ) 1A 1.33A 1.96A 2.78A 5.76A 10.26A 16.92A 50.25A 100A 500A 0.67B 1.37B 2.22B 4.73B 9.74B 16.4B 49.75B 99.5B 499.5B 2i 6.5 Cách khắc phục Loại trừ biến giải thích khỏi mơ hình B1: Xem cặp biến giải thích có quan hệ chặt chẽ Giả sử X2, X3…Xk biến độc lập, Y biến phụ thuộc X2, X3 có tương quan chặt chẽ với B2: Tính R2 hàm hồi quy: có mặt biến; khơng có mặt biến B3: Loại biến mà giá trị R2 tính khơng có mặt biến lớn x x 3i 32 32 35 35 6.5 Cách khắc phục 6.5 Cách khắc phục Dùng thơng tin tiên nghiệm Ví dụ hồi quy mơ hình sản xuất Cobb-Douglas Bổ sung thêm liệu chọn mẫu Y i AL i K i e u i Ln(Yi)=1 + 2ln(Ki)+ 3ln(Li) + ui Có thể gặp tượng đa cộng tuyến K L tăng theo quy mô sản xuất Nếu ta biết hiệu suất không đổi theo quy mô tức 2+3=1 Ln(Yi)=1 + 2ln(Ki)+ (1-2)ln(Li) + ui Ln(Yi) – Ln(Li) = 1 + 2[ln(Ki) - ln(Li)] + ui Ln(Yi /Li ) = 1 + 2ln(Ki /Li) + ui => đa cộng tuyến (vì mơ hình hồi quy đơn) 33 33 36 36 X2 80 100 120 140 160 180 200 220 240 260 6.5 Cách khắc phục Dùng sai phân cấp Ví dụ từ hàm hồi qui: yt = 1 + 1x1t + 2x2t + ut ta suy yt-1 = 1 + 1x1,t-1 + 2x2,t-1 + ut-1 Trừ hai vế cho nhau, ta được: yt – yt – = 1(x1,t – x1,t – 1) + 2(x2,t – x2,t – 1) + (ut – ut – 1) Hay: yt = 1 x1,t + 2 x2,t + et, Mặc dù, x1 x2 có quan hệ tuyến tính, khơng có nghĩa sai phân chúng Y 70 65 90 95 110 115 120 140 155 150 Nguồn: Ramu Ramanathan 37 37 X3 810 1009 1273 1425 1633 1876 2052 2201 2435 2686 40 40 6.5 Cách khắc phục Đổi biến Ví dụ : yt = 1 + 1x1t + 2x2t + ut Với Y: tiêu dùng X1: GDP X2: dân số Vì GDP dân số theo thời gian có xu hướng tăng nên cộng tuyến Biện pháp: chia biến cho dân số Ước lượng mơ hình hồi quy Y= β1 + β2 X2 + β3.X3 +U Nhận xét ban đầu: Theo lý thuyết kinh tế chi tiêu cho tiêu dùng (Y) có xu hướng tăng theo thu nhập (X2) giàu có (X3) nên dấu hệ số hồi quy riêng dương Kết hồi quy Eviews sau: Yt u 2 t X t X t X 2t X 2t 38 38 41 41 Ví dụ Khảo sát chi tiêu tiêu dùng, thu nhập giàu có, ta có bảng số liệu sau Gọi Y: chi tiêu tiêu dùng (USD) X2: thu nhập (USD) X3: giàu có (USD) u cầu: Ước lượng mơ hình hồi quy Y= β1 + β2 X2 + β3.X3 +U Mơ hình có xảy đa cộng tuyến khơng? Vì sao? Nếu xảy đa cộng tuyến, tìm cách khắc phục 39 39 42 42 ... VIF 1.33 1. 96 2.78 5. 76 10. 26 16. 26 50.25 100 500 2 x 2i ;B Var ( ˆ ) Cov ( ˆ , ˆ ) 1A 1.33A 1.96A 2.78A 5.76A 10.26A 16. 92A 50.25A 100A 500A 0 .67 B 1.37B 2.22B 4.73B 9.74B 16. 4B 49.75B... đa cộng tuyến Nếu F > F(m-1,n-m): bác bỏ H0 => có đa cộng tuyến Nếu F < F(m-1,n-m): chấp nhận H0 => khơng có đa cộng tuyến 26 26 29 29 6. 4 Cách phát đa cộng tuyến 6. 4 Cách phát đa cộng tuyến... 120 140 160 180 200 220 240 260 6. 5 Cách khắc phục Dùng sai phân cấp Ví dụ từ hàm hồi qui: yt = 1 + 1x1t + 2x2t + ut ta suy yt-1 = 1 + 1x1,t-1 + 2x2,t-1 + ut-1 Trừ hai vế cho nhau, ta được: