1 ĐACỘNGTUYẾN CHƯƠNG VI 2 Khi lập mô hình hồi quy bội Có sự phụ thuộc tuyến tính cao giữa các biến giải thích gọi là đacộng tuyến. a. Đacộngtuyến hoàn hảo Tồn tại λ 2 , λ 3 ,… λ k không đồng thời bằng 0 sao cho : λ 2 X 2 + λ 3 X 3 + …+ λ k X k = 0 b. Đa cộngtuyến không hoàn hảo λ 2 X 2 + λ 3 X 3 + …+ λ k X k + v i = 0 kikiii XXXY ββββ ˆ ˆˆˆ ˆ 33221 ++++= 6.1. Bản chất của đacộngtuyến 5 Nếu X 2i = λX 3i => x 2i = λx 3i => => không xác định được 2 32 2 3 2 2 323 2 32 2 )( ˆ ∑ ∑∑ ∑∑∑ ∑ − − = iiii iiiiiii xxxx xxxyxxy β 0 0 ˆ 2 3 2 3 22 3 2 3 2 333 2 33 2 = − − = ∑ ∑ ∑∑ ∑∑ ∑ ∑ iiii iiiiiii xxxx xxxyxxy λλ λλ β 32 ˆ , ˆ ββ 6.2. Ước lượng các tham số khi có đa cộngtuyến 6 • Khi chọn các biến độc lập mối quan có quan hệ nhân quả hay có tương quan cao vì đồng phụ thuộc vào một điều kiện khác. • Khi số quan sát nhỏ hơn số biến độc lập. • Cách thu thập mẫu. • Chọn biến X i có độ biến thiên nhỏ. * Một số nguyên nhân gây ra hiện tượng đa cộngtuyến 7 • Ước lượng các hệ số không hiệu quả do phương sai của ước lượng lớn. • Khoảng tin cậy của các ước lượng rộng • Tỷ số t i không có ý nghĩa • R 2 lớn nhưng t nhỏ • Các ước lượng OLS và sai số chuẩn của chúng trở nên rất nhạy với những thay đổi nhỏ của dữ liệu • Dấu các ước lượng của các hệ số hồi quy có thể sai • Thêm vào hay bớt đi các biến cộngtuyến với các biến khác, mô hình sẽ thay đổi về dấu hoặc thay đổi về độ lớn của các ước lượng. 6.3. Hậu quả của đacộngtuyến 8 6.4.2. Tương quan cặp giữa các biến giải thích cao Trong đó X, Z là 2 biến giải thích trong mô hình ∑ ∑ −− −− = 22 )()( ))(( ZZXX ZZXX r ii ii XZ 6.4. Cách phát hiện đacộngtuyến 6.4.1. R 2 lớn nhưng tỷ số t nhỏ 9 Mô hình hồi qui bội : H 0 : R 2 = 0 • Nếu F > F α (m-1,n-m): bác bỏ H 0 => có đa cộngtuyến • Nếu F < F α (m-1,n-m): chấp nhận H 0 => không có đa c ộ n g tu y ến mikii XXX βββ ˆ ˆˆ ˆ 3312 +++= )1)(1( )( 2 2 −− − = mR mnR F 6.4.3. Sử dụng mô hình hồi quy phụ 10 Đối với hàm hồi quy 2 biến giải thích, VIF được định nghĩa như sau: Đối với trường hợp tổng quát, có (k-1) biến giải thích thì: R 2 j : là giá trị R 2 trong hàm hồi quy của X j theo (k-1) biến giải thích còn lại. Thông thường khi VIF > 10, thì biến này được coi là có cộngtuyến cao )1( 1 2 23 r VIF − = )1( 1 2 j R VIF − = 6.4.4. Sử dụng nhân tử phóng đại phương sai (VIF – Variance Inflation Factor)) 11 1) Dùng thông tin tiên nghiệm Ví dụ khi hồi quy mô hình sản xuất Cobb-Douglas Ln(Y i )=b 1 + b 2 ln(K i )+ b 3 ln(L i ) + u i Có thể gặp hiện tượng đacộngtuyến do K và L cùng tăng theo quy mô sản xuất. Nếu ta biết là hiệu suất không đổi theo quy mô tức là b 2 +b 3 =1. Ln(Y i )=b 1 + b 2 ln(K i )+ (1-b 2 )ln(L i ) + u i Ln(Y i ) – Ln(L i ) = b 1 + b 2 [ln(K i ) - ln(L i )] + u i => mất đacộngtuyến (vì đây là mô hình hồi quy đơn). i u iii eKALY 2 3 β β = 6.5. Biện pháp khắc phục 12 2) Loại trừ một biến giải thích ra khỏi mô hình • B1: Xem cặp biến giải thích nào có quan hệ chặt chẽ • B2: Tính R 2 đối với các hàm hồi quy: có mặt cả 2 biến; không có mặt một trong 2 biến • B3: Loại biến mà giá trị R 2 tính được khi không có mặt biến đólàlớn hơn. 3) Bổ sung thêm dữ liệu hoặc chọn mẫu mới 4) Dùng sai phân cấp 1 • Phương pháp này chỉ áp dụng cho chuỗi thời gian) Ví dụ 6.1. xem xét đacộngtuyến trong mô hình từ số liệu ở file “vi du 6.1 - dacongtuyen ” 6.5. Biện pháp khắc phục (tt) . 1 ĐA CỘNG TUYẾN CHƯƠNG VI 2 Khi lập mô hình hồi quy bội Có sự phụ thuộc tuyến tính cao giữa các biến giải thích gọi là đa cộng tuyến. a. Đa cộng tuyến hoàn hảo Tồn tại. λ 3 X 3 + …+ λ k X k = 0 b. Đa cộng tuyến không hoàn hảo λ 2 X 2 + λ 3 X 3 + …+ λ k X k + v i = 0 kikiii XXXY ββββ ˆ ˆˆˆ ˆ 33221 ++++= 6.1. Bản chất của đa cộng tuyến 5 Nếu X 2i = λX 3i =>. hình ∑ ∑ −− −− = 22 )()( ))(( ZZXX ZZXX r ii ii XZ 6.4. Cách phát hiện đa cộng tuyến 6.4.1. R 2 lớn nhưng tỷ số t nhỏ 9 Mô hình hồi qui bội : H 0 : R 2 = 0 • Nếu F > F α (m-1,n-m): bác bỏ H 0 => có đa cộng tuyến • Nếu F < F α (m-1,n-m):