Hiện tượng trên được gọi là hiện tượng đa cộng tuyến. Vậy đa cộng tuyến là gì, hậu quả của hiện tượng này như thế nào, làm thế nào để phát hiện và biện pháp khắc phục nó. Để trả lwoif cho câu hỏi này thì sau đây chúng ta cùng đi thảo luận về đề tài “hiện tượng đa cộng tuyến”.
Lời mở đầu Trong mô hình phân tích hồi quy bội, giả thiết biến giải thích Xi mô hình độc lập tuyến tính với nhau, tức hệ số hồi quy biến cụ thể số đo tác động riêng phần biến tương ứng tất biến khác mô hình giữ cố định Tuy nhiên giả thiết vi phạm tức biến giải thích có tương quan tác biệt ảnh hưởng riêng biệt biến Hiện tượng gọi tượng đa cộng tuyến Vậy đa cộng tuyến gì, hậu tượng nào, làm để phát biện pháp khắc phục Để trả lwoif cho câu hỏi sau thảo luận đề tài “hiện tượng đa cộng tuyến” I Lý thuyết Bản chất đa cộng tuyến Xét mô hình hồi quy: = + X2i + + Xki + Ui Mô hình gọi có tượng đa cộng tuyến, biến độc lập X2, X3,… Xk có quan hệ tuyến tính với a Đa cộng tuyến hoàn hảo: Mô hình gọi xảy tượng đa cộng tuyến hoàn hảo tồn k-1 số thực λ1, λ2, , λk không đồng thời 0, cho: λ1X1 + λ2 X2 + + λk Xk = b Đa cộng tuyến không toàn phần: Mô hình gọi xảy tượng đa cộng tuyến không toàn phần tồn k-1 số thực λ1, λ2, , λ3 không đồng thời 0, cho: λ X1i + λ2 X2i + + λk Xki + Vi = Nguyên nhân Các nguyên nhân gây tượng đa cộng tuyến nguyên nhân sau : • Do chất kinh tế xã hội biến nhiều có quan hệ tuyến tính với • Do mẫu lấy không ngẫu nhiên • Do trình xử lý tính toán số liệu • Một số nguyên nhân khác Hậu • Phương sai hiệp phương sai ước lượng OLS lớn • Khoảng tin cậy rộng • Tỷ số t ý nghĩa • R cao tỷ số t ý nghĩa • Dấu ước lượng sai • Các ước lượng sai số chuẩn nhạy với thay đổi số liệu • Thay đổi ước lượng mô hình thêm bớt biến cộng tuyến II Bài tập vật dụng Bài toán - GDP (tổng sản phẩm quốc nội) giá trị thị trường tất hàng hóa dịch vụ cuối sản xuất phạm vi lãnh thổ định thời kì định - Đầu tư tổng đầu tư nước tư nhân Nó bao gồm khoản chi tiêu doanh nghiệp trang thiết bị nhà xưởng hay xây dựng, mua nhà hộ gia đình - Xuất việc bán hàng hóa dịch vụ cho nước - Nhập việc quốc gia mua hàng hóa dịch vụ từ quốc gia khác Ta bảng số liệu: (Đơn vị: tỷ đồng) Năm 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 GDP Đầu tư Xuất Nhập 435319.0 151183.0 14482.7 15636.5 474855.0 170496.0 15029.2 16217.9 527056.0 200145.0 16706.1 19745.6 603688.0 239246.0 20149.3 25255.8 701906.0 290927.0 26485.0 31968.8 897222.0 343135.0 32447.1 36761.1 1038755.0 404712.0 39826.2 44891.1 1211806.0 532093.0 48561.4 62764.7 1567964.0 616735.0 62685.1 80713.8 1731221.0 708826.0 57096.3 69948.8 2075578.0 830278.0 72236.7 84838.6 2660076.0 924495.0 96905.7 106749.8 2012 2013 2014 2015 2.1 3115227.0 3430668.0 3750823.0 3997609.0 1010114.0 1094542.0 1220704.0 1367205.0 114529.2 132032.9 150217.1 162016.7 113780.4 132032.6 147849.1 165570.4 Giải toán Xây dựng mô hình hồi quy *Với mức ý nghĩa α = 0.05 Mô hình tổng thể: Trong đó: Biến phụ thuộc : Ŷi : GDP Biến giải thích: Xi: Đầu tư Zi: Xuất Ni: Nhập Ui: Sai số ngẫu nhiên * Dùng eview ước lượng mô hình hồi quy mẫu theo phương pháp bình phương nhỏ nhất: - Từ kết ta có mô hình hồi quy sau: (SRF) Ŷi = 14115,24 + 2,017746X + 24,3044Z – 15,75433N + Ui - Ý nghĩa hệ số hồi quy: Đối với = 14115,24 có ý nghĩa tổng giá trị đầu tư, xuất khẩu, nhập đồng thời GDP đạt giá trị trung bình 14115,24 tỷ đồng/năm Đối với = 2,017746 có ý nghĩa xuất khẩu, nhập không đổi tổng giá trị đầu tư tăng thêm đơn vị GDP trung bình tăng thêm 2,01 tỷ đồng/năm Đối với = 24,3044 có ý nghĩa tổng giá trị đầu tư, nhập không đổi tổng giá trị xuất tăng thêm đơn vị GDP trung bình tăng thêm 24,3 tỷ đồng/năm Đối với = -15,75 có ý nghĩa tổng giá trị đầu tư, xuất tăng 2.2 thêm đơn vị GDP trung bình giảm 15,75 tỷ đồng/năm Kiểm định giả thuyết đánh giá mức độ phù hợp mô hình 2.2.1 Hệ số thu từ hàm hồi quy có phù hợp với lý thuyết kinh tế không Kiểm định giả thiết II.2.2 với mức ý nghĩa α = 0,05 Ta thấy có giá trị kiểm định t = 5,3893 có mức xác suất tương ứng Pvalue = 0,0002 < α = 0,05 → Bác bỏ H0 → Đầu tư có ảnh hưởng đến tổng thu nhập GDP Kiểm định giả thiết với mức ý nghĩa α = 0,05 Ta thấy có giá trị kiểm định t = 8,5843 có mức xác suất tương ứng Pvalue = 0,0000 < α = 0,05 → Bác bỏ H0 → Xuất có ảnh hưởng đến tổng thu nhập GDP Kiểm định giả thiết với mức ý nghĩa α = 0,05 Ta thấy có giá trị kiểm định t = 0,3725 có mức xác xuất tương ứng Pvalue = 0,0039 < α = 0,05 Nhập có ảnh hưởng đến tổng thu nhập GDP Kiểm định phù hợp mô hình hồi quy Kiểm định giả thiết với mức ý nghĩa α = 0,05 mô hình không phù hợp mô hình phù hợp Từ kết ta thấy = 0,9978 có xác suất Pvalue = 0,0000 < α = 0,05 → Bác bỏ H0, tức mô hình hồi quy phù hợp 2.3 Kiểm định khắc phục tượng 2.3.1 a • Kiểm định tồn đa cộng tuyến Nhận biết đa cộng tuyến Hệ số sách định bội R2 cao tỷ số t thấp Từ số liệu sử dụng phần mềm eview t có kết sau: Ŷi = 14115,24 + 2,017746X + 24,3044Z – 15,75433N + Ui Với mức ý nghĩa α = 0,05 ta có = 2,179 • Nhận xét từ kết eview ta có : R2 = 0.997859 > 0.8 Thống kê t hệ số tương ứng với biến C t1=0.372550 < 2.179 Thống kê t hệ số tương ứng với biến X t2 = 5.389309 > 2.179 Thống kê t hệ số tương ứng với biến Z t3=8.584396 > 2.179 Thống kê t hệ số tương ứng với biến N t4= -3.566101 < 2.179 Ta thấy hệ số xác định R mô hình hồi quy gần , điều chứng tỏ mô hình phù hợp Trong thống kê, t1 lại có giá trị gần 0, kết làm tăng khả chấp nhận H0 ý nghĩa mặt thống kê Vậy nghi ngờ có tượng đa cộng tuyến xảy mô hình Hệ số tương quan cặp biến giải thích với cao Sử dụng phần mềm Eview ta bảng sau: Từ kết cho thấy: + Hệ số tương quan biến X Z 0,985231 > 0,8 + Hệ số tương quan biến X N 0,993728 > 0,8 + Hệ số tương quan biến Z N 0,992928 > 0,8 Có thể nói xuất hiện tượng đa cộng tuyến • Hồi quy phụ Ta tiến hành hồi quy Sử dụng phần mềm eview ta bảng: Từ bảng eview ta mô hình hồi quy phụ: = 39237.67 - 0.836896 + 8.976440 Kiểm định giả thiết: với ý nghĩa α = 0,05 Từ kết eview ta thấy F = 519,7134 có xác suất Pvalue = 0,0000 < α= 0,05 • Nên ta bác bỏ giả thiết H0 Mô hình hồi quy phù hợp Xảy tượng đa cộng tuyến Nhân tử phóng đại phương sai VIF Với biến X R2phụ = 0.987648 suy VIF = 80.958549 10 Có tượng đa cộng tuyến Với biến Z R2phụ 3= 0.986079 suy VIF = 71.833919 10 Có tượng đa cộng tuyến Với biến N R2phụ 4= 0.994062 suy VIF = 168,406871 10 Có tượng đa cộng tuyến • Đo độ Theil Xét mô hình hồi quy Y theo X ta kết quả: Xét mô hình hồi quy Y theo Z ta kết quả: Xét mô hình hồi quy Y theo N ta kết b Từ bảng ta thu kết quả: = 0,982058 = 0,992555 = 0,981147 Độ đo Theil: m = R2 – (R2 - ) – (R2 - ) – (R2 - ) = 0,997859 – (0,997859 - 0,982058) – (0,997859 - 0,992555) – (0,997859 - 0,981147) = 0,960042 Vậy độ đo Theil mức độ đa cộng tuyến 0,960042 Khắc phục tượng đa cộng tuyến - Phương pháp tăng kích thước mẫu • Ban đầu n=16, k=4, với số liệu cho có xảy tượng đa cộng tuyến, phương pháp thêm số liệu từ điều tra thêm mẫu tức n tăng để khắc phục tượng đa cộng tuyến ta có: Khi n’=26 tức thêm 10 mẫu vào n=16 • Ta thêm số liệu sau: Năm 1990 1991 1992 1993 1994 1995 1996 1997 1998 GDP 39284.0 72620.0 106757.0 134913.0 174017.0 228677.0 269654.0 308600.0 352836.0 Đầu tư 57912.0 59679.0 61894.0 68344.0 71171.0 72447.0 87394.0 108370.0 117134.0 Xuất 2404.0 2087.1 2580.7 2985.2 4054.3 5448.9 7255.8 9185.0 9360.3 Nhập 2752.4 2338.1 2540.8 3923.9 5825.8 8155.4 11143.6 11592.3 11499.6 1999 392693.0 • 131171.0 11541.4 11742.1 Tiến hành hồi quy eview với n’=26 k=4 với số liệu ta kết sau: Nhận thấy: với mức ý nghĩa 5%: R2 = 0,997825 > 0,8 P_value = 0,4407 > 0,05 P_value = 0,0000 < 0,05 ( không t/m) P_value = 0.0000 < 0,05 ( không t/m) P_value = 0,0041 < 0,05 ( không t/m) Với so sánh ta nhận thấy mô hình không tồn tượng đa cộng tuyến Tuy nhiên phương pháp tương quan cặp biến giải thích cao ta có: Từ bảng ta thấy hệ số tương quan cặp biến giải thích cao: Hệ số tương quan biến X Z 0.989511 > 0.8 Hệ số tương quan biến X N 0.996033 > 0.8 Hệ số tương quan biến Z N 0.994692 > 0.8 Phương pháp lấy thêm biến chưa thực hiệu để khắc phục tượng đa cộng tuyến Phương pháp loại bỏ biến Loại bỏ biến X ta có mô hình hồi quy: - = 93286,89 + 22,61576Z + 2,357846N = 0,992675 t1 = 1,503269 t2 = 4,523300 t3 = 0,462768 Khi bỏ biến Z ta có: = -132468,7 + 1,662055X + 11,72962N = 0,984708 Khi bỏ biến N ta có: = 0,995589 Ta thấy > > nên mô hình loại bỏ biến Z có phù hợp cao bỉ hai biến X N ... Vậy độ đo Theil mức độ đa cộng tuyến 0,960042 Khắc phục tượng đa cộng tuyến - Phương pháp tăng kích thước mẫu • Ban đầu n=16, k=4, với số liệu cho có xảy tượng đa cộng tuyến, phương pháp thêm... Xảy tượng đa cộng tuyến Nhân tử phóng đại phương sai VIF Với biến X R2phụ = 0.987648 suy VIF = 80.958549 10 Có tượng đa cộng tuyến Với biến Z R2phụ 3= 0.986079 suy VIF = 71.833919 10 Có tượng. .. R2phụ 3= 0.986079 suy VIF = 71.833919 10 Có tượng đa cộng tuyến Với biến N R2phụ 4= 0.994062 suy VIF = 168,406871 10 Có tượng đa cộng tuyến • Đo độ Theil Xét mô hình hồi quy Y theo X ta