Hiện tượng trên được gọi là hiện tượng đa cộng tuyến. Vậy đa cộng tuyến là gì, hậu quả của hiện tượng này như thế nào, làm thế nào để phát hiện và biện pháp khắc phục nó. Để trả lwoif cho câu hỏi này thì sau đây chúng ta cùng đi thảo luận về đề tài “hiện tượng đa cộng tuyến”.
Trang 1Lời mở đầu
Trong mô hình phân tích hồi quy bội, chúng ta giả thiết giữa các biến giải thích
Xi của mô hình độc lập tuyến tính với nhau, tức các hệ số hồi quy đối với một biến cụ thể là số đo tác động riêng phần của biến tương ứng khi tất cả các biến khác trong mô hình được giữ cố định Tuy nhiên khi giả thiết đó vi phạm tức là các biến giải thích có tương quan thì chúng ta không thể tác biệt sự ảnh hưởng riêng biệt của một biến nào đó
Hiện tượng trên được gọi là hiện tượng đa cộng tuyến Vậy đa cộng tuyến là gì, hậu quả của hiện tượng này như thế nào, làm thế nào để phát hiện và biện pháp khắc phục nó Để trả lwoif cho câu hỏi này thì sau đây chúng ta cùng đi thảo luận về đề tài “hiện tượng đa cộng tuyến”
1 Bản chất của đa cộng tuyến
Xét mô hình hồi quy:
^
Y i = ^β1+ ^β2X2i + + ^βKXki + Ui
Mô hình trên được gọi là có hiện tượng đa cộng tuyến, nếu các biến độc lập X2, X3,… Xk có quan hệ tuyến tính với nhau
a Đa cộng tuyến hoàn hảo:
Mô hình được gọi là xảy ra hiện tượng đa cộng tuyến hoàn hảo nếu tồn tại k-1 số thực λ1, λ2, , λk không đồng thời bằng 0, sao cho:
λ1X1 + λ2 X2 + + λk Xk = 0
b Đa cộng tuyến không toàn phần:
Mô hình được gọi là xảy ra hiện tượng đa cộng tuyến không toàn phần nếu tồn tại k-1 số thực λ1, λ2, , λ3 không đồng thời bằng 0, sao cho:
λ 1 X1i + λ2 X2i + + λk Xki + Vi = 0
2 Nguyên nhân
Các nguyên nhân gây ra hiện tượng đa cộng tuyến ở đây có thể là do các nguyên nhân sau :
Do bản chất kinh tế xã hội các biến ít nhiều có quan hệ tuyến tính với nhau
Do mẫu lấy không ngẫu nhiên
Do quá trình xử lý tính toán số liệu
Trang 2 Một số nguyên nhân khác
3 Hậu quả
Phương sai và hiệp phương sai của các ước lượng OLS lớn
Khoảng tin cậy rộng hơn
Tỷ số t mất ý nghĩa 2
R cao nhưng tỷ số t ít ý nghĩa
Dấu của các ước lượng có thể sai
Các ước lượng và sai số chuẩn rất nhạy với sự thay đổi trong số liệu
Thay đổi các ước lượng của mô hình khi thêm bớt các biến cộng tuyến
1 Bài toán
- GDP (tổng sản phẩm quốc nội) là giá trị thị trường của tất cả các hàng hóa và dịch vụ cuối cùng được sản xuất ra trong phạm vi một lãnh thổ nhất định và trong một thời kì nhất định
- Đầu tư là tổng đầu tư ở trong nước của tư nhân Nó bao gồm các khoản chi tiêu của doanh nghiệp về trang thiết bị và nhà xưởng hay sự xây dựng, mua nhà mới của hộ gia đình
- Xuất khẩu là việc bán hàng hóa dịch vụ cho nước ngoài
- Nhập khẩu là việc quốc gia này mua hàng hóa và dịch vụ từ quốc gia khác
Ta được bảng số liệu:
(Đơn vị: tỷ đồng)
Trang 32011 2660076.0 924495.0 96905.7 106749.8
2 Giải quyết bài toán
2.1 Xây dựng mô hình hồi quy
*Với mức ý nghĩa α = 0.05
Mô hình tổng thể:
^
Y i= ^β1+ ^β2X i+ ^β3Z i+ ^β4N i+U i
Trong đó:
Biến phụ thuộc : Ŷ i : GDP
Biến giải thích: X i , Z i , N i
Xi: Đầu tư
Zi: Xuất khẩu
Ni: Nhập khẩu
Ui: Sai số ngẫu nhiên
* Dùng eview ước lượng mô hình hồi quy mẫu theo phương pháp bình phương nhỏ nhất:
Trang 4- Từ kết quả trên ta có mô hình hồi quy như sau:
(SRF) Ŷi = 14115,24 + 2,017746X + 24,3044Z – 15,75433N + Ui
- Ý nghĩa của các hệ số hồi quy:
Đối với ^β1= 14115,24 có ý nghĩa là tổng giá trị đầu tư, xuất khẩu, nhập khẩu đồng thời bằng 0 thì GDP đạt giá trị trung bình là 14115,24 tỷ đồng/năm
Đối với ^β2 = 2,017746 có ý nghĩa là khi xuất khẩu, nhập khẩu không đổi thì tổng giá trị đầu tư tăng thêm một đơn vị thì GDP trung bình sẽ tăng thêm 2,01 tỷ đồng/năm
Đối với ^β3 = 24,3044 có ý nghĩa là khi tổng giá trị đầu tư, nhập khẩu không đổi thì tổng giá trị xuất khẩu tăng thêm một đơn vị thì GDP trung bình sẽ tăng thêm 24,3 tỷ đồng/năm
Trang 5Đối với ^β4 = -15,75 có ý nghĩa là khi tổng giá trị đầu tư, xuất khẩu tăng thêm một đơn vị thì GDP trung bình sẽ giảm đi 15,75 tỷ đồng/năm
2.2 Kiểm định giả thuyết và đánh giá mức độ phù hợp của mô hình
2.2.1 Hệ số thu được từ hàm hồi quy có phù hợp với lý thuyết kinh tế không
Kiểm định giả thiết {H0: β2= 0
H1: β2≠ 0 với mức ý nghĩa α = 0,05
Ta thấy β2 có giá trị kiểm định t = 5,3893 có mức xác suất tương ứng
là Pvalue = 0,0002 < α = 0,05
→ Bác bỏ H0 → β2≠ 0
Đầu tư có ảnh hưởng đến tổng thu nhập GDP
Kiểm định giả thiết {H0: β3= 0
H1: β3≠ 0 với mức ý nghĩa α = 0,05
Ta thấy β3 có giá trị kiểm định t = 8,5843 có mức xác suất tương ứng
là Pvalue = 0,0000 < α = 0,05
→ Bác bỏ H0 → β3≠ 0
Xuất khẩu có ảnh hưởng đến tổng thu nhập GDP
Kiểm định giả thiết {H0: β4=0
H1: β4≠ 0 với mức ý nghĩa α = 0,05
Ta thấy β4 có giá trị kiểm định t = 0,3725 có mức xác xuất tương ứng
là Pvalue = 0,0039 < α = 0,05
Nhập khẩu có ảnh hưởng đến tổng thu nhập GDP
II.2.2 Kiểm định sự phù hợp của mô hình hồi quy
Kiểm định giả thiết {H0: R2=0
H1: R2> 0 với mức ý nghĩa α = 0,05
H0 là mô hình không phù hợp
H1 là mô hình phù hợp
Từ kết quả trên ta thấy R2 = 0,9978 và
có xác suất Pvalue = 0,0000 < α = 0,05
→ Bác bỏ H0, tức là mô hình hồi quy là phù hợp
2.3 Kiểm định và khắc phục hiện tượng
2.3.1 Kiểm định sự tồn tại của đa cộng tuyến
Trang 6a Nhận biết đa cộng tuyến
Từ số liệu sử dụng phần mềm eview t có kết quả sau:
Ŷi = 14115,24 + 2,017746X + 24,3044Z – 15,75433N + Ui
Với mức ý nghĩa α = 0,05 thì ta có t0,02512 = 2,179
Nhận xét từ kết quả eview ta có :
R2 = 0.997859 > 0.8 Thống kê t của hệ số tương ứng với biến C là
t1=0.372550 < 2.179 Thống kê t của hệ số tương ứng với biến X là
t2 = 5.389309 > 2.179 Thống kê t của hệ số tương ứng với biến Z là
t3=8.584396 > 2.179 Thống kê t của hệ số tương ứng với biến N là
t4= -3.566101 < 2.179
Ta thấy rằng hệ số xác định bởi R của mô hình hồi quy rất gần 1 , điều này chứng tỏ mô hình rất là phù hợp
Trang 7Trong khi đó thống kê, t1 lại có giá trị rất gần 0, kết quả làm tăng khả năng chấp nhận H0 không có ý nghĩa về mặt thống kê
Vậy có thể nghi ngờ rằng có hiện tượng đa cộng tuyến xảy ra trong
mô hình
Hệ số tương quan cặp giữa các biến giải thích với cao
Sử dụng phần mềm Eview ta được bảng như sau:
Từ kết quả trên cho thấy:
+ Hệ số tương quan giữa biến X và Z là 0,985231 > 0,8
+ Hệ số tương quan giữa biến X và N là 0,993728 > 0,8
+ Hệ số tương quan giữa biến Z và N là 0,992928 > 0,8
Có thể nói ở đây xuất hiện hiện tượng đa cộng tuyến
Ta tiến hành hồi quy X i theo Z i , N i
Sử dụng phần mềm eview ta được bảng:
Từ bảng eview trên ta được mô hình hồi quy phụ:
Trang 8X i= 39237.67 - 0.836896Z i+ 8.976440N i
Kiểm định giả thiết: {H0: R2 =0
H1: R2
> 0 với ý nghĩa α = 0,05
{H0: Mô hìnhkhông có đa cộng tuyến
H1: Môhình có đa cộng tuyến
Từ kết quả eview ta thấy F = 519,7134
và có xác suất Pvalue = 0,0000 < α= 0,05 Nên ta bác bỏ giả thiết H0
Mô hình hồi quy phù hợp
Xảy ra hiện tượng đa cộng tuyến
1−R2phụ i
Với biến là X thì R2
phụ 2 = 0.987648 suy ra VIF = 80.958549 ¿ 10
Có hiện tượng đa cộng tuyến
Với biến Z thì R2
phụ 3= 0.986079
Trang 9suy ra VIF = 71.833919 ¿ 10
Có hiện tượng đa cộng tuyến
Với biến N thì R2
phụ 4= 0.994062 suy ra VIF = 168,406871¿ 10
Có hiện tượng đa cộng tuyến
Trang 10 Đo độ Theil
Xét mô hình hồi quy Y theo X ta được kết quả:
Xét mô hình hồi quy Y theo Z ta được kết quả:
Trang 11Xét mô hình hồi quy Y theo N ta được kết quả
Từ 3 bảng trên ta thu được kết quả:
R122 = 0,982058
R132 = 0,992555
R142 = 0,981147
Độ đo Theil:
m = R2 – (R2 - R122 ) – (R2 - R132 ) – (R2 - R142 )
= 0,997859 – (0,997859 - 0,982058) – (0,997859 - 0,992555) –
(0,997859 - 0,981147) = 0,960042
Vậy độ đo của Theil về mức độ đa cộng tuyến là 0,960042
b Khắc phục hiện tượng đa cộng tuyến
Trang 12- Phương pháp tăng kích thước mẫu
Ban đầu n=16, k=4, với số liệu đã cho có xảy ra hiện tượng đa cộng tuyến, bằng phương pháp thêm số liệu từ điều tra thêm mẫu tức n tăng để khắc phục hiện tượng đa cộng tuyến ta có:
Khi này n’=26 tức thêm 10 mẫu nữa vào n=16
Ta sẽ thêm số liệu mới khi này như sau:
Tiến hành hồi quy trên eview với n’=26 và k=4 với số liệu trên ta được kết quả như sau:
Trang 13Nhận thấy: với mức ý nghĩa 5%:.
R2 = 0,997825 > 0,8
P_value 1 = 0,4407 > 0,05
P_value 2 = 0,0000 < 0,05 ( không t/m)
P_value 3 = 0.0000 < 0,05 ( không t/m)
P_value 4 = 0,0041 < 0,05 ( không t/m)
Với so sánh trên ta nhận thấy mô hình không tồn tại hiện tượng đa cộng tuyến nữa
Tuy nhiên bằng phương pháp tương quan cặp giữa các biến giải thích cao ta có:
Từ bảng trên ta thấy hệ số tương quan cặp giữa các biến giải thích đều rất cao:
Hệ số tương quan giữa biến X và Z là 0.989511 > 0.8
Hệ số tương quan giữa biến X và N là 0.996033 > 0.8
Hệ số tương quan giữa biến Z và N là 0.994692 > 0.8
Phương pháp lấy thêm biến chưa thực sự hiệu quả để
có thể khắc phục được hiện tượng đa cộng tuyến
- Phương pháp loại bỏ biến
Loại bỏ biến X ta sẽ có mô hình hồi quy:
Trang 14Y i = 93286,89 + 22,61576Z + 2,357846N
R12= 0,992675
t1 = 1,503269
t2 = 4,523300
t3 = 0,462768
Khi bỏ biến Z ta có:
^
Y2 = -132468,7 + 1,662055X + 11,72962N
R22 = 0,984708
Trang 15Khi bỏ biến N ta có:
^
Y3=3970,669+1,002063 X +16,98742 Z
R32 = 0,995589
Ta thấy rằng R32 >R12 > R22 nên khi mô hình loại bỏ biến Z sẽ có sự phù hợp cao hơn khi bỉ hai biến X và N