6. Kết cấu đề tài
2.3.8.2. Kiểm tra hiện tượng đa cộng tuyến
Chuỗi dữ liệu về thời gian thường có những xu hướng tiềm ẩn thông thường. Trong trường hợp thay đổi mô hình như loại bỏ biến hoặc thêm biến vào có thể làm
46
thay đổi kết quả một cách nghiêm trọng, khiến cho việc diễn dịch các ước lượng sẽ khó khăn hơn. Đây cũng chính là hiện tượng đa cộng tuyến xuất hiện. Chúng tôi tiến hành kiểm tra mô hình ước lượng có hiện tượng đa cộng tuyến không theo các dấu hiệu sau:.
- Nếu R2 cao, trị thống kê t thấp ta nghi ngờ có hiện tượng đa cộng tuyến
Ước lượng từ mô hình hồi qui sau điều chỉnh hình [2.7] :
Hằng số LP THNS GDP 16.02793 0.258927 1.873778 0.621818 (5.586854) (3.580846 ) (5.182564) (2.337742) [ 0.0000] [0.0025] [0.0001] [0.0327] ESS R2 F d.f 55.06099 0.815977 0.781473 23.64858 20
Giá trị trong hoặc đơn là giá trị thống kê t, hoặc vuông là P_value
Kết quả từ mô hình trên cho thấy :
R2 = 0.815977 81,59 R2 =0.8 R2 không cao. P_Value (LP) = 0.0025 < 0.05 (mức ý nghĩa 5%) P_Value (THNS) = 0.0001 < 0.05 (mức ý nghĩa 5%) P_Value (GDP) = 0.0327 < 0.05 (mức ý nghĩa 5%)
Nhận xét: R2 tương đối cao nhưng các hệ số biến giải thích có giá trị thống kê nên chưa đủ cơ sở để kết luận mô hình bị đa cộng tuyến. (kq1)
- Hệ số tương qua cặp giữa các biến giải thích cao.
Mở các biến, vào Eview/ correlation xây dựng ma trận hệ số tương quan cặp giữa các biến giải thích (LP, THNS, GDP ). Ta có bảng kết quả sau :
Biến LP THNS GDP
LP 1 0.26228 0.191425
THNS 0.26228 1 0.24624
GDP 0.191425 0.24624 1
Hình 2.10: Ma trận hệ số tương quan của các biến LP, THNS, GDP
Mặc định các hệ số tương quan cặp giữa các biến giải thích > 0.8 là cao. Nhìn vào kết quả hình [2.10]: ta nhận thấy các hệ số tương quan cặp giữa các biến giải thích đếu có giá trị thấp cụ thể là :
47
Hệ số tương quan giữa : LP và THNS là 0.26228 LP và GDP là 0.19142 THNS và GDP là 0.24624
Mô hình không có hiện tượng đa cộng tuyến. Trừ trường hợp đặt biệt, có một số trường hợp khi hệ số tương quan cặp giữa các biến giải thích thấp nhưng vẫn xảy ra hiện tượng đa cộng tuyến. (kq2)
- Hồi qui nhạy cảm với đặc trưng ( đổi dấu kỳ vọng hoặc thay đổi mạnh mẽ hệ số ước lượng ).
Sử dụng mô hình hồi qui phụ kiểm định tính đa cộng tuyến.
+ Chạy mô hình hồi qui gốc: là mô hình hồi qui tuyến tính đối với dữ liệu kinh tế Việt Nam sau điều chỉnh các biến LSDH, LP, THNS, GDP. ( hình 2.7)
+ Chạy mô hình hồi qui phụ 1: gồm các biến LP, THNS, GDP ( xem phụ lục 1) + Chạy mô hình hồi qui phụ 2 gồm các biến THNS,LP, GDP ( xem phụ lục 1) + Chạy mô hình hồi qui phụ 3: gồm các biến GDP, LP, THNS, ( xem phụ lục 1)
Mô hình hồi điểu chỉnh Mô hình hồi qui phụ 1 Mô hình hồi qui phụ 2 Mô hình hồi qui phụ 3 LSDH =f(LP, THNS, GDP) LP =f(THNS, GDP) THNS= f(LP, GDP) GDP = f(LP, THNS) R2 0.815977 0.085918 0.108681 0.077911
Áp dụng qui tắc ngón tay cái –Rule of thumb của Klien. Nếu có ít nhất R2 của hồi qui phụ > R2 của hồi qui gốc thì có đa cộng tuyến xảy ra (R2phụ i > R2gốc, với i =1 n).
Nhìn vào kết quả trên, ta thấy R2phụ LP (0.085918); R2phụ THNS(0.108681); R2phụ
GDP (0.077911) < R2gốc =0.8159
Mô hình hồi qui không có hiện tượng đa cộng tuyến (kq3)
Kết luận: LSDH phụ thuộc LP, THNS, GDP không có hiện tượng đa cộng tuyến.
-Nhân tử phóng đại VIF. VIF = 1 / ( 1- R2phụ i)
Nếu VIF ≥10 ( tương đương với R2phụ i > 0.9 ) thì có hiện tượng đa cộng tuyến. Tính VIFLP = 1 / ( 1- (0.085918)2 ) = 1.007473 ≈ 1.007
48
Mức độ đa cộng tuyến là rất thấp
Không có hiện tượng đa cộng tuyến (kq4)
Tính VIFTHNS = 1 / ( 1- (0.108681)2 ) = 1.01195 ≈ 1.012
VIFTHNS = 1.012 ≤10↔ R2LP = 0.108681 < 0.9 Tính VIFgdp = 1 / ( 1- (0.0779)2 ) = 1.0061 ≈ 1.006
VIFgdp = 1.006 ≤10↔ R2LP = 0.0779 < 0.9
Mô hình không có hiện tượng đa cộng tuyến (kq4)
Kết luận chung: từ kq (1), (2), (3), (4) ta có thể kết luận rằng mô hình hồi qui sau điều chỉnh là (hình 2.7):
LSDH = 16.02793 + 0.258927*LP + 1.873778*THNS + 0.621818*GDP
không xảy ra hiện tượng đa cộng tuyến.