Phát hiện sự tồn tại đa cộng tuyến và biện pháp khắc phục
Phát hiện sự tồn tại đa cộng tuyến
1.1 Hệ số xác định R cao nhưng tỷ số t thấp 2
-Có từ 2 giá trị tj:|tj| 0.8, thì mô hình có đa cộng tuyến cao Ngược lại, nếu tất cả các hệ số tương quan đều ≤ 0.8 thì mô hình không có hiện tượng đa cộng tuyến cao.
Một cách có thể tin cậy được để đánh giá mức độ tin cậy của đa cộng tuyến là hồi quy phụ Hồi quy phụ là hồi quy mỗi biến\độc lập
X i theo các biến độc lập còn lại
Cách sử dụng mô hình hồi quy phụ như sau:
- Hồi quy mỗi biến độc lập còn lại Tính R 2 cho mỗi hồi quy phụ:
- Kiểm định các giả thiết:
=0 (tức giả thuyết biến X i tương ứng không tương quan tuyến tính với các biến còn lại Nếu giả thuyết H 0 được chấp nhận, thì không có hiện tượng đa cộng tuyến.)
2(n−k) (1−R 2 i )(k−1) Trong đó n là cỡ mẫu, k là số biến độc lập trong hồi quy phụ Ri
2 là hệ số xác định trong hồi quy của biến X i theo các biến khác.
Nếu F i >F αi(k−2 ,n−k+1) thì bác bỏ H 0, điều này có nghĩa là có đa cộng tuyến trong mô hình.
Trở ngại của kỹ thuật hồi quy phụ là gây gánh nặng về tính toán Nhưng ngày nay đã có nhiều chương trình máy tính đã có thể đảm đương được công việc tính toán này.
1.4 Sử dụng nhân tử phóng đại phương sai VIF
Nhân tử phóng đại phương sai VIF có chức năng đo lường mối tương quan và độ mạnh của mối tương quan giữa các biến dự báo trong mô hình hồi quy Nhân tử phóng đại phương sai gắn với biến X i , ta kí hiệu là VIF(X i).
VIF(Xi)được thiết lập trên cơ sở hệ số xác định Ri
2 của hồi quy phụ biến Xi theo các biến độc lập khác:
Tiêu chuẩn so sánh hệ số VIF như sau:
VIF từ 1- 2 thì các biến không tương quan tức không có hiện tượng đa cộng tuyến.
VIF từ 2 - 5 thì các biến có tương quan vừa phải tức có tồn tại hiện tượng đa cộng tuyến, nhưng nó không đủ nghiêm trọng để người nghiên cứu phải tìm biện pháp khắc phục.\
VIF > 5 thì các biến có tương quan cao tức tồn tại đa cộng tuyến nghiêm trọng \hệ số được ước tính kém và các giá trị p - values là đáng nghi ngờ.
VIF > 10 thì chắc chắn có đa cộng tuyến.
Biện pháp khắc phục đa cộng tuyến
2.1 Bỏ biến giải thích có khả năng là tổ hợp tuyến tính của các biến còn lại
Bước 1: Xác định các biến có mối quan hệ tương quan chặt chẽ với nhau.\
Giả sử X 2 ,X 3 X k là các biến độc lập, Y là biến phụ thuộc và X 2 , X 3 có tương quan chặt chẽ với nhau
Bước 2: Tính R 2 đối với các hàm hồi quy: có mặt cả hai biến; không có mặt một trong hai biến
Bước 3: Ta loại biến mà giá trị R 2 tính được khi không có mặt biến đó là lớn hơn
2.2 Thu thập số liệu và lấy mẫu mới
Vì đa cộng tuyến là đặc trưng của mẫu nên có thể có mẫu khác liên quan đến cùng các biến trong mẫu ban đầu mà đa cộng tuyến có thể không nghiêm trọng nữa.Tuy nhiên nếu mẫu lớn hơn mà vẫn còn đa cộng tuyến thì vẫn có giá trị vì mẫu lớn hơn sẽ làm cho phương sai nhỏ hơn và hệ số ước lượng chính xác hơn so với mẫu nhỏ Điều này có thể làm được khi chi phí cho việc lấy mẫu khác có thể chấp nhận được trong thực tế Đôi khi chỉ cần thu thập thêm số liệu , tăng cỡ mẫu có thể làm giảm tính nghiêm trọng của đa cộng tuyến.
2.3 Kiểm tra lại mô hình Đa cộng tuyến là một lỗi của mô hình do đó khiến mô hình sau khi kiểm định, kết quả thực chất không còn đúng nữa Nên lúc này ta phải ktra xem nguyên nhân xảy ra hiện tượng đa cộng tuyến là gì.Và bỏ cái nguyên nhân đó đi, cụ thể ở đây là biến sai.
Document continues below kinh tế lượng
BTL Kinh tế lượng nhóm 3 (bản cuối) kinh tế lượng 100% (4)
Bài tập klt - aaaaaaaaaaaaaaaa kinh tế lượng 100% (1)
4 đa bt 1 ktl - đáp án bt kinh tế lượng kinh tế lượng 100% (1)
Nhóm 2 - Các phương pháp pháp… kinh tế lượng None 43
Lythuyet KTL - câu hỏi lý thuyết kinh tế lượng None1
Sau khi bỏ biến sai thì mình phải làm lại từ đầu phần thu thập số liệu và lấy mẫu mới Và để chắc chắn ta lại phải kiểm tra đa cộng tuyến 1 lần nữa cho đến khi không xảy ra hiện tượng đa cộng tuyến nữa
2.4 Thay đổi dạng hàm log:
- Định dạng lại mô hình bằng cách dùng mô hình log tuyến tính:
- Sau khi kiểm tra lại khuyết tật đa cộng tuyến, nếu vẫn còn hiện tượng đa cộng tuyến thì ta sử dụng mô hình log-log: lnYi= β1+β2lnXi+β3lnZi+Ui (2)
- Sau khi kiểm tra lại khuyết tật đa cộng tuyến, nếu mô hình vẫn còn hiện tượng đa cộng tuyến thì ta khắc phục bằng sai phân cấp 1 với mô hình log-log:
+ Xét mô hình hồi quy đa cộng tuyến theo số liệu chuỗi thời gian sau: lnY t = β 1 +β 2 lnX t +β 3 lnZ t +U t (3)
+Mô hình trên đúng với thời điểm t cũng đúng với thời điểm: lnYt−1= β1+β2lnXt−1+β3lnZt−1+Ut−1 (4)
Lấy (3) trừ cho (4) ta có: lnY t -lnY t− = β 2 (lnX t -lnX t−1 )+β 3 (lnZ t -lnZ t−1 )+V t (5) Đặt lnY-lnY t− = Y ¿ t ; lnX t -lnX t−1 =X ¿ t ; lnZ t -lnZ t−1 =Z t ¿ (6)
(6) được viết: Yt ¿= β2Xt ¿+β3Zt ¿+Vt
Mô hình hồi quy dạng này là mô hình sai phân cấp 1 có tác dụng làm giảm mức độ nghiêm trọng của đa cộng tuyến Tuy nhiên, việc biến đổi sai phân có thể sinh ra một vài vấn đề như p_value của thống kê F quá cao nên sử dụng biến pháp mô hình này là không phù hợp.
BẢN WORD KTL - đề tài thảo luận về tác… kinh tế lượng None32
Ví dụ minh họa
Phát hiện sự tồn tại của đa cộng tuyến
a Hệ số xác định R cao nhưng tỷ số t thấp 2
Variable Coefficient Std Error t-Statistic Prob
S.E of regression 13.08956 Akaike info criterion 8.204685
Sum squared resid 1884.701 Schwarz criterion 8.393498
Log likelihood -57.53514 Hannan-Quinn criter 8.202673
Xét hàm hồi quy tuyến tính mẫu:
11 =2,201 ttn(I)=2,5218 →Cao ttn(XK)=2,682 →Cao t tn (NK)=−2,423 →|t tn (NK)| =2,423→Cao
Chưa phát hiện đa cộng tuyến b Xét hệ số tương quan cặp giữa các biến I, XK, NK Với mức ý : nghĩa α=0,05
Từ kết quả trên cho thấy:
Hệ số tương quan giữa I và XK là 0,980211 > 0,8
Hệ số tương quan giữa I và NK là 0,97362 > 0,8
Hệ số tương quan giữa XK và NK là 0,997986 > 0,8
Vậy mô hình GDP theo I, XK, NK có xảy ra hiện tượng đa cộng tuyến. c.Xét hồi quy phụ NK theo I và XK
Xét mô hình hồi quy 4 biến, với GPA là biến phụ thuộc, còn I, NK, XK là các biến giải thích Mô hình hồi quy phụ:
NK i =α 1 +α 2 I i +α 3 XK i +VGiả sử hồi quy NK theo I và XK ta được bảng kết quả dưới đây:
Với α=0,05ta cần kiểm định giả thuyết sau { H 0: RH 1 : R 2 2 =0≠ 0
Ta sử dụng tiêu chuẩn kiểm định F ¿ R 2
Ta thấy từ bảng kết quả Eview ta thấy F= 1762,69 và giá trị p-value của thống kê F là 0,00000 ¿0,05
Hay p-value ¿α => bác bỏ H0, chấp nhận H1
- α2 có giá trị kiểm định t = -1,494827 có mức xác suất tương ứng là: p-value = 0,1608 > α = 0,05
- α3có giá trị kiểm định t = 13,21509 có mức xác suất tương ứng là: p-value = 0,0000 < α = 0,05
=> Với mức ý nghĩa 5 % ta kết luận mô hình hồi quy phụ phù hợp hay có tồn tại mối quan hệ giữa NK với ít nhất một trong hai biến I và XK.
Kết luận: Như vậy bằng kiểm định hồi quy phụ ta kết luận mô hình hồi quy ban đầu GDP theo I, XK, NK có xảy ra hiện tượng đa cộng tuyến d Sử dụng nhân tử phóng đại phương sai VIF
Một thước đo khác của hiện tượng đa cộng tuyến là phân tử phóng đại phương sai gắn với biến X1, ký hiệu là VIF(X1).
VIF(X1) được thiết lập trên cơ sở của hệ số xác định R12 trong hồi quy của biến X1 với các biến khác như sau:
Dựa vào bảng số liệu trên, ta thấy:
I = 273.7311 > 10; NK = 1543.452 > 10; XK = 1746.756 > 10Vậy có xảy ra hiện tượng đa cộng tuyến.
Khắc phục hiện tượng đa cộng tuyến
a Loại bỏ biến I hoặc XK hoặc NK khỏi mô hình ban đầu
Mô hình hồi quy đã loại bỏ biến I
Mô hình đã loại bỏ biến NK
Mô hình đã loại bỏ biến XK
Từ 3 kết quả trên ta thấy R 2 (bỏ biến NK) > R 2 (bỏ biến I)
> R 2 (bỏ biến XK) nên ta loại biến NK (tổng giá trị nhập khẩu) ra khỏi mô hình.
Khi đó mô hình hồi quy mới là:
^GDPi=¿ -1,134826 + 2,238354*I + 0,261618*XKi i b Kiểm tra lại mô hình
Kiểm tra lại mô hình sau khi loại bỏ biến NK bằng hệ số phóng đại phương sai VIF:
Ta có hệ số phóng đại phương sai VIF đều = 25.51916 > 10 Mô hình vẫn xảy ra hiện tượng đa cộng tuyến. c Thay đổi dạng hàm
Thay thế dạng hàm tuyến tính bằng dạng hàm Log – Log ta thu được bảng kết quả Eviews như sau:
Variable Coefficient Std Error t-Statistic Prob
S.E of regression 0.035879 Akaike info criterion -3.594154
Sum squared resid 0.014160 Schwarz criterion -3.405341
Log likelihood 30.95616 Hannan-Quinn criter -3.596165
Kiểm tra khuyết tật đa cộng tuyến trong mô hình bằng hệ số phóng đại phương sai VIF
Hệ số phóng đại phương sai VIF đều > 10 Mô hình vẫn xảy ra hiện tượng đa cộng tuyến.
Khắc phục hiện tượng đa cộng tuyến bằng Sai phân cấp 1 với mô hình Log – Log ta thu được bảng kết quả hồi quy sau:
Variable Coefficient Std Error t-Statistic Prob
S.E of regression 0.036261 Akaike info criterion -3.561219
Sum squared resid 0.013148 Schwarz criterion -3.378631
Log likelihood 28.92853 Hannan-Quinn criter -3.578121
Kiểm tra khuyết tật đa cộng tuyến bằng hồi quy phụ:
Variable Coefficient Std Error t-Statistic Prob
S.E of regression 0.102525 Akaike info criterion -1.530013
Sum squared resid 0.115625 Schwarz criterion -1.393072
Log likelihood 13.71009 Hannan-Quinn criter -1.542689
Từ bảng kết quả Eviews, ta có Prob(F) = 0,603948 > 0,05 Mô hình hồi quy phụ không phù hợp Mô hình không có đa cộng tuyến.
Kiểm tra khuyết tật đa cộng tuyến trong mô hình bằng hệ số phóng đại phương sai VIF
Hệ số phóng đại phương sai VIF đều < 10 Hiện tượng đa cộng tuyến đã được khắc phục.