2. Kiểm định và khắc phục khuyết tật của mơ hình hồi quy
2.1. Kiểm định tự tương quan
Bản chất: Tự tương quan là một khuyết tật của mơ hình hồi quy, vi
phạm một trong những giả thuyết cơ bản của mơ hình hồi quy tuyến tính cổ điển: “Khơng có sự tương quan giữa các sai số ngẫu nhiên ui”, tức là mơ hình có khuyết tật tự tương quan khi hiệp phương sai của sai số ngẫu nhiên trong hai quan sát bất kỳ khác không:
Cov (ui,uj) ≠ 0 (i ≠ j)
Nguyên nhân:
Nguyên nhân khách quan:
- Tính chất quán tính của chuỗi số liệu: các chuỗi số liệu thời gian về GDP, chỉ số giá, tỉ lệ thất nghiệp, ...
- Hiện tượng trễ: biến phụ thuộc thời kỳ t phụ thuộc vào biến đó ở thời kỳ t-1.
- Hiện tượng mạng nhện Coweb: phán ứng của cung nơng sản đối với giá thị trường có một khoảng trễ về thời gian.
Nguyên nhân chủ quan:
- Do mơ hình thiếu biến quan trọng hoặc dạng hàm sai.
- Việc xử lý dữ liệu: bôi trơn dữ liệu, loại bỏ những quan sát gai góc.
Phương pháp kiểm định: Sử dụng kiểm định Durbin - Watson
Quy tắc kiểm định: Giá trị kiểm định Durbin - Watson nằm trong
khoảng từ dU đến 4 – dU thì mơ hình khơng có khuyết tật tự tương quan. Bảng thống kê Durbin - Watson cho giá trị tới hạn dU và dLdựa vào ba yếu tố:
- Mức ý nghĩa α
- Số biến độc lập của mơ hình: k’ - Số quan sát: n
Với α = 0.05, k’= 3, n = 56, ta có: dU = 1.681, dL = 1.452
Sử dụng phần mềm Gretl: Chọn Tests/Durbin – Watson p-value, thu được kết quả như sau:
Durbin-Watson statistic = 0.150568 p-value = 1.79769e+308
Có thể thấy: d = 0.150568 < dU, như vậy, mơ hình bị mắc khuyết tật tự tương quan.
Khắc phục khuyết tật tự tương quan:
Có tự tương quan: ui = ρui-1 + vi
Tiến hành hồi quy mơ hình này, ta được kết quả như sau: Model 1: OLS, using observations 1-48
Dependent variable: ui
Coefficient Std. Error t-ratio p-value
ui-1 0.821697 0.0540312 15.2078 8.93e-020 ***
Mean dependent var 1854.592 S.D. dependent var 15345.96 Sum squared resid 1.90e+09 S.E. of regression 6353.582 R-squared 0.831104 Adjusted R-squared 0.831104
F(1, 47) 231.2781 P-value(F) 8.93e-20
Log-likelihood -487.9289 Akaike criterion 977.8578 Schwarz criterion 979.7290 Hannan-Quinn 978.5650
Như vậy, giá trị ước lượng của ρ là 0.821697 với p-value là 8.93e-020, nhỏ hơn mức ý nghĩa α là 0.05, tức là ρ thực sự khác khơng.
Xét mơ hình gốc có dạng:
GDP PER CAPITAL i = β1 + β2CPIi + β3FDIi + β4NXi+ ui (1) GDP PER CAPITAL i-1 = β1 + β2CPIi-1 + β3FDIi-1 + β4NXi-1+ ui (2) Nhân cả hai vế của phương trình (2) với ρ, ta được:
ρGDP PER CAPITAL i-1 = ρβ1 + ρβ2CPIi-1 + ρβ3FDIi-1 + ρβ4NXi-1+ ρui (3) Trừ (1) cho (3), ta có phương trình:
GDP PER CAPITAL i* = β1*+ β2*CPIi* + β3*FDIi* + β4*NXi*+ vi (4) Trong đó: GDP PER CAPITAL i* = GDPi - ρGDPi-1
β1*= β1 - ρβ1 β2* = β2 β3* = β3 β4* = β4
CPIi*= CPIi - ρCPIi-1 FDIi*= FDIi - ρFDIi-1 NXi*= NXi - ρNXi-1
Hồi quy mơ hình (4) theo phương pháp OLS, ta được kết quả như sau: Model 1: Pooled OLS, using 48 observations
Included 8 cross-sectional units Time-series length = 6
Dependent variable: GDP PER CAPITAL*
Coefficient Std. Error t-ratio p-value
const 24136.4 2909.74 8.2950 1.53e-010 ***
CPI* -795.391 130.94 -6.0745 2.62e-07 ***
FDI* 4.41491e-08 1.57298e-08 2.8067 0.00743 *** NX* 3.69974e-08 1.07868e-08 3.4299 0.00132 *** Mean dependent var 6935.953 S.D. dependent var 5242.038 Sum squared resid 6.27e+08 S.E. of regression 3774.059 R-squared 0.514743 Adjusted R-squared 0.481657
F(3, 44) 15.55786 P-value(F) 4.86e-07
Log-likelihood -461.3443 Akaike criterion 930.6886 Schwarz criterion 938.1734 Hannan-Quinn 933.5171
rho 0.193941 Durbin-Watson 1.123809
Ta thấy giá trị kiểm định Durbin – Watson bằng 1.123809 Với α = 0.05, k’= 3, n = 48, ta có: dU = 1.674, dL = 1.421
Như vậy, mơ hình mới vẫn mắc khuyết tật tự tương quan: vi = ρ*vi-1 + vi* Thực hiện các bước khắc phục tự tương quan như trên với mơ hình (4), ta thu được mơ hình hồi quy mới:
GDP PER CAPITAL i**= β1**+ β2**CPIi** + β3**FDIi** + β4**NXi** + vi* (5)
Hồi quy mơ hình (5) theo phương pháp OLS, ta được kết quả như sau: Model 1: Pooled OLS, using 40 observations
Included 8 cross-sectional units Time-series length = 5
Dependent variable: GDP PER CAPITAL ***
Coefficient Std. Error t-ratio p-value
const 19055.2 2756.74 6.9122 4.28e-08 ***
CPIb -797.344 153.446 -5.1963 8.24e-06 ***
NXb 2.16595e-08 1.06664e-08 2.0306 0.04973 ** Mean dependent var 4921.305 S.D. dependent var 3726.049 Sum squared resid 2.98e+08 S.E. of regression 2876.615 R-squared 0.449821 Adjusted R-squared 0.403973
F(3, 36) 9.811074 P-value(F) 0.000072
Log-likelihood -373.2251 Akaike criterion 754.4502 Schwarz criterion 761.2057 Hannan-Quinn 756.8928
rho 0.159122 Durbin-Watson 1.687146
Ta thấy giá trị kiểm định Durbin – Watson bằng 1.687146 Với α = 0.05, k’= 3, n = 40, ta có: dU = 1.659, dL = 1.338 Như vậy, mơ hình mới khơng mắc khuyết tật tự tương quan.