2 .Xây dựng mơ hình lý thuyết
2. Kiểm định và khắc phục khuyết tật mơ hình
2.1. Kiểm định đa cộng tuyến
Bản chất: Về bản chất, đa cộng tuyến là 1 khuyết tật của mơ hình tuyến tính
bội (mơ hình có nhiều biến độc lập). Đa cộng tuyến xảy ra khi có sự phụ thuộc tuyến tính cao giữa các biến độc lập. Đa cộng tuyến có 2 mức độ, là đa cộng tuyến hồn hảo và đa cộng tuyến khơng hồn hảo.
Nguyên nhân:
- Do đặt ra vấn đề sai.
- Phương pháp thu thập dữ liệu không đúng, mẫu dữ liệu không đặc trưng cho tổng thể.
- Giá trị biến độc lập có tính tương quan cao trong mẫu nhưng không tương quan cao tổng thể.
- Xác định dạng hàm sai.
- Sử dụng số liệu vĩ mô theo chuỗi thời gian.
Phương pháp kiểm định: Sử dụng nhân tử phóng đại phương sai VIF.
Quy tắc kiểm định: : Nếu VIF > 10 thì xảy ra đa cộng tuyến.
Sử dụng STATA để tính VIF ta được kết quả:
GDP 1.48
GDPPERCAPITAL 4.33
NX 2.36
Do chỉ số VIF của GDP, GDPPERCAPITAL, NX, TAX, RANK và TGHD đều nhỏ hơn 10, kết luận là mơ hình khơng xảy ra hiện tượng đa cộng tuyến.
2.2. Kiểm định phương sai sai số thay đổi
Hiện tượng: Vi phạm giả thuyết cơ bản số 3 của mơ hình hồi quy tuyến tính:
Các sai số ngẫu nhiên Ui có một phương sai khác nhau :
Var(Ui/Xi) = E[Ui – E(Ui)]2 = E(Ui)2 = σi2; với i = 1,2,3...n
Nguyên nhân:
- Khi con người học hỏi, các sai lầm của họ nhỏ đi theo thời gian, phương sai sai số giảm dần.
- Kỹ thuật thu thập số liệu được cải thiện - Do bản chất của các mối quan hệ kinh tế
- Do sự xuất hiện của các quan sát ngoại lai, một quan sát rất khác, có thể là rất nhỏ hoặc rất lớn so với các quan sát khác trong mẫu
- Do dạng hàm sai hoặc do bị thiếu biến quan trọng Phương pháp kiểm định: Sử dụng kiểm định White
Cặp giả thuyết: hay
H0: Mơ hình khơng có phương sai sai số thay đổi H1: Mơ hình có phương sai sai số thay đổi
Sử dụng phần mềm stata với lệnh: “imtest, white” được kết quả sau: White's test for Ho: homoskedasticity
against Ha: unrestricted heteroskedasticity chi2(27) = 39.83
Prob > chi2 = 0.0531
Cameron & Trivedi's decomposition of IM-test Source | chi2 df p
Với mức ý nghĩa 5% theo kết quả mơ hình có p-value = 0.0531 > 0.05, nên ta thừa nhận H0 .
Kết luận: Mơ hình có phương sai sai số khơng đổi.
2.3. Kiểm định sai số chuẩn của sai số ngẫu nhiên
Bản chất
Để có thể tiến hành kiểm định và dự báo, chúng ta đã đưa thêm giải thuyết về phân phối chuẩn của nhiễu. Tức là
Nếu sai số ngẫu nhiên khơng có phân phối chuẩn thì dự báo khơng cịn chính xác và các kiểm định t, F khơng cịn đáng tin cậy.
Phương pháp kiểm định:
Dựa trên phần dư kiểm định Jacque-Bera Cặp giả thuyết:
H0: Sai số ngẫu nhiên có phân phối chuẩn H1: Sai số ngẫu nhiên không phân phối chuẩn
Skewness/Kurtosis tests for Normality Variable Obs Pr(Skewness) Pr(Kurtosis) adj
chi2(2)
Prob>chi2
e 66 0.3471 0.2417 2.35 0.3092
Độ nghiêng là 0,3471 Độ nhọn là 0,2417
Như vậy ta có Chi2 (2) = 2.35 với p-value tương ứng bằng 0,3092. Với mức ý nghĩa 5%, p-value > =0,05 do đó thừa nhận giả thuyết H0. Kết luận: Mơ hình có sai số ngẫu nhiên phân phối chuẩn.
2.4. Kiểm định bỏ sót biến
Một trong những sai lầm khi xây dựng mơ hình kinh tế lượng là bỏ sót biến quan trọng. Như vậy thì các ước lượng sẽ chệch và khơng vững, kém chính xác. Kiểm định bỏ sót biến quan trọng
Cặp giả thuyết:
H0: Mơ hình khơng bỏ sót biến H1: Mơ hình bỏ sót biến
Sử dụng STATA với lệnh: “ovtest” được kết quả sau:
Ramsey RESET test using powers of the fitted values of lnfdi Ho: model has no omitted variables
Với mức ý nghĩa 5%, p-value > =0,05 nên thừa nhận H0. Kết luận: Mơ hình có dạng đúng hay mơ hình khơng bỏ sót biến.
2.5. Kiểm định tự tương quan
Bản chất: Tự tương quan là một khuyết tật của mơ hình hồi quy, vi phạm
một trong những giả thuyết cơ bản của mơ hình hồi quy tuyến tính cổ điển: “Khơng có sự tương quan giữa các sai số ngẫu nhiên ui”, tức là mơ hình có khuyết tật tự tương quan khi hiệp phương sai của sai số ngẫu nhiên trong hai quan sát bất kỳ khác không:
Nguyên nhân:
Nguyên nhân khách quan:
- Tính chất quán tính của chuỗi số liệu: các chuỗi số liệu thời gian về
GDP, chỉ số giá, tỉ lệ thất nghiệp, ...
- Hiện tượng trễ: biến phụ thuộc thời kỳ t phụ thuộc vào biến đó ở thời kỳ t-1.
- Hiện tượng mạng nhện Coweb: phán ứng của cung nông sản đối với giá thị trường có một khoảng trễ về thời gian.
Nguyên nhân chủ quan:
- Do mơ hình thiếu biến quan trọng hoặc dạng hàm sai.
- Việc xử lý dữ liệu: bôi trơn dữ liệu, loại bỏ những quan sát gai góc.
Phương pháp kiểm định: Sử dụng kiểm định Wooldridge (do dữ liệu của
mơ hình thuộc dạng dữ liệu bảng)
Quy tắc kiểm định: Với giá trị p-value > 5% của kiểm định Wooldridge
thì mơ hình khơng có hiện tượng tự tương quan. Cặp giả thuyết:
H0: Mơ hình khơng có hiện tượng tự tương quan H1: Mơ hình có hiện tượng tự tương quan
Wooldridge test for autocorrelation in panel data H0: no first-order autocorrelation
F( 1, 10) = 0.336 Prob > F = 0.5750
Như vậy, ta có F(1,10) = 0,336 với p-value tương ứng là 0,5750. Với mức ý nghĩa 5%, p-value > =0,05 nên thừa nhận H0. Kết luận mơ hình khơng có hiện tượng tự tương quan.
Tóm lại, sau khi thực hiện các kiểm định khuyết tật, mơ hình khơng bị khuyết
tật tức là mơ hình đã ước lượng là ước lượng tuyến tính khơng chệch tốt nhất.