Bước 1. Chạy mô hình fixed effect để lựa chọn giữa mô hình pooled OLS và fixed effect. Theo đó kết quả kiểm định F với Ho = μc = μ‰ = μ¹ = ⋯ = μ cho kết quả Prob>chi2 = 0.0000. Theo đó, mô hình pooled OLS bị loại bỏ, mô hình fixed effect được lựa chọn.
Bước 2. Chạy mô hình random effect để lựa chọn giữa mô hình pooled OLS và random effect. Theo đó kết quả kiểm định Breusch-Pagan với Ho = Var (μO) = 0 cho kết quả Prob > chibar2 = 0.0000. Theo đó Ho bị bác bỏ. Kết quả cho thấy mô hình random effect được lựa chọn. Đồng thời kết quả cũng cho thấy trong mô hình random effect có hiện tượng phương sai sai số thay đổi.
Bước 3. Sử dụng hausman test để lựa chọn giữa mô hình fixed effect và random effect. Kết quả hausman test cho Prob>chi2 = 0.9469. Theo đó Ho được chấp nhận và mô hình random effect được sử dụng.
Bước 4. Kiểm tra các khuyết tật của mô hình
Trước hết kiểm tra hiện tượng tương quan chuỗi bằng Wooldridge test for autocorrelation in panel data. Kết quả cho thấy mô hình có hiện tượng tương quan chuỗi. Đồng thời từ kết quả ở phần trên cho thấy mô hình RE gặp phải hiện tượng phương sai sai số thay đổi.
Bước 5. Lựa chọn mô hình cuối cùng
Đặc điểm dữ liệu là long data với T và N tương ứng là 46 và 7. Do đó với các
khuyết tật của mô hình đã được xác định, 4 công cụ ước lượng được lựa chọn để xem xét, trong đó 2 công cụ ước lượng chính và 2 công cụ để đối chiếu gồm:
- Sử dụng Generalized least squares với lựa chọn panel specific AR (1) để xử lý hiện tượng tự tương quan (autocorrrelation). Đồng thời trong mô hình GLS bổ sung thêm 2 lựa chọn là: GLS1 lựa chọn heteroskedastic and correlated để xử lý hiện tượng phương sai sai số thay đổi và cross-section correlation; và GLS2. lựa chọn heteroskedastic but correlated để xử lý hiện tượng phương sai sai số thay đổi, không tính đến cross-section correlation do N = 7.
- Sử dụng Linear regression with panel corrected standard errors với lựa chọn panel specific AR (1) để xử lý hiện tượng tự tương quan (autocorrrelation). Đồng thời trong mô hình PCSE bổ sung thêm 2 lựa chọn là: PCSE1 lựa chọn heteroskedastic and correlated để xử lý hiện tượng phương sai sai số thay đổi và cross-section correlation; và PCSE2 lựa chọn heteroskedastic but correlated để xử lý hiện tượng phương sai sai số thay đổi, không tính đến cross-section correlation do N = 7.
Giữa 2 mô hình GLS và PCSE, mô hình GLS được ưu tiên hơn theo quy tắc được đề xuất bởi Reed and Ye (2011). Trong đó mục tiêu chính của mô hình tính chính xác và tỷ lệ T/N là > 1,5.
- Sử dụng Random effects linear model with AR(1) disturbances với ký hiệu là REAR1. Việc lựa chọn công cụ ước lượng này do đặc điểm dữ liệu có N là 7 trong khi T là 46 nên xử lý khuyết tật về tương quan chuỗi (serial correlation) được tập trung hơn, trong khi các khuyết tật về phương sai sai số thay đổi (heteroskedasticity) và tương quan chéo (cross section correlation) có thể linh hoạt hơn. Mặc dù vậy đây cũng chỉ là công cụ ước lượng để tham khảo để so sánh.
- Sử dụng Random effect model với ký hiệu là RE. Kết quả của ước lượng chỉ mang tính chất tham khảo để so sánh.