Kiểm định F
Tác giả thực hiện kiểm định này nhằm tìm ra mô hình phù hợp hơn giữa mô hình Pooled OLS và FEM. Theo đó, tác giả đặt ra giả thiết nhƣ sau:
H0: � = �1 = �2 = �3 = �4 = �5 = �6 = �7 = �8 = 0 H1: � G �1 G �2 G �3 G �4 G �5 G �6
G �7 G �8 G 0
Nếu p-value < �, H0 sẽ bị bác bỏ và điều đó có nghĩa là không xảy ra đồng thời các biến độc lập đều không ảnh hƣởng đến biến phụ thuộc. Khi đó, mô hình FEM sẽ đƣợc chọn thay cho mô hình Pooled OLS. Ngƣợc lại, p-value > � thì H0 sẽ đƣợc chấp nhận, nghĩa là đồng thời các độc lập đều không ảnh hƣởng đến biến phụ thuộc và mô hình Pooled OLS là mô hình phù hợp.
Kết quả kiểm định F đƣợc thể hiện trong bảng 4.4.
Bảng 4.4. Kết quả kiểm định F
Kiểm định F
F-statistic Prob(F-statistic) Kết luận
2.79 0.0069 Kết quả kiểm định F ủng hộ sử dụng mô hình FEM/REM
Với mức ý nghĩa 10%, p-value < (0.0069 < 0.1) nên 0 sẽ bị bác bỏ. Nhƣ vậy, không xảy ra đồng thời các biến độc lập đều không ảnh hƣởng đến biến phụ thuộc, từ đó rút ra kết luận mô hình Pooled OLS không phù hợp.
Kiểm định Hausman
Sau khi kiểm định F đƣa ra kết quả mô hình OLS không phù hợp thì tiếp theo tác giả sẽ lựa chọn giữa mô hình FEM và REM. Tác giả sẽ thực hiện kiểm định Hausman để xem xét có sự tƣơng quan giữa thành phần ngẫu nhiên (εi ) và các biến độc lập hay không, từ đó đƣa ra kết luận giữa mô hình FEM và REM thì mô hình nào phù hợp hơn.
Tác giả tiến hành kiểm định Hausman với các giả thiết sau:
H0: Không có sự tƣơng quan giữa εi và các biến độc lập (Mô hình REM phù hợp).
H1: Có sự tƣơng quan giữa εi và các biến độc lập (Mô hình FEM phù hợp). Nếu p-value < �, H0 sẽ bị bác bỏ. Khi đó, εi và biến độc lập có tƣơng quan với nhau và mô hình FEM sẽ phù hợp hơn. Ngƣợc lại, p-value > � thì H0 sẽ đƣợc chấp nhận và mô hình REM là mô hình phù hợp để nghiên cứu.
Kết quả kiểm định Hausman nhƣ sau: Coefficients (b) FEM (B) REM (b-B) Difference sqrt(diag(V_b-V_B)) S.E. SIZE 1.788817 0.7223607 1.066457 0.5999143 ROA 0.3191663 0.9358174 -0.616651 0.2351905 GROW 0.7563297 0.8547192 -0.0983894 0.0877769 UNIQ 0.1000387 -0.0165963 0.116635 0.0533247
TANG 0.967584 0.5659468 0.4016372 1.195648 LIQ -0.208223 -0.3567425 0.1485195 0.1207114 AGE -0.113492 -0.0831183 -0.0303737 0.0243941 TAX -0.5289519 -1.044685 0.5157328 0.1704257
b = consistent under Ho and Ha; obtained from xtreg B = inconsistent under Ha, efficient under Ho; obtained from xtreg Test: Ho: difference in coefficients not systematic
chi2(8) = (b-B)'[(V_b-V_B)^(-1)](b-B) = 9.54
Prob>chi2 = 0.2987
(V_b-V_B is not positive definite)
Với mức ý nghĩa 10%, kết quả cho thấy giá trị p-value > � (0.2987 > 0.1). Nhƣ vậy, giả thiết H0 đƣợc chấp nhận. Mô hình REM đƣợc chọn làm mô hình nghiên cứu.
Tóm lại, dựa trên kết quả của 02 phƣơng pháp kiểm định là kiểm định F và kiểm định Hausman thì mô hình REM là mô hình nghiên cứu phù hợp nhất.
Kiểm định thừa biến trong mô hình (biến không cần thiết)
Theo nhƣ kết quả của phƣơng pháp hồi quy theo mô hình REM, biến SIZE có ý nghĩa thống kê ở mức 5%, biến GROW và AGE có ý nghĩa thống kê ở mức 10%. Các biến ROA, UNIQ, TANG, LIQ, TAX không có ý nghĩa thống kê với mức ý nghĩa 10%. Nhƣ vậy, kiểm định Wald đƣợc sử dụng để phát hiện biến không cần thiết trong mô hình.
Tác giả đặt ra các giả thuyết nhƣ sau:
H0: �2 = �4 = �5 = �6 = �8 = 0 H1: �2 G �4 G �5 G �6
G �8 G 0
Nếu p-value < �, H0 sẽ bị bác bỏ và điều đó có nghĩa cả 05 biến ROA, UNIQ, TANG, LIQ, TAX đều có ý nghĩa thống kê. Ngƣợc lại, p-value > � thì �0 sẽ đƣợc chấp nhận và cả 05 biến trên đều sẽ không có ý nghĩa thống kê.
Kết quả kiểm định nhƣ sau: ( 1) ROA = 0 ( 2) UNIQ = 0 ( 3) TANG = 0 ( 4) LIQ = 0 ( 5) TAX = 0 chi2 (5) = 2.94 Prob > chi2 = 0.7096
Với mức ý nghĩa 10%, p-value > � (0.7096 > 0.1) nên có thể chấp nhận giả thiết �0, tức là cả 05 biến ROA, UNIQ, TANG, LIQ, TAX đều không có ý nghĩa thống kê.
Nhƣ vậy, còn lại 03 biến SIZE, GROW và AGE có tác động mạnh nhất đên CTV của DN sẽ đƣợc đƣa vào mô hình hồi quy cuối cùng.
Mô hình hồi quy cuối cùng
Sau khi đã thực hiện kiểm định để tìm ra mô hình phù hợp nhất và loại bỏ các biến không cần thiết thì mô hình hồi quy cuối cùng có dạng nhƣ sau:
DEit = Ci + �1SIZE + �2GROW + �3AGE + �i + uit
Random-effects GLS regression Number of obs = 161
Group variable: Enterprise Number of groups = 23
R-sq: Obs per group:
within = 0.1289 min = 7
between = 0.1540 avg = 7.0
overall = 0.1335 max = 7
Wald chi2(3) = 22.10
corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0001 DE Coef. Std. Err. z P>z [95% Conf. Interval] SIZE 0.929631 0.3494432 2.66 0.008 0.2447349 1.614527 GROW 0.9151656 0.4147732 2.21 0.027 0.1022251 1.728106 AGE -0.105951 0.0442021 -2.4 0.017 -0.1925854 -0.0193165 _cons -2.557639 2.179343 -1.17 0.241 -6.829073 1.713796 sigma_u 1.3332593 sigma_e 1.2291426
rho 0.54056548 (fraction of variance due to u_i)
Kết quả hồi quy cho thấy R-squared = 0.1289. Nhƣ vậy mô hình giải thích đƣợc 12.89% sự thay đổi của biến phụ thuộc. Đồng thời, tất cả các biến trong mô hình đều có ý nghĩa thống kê ở mức 1% và 5%.
Vậy mô hình hồi quy cuối cùng có dạng nhƣ sau: