Mô hình Pooled OLS:
Mô hình Pooled OLS đƣợc sử dụng cho dữ liệu bảng, dữ liệu càng lớn thì mô hình này càng chuẩn. Pooled OLS giúp kiểm soát yếu tố thời gian, vì mỗi mốc thời gian có những biến động kinh tế khác nhau, nếu không kiểm soát yếu tố thời gian thì sẽ đƣa các năm về cùng một giá trị trung bình dẫn đến không chính xác.
Tiến hành hồi quy theo mô hình Pooled OLS, kết quả đƣợc trình bày trong bảng sau:
Bảng 5.2: Kết quả hồi quy theo mô hình Pooled OLS
NPL Coef. Std. Err. t P>|t| [95% Conf. Interval]
37 ROE -.1689179 .0378981 -4.46 0.000 -.2437142 -.0941217 LGR -.0015193 .0017372 -0.87 0.383 -.0049479 .0019092 LR .0026704 .1350957 0.02 0.984 -.2639561 .2692969 IER .0042619 .0350675 0.12 0.903 -.0649477 .0734716 SIZE .1009529 .0324513 3.11 0.002 .0369065 .1649992 INEF -.0329159 .0155392 -2.12 0.036 -.0635842 -.0022476 SOLR -.0345314 .1324097 -0.26 0.795 -.2958568 .226794 GDPGR .1494353 .4517012 0.33 0.741 -.7420477 1.040918 INFLA .3559893 .2104004 1.69 0.092 -.0592595 .7712381 _cons .0241001 .1385112 0.17 0.862 -.2492673 .2974674
(Nguồn: Kết quả phần mềm Stata 12)
Bảng 5.3: Ma trận hệ số tƣơng quan
NPL NII ROE LGR LR IER SIZE INEF SOLR GDPGR INFLA NPL 1 NII -0.005 1 ROE -0.2067 0.0410 1 LGR -0.1739 0.2717 0.0216 1 LR 0.0316 -0.0126 0.4203 -0.1820 1 IER 0.0342 -0.1087 -0.1536 -0.2325 0.0836 1 SIZE 0.2209 0.0978 0.3811 -0.1604 0.4212 -0.2159 1 INEF 0.0400 -0.2217 -0.5674 -0.1968 0.0265 0.2919 -0.2815 1 SOLR -0.0368 0.0028 -0.4101 0.1839 -0.9834 -0.0863 -0.4172 -0.0269 1 GDPGR -0.0708 -0.0982 0.2318 0.3188 -0.1102 -0.3092 0.0425 -0.4362 0.1006 1 INFLA -0.0012 -0.0443 0.0954 -0.1308 -0.1098 0.4521 -0.0087 -0.0582 0.0961 -0.1134 1
Sau đó kiểm định các giả thuyết xem mô hình có phù hợp hay không, đầu tiên ta kiểm định mô hình có bị đa cộng tuyến hay không
38
Bảng 5.4: Kiểm định đa cộng tuyến
Variable VIF 1/VIF
NII 1.45 0.691797 ROE 2.37 0.422132 LGR 1.57 0.636069 LR 33.38 0.029959 IER 2.04 0.491257 SIZE 1.60 0.625063 INEF 2.44 0.410378 SOLR 32.09 0.031158 GDPGR 4.56 0.219129 INFLA 60.17 0.016619 Mean VIF 13.86
(Nguồn: Kết quả phần mềm Stata 12)
Đa cộng tuyến xảy ra khi các biến độc lập có mối quan hệ với nhau, dẫn đến phƣơng sai lớn, khoảng tin cậy của các hệ số hồi quy lớn làm cho dấu các ƣớc lƣợng của hệ số hồi quy có thể sai lệch, hoặc không có ý nghĩa thống kê
Qua kiểm định vif cho thấy LR, SOLR, INFLA bị đa cộng tuyến, chọn khắc phục hiện tƣợng đa cộng tuyến bằng cách bỏ 2 biến trong 3 biến này, nghiên cứu gần đây chƣa tìm thấy bằng chứng về mối tƣơng quan có ý nghĩa giữa SOLR và NPL, còn biến vĩ mô INFLA nghiên cứu tại Việt Nam chƣa tìm hấy bằng chứng cho thấy mối quan hệ của biến này với NPL nên biến LR cần đƣợc giữ lại.
Các biến trong mô hình đƣợc điều chỉnh gồm 8 biến độc lập: NII, ROE, LGR, LR, IER, SIZE, INEF, GDPGR. Sau khi điều chỉnh lại các biến độc lập, tiếp theo ta kiểm tra hiện tƣợng đa cộng tuyến một lần nữa để khẳng định các biến đƣa vào mô hình là phù hợp.
39
Bảng 5.5: Kiểm định đa cộng tuyến
Variable VIF 1/VIF
NII 1.44 0.694605 ROE 2.37 0.422141 LGR 1.56 0.641527 LR 2.04 0.490238 IER 2.04 0.491264 SIZE 1.60 0.625110 INEF 2.43 0.410795 GDPGR 7.32 0.136551 Mean VIF 2.67
(Nguồn: Kết quả phần mềm Stata 12)
Bƣớc tiếp theo kiểm định phƣơng sai thay đổi cho mô hình với các biến đã đƣợc điều chỉnh không còn đa cộng tuyến, sử dụng kiểm định sau:
Bảng 5.6: Kiểm định phƣơng sai thay đổi
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity Ho: Constant variance
Variables: fitted values of npl chi2(1) = 641.07
Prob > chi2 = 0.0000
(Nguồn: Kết quả phần mềm Stata 12)
Kết quả kiểm định Breusch-Pagan với p_value rất nhỏ 0.0000 <5 %. bác bỏ giả thuyết Ho, cho thấy mô hình có hiện tƣợng phƣơng sai thay đổi.
Mô hình Pooled OLS còn nhiều nhƣợc điểm nhƣ xảy ra hiện tƣợng phƣơng sai thay đổi, tự tƣơng quan. Hiện tƣợng phƣơng sai thay đổi, tự tƣơng quan dẫn đến ƣớc lƣợng, kiểm định mô hình không còn đáng tin cậy, các hệ số hồi quy cũng không còn chính xác. Mô hình Pooled OLS không giải thích đƣợc tính riêng của các chủ thể nghiên cứu, nên ta cần so sánh và lựa chọn mô hình tốt hơn bằng cách dùng các kiểm định để lựa chọn các mô hình phù hợp tiếp theo, với hai mô hình REM và FEM có xét đến tính riêng của các chủ thể nghiên cứu.
40
Lựa chọn mô hình Pooled OLS và REM:
Tiến hành lựa chọn mô hình Pooled OLS và REM bằng kiểm định Breusch and Pagan Lagrangian.
Đối với ƣớc lƣợng tác động ngẫu nhiên, phƣơng pháp Lagrange (LM) với kiểm định Breusch-Pagan đƣợc sử dụng để kiểm chứng tính phù hợp của ƣớc lƣợng.
Bảng 5.7: Kiểm định Breusch-Pagan
Breusch and Pagan Lagrangian multiplier test for random effects npl[id,t] = Xb + u[id] + e[id,t]
Estimated results: | Var sd = sqrt(Var) ---+--- npl | .0005498 .0234488 e | .0003993 .0199835 u | .0000632 .0079478 Test: Var(u) = 0 chibar2(01) = 7.97 Prob > chibar2 = 0.0024
(Nguồn: Kết quả phần mềm Stata 12)
Đây là kiểm định giúp lựa chọn mô hình phù hợp hơn, qua bảng ta có p_value rất nhỏ 0.0024 < 5 %. Mô hình REM phù hợp.
Lựa chọn mô hình Pooled OLS và FEM:
Tiến hành lựa chọn mô hình Pooled OLS và FEM kiểm định F_test với giả thuyết Ho: tất cả các hệ số 𝑣 i đều bằng 0, ta có p_value = 0.0002 < 5% bác bỏ giả thuyết Ho, cho thấy mô hình FEM phù hợp.
Bảng 5.8: Mô hình hồi quy FEM
Fixed-effects (within) regression Number of obs = 193 Group variable: id Number of groups = 20 R-sq: within = 0.2187 Obs per group: min = 8 between = 0.1390 avg = 9.7
overall = 0.1087 max = 10 F(8,165) = 5.77
corr(u_i, Xb) = -0.7891 Prob > F = 0.0000
NPL Coef. Std. Err. t P>|t| [95% Conf. Interval]
NII -.003594 .0104622 -0.34 0.732 -.0242511 .017063 ROE -.1388197 .0412995 -3.36 0.001 -.2203634 -.057276 LGR -.0033817 .001666 -2.03 0.044 -.0066711 -.0000923
41
NPL Coef. Std. Err. t P>|t| [95% Conf. Interval]
LR .0147611 .0334231 0.44 0.659 -.051231 .0807531 IER .0199882 .0313264 0.64 0.524 -.0418641 .0818405 SIZE .3932667 .0865105 4.55 0.000 .2224563 .564077 INEF -.01355 .016843 -0.80 0.422 -.0468055 .0197055 GDPGR .0778819 .2534388 0.31 0.759 -.4225192 .5782831 _cons .0062039 .0338981 0.18 0.855 -.060726 .0731339
F test that all u_i=0: F(19, 165) = 2.80 Prob > F = 0.0002
(Nguồn: Kết quả phần mềm Stata 12)
Lựa chọn mô hình REM và FEM:
Tiếp theo tiến hành lựa chọn mô hình Pooled REM và FEM dùng kiểm định Hausman. Kiểm định Hausman sẽ đƣợc sử dụng để lựa chọn phƣơng pháp ƣớc lƣợng phù hợp giữa hai FEM và REM.
Khi giả thuyết H0 bị bác bỏ thì ƣớc lƣợng tác động cố định là phù hợp hơn so với ƣớc lƣợng tác động ngẫu nhiên. Ngƣợc lại, chƣa có đủ bằng chứng để bác bỏ H0
Bảng 5.9: Kết quả kiểm định Hausman
---- Coefficients ---- (b) fe (B) re (b-B) Difference sqrt(diag(V_b- V_B)) S.E. NII -.003594 -.0015368 -.0020573 .0027136 ROE -.1388197 -.1531813 .0143616 .0159701 LGR -.0033817 -.0030072 -.0003745 .0003923 LR .0147611 .0214829 -.0067218 .0115506 IER .0199882 .0284523 -.0084641 .0125917 SIZE .3932667 .151216 .2420507 .0759387 INEF -.01355 -.0188583 .0053083 .0062777 GDPGR .0778819 .0977643 -.0198824 .0212126
b = consistent under Ho and Ha; obtained from xtreg
B = inconsistent under Ha, efficient under Ho; obtained from xtreg Test: Ho: difference in coefficients not systematic
42 chi2(8) = (b-B)'[(V_b-V_B)^(-1)](b-B) = 2.78
Prob>chi2 = 0.9473
(V_b-V_B is not positive definite)
(Nguồn: Kết quả phần mềm Stata 12)
Với giả thuyết Ho: Sự khác biệt giữa các hệ số tƣơng quan không có tính hệ thống (hay mô hình REM là phù hợp), kiểm định cho kết quả p_value rất nhỏ 0.9473 > 5 %. Mô hình REM phù hợp.
Qua 3 mô hình Pooled OLS, FEM, REM ta có R2 lần lƣợt nhƣ sau:
+ Mô hình Pooled OLS có R2 đạt 23.16 % cho thấy các biến độc lập trong mô hình giải thích đƣợc 23.16 % sự biến động của NPL, mô hình có ROE, SIZE, INEF, GDPGR có ý nghĩa thống kê. ROE, SIZE có ý nghĩa thống kê tại mức ý nghĩa 1%, INEF, GDPGR có ý nghĩa thống kê tại mức ý nghĩa 5%.
+ Mô hình FEM có R2 đạt 10.87 % cho thấy các biến độc lập trong mô hình giải thích đƣợc 10.87 % sự biến động của NPL, mô hình có ROE, LGR, SIZE, có ý nghĩa thống kê. ROE, SIZE có ý nghĩa thống kê tại mức ý nghĩa 1%, LGR có ý nghĩa thống kê tại mức ý nghĩa 5%.
+ Mô hình REM có R2 đạt 16.95 % cho thấy các biến độc lập trong mô hình giải thích đƣợc 16.95 % sự biến động của NPL, mô hình có ROE, LGR, SIZE, có ý nghĩa thống kê. ROE, SIZE có ý nghĩa thống kê tại mức ý nghĩa 1%, LGR có ý nghĩa thống kê tại mức ý nghĩa 10%.
43
Bảng 5.10: Tổng hợp kết quả hồi quy mô hình Pooled OLS, FEM, REM với dữ liệu bảng không cân bằng
(1) (2) (3)
OLS FEM REM
VARIABLES npl npl npl NII 0.00861 -0.00359 -0.00154 (0.0106) (0.0105) (0.0101) ROE -0.169*** -0.139*** -0.153*** (0.0378) (0.0413) (0.0381) LGR -0.00156 -0.00338** -0.00301* (0.00173) (0.00167) (0.00162) LR 0.0368 0.0148 0.0215 (0.0333) (0.0334) (0.0314) IER 0.00430 0.0200 0.0285 (0.0350) (0.0313) (0.0287) SIZE 0.101*** 0.393*** 0.151*** (0.0324) (0.0865) (0.0414) INEF -0.0328** -0.0136 -0.0189 (0.0155) (0.0168) (0.0156) GDPGR 1.151** 0.0779 0.0978 (0.571) (0.253) (0.253) Constant -0.0557 0.00620 0.0139 (0.0511) (0.0339) (0.0321) Observations 193 193 193 R-squared 0.232 0.219 Number of id 20 20
Standard errors in parentheses *** p<0.01, ** p<0.05, * p<0.1
(Nguồn: Kết quả phần mềm Stata 12)
44
Vậy qua các kiểm định cho thấy mô hình REM phù hợp nhất trong 3 mô hình, bƣớc tiếp theo hồi quy lại mô hình REM một lần nữa, và kiểm tra hiện tƣợng đa cộng tuyến trong mô hình REM này.
Bảng 5.11: Kiểm định đa cộng tuyến Variable VIF 1/VIF
LR 145.30 0.006882 GDPGR 62.45 0.016013 INEF 20.75 0.048193 ROE 8.26 0.121100 IER 5.44 0.183708 NII 2.76 0.362611 SIZE 2.50 0.400207 LGR 1.66 0.602647 Mean VIF 31.14
(Nguồn: Kết quả phần mềm Stata 12)
Qua kiểm định vif cho thấy các biến LR, GDPGR, INEF bị đa cộng tuyến, khắc phục hiện tƣợng này một lần nữa chọn cách bỏ 2 biến trong 3 biến này, nghiên cứu trong nƣớc tìm thấy bằng chứng về mối tƣơng quan có ý nghĩa giữa INEF và NPL, nên biến INEF cần đƣợc giữ lại. Các biến trong mô hình đƣợc điều chỉnh gồm 6 biến độc lập: NII, ROE, LGR, IER, SIZE, INEF. Sau khi điều chỉnh lại các biến độc lập ta có mô hình REM mới nhƣ sau:
Bảng 5.12: Mô hình hồi quy REM
Random-effects GLS regression Number of obs = 193 Group variable: id Number of groups = 20 R-sq: within = 0.1764 Obs per group: min = 8 between = 0.2091 avg = 9.7
overall = 0.1687 max = 10 Wald chi2(6) = 37.76
corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0000
NPL Coef. Std. Err. t P>|t| [95% Conf. Interval]
NII -.0026064 .0095317 -0.27 0.785 -.0212882 .0160753 ROE -.1423701 .0336283 -4.23 0.000 -.2082803 -.0764599
45
NPL Coef. Std. Err. t P>|t| [95% Conf. Interval]
LGR -.002835 .0015515 -1.83 0.068 -.0058758 .0002059 IER .0270737 .0278933 0.97 0.332 -.0275961 .0817435 SIZE .1538867 .0377798 4.07 0.000 .0798396 .2279337 INEF -.0174735 .0135101 -1.29 0.196 -.0439528 .0090059 _cons .037378 .0099911 3.74 0.000 .0177958 .0569602
(Nguồn: Kết quả phần mềm Stata 12)
Mô hình REM sau khi đã loại bỏ LR, GDPGR có R2 mới đạt 16.87 % cho thấy các biến độc lập trong mô hình giải thích đƣợc 16.87 % sự biến động của NPL, mô hình cũng có ROE, LGR, SIZE có ý nghĩa thống kê.
Kiểm định cho thấy p_value = 0.0000 < 5% mô hình REM bị phƣơng sai thay đổi và tự tƣơng quan.
Bảng 5.13: Kết quả kiểm định phƣơng sai thay đổi và tự tƣơng quan cho mô hình REM
Tests for the error component model: npl[id,t] = Xb + u[id] + v[id,t] v[id,t] = lambda v[id,(t-1)] + e[id,t] Estimated results: | Var sd = sqrt(Var) ---+--- npl | .0005498 .0234488 e | .0003952 .01987962 u | .00005 .00707154 Tests:
Random Effects, Two Sided:
ALM(Var(u)=0) = 2.13 Pr>chi2(1) = 0.1443 Random Effects, One Sided:
ALM(Var(u)=0) = -1.46 Pr>N(0,1) = 0.9278 Serial Correlation:
ALM(lambda=0) = 76.96 Pr>chi2(1) = 0.0000
Joint Test:
LM(Var(u)=0,lambda=0) = 85.00 Pr>chi2(2) = 0.0000
(Nguồn: Kết quả phần mềm Stata 12)
Nhƣ vậy mô hình REM có hiện tƣợng tự tƣơng quan, phƣơng sai thay đổi. Vì vậy nghiên cứu chọn mô hình tiếp theo mô hình one-step GMM của Arellano & Bond (1981 và 1998). Dựa vào nghiên cứu Louzis et al. (2010) áp dụng cho nghiên cứu Việt Nam tác giả dùng mô hình one-step GMM.
46
Kiểm định mô hình GMM:
Các vấn đề hay gặp phổ biến là do đặc tính dữ liệu dẫn đến kết quả ƣớc lƣợng có thể bị chệch, hiện tƣợng đa cộng tuyến, phƣơng sai thay đổi, tự tƣơng quan. Do đó phƣơng pháp khắc phục đƣợc những tồn tại trên thƣờng đƣợc sử dụng là GMM.
Hầu hết trong những nghiên cứu gần đây nghiên cứu về các yếu tố tác động đến nợ xấu, nhiều nhà nghiên cứu đều sử dụng mô hình GMM nhƣ Salas & Saurina (2002), Raphael Espinoza and Ananthakrishnan Prasad (2010), Marijana Curak, Sandra Pepur, Klime Poposki (2013), Munib Badar & Yasmin Javid (2013).
Tác giả tham khảo nghiên cứu Louzis et al. (2010) sử dụng one-step GMM, cho ra mô hình sau:
GMM1: ∆NPLit=β1∆NPLi(t-1) + β2∆NIIit+ β3∆ROEit+ β4∆LGRit+β5∆IERit + β6∆SIZEit + β7∆INEFit + ∆ 𝜇it
GMM2: ∆NPLit=β1∆NPLi(t-1) + ∆β2LGRi(t-1) + ∆β3NIIit + β4∆ROEit+ β5∆LGRit+β6∆IERit + β7∆SIZEit + β8∆INEFit + ∆ 𝜇it
Lấy sai phân bậc nhất của các biến rồi hồi quy sai phân bậc nhất của các biến đó và độ trễ bậc 1 của sai phân biến phụ thuộc NPL ta có p_value = 0.0000 < 5% cho thấy tính phù hợp của mô hình. Mô hình one-step GMM (GMM1) cũng giúp giải quyết hiện tƣợng nội sinh.
Xem xét tác động trễ của biến tăng trƣởng tín dụng đến nợ xấu nhƣ thế nào, thực hiện hồi quy độ trễ bậc một của sai phân biến LGR trong mô hình one-step GMM (GMM2).
47
Bảng 5.14: Tổng hợp kết quả hồi quy mô hình GMM với dữ liệu bảng không cân bằng:
(1) (2)
GMM1 GMM2
VARIABLES delta_npl delta_npl L.delta_npl -0.0765 -0.0961 (0.178) (0.190) L.delta_lgr -0.00168 (0.00106) delta_nii 0.0167* 0.0159* (0.00903) (0.00914) delta_roe -0.0142 -0.0185 (0.0446) (0.0420) delta_lgr -0.00227* -0.00402*** (0.00118) (0.00101) delta_ier 0.0492** 0.0444** (0.0206) (0.0198) delta_size 0.275*** 0.313*** (0.107) (0.114) delta_inef 0.0189 0.0204 (0.0140) (0.0145) Observations 133 133 Number of id 20 20
Robust standard errors in parentheses *** p<0.01, ** p<0.05, * p<0.1
48