Đối với các dữ liệu vi mô từ ngân hàng: Khóa luận thu thập từ báo cáo tài chính của 25 NHTMCP Việt Nam5 trong giai đoạn 2006 – 2016. Lý do luận văn chỉ
sử dụng dữ liệu của 25 ngân hàng này trong giai đoạn đƣợc đề cập vì trong giai đoạn này chỉcó 25 NHTMCP công bố đủ dữ liệu mà luận văn cần. Các ngân hàng đƣợc chọn đáp ứng tiêu chí còn tồn tại và hoạt động cho tới hết năm 2016, có số
liệu thống kê liên tục trong 10 năm
Với một số dữ liệu vĩ mô, tác giả lấy từ các nguồn uy tín nhƣ: tốc độ tăng trƣởng kinh tế GDP, tỷ lệ lạm phát và tỷ lệ thất nghiệp đƣợc lấy từ số liệu thống kê
của World Bank, IMF.
3.2.2. Phƣơng pháp nghiên cứu
Đểđo lƣờng tác động của các nhân tố vĩ mô và vi mô đến nợ xấu ngân hàng, tác giả sử dụng phƣơng pháp phân tích dữ liệu bảng (panel data) với ba phƣơng
pháp khác nhau: phƣơng pháp pooled OLS, phƣơng pháp random effects (REM) và phƣơng pháp fixed effects (FEM). Tuy nhiên, việc ƣớc lƣợng theo mô hình pooled
OLS không phản ánh đƣợc tác động riêng biệt, mang tính đặc thù của từng ngân hàng. Do đó, để khắc phục hạn chếnày ởmô hình pooled OLS, nghiên cứu sử dụng
Hausman test để lựa chọn giữa FEM và REM. Giả thuyết H0làm nền tảng cho kiểm
định Hausman là tác động cá biệt của mỗi đơn vị chéo không gian không có tƣơng
quan với các biến hồi quy khác trong mô hình. Nếu có tƣơng quan (giả thuyết H0 bị
từ chối), mô hình hồi quy theo REM sẽ cho kết quả bị thiên lệch, vì vậy mô hình theo FEM đƣợc ƣa thích hơn.
Tiếp theo, tác giả kiểm định các khuyết tật của mô hình FEM:
- Kiểm định hiện tƣợng đa cộng tuyến bằng ma trận tƣơng quan giữa các biến
và hệ sốnhân tửphóng đại VIF để loại trừcác biến có mối liên hệ với nhau. - Hiện tƣợng phƣơng sai thay đổi thông qua đồ thị và kiểm định Wald. - Hiện tƣợng tƣ tƣơng quan thông qua phƣơng pháp Durbin Watson. Kết quả cho thấy mô hình FEM có hiện tƣợng phƣơng sai thay đổi.
31
Sau đó, mô hình Generalized method of moments (GMM) đƣợc sử dụng để
khắc phục hiện tƣợng nội sinh và phƣơng sai thay đổi. Trong đó, hiện tƣợng biến nội sinh (đƣợc miêu tả qua biến khác) là biến độc lập trong mô hình có quan hệ hai chiều với biến phụ thuộc và/hoặc bị phần dƣ của mô hình tác động. Để khắc phục hiện tƣợng này, Lars Peter Hansen (1982) đã phát triển đƣa thêm biến công cụ (có
quan hệ chặt với biến độc lập, phụ thuộc trong mô hình cũ những không có quan hệ
với phần dƣ). Trong nghiên cứu này, các biến SIZEit, CREDITit, ROEit đƣợc xếp
vào nhóm các biến đƣợc công cụ và đƣợc lấy giá trị độ trễ thứ nhất. Còn các biến NPLit-1, GDPit, INFit và UNTit đƣợc xếp vào nhóm các biến công cụ và giá trị hiện tại của chúng là công cụ thích hợp. Tính hợp lý của các biến công cụđƣợc sử dụng
trong phƣơng pháp GMM đƣợc đánh giá qua các thống kê Sargan (1958) và để
kiểm định Sargan (1958) không bị yếu thì số lƣợng các biến công cụđƣợc lựa chọn phải nhỏhơn hoặc bằng sốlƣợng các nhóm đối tƣợng nghiên cứu (số liệu mỗi ngân hàng trong giai đoạn 2006 –2016 đƣợc xem là một nhóm,do đó nghiên cứu này có 25 nhóm tƣơng ứng với 25 ngân hàng). Bên cạnh đó, kiểm định Arellano & Bond – AR (1991) để kiểm tra tính chất tựtƣơng quan của phƣơng sai sai sốmô hình GMM ở dạng sai phân và sử dụng tƣơng quan ở bậc hai AR (2) vì nó kiểm tra tự tƣơng
quan ở mọi cấp độ. Tuy nhiên, kết quả mô hình cho thấy kiểm định Sargan không
thỏa điều kiện, mặc dù các điều kiện khác đều thỏa. Do đó, phƣơng pháp GMM
trong dữ liệu nghiên cứu này là chƣa khả thi.
Cuối cùng,tác giả sử dụng phƣơng pháp bình phƣơng tối thiểu tổng quát khả
thi (Feasible Generalized Least Squares – FGLS) để kiểm soát đƣợc hiện tƣợng
phƣơng sai thay đổi. Phƣơng pháp này sẽƣớc tính mô hình theo phƣơng pháp OLS
(ngay cảtrong trƣờng hợp có sự tồn tại của hiện tƣợng phƣơng sai thay đổi hay tự tƣơng quan). Các sai số đƣợc rút ra từ mô hình sẽ đƣợc dùng để ƣớc tính ma trận
phƣơng sai – hiệp phƣơng sai của sai số. Cuối cùng, sử dụng ma trận này để chuyển
đổi các tham số cần tìm trong mô hình. Kết quả p-value mô hình có ý nghĩa về mặt thống kê cao ở mức 1%. Vì vậy. các hệ sốtrong mô hình FGLS đƣợc lựa chọn làm
32
KẾT LUẬN CHƢƠNG 3
Mục tiêu của chƣơng này là đề xuất mô hình nghiên cứu cụ thể, cách chọn biến, giả thuyết nghiên cứu và lý giải lý do chọn biến trong mô hình. Đồng thời,
chƣơng này trình bày rõ các nguồn dữ liệu đƣợc thu thập và cách đo lƣờng các biến.
Đặc biệt, phƣơng pháp ƣớc lƣợng mô hình và các kiểm định lần lƣợt đƣợc tác giả làm rõ.
Chƣơng 4 sẽtrình bày các kết quảnghiên cứu vềtác động của các nhân tốđến nợ xấu cùng với thảo luận ý nghĩa của kết quảđạt đƣợc.
33
CHƢƠNG 4
KẾT QUẢNGHIÊN CỨU THỰC NGHIỆM
Các chƣơng trƣớc của khóa luận đã trình bày về mô hình nghiên cứu, các phƣơng pháp và dữ liệu sẽ sử dụng để mô hình hóa các biến. Chƣơng này sẽ trình bày kết quả hồi quy và các kiểm định, quan sát mức ý nghĩa tác động và chiều
hƣớng ảnh hƣởng của các biến độc lập đối với biến phụ thuộc là tỷ lệ nợ xấu NHTMCP. Mẫu nghiên cứu bao gồm 25 ngân hàng TMCP tại Việt Nam với 275 số quan sát, trong khoảng thời gian 10 năm từ 2006 – 2016.
4.1. THỐNG KÊ MÔ TẢ
Đầu tiên, về đặc điểm mẫu nghiên cứu, hiện nay, có nhiều kỹ thuật để xác định kích thƣớc mẫu đại diện cho mẫu tổng thể. Một trong những kỹ thuật xác định
kích thƣớc mẫu dựa trên kinh nghiệm của Green (1991), tác giả khuyến nghị công
thức xác định cỡ mẫu nghiên cứu nhƣ sau:
n 50 + 8m (2)
Trong đó, n là kích thƣớc mẫu tối thiểu cần thiết và m là sốlƣợng biến độc lập
trong mô hình.
Với công thức (2) và số biến độc lập trong mô hình (1) đã xây dựng ởchƣơng
3, ta có kích thƣớc mẫu tối thiểu là 106 sốquan sát.
Ngoài ra, Tabachnick và Fidell (2007) cho rằng công thức xác định kích thƣớc mẫu đủ lớn để kết quả hồi quy đƣợc thuyết phục hơn là:
n 104 + m (3)
Nhƣ vậy, theo công thức (3), kích thƣớc mẫu tối thiểu là 111 sốquan sát. Trong nghiên cứu này, mẫu nghiên cứu đƣợc hình thành từ việc thu thập dữ
liệu của 25 ngân hàng TMCP hoạt động trên lãnh thổ Việt Nam có báo cáo tài chính, báo cáo thƣờng niên đƣợc công bố công khai trong giai đoạn từ năm 2006 đến 2016. Do có một sốngân hàng mới công bốcông khai trong vài năm gần đây và
một số ngân hàng đã tiền hành hợp nhất, sáp nhập số liệu nên mẫu nghiên cứu sau
cùng là 275 sốquan sát. Sốquan sát này mẫu nghiên cứu thỏa điều kiện ở công thức
(2) và (3).
Sau đó, để có một bức tranh cụ thể về các biến quan sát, khóa luận sử dụng
34 số trung bình, độ lệch chuẩn, giá trị lớn nhất và giá trị nhỏ nhất để làm rõ hơn về
những đặc trƣng của các biến quan sát trong mẫu nghiên cứu. Lƣu ý là giá trị các
biến đã đƣợc lấy giá trị logarit tự nhiên nhằm đảm bảo điều kiện giá trị nằm trong khoảng [- và đƣợc phân phối đối xứng.
Bảng 4.1. Thống kê mô tảcác biến trong mô hình
Biến Số quan
sát Trung bình Độ lệch chuẩn Giá trịnhấ nht ỏ
Giá trị lớn nhất NPLit 269 -3,980146 0,764859 -7,130899 0,5988365 GDPit 275 0,0612455 0,0061772 0,0525 0,0713 INFit 275 0,0915382 0,0709486 0,019079 0,2267332 UNTit 275 0,0220909 0,0026143 0,018 0,026 ROEit 271 0,8216086 2,23173 -5,360193 7,214504 CREDITit 247 -1,26966 1,198215 -9,21034 2,2428583 SIZEit 271 2,371843 1,1332445 1,904761 2,626271 Nguồn: Kết xuất từ phần mềm Stata 13
Nhƣ vậy, bảng 4.1. mô tả giá trịtrung trình, độ lệch chuẩn, giá trị nhỏ nhất và giá trị lớn nhất. Cỡ mẫu nghiên cứu gồm 275 - 269 quan sát cho mỗi biến. Đây là cỡ
35
4.2. KẾT QUẢMÔ HÌNH NGHIÊN CỨU
4.2.1. Phân tích tƣơng quan mô hình nghiên cứu
Bảng 4.2. Kết quảphân tíchtƣơng quancác biến trong mô hình nghiên cứu
Biến NPLit NPLit-1 GDPit INFit UNTit CREDITi
t ROEit SIZE it NPLit 1,000 NPLit-1 0,4806 1,000 GDPit -0,3074 -0,1403 1,000 INFit - 0,02554 -0,3186 -0,0906 1,000 UNTit -0,3007 -0,1639 0,2405 0,0886 1,000 CREDIT it -0,2572 -0,1497 0,3095 0,080 0,4191 1,000 ROEit 0,0642 0,0716 0,0798 0,0806 0,1719 0,1460 1,000 SIZEit 0,0611 0,0897 -0,0826 -0,2721 -0,2773 -0,2419 -0,1778 1,0 Nguồn: Kết xuất từ phần mềm Stata 13
Hệ số tƣơng quan đơn tuyến tính giữa các cặp biến Pearson dùng để chỉ mối quan hệ giữa các biến trong mô hình. Dựa vào kết quả ma trận tƣơng quan, tác giả
sẽphân tích mối tƣơng quan giữa các biến phụ thuộc với các biến độc lập trong mô hình và mối tƣơng quan giữa các biến độc lập với nhau. Theo đó, dựa vào bảng 4.2. Kết quảphân tích tƣơng quan mô hình nghiên cứu, có thể thấy các biến độc lập gồm GDPit, INFit, UNTit, CREDITit tác động ngƣợc chiều đến NPLit; các biến độc lập
còn lại gồm NPLit-1, ROEit, SIZEitảnh hƣởng cùng chiều với NPLit.
Để phát hiện hiện tƣợng đa cộng tuyến giữa các biến, ta xem xét ma trận
tƣơng quan giữa các biến. Theo Farrar & Glauber (1967), Gujarati (1995) và White
(1998), nếu hệ số tƣơng quan cặp vƣợt quá 0,8 thì phƣơng trình hồi quy sẽ gặp vấn
đềđa cộng tuyến. Do đó, để giảm tối đa hiện tƣợng đa cộng tuyến, tác giả tiến hành
kiểm tra sự tƣơng quan giữa các biến để loại bỏ biến không cần thiết ra khỏi mô hình. Có thể nhận thấy các cặp biến ở mô hình đều có hệ số tƣơng quan nhỏ hơn 0,8. Tác giả kiểm tra lại bằng phƣơng pháp phóng đại nhân tử phƣơng sai VIF
36
phóng đại VIF của các biến đều nhỏ hơn 10. Do đó, không có hiện tƣợng đa cộng tuyến nghiêm trọng hay hiện tƣợng tự tƣơng quan giữa các biến độc lập trong mô hình.
Bảng 4.3. Kết quả sử dụng VIF để kiểm định hiện tƣợng đa cộng tuyến
Biến VIF 1/VIF CREDITit 1,32 0,755298 UNT 1,31 0,763164 INF 1,24 0,808965 SIZE 1,20 0,833425 GDPit-1 1,19 0,840370 GDPit 1,17 0,855220 ROE 1,08 0,928570 Trung bình VIF 1,22 Nguồn: Kết xuất từ phần mềm Stata 13 4.2.2. Lựa chọn mô hình phù hợp
- Kết quảmô hình Pooled OLS, REM và FEM
Kết quả chạy hồi quy mô hình Pooled OLS, FEM và REM lần lƣợt đƣợc trình bày trong bảng 4.4:
Bảng 4.4. Tổng hợp kết quảmô hình nghiên cứu Pooled OLS, FEM và REM
Biến POOLED OLS REM FEM
GDPit -22,45925*** (7,885816) -22,45925*** (7,885816) -24,17823*** (7,903077) UNTit -50,85849*** (18,30622) -50,85849*** (18,30622) -33,40755* (20,00597) INFit 1,172621* (0,641936) 1,172621* (0,641936) 1,438222** (0,7242406) NPLit-1 0,4630961*** (0,0632061) 0,4630961*** (0,0632061) 0,29916*** (0,0733148) SIZEit -0,1220305 -0,1220305 1,204488
37 (0,3877466) (0,3877466) (0,8821612) CREDITit -0,0562623 (0,0408604) -0,0562623 (0,0408604) -0,0277163 (0,0495247) ROEit 0,0264713 (0,0199734) 0,0264713 (0,0199734) -0,1107841** (0,0526507) Cons 0,4477362 (1,18414) 0,4477362 (1,18414) -3,526538 (2,395159) Số quan sát 218 218 218 F(7,210) = 15,77 Wald chi2(7) = 110,40 F(7,186) = 11,76 Prob > F = 0,000 Prob > chi2 = 0,0000 Prob > F = 0,0000 R2 = 0,3446 R2 overall = 0,3446 R2 overall = 0,1453
Nguồn: Tổng hợp của tác giả
Ghi chú: số liệu ở trong dấu ngoặc () là sai số chuẩn của hệ số hồi quy. Ký
hiệu *, **, *** có ý nghĩa thống kê lần lƣợt tại 10%, 5%, 1%. Dựa vào bảng 4.4 tác giả nhận xét kết quảnhƣ sau:
Đầu tiên, nghiên cứu tiến hành ƣớc lƣợng hồi quy theo mô hình POOLED
OLS, REM, FEM. Kết quả bảng 4.3 cho thấy R2 lần lƣợt của POOLED OLS, REM,
FEM là 34,46%, 34,46%, 14,53%. Điều này thể hiện rằng các biến độc lập đƣợc sử
dụng trong mô hình có thểđã giải thích đƣợc 34,46%, 34,46%, 14,53% sự thay đổi trong tỷ lệ nợ xấu của các ngân hàng.
Giá trị p-value của mô hình đƣợc ƣớc lƣợng theo 3 phƣơng pháp trên đều là
0,0000 –giá trịnày nhỏhơn = 0,01. Nhƣ vậy, ƣớc lƣợng của ba phƣơng pháp này đều có ý nghĩa thống kê.
Theo kết quả ở cột 1 của bảng 4.3, hệ số hồi quy của các biến GDPit, UNTit, INFit, NPLit-1đều có ý nghĩa về mặt thống kê. Trong đó, biến GDPit, UNTittác động
ngƣợc chiều đến NPLit với mức ý nghĩa 1%, còn biến INFit và NPLit-1tác động cùng
38 CREDITit mặc dù có tác động ngƣợc chiều lên NPLit nhƣng lại không có ý nghĩa
thống kê. Ngoài ra còn biến ROEit có tác động cùng chiều với tỷ lệ nợ xấu nhƣng cũng không có ý nghĩa thống kê.
Tuy nhiên, việc ƣớc lƣợng theo mô hình Pooled OLS không phản ánh đƣợc
tác động riêng biệt, mang tính đặc thù của từng ngân hàng. Do đó, để khắc phục hạn chế này ở mô hình Pooled OLS, nghiên cứu tiếp tục lựa chọn ƣớc lƣợng mô hình
hồi quy theo phƣơng pháp tác động cốđịnh FEM và tác động ngẫu nhiên REM. Kết quả hồi quy cho thấy kết quả mô hình REM có các thông số giống với mô hình
Pooled OLS, còn mô hình FEM thì các biến GDPit, UNTit, INFit, NPLit-1 đều cùng
dấu với mô hình Pooled OLS và có ý nghĩa nhƣng mức độtác động và mức ý nghĩa
lại có sựkhác nhau ở2 mô hình. Bên cạnh đó, ởmô hình FEM có thêm một biến có ý nghĩa ở mức 5% là biến ROEit–ngƣợc dấu với tỷ lệ nợ xấu ngân hàng.
Vì vậy, để xác định mô hình nào phù hợp hơn, nghiên cứu thực hiện kiểm
định Hausman Test để chọn lựa giữa mô hình FEM và REM.
Cả hai mô hình FEM và REM đều phù hợp nên tác giả sẽ dùng kiểm định Hausman Test (Green, 2008) với giả thuyết H0 – REM hiệu quả hơn, không có sự tƣơng quan giữa sai số đặc trƣng giữa các ngân hàng với các biến giải thích trong mô hình. Qua đó, kiểm soát các yếu tốđặc trƣng của mỗi ngân hàng có khảnăng tác động đến nợ xấu.
Bảng 4.5. Kiểm định Hausman để lựa chọn giữa REM và FEM
Test: H0: difference in coefficients not systemtic Chi2(7) = (b-B)‟[(V_b-V_B) ^ (-1)] (b-B) = 23,48
Prob > chi2 = 0,0014
(V_b-V_B is not positive definite)
Nguồn: Kết xuất từ phần mềm Stata 13
Kiểm định cho kết quả p-value = 0,0014 < = 0,05. Với mức ý nghĩa 1%, ta bác bỏ giả thuyết H0, tức mô hình FEM đƣợc chọn. Nhƣ vậy, trong ba mô hình Pooled OLS, REM và FEM khi hồi quy dữ liệu bảng thì mô hình FEM là phù hợp
39 nhất với tổng thể số liệu nghiên cứu các nhân tố tác động đến tỷ lệ nợ xấu tại các
NHTM.
4.2.3. Kiểm định các giả thiết hồi quy mô hình nghiên cứu
Với việc lựa chọn mô hình FEM, các kiểm định phƣơng sai sai sốthay đổi và
tự tƣơng quan cần đƣợc thực hiện đểđảm bảo rằng mô hình không vi phạm những giảđịnh về sựphù hợp của mô hình.
- Kiểm định tựtương quan
Khi sử dụng mô hình FEM thì sẽkhông còn lo ngại hiện tƣợng tựtƣơng quan vì mô hình FEM chỉquan tâm đến những khác biệt mạng tính cá nhân đóng góp vào mô hình nên sẽ không có hiện tƣợng tự tƣơng quan trong mô hình. Tuy nhiên, tác
giả vẫn thực hiện kiểm định Durbin –Watson đểđảm bảo điều kiện này:
40
Bảng 4.6. Kiểm định hiện tựtƣơng quan trong mô hình FEM
Dependent Variable: NPL