3.2.1. Dữ liệu nghiên cứu
Đối với các dữ liệu vi mô từ ngân hàng: Khóa luận thu thập từ báo cáo tài chính của 25 NHTMCP Việt Nam5
trong giai đoạn 2006 – 2016. Lý do luận văn chỉ sử dụng dữ liệu của 25 ngân hàng này trong giai đoạn đƣợc đề cập vì trong giai đoạn này chỉ có 25 NHTMCP công bố đủ dữ liệu mà luận văn cần. Các ngân hàng đƣợc chọn đáp ứng tiêu chí còn tồn tại và hoạt động cho tới hết năm 2016, có số liệu thống kê liên tục trong 10 năm
Với một số dữ liệu vĩ mô, tác giả lấy từ các nguồn uy tín nhƣ: tốc độ tăng trƣởng kinh tế GDP, tỷ lệ lạm phát và tỷ lệ thất nghiệp đƣợc lấy từ số liệu thống kê của World Bank, IMF.
3.2.2. Phƣơng pháp nghiên cứu
Để đo lƣờng tác động của các nhân tố vĩ mô và vi mô đến nợ xấu ngân hàng, tác giả sử dụng phƣơng pháp phân tích dữ liệu bảng (panel data) với ba phƣơng pháp khác nhau: phƣơng pháp pooled OLS, phƣơng pháp random effects (REM) và phƣơng pháp fixed effects (FEM). Tuy nhiên, việc ƣớc lƣợng theo mô hình pooled OLS không phản ánh đƣợc tác động riêng biệt, mang tính đặc thù của từng ngân hàng. Do đó, để khắc phục hạn chế này ở mô hình pooled OLS, nghiên cứu sử dụng Hausman test để lựa chọn giữa FEM và REM. Giả thuyết H0 làm nền tảng cho kiểm định Hausman là tác động cá biệt của mỗi đơn vị chéo không gian không có tƣơng quan với các biến hồi quy khác trong mô hình. Nếu có tƣơng quan (giả thuyết H0 bị từ chối), mô hình hồi quy theo REM sẽ cho kết quả bị thiên lệch, vì vậy mô hình theo FEM đƣợc ƣa thích hơn.
Tiếp theo, tác giả kiểm định các khuyết tật của mô hình FEM:
- Kiểm định hiện tƣợng đa cộng tuyến bằng ma trận tƣơng quan giữa các biến và hệ số nhân tử phóng đại VIF để loại trừ các biến có mối liên hệ với nhau.
- Hiện tƣợng phƣơng sai thay đổi thông qua đồ thị và kiểm định Wald. - Hiện tƣợng tƣ tƣơng quan thông qua phƣơng pháp Durbin Watson. Kết quả cho thấy mô hình FEM có hiện tƣợng phƣơng sai thay đổi.
Sau đó, mô hình Generalized method of moments (GMM) đƣợc sử dụng để khắc phục hiện tƣợng nội sinh và phƣơng sai thay đổi. Trong đó, hiện tƣợng biến nội sinh (đƣợc miêu tả qua biến khác) là biến độc lập trong mô hình có quan hệ hai chiều với biến phụ thuộc và/hoặc bị phần dƣ của mô hình tác động. Để khắc phục hiện tƣợng này, Lars Peter Hansen (1982) đã phát triển đƣa thêm biến công cụ (có quan hệ chặt với biến độc lập, phụ thuộc trong mô hình cũ những không có quan hệ với phần dƣ). Trong nghiên cứu này, các biến SIZEit, CREDITit, ROEit đƣợc xếp vào nhóm các biến đƣợc công cụ và đƣợc lấy giá trị độ trễ thứ nhất. Còn các biến NPLit-1, GDPit, INFit và UNTit đƣợc xếp vào nhóm các biến công cụ và giá trị hiện tại của chúng là công cụ thích hợp. Tính hợp lý của các biến công cụ đƣợc sử dụng trong phƣơng pháp GMM đƣợc đánh giá qua các thống kê Sargan (1958) và để kiểm định Sargan (1958) không bị yếu thì số lƣợng các biến công cụ đƣợc lựa chọn phải nhỏ hơn hoặc bằng số lƣợng các nhóm đối tƣợng nghiên cứu (số liệu mỗi ngân hàng trong giai đoạn 2006 – 2016 đƣợc xem là một nhóm, do đó nghiên cứu này có 25 nhóm tƣơng ứng với 25 ngân hàng). Bên cạnh đó, kiểm định Arellano & Bond – AR (1991) để kiểm tra tính chất tự tƣơng quan của phƣơng sai sai số mô hình GMM ở dạng sai phân và sử dụng tƣơng quan ở bậc hai AR (2) vì nó kiểm tra tự tƣơng quan ở mọi cấp độ. Tuy nhiên, kết quả mô hình cho thấy kiểm định Sargan không thỏa điều kiện, mặc dù các điều kiện khác đều thỏa. Do đó, phƣơng pháp GMM trong dữ liệu nghiên cứu này là chƣa khả thi.
Cuối cùng, tác giả sử dụng phƣơng pháp bình phƣơng tối thiểu tổng quát khả thi (Feasible Generalized Least Squares – FGLS) để kiểm soát đƣợc hiện tƣợng phƣơng sai thay đổi. Phƣơng pháp này sẽ ƣớc tính mô hình theo phƣơng pháp OLS (ngay cả trong trƣờng hợp có sự tồn tại của hiện tƣợng phƣơng sai thay đổi hay tự tƣơng quan). Các sai số đƣợc rút ra từ mô hình sẽ đƣợc dùng để ƣớc tính ma trận phƣơng sai – hiệp phƣơng sai của sai số. Cuối cùng, sử dụng ma trận này để chuyển đổi các tham số cần tìm trong mô hình. Kết quả p-value mô hình có ý nghĩa về mặt thống kê cao ở mức 1%. Vì vậy. các hệ số trong mô hình FGLS đƣợc lựa chọn làm kết quả cuối cùng của khóa luận.
KẾT LUẬN CHƢƠNG 3
Mục tiêu của chƣơng này là đề xuất mô hình nghiên cứu cụ thể, cách chọn biến, giả thuyết nghiên cứu và lý giải lý do chọn biến trong mô hình. Đồng thời, chƣơng này trình bày rõ các nguồn dữ liệu đƣợc thu thập và cách đo lƣờng các biến. Đặc biệt, phƣơng pháp ƣớc lƣợng mô hình và các kiểm định lần lƣợt đƣợc tác giả làm rõ.
Chƣơng 4 sẽ trình bày các kết quả nghiên cứu về tác động của các nhân tố đến nợ xấu cùng với thảo luận ý nghĩa của kết quả đạt đƣợc.
CHƢƠNG 4
KẾT QUẢ NGHIÊN CỨU THỰC NGHIỆM
Các chƣơng trƣớc của khóa luận đã trình bày về mô hình nghiên cứu, các phƣơng pháp và dữ liệu sẽ sử dụng để mô hình hóa các biến. Chƣơng này sẽ trình bày kết quả hồi quy và các kiểm định, quan sát mức ý nghĩa tác động và chiều hƣớng ảnh hƣởng của các biến độc lập đối với biến phụ thuộc là tỷ lệ nợ xấu NHTMCP. Mẫu nghiên cứu bao gồm 25 ngân hàng TMCP tại Việt Nam với 275 số quan sát, trong khoảng thời gian 10 năm từ 2006 – 2016.
4.1. THỐNG KÊ MÔ TẢ
Đầu tiên, về đặc điểm mẫu nghiên cứu, hiện nay, có nhiều kỹ thuật để xác định kích thƣớc mẫu đại diện cho mẫu tổng thể. Một trong những kỹ thuật xác định kích thƣớc mẫu dựa trên kinh nghiệm của Green (1991), tác giả khuyến nghị công thức xác định cỡ mẫu nghiên cứu nhƣ sau:
n 50 + 8m (2)
Trong đó, n là kích thƣớc mẫu tối thiểu cần thiết và m là số lƣợng biến độc lập trong mô hình.
Với công thức (2) và số biến độc lập trong mô hình (1) đã xây dựng ở chƣơng 3, ta có kích thƣớc mẫu tối thiểu là 106 số quan sát.
Ngoài ra, Tabachnick và Fidell (2007) cho rằng công thức xác định kích thƣớc mẫu đủ lớn để kết quả hồi quy đƣợc thuyết phục hơn là:
n 104 + m (3)
Nhƣ vậy, theo công thức (3), kích thƣớc mẫu tối thiểu là 111 số quan sát. Trong nghiên cứu này, mẫu nghiên cứu đƣợc hình thành từ việc thu thập dữ liệu của 25 ngân hàng TMCP hoạt động trên lãnh thổ Việt Nam có báo cáo tài chính, báo cáo thƣờng niên đƣợc công bố công khai trong giai đoạn từ năm 2006 đến 2016. Do có một số ngân hàng mới công bố công khai trong vài năm gần đây và một số ngân hàng đã tiền hành hợp nhất, sáp nhập số liệu nên mẫu nghiên cứu sau cùng là 275 số quan sát. Số quan sát này mẫu nghiên cứu thỏa điều kiện ở công thức (2) và (3).
Sau đó, để có một bức tranh cụ thể về các biến quan sát, khóa luận sử dụng phƣơng pháp thống kê mô tả, sử dụng các chỉ tiêu đo lƣờng bao gồm: số quan sát,
số trung bình, độ lệch chuẩn, giá trị lớn nhất và giá trị nhỏ nhất để làm rõ hơn về những đặc trƣng của các biến quan sát trong mẫu nghiên cứu. Lƣu ý là giá trị các biến đã đƣợc lấy giá trị logarit tự nhiên nhằm đảm bảo điều kiện giá trị nằm trong khoảng [- và đƣợc phân phối đối xứng.
Bảng 4.1. Thống kê mô tả các biến trong mô hình
Biến Số quan
sát Trung bình Độ lệch chuẩn Giá trị nhỏ nhất
Giá trị lớn nhất NPLit 269 -3,980146 0,764859 -7,130899 0,5988365 GDPit 275 0,0612455 0,0061772 0,0525 0,0713 INFit 275 0,0915382 0,0709486 0,019079 0,2267332 UNTit 275 0,0220909 0,0026143 0,018 0,026 ROEit 271 0,8216086 2,23173 -5,360193 7,214504 CREDITit 247 -1,26966 1,198215 -9,21034 2,2428583 SIZEit 271 2,371843 1,1332445 1,904761 2,626271
Nguồn: Kết xuất từ phần mềm Stata 13
Nhƣ vậy, bảng 4.1. mô tả giá trị trung trình, độ lệch chuẩn, giá trị nhỏ nhất và giá trị lớn nhất. Cỡ mẫu nghiên cứu gồm 275 - 269 quan sát cho mỗi biến. Đây là cỡ mẫu chấp nhận đƣợc để thực hiện hồi quy trong thống kê.
4.2. KẾT QUẢ MÔ HÌNH NGHIÊN CỨU 4.2.1. Phân tích tƣơng quan mô hình nghiên cứu 4.2.1. Phân tích tƣơng quan mô hình nghiên cứu
Bảng 4.2. Kết quả phân tích tƣơng quan các biến trong mô hình nghiên cứu
Biến NPLit NPLit-1 GDPit INFit UNTit CREDITi
t ROEit SIZE it NPLit 1,000 NPLit-1 0,4806 1,000 GDPit -0,3074 -0,1403 1,000 INFit - 0,02554 -0,3186 -0,0906 1,000 UNTit -0,3007 -0,1639 0,2405 0,0886 1,000 CREDIT it -0,2572 -0,1497 0,3095 0,080 0,4191 1,000 ROEit 0,0642 0,0716 0,0798 0,0806 0,1719 0,1460 1,000 SIZEit 0,0611 0,0897 -0,0826 -0,2721 -0,2773 -0,2419 -0,1778 1,0
Nguồn: Kết xuất từ phần mềm Stata 13
Hệ số tƣơng quan đơn tuyến tính giữa các cặp biến Pearson dùng để chỉ mối quan hệ giữa các biến trong mô hình. Dựa vào kết quả ma trận tƣơng quan, tác giả sẽ phân tích mối tƣơng quan giữa các biến phụ thuộc với các biến độc lập trong mô hình và mối tƣơng quan giữa các biến độc lập với nhau. Theo đó, dựa vào bảng 4.2. Kết quả phân tích tƣơng quan mô hình nghiên cứu, có thể thấy các biến độc lập gồm GDPit, INFit, UNTit, CREDITit tác động ngƣợc chiều đến NPLit; các biến độc lập còn lại gồm NPLit-1, ROEit, SIZEit ảnh hƣởng cùng chiều với NPLit.
Để phát hiện hiện tƣợng đa cộng tuyến giữa các biến, ta xem xét ma trận tƣơng quan giữa các biến. Theo Farrar & Glauber (1967), Gujarati (1995) và White (1998), nếu hệ số tƣơng quan cặp vƣợt quá 0,8 thì phƣơng trình hồi quy sẽ gặp vấn đề đa cộng tuyến. Do đó, để giảm tối đa hiện tƣợng đa cộng tuyến, tác giả tiến hành kiểm tra sự tƣơng quan giữa các biến để loại bỏ biến không cần thiết ra khỏi mô hình. Có thể nhận thấy các cặp biến ở mô hình đều có hệ số tƣơng quan nhỏ hơn 0,8. Tác giả kiểm tra lại bằng phƣơng pháp phóng đại nhân tử phƣơng sai VIF (Varince Inflation Factor) các biến này thì giá trị VIF trung bình bằng 1,22 và hệ số
phóng đại VIF của các biến đều nhỏ hơn 10. Do đó, không có hiện tƣợng đa cộng tuyến nghiêm trọng hay hiện tƣợng tự tƣơng quan giữa các biến độc lập trong mô hình.
Bảng 4.3. Kết quả sử dụng VIF để kiểm định hiện tƣợng đa cộng tuyến
Biến VIF 1/VIF
CREDITit 1,32 0,755298 UNT 1,31 0,763164 INF 1,24 0,808965 SIZE 1,20 0,833425 GDPit-1 1,19 0,840370 GDPit 1,17 0,855220 ROE 1,08 0,928570 Trung bình VIF 1,22
Nguồn: Kết xuất từ phần mềm Stata 13
4.2.2. Lựa chọn mô hình phù hợp
- Kết quả mô hình Pooled OLS, REM và FEM
Kết quả chạy hồi quy mô hình Pooled OLS, FEM và REM lần lƣợt đƣợc trình bày trong bảng 4.4:
Bảng 4.4. Tổng hợp kết quả mô hình nghiên cứu Pooled OLS, FEM và REM
Biến POOLED OLS REM FEM
GDPit -22,45925*** (7,885816) -22,45925*** (7,885816) -24,17823*** (7,903077) UNTit -50,85849*** (18,30622) -50,85849*** (18,30622) -33,40755* (20,00597) INFit 1,172621* (0,641936) 1,172621* (0,641936) 1,438222** (0,7242406) NPLit-1 0,4630961*** (0,0632061) 0,4630961*** (0,0632061) 0,29916*** (0,0733148) SIZEit -0,1220305 -0,1220305 1,204488
(0,3877466) (0,3877466) (0,8821612) CREDITit -0,0562623 (0,0408604) -0,0562623 (0,0408604) -0,0277163 (0,0495247) ROEit 0,0264713 (0,0199734) 0,0264713 (0,0199734) -0,1107841** (0,0526507) Cons 0,4477362 (1,18414) 0,4477362 (1,18414) -3,526538 (2,395159) Số quan sát 218 218 218 F(7,210) = 15,77 Wald chi2(7) = 110,40 F(7,186) = 11,76 Prob > F = 0,000 Prob > chi2 = 0,0000 Prob > F = 0,0000 R2 = 0,3446 R2 overall = 0,3446 R2 overall = 0,1453
Nguồn: Tổng hợp của tác giả
Ghi chú: số liệu ở trong dấu ngoặc () là sai số chuẩn của hệ số hồi quy. Ký hiệu *, **, *** có ý nghĩa thống kê lần lƣợt tại 10%, 5%, 1%.
Dựa vào bảng 4.4 tác giả nhận xét kết quả nhƣ sau:
Đầu tiên, nghiên cứu tiến hành ƣớc lƣợng hồi quy theo mô hình POOLED OLS, REM, FEM. Kết quả bảng 4.3 cho thấy R2 lần lƣợt của POOLED OLS, REM, FEM là 34,46%, 34,46%, 14,53%. Điều này thể hiện rằng các biến độc lập đƣợc sử dụng trong mô hình có thể đã giải thích đƣợc 34,46%, 34,46%, 14,53% sự thay đổi trong tỷ lệ nợ xấu của các ngân hàng.
Giá trị p-value của mô hình đƣợc ƣớc lƣợng theo 3 phƣơng pháp trên đều là 0,0000 – giá trị này nhỏ hơn = 0,01. Nhƣ vậy, ƣớc lƣợng của ba phƣơng pháp này đều có ý nghĩa thống kê.
Theo kết quả ở cột 1 của bảng 4.3, hệ số hồi quy của các biến GDPit, UNTit, INFit, NPLit-1 đều có ý nghĩa về mặt thống kê. Trong đó, biến GDPit, UNTit tác động ngƣợc chiều đến NPLit với mức ý nghĩa 1%, còn biến INFit và NPLit-1 tác động cùng chiều với NPLit với mức ý nghĩa lần lƣợt là 10%, 1%. Tuy nhiên, các biến SIZEit,
CREDITit mặc dù có tác động ngƣợc chiều lên NPLit nhƣng lại không có ý nghĩa thống kê. Ngoài ra còn biến ROEit có tác động cùng chiều với tỷ lệ nợ xấu nhƣng cũng không có ý nghĩa thống kê.
Tuy nhiên, việc ƣớc lƣợng theo mô hình Pooled OLS không phản ánh đƣợc tác động riêng biệt, mang tính đặc thù của từng ngân hàng. Do đó, để khắc phục hạn chế này ở mô hình Pooled OLS, nghiên cứu tiếp tục lựa chọn ƣớc lƣợng mô hình hồi quy theo phƣơng pháp tác động cố định FEM và tác động ngẫu nhiên REM. Kết quả hồi quy cho thấy kết quả mô hình REM có các thông số giống với mô hình Pooled OLS, còn mô hình FEM thì các biến GDPit, UNTit, INFit, NPLit-1 đều cùng dấu với mô hình Pooled OLS và có ý nghĩa nhƣng mức độ tác động và mức ý nghĩa lại có sự khác nhau ở 2 mô hình. Bên cạnh đó, ở mô hình FEM có thêm một biến có ý nghĩa ở mức 5% là biến ROEit – ngƣợc dấu với tỷ lệ nợ xấu ngân hàng.
Vì vậy, để xác định mô hình nào phù hợp hơn, nghiên cứu thực hiện kiểm định Hausman Test để chọn lựa giữa mô hình FEM và REM.
Cả hai mô hình FEM và REM đều phù hợp nên tác giả sẽ dùng kiểm định Hausman Test (Green, 2008) với giả thuyết H0 – REM hiệu quả hơn, không có sự tƣơng quan giữa sai số đặc trƣng giữa các ngân hàng với các biến giải thích trong mô hình. Qua đó, kiểm soát các yếu tố đặc trƣng của mỗi ngân hàng có khả năng tác động đến nợ xấu.
Bảng 4.5. Kiểm định Hausman để lựa chọn giữa REM và FEM
Test: H0: difference in coefficients not systemtic Chi2(7) = (b-B)‟[(V_b-V_B) ^ (-1)] (b-B) = 23,48
Prob > chi2 = 0,0014
(V_b-V_B is not positive definite)
Nguồn: Kết xuất từ phần mềm Stata 13
Kiểm định cho kết quả p-value = 0,0014 < = 0,05. Với mức ý nghĩa 1%, ta bác bỏ giả thuyết H0, tức mô hình FEM đƣợc chọn. Nhƣ vậy, trong ba mô hình Pooled OLS, REM và FEM khi hồi quy dữ liệu bảng thì mô hình FEM là phù hợp
nhất với tổng thể số liệu nghiên cứu các nhân tố tác động đến tỷ lệ nợ xấu tại các NHTM.
4.2.3. Kiểm định các giả thiết hồi quy mô hình nghiên cứu
Với việc lựa chọn mô hình FEM, các kiểm định phƣơng sai sai số thay đổi và tự tƣơng quan cần đƣợc thực hiện để đảm bảo rằng mô hình không vi phạm những giả định về sự phù hợp của mô hình.
- Kiểm định tự tương quan
Khi sử dụng mô hình FEM thì sẽ không còn lo ngại hiện tƣợng tự tƣơng quan vì mô hình FEM chỉ quan tâm đến những khác biệt mạng tính cá nhân đóng góp vào mô hình nên sẽ không có hiện tƣợng tự tƣơng quan trong mô hình. Tuy nhiên, tác giả vẫn thực hiện kiểm định Durbin – Watson để đảm bảo điều kiện này:
Bảng 4.6. Kiểm định hiện tự tƣơng quan trong mô hình FEM