Dữ liệu được vi mô sử dụng trong bài nghiên cứu được thu thập chủ yếu từ báo cáo tài chính của 15 NHTM Việt Nam, bao gồm: Ngân hàng Á Châu (ACB), Ngân hàng Nông nghiệp và Phát triển Nông thôn Việt Nam (Agribank), Ngân hàng Đầu tư và Phát triển Việt Nam (BIDV), Ngân hàng Xuất nhập khẩu Việt Nam (Eximbank),
Ngân hàng Phát triển Thành phố Hồ Chí Minh (HDBank), Ngân hàng Hàng hải Việt Nam (Maritime Bank), Ngân hàng Quân đội (MB), Ngân hàng Sài Gòn thương tín (Sacombank), Ngân hàng Sài Gòn (SCB), Ngân hàng Sài Gòn – Hà Nội (SHB), Ngân hàng Kỹ thương Việt Nam (Techcombank), Ngân hàng quốc tế (VIB), Ngân hàng Ngoại thương Việt Nam (Vietcombank), Ngân hàng Công thương Việt Nam (VietinBank) và Ngân hàng Việt Nam Thịnh Vượng (VPBank) trong giai đoạn 2007 – 2016. Còn đối với 2 yếu tố vĩ mô là tốc độ tăng trưởng GDP và tỷ lệ lạm phát, số liệu đều được lấy từ báo cáo chính thức của World Bank.
Lý do mà tác giả lựa chọn 15 ngân hàng này là vì đây là 15 ngân hàng lớn nhất của Việt Nam, có thời gian tồn tại, hoạt động liên tục và thực hiện thống kê các số liệu một cách đầy đủ, rõ ràng trong suốt giai đoạn nghiên cứu. Bên cạnh đó, đối với những chỉ tiêu vĩ mô như tăng trưởng GDP và tỷ lệ lạm phát tại Việt Nam từ năm 2007 đến 2016, tác giả sẽ lấy số liệu chính thức từ World Bank nhằm đảm bảo sự chính xác và thống nhất.
3.3. Phƣơng pháp nghiên cứu 3.3.1. Hồi quy dữ liệu bảng
Dữ liệu bảng (Panel Data) là dạng dữ liệu được sử dụng rộng rãi nhất trong các nghiên cứu cả về vi mô (trong phạm vi hộ gia đình, doanh nghiệp) và vĩ mô (trong phạm vi thành phố hoặc quốc gia). Đây là dạng dữ liệu được kết hợp từ 2 loại dữ liệu khác nhau là dữ liệu chuỗi thời gian (Time series: tập hợp các quan sát của một biến số được thu thập theo thời gian gắn liền với một tần suất quan sát cụ thể) và dữ liệu chéo (Cross – section data: tập hợp thông tin của nhiều biến tại một thời điểm cụ thể). Sự kết hợp này đã tạo ra rất nhiều thuận lợi đáng kể trong quá trình nghiên cứu, tiêu biểu nhất là trong việc phân tích mối liên hệ giữa các thành phần kinh tế theo thời gian hoặc là trong phân tích sự khác biệt giữa các nhóm đối tượng nghiên cứu xác định.
Cấu trúc của dữ liệu bảng được chia ra thành 02 loại: cân bằng (balanced) và không cân bằng (unbalanced). Dữ liệu bảng được xem là cân bằng khi có đầy đủ các thông tin, số liệu của các đối tượng trong tất cả những năm quan sát và không bị mất số liệu trong bất cứ năm quan sát nào. Ngược lại, dữ liệu bảng không cân bằng khi thiếu mất một số thông tin của một hoặc nhiều đối tượng nghiên cứu.
Hiện nay, kiểu dữ liệu bảng đang ngày càng được sử dụng rộng rãi vì các lý do sau: - Dữ liệu bảng có chứa các thông tin liên quan đến đối tượng đơn vị bao gồm các
cá nhân, doanh nghiệp, thành phố, đất nước,… qua thời gian nên rất cần có tính dị biệt (tính không đồng nhất) giữa các đơn vị này. Như vậy, kỹ thuật ước lượng dữ liệu bảng có thể chính thức xem xét đến tính dị biệt đó bằng cách xem xét các biến số có tính đặc thù theo từng đối tượng.
- Nhờ việc kết hợp các chuỗi theo thời gian của các quan sát theo không gian, dữ liệu bảng có thể cung cấp những dữ liệu có nhiều thông tin hơn, đa dạng hơn, ít xảy ra đa cộng tuyến hơn giữa các biến số, đồng thời có nhiều bậc tự do hơn và cũng hiệu quả hơn.
- Bằng cách nghiên cứu các quan sát theo không gian lặp lại, dữ liệu bảng được đánh giá là phù hợp hơn để nghiên cứu tính động của thay đổi. Cụ thể như dữ liệu bảng sẽ phân tích tốt hơn trong các nghiên cứu về những thay đổi liên tục của tỷ lệ thất nghiệp hoặc lưu chuyển lao động.
- Dữ liệu bảng có thể phát hiện cũng như đo lường tốt hơn những ảnh hưởng không thể quan sát trong dạng dữ liệu chuỗi thời gian thuần túy (thời gian nghiên cứu là liên tục) hoặc dữ liệu chéo theo không gian thuần túy (không gian nghiên cứu chỉ trong một phạm vi). Ví dụ với đề tài nghiên cứu “Ảnh hưởng của luật tiền lương tối thiểu đối với việc làm và thu nhập” có thể đạt được kết quả tốt hơn nếu tác giả xem xét các đợt gia tăng tiền lương liên tiếp nhau trong mức lương tối thiểu của một thành phố hoặc một quốc gia.
- Dữ liệu bảng có thể hỗ trợ rất nhiều khi tiến hành nghiên cứu những mô hình có hành vi phức tạp. Ví dụ, các hiện tượng như lợi thế kinh tế theo quy mô và thay đổi kỹ thuật có thể được xem xét bằng dữ liệu bảng tốt hơn so với bằng dữ liệu chuỗi thời gian thuần túy hay dữ liệu chéo theo không gian thuần túy.
- Vì thu thập được những số liệu có sẵn với số lượng lớn như vài nghìn đơn vị, dữ liệu bảng có khả năng giảm thiểu sự chênh lệch có thể xảy ra khi tổng hợp các cá nhân hay doanh nghiệp thành số liệu tổng. Mặt khác, dữ liệu bảng đi sâu vào phân tích nhiều thời gian và không gian hơn nên cũng có thể giải quyết được vấn đề phân phối chuẩn của các biến.
3.3.2. Các phƣơng pháp hồi quy dữ liệu
Những phương pháp ước lượng phổ biến nhất được sử dụng với dữ liệu bảng gồm có: Pooled Regression model (Mô hình Pooled), Fixed Effect Model (FEM) và Random Effect Model (REM). Nhưng nếu gặp phải các vấn đề như: hiện tượng tự tương quan hoặc phương sai thay đổi thì kết quả của 03 phương pháp ước lượng này đều bị thiên lệch (bias) nên không còn đảm bảo sự tin cậy nữa. Và trong những trường hợp vi phạm như vậy, ước lượng bằng GLS (khi không xảy ra nội sinh) hoặc bằng GMM (khi xảy ra nội sinh) sẽ là những mô hình phù hợp và chính xác hơn.
3.3.2.1. Phƣơng pháp Bình phƣơng tối thiểu tổng quát (GLS)
Phương pháp ước lượng GLS cũng giống như phương pháp OLS nhưng có các biến số đã được biến đổi để thỏa mãn các giả thuyết bình phương tối thiểu tiêu chuẩn. Trên thực tế, trong dữ liệu bảng sai số thường có phương sai không đồng nhất và tương quan lẫn nhau thường do:
- Các đơn vị chéo không đồng nhất. - Tương quan giữa các đơn vị chéo.
Khi đó, nếu găp phải vấn đề phương sai không đồng nhất, có khả năng rất cao ước lượng OLS sẽ không còn là ước lượng nhất quán nữa. Vì thế, để khắc phục tình trạng này, chúng ta cần phải thay thế bằng phương pháp GLS. Nói cách khác, phương pháp GLS được sử dụng để đảm bảo không có sự tương quan giữa các sai số của một đơn vị chéo theo thời gian. Tuy nhiên, phương pháp GLS có một hạn chế là không thể khắc phục được hiện tượng nội sinh.
3.3.2.2. Phƣơng pháp Mômen tổng quát (GMM)
Thực chất, những phương pháp ước lượng thường gặp như OLS, 2SLS, GLS đều là những trưởng hợp đặc biệt của GMM nên phải đi kèm với nhiều ràng buộc rất phức tạp và chặt chẽ. Do đó, GMM có tính bao quát hơn cả và hầu như có thể sử dụng được trong mọi tình huống:
- Nếu sử dụng GMM đối với mô hình không bị nội sinh, không có phương sai sai số thay đổi, không có hiện tượng tự tương quan thì kết quả theo phương pháp GMM sẽ giống với kết quả theo OLS.
- Nếu sử dụng GMM đối với mô hình bị nội sinh nhưng không có phương sai sai số thay đổi, không có hiện tượng tự tương quan thì kết quả theo phương pháp GMM sẽ giống với kết quả theo 2SLS.
- Nếu sử dụng GMM đối với mô hình không bị nội sinh nhưng có phương sai sai số thay đổi hoặc có hiện tượng tự tương quan thì kết quả theo phương pháp GMM sẽ giống với kết quả theo GLS.
Bên cạnh đó, GMM còn có thể xử lý những hàm hồi quy phi tuyến. Ngoài ra, phương pháp GMM luôn đảm bảo tính bền vững nếu sử dụng đúng biến công cụ, bất kể về mức độ tương quan giữa các biến công cụ và biến bị nội sinh.
Một số kiểm định tính phù hợp của kết quả ƣớc lƣợng bằng GMM.
Để kiểm định tính phù hợp kết quả ước lượng bằng phương pháp GMM, ta có thể sử dụng một số kiểm định sau:
- Kiểm định Sargan (hay còn đƣợc biết đến là kiểm định Hansen): Kiểm định Sargan/Hausen được dùng để xác định sự phù hợp của các biến công cụ trong mô hình GMM. Thực chất, đây còn là kiểm định ràng buộc xác định quá mức (Over – identifying restrictions).
Kiểm định Sargan/Hausen với giả thuyết : Biến công cụ là ngoại sinh - có nghĩa là không tương quan với sai số của mô hình, thế nên giá trị P – value của thống kê Hansen càng lớn thì càng có độ tin cậy. Kiểm định Sargan được xem xét đối với trường hợp trong câu lệnh hồi quy không sử dụng tùy chọn Robust, còn đối với trường hợp có sử dụng tùy chọn Robust thì kiểm định Hansen sẽ phù hợp hơn.
- Kmmiểm định Arellano – Bond (AR): Kiểm định này được đề xuất bởi Arellano – Bond (1991) nhằm kiểm tra tính tự tương quan của phương sai sai số mô hình GMM dưới dạng sai phân bậc 1. Vì vậy, chuỗi sai phân khảo sát mặc nhiên có tương quan bậc 1, AR(1) nên kết quả kiểm định được bỏ qua. Còn tương quan bậc 2, AR(2) được sử dụng để phát hiện hiện tượng tự tương quan của phần dư ở bậc 2 và thường cho kết quả tốt hơn AR(1).
Kiểm định Arellano – Bond (AR) có giả thuyết : Không có hiện tượng tự tương quan cho phần dư, vì vậy nên giá trị P – value của kiểm định AR(2) càng lớn thì càng chứng tỏ không có hiện tượng tự tương quan bậc 2 cho phần dư. Ngoài ta, để đảm bảo rằng biến công cụ không quá yếu, tác giả cần chắc chắn số lượng biến công cụ nhỏ hơn số lượng nhóm trong mô hình.
KẾT LUẬN CHƢƠNG 3
Dựa vào nghiên cứu thực nghiệm của Ahlem Selma Messai và Fathi Jouini (2013), Nguyễn Thị Hồng Vinh (2015), tác giả đã tiến hành xây dựng mô hình với các biến được lựa chọn gồm biến phụ thuộc là Tỷ lệ nợ xấu năm hiện tại và các biến độc lập gồm Tỷ lệ nợ xấu năm cũ ( ), Khă năng sinh lời ( , Vốn chủ sở hữu ( ), Tốc độ tăng trưởng tín dụng ( ), Tốc độ tăng trưởng ) và Tỷ lệ lạm phát ( .
Bên cạnh đó, một số giả thuyết cũng được đưa ra để dự đoán mức độ tác động của các biến độc lập đến tỷ lệ nợ xấu như thế nào, cụ thể như sau: nợ xấu năm trước, tốc độ tăng trưởng tín dụng và tỷ lệ lạm phát có tác động cùng chiều đến nợ xấu. Trái lại, khả năng sinh lời, vốn chủ sở hữu và tốc độ tăng trưởng GDP có tác động ngược chiều đến tỷ lệ nợ xấu.
Đối với dữ liệu được nghiên cứu trong bài, số liệu của các thông tin vi mô được thu thập chủ yếu từ báo cáo tài chính hợp nhất của các NHTM Việt Nam trong giai đoạn 2007 – 2016, còn số liệu vĩ mô sẽ được lấy từ Ngân hàng thế giới World Bank. Ngoài ra, phương pháp ước lượng được tác giả sử dụng trong bài là phương pháp Bình phương tối thiểu tổng quát (GLS) và Mômen tổng quát (GMM) vì mô hình có thể gặp phải hiện tượng tự tương quan và phương sai sai số thay đổi.
Trong chương tiếp theo, tác giả sẽ đưa ra kết quả của các kiểm định và kết quả ước lượng mô hình bằng 2 phương pháp GLS và GMM rồi nhận xét xem kết quả theo phương pháp nào là phù hợp hơn.
CHƢƠNG 4: KẾT QUẢ NGHIÊN CỨU
4.1. Phân tích thực trạng nợ xấu của hệ thống ngân hàng Việt Nam giai đoạn 2007 – 2016 2007 – 2016
Trên thực tế, mỗi tổ chức tài chính đều công bố tỷ lệ nợ xấu trên báo cáo tài chính dựa trên Chuẩn mực Kế toán Việt Nam (VAS) và các quy định về phân loại nợ của NHNN. Và từ các tài liệu của các NHTM này, NHNN mới tính toán tỷ lệ nợ xấu của toàn hệ thống ngân hàng rồi công bố trên website chính thức.
Hình 4.1: Nợ xấu của hệ thống ngân hàng Việt Nam giai đoạn 2007 – 2016
(Đơn vị: %)
Nguồn: Ngân hàng Nhà nước
Dựa vào hình 4.1 có thể thấy tỷ lệ nợ xấu trong hệ thống ngân hàng thương mại Việt Nam có xu hướng tăng liên tục từ năm 2007 do ảnh hưởng từ sự tăng trưởng cao của dư nợ tín dụng trong khi chất lượng của các khoản tín dụng và công tác giám sát, quản trị nợ vay vẫn còn nhiều thiếu sót. Tiếp theo đó, bước qua giai đoạn từ năm 2008 – 2011, tỷ lệ nợ xấu tăng rất nhanh và đến cuối năm 2011, nợ xấu đã đạt đến 85,000 tỷ đồng, chiếm 3.3% tổng dư nợ. Sau đó, con số này lại tiếp tục tăng lên đến 4.86% vào cuối năm 2012. Nói cách khác, tỷ lệ nợ xấu đã tăng lên và luôn duy trì trên mức an toàn 3% trong suốt giai đoạn từ năm 2011 đến cuối năm 2014.
1.5% 2.06% 1.9% 2.52% 3.3% 4.86% 3.79% 3.7% 2.55% 2.46% 0 1 2 3 4 5 6 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 Tỷ lệ nợ xấu
Tuy nhiên, trong những năm kế tiếp, tỷ lệ nợ xấu đã bắt đầu có những tín hiệu tích cực khi giảm dần qua từng năm xuống lần lượt còn 2.55% và 2.46% trong 2 năm 2016 và 2016.
Theo nhận định được đưa ra trong Báo cáo về hệ thống tài chính của Ủy ban Giám sát Tài chính quốc gia, tỷ lệ nợ xấu của hệ thống tổ chức tín dụng giảm chủ yếu là do các khoản nợ xấu tiềm ẩn trong nợ cơ cấu lại, trái phiếu doanh nghiệp và các khoản phải thu bên ngoài khó thu hồi giảm. Ngoài ra, nợ xấu thường tập trung chủ yếu ở các ngân hàng thương mại yếu kém hoặc ngân hàng trong diện tái cơ cấu. Mặt khác, xét về cơ cấu theo ngành kinh tế, nợ xấu thường tập trung ở 5 lĩnh vực chính, gồm: công nghiệp chế biến, chế tạo; kinh doanh bất động sản, dịch vụ; bán buôn, bán lẻ, sửa chữa ô tô, xe máy, xe có động cơ; vận tải, kho bãi và xây dựng. Tính đến cuối tháng 6/2012, nợ xấu của 5 ngành này đã chiếm gần 96,000 tỷ đồng, tương đương với khoảng 80.49% tổng nợ xấu của toàn bộ nền kinh tế.
Hình 4.2: Cơ cấu nợ xấu theo ngành của các NHTM Việt Nam
Nguồn: Ngân hàng nhà nước năm 2012
4.2. Thống kê mô tả dữ liệu nghiên cứu
Câu lệnh: Sum <biến phụ thuộc> <các biến độc lập>
Công nghiệp chế biến, chế tạo
Kinh doanh bất động sản, dịch vụ Bán buôn, bán lẻ,
sửa chữa ô tô, xe máy, xe có động
cơ Vận tải, kho bãi
Xây dựng Khác 22.5% 19.25% 18.25% 11% 9.5% 19.23%
Bảng 4.1: Thống kê mô tả dữ liệu nghiên cứu (Đơn vị: %) Biến Số quan sát Trung bình Độ lệch chuẩn Giá trị nhỏ nhất Giá trị lớn nhất NPL 150 2.2495 1.6777 0.0835 12.4635 NPL1 150 2.2571 1.7586 0.0835 12.4635 ROE 150 13.2087 9.0695 0.2300 69.3800 CREDITGR 150 38.4629 69.1435 -30.7097 748.6098 EQUITY 150 8.1288 3.2059 3.2513 26.6211 GDP 150 6.0396 0.5834 5.2470 7.1300 INF 150 8.9909 6.5505 0.8790 23.1160
Nguồn: Kết quả từ phần mềm Stata - Đối với nợ xấu (NPL): Bảng 4.1 cho thấy tỷ lệ nợ xấu trung bình của 15 ngân hàng thương mại Việt Nam trong giai đoạn 2007 – 2016 là 2.249% trên tổng dư nợ. Trong đó, ngân hàng SCB vào năm 2010 có tỷ lệ nợ xấu cao nhất với 12.464%, ngược lại ngân hàng ACB vào năm 2007 có tỷ lệ nợ xấu thấp nhất là 0.084%. Bên cạnh đó, thông số độ lệch chuẩn 1.678% đã phản ánh mức độ phân tán khá lớn trong tỷ lệ nợ xấu tại các NHTM Việt Nam.
- Đối với khả năng sinh lời (ROE): Chỉ số ROE thể hiện hiệu quả trong hoạt động và công tác quản lý của các NHTM Việt Nam. Trong bảng dữ liệu này, ROE có giá trị trung bình là 13.209%, trong đó ngân hàng Agribank vào năm 2007 có ROE cao nhất là 69.38% và ngân hàng SCB vào năm 2011 có tỷ lệ ROE thấp nhất là 0.23%. Mặt khác, chỉ số ROE trong giai đoạn này có độ lệch chuẩn tương đối cao 9.07% biểu hiện cho mức độ biến thiên rất đáng lưu ý do