3.1.1. Dữ liệu nghiên cứu
Kích thước mẫu nghiên cứu là vấn đề đáng quan tâm trong quà trình thực hiện luận văn này. Bài nghiên cứu sử dụng dữ liệu dưới dạng bảng cân xứng 297 quan sát được thu thập từ báo cáo tài chính đã được kiểm toán và báo cáo thường niên của 27 ngân hàng thương mại cổ phần đang hoạt động tại Việt Nam trong giai đoạn từ năm 2009 đến năm 2019. Đề tài tập trung nghiên cứu vào các NHTM vì nguồn vốn đa phần đến từ các khoản tiền gửi được huy động từ các cá nhân, tổ chức hay thông qua phát hành giấy tờ có giá. Các NHTM sử dụng nguồn vốn này để thực hiện các dịch vụ tài chính như nhận tiền gửi, phát hành giấy tờ có giá, cho vay, dịch vụ ủy thác, bảo lãnh, tài trợ mua bán và các dịch vụ khác. Chính vì vậy, việc lựa chọn các nhân tố liên quan đến đặc điểm của ngân hàng tác động đến RRTD là phù hợp. Để hạn chế sự sai số trong quá trình nghiên cứu, tác giả đã tiến hành lựa chọn các ngân hàng có đầy đủ báo cáo tài chính bao gồm bảng cân đối kế toán, báo cáo kết quả hoạt động kinh doanh, báo cáo lưu chuyển tiền tệ và thuyết minh báo cáo tài chính.
Dữ liệu phân tích cho các biến vĩ mô như tốc độ tăng GDP, tỷ lệ lạm phát và tỷ lệ thất nghiệp được tác giả tổng hợp từ website chính thống của ngân hàng Nhà nước và Tổng cục thống kê Việt Nam trong giai đoạn phân tích tương ứng. Số liệu cho các biến như nợ xấu, dự phòng rủi ro tín dụng, quy mô ngân hàng, lợi nhuận được thu thập và trích lọc từ các báo cáo tài chính và báo cáo thường niên của các NHTM. Dữ liệu sử dụng trong đề tài là Panel data (dữ liệu bảng) có 2 chiều: chiều không gian và
chiều thời gian nên sẽ xuất hiện các ưu điểm và nhược điểm trong quá trình nghiên cứu như sau:
Bảng 3.1. Các ưu và nhược điểm của Panel data
Ưu điểm Nhược điểm
- Dữ liệu bảng cung cấp nhiều thông tin hơn, biến thiên hơn, nâng cao được số quan sát và phần nào khắc phục được hiện tượng đa cộng tuyến, bậc tự do cao hơn và hiệu quả hơn.
- Bằng cách nghiên cứu các dữ liệu chéo một cách lặp đi lặp lại, dữ liệu bảng thực hiện tốt hơn các nghiên cứu về những thay đổi xảy ra liên tục.
- Cho phép kiểm soát sự khác biệt không quan sát được giữa các thực thể (entities). - Cho phép kiểm soát các biến không quan sát được nhưng thay đổi theo thời gian. - Cho phép nghiên cứu các mô hình phức tạp.
- Đây là loại dữ liệu có thể làm phức tạp trong phân tích bởi vì không thể giả định quan sát khác nhau là độc lập. - Loại dữ liệu này thường bị thiếu quan
sát dẫn đến việc cần điều chỉnh trong các tiêu chuẩn phân tích.
- Vấn đề tồn tại trong dữ liệu chéo (ví dụ như phương sai thay đổi) và dữ liệu thời gian (ví dụ như tự tương quan) cần phải được xem xét.
Sử dụng Panel data có hai ưu điểm lớn nhất là: dữ liệu bảng cho các kết quả ước lượng của các tham số trong mô hình đáng tin cậy hơn và dữ liệu bảng cho phép chúng ta xác định và đo lường tác động mà những tác động này không thể được xác định và đo lường khi sử dụng dữ liệu chéo (cross-section) hoặc dữ liệu thời gian (time series).
Mẫu nghiên cứu được sàng lọc và xử lý như sau:
Đầu tiên, do mẫu nghiên cứu trong bài là các NHTM và các NHTM cổ phần nên các ngân hàng Nhà nước, ngân hàng nước ngoài và ngân hàng chính sách được loại ra khỏi mẫu.
Thứ hai, thực hiện loại bỏ các ngân hàng không có thông tin, thiếu và mất dữ liệu. Sau đó, loại bỏ các quan sát có số liệu lớn đột biến nhằm đảm bảo độ tin cậy và khách quan đối với kết quả nghiên cứu.
Thống kê mô tả được sử dụng để mô tả những đặc tính cơ bản của dữ liệu thu thập được từ nghiên cứu thực nghiệm qua các cách thức khác nhau, từ đó cung cấp những tóm tắt (dưới dạng các giá trị thống kê đơn nhất) về mẫu và các thước đo thông qua phân tích đồ họa đơn giản và các phương pháp cơ bản của mô tả dữ liệu giúp đưa ra các quyết định đúng đắn.
Số liệu trong thống kê mô tả hoặc các thông số đo lường và biến đổi chủ yếu là giá trị trung bình, trung vị, giá trị lớn nhất, giá trị nhỏ nhất và độ lệch chuẩn của các biến và cung cấp góc nhìn tổng quan về đặc tính dữ liệu. Độ lệch chuẩn rất quan trọng trong thống kê mô tả, nếu độ lệch thấp thì sự sai lệch dữ liệu thực so với giá trị trung bình là rất nhỏ.
3.1.3. Phân tích tương quan
Phân tích tương quan là phép phân tích được sử dụng làm thước đo độ lớn của các mối liên hệ giữa các biến định lượng trong một đề tài nghiên cứu, từ đó có thể xác định mối quan hệ tuyến tính giữa các biến độc lập và phụ thuộc trong nghiên cứu đó.
Đối với phân tích tương quan, hệ số tương quan được sử dụng để lượng hóa mức độ chặt chẽ của mối liên hệ tuyến tính giữa hai biến định lượng. Các biến có thể là hai cột của một bộ dữ liệu quan sát đã cho, thường được gọi là mẫu hoặc hai
phần của một biến ngẫu nhiên đa biến số có phân phối đã biết trước. Ma trận tương
quan xác định mối quan hệ tương quan tuyến tính giữa các biến lẫn nhau. Từ ma trận tương quan có thể xem xét vấn đề đa cộng tuyến giữa các biến đó và chọn ra những biến có mối quan hệ kinh tế với nhau được đưa vào để chạy mô hình hồi quy đa biến. Đa cộng tuyến (Multicollinearity) là hiện tượng có sự tương quan phụ thuộc lẫn nhau giữa các biến độc lập. Điều này sẽ dẫn đến việc tạo các thông số dư thừa hay các hệ số không ổn định khi thêm biến vào mô hình hồi quy (Farrar, 1967). Phân tích tương quan phản ánh tính chất tuyến tính của mô hình hồi quy nhằm kiểm định sự phù hợp trong môi trường nghiên cứu.
3.1.4. Phân tích hồi quy
biến sẽ là biến độc lập (ảnh hưởng đến biến mục tiêu), và biến còn lại sẽ là biến mục tiêu (bị ảnh hưởng bởi biến độc lập), mô hình hóa, định lượng hóa mối quan hệ này để qua đó có thể xác định giá trị của biến mục tiêu nếu các biến độc lập thay đổi như thế nào. Sau khi phân tích tương quan giữa các biến trong mô hình nghiên cứu và thực hiện xem xét hiện tượng đa cộng tuyến sẽ chỉ cho thấy mối quan hệ của từng cặp biến độc lập với nhau. Trong khi đó, mục đích nghiên cứu của đề tài là xác định rõ ràng mức độ ảnh hưởng của từng yếu tố đến RRTD của các NHTM tại Việt Nam. Do đó, đề tài sử dụng lần lượt các phương pháp hồi quy dữ liệu theo mô hình Pooled OLS và phương pháp hồi quy mẫu dữ liệu theo hai phương pháp ước lượng FEM và REM để phân tích, kiểm định, so sánh sự phù hợp và chọn ra mô hình tốt nhất trong ba mô hình. Trong đó, phương pháp Pooled OLS chỉ áp dụng với điều kiện các biến độc lập trong mô hình đều là biến ngoại sinh. Phương pháp ước lượng FEM chỉ quan tâm đến khác biệt mang tính cá nhân đóng góp vào mô hình nên không có hiện tượng tự tương quan trong mô hình. Nếu mô hình có hiện tượng tự tương quan thì ước lượng FEM sẽ không đạt hiệu quả cao. Còn phương pháp ước lượng REM quan tâm cả về các khác biệt của riêng các đối tượng phân tích thông qua thời gian đóng góp vào mô hình do đó tự tương quan là vấn đề tiềm tàng trong mô hình này cần xử lý và có thể giải quyết bằng cách chuyển mô hình nghiên cứu sang dạng sai phân bậc 1.
Để đảm bảo sự phù hợp của mô hình, nghiên cứu đã thực hiện một số kiểm định Breusch-Pagan Lagrangian là phương pháp cho phép lựa chọn chọn giữa mô hình tác động ngẫu nhiên REM và mô hình Pooled OLS với giả thuyết H0 - mô hình Pooled OLS là phù hợp, kiểm định Hausman (1978) cho phép lựa chọn giữa mô hình tác động cố định FEM và mô hình REM với giả thuyết H0 - mô hình REM là hiệu quả hơn, kiểm định Wald được dùng để kiểm định hiện tượng phương sai thay đổi trong mô hình với giả thuyết H0 là mô hình không có hiện tượng phương sai thay đổi và tương tự đối với kiểm định Wooldridge dùng để phát hiện tự tương quan.
Sau khi lựa chọn được mô hình phù hợp với đề tài nghiên cứu, tác giả sẽ tiếp tục tiến hành kiểm định các khuyết tật có thể xuất hiện trong mô hình này bằng phương pháp kiểm định Modified Ward và kiểm định Woodridge. Dựa vào kết quả kiểm định,
nếu nghiên cứu nhận thấy tồn tại vấn đề tự tương quan và phương sai thay đổi trong mô hình nghiên cứu thì sẽ khắc phục các khuyết tật trên bằng phương pháp ước lượng bình Phương tối thiểu tổng quát khả thi-FGLS (Feasible Generalized least square) được sử dụng (Greene, 2012) để hồi quy các phương trình nghiên cứu tồn tại vấn đề tự tương quan và phương sai thay đổi.
Do mô hình có sử dụng biến trễ của biến phụ thuộc (LNPL) làm biến độc lập nên hiện tượng nội sinh sẽ ảnh hưởng tới kết quả hồi quy. Theo nghiên cứu của nhóm tác giả Cristina Martinez-Sola và cộng sự (2013) cho rằng phương trình hồi quy không thể hồi quy bằng phương pháp OLS thông thường vì giả thiết các biến nội sinh bị vi phạm, vì thế tác giả sử dụng phương pháp hồi quy moment tổng thể (GMM) để khắc phục hiện tượng trên. GMM được Lars Peter Hansen trình bày lần đầu tiên vào năm 1982 trong bài viết “Large Sample Propertiesof Generalized Methods of Moments Estimators” được đăng trong Econometrica, Vol. 50, page 1029-1054. Một cách tổng quan, GMM là phương pháp tổng quát của rất nhiều phương pháp ước lượng phổ biến như OLS để cho ra các hệ số ước lượng vững, không chệch, phân phối chuẩn và hiệu quả.
3.1.5. Kiểm định sự phù hợp của mô hình
Sau khi chạy mô hình hồi quy GMM hai bước, kiểm định quan trọng nhất của phương pháp ước lượng GMM là kiểm định Overidentifying Restrictions (Overidentifying Restrictions Test) hay còn gọi là kiểm định Hansen test nhằm kiểm định biến công cụ được chọn là phù hợp và mô hình sử dụng biến đó để ước lượng cũng phù hợp. Ngoài ra, tác giả còn sử dụng kiểm định Arellano – Bond để kiểm tra tính bền vững của ước lượng GMM, AR(2) được kiểm định trên chuỗi sai phân của sai số để phát hiện hiện tượng tự tương quan của sai số ở bậc 1 (AR1). Do đó, chuỗi sai phân khảo sát mặc nhiên có tương quan bậc 1 để phát hiện hiện tượng tự tương quan bậc nhất của phần dư mô hình.
3.2. LỰA CHỌN MÔ HÌNH NGHIÊN CỨU
Dựa trên cơ sở các lý thuyết và công trình nghiên cứu từ mô hình trong đề tài nghiên cứu của tác giả Hasna Chaibi và Zied Ftiti năm 2015. Tác giả chọn ra 8 biến,
trong đó có 1 biến phụ thuộc là tỷ lệ nợ xấu và 8 biến còn lại là biến giải thích (biến độc lập). Các biến độc lập gồm 2 nhóm yếu tố, nhóm yếu tố kinh tế vĩ mô và nhóm yếu tố bên trong ngân hàng. Từ các tiền đề cơ bản trên, tác giả tiến hành áp dụng mô hình nghiên cứu tại Việt Nam nhằm xem xét các nhân tố tác động đến RRTD của các NTHM tại Việt Nam trong giai đoạn 2009-2019.
Do tình hình thực tế tại Việt Nam và để thuận tiện trong việc thu thập dữ liệu, các biến độc lập trong bài nghiên cứu này không hoàn toàn giống với mô hình trong bài nghiên cứu của Hasna Chaibi và Zied Ftiti (2015), có điều chỉnh thêm vào hoặc bớt đi một số biến để xác định các yếu tố ảnh hưởng đến RRTD của NHTM. Dữ liệu mẫu trong bài nghiên cứu liên tục trong thời gian 11 năm cho hầu hết các quan sát, tác giả có thể ước tính mô hình các yếu tố tác động đến RRTD của các NTHM tại Việt Năm từ dữ liệu bảng chi tiết sau đây:
NPLit = α + γNPLi,t-1 +
∑� ����
�� + εi,t (1)
Trong đó:
Biến phụ thuộc: NPLit: RRTD được đại diện bởi biến nợ xấu. Hệ số chặn: α
NPLi,t-1 là tỷ lệ nợ xấu của ngân hàng i vào năm t-1.
γ là tác động của biến trễ tỷ lệ nợ xấu đến tỷ lệ nợ xấu năm t.
Xkit là vector các biến độc lập, bao gồm cả biến vĩ mô và biến nội tại trong ngân hàng. Biến nội tại trong ngân hàng: LLR, LEV, SIZE, ROE; biến vĩ mô: INF, GDP, UEP.
Βk là tác động của vector biến độc lập đến tỷ lệ nợ xấu. εi,t là phần dư của mô hình.
=
�
Bảng 3.2: Diễn giải các biến độc lập tác động đến tỷ lệ nợ xấu của NHTM
Biến Ký hiệu Diễn giải biến Kỳ
ọng
Tỷ lệ nợ xấu năm trước
NPLi,t-1 Tỷ lệ nợ xấu/Tổng dư nợ +
Dự phòng rủi ro tín dụng LLR Tỷ lệ chi phí trích lập dự phòng rủi ro tín dụng /Tổng dư nợ +
Đòn bẩy LEV Tỷ lệ nghĩa vụ nợ/Tổng tài sản
bình quân +
Quy mô ngân
hàng SIZE
Logarit tự nhiên tổng tài sản
bình quân -
Lợi nhuận ngân
hàng (ROE) ROE
Lợi nhuận sau thuế/Vốn chủ sở
hữu bình quân -
Tăng trưởng GDP GDP Tốc độ tăng trong GDP -
Lạm phát INF Sự thay đổi trong chỉ số giá
CPI +
Tỷ lệ thất nghiệp UEP Tỷ lệ thất nghiệp +
Các dữ liệu thu thập để nghiên cứu trong các công trình nghiên cứu mà tác giả tham khảo đều sử dụng dự liệu bảng nên tác giả sử dụng mô hình Pooled OLS, tác động cố định FEM và tác động ngẫu nhiên REM, sau đó thực hiện kiểm định F- test, Hausman và Breusch and Pagan để kiểm tra sự phù hợp giữa các mô hình này.
Sử dụng biến trễ của biến phụ thuộc là NPLi,t-1 dẫn đến việc xảy ra hiện tượng nội sinh. Vậy nên, tác giả tiến hành hồi quy phương trình (1) mô hình bằng phương pháp Ước lượng bình phương tối thiểu tổng quát khả thi - FGLS (Feasible Generalized Least Square) của Greene (2012) nhằm khắc phục vi phạm giả thuyết về phương sai sai số không đổi. Hơn nữa, tác giả còn sử dụng thêm phương pháp hồi
quy Moment tổng thể (GMM) để khắc phục hiện tượng nội sinh do biến trễ NPLi,t- 1 gây ra.
3.3. ĐO LƯỜNG BIẾN VÀ GIẢ THUYẾT VỀ TÁC ĐỘNG CỦA CÁC
BIẾN
Phân tích những tác động của yếu tố tỷ lệ nợ xấu năm trước đó, dự phòng rủi ro tín dụng, đòn bẩy tài chính, quy mô, lợi nhuận ngân hàng, tỷ lệ lạm phát, tăng trưởng GDP và tỷ lệ thất nghiệp lên tỷ lệ nợ xấu của các NHTM, biến phụ thuộc và biến độc lập được lựa chọn và mô tả trong các mục sau. Để đo lường các yếu tố tác động đến RRTD của những NHTM tại Việt Nam, tỷ lệ nợ xấu được lựa chọn là biến phụ thuộc, các biến tỷ lệ nợ xấu năm trước, dự phòng rủi ro tín dụng, đòn bẩy tài chính, quy mô, lợi nhuận ngân hàng, tỷ lệ lạm phát, tăng trưởng GDP và tỷ lệ thất nghiệp được tác giả lựa chọn là các biến độc lập.
3.3.1. Biến phụ thuộc
Trong mô hình nghiên cứu, nợ xấu (NPL) được sử dụng để đánh giá RRTD với vai trò là biến phụ thuộc. Việc sử dụng biến NPL đại diện để đánh giá tác động của các biến độc lập đến RRTD phù hợp với các nghiên cứu của Somanadevi Thiagarajan và cộng sự (2011) bởi vì tác giả cho rằng NPL có tác động trực tiếp đến hoạt động tài chính, đồng thời cũng là nhân tố ảnh hưởng đến RRTD trong hệ thống ngân hàng. Theo tác giả Somoye (2010), nợ xấu làm giảm tính thanh khoản của các