CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU TÁC ĐỘNG CỦA THU NHẬP NGOÀI LÃI ĐẾN HIỆU QUẢ HOẠT ĐỘNG CỦA NGÂN HÀNG THƯƠNG MẠI
3.1. Thiết kế nghiên cứu
Để nghiên cứu tác động của TNNL đến HQHĐ của các NHTM, tác giả thực hiện các nội dung nghiên cứu sau : (1) Nghiên cứu các yếu tố ảnh hưởng đến TNNL; (2) Nghiên cứu tác động của TNNL đến HQHĐ của các NHTM tại Việt Nam trong giai đoạn từ 2012-2022; (3) Nghiên cứu kênh tác động của TNNL đến HQHĐ của các NHTM tại Việt Nam trong giai đoạn từ 2012-2022. Các nội dung này có sự liên kết với nhau cụ thể: (i) Khi xác định được TNNL có tác động đến HQHĐ của các NHTM, để thúc đẩy HQHĐ cần phải thúc đẩy TNNL; (ii) Tiếp đó, thông qua việc xác định được các yếu tố tác động đến TNNL, tác giả có thể đề xuất được các hàm ý chính sách nhằm gia tăng TNNL cho các NHTM; (iii) Cuối cùng, việc xác định được các kênh tác động của TNNL đến HQHĐ của các NHTM giúp nhận diện được đầy đủ hơn về cơ chế tác động này.
Nghiên cứu sử dụng kết hợp cả phương pháp nghiên cứu định tính và phương pháp nghiên cứu định lượng. Cụ thể quy trình nghiên cứu được trình bày theo hình 3.1 như sau:
Hình 3.1 Quy trình nghiên cứu
(Nguồn: Đề xuất của tác giả)
Bước 1: Xác định vấn đề nghiên cứu, lược khảo tài liệu và xây dựng các mô hình
nghiên cứu
Tại bước này, phương pháp nghiên cứu định tính được sử dụng để xây dựng cơ sở lý thuyết cho nghiên cứu, khảo lược, tổng hợp các nghiên cứu trước phân tích về các yếu tố tác động đến TNNL và tác động của TNNL đến HQHĐ của các NHTM nhằm đề xuất các mô hình nghiên cứu. Sau khi đã có kết quả phân tích định lượng, nghiên cứu thực hiện phân tích các kết quả dựa trên thực tiễn tại Việt Nam và có sự so sánh, đối chiếu với các nghiên cứu trước đây để chứng minh độ tin cậy về kết quả nghiên cứu.
Bước 2: Thu thập và tiền xử lý dữ liệu
Để xác định các yếu tố tác động đến TNNL và xem xét tác động của TNNL đến HQHĐ của các NHTM tại Việt Nam, nghiên cứu sử dụng nguồn dữ liệu thứ cấp và được thu thập từ các báo cáo tài chính đã được kiểm toán trong giai đoạn 2012-2022 của 32 NHTM. Dữ liệu vĩ mô được lấy từ cơ sở dữ liệu (database) của Quỹ Tiền tệ Quốc tế (IMF). Sau khi thu thập dữ liệu từ các nguồn, tác giả tiến hành mã hóa các biến, tính
Bước 1: Xác định vấn đề nghiên cứu, lược khảo tài liệu và xây
dựng các mô hình nghiên cứu
Bước 2: Thu thập và tiền xử lý dữ liệu
Bước 3: Xác định mối tương quan giữa các biến số và kiểm định
hiện tương đa cộng tuyến
Bước 4: Ứơc lượng các mô hình bằng các phương pháp dành cho
dữ liệu bảng
Bước 5: Lựa chọn mô hình, kiểm định các khuyết tật và ước lượng
mô hình bằng phương pháp phù hợp
Bước 6: Thảo luận kết quả nghiên cứu và kết luận
toán các biến số trong mô hình, gộp dữ liệu vĩ mô và dữ liệu từ báo cáo tài chính của các NHTM theo năm và theo ngân hàng để thu được dữ liệu bảng phục vụ nghiên cứu.
Bước 3: Xác định mối tương quan giữa các biến số và kiểm định hiện tương đa
cộng tuyến
Sau khi thu thập và tiền xử lý dữ liệu, tác giả tiếp tục đánh giá mối tương quan giữa các biến số trong các mô hình thông qua ma trận hệ số tương quan. Việc đánh giá này cho thấy sơ bộ về mối quan hệ đồng biến và nghịch biến giữa từng cặp biến số trong mô hình. Đặc biệt, ở bước này, tác giả tiến hành kiểm định và xử lý hiện tượng đa cộng tuyến giữa các biến độc lập trong các mô hình.
Kiểm định đa cộng tuyến trong mô hình được sử dụng qua hệ số nhân tử phóng đại phương sai VIF. Theo Gujarati (2009), các biến có hệ số tương quan cao (lớn hơn 0.8) và hệ số VIF lớn (lớn hơn 10) sẽ bị loại ra khỏi mô hình nghiên cứu để đảm bảo mô hình nghiên cứu không xảy ra hiện tượng đa cộng tuyến nghiêm trọng.
Bước 4: Ứơc lượng các mô hình bằng các phương pháp dành cho dữ liệu bảng
Phương pháp nghiên cứu định lượng được thực hiện nhằm lượng hóa các mô hình nghiên cứu. Trong luận án này, tác giả áp dụng các kỹ thuật hồi quy dữ liệu bảng (panel data) và các phương pháp ước lượng Pooled OLS, FEM, REM, FGLS, SGMM, phân tích Bayes.
Dữ liệu bảng là tập hợp của hai loại dữ liệu chuỗi thời gian (time- series) và dữ liệu chéo (cross-setional). Sử dụng dữ liệu bảng có các ưu điểm như: Dữ liệu bảng cho các kết qủa ước lượng của các tham số trong mô hình tin cậy hơn và dữ liệu bảng cho phép xác định và đo lường tác động mà những tác động này không thể được xác định và đo lường khi sử dụng chéo hoặc dữ liệu thời gian. Phân tích dữ liệu bảng có ba cách tiếp cận độc lập: Mô hình Pooled OLS, mô hình tác động ngẫu nhiên (Random effects model) và mô hình tác động cố định (Fixed effects model)
Mô hình OLS (Ordinary Least Square) hay còn gọi là mô hình Pooled OLS là hồi quy bằng phương pháp bình phương nhỏ nhất hay bé nhất hoặc tối thiểu. Đây một trường hợp đặc biệt của phương pháp bình phương nhỏ nhất tổng quát (generalized least squares method – GLS) sử dụng để tìm đường hồi quy gần nhất với giá trị liên tục của biến phụ thuộc hay nói cách khác là làm sao để tổng bình phương sai số giữa giá trị thực tế và giá trị được dự đoán là nhỏ nhất. Mô hình hồi quy mẫu (sample regression model) với dạng như sau:
Yi = b1 + b2X2i+ b3X3i +…+ bkXki+ui
Phương pháp OLS sẽ lựa chọn các hệ số beta hồi quy từ B1 đến Bk sao cho bình phương sai số của mô hình (u) ước lượng là nhỏ nhất.
Mô hình FEM (Fixed effects model) là một phương pháp trong phân tích hồi quy, được sử dụng để xác định mối quan hệ giữa một biến phụ thuộc và các biến độc lập khi có sự khác biệt giữa các đơn vị quan sát, còn được gọi là hiệu ứng cố định của đơn vị.
Với FEM, hiệu ứng cố định của đơn vị được giải quyết bằng cách giữ nguyên các hiệu ứng cố định của các đơn vị trong mô hình, thay vì giả định rằng các hiệu ứng cố định này là giống nhau cho tất cả các đơn vị. Các hiệu ứng cố định này có thể được biểu diễn bằng các biến giả định hoặc dùng dữ liệu quan sát. FEM thường được sử dụng trong các nghiên cứu quan sát ngang hoặc dữ liệu theo thời gian để điều chỉnh cho sự khác biệt giữa các đơn vị. Nó giúp loại bỏ hiệu ứng cố định của đơn vị và tập trung vào việc đánh giá mối quan hệ giữa các biến độc lập và biến phụ thuộc.
REM (Random Effects Model) là một phương pháp trong phân tích hồi quy, được sử dụng để xác định mối quan hệ giữa một biến phụ thuộc và các biến độc lập khi có sự khác biệt giữa các đơn vị quan sát, còn được gọi là hiệu ứng ngẫu nhiên của đơn vị. Với REM, hiệu ứng ngẫu nhiên của đơn vị được giải quyết bằng cách cho các hiệu ứng ngẫu nhiên này là các biến ngẫu nhiên và không khớp giữa các đơn vị. Các hiệu ứng này được giả định là được phân phối theo phân phối chuẩn và có hiệu ứng ngẫu nhiên đối với một số đặc điểm của các đơn vị. REM thường được sử dụng để loại bỏ hiệu ứng ngẫu nhiên của đơn vị và tập trung vào việc đánh giá mối quan hệ giữa các biến độc lập và biến phụ thuộc.
GLS (Generalized Least Squares) được sử dụng khi sự khác biệt giữa các đơn vị quan sát không tuân theo giả định về tính đồng nhất của phương sai. GLS được sử dụng để giải quyết vấn đề sự khác biệt trong phương sai giữa các đơn vị quan sát. Trong phương pháp GLS, các trọng số được gán cho các quan sát để điều chỉnh cho sự khác biệt trong phương sai. Các trọng số này được tính toán bằng cách sử dụng các thông tin về ma trận hiệp phương sai của các biến độc lập và ma trận hiệp phương sai của sai số.
Sau khi tính toán các trọng số này, chúng ta có thể sử dụng phương pháp hồi quy thông thường để tìm ra các hệ số tối ưu cho mô hình hồi quy. GLS thường được sử dụng để
loại bỏ sự khác biệt trong phương sai giữa các đơn vị và tập trung vào việc đánh giá mối quan hệ giữa các biến độc lập và biến phụ thuộc.
Bước 5: Lựa chọn mô hình, kiểm định các khuyết tật và ước lượng mô hình bằng
phương pháp phù hợp
Trong bước này, tác giả thực hiện các kiểm định cần thiết đối với các phương pháp ước lượng đã trình bày ở bước 4. Bao gồm:
Kiểm định F nhằm lựa chọn phương pháp OLS hay REM là phù hợp cho hồi quy dữ liệu mẫu với gỉa thuyết:
Ho: Mô hình không có hiệu ứng cố định H1: Mô hình có hiệu ứng cố định
Khi p-value < 0.05 ta bác bỏ Ho, chấp nhận H1, tức là có hiệu ứng cố định trong mô hình, hay nói cách khác là mô hình FEM phù hợp hơn OLS. Ngược lại, phương pháp OLS phù hợp hơn nếu giả thiết H0 được chấp nhận.
Kiểm định Hausman được thực hiện nhằm lựa chọn mô hình phù hợp để giải thích mối quan hệ của các yếu tố trong mô hình nghiên cứu giữa mô hình FEM hay mô hình hình REM, dựa trên giả định H0 không có sự tương quan giữa biến giải thích và yếu tố ngẫu nhiên vì tương quan là nguyên nhân tạo nên sự khác biệt giữa FEM và
REM với giả thuyết: (1) Ho: Mô hình Random effect là phù hợp; (2) H1: Mô hình Fixed effect là phù hợp”
Khi p-value < 0.05 cho phép kết luận giả thiết H0 bị bác bỏ, khi đó kết luận là phương pháp FEM phù hợp hơn để sử dụng. Ngược lại, phương pháp REM phù hợp hơn nếu chấp nhận giả thiết H0.
Kiểm định Breusch and Pagan Lagrangian Multiplier thực hiện để lựa chọn mô hình phù hợp giữa REM và OLS với giả thuyết (1) Ho: Mô hình OLS là phù hợp;
(2) H1: Mô hình Random effect là phù hợp. Khi p-value < 0.05 cho phép kết luận giả thiết H0 bị bác bỏ, khi đó kết luận là phương pháp REM phù hợp. Ngược lại, phương pháp OLS phù hợp hơn nếu chấp nhận giả thiết H0.
Kiểm định phương sai sai số thay đổi (Wald) với giả thuyết:
H0 : Không có hiện tượng phương sai sai số thay đổi.
H1 : Có hiện tượng phương sai sai số thay đổi
ei
Theo Baltagi (2001), nếu p-value ≤ α (α = 0.05) cho phép kết luận chấp nhận giả thuyết H1, bác bỏ giả thuyết H0. Nếu H0 bị bác bỏ nghĩa là có hiện tượng phương sai sai số thay đổi.
Đối với mô hình REM, kiểm định phương sai sai số thay đổi được thực hiện bằng kiểm định Breusch and Pagan Lagrangian Multiplier . Nếu p-value ≤ α (α = 0.05) cho phép kết luận mô hình xảy ra hiện tượng phương sai sai số thay đổi.
Kiểm định tự tương quan (Wooldridge) với giả thuyết:
H0 : Không có hiện tượng tự tương quan trong mô hình H1 : Có hiện tượng tự tương quan trong mô hình.
Theo Wooldridge (2010), nếu p-value ≤ α (α = 0.05) cho phép kết luận chấp nhận giả thuyết H1, bác bỏ giả thuyết H0. Nếu Ho bị bác bỏ nghĩa là có hiện tương quan trong mô hình.
Theo Abuzayed et al. (2018), các mô hình nghiên cứu về kinh tế thường xảy ra hiện tượng nội sinh, hiện tượng này là nguyên nhân dẫn đến kết quả bị sai lệch (bias) khi áp dụng các ước lượng trên. Để khắc phục vấn đề này, Greene (2003) đề xuất sử dụng phương pháp ước lượng GMM do Blundell and Bond (1998) phát triển.
Ước lượng GMM có hai dạng thay thế lẫn nhau là GMM sai phân (Different GMM – DGMM) và GMM hệ thống (System GMM – SGMM). Cả hai phương pháp này đều được sử dụng cho các dữ liệu có t (thời gian) nhỏ và không gian (mẫu kích thước – N) lớn. Điểm khác biệt rõ rệt nhất của hai phương pháp này DGMM sử dụng sai phân (difference) để loại bỏ khuyết tật nội sinh trong khi SGMM lại sử dụng các biến công cụ và ngoại sinh để khắc phục hiện tượng nội sinh trong mô hình nghiên cứu. Do vậy, kết quả mà phương pháp SGMM mang lại thường tốt hơn so với phương pháp DGMM vì biến công cụ được sử dụng trong ước lượng SGMM có sự dự đoán chính xác hơn cho biến nội sinh của mô hình (Blundell & Bond, 1998). Do vậy, trong chuyên đề này, tác giả áp dụng phương pháp SGMM để đảm bảo kết quả nghiên cứu là đáng tin cậy. Để đảm bảo các biến công cụ được sử dụng phù hợp, kiểm định Hansen và kiểm định tự tương quan bậc 1 và bậc 2 sẽ được thực hiện. Nếu p-value của các kiểm định Hansen và tự tương quan bậc 2 lớn hơn 10% sẽ cho thấy các biến công cụ nếu sử dụng từ độ trễ 2 trở đi là phù hợp.
Phương pháp Bayes (Bayesian techniques) là các phương pháp phân tích thống
kê (bao gồm cả phương pháp ước lượng và suy rộng thống kê) mà trong đó những thông
tin tiên nghiệm (biết trước) được kết hợp một cách chính thức với số liệu mẫu để tạo ra kết quả ước lượng hoặc các giả thuyết kiểm định.
Trong đề tài này, tác giả cố gắng đóng góp một phương pháp suy luận giả thuyết dựa trên phân tích Bayes. Ưu điểm của phân tích Bayes so với giá trị p- value là nó cho thấy xác suất xảy ra giả thuyết. Phân tích Bayes được suy ra từ phân phối hậu nghiệm của các hệ số trong mô hình. Từ phân phối hậu nghiệm của các hệ số trong mô hình, phân tích Bayes cho thấy xác suất xảy ra giả thuyết. Phân phối hậu nghiệm được tạo ra bằng cách kết hợp một hàm khả năng và một phân phối tiên nghiệm. Một hàm khả năng đưa ra các ước tính của các hệ số từ dữ liệu. Phân phối tiên nghiệm sẽ cung cấp thông tin trước đây về các hệ số này.
Phân phối hậu nghiệm ∝ Hàm khả năng × Phân phối tiên nghiệm
Phân bố hậu nghiệm được tạo ra từ các chuỗi Markov (Markov chain Monte Carlo - MCMC) với các phương pháp lấy mẫu nổi tiếng như Metropolis-Hastings và Gibbs. Nghiên cứu sử dụng kỹ thuật lấy mẫu Metropolis- Hastings với kích thước mẫu MCMC là 1000. Tuy nhiên, một vấn đề với phân tích Bayes là các phân phối tiên nghiệm cho các hệ số của mô hình phải được xác định một cách hợp lý. Bên cạnh đó, các chuỗi MCMC phải đạt được sự hội tụ. Đối với vấn đề đầu tiên, tác giả sử dụng phương pháp tác động cố định để tìm thông tin về các phân phối tiên nghiệm cho các hệ số của mô hình. Cụ thể, phân phối tiên nghiệm sẽ được sử dụng là phân phối chuẩn với các tham số nhận được từ phương pháp tác động cố định. Đối với vấn đề thứ hai, tác giả sử dụng biểu đồ trace, biểu đồ phân phối, biểu đồ tự tương quan và biểu đồ mật độ để đưa ra kết luận về sự hội tụ của các chuỗi MCMC.
Bước 6: Thảo luận kết quả nghiên cứu và kết luận
Sau khi thực hiện các ước lượng và các kiểm định cần thiết, bao gồm cả kiểm định tính vững thông qua phương pháp phân tích Bayes, tác giả tiến hành phân tích kết quả nghiên cứu, so sánh kết quả nghiên cứu này với các nghiên cứu trong và ngoài nước trước đó. Từ đó, tác giả tiến hành rút ra kết luận về các yếu tố ảnh hưởng đến TNNL, tác động của TNNL đến HQHĐ của các NHTM tại Việt Nam. Đặc biệt là chỉ ra các kênh tác động của TNNL đến HQHĐ của các NHTM tại Việt Nam.