Dữ liệu nghiên cứu được xem xét là dữ liệu từ các báo cáo tài chính đã được kiểm toán của các NHTMCP đang hoạt động. Dữ liệu được chọn từ ngày 01/12/2009 đến ngày 31/12/2018. Các nguồn thông tin lấy dữ liệu chủ yếu từ các nguồn sau: Báo cáo của chính phủ, bộ ngành, số liệu thống kê về tình hình kinh tế xã hội, xuất nhập khẩu, ngân sách quốc gia, đầu tư nước ngoài, dữ liệu từ các báo cáo tài chính các ngân hàng theo năm, nghiên cứu thị trường, các Website chính thức của các ngân hàng, dữ liệu từ WorldBank và các trang báo kinh tế điện tử uy tín giai đoạn 2009-2018.
Đề tài sử dụng phương pháp nghiên cứu định lượng: hồi quy dữ liệu bảng (panel data), (thống kê, hồi quy OLS, FEM, REM, FGLS) kết hợp với các giải thích dựa trên cơ sở lý thuyết nền cũng như đúc kết từ các bài nghiên cứu khác qua đó làm rõ các mục tiêu cũng như câu hỏi nghiên cứu sử dụng phần mềm Stata để thực hiện các phân tích định lượng bao gồm: thống kê mô tả, đo lường giá trị ma trận tương quan, hồi quy dữ liệu theo phương pháp Pooled OLS REM, FEM và FGLS.
Theo Hoffmann (2010), việc sử dụng dữ liệu bảng là công cụ phù hợp nhất khi mẫu quan sát là sự kết hợp giữa dữ liệu chéo và dữ liệu chuỗi thời gian. Bằng cách kết hợp chuỗi thời gian của các quan sát chéo, dữ liệu bảng cho chúng ta “dữ liệu chứa nhiều thông tin hữu ích hơn, tính biến thiên nhiều hơn, ít hiện tượng đa cộng tuyến giữa các biến hơn, nhiều bậc tự do hơn và hiệu quả cao hơn. Theo Al-Kayed và cộng sự (2014) dữ liệu bảng làm tăng kích thước mẫu (số lượng quan sát), từ đó tăng độ chính xác của các ước lượng và vì vậy kết quả có ý nghĩa thống kê cao hơn. Cuối cùng, Arellano và Bover (2005) chỉ rằng việc phân tích dữ liệu bảng sẽ tốt hơn
trong việc xác định và đo lường các ảnh hưởng không thể quan sát được so với phân tích dữ liệu chéo hoặc dữ liệu chuỗi thời gian.