Nghiên cứ sử dụng dữ liệu thứ cấp bao gồm dữ liệu từ báo cáo tài chính đã kiểm toán và báo cáo thường niên hàng năm của 16 NHTM Việt Nam cho giai đoạn 2007 – 2015. Riêng tỷ lệ lạm phát và tốc độ tăng trưởng kinh tế được lấy từ cơ sở dữ liệu IFS của Quỹ Tiền tệ Quốc tế - IMF.
Về mặt lý thuyết, tất cả các NHTM Việt Nam đều phải bao gồm trong nghiên cứu. Tuy nhiên, hiện nay hệ thống NHTM Việt Nam có trên 30 NHTM nội địa, nhưng việc công bố báo cáo tài chính cũng như các thông tin hoạt động không được rõ ràng và đầy đủ. Tác giả đã rà soát toàn bộ báo cáo tài chính của các ngân hàng nhưng chỉ thu thập được 16 NHTM Việt Nam đáp ứng đầy đủ dữ liệu trong toàn bộ giai đoạn nghiên cứu. Do đó, mẫu nghiên cứu chỉ bao gồm dữ liệu của 16 NHTM Việt Nam bởi vì việc sử dụng dữ liệu bảng thiếu quá nhiều thông tin và các dữ liệu thiếu hụt là không ngẫu nhiên có thể ảnh hưởng đến hiệu quả ước lượng.
Giai đoạn nghiên cứu là từ năm 2007 - 2015 vì năm 2007 đánh dấu bước phát triển mạnh mẽ của hệ thống NHTM Việt Nam sau khi Việt Nam chính thức gia nhập WTO và không bao lâu sau là giai đoạn khó khăn do khủng hoảng tài chính thế giới. Trong giai đoạn này, các NHTM Việt Nam trải qua nhiều biến động về vốn, hợp nhất và sáp nhập, khả năng sinh lời của các NHTM giảm sút đáng kể.
Mẫu nghiên cứu gồm 16 ngân hàng với dữ liệu từ năm 2007 – 2015 tạo thành dữ liệu bảng cân bằng với 144 quan sát.