Nghiên cứu sử dụng dữ liệu thứ cấp bao gồm dữ liệu tài chính kế toán của các NHTM, dữ liệu kinh tế vĩ mô cho giai đoạn 2010 – 2014. Dữ liệu tài chính kế toán của NHTM bao gồm các chỉ tiêu trong bảng cân đối kế toán và báo cáo kết quả kinh doanh dùng để tính toán các chỉ tiêu đại diện cho các nhân tố bên trong ngân hàng được thu thập từ báo cáo tài chính đã kiểm toán hàng năm của ngân hàng. Dữ liệu GDP và lạm phát hàng năm được thu thập từ báo cáo của NHNN Việt Nam, Tổng cục thống kê, ADB, Worldbank. Giai đoạn nghiên cứu được chọn dựa trên thực tế đây là giai đoạn các NHTM hoạt động mạnh mẽ và có những thay đổi lớn trong hệ thống NHTM Việt Nam và nền kinh tế vĩ mô. Giai đoạn này bắt đầu từ việc các NHTM chạy đua trong việc tăng vốn điều lệ để tuân thủ về mức vốn pháp định tối thiểu đến cuối năm 2010 theo Nghị định 141 của Chính phủ, từ đó dẫn đến hiện tượng sở hữu chéo hình thành. Trong những năm gần đây, hệ thống ngân hàng lại chứng kiến hàng loạt những thương vụ mua bán, sáp nhập và tái cơ cấu cũng như những quy định mới của NHNN nhằm mục tiêu xử lý nợ xấu và hiện tượng sở hữu chéo ngày càng phức tạp.
Phương pháp chọn mẫu được áp dụng là chọn mẫu chỉ tiêu không xác suất vìđảm bảo rằng một số nhất định các ngân hàng với các hình thức sở hữu chéo khác nhau sẽ có
mặt trong mẫu. Tất cả các NHTM Việt Nam với hai loại hình NHTMNN và NHTMCP được bao gồm trong nghiên cứu. Tuy nhiên, một số ngân hàng không công bố BCTC, đồng thời nghiên cứu xử lý các điểm “đột biến” bằng phương pháp thống kê dựa trên phân phối chuẩn, nhằm tránh làm nhiễu trong phân tích dữ liệu và kết quả của mô hình hồi quy. Kết quả, nghiên cứu còn lại 28 ngân hàng với dữ liệu trong giai đoạn từ 2010 – 2014, tạo thành 140 quan sát. Số lượng các NHTM trong mẫu nghiên cứu bao gồm các NHTMNN và NHTMCP với quy mô lớn, vừa và nhỏ chiếm 80% tổng tài sản và 70% tổng vốn điều lệ (tại 31/12/2014) của hệ thống các NHTM Việt Nam đã đại diện được cho tổng thể nghiên cứu (Danh sách các NHTM trong mẫu nghiên cứu được trình bày trong Phụ lục 1).