Nguồn dữ liệu sử dụng trong đề tài này chủ yếu là dữ liệu thu thập từ các báo cáo tài chính, báo cáo tình hình quản trị, bản cáo bạch đƣợc các NHTM công bố thƣờng niên trên trang chủ của các ngân hàng, NHNN Việt Nam, Sở Giao Dịch Chứng Khoán Thành phố Hồ Chí Minh và Hà Nội cũng nhƣ một số website chuyên về thông tin chứng khoán nhƣ: cafef.vn, vietstock.vn… Các số liệu nhƣ: tỷ lệ sở hữu ngoài, tỷ suất sinh lợi trên tổng tài sản, tỷ suất sinh lợi trên tổng nguồn vốn đƣợc tác giả lấy trực tiếp từ những báo cáo này. Các số liệu khác: quy mô ngân hàng, tỷ lệ vốn chủ sở hữu trên tổng tài sản, tỷ lệ tài sản thanh khoản trên tổng tài sản, tỷ lệ tổng chi phí trên tổng thu nhập thì tác giả tính toán lại dựa trên các số liệu công bố của các ngân hàng. Trong khi đó, số liệu về tỷ lệ lạm phát hàng năm đƣợc lấy từ website của Tổng cục Thống kê Việt Nam (www.gos.gov.vn)
Theo báo cáo của NHNN Việt Nam, tính đến ngày 30/06/2017, toàn quốc có hơn 46 ngân hàng các loại, đề tài sẽ áp dụng các tiêu chí phân loại nhƣ sau:
- Loại bỏ những NHTMCP có hoạt động bị sáp nhập (Ngân hàng Phƣơng Nam, Ngân hàng Phát Triển Mê Kông,..) hoặc các Ngân hàng bị Nhà nƣớc mua lại với giá 0 đồng (Ngân hàng Đại Dƣơng, Ngân hàng Xây Dựng, Ngân hàng Dầu Khí Toàn Cầu).
- Loại bỏ những ngân hàng có chức năng đặc biệt, kinh doanh không vì mục tiêu lợi nhuận (Ngân hàng Phát Triển Việt Nam)
- Loại bỏ những NHTMCP không thu thập đƣợc báo cáo tài chính
Sau khi loại các ngân hàng có chức năng đặc biệt, các ngân hàng có hoạt động sáp nhập và các ngân hàng không thực hiện công bố số liệu, còn lại khoảng 20 ngân hàng để thực hiện lấy số liệu nghiên cứu (Phụ lục). Giai đoạn nghiên cứu từ 2007 đến 2017 là 11 năm, tuy nhiên, có những năm một số ngân hàng không công
bố báo cáo tài chính nên không tìm đƣợc số liệu. Vì vậy, kích thƣớc mẫu của nghiên cứu là 183 quan sát từ 20 NHTMCP trong giai đoạn 2007-2017. Các ngân hàng này tất cả đều có hoặc đã từng có sở hữu nƣớc ngoài. Sau khi có đƣợc số liệu hoàn chỉnh về các biến của đề tài sẽ đƣợc đƣa vào phần mềm STATA để xử lý và chạy mô hình nghiên cứu.