Dữ liệu bảng (Panel data) là bộ dữ liệu bao gồm các quan sát chéo (cross – section) và quan sát theo thời gian (time series) giúp nghiên cứu được sự khác biệt của mẫu. Panel
data có nhiều thuâ ̣n lợi trong phân tích, đă ̣c biê ̣t khi muốn quan sát, phân tích sự biến
đô ̣ng của các nhóm đối tượng nghiên cứu sau các biến cố hay theo thời gian cũng như phân tích sự khác biê ̣t giữa các giữa các nhóm của đối tượng nghiên cứu. Đồng thời, dữ liệu bảng giúp nâng cao số quan sát của mẫu cũng như khắc phục phần nào được hiện tượng đa cộng tuyến. Bên cạnh đó còn chứa đựng nhiều thông tin hơn những bộ dữ liệu chuỗi. Dữ liệu bảng (Panel data) được chia thành 2 dạng: là dữ liệu bảng cân bằng (balanced data - khi các đơn vị chéo có cùng số quan sát theo thời gian) và dữ liệu bảng không cân bằng (unbalance data - khi các đơn vị chéo không có cùng số quan sát theo thời gian).
Cụ thể, bộ dữ liệu sử dụng để hồi quy và kiểm định mô hình trên thực nghiệm tại Việt Nam được lựa chọn là dạng dữ liệu bảng không cân bằng (unbalance data). Trong đó, số lượng năm quan sát của các ngân hàng không bằng nhau do điều kiện thực tế không thu thập được đầy đủ dữ liệu những năm đó. Dữ liệu được thu thập từ báo cáo thường niên của 32 ngân hàng thương mại tại Việt Nam trong vòng 23 năm trong giai đoạn 1992
- 2016. Vì các kết quả phân tích, kiểm định trong nghiên cứu được sử du ̣ng mẫu là dữ
liệu của 32 ngân hàng, ngân hàng có thời gian khảo sát ít nhất là 6 năm, nhiều nhất là
23 năm, và do điều kiện thực tế mà một số ngân hàng không thể thu thập đủ dữ liệu cần thiết nên tổng số quan sát được thực hiện tổng cộng là 422.