Theo Brooks (2008), dữ liệu bảng hay còn đƣợc gọi bằng tên khác, nhƣ dữ liệu gộp chung (gộp chung các quan sát chéo và chuỗi thời gian), là sự kết hợp của dữ liệu chéo và chuỗi thời gian, dữ liệu bảng vi mô (micropanel data), dữ liệu dọc (longitudinal data) (đó là một nghiên cứu nào đó theo thời gian về một biến hay một nhóm đối tƣợng), phân tích lịch sử sự kiện, phân tích theo tổ (cohort analysis). Mô hình dữ liệu bảng đƣợc Brooks cụ thể nhƣ sau:
𝑁iiiiiiiiiiiiiii + ++++++++++++++=� iiiiiiiiiiiiiii + 𝑁iiiiiiiiiiiiiii (3.1) Trong đó 𝑁iiiiiiiiiiiiiii là biến phụ thuộc, � là hệ số chặn, 𝑁 là × vecto tham số đƣợc ƣớc lƣợng bằng biến giải thích, và 𝑁iiiiiiiiiiiiiii là × vecto của số quan sát trong biến giải thích, t
= 1,….,T; i = 1,….,N2.
So với các dữ liệu chéo thì dữ liệu bảng có nhiều ƣu điểm hơn, cụ thể nhƣ sau:
• Dữ liệu bảng chứa nhiều thông tin hơn, tính biến thiên nhiều hơn, ít hiện tƣợng đa cộng tuyến hơn, có nhiều bậc tự do hơn và hiệu quả cao hơn.
• Dữ liệu bảng phù hợp cho việc nghiên cứu động thái hay đổi theo thời gian của các đơn vị chéo này, ví dụ nhƣ những tác động của thất nghiệp, tốc độ quay vòng việc làm, tính dịch chuyển của lao động đƣợc nghiên cứu tốt hơn khi có dữ liệu bảng.
• Dữ liệu bảng có thể phát hiện và đo lƣờng tốt hơn các tác động mà ngƣời ta không thể quan sát đƣợc trong dữ liệu chuỗi thời gian hay dữ liệu chéo thuần túy.
• Dữ liệu bảng giúp tác giả có thể nghiên cứu các mô hình phức tạp hơn. Thí dụ, chúng ta có thể xử lý tốt hơn bằng dữ liệu bảng các hiện tƣợng nhƣ lợi thế kinh tế theo qui mô và thay đổi công nghệ so với dữ liệu chéo hay dữ liệu chuỗi thời gian.
Tóm lại, dữ liệu bảng có thể giúp tác giả phân tích thực nghiệm phong phú hơn so với cách sử dụng dữ liệu chéo hay dữ liệu chuỗi thời gian.