Các ưu điểm của dữ liệu bảng so với dữ liệu theo chuỗi thời gian và không gian, theo Baltagi:
Vì dữ liệu bảng liên quan đến các cá nhân, doanh nghiệp, tiểu bang, đất nước, v.v… theo thời gian, nên nhất định phải có tính dị biệt (không đồng nhất)
trong các đơn vị này. Kỹ thuật ước lượng dữ liệu bảng có thể chính thức xem xét đến tính dị biệt đó bằng cách xem xét các biến số có tính đặc thù theo từng cá nhân. Ta sử dụng thuật ngữ cá nhân theo ý nghĩa chung bao gồm các đơn vị vi mô như các cá nhân, các doanh nghiệp, tiểu bang, và đất nước.
Thông qua kết hợp các chuỗi theo thời gian của các quan sát theo không gian, dữ liệu bảng cung cấp “những dữ liệu có nhiều thông tin hơn, đa dạng hơn, ít cộng tuyến hơn giữa các biến số, nhiều bậc tự do hơn và hiệu quả hơn.’
Thông qua nghiên cứu các quan sát theo không gian lặp lại, dữ liệu bảng phù hợp hơn để nghiên cứu tính động của thay đổi. Tình trạng thất nghiệp, luân chuyển công việc, và tính lưu chuyển lao động sẽ được nghiên cứu tốt hơn với dữ liệu bảng.
Dữ liệu bảng có thể phát hiện và đo lường tốt hơn những ảnh hưởng mà không thể quan sát trong dữ liệu chuỗi thời gian thuần túy hay dữ liệu chéo theo không gian thuần túy. Ví dụ, ảnh hưởng của luật tiền lương tối thiểu đối với việc làm và thu nhập có thể được nghiên cứu tốt hơn nếu chúng ta xem xét các đợt gia tăng tiền lương tối thiểu liên tiếp nhau trong mức lương tối thiểu của nhà nước.
Dữ liệu bảng giúp ta nghiên cứu những mô hình hành vi phức tạp hơn. Ví dụ, các hiện tượng như lợi thế kinh tế theo qui mô và thay đổi kỹ thuật có thể được xem xét thông qua dữ liệu bảng tốt hơn so với dữ liệu theo chuỗi thời gian thuần túy hay theo không gian thuần túy. Bằng cách thu thập những số liệu có sẵn cho vài nghìn đơn vị, dữ liệu bảng có thể tối thiểu hóa sự thiên lệch có thể xảy ra nếu ta tổng hợp các cá nhân hay các doanh nghiệp thành số liệu tổng.
Nói vắn tắt, dữ liệu bảng có thể giúp chúng ta phân tích thực nghiệm theo những cách thức mà không chắc có thể đạt được nếu ta chỉ sử dụng các dữ liệu theo chuỗi thời gian hay không gian thuần túy
Phương pháp nghiên cứu được sử dụng trong bài là phương pháp phân tích thống kê mô tả. Sau đó tiến hành phương pháp ước lượng bình quân tối thiểu (Pooled OLS), kiểm định sự phù hợp phương sai thay đổi và tự tương quan để xem xét sử dụng mô hình hiệu ứng cố định (FEM – Fixed Effects Model), mô hình hiệu
ứng ngẫu nhiên (REM – Random Effects Model) và phương pháp hồi quy GMM. Các bước thực hiện trong quá trình chạy mô hình như sau:
Bước 1: Thực hiện thống kê mô tả, mục đích lọc dữ liệu. Loại bỏ các quan sát quá sai lệch so với dữ liệu mẫu trong mô hình hồi quy. Cung cấp tham số thống kê mô tả trung bình, phương sai, giá trị nhỏ nhất lớn nhất của dữ liệu cho bài nghiên cứu của tác giả.
Bước 2: Kểm định hiện tượng đa cộng tuyến trong mô hình hồi quy. Nếu hệ số tương quan cặp giữa các biến giải thích cao (>0.8) thì xảy ra hiện tượng đa cộng tuyến nghiêm trọng. Hoặc nhân tử phóng đại phương sai lớn hơn (>10) thì có hiện tượng đa cộng tuyến nghiêm trọng. Việc kiểm định hiện tượng đa cộng tuyến này nhằm mục đích lựa chọn phương pháp hồi quy phù hợp, tránh các trường hợp phát sinh lỗi không mong muốn xảy ra.
Bước 3: Kiểm tra phương sai thay đổi của nhiễu trên dữ liệu. Phương sai thay đổi làm tăng phương sai của ước lượng hệ số ảnh hưởng đến độ tin cậy kiểm định mô hình. Tác giả kiểm tra phương sai thay đổi bằng phương pháp được giới thiệu bởi Greene (2000).
Bước 4: Kiểm tra tự tương quan của nhiễu trên dữ liệu. Tự tương quan của nhiễu làm tăng phương sai của ước lượng hệ số ảnh hưởng đến độ tin cậy kiểm định mô hình. Tác giả kiểm tra tự tương quan của nhiễu bằng phương pháp được giới thiệu bởi – Wooldridge (2002) và Drukker (2003).
Bước 5: Nếu không tồn tại phương sai thay đổi, tự tương quan tác giả sẽ tiếp cận mô hình với phương pháp hình hiệu ứng cố định (FEM – Fixed Effects Model), mô hình hiệu ứng ngẫu nhiên (REM – Random Effects Model), Pooled OLS. Tuy nhiên nếu trong trường hợp phát hiện dữ liệu tồn tại phương sai thay đổi, tự tương quan tác giả sử dụng mô hình GMM để ước lượng nhằm khắc phục phương sai thay đổi, tự tương quan, và nội sinh.