Dữ liệu bảng được cấu thành bởi những quan sát theo không gian và những quan sát theo thời gian. Những mô hình sử dụng dữ liệu bảng thường được ước lượng bởi mô hình tổng quát về dữ liệu bảng như sau:
𝐘𝐢𝐭 = 𝛂 + 𝛃𝟐𝐗𝟐𝐢𝐭+ 𝛃𝟑𝐗𝟑𝐢𝐭+ ⋯ + 𝛃𝐧𝐗𝐧𝐢𝐭+ 𝐮𝐢𝐭 (3.2)
Trong đó (𝐮𝐢𝐭) là sai số kết hợp của mô hình với 𝐮𝐢𝐭 = 𝐯𝐢 + 𝐞𝐢𝐭. Trong sai số kết hợp này, (𝐯𝐢) được coi là những ảnh hưởng đặc thù của từng đơn vị i không quan sát được và không thay đổi theo thời gian, còn (𝐞𝐢,𝐭) là những biến số ngẫu nhiên xuất hiện ở sai số hay còn gọi là sai số đặc thù quan sát được và thay đổi theo thời gian. Trong trường hợp (𝐯𝐢) không tác động lên các biến số độc lập và (𝐞𝐢,𝐭) không bị tự tương quan thì phương pháp ước lượng phù hợp là Pooled OLS.
Tuy nhiên, do (𝐯𝐢)là một thành phần của sai số và nó có thể tác động lên các biến số độc lập X. Nếu (𝐯𝐢) tương quan với bất kỳ biến độc lập nào thì ước lượng hồi quy từ hồi quy Y theo X sẽ bị ảnh hưởng chéo bởi những nhân tố không đồng nhất không quan sát được, làm cho ước lượng bị chệch. Thậm chí, nếu (𝐯𝐢) không tương quan với bất kỳ một biến giải thích nào thì sự có mặt của nó cũng làm cho cho các ước lượng OLS không hiệu quả và sai số tiêu chuẩn không có hiệu lực. Vì vậy, để khắc phục các nhược điểm gặp phải ở mô hình Pooled OLS, mô hình Fixed Effect Model (FEM) và Random Effect Model (REM) được sử dụng.
Mô hình FEM phát triển từ mô hình Pooled OLS khi có thêm sự kiểm soát từng đặc điểm khác nhau giữa các đơn vị, và có sự tương quan giữa phần dư của mô hình và các biến độc lập. Do vậy, khi (𝐯𝐢) có tác động lên các biến số độc lập thì phương pháp ước lượng phù hợp là FEM. Với giả định mỗi đơn vị đều có những đặc điểm riêng biệt có thể ảnh hưởng đến các biến giải thích, FEM phân tích mối tương quan này giữa phần dư của mỗi đơn vị với các biến giải thích qua đó kiểm soát và tách ảnh hưởng của các đặc điểm riêng biệt (không đổi theo thời gian) ra khỏi các biến giải thích để có thể ước lượng những ảnh hưởng thực (net effects) của biến giải thích lên biến phụ thuộc.
Mô hình REM cũng phát phát triển từ mô hình Pooled OLS khi có thêm sự kiểm soát từng đặc điểm khác nhau giữa các đơn vị. Tuy nhiên, điểm khác biệt giữa mô hình REM và FEM được thể hiện ở sự biến động giữa các đơn vị. Nếu sự biến động giữa các đơn vị có tương quan đến biến độc lập trong mô hình FEM thì trong
mô hình REM sự biến động giữa các đơn vị (𝐯𝐢) được giả sử là ngẫu nhiên và không tương quan đến các biến giải thích.
Để xem xét mô hình FEM hay REM phù hợp hơn, sử dụng kiểm định Hausman để xem xét có tồn tại sự tương quan giữa (𝐯𝐢) và các biến độc lập hay không với giả thuyết Ho: (𝐯𝐢) và biến độc lập không tương quan. Nếu giá trị p-value < 0.05 thì bác bỏ Ho, khi đó (𝐯𝐢) và biến độc lập tương quan với nhau, mô hình phù hợp là FEM. Ngược lại, mô hình REM phù hợp để nghiên cứu.
Tuy nhiên, các phương pháp ước lượng trên chỉ đúng nếu như biến độc lập trong mô hình không chứa độ trễ của biến phụ thuộc, có nghĩa là không chứa Yi,t−h (h là độ trễ của Y). Lúc này Yt-h là biến nội sinh (endogeous), có nghĩa là Yt-h sẽ tương quan với sai số. Ngoài ra, sự hiện diện của biến số này sẽ làm tăng sự tự tương quan của sai số (Arellano và Bond, 1991; Mileva, 2007). Để xử lý các vấn đề này, phương pháp ước lượng Generalized Method of Moments (GMM) được xem là phương pháp ước lượng hồi quy cho kết quả vững và hiệu quả.