Phƣơng pháp hồi quy dữ liệu bảng

Hồi quy dữ liệu bảng sử dụng ba phƣơng pháp chính, đó là phƣơng pháp Pooled OLS, phƣơng pháp tác động cố định (FEM) và phƣơng pháp tác động ngẫu nhiên (FEM).

• Hồi quy theo mô hình Pooled OLS

Phƣơng pháp Pooled OLS thực chất là việc sử dụng dữ liệu bảng để phân tích bằng hình thức sử dụng tất cả dữ liệu theo cách xếp chồng và không phân biệt từng đơn vị chéo riêng. Đây là phƣơng pháp thông thƣờng và đơn giản nhất, tƣơng tự nhƣ việc phân tích OLS bình thƣờng, không kể đến kích thƣớc không gian và thời gian của dữ liệu. Mô hình Pooled OLS đƣợc cụ thể nhƣ sau:

𝑁iiiiiiiiiiiiiii =�1+ 1𝑁1iiiiiiiiiiiiii i + 𝑁2𝑁2iiiiiiiiiiiiii i+. . +++++++++++++++ 𝑁𝑁iiiiiiiiiiiiiii + +++++++++++++++ iiiiiiiiiiiiiii (3.2) Trong đó 𝑁iiiiiiiiiiiiiii là biến phụ thuộc của quan sát i trong thời kỳ t, 𝑁iiiiiiiiiiiiiii là biến độc lập của quan sát k trong thời kỳ k.

Mô hình này có một số nhƣợc điểm, đó là nhận diện sai thể hiện ở Durbin – Watson (DW) và ràng buộc quá chặt về các đơn vị chéo, điều này khó xảy ra so với thực tế. Vì thế, để khắc phục các nhƣợc điểm trên, mô hình FEM và REM đƣợc sử dụng.

• Hồi quy theo mô hình tác động cố định – FEM

Để thể hiện tác động đặc trƣng của mỗi đơn vị chéo đến biến phụ thuộc nhằm cho tung độ gốc thay đổi đối với mỗi đơn vị nhƣng hệ số độ dốc không thay đổi. Phƣơng pháp đó đƣợc gọi là phƣơng pháp hồi quy theo mô hình tác động cố định (FEM),

nghĩa là tung độ gốc có thể khác nhau giữa các đơn vị chéo nhƣng không thay đổi theo thời gian.

Với giả định mỗi đơn vị đều có những đặc điểm riêng biệt có thể ảnh hƣởng đến các biến giải thích, FEM phân tích mối tƣơng quan này giữa phần dƣ của mỗi đơn vị với các biến giải thích qua đó kiểm soát và tách ảnh hƣởng của các đặc điểm riêng biệt (không đổi theo thời gian) ra khỏi các biến giải thích để chúng ta có thể ƣớc lƣợng những ảnh hƣởng thực (net effects) của biến giải thích lên biến phụ thuộc. Mô hình FEM có dạng nhƣ sau:

𝑁iiiiiiiiiiiiiii = 𝑁i + 𝑁𝑁iiiiiiiiiiiiiii + +++++++++++++++iiiiiiiiiiiiiii (3.3) Trong đó 𝑁iiiiiiiiiiiiiii là biến phụ thuộc của quan sát i trong thời gian t, 𝑁iiiiiiiiiiiiiii là biến độc lập của quan sát i trong thời gian t, 𝑁i là hệ số chặn cho từng đơn vị nghiên cứu, 𝑁 là hệ số góc đối với nhân tố x và 𝑁iiiiiiiiiiiiiiilà phần dƣ.

Theo Brooks (2008) để ƣớc lƣợng mô hình này thì có hai phƣơng pháp ƣớc lƣợng đƣợc sử dụng để ƣớc lƣợng tham số của mô hình tác động cố định, đó là (i) Ƣớc lƣợng hồi quy biến giả tối thiểu LSDV1 đối với mỗi biến giả là đại diện cho mỗi đối tƣợng quan sát của mẫu; (ii) Ƣớc lƣợng tác động cố định (Fixed effects estimator). Mặc dù có thể khắc phục nhƣợc điểm của phƣơng pháp Pooled OLS nhƣng mô hình FEM vẫn có một số nhƣợc điểm: Thứ nhất, nếu sử dụng quá nhiều biến giả thì sẽ làm mất bậc tự do của dữ liệu. Thứ hai, khi sử dụng quá nhiều biến giả thì sẽ làm cho mô hình xảy ra hiện tƣợng đa cộng tuyến do các thông số ƣớc lƣợng không chính xác. Thứ ba, mô hình FEM không xét tới tác động của các biến không thay đổi theo thời gian (giới tính, chủng tộc)

• Hồi quy theo mô hình tác động ngẫu nhiên – REM

Điểm khác biệt giữa mô hình ảnh hƣởng ngẫu nhiên và mô hình ảnh hƣởng cố định đƣợc thể hiện ở sự biến động giữa các đơn vị. Nếu sự biến động giữa các đơn vị có tƣơng quan đến biến độc lập – biến giải thích trong mô hình ảnh hƣởng cố định thì trong mô hình ảnh hƣởng ngẫu nhiên sự biến động giữa các đơn vị đƣợc giả sử là ngẫu nhiên và không tƣơng quan đến các biến giải thích.

Chính vì vậy, nếu sự khác biệt giữa các đơn vị có ảnh hƣởng đến biến phụ thuộc thì REM sẽ thích hợp hơn so với FEM. Trong đó, phần dƣ của mỗi thực thể (không tƣơng quan với biến giải thích) đƣợc xem là một biến giải thích mới.

Ý tƣởng của mô hình REM cũng bắt đầu từ mô hình nhƣ sau:

𝑁iiiiiiiiiiiiiii = 𝑁i + 𝑁𝑁iiiiiiiiiiiiiii + +++++++++++++++iiiiiiiiiiiiiii (3.4) Thay vì trong mô hình trên, 𝑁i là cố định thì trong REM có giả định rằng nó là một biến ngẫu nhiên với trung bình là C1 và giá trị hệ số chặn đƣợc mô tả nhƣ sau

𝑁i = 𝑁 + si (i = 1, … , 𝑁) (3.5)

Trong đó si là sai số ngẫu nhiên có trung bình bằng 0 và phƣơng sai là 𝑁2. Thay vào mô hình tác giả đƣợc:

𝑁iiiiiiiiiiiiiii = 𝑁 + 𝑁𝑁iiiiiiiiiiiiiii + siiiiiiiiiiiiiii + 𝑁iiiiiiiiiiiiiii hay 𝑁iiiiiiiiiiiiiii = 𝑁 + 𝑁𝑁iiiiiiiiiiiiiii + 𝑁iiiiiiiiiiiiiii và 𝑁iiiiiiiiiiiiiii = siiiiiiiiiiiiiii + 𝑁iiiiiiiiiiiiiii (3.6) Trong đó siiiiiiiiiiiiiii là sai số thành phần của các đối tƣợng khác nhau (đặc điểm khác nhau của từng doanh nghiệp) và 𝑁iiiiiiiiiiiiiii là sai số thành phần kết hợp khác của cả đặc điểm riêng theo từng đối tƣợng và theo thời gian.

So với phƣơng pháp FEM, phƣơng pháp REM có thể khắc phục toàn bộ nhƣợc điểm của phƣơng pháp FEM nhƣng REM coi mỗi đặc điểm riêng của các đơn vị si không tƣơng quan với các biến độc lập. Do đó nếu xảy ra hiện tƣợng này thì REM ƣớc lƣợng không còn chính xác.

• Kiểm định Hausman

Để xem xét mô hình FEM hay REM phù hợp hơn, tác giả sẽ kiểm định Hausman. Ý nghĩa của kiểm định Hausman là để xem xét có sự tồn tại tự tƣơng quan giữa si và các biến độc lập hay không. Giả thiết của kiểm định Hausman nhƣ sau: H0 là si và các biến độc lập không tƣơng quan; H1 là si và các biến độc lập có tƣơng quan (Brooks, 2008).

Khi giá trị P_value < 0.05 thì tác giả bác bỏ H0, khi đó thì si và các biến độc lập có tƣơng quan với nhau, do đó mô hình FEM đƣợc lựa chọn. Ngƣợc lại nếu P_value > 0.5 thì mô hình REM đƣợc lựa chọn

Các nghiên cứu thực nghiệm trong nƣớc

Khái quát dữ liệu bảng