7. Tổng quan tài liệu nghiên cứu
2.5.2. Ƣớc lƣợng mô hình
a. Mô hình tác động cố định (Fixed Effects Model)
Xét một mối quan hệ kinh tế, với biến phụ thuộc, Y, và các biến giải thích quan sát đƣợc, X1, X2…, Xn và một hoặc nhiều biến không quan sát đƣợc. Chúng ta có dữ liệu bảng cho Y, X1, X2, Xn. Dữ liệu bảng bao gồm N - đối tƣợng và T - thời điểm, và vì vậy chúng ta có N×T quan sát. Mô hình hồi quy tuyến tính cổ điển không có hệ số cắt đƣợc xác định bởi:
Yit = β1X1it +β2X2it +…+ βnXnit + μit với i = 1, 2, …, N và t = 1, 2,…, T Trong đó Yit là giá trị của Y cho đối tƣợng i ở thời điểm t; Xnit là giá trị của Xn đối tƣợng i ở thời điểm t, và μit là sai số của đối tƣợng i ở thời điểm t.
Mô hình hồi quy tác động cố định, là một dạng mở rộng của mô hình hồi quy tuyến tính cổ điển, đƣợc cho bởi:
Yit = β1X1it +β2X2it +…+ βnXnit +νi + εit
Trong đó μit = νi + εit. Sai số của mô hình hồi quy tuyến tính cổ điển đƣợc tách làm hai thành phần. Thành phần νi đại diện cho các yếu tố không quan sát đƣợc khác nhau giữa các đối tƣợng nhƣng không thay đổi theo thời gian. Thành phần εit đại diện cho những yếu tố không quan sát đƣợc khác nhau giữa các đối tƣợng và thay đổi theo thời gian.
Có hai phƣơng pháp ƣớc lƣợng đƣợc sử dụng để ƣớc lƣợng các tham số của mô hình tác động cố định: ƣớc lƣợng hồi quy biến giả bình phƣơng tối thiểu với mỗi biến giả là đại diện cho mỗi đối tƣợng quan sát của mẫu và ƣớc lƣợng tác động cố định (Fixed effects estimator).
+ Khi N lớn, việc sử dụng ƣớc lƣợng LSDV sẽ rất cồng kềnh hoặc không khả thi. Chẳng hạn, chúng ta muốn ƣớc lƣợng mô hình xác định lƣợng, có mẫu N = 1000 ngƣời lao động. Để sử dụng ƣớc lƣợng hồi quy biến giả bình phƣơng tối thiểu, chúng ta sẽ cần tạo ra 1000 biến giả và chạy hồi quy OLS (phƣơng pháp bình phƣơng nhỏ nhất) hơn 1000 biến. Trong trƣờng hợp nhƣ vậy, ƣớc lƣợng tác
động cố định sẽ thích hợp hơn.
Nguyên tắc của ƣớc lƣợng tác động cố định đƣợc hiểu nhƣ sau. Để đánh giá tác động nhân quả của biến độc lập Xn lên biến phụ thuộc Y, ƣớc lƣợng tác động cố định sử dụng sự thay đổi trong Xn, và Y theo thời gian. Gọi Zi là kí hiệu cho một biến không quan sát đƣợc khác nhau giữa các đối tƣợng nhƣng không đổi theo thời gian và vì vậy bao gồm cả phần sai số trong đó. Bởi vì Zi không thay đổi theo thời gian nên nó không thể giải thích bất kì sự thay đổi nào trong Yit. Vì vậy, loại trừ tác động cố định của Zi lên Yit bằng cách sử dụng dữ liệu sự thay đổi của Yit theo thời gian.
b. Mô hình tác động ngẫu nhiên (Random Effects Model)
Xét một mối quan hệ kinh tế bao gồm một biến phụ thuộc, Y, và các biến giải thích quan sát đƣợc, X1, X2…, Xn. Chúng ta có dữ liệu bảng cho Y, X1, X2…, Xn. Dữ liệu bảng gồm có N đối tƣợng và T thời điểm, và vì vậy chúng ta có N×T quan sát.
Mô hình tác động ngẫu nhiên đƣợc viết dƣới dạng: Yit = β1X1it +β2X2it +…+ βnXnit + νi + εi
Với i = 1, 2, …, N và t = 1, 2, …, T
Trong đó, sai số cổ điển đƣợc chia làm 2 thành phần. Thành phần νi đại diện cho tất các các yếu tố không quan sát đƣợc mà thay đổi giữa các đối tƣợng nhƣng không thay đổi theo thời gian. Thành phần εit đại diện cho tất cả các yếu tố không quan sát đƣợc mà thay đổi giữa các đối tƣợng và thời gian. Giả sử rằng νi đƣợc cho bởi:
νi = α0 + ωi, với i = 1, 2, …, N Trong đó, νi lại đƣợc phân chia làm hai thành phần: i) thành phần bất định α0,
Giả định rằng, ωi cho mỗi đối tƣợng đƣợc rút ra từ một phân phối xác suất độc lập với giá trị trung bình bằng 0 và phƣơng sai không đổi, đó là, E(ωi) = 0, Var(ωi) = σω2, Cov(ωi,ωs) = 0
N biến ngẫu nhiên ωi đƣợc gọi tác động ngẫu nhiên (random effects). Mô hình tác động ngẫu nhiên có thể đƣợc viết lại:
Yit = α0X1it + β2X2it +…+ βnXnit + μit
Trong đó μit= ωi + εit. Một giả định quan trọng trong mô hình tác động ngẫu nhiên là thành phần sai số μit không tƣơng quan với bất kì biến giải thích nào trong mô hình.
Ƣớc lƣợng OLS cho mô hình tác động ngẫu nhiên sẽ cho các tham số ƣớc lƣợng không chệch nhƣng lại không hiệu quả. Hơn nữa, ƣớc lƣợng OLS bỏ qua sự tự tƣơng quan trong thành phần sai số μit, do đó thống kê t sẽ không còn chính xác. Để kết quả ƣớc lƣợng không chệch và hiệu quả, chúng ta có thể sử dụng ƣớc lƣợng GLS khả thi (FGLS) để khắc phục hiện tƣợng sai số nhiễu tự tƣơng quan. Ƣớc lƣợng FGLS còn đƣợc gọi là ƣớc lƣợng tác động ngẫu nhiên (Random effects estimator).