3.2. Phương pháp kinh tế lượng
3.2.1. Mơ hình tĩnh
Mơ hình hồi quy tổng thể đối với dữ liệu dạng bảng có thể được viết như sau: Yit = Xit + i + uit (20)
với i = 1,…,N và t = 1,2, ... .T
Trong đó Xit là ma trận cấp 1 * K chứa các biến quan sát được có thể thay đổi theo thời gian hoặc theo cá nhân, là ma trận của các tham số cần ước lượng. αi
được gọi là thành phần không quan sát được, biến tiềm ẩn; đại diện cho hiệu ứng cá nhân hoặc sự không đồng nhất giữa các cá nhân. Các cá nhân ở đây có thể được có thể được hiểu là các gia đình, cơng ty, thành phố. Các uit được gọi là những sai số hệ thống vì chúng có thể những thay đổi theo t cũng như theo i, với điều kiện: uit ~ N(0, 𝜎𝑢2) và i ~ N(0, 𝜎2) độc lập với nhau và với bản thân chúng.
Đối với mơ hình tĩnh đối với dữ liệu dạng bảng, ba phương pháp được sử dụng bao gồm: Phương pháp bình phương nhỏ nhất dạng gộp (Pooled OLS), phương pháp tác động cố định (FEM) và phương pháp tác động ngẫu nhiên (REM).
Phương pháp bình phương nhỏ nhất dạng gộp xét các thực thể là đồng nhất, do đó, xem dữ liệu là dữ liệu chéo, sau đó sử dụng phương pháp bình phương nhỏ nhất để tìm các ước lượng. Điều này thơng thường khơng phù hợp về mặt thực tế vì mỗi quốc gia là một thực thể riêng biệt, sẽ có những đặc điểm riêng hồn tồn khác nhau (chẳng hạn như chính sách, chế độ chính trị, tăng trưởng kinh tế) có thể ảnh hưởng đến số lao động trẻ thất nghiệp. Vì vậy, ước lượng bằng phương pháp Pooled OLS có thể dẫn đến các ước lượng chệch vì khơng kiểm sốt được những đặc điểm riêng lẻ.
Để kiểm soát các đặc điểm riêng lẻ giữa các quốc gia, giả định rằng tất cả các tác động của các yếu tố không quan sát được lên Y cho đối tượng i (không thay đổi theo thời gian) là một tham số cố định. Khi đó, mơ hình tác động cố định có thể được viết lại:
Yit = Xit + 1D1+ 2D2+…+ NDN+ uit (21) trong đó, Di là biến giả đại diện cho cá nhân thứ i.
Nhược điểm của mơ hình nhân tố tác động cố định được sử dụng khi nghiên cứu chỉ tập trung vào phân tích ảnh hưởng của các biến thay đổi theo thời gian. Tuy nhiên, mơ hình tác động cố định giả định rằng có một yếu tố nào đó giữa các cá thể có thể ảnh hưởng đến mối quan hệ giữa biến phụ thuộc và biến độc lập, hay nói cách khác, nó cho phép các biến đặc trưng cho từng các nhân khơng quan sát được có thể tương quan với biến độc lập trong mơ hình.
Để lựa chọn giữa mơ hình Pooled OLS và mơ hình FEM, cần chứng minh rằng các đặc điểm riêng lẻ không ảnh hưởng đến biến phụ thuộc. Do đó, giả thuyết cần kiểm định dựa trên mơ hình (2) trong trường hợp này như sau:
H0: 1 = 2 = ...= N = 0
Giả thuyết trên được kiểm định qua kiểm định Wald với thống kê F. Nếu giả thuyết H0 bị bác bỏ, mơ hình FEM tốt hơn.
Khác với mơ hình tác động cố định, mơ hình ngẫu nhiên giả định các đặc trưng của cá nhân khơng quan sát i là ngẫu nhiên. Khi đó, it = i + uit được gọi là sai số tổng hợp. Trong trường hợp này, mơ hình (1) ở trên sẽ có hiện tượng tự tương quan. Nếu sử dụng phương pháp bình phương bé nhất thì các ước lượng thu được từ mơ hình sẽ khơng cịn là ước lượng hiệu quả nhất. Hơn nữa, các ước lượng của sai số chuẩn và do đó thống kê t sẽ khơng cịn chính xác. Do đó, phương pháp bình phương bé nhất tổng quá được sử dụng để ước lượng các hệ số hồi quy trong trường hợp này. Một giả thiết quan trọng của mơ hình tác động ngẫu nhiên là các đặc trưng của cá nhân không được tương quan với biến độc lập trong mơ hình, nếu khơng, các ước lượng thu được sẽ bị chệch.
Để lựa chọn giữa tác động cố định và tác động ngẫu nhiên, chúng ta cần thiết phải kiểm tra sự tương quan giữa các đặc trưng của từng cá nhân không quan sát được với các biến giải thích. Kiểm định Hausman sẽ thực hiện việc kiểm tra này. Giả thuyết H0 và H1 tương ứng của kiểm định Hausman như sau:
H0: Cov(Xit, i) = 0: mơ hình REM tốt hơn H1: Cov(Xit, i) 0: mơ hình FEM tốt hơn
Thống kê kiểm định tuân theo phân phối chi-bình phương với bậc tự do bằng số biến độc lập trong mơ hình. Với mức ý nghĩa cho trước, thống kê kiểm định lớn hơn giá trị tới hạn thì bác bỏ H0.
Để lựa chọn giữa mơ hình REM và Pooled OLS, giải thuyết H0 và H1 tương ứng như sau:
H0: Var(i) = 0 : mơ hình Pooled OLS tốt hơn H1: Var(i) 0 : mơ hình REM tốt hơn
Sự khác nhau giữa Pooled OLS và REM chính là i được xem là hằng số hay là biến ngẫu nhiên. Kiểm định LM (Breusch – Pagan Lagrange Multiplier) được sử dụng trong trường hợp này. Nếu thống kê chi bình - phương tính tốn được lớn hơn giá trị tới hạn thì bác bỏ H0.