Mô hình (1) được ước lượng theo phương pháp hồi quy với số liệu bảng. Theo đó, có 3 loại mô hình được sử dụng, cụ thể:
Mô hình tác động cố định (Fixed Effect Model – FEM)
Xét quan hệ kinh tế bao gồm Y là biến phụ thuộc và X1, X2 là hai biến giải thích quan sát được và một hoặc nhiều biến giải thích không quan sát được. Từ đó, tập dữ liệu bảng được hình thành cho Y, X1 và X2, trong đó bao gồm bao gồm N đối tượng được quan sát qua t thời điểm. Như vậy, tổng số quan sát có được là n*t. Mô hình hồi quy tuyến tính cổ điển (Classical Linear Regression Model – CLRM) được xác định bởi:
Với i = 1, 2,…, n và t = 1, 2, …, t
Trong đó, Yit là giá trị của Y cho đối tượng i tại thời điểm t; Xit1 là giá trị của X1 cho đối tượng i tại thời điểm t; Xit2 là giá trị của X2 cho đối tượng i tại thời điểm t; và ηit là sai số của đối tượng i tại thời điểm t. Mô hình hồi quy tác động cố định FEM là một dạng mở rộng của mô hình hồi quy tuyến tính cổ điển, được cho bởi:
Yit = 𝛼1𝑋it1 + 𝛼2𝑋it2+ 𝜓i + 𝜙it
Với 𝜂it = 𝜓i + 𝜙it
Có thể thấy rằng, sai số của mô hình CLRM bao gồm hai thành phần. Thành phần 𝜓 đại diện cho các yếu tố không quan sát được khác nhau giữa các đối tượng nhưng không thay đổi theo thời gian. Trong khi đó, thành phần 𝜙it đại diện cho những yếu tố không quan sát được khác nhau giữa các đối tượng và thay đổi theo thời gian. Giả định rằng tất cả các tác động ròng của các yếu tố không quan sát được lên Y cho đối tượng i không thay đổi theo thời gian (𝜓i) là một tham số cố định (βi). Khi đó, mô hình tác động cố định có thể được viết lại như sau:
Yit = 𝛼1𝑋it1 + 𝛼2𝑋it2+ 𝛽1 + 𝛽2 + ⋯ + 𝛽n + 𝜙it
Như vậy, thành phần sai số không quan sát được βi đã được thay thế bằng một tập hợp các tham số cố định, β1+ β2+…+ βn. Mỗi tham số ứng với một trong đối tượng. Những tham số này được gọi là những tác động không quan sát được và thể hiện tính không đồng nhất không quan sát được. Cụ thể, β1 đo lường tác động ròng của các yếu tố không quan sát được và không thay đổi theo thời gian lên Y cho đối tượng 1, β2 cho đối tượng 2 và βn cho đối tượng n. Vì vậy, trong mô hình tác động cố định mỗi đối tượng trong mẫu đều có một hệ số cắt riêng. N hệ số cắt này kiểm soát tác động của tất cả các yếu tố không quan sát được và không thay đổi theo thời gian lên N đối tượng khác nhau.
Để ước lượng Mô hình tác động cố định (FEM) thì có hai phương pháp, bao gồm: (i) Ước lượng hồi quy biến giả tối thiểu LSDV (Least Squares Dummy Variable Estimator) với mỗi biến giả là đại diện cho mỗi đối tượng quan sát của mẫu; và (ii) Ước lượng tác động cố định FE (Fixed Effects Estimator). Lưu ý rằng nếu n lớn thì
sử dụng ước lượng LSDV sẽ cồng kềnh hoặc không khả thi nên ước lượng tác động cố định FE sẽ thích hợp và hiệu quả hơn.
Mô hình tác động ngẫu nhiên (Random Effect Model – REM)
Xét quan hệ kinh tế với biến phụ thuộc (Y) và hai biến giải thích quan sát được (X1, X2). Tương tự, chúng ta tạo lập được tập dữ liệu bảng cho Y, X1, và X2. Trong đó, dữ liệu bảng bao gồm n đối tượng và t thời điểm, và vì vậy tổng số quan sát là n*t. Mô hình tác động ngẫu nhiên được viết dưới dạng:
Yit = 𝛼1𝑋it1 + 𝛼2𝑋it2+ 𝜂it
Với i = 1, 2, …, n và t = 1, 2, …, t
Trong đó, sai số cổ điển được chia làm 2 thành phần 𝜓i và 𝜙it Thành phần 𝜓i đại diện cho tất các các yếu tố không quan sát được và thay đổi giữa các đối tượng nhưng không thay đổi theo thời gian. Trong khi đó, thành phần 𝜙it đại diện cho tất cả các yếu tố không quan sát được thay đổi giữa các đối tượng và thời gian.
Giả sử rằng 𝜓i được cho bởi: 𝜓i = 𝛽0 + 𝜆i với i = 1, 2, …, N
Trong đó, 𝜓i bao gồm hai thành phần là 𝛽0 (thành phần bất định) và 𝜆i (thành phần ngẫu nhiên). Thành phần bất định (𝛽0) được gọi là tham số cắt trung bình tổng thể. Thành phần ngẫu nhiên (𝜆i) là sự khác nhau giữa tham số cắt trung bình mẫu và tham số cắt cho đối tượng i. Như vậy, mỗi đối tượng trong n đối tượng sẽ có 1 hệ số cắt riêng. Tuy nhiên, trong mô hình tác động ngẫu nhiên n hệ số cắt này không phải là tham số cố định bởi có thêm thành phần ngẫu nhiên 𝜆i Giả định rằng, 𝜆i cho mỗi đối tượng được rút ra từ một phân phối xác suất độc lập với giá trị trung bình bằng 0 và phương sai không đổi:
(𝜆i) = 0; 𝑉ar(𝜆i) = 𝜎𝜆2 ; và 𝐶ov (𝜆i𝜆s) = 0
N biến ngẫu nhiên 𝜆 được gọi tác động ngẫu nhiên (random effects). Mô hình tác động ngẫu nhiên (FEM) có thể được viết lại như sau:
Trong đó, 𝜔it = 𝜆i + 𝜙it. Lưu ý rằng, một giả định quan trọng trong mô hình tác động ngẫu nhiên (FEM) là thành phần sai số 𝜔it không tương quan với bất kì biến giải thích nào trong mô hình.
Về phương pháp ước lượng Mô hình tác động ngẫu nhiên (REM) thì ước lượng OLS sẽ cho các tham số ước lượng không hiệu quả. Hơn nữa, phương sai của các đối tượng thay đổi, dẫn đến thống kê t sẽ không còn chính xác và các hệ số ước lượng không còn đúng. Sở dĩ như vậy là vì ước lượng OLS bỏ qua sự tự tương quan trong thành phần sai số 𝜔it.
Lựa chọn mô hình, kiểm định khuyết tật và sửa lỗi mô hình
Để lựa chọn giữa Mô hình tác động cố định FEM hay Mô hình tác động ngẫu nhiên REM thì nhiều nghiên cứu thực hiện ước lượng cho cả hai mô hình và sau đó tiến hành kiểm định sự khác biệt trong các hệ số đối với các biến giải thích thay đổi theo thời gian hay kiểm định xem liệu các tác động không quan sát được (𝜓i có tương quan với một hoặc một số biến giải thích hay không (Wooldridge, 2009). Kiểm định Hausman (1978) là kiểm định được áp dụng phổ biến nhất trong việc so sánh và xác định sự phù hợp của Mô hình FEM hay Mô hình REM (Baltagi, 2008; Gujarati, 2004). Đối với kiểm định Hausman, giả thuyết H0 và giả thuyết thay thế được phát biểu như sau:
H0: 𝜓i không có tương quan với Xit (hay Mô hình REM là phù hợp); H1: 𝜓i có tương quan với Xit (hay Mô hình FEM là phù hợp)
Để kiểm định giả thuyết H0, chúng ta đối chiếu kết quả ước lượng của hai mô hình FEM và REM. Ước lượng REM là hợp lý theo giả thuyết H0, nhưng không hợp lý đối với giả thuyết thay thế. Ước lượng FEM là hợp lý ở giả thuyết H1 và cả giả thuyết H0 vì mô hình FEM chỉ cho rằng các tác động không quan sát được phụ thuộc đối tượng, thể hiện qua các hệ số cắt khác nhau, chứ không đề cập đến vấn đề tương quan giữa 𝜓i với Xit. Tuy nhiên, trong trường hợp giả thuyết H0 bị bác bỏ thì ước lượng tác động cố định FEM là phù hợp hơn so với ước lượng tác động ngẫu nhiên REM. Ngược lại, chưa có đủ bằng chứng để bác bỏ H0 nghĩa là không bác bỏ được sự tương quan giữa sai số và các biến giải thích thì ước lượng tác động cố định không còn phù hợp và ước lượng ngẫu nhiên sẽ được lựa chọn.
Sau khi lựa chọn mô hình, để suy diễn thống kê mô hình cần vượt qua các kiểm định chuẩn đoán như là:
Kiểm định hiện tượng tự tương quan
Một vấn đề phổ biến trong phân tích hồi quy là hiện tượng tự tương quan. Hiện tượng tự tương quan là hiện tượng mà sai số tại thời điểm t có mối quan hệ với sai số tại thời điểm t-1 hoặc tại bất kỳ một thời điểm nào trong quá khứ. Khi xảy ra hiện tượng tự tương quan, các hàm ước lượng của mô hình vẫn là tuyến tính không thiên lệch và nhất quán, nhưng chúng không còn là kết quả nữa. Hiện tượng này có thể là do tính ì (một đặc điểm của đa số chuỗi thời gian kinh tế) hay các thiên lệch trong xác định đặc trưng như loại biến hay dạng hàm không đúng. Vì thế, cần kiểm định hiện tượng tự tương quan trước khi phân tích kết quả mô hình hồi quy.
Với mô hình hồi quy sử dụng dữ liệu bảng, năm 2002, Wooldridge đã đưa ra một kiểm định đơn giản cho việc kiểm định hiện tượng tự tương quan. Drukker (2003) đưa ra nhiều kết quả chỉ ra rằng kiểm định này đưa ra kết quả đáng tin cậy. Bằng sự hỗ trợ của phần mềm Eviews, nghiên cứu sử dụng kiểm định Breusch-Godflrey để kiểm định sự tương quan của mô hình. Kết quả từ kiểm định này chỉ ra hiện tượng tự tương quan khi p<0,05.
Kiểm định hiện tượng phương sai sai số thay đổi
Trước khi phân tích kết quả hồi quy, một trong các giả thiết ban đầu là phương sai sai số không đổi. Khi thực hiện hồi quy, nếu xảy ra hiện tượng phương sai của mỗi biến ngẫu nhiên trong điều kiện giá trị đã cho của biến độc lập thay đổi, tức là phương sai sai số thay đổi thì sẽ vi phạm giả thiết trên. Khi đó, các ước lượng mặc dù không chệch nhưng không kết quả làm cho các ước lượng không có ý nghĩa thống kê và mô hình không chuẩn nữa.
Có nhiều phương pháp kiểm định hiện tượng phương sai sai số thay đổi. Trong nghiên cứu này, FEM là mô hình hồi quy tốt hơn cho mẫu nghiên cứu. Vì thế, nghiên cứu sinh sử dụng kiểm định phương sai sai số thay đổi Heteroskedasticity Test bằng kiểm định White. Trong kiểm đinh White, H0 là nhiễu của mô hình có phương sai thuần nhất, H1 là nhiễu có phương sai thay đổi.