Nghiên cứu sử dụng phương pháp hồi quy dữ liệu bảng. Ưu điểm của dữ liệu bảng là dữ liệu cung cấp nhiều thông tin hơn, biến thiên hơn và ít có đa cộng tuyến trong mô hình. Thêm vào đó, kết quả hệ số tương quan giữa các biến trong mô hình cho thấy mối tương quan giữa các biến độc lập trong mô hình là trung bình hoặc thấp nên khả năng xảy ra đa cộng tuyến là rất thấp. Thêm vào đó, ước lượng mô hình bằng dữ liệu bảng còn hạn chế được hiện tượng tự tương quan và phương sai sai số thay đổi trong mô hình.
Có 2 phương pháp hồi quy bao gồm: - Hồi quy mô hình với tác động cố định Mô hình tác động cố định có dạng: Yit = β1 Xit1 + β2 Xit2 + vi + εit
Trong đó:
Yit: giá trị của Y cho đối tượng i ở thời điểm t Xit1:giá trị của X1 cho đối tượng i ở thời điểm t Xit2: giá trị của X2 cho đối tượng i ở thời điểm t μit =vi+εit : sai số của đối tượng i ở thời điểm t
Sai số trong mô hình hồi quy tuyến tính cổ điển được tách ra làm 2 phần. Thành phần vi đại diện cho các yêu tố không quan sát được khác nhau giữa các đối tượng nhưng không thay đổi theo thời gian. Thành phần εit đại diện cho những yếu tố không quan sát được khác nhau giữa các đối tượng và thay đổi theo thời gian.
Giả định rằng tất cả các tác động ròng của các yếu tố không quan sát được lên Y cho các đối tượng i (không thay đổi theo thời gian) là một tham số cố định kí hiệu là ai. Khi đó mô hình tác động cố định có thể viết lại như sau:
Yit = β1 Xit1 + β2 Xit2 + a1 + a2 + ... + an +εit
tham số này gọi là những tác động không quan sát được và thể hiện tính không đồng nhất không quan sát được. Chẳng hạn, a1 thể hiện tác động ròng của các yếu tố không quan sát được lên Y cho đối tượng 1, a2 cho đối tượng 2, ..., an cho đối tượng n. Vì vậy, trong mô hình tác động cố định mỗi đối tượng trong mẫu đều có một hệ số cắt riêng, n hệ số cắt này kiểm soát tác động của tất cả các yếu tố không quan sát được lên N đối tượng khác nhau.
- Hồi quy mô hình với tác động ngẫu nhiên
Mô hình tác động ngẫu nhiên được viết dưới dạng: Yit = β1 Xit1 + β2 Xit2 + vi + εit
Với i = 1, 2, ..., n và t = 1, 2, ..., n
Trong đó sai số cổ điển được chia thành 2 phần:
vi : đại diện cho tất cả các yếu tố không quan sát được mà thay đổi giữa các đối tượng nhưng không thay đổi theo thời gian.
εit: Đại diện cho tất cả các yếu tố không quan sát được thay đổi giữa các đối tượng và thời gian
Giả sử vi được cho bởi: vi = α0 + ωi với i =1, 2, ..., n
Trong đó vi lại được chia thành 2 thành phần : thành phần bất định α0 và thành phần ngẫu nhiên ωi
- Thành phần bất định α0 được xem là tham số cắt trung bình tổng thể
- Thành phần ngẫu nhiên ωi là sự khác nhau giữa tham số cắt trung bình mẫu và tham số cắt cho đối tượng i
Mỗi đối tượng trong N đối tượng sẽ có một hệ số cắt riêng. Tuy nhiên, trong mô hình tác động ngẫu nhiên N hệ số cắt này không phải là tham số cố định bởi có thêm thành phần ngẫu nhiên ωi .
Giả sử rằng ωi cho mỗi đối tượng được rút ra từ một phân phối xác suất độc lập với giá trị trung bình bằng 0 và phương sai không đổi đó là:
E(ωi )│Var(ωi ) = δω2 │Cov (ωi , ωs ) =0
N biến ngẫu nhiên ωi được gọi là tác động ngẫu nhiên Mô hình tác động ngẫu nhiên có thể được viết lại như sau: Yit = α0 + β1 Xit1 + β2 Xit2 + φit
Trong đó: φit = ωi + εit
Một giả định quan trọng trong mô hình tác động ngẫu nhiên là thành phần sai số φit không tương quan với bất kì biến nào trong mô hình. Bởi vì thành phần sai số ωi là một thành phần của sai số φit cho mỗi đối tượng ở mỗi thời điểm, sai số φit có sự tự tương quan.