6. Kết cấu của luận văn
2.5.3. Mô hình hồi quy dữ liệu bảng
Dữ liệu bảng điều khiển còn được biết đến với các tên khác, chẳng hạn như dữ liệu gộp (kết hợp các quan sát chéo và chuỗi thời gian), là sự kết hợp của chuỗi thời gian và dữ liệu cắt ngang, dữ liệu bảng vi mô), dữ liệu dọc (nghĩa là, một nghiên cứu về điều gì đó theo thời gian về một biến số hoặc một nhóm đối tượng), phân tích lịch sử các sự kiện (ví dụ: nghiên cứu sự thay đổi theo thời gian của các đối tượng giữa các trạng thái), dữ liệu dọc nghĩa là nghiên cứu về điều gì đó theo thời gian về một biến số hoặc nhóm đối tượng theo chiều dọc. Mặc dù có sự khác biệt nhỏ, nhưng tất cả các tiêu đề này đều ám chỉ đến sự biến thiên thời gian của các đơn vị chéo.
Đối với dữ liệu bảng, có 3 phương pháp chính để ước lượng mô hình là mô hình tác động cố định (FEM), mô hình tác động ngẫu nhiên (REM) và mô hình Pooled- OLS. Cách xác định mô hình phù hợp như sau:
Bảng 2.8. Phương pháp lựa chọn mô hình hồi quy dữ liệu bảng Kiểm định
Hausman
FEM REM Pooled – OLS Mô hình
được chọn
Prob < 0,05 X FEM
Prob > 0,05 X
Dùng kiểm định nhân tử Lagrange để loại trừ Chạy xttest0
Nếu Prob < Chi2 < α,
chọn REM Nếu Prob > Chi2 > α, chọn Pooled - OLS
2.5.3.1. Mô hình tác động cố định (FEM)
Xem xét mối quan hệ kinh tế với Y là biến phụ thuộc, X1 và X2, là hai biến giải thích có thể quan sát được và một hoặc nhiều biến không nhìn thấy được. Đối với Y, X1 và X2, chúng tôi có dữ liệu bảng. Chúng ta có các quan sát NxT vì dữ liệu bảng
được tạo thành từ N đối tượng và T thời gian. Sau đây là định nghĩa của mô hình hồi quy tuyến tính thông thường không có điểm cắt:
Trong đó:
• Yit: giá trị của Y đối với đối tượng i tại thời điểm t;
• Xit1: giá trị của X1 đối với đối tượng i tại thời điểm t;
• Xit2: là giá trị của X2 đối với đối tượng i tại thời điểm t;
• μit: là sai số của đối tượng i tại thời điểm t.
Mô hình hồi quy tác động cố định là một biến thể của mô hình hồi quy tuyến tính cổ điển, được biểu diễn như sau:
Trong đó: μit = νi + εit. Sai số từ mô hình hồi quy tuyến tính truyền thống được chia thành hai phần:
• Các thành phần không thể quan sát được khác nhau giữa các đối tượng nhưng không thay đổi theo thời gian được biểu diễn bằng thành phần νi.
• Các thành phần không thể quan sát được khác nhau giữa các đối tượng và thay đổi theo thời gian được đại diện bởi thành phần εit.
Giả thiết mô hình:
H0: P value <0,0500 => chấp nhận H0, mô hình phù hợp H1: P value >0,0500 => bác bỏ H0, mô hình không phù hợp
Yit = β1Xit1 + β2Xit2 + μit với i = 1, 2, …, N và t = 1, 2, …, T (3.1)
Bảng 2.9. Mô hình tác động cố định (FEM)
(Nguồn: BCTC thường niên của 44 CTCP ngành BĐS niêm yết trên HoSE, 2017 – 2020, phần mềm Stata)
Do P value = 0,0000 (<0,0500) nên ta chấp nhận mô hình FEM.
2.5.3.2. Mô hình tác động ngẫu nhiên (REM)
Xem xét một mối quan hệ kinh tế trong đó Y là biến phụ thuộc và X1 và X2 là hai biến giải thích có thể quan sát được. Đối với Y, X1 và X2, ta có dữ liệu bảng. Ta có NxT quan sát vì dữ liệu bảng có N đối tượng và T thời gian. Mô hình tác động ngẫu nhiên được biểu diễn như sau:
Trong trường hợp này, sai số cổ điển được chia thành hai nửa. Tất cả các phần tử không thể quan sát được thay đổi giữa các đối tượng nhưng không thay đổi theo thời gian được biểu diễn bằng thành phần νi. Tất cả các yếu tố không thể quan sát được
khác nhau giữa các đối tượng và theo thời gian được đại diện bởi νi. Giả sử rằng vi gồm:
Trong trường hợp này, vi được chia thành hai phần: α0, thành phần bất định và ωi là thành phần ngẫu nhiên.
ωi được suy ra từ phân phối xác suất độc lập với giá trị trung bình bằng 0 và phương sai không đổi: E(ωi) = 0 Var(ωi) = sω2 Cov(ωi,ωs) = 0
N biến ngẫu nhiên ωi được gọi là tác động ngẫu nhiên Có thể viết lại mô hình tác động ngẫu nhiên như sau:
Trong đó: μitit = ωii + εit. Thành phần sai số không liên quan đến bất kỳ biến giải thích nào trong mô hình.
Giả thiết mô hình:
H0: P value <0,0500 => chấp nhận H0, mô hình phù hợp H1: P value >0,0500 => bác bỏ H0, mô hình không phù hợp
vi = α0 + ωi, với i = 1, 2, …, N (3.4)
Bảng 2.10. Mô hình tác động ngẫu nhiên (REM)
(Nguồn: BCTC thường niên của 44 CTCP ngành BĐS niêm yết trên HoSE, 2017 – 2020, phần mềm Stata)
Do P value = 0,0000 (<0,0500) nên ta cũng chấp nhận mô hình REM.
2.5.3.3. Lựa chọn mô hình phù hợp
Kiểm định Hausman là một kiểm định giả thuyết thống kê trong kinh tế lượng. Phương pháp ước lượng FEM và REM được lựa chọn bằng cách sử dụng cách này. Nói một cách khác, ta áp dụng bài kiểm tra Hausman để quyết định mô hình FEM hoặc REM tốt hơn. Trên thực tế, kiểm định Hausman được sử dụng để xác định có hay không có tự tương quan giữa εi và các biến độc lập. Giả thiết:
Ho: εi và biến độc lập có tương quan với biến độc lập H1: εi và biến độc lập không tương quan với biến độc lập
Ta bác bỏ Ho khi giá trị P<0,05 và sử dụng mô hình ảnh hưởng cố định khi εi và biến độc lập có tương quan với nhau. Ngược lại, sử dụng mô hình tác động ngẫu nhiên.
H0: P value <0,0500 => chấp nhận H0, chọn mô hình FEM H1: P value >0,0500 => bác bỏ H0, chọn mô hình REM
Bảng 2.11. Kiểm định Hausman
(Nguồn: BCTC thường niên của 44 CTCP ngành BĐS niêm yết trên HoSE, 2017 – 2020, phần mềm Stata)
Do P value = 0,0092 (< 0,0500) nên ta lựa chọn mô hình tác động cố định (FEM).