CHƯƠNG 3 DỮ LIỆU VÀ MƠ HÌNH NGHIÊN CỨU
3. 1 Dữ liệu nghiên cứu
3.2. Mơ hình nghiên cứu
3.2.1. Mơ hình hồi quy dữ liệu bảng:
Khái niệm: Dữ liệu bảng là các quan sát về một chỉ tiêu nào đó sẽ bao gồm quan sát chéo (cross-section) và quan sát theo thời gian (time series).
Dữ liệu bảng được sử dụng rất phổ biến vì các lí do sau:
- Thứ nhất, thông qua kết hợp các chuỗi theo thời gian và các quan sát theo không gian, dữ liệu bảng cung cấp những dữ liệu có nhiều thơng tin hơn, đa dạng hơn, ít cộng tuyến hơn hơn giữa các biến số, nhiều bậc tự do hơn và hiệu quả hơn.
- Thứ hai, thông qua nghiên cứu các quan sát theo không gian lặp lại, dữ liệu
bảng phù hợp hơn để nghiên cứu tính động của thay đổi.
- Thứ ba, dữ liệu bảng có thể phát hiện và đo lường tốt hơn những ảnh hưởng
mà không thể quan sát trong chuỗi dữ liệu thời gian thuần túy hay dữ liệu chéo theo không gian thuần túy.
Tổ chức dữ liệu bảng:
Unstacked: Các đơn vị chéo được sắp xếp theo thời gian một cách riêng biệt theo từng biến.
Stacked: Các đơn vị chéo được sắp xếp theo thời gian và các đơn vị chéo này được nhóm lại với nhau theo từng biến.
Các loại dữ liệu bảng
Dữ liệu bảng cân bằng (balanced): khi các đơn vị chéo có cùng số quan sát theo thời gian.
Dữ liệu bảng không cân bằng (unbalance): khi các đơn vị chéo khơng có cùng số quan sát theo thời gian.
Dạng tổng qt của mơ hình dữ liệu bảng như sau:
(a)
Trong đó, i =1,…,n là các cá thể trong mẫu nghiên cứu, t=1,…,T là các khoảng
thời gian quan sát. là biến phụ thuộc cần nghiên cứu và là các biến độc lập có
tác động đến theo các lý thuyết kinh tế học.
Có 3 cách tiếp cận để ước lượng mơ hình hồi quy theo dữ liệu bảng: ước lượng theo OLS (hồi quy gộp), ước lượng theo mơ hình các ảnh hưởng cố định (Fixed Effects) và ước lượng theo mơ hình các ảnh hưởng ngẫu nhiên (Random Effects).