và dữ liệu chéo gộp chung Dữ liệu bảng là dữ liệu mà các quan sát của dữ liệu này bao gồm quan sát chéo và các quan sát chéo này lại được quan sát theo thời gian Cần phân biệt dữ liệu bả
Trang 1Dữ liệu bảng (Panel Data)
Các loại dữ liệu
Time – series Cross – sections Panel
Trang 2và dữ liệu chéo gộp chung
Dữ liệu bảng là dữ liệu mà các quan sát của
dữ liệu này bao gồm quan sát chéo và các quan sát chéo này lại được quan sát theo thời gian
Cần phân biệt dữ liệu bảng và dữ liệu chéo gộp chung
Ưu điểm của dữ liệu bảng
Nghiên cứu được sự khác biệt giữa các đơn
vị chéo mà trước đây chúng ta hay sử dụng dummy
Nâng cao được số quan sát của mẫu và phần nào khắc phục được hiện tượng đa cộng tuyến
Chứa đựng nhiều thông tin hơn các dữ liệu khác
Trang 3Ưu điểm của dữ liệu bảng (tt)
Nghiên cứu được động thái thay đổi của các đơn vị chéo theo thời gian
Tổ chức dữ liệu bảng
Unstacked: Các đơn vị chéo được sắp xếp theo thời gian một cách riêng biệt theo từng biến (ví dụ trong tài liệu đọc của Gujarati, đây là cách thông thường khi mô tả dữ liệu bảng-ví dụ bằng Eviews)
Stacked: Các đơn vị chéo được sắp xếp theo thời gian và các đơn vị chéo này được nhóm lại với nhau theo từng biến
Trang 4Ví dụ về dữ liệu bảng stacked
T N, N,2 N,1
T , 2
2 , 2 1 , 2 T , 1
2 , 1 1 , 1
Y Y Y Y Y Y Y Y Y
M
M M M
T N, N,2 N,1
, 2
2 , 2 1 , 2 , 1
2 , 1 1 , 1
X X X
M
M M M
T
T
X X X X X X
T N, N,2 N,1
, 2
2 , 2 1 , 2 , 1
2 , 1 1 , 1
Z Z Z
M
M M M
T
T
Z Z Z Z Z Z
Ví dụ về dữ liệu bảng Unstacked
254,2 2202,9
361,6 1940
186,6 2132,2
74,4 1940
312,7 1957,3
230,4 1939
172,6 2256,2
48,1 1939
260,2 1801,9
262,3 1938
156,2 2039,7
44,6 1938
118,1 2673,3
469,9 1937
118,0 2803,3
77,2 1937
50,5 1807,1
355,3 1936
104,4 2015,8
45,0 1936
53,8 1362,4
209,9 1935
97,8 1170,6
33,1 1935
US GE
C –1
F –1 I
Quan sát
C –1
F –1 I
Quan sát
Trang 5Các loại dữ liệu bảng
Dữ liệu bảng cân bằng (balanced): khi các đơn vị chéo có cùng số quan sát theo thời gian, phần lớn các dữ liệu bảng sẽ được trình bày theo kiểu này
Dữ liệu bảng không cân bằng (unbalance):
khi cac đơn vị chéo không có cùng số quan sát theo thời gian
Ý tưởng cơ bản về dữ liệu bảng
Dữ liệu bảng không thể thực hiện hồi qui bằng OLS thông thường
Các trường hợp có thể xảy ra cho các đơn vị chéo (một ví dụ đơn giản)
¾Các đơn vị chéo có điều kiện đặc thù giống nhau
¾Các đơn vị chéo có điều kiện đặc thù khác nhau
Trang 6Ý tưởng cơ bản về dữ liệu bảng (tt)
¾Các đơn vị chéo có sự khác biệt về tác động biên của các nhân tố ảnh hưởng
¾Các đơn vị chéo vừa khác biệt về điều kiện đặc thù và vừa khác biệt về tác động biên của các nhân tố ảnh hưởng
¾Các đơn vị chéo không có sự khác biệt về điều kiện đặc thù và tác động biên của các nhân tố đang xét
Dummy và dữ liệu bảng
Dummy có giải quyết các vấn đề của dữ liệu bảng?
Câu trả lời là được nhưng rất phức tạp và không hiệu quả
Trang 7Dạng tổng quát mô hình
Yit = β1it+ β2itX 2it+ β3itX 3it + u it
Các tiếp cận ước lượng mô hình tổng quát
Tiếp cận tác động cố định
Tất cả các hệ số đều không đổi theo thời gian và các đơn vị chéo
Hệ số độ dốc không đổi theo thời gian và các đơn vị chéo nhưng hệ số trục tung khác nhau giữa các đơn vị chéo
Hệ số độ dốc không đổi theo thời gian và các đơn vị chéo nhưng hệ số trục tung biến đổi giữa các đơn vị chéo và thời gian
Trang 8Tiếp cận tác động cố định (tt)
Tất cả các hệ số biến đổi theo các đơn vị chéo
Tất cả các hệ số biến đổi theo các đơn vị chéo và theo thời gian
Tất cả các hệ số không đổi
OLS- Pooled (hồi qui kết hợp tất cả các quan sát)
Yit = β1+ β2X 2it+ β3X 3it + u it
Nhược điểm
¾ Nhận dạng sai thể hiện ở DW
¾Ràng buộc quá chặt về các đơn vị chéo, điều này khó xảy ra trong thực tế
Trang 9Tất cả các hệ số không đổi (tt)
Y^ = –63,3041 +0,1101X2 + 0,3034X3
se (29,6124) (0,0137) (0,0493)
t (–2,1376) (8,0188) (6,1545) R2 = 0,7565 Durbin–Watson = 0,2187
n = 80 df = 77 Phương trình 16.3.1 trong bài đọc
Hệ số trục tung biến đổi theo chéo
Phương pháp FEM – LSDV
Yit = β1it+ β2X 2it+ β3X 3it + u it
FEM: mặc dù có sự khác biệt các đơn vị chéo về hệ số trục tung nhưng lại không khác biệt theo thời gian
Giải pháp dummy?
Trang 10Intercept biến đổi theo đơn vị chéo (tt)
β2X2it + β3X3it + uit
Intercept biến đổi theo đơn vị chéo (tt)
Hãy xem kết quả mô hình ước lượng 16.3.4
Mô hình này tốt hơn mô hình đầu tiên ở các
hệ số xác định, ý nghĩa thống kê t và DW
Sự sai lầm về nhận dạng được cải thiện Thoả mãn kiểm định Wald
Trang 11Intercept biến đổi theo thời gian
Tiếp tục sử dụng biến dummy cho thời gian Tốn kém thời gian
Không có ý nghĩa thống kê Time effect: điều này có nghĩa là các yếu tố đặc thù của ngành không thay đổi theo thời gian
Intercept biến đổi theo đơn vị chéo
và theo thời gian
Sử dụng dummy một lần nữa cho cả đơn vị chéo và thời gian
Kết quả
¾Các hệ số của dummy ít có ý nghĩa thống kê
¾Mô hình tốt là mô hình có các biến giả theo các đơn vị chéo
Trang 12chéo
Sử dụng dummy theo các đơn vị chéo cho intercept và slope
Kết quả hồi qui ở 16.3.8
¾ Các hàm đầu tư của các đơn vị chéo khác nhau
¾Không thể sử dụng dữ liệu pooled để hồi qui hàm đầu tư cho tất cả các đơn vị chéo
mà không tính đến đặc thù của chúng
Trục trặc khi sử dụng FEM (LSDV)
Giảm bậc tự do của dữ liệu đi rất nhiều Nguy cơ đa cộng tuyến vì có quá nhiều biến
Giả định cổ điển về uit ~ N (0, σ2) rất khó thực hiện
¾Cần thiết có một phương pháp khác
Trang 13Tiếp cận REM (ECM)
Ý tưởng của tiếp cận này cho rằng sự khác biệt về các điều kiện đặc thù của các đơn vị chéo được chứa đựng trong phần sai số ngẫu nhiên
¾ β1i = β1 + εi
¾Y it = β1 + β2X 2it + β3X 3it + εi + u it
= β1 + β2X 2it+ β3X 3it + w it
¾ w it = εi + u it
Giả định REM
Giả định thông thường
2
, 0
~
, 0
~
u it
i
N u
N
σ σ
Trang 14Sự khác biệt giữa FEM và ECM
FEM có riêng từng Intercept cho từng đơn vị chéo
và chúng ta quan sát được ECM chỉ có một intercept duy nhất cho tất cả các đơn vị chéo, giá trị này là gái trị trung bình của tất
cả các đơn vị chéo
Sự khác biệt của các đơn vị chéo nằm trong thành
GLS là phương pháp ước lượng ECM
Do cấu trúc sai số của tiếp cận ECM có tương quan với nhau (AR)
Nếu ước lượng bằng OLS thì các hệ số ước lượng sẽ không hiệu quả (chệch và phương sai không nhỏ nhất)
2 2
2
) ,
(
corr
u
is
it w
w
σ σ
σ
ε
ε
+
=
Trang 15Lựa chọn mô hình cho dữ liệu bảng
Ý tưởng kinh tế lượng
¾FEM khi εi và các biến độc lập được giả thiết có mối quan hệ chặt chẽ
¾ ECM khi εi và các biến độc lập được giả thiết không có mối quan hệ chặt chẽ Căn cứ vào n và t: Judge
Lựa chọn mô hình cho dữ liệu bảng
Căn cứ vào N và T: Judge
¾ECM và FEM không phân biệt khi T lớn và N nhỏ
¾ECM và FEM sẽ khá khác biệt về kết quả khi
N lớn và T nhỏ
9ECM thích hợp khi các đơn vị chéo ngẫu nhiên
9FEM sẽ thích hợp khi các đơn vị chéo không được lựa chọn ngẫu nhiên