Kinh Tế - Quản Lý - Y khoa - Dược - Kinh tế 1 Báo cáo về phân tích số liệu mảng (panel data) TS. Phạm Ngọc Hưng Những nội dung trong báo cáo 1. Một số khái niệm về mô hình số liệu mảng 2. Mô hình gộp 3. Mô hình tác động cố định 4. Mô hình tác động ngẫu nhiên 2 Phân tích mô hình kinh tế lượng với số liệu mảng 1. Một số khái niệm Khái niệm số liệu mảng Số liệu mảng (panel data) là loại số liệu kết hợp chuỗi thời gian (time series) và số liệu chéo (cross sections) (Xem Willam H. Greene trang 283) 3 Một số ví dụ về số liệu mảng Số liệu gộp của các vùng, các tỉnh Tỷ lệ thất nghiệp, tỷ lệ nhập cư,… Tổng sản phẩm các ngành nông nghiệp, công nghiệp, dịch vụ,… Thu nhập bình quân,… Số liệu gộp của các ngành Số lao động bình quân hàng năm Thu nhập bình quân của người lao động,… Số liệu của các doanh nghiệp : sản lượng, vốn, lao động,… Số liệu về người lao động : trạng thái (chính thức – phi chính thức – thất nghiệp), thu nhập,… Xem cụ thể với STATA và Eviews5 Cấu trúc bộ số liệu 4 Một vài lưu ý với số liệu mảng Các cá thể (đơn vị chéo) dường như không có tính thuần nhất Ký hiệu chỉ số của các biến Ví dụ: zit, i = 1, …, n ; t = 1, …, T (hay Ti) Có hai loại số liệu thường gặp Số liệu cân xứng: số quan sát N = nT Số liệu không cân xứng : số quan sát N n ii=1 T Một vài lưu ý với số liệu mảng (tiếp) Các đặc tính không quan sát được của các cá thể (ký hiệu là ci) nhưng các đặc tính ấy có tác động đến biến phụ thuộc Ký hiệu là αi nếu tác động là cố định với mỗi cá thể VD: Đặc tính vùng miền, dân tộc, giới tính,… Ký hiệu là ui nếu tác động là ngẫu nhiên với mỗi cá thể VD: Tác động của chính sách nhà nước đối với các vùng, các tỉnh, các ngành, các doanh nghiệp hay người lao động,… Một mô hình mà không xem xét sự có mặt của ci được xem là có hiện tượng bỏ sót biến 5 Những ưu điểm của mô hình số liệu mảng Tăng độ chính xác của các ước lượng do số quan sát được điều tra theo cá thể (đơn vị chéo) và thời gian Nghiên cứu được sự khác biệt giữa các cá thể mà trước đây ta chỉ sử dụng biến giả Nâng cao được số quan sát của mẫu và phần nào khắc phục được hiện tượng đa cộng tuyến Chứa đựng nhiều thông tin hơn các loại số liệu khác Nghiên cứu được động thái thay đổi của các cá thể theo thời gian Tác động cố định hay tác động ngẫu nhiên Các tác động không quan sát được trong hồi quy, ký hiệu là ci Ký hiệu: T dòng, k cột Dạng tuyến tính: Tác động cố định: Các tác động không quan sát được tương quan với các biến giải thích. Covxit,ci ≠ 0 Tác động ngẫu nhiên: Các tác động không quan sát được không tương quan với các biến giải thích. Covxit,ci = 0 it it i ity + c + x i1 i2 i iT x x X x 6 Cách diễn đạt mô hình hay dùng Tác động cố định theo cá thể – mô hình biến giả Tác động ngẫu nhiên theo cá thể – mô hình sai số hỗn hợp it i it ity x it it it iy u x Vấn đề ngoại sinh Ngoại sinh cùng thời kỳ Eεitxit,ci = 0 Không đủ điều kiện để hồi quy Dẫn đến không thực hiện ước lượng được β Ngoại sinh chặt Eεitxi1, xi2,…,xiT,ci = 0 Sử dụng mh sai phân bậc nhất hay mh tác động cố định Không thỏa mãn với mô hình có biến giải thích là biến trễ của biến phụ thuộc Ngoại sinh từ thời kỳ đầu tiên đến thời kỳ t (1 < t < T) Eεitxi1, xi2,…,xit,ci = 0 (tùy thuộc vị trí của t) 7 Một số giả thiết Moment cấp 1, cấp 2,… của ma trận Xi hữu hạn (theo cá thể) n > k, T > k Hạng của ma trận X bằng hạng của hệ véc tơ cột Xit ngoại sinh chặt. Ước lượng β β là véc tơ hệ số (cần ước lượng) của các biến giải thích Có thể ước lượng được (một cách phù hợp) với sự có mặt của ci (không đo được)? Thực hiện phương pháp OLS khi nào ? Hầu như không dùng được trong thực tế Chiến lược “kiểm soát ci” với số liệu mẫu Sử dụng biến đại diện 8 Phân tích mô hình kinh tế lượng với số liệu mảng 2. Mô hình gộp Hồi quy gộp Sự xuất hiện của các tác động bị bỏ sót Khả năng chệch không vững hay không hiệu quả với phương pháp OLS – phụ thuộc vào tác động ‘cố định’ hay ‘ngẫu nhiên’ it it i it i i i i y c ε c x β y X β i ε y Xβ c ε 9 Sử dụng phương pháp OLS với mô hình có tác động cá thể 2 Cov( ) ˆ i b X X X''''y X X X y b X X -1 -1 n n i=1 i i i=1 i -1 = = (1n)Σ (1n)Σ = Sử dụng biến đo được đại diện cho ci Dùng OLS để ước lượng ta thu được Kết quả ước lượng với STATA 10 Phân tích mô hình kinh tế lượng với số liệu mảng 3. Mô hình tác động cố định Các giả thiết của mô hình Các cách diễn đạt mô hình Giả thiết ci tương quan với Xit nhưng EεitXi,ci = 0 Dùng biến giả đại diện it it i it i i i i y c ε c x β y X β i ε y Xβ c ε n it it j=1 j ijt it ijty d ε , d = (i=j) x β 1 11 Các giả thiết của mô hình (tiếp) yi = Xi + iαi + εi với mỗi cá thể 1 2 n α = α 1 2 n X i 0 0 0y X 0 i 0 0y β ε X 0 0 0 iy β X,D ε Eci Xi = g(Xi) Các tác động (không quan sát được) tương quan với tất cả các biến Thông thường: Covxit,ci ≠ 0 Ước lượng bằng phương pháp bình phương nhỏ nhất với biến giả (LSDV) Các phương trình chuẩn tìm a là D’Xb + D’Da = D’y a = (D’D)-1D’(y – Xb) Hay T i t=1 it ita (1T)Σ (y ) x b 1 ,ma tran cap n cap nT D D -1 D D b X M X X M y M I D(D D) D D D M 12 Kết quả ước lượng b và a với mô hình LSDV Một số kết luận với phương pháp LSDV Giả thiết ngoại sinh chặt: Covεit,(xjs,cj) = 0 Dùng phương pháp LSDV để ước lượng tương tự như dùng OLS trong lớp các mô hình hồi quy tuyến tính cổ điển Covb = với được tính bởi công thức: Cova = 2 LSDVˆ cov( T i iX b)X 2 1 LSDV ˆ i D iX M X n T 2 2 i=1 t=1 it i it LSDV (y a ) ˆ nT n k x b 2 LSDVˆ 13 Tìm ước lượng β qua mô hình biến đổi loại bỏ tác động trong các cá thể it it i it i i i i it i it i it i it it it y c ε y c ε (BE) y y ( ) (ε ε ) (WE) y ε x β x β x x β x β Chú ý: Hồi quy bình phương nhỏ nhất MDy theo MDX tương đương với hồi quy Ước lượng của các ci (các tác động): it i it iy y theo x x i i i WE ˆc y x b Một số kết luận với phương pháp LSDV Với các giả thiết của định lý Gauss - Markov, b là ước lượng không chệch, vững và hiệu quả của β Nếu Varεi = Ωi ≠ ε2IT thì b là ước lượng vững nhưng không hiệu quả a là ước lượng không chệch nhưng không vững của α 14 Tác động cố định theo cá thể và thời gian Mô hình với biến giả cho từng cá thể và biến giả cho từng thời kỳ yit = αi + γt + xit’β + εit Tách αi, γt thành hai phần và viết lại mô hình: yit = μ + αi + γt + xit’β + εit với i αi = 0, t γt = 0 Với μ là tác động chung theo cả i và t, αi là tác động chỉ yếu tố cá thể không có yếu tố thời gian Thực hành ước lượng ta thêm T – 1 biến giả Số liệu không cân xứng phân tích sẽ vô cùng phức tạp, ta xét Ti = T với mọi i (số liệu cân xứng) Các ước lượng Ước lượng mô hình Tìm được b là ước lượng của β, sau đó ta tìm được i t μ y α i i t t ˆ (y y) ( )ˆ (y y) ( )ˆ x b x x b x x b it it it it it i t y y y y y y ; x β x x x x x it it i t it it i t ε ε ε ε ε ε 15 Kết quả ước lượng mô hình tác động cố định theo cá thể Kết quả ước lượng mô hình FE theo cá thể có hiệu chỉnh sai số ước lượng 16 Các tác động không quan sát được ảnh hưởng đến biến phụ thuộc với mô hình FE SỬ dụng lệnh trong STATA: Predict fe, u Hoặc thực đơn Statistics>Postestimation> Predictions, residuals, etc. Chọn Fixed and random error Component (ui) Kết quả ước lượng mô hình tác động cố định theo cá thể và thời gian 17 Việc lựa chọn OLS hay LSDV để ước lượng mô hình (Greene, trang 289) Kiểm định cặp giả thuyết H0 : Dùng OLS để ước lượng H1 : Dùng LSDV để ước lượng Tiêu chuẩn kiểm định 2 2 ooled 2 1 ~ ( 1; ) 1 LSDV P LSDV R R nF F n nT n k R nT n k Kết quả kiểm định sử dụng OLS hay LSDV Hoặc có thể dựa vào báo cáo ước lượng của mô hình FE 18 Phân tích mô hình kinh tế lượng với số liệu mảng 4. Mô hình tác động ngẫu nhiên Các giả thiết của mô hình Viết lại mô hình Giả thiết ci không tương quan với Xit với mọi t Eci Xi = 0 EεitXi,ci = 0 it it i it i i i i y = c ε = c = x β y X β i ε y Xβ c ε 19 Mô hình sai số hỗn hợp Mô hình hồi quy tổng quát với các giả thiết khác it it i it i 2 2 it i i i 2 2 i i u i i i y ε u Eε 0 Eε σ Eu 0 ...
Trang 1Báo cáo về phân tích số liệu mảng
(panel data)
TS Phạm Ngọc Hưng
Những nội dung trong báo cáo
1. Một số khái niệm về mô hình số liệu mảng
2. Mô hình gộp
3. Mô hình tác động cố định
4. Mô hình tác động ngẫu nhiên
Trang 2Phân tích mô hình kinh tế lượng với số liệu
mảng
1 Một số khái niệm
Khái niệm số liệu mảng
Số liệu mảng (panel data) là loại số liệu kết
hợp chuỗi thời gian (time series) và số liệu
chéo (cross sections)
(Xem Willam H Greene trang 283)
Trang 3 Số lao động bình quân hàng năm
Thu nhập bình quân của người lao động,…
Số liệu của các doanh nghiệp : sản lượng, vốn, lao động,…
Số liệu về người lao động : trạng thái (chính thức – phi chính
thức – thất nghiệp), thu nhập,…
Xem cụ thể với STATA và Eviews5
Cấu trúc bộ số liệu
Trang 4Một vài lưu ý với số liệu mảng
Các cá thể (đơn vị chéo) dường như không có tính
thuần nhất
Ký hiệu chỉ số của các biến
Ví dụ: zit, i = 1, …, n ; t = 1, …, T (hay Ti)
Có hai loại số liệu thường gặp
Số liệu cân xứng: số quan sát N = nT
Số liệu không cân xứng : số quan sát N ni=1T i
Một vài lưu ý với số liệu mảng (tiếp)
Các đặc tính không quan sát được của các cá thể (ký hiệu là ci)
nhưng các đặc tính ấy có tác động đến biến phụ thuộc
Ký hiệu là αinếu tác động là cố địnhvới mỗi cá thể
VD: Đặc tính vùng miền, dân tộc, giới tính,…
Ký hiệu là ui nếu tác động là ngẫu nhiên với mỗi cá thể
VD: Tác động của chính sách nhà nước đối với các vùng, các
tỉnh, các ngành, các doanh nghiệp hay người lao động,…
Một mô hình mà không xem xét sự có mặt của ciđược xem
là có hiện tượng bỏ sót biến
Trang 5Những ưu điểm của mô hình số liệu mảng
Tăng độ chính xác của các ước lượng do số quan sát
được điều tra theo cá thể (đơn vị chéo) và thời gian
Nghiên cứu được sự khác biệt giữa các cá thể mà
trước đây ta chỉ sử dụng biến giả
Nâng cao được số quan sát của mẫu và phần nào
khắc phục được hiện tượng đa cộng tuyến
Chứa đựng nhiều thông tin hơn các loại số liệu khác
Nghiên cứu được động thái thay đổi của các cá thể
theo thời gian
Tác động cố định hay tác động ngẫu nhiên
Các tác động không quan sát được trong hồi quy, ký hiệu là ci
Ký hiệu:
T dòng, k cột
Dạng tuyến tính:
Tác động cố định: Các tác động không quan sát được tương quan với
các biến giải thích Cov[xit,ci] ≠ 0
Tác động ngẫu nhiên:Các tác động không quan sát được không tương
quan với các biến giải thích Cov[xit ,c i] = 0
it it i it
i1 i2 i
Trang 6Cách diễn đạt mô hình hay dùng
Tác động cố định theo cá thể – mô hình biến giả
Tác động ngẫu nhiên theo cá thể – mô hình sai số hỗn hợp
Ngoại sinh cùng thời kỳ
E[εit|xit,ci] = 0 Không đủ điều kiện để hồi quy
Dẫn đến không thực hiện ước lượng được β
Ngoại sinh chặt
E[εit|xi1, xi2,…,xiT,ci] = 0
Sử dụng mh sai phân bậc nhất hay mh tác động cố định
Không thỏa mãn với mô hình có biến giải thích là biến trễ của
biến phụ thuộc
Ngoại sinh từ thời kỳ đầu tiên đến thời kỳ t (1 < t < T)
Trang 7 Có thể ước lượng được (một cách phù hợp) với sự có
mặt của ci (không đo được)?
Thực hiện phương pháp OLS khi nào ? Hầu như không
dùng được trong thực tế
Chiến lược “kiểm soát ci” với số liệu mẫu
Sử dụng biến đại diện
Trang 8Phân tích mô hình kinh tế lượng với
số liệu mảng
2 Mô hình gộp
Hồi quy gộp
Sự xuất hiện của các tác động bị bỏ sót
Khả năng chệch / không vững hay không hiệu quả
với phương pháp OLS – phụ thuộc vào tác động ‘cố
định’ hay ‘ngẫu nhiên’
Trang 9Sử dụng phương pháp OLS với mô hình có tác
=
Sử dụng biến đo được đại diện cho ci
Dùng OLS để ước lượng ta thu được
Kết quả ước lượng với STATA
Trang 10Phân tích mô hình kinh tế lượng với
số liệu mảng
3 Mô hình tác động cố định
Các giả thiết của mô hình
Các cách diễn đạt mô hình
Giả thiết citương quan với Xit nhưng E[εit|Xi,ci] = 0
Dùng biến giả đại diện
Trang 11Các giả thiết của mô hình (tiếp)
yi = Xi + iαi + εi với mỗi cá thể
Thông thường: Cov[x it,ci ] ≠ 0
Ước lượng bằng phương pháp bình phương nhỏ nhất
với biến giả (LSDV)
Trang 12Kết quả ước lượng b và a với mô hình LSDV
Một số kết luận với phương pháp LSDV
Giả thiết ngoại sinh chặt: Cov[εit,(xjs,cj)] = 0
Dùng phương pháp LSDV để ước lượng tương tự như dùng
OLS trong lớp các mô hình hồi quy tuyến tính cổ điển
Cov[b] =
với được tính bởi công thức:
Cov[a] =
2 LSDV
Trang 13Tìm ước lượng β qua mô hình biến đổi loại bỏ
Hồi quy bình phương nhỏ nhất M D y theo M D X tương
đương với hồi quy
Ước lượng của các ci(các tác động):
y y theo x x
i i i WE
ˆc y x b
Một số kết luận với phương pháp LSDV
Với các giả thiết của định lý Gauss - Markov, b là
ước lượng không chệch, vững và hiệu quả của β
Nếu Var[εi] = Ωi≠ ε2IT thì b là ước lượng vững
nhưng không hiệu quả
a là ước lượng không chệch nhưng không vững của α
Trang 14Tác động cố định theo cá thể và thời gian
Mô hình với biến giả cho từng cá thể và biến giả cho từng thời
kỳ
yit= αi+ γt+ xit’β + εit
Tách αi, γt thành hai phần và viết lại mô hình:
yit= µ + αi* + γt* + xit’β + εit với i αi* = 0, tγt* = 0
Với µ là tác động chung theo cả i và t, αi* là tác động chỉ
yếu tố cá thể không có yếu tố thời gian
Thực hành ước lượng ta thêm T – 1 biến giả
Số liệu không cân xứng phân tích sẽ vô cùng phức tạp, ta
xét Ti= T với mọi i (số liệu cân xứng)
Các ước lượngƯớc lượng mô hình
Tìm được b là ước lượng của β, sau đó ta tìm được
Trang 15Kết quả ước lượng mô hình tác động cố định
theo cá thể
Kết quả ước lượng mô hình FE theo cá thể có
hiệu chỉnh sai số ước lượng
Trang 16Các tác động không quan sát được ảnh hưởng
đến biến phụ thuộc với mô hình FE
SỬ dụng lệnh trong STATA:
Predict fe, u
Hoặc thực đơn
Statistics>Postestimation>
Predictions, residuals, etc
Chọn Fixed and random error
Component (u_i)
Kết quả ước lượng mô hình tác động cố định
theo cá thể và thời gian
Trang 17Việc lựa chọn OLS hay LSDV để ước lượng mô
hình (Greene, trang 289)
Kiểm định cặp giả thuyết
H0: Dùng OLS để ước lượng
H1: Dùng LSDV để ước lượng
Tiêu chuẩn kiểm định
2 2
ooled 2
1
LSDV P LSDV
Kết quả kiểm định sử dụng OLS hay LSDV
Hoặc có thể dựa vào báo cáo ước lượng của mô hình
FE
Trang 18Phân tích mô hình kinh tế lượng với số
liệu mảng
4 Mô hình tác động ngẫu nhiên
Các giả thiết của mô hình
Viết lại mô hình
Giả thiết cikhông tương quan với Xitvới mọi t
Trang 20Ma trận phương sai của sai số hỗn hợp
ε i
I ii
I ii Ω
Ước lượng hiệu quả
Giả thiết trực giao có thể khó thỏa mãn (ci Xi)
Tác động cố định
Mẫu lớn – ước lượng cho β thông thường vững
Nhiều tham số với mô hình LSDV
Trang 21Ordinary Least Squares
Nếu dùng phương pháp OLS để ước lượng mô hình RE
(hay mô hình sai số hỗn hợp) thì các ước lượng nhận
được có tính chất:
Vững
Không chệch
Nhưng không hiệu quả
Ước lượng bằng phương pháp bình phương nhỏ
T ( Xem Wooldridge trang 286 )
Trang 22Ước lượng bằng phương pháp bình phương nhỏ
σ +Tσ (σ +Tσ )[ ]
Trang 23Ước lượng bằng phương pháp bình phương nhỏ
T ˆ
Ước lượng mô hình bằng phương pháp bình phương nhỏ
nhất tổng quát thực chất là OLS với mô hình hồi quy
Trang 24Phương pháp bình phương nhỏ nhất tổng quát
bằng phương pháp LSDV thu được ước lượng của β ký hiệu là bLSDV
khi đó
là ước lượng của
Ước lượng mô hình (1) bằng phương pháp OLS thu được ước lượng
2 2 i 1 t 1 LSDV
Trang 25Tìm (tiếp) Tìm ước lượng của Var(εit + ui) = Var(wit) = σ2
Trang 26Các tác động không quan sát được ảnh hưởng
đến biến phụ thuộc với mô hình RE
Kiểm định mô hình tác động ngẫu nhiên
Breusch và Pagan dùng thống kê nhân tử Lagrange để
kiểm định mô hình tác động ngẫu nhiên hay không ?
Trang 27Kiểm định Breusch - Pagan
Kiểm định Hausman với mô hình tác động ngẫu
nhiên hay cố định
Lần lượt ước lượng mô hình với các phương pháp LSDV và
GLS thu được
Hausman chọn thống kê
Với cặp giả thuyết
H0: Mô hình phù hợp là mô hình tác động ngẫu nhiên
Trang 28Tính toán thống kê Hausman thế nào ?
T
Tˆ ˆ
Trang 29Kiểm định Hausman với FE hay RE
PP ước lượng Tác động ngẫu nhiên
E[ci|Xi] = 0
Tác động cố địnhE[ci|Xi] ≠ 0GLS
ε đồng thời xây dựng và hồi quy
việc trình bày tương tự như ước lượng mô hình tác động
ngẫu nhiên theo cá thể
Trang 30Ước lượng mô hình tác động cố định hay tác động ngẫu
nhiên
Ta có
Trường hợp với mô hình tác động cố định
Trường hợp với mô hình tác động ngẫu nhiên
Khi tác động ngẫu nhiên trở thành tác động cố định
Khi tác động ngẫu nhiên trở thành OLS
Khi tác động ngẫu nhiên trở thành tác động cố định
2 u
2 2 u
Tˆ ˆ
1. Mô hình phân tích di chuyển lao động giữa các vùng,
mô hình di chuyển lao động giữa các ngành,…
2. Mô hình phân tích di chuyển trạng thái của người lao
động (mô hình với biến phụ thuộc định tính)
Trang 31Mô hình của Patrick A Puhani
Dùng để phân tích di chuyển lao động – hiệu chỉnh
cơ cấu lao động Châu Âu
Mô hình của Chiara Bentivogli và Patrizio
Dùng để phân tích sự khác biệt vùng và di chuyển
lao động của Châu Âu và Mỹ
Trang 32Mô hình của các tác giả Xiaodong Gong, Arthur van
Soest , Elizabeth Villagomez
Phân tích di chuyển trạng thái lao động khu vực
Mô hình của các tác giả René Böheim và Mark Taylor
Phân tích di chuyển nơi cư trú theo các mức khoảng
cách, nhà ở và thị trường lao động ở Anh
Mô hình Probit tác động ngẫu nhiên
Y Y
otherwise
Trang 33Mô hình của các tác giả René Böheim và Mark Taylor
Mô hình Logit tác động ngẫu nhiên
i k k
i
i k k
Những nội dung (dự kiến) trong các báo
cáo tiếp theo
1. Vấn đề PSSS thay đổi, tự tương quan,
dạng hàm
2. Số liệu không cân xứng
3. Hồi quy có thứ bậc
4. Biến phụ thuộc định tính (2 trạng thái, 3
trạng thái) với số liệu mảng
5. Ứng dụng