Kinh Tế - Quản Lý - Y khoa - Dược - Kinh tế 1 Báo cáo về phân tích số liệu mảng (panel data) TS. Phạm Ngọc Hưng Những nội dung trong báo cáo 1. Một số khái niệm về mô hình số liệu mảng 2. Mô hình gộp 3. Mô hình tác động cố định 4. Mô hình tác động ngẫu nhiên 2 Phân tích mô hình kinh tế lượng với số liệu mảng 1. Một số khái niệm Khái niệm số liệu mảng Số liệu mảng (panel data) là loại số liệu kết hợp chuỗi thời gian (time series) và số liệu chéo (cross sections) (Xem Willam H. Greene trang 283) 3 Một số ví dụ về số liệu mảng Số liệu gộp của các vùng, các tỉnh Tỷ lệ thất nghiệp, tỷ lệ nhập cư,… Tổng sản phẩm các ngành nông nghiệp, công nghiệp, dịch vụ,… Thu nhập bình quân,… Số liệu gộp của các ngành Số lao động bình quân hàng năm Thu nhập bình quân của người lao động,… Số liệu của các doanh nghiệp : sản lượng, vốn, lao động,… Số liệu về người lao động : trạng thái (chính thức – phi chính thức – thất nghiệp), thu nhập,… Xem cụ thể với STATA và Eviews5 Cấu trúc bộ số liệu 4 Một vài lưu ý với số liệu mảng Các cá thể (đơn vị chéo) dường như không có tính thuần nhất Ký hiệu chỉ số của các biến Ví dụ: zit, i = 1, …, n ; t = 1, …, T (hay Ti) Có hai loại số liệu thường gặp Số liệu cân xứng: số quan sát N = nT Số liệu không cân xứng : số quan sát N n ii=1 T Một vài lưu ý với số liệu mảng (tiếp) Các đặc tính không quan sát được của các cá thể (ký hiệu là ci) nhưng các đặc tính ấy có tác động đến biến phụ thuộc Ký hiệu là αi nếu tác động là cố định với mỗi cá thể VD: Đặc tính vùng miền, dân tộc, giới tính,… Ký hiệu là ui nếu tác động là ngẫu nhiên với mỗi cá thể VD: Tác động của chính sách nhà nước đối với các vùng, các tỉnh, các ngành, các doanh nghiệp hay người lao động,… Một mô hình mà không xem xét sự có mặt của ci được xem là có hiện tượng bỏ sót biến 5 Những ưu điểm của mô hình số liệu mảng Tăng độ chính xác của các ước lượng do số quan sát được điều tra theo cá thể (đơn vị chéo) và thời gian Nghiên cứu được sự khác biệt giữa các cá thể mà trước đây ta chỉ sử dụng biến giả Nâng cao được số quan sát của mẫu và phần nào khắc phục được hiện tượng đa cộng tuyến Chứa đựng nhiều thông tin hơn các loại số liệu khác Nghiên cứu được động thái thay đổi của các cá thể theo thời gian Tác động cố định hay tác động ngẫu nhiên Các tác động không quan sát được trong hồi quy, ký hiệu là ci Ký hiệu: T dòng, k cột Dạng tuyến tính: Tác động cố định: Các tác động không quan sát được tương quan với các biến giải thích. Covxit,ci ≠ 0 Tác động ngẫu nhiên: Các tác động không quan sát được không tương quan với các biến giải thích. Covxit,ci = 0 it it i ity + c + x i1 i2 i iT x x X x 6 Cách diễn đạt mô hình hay dùng Tác động cố định theo cá thể – mô hình biến giả Tác động ngẫu nhiên theo cá thể – mô hình sai số hỗn hợp it i it ity x it it it iy u x Vấn đề ngoại sinh Ngoại sinh cùng thời kỳ Eεitxit,ci = 0 Không đủ điều kiện để hồi quy Dẫn đến không thực hiện ước lượng được β Ngoại sinh chặt Eεitxi1, xi2,…,xiT,ci = 0 Sử dụng mh sai phân bậc nhất hay mh tác động cố định Không thỏa mãn với mô hình có biến giải thích là biến trễ của biến phụ thuộc Ngoại sinh từ thời kỳ đầu tiên đến thời kỳ t (1 < t < T) Eεitxi1, xi2,…,xit,ci = 0 (tùy thuộc vị trí của t) 7 Một số giả thiết Moment cấp 1, cấp 2,… của ma trận Xi hữu hạn (theo cá thể) n > k, T > k Hạng của ma trận X bằng hạng của hệ véc tơ cột Xit ngoại sinh chặt. Ước lượng β β là véc tơ hệ số (cần ước lượng) của các biến giải thích Có thể ước lượng được (một cách phù hợp) với sự có mặt của ci (không đo được)? Thực hiện phương pháp OLS khi nào ? Hầu như không dùng được trong thực tế Chiến lược “kiểm soát ci” với số liệu mẫu Sử dụng biến đại diện 8 Phân tích mô hình kinh tế lượng với số liệu mảng 2. Mô hình gộp Hồi quy gộp Sự xuất hiện của các tác động bị bỏ sót Khả năng chệch không vững hay không hiệu quả với phương pháp OLS – phụ thuộc vào tác động ‘cố định’ hay ‘ngẫu nhiên’ it it i it i i i i y c ε c x β y X β i ε y Xβ c ε 9 Sử dụng phương pháp OLS với mô hình có tác động cá thể 2 Cov( ) ˆ i b X X X''''y X X X y b X X -1 -1 n n i=1 i i i=1 i -1 = = (1n)Σ (1n)Σ = Sử dụng biến đo được đại diện cho ci Dùng OLS để ước lượng ta thu được Kết quả ước lượng với STATA 10 Phân tích mô hình kinh tế lượng với số liệu mảng 3. Mô hình tác động cố định Các giả thiết của mô hình Các cách diễn đạt mô hình Giả thiết ci tương quan với Xit nhưng EεitXi,ci = 0 Dùng biến giả đại diện it it i it i i i i y c ε c x β y X β i ε y Xβ c ε n it it j=1 j ijt it ijty d ε , d = (i=j) x β 1 11 Các giả thiết của mô hình (tiếp) yi = Xi + iαi + εi với mỗi cá thể 1 2 n α = α 1 2 n X i 0 0 0y X 0 i 0 0y β ε X 0 0 0 iy β X,D ε Eci Xi = g(Xi) Các tác động (không quan sát được) tương quan với tất cả các biến Thông thường: Covxit,ci ≠ 0 Ước lượng bằng phương pháp bình phương nhỏ nhất với biến giả (LSDV) Các phương trình chuẩn tìm a là D’Xb + D’Da = D’y a = (D’D)-1D’(y – Xb) Hay T i t=1 it ita (1T)Σ (y ) x b 1 ,ma tran cap n cap nT D D -1 D D b X M X X M y M I D(D D) D D D M 12 Kết quả ước lượng b và a với mô hình LSDV Một số kết luận với phương pháp LSDV Giả thiết ngoại sinh chặt: Covεit,(xjs,cj) = 0 Dùng phương pháp LSDV để ước lượng tương tự như dùng OLS trong lớp các mô hình hồi quy tuyến tính cổ điển Covb = với được tính bởi công thức: Cova = 2 LSDVˆ cov( T i iX b)X 2 1 LSDV ˆ i D iX M X n T 2 2 i=1 t=1 it i it LSDV (y a ) ˆ nT n k x b 2 LSDVˆ 13 Tìm ước lượng β qua mô hình biến đổi loại bỏ tác động trong các cá thể it it i it i i i i it i it i it i it it it y c ε y c ε (BE) y y ( ) (ε ε ) (WE) y ε x β x β x x β x β Chú ý: Hồi quy bình phương nhỏ nhất MDy theo MDX tương đương với hồi quy Ước lượng của các ci (các tác động): it i it iy y theo x x i i i WE ˆc y x b Một số kết luận với phương pháp LSDV Với các giả thiết của định lý Gauss - Markov, b là ước lượng không chệch, vững và hiệu quả của β Nếu Varεi = Ωi ≠ ε2IT thì b là ước lượng vững nhưng không hiệu quả a là ước lượng không chệch nhưng không vững của α 14 Tác động cố định theo cá thể và thời gian Mô hình với biến giả cho từng cá thể và biến giả cho từng thời kỳ yit = αi + γt + xit’β + εit Tách αi, γt thành hai phần và viết lại mô hình: yit = μ + αi + γt + xit’β + εit với i αi = 0, t γt = 0 Với μ là tác động chung theo cả i và t, αi là tác động chỉ yếu tố cá thể không có yếu tố thời gian Thực hành ước lượng ta thêm T – 1 biến giả Số liệu không cân xứng phân tích sẽ vô cùng phức tạp, ta xét Ti = T với mọi i (số liệu cân xứng) Các ước lượng Ước lượng mô hình Tìm được b là ước lượng của β, sau đó ta tìm được i t μ y α i i t t ˆ (y y) ( )ˆ (y y) ( )ˆ x b x x b x x b it it it it it i t y y y y y y ; x β x x x x x it it i t it it i t ε ε ε ε ε ε 15 Kết quả ước lượng mô hình tác động cố định theo cá thể Kết quả ước lượng mô hình FE theo cá thể có hiệu chỉnh sai số ước lượng 16 Các tác động không quan sát được ảnh hưởng đến biến phụ thuộc với mô hình FE SỬ dụng lệnh trong STATA: Predict fe, u Hoặc thực đơn Statistics>Postestimation> Predictions, residuals, etc. Chọn Fixed and random error Component (ui) Kết quả ước lượng mô hình tác động cố định theo cá thể và thời gian 17 Việc lựa chọn OLS hay LSDV để ước lượng mô hình (Greene, trang 289) Kiểm định cặp giả thuyết H0 : Dùng OLS để ước lượng H1 : Dùng LSDV để ước lượng Tiêu chuẩn kiểm định 2 2 ooled 2 1 ~ ( 1; ) 1 LSDV P LSDV R R nF F n nT n k R nT n k Kết quả kiểm định sử dụng OLS hay LSDV Hoặc có thể dựa vào báo cáo ước lượng của mô hình FE 18 Phân tích mô hình kinh tế lượng với số liệu mảng 4. Mô hình tác động ngẫu nhiên Các giả thiết của mô hình Viết lại mô hình Giả thiết ci không tương quan với Xit với mọi t Eci Xi = 0 EεitXi,ci = 0 it it i it i i i i y = c ε = c = x β y X β i ε y Xβ c ε 19 Mô hình sai số hỗn hợp Mô hình hồi quy tổng quát với các giả thiết khác it it i it i 2 2 it i i i 2 2 i i u i i i y ε u Eε 0 Eε σ Eu 0 ...
Báo cáo phân tích số liệu mảng (panel data) TS Phạm Ngọc Hưng Những nội dung báo cáo Một số khái niệm mơ hình số liệu mảng Mơ hình gộp Mơ hình tác động cố định Mơ hình tác động ngẫu nhiên Phân tích mơ hình kinh tế lượng với số liệu mảng Một số khái niệm Khái niệm số liệu mảng Số liệu mảng (panel data) loại số liệu kết hợp chuỗi thời gian (time series) số liệu chéo (cross sections) (Xem Willam H Greene trang 283) Một số ví dụ số liệu mảng Số liệu gộp vùng, tỉnh Tỷ lệ thất nghiệp, tỷ lệ nhập cư,… Tổng sản phẩm ngành nông nghiệp, công nghiệp, dịch vụ,… Thu nhập bình quân,… Số liệu gộp ngành Số lao động bình quân hàng năm Thu nhập bình quân người lao động,… Số liệu doanh nghiệp : sản lượng, vốn, lao động,… Số liệu người lao động : trạng thái (chính thức – phi thức – thất nghiệp), thu nhập,… Xem cụ thể với STATA Eviews5 Cấu trúc số liệu Một vài lưu ý với số liệu mảng Các cá thể (đơn vị chéo) dường khơng có tính Ký hiệu số biến Ví dụ: zit, i = 1, …, n ; t = 1, …, T (hay Ti) Có hai loại số liệu thường gặp Số liệu cân xứng: số quan sát N = nT n Số liệu không cân xứng : số quan sát N i=1Ti Một vài lưu ý với số liệu mảng (tiếp) Các đặc tính không quan sát cá thể (ký hiệu ci) đặc tính có tác động đến biến phụ thuộc Ký hiệu αi tác động cố định với cá thể VD: Đặc tính vùng miền, dân tộc, giới tính,… Ký hiệu ui tác động ngẫu nhiên với cá thể VD: Tác động sách nhà nước vùng, tỉnh, ngành, doanh nghiệp hay người lao động,… Một mơ hình mà khơng xem xét có mặt ci xem có tượng bỏ sót biến Những ưu điểm mơ hình số liệu mảng Tăng độ xác ước lượng số quan sát điều tra theo cá thể (đơn vị chéo) thời gian Nghiên cứu khác biệt cá thể mà trước ta sử dụng biến giả Nâng cao số quan sát mẫu phần khắc phục tượng đa cộng tuyến Chứa đựng nhiều thông tin loại số liệu khác Nghiên cứu động thái thay đổi cá thể theo thời gian Tác động cố định hay tác động ngẫu nhiên Các tác động không quan sát hồi quy, ký hiệu ci Ký hiệu: yit xit + ci + it xi1 T dòng, k cột x Xi i2 xiT Dạng tuyến tính: Tác động cố định: Các tác động khơng quan sát tương quan với biến giải thích Cov[xit,ci] ≠ Tác động ngẫu nhiên: Các tác động không quan sát không tương quan với biến giải thích Cov[xit,ci] = Cách diễn đạt mơ hình hay dùng Tác động cố định theo cá thể – mơ hình biến giả yit i xit it Tác động ngẫu nhiên theo cá thể – mơ hình sai số hỗn hợp yit xit it ui Vấn đề ngoại sinh Ngoại sinh thời kỳ E[εit|xit,ci] = Không đủ điều kiện để hồi quy Dẫn đến không thực ước lượng β Ngoại sinh chặt E[εit|xi1, xi2,…,xiT,ci] = Sử dụng mh sai phân bậc hay mh tác động cố định Khơng thỏa mãn với mơ hình có biến giải thích biến trễ biến phụ thuộc Ngoại sinh từ thời kỳ đến thời kỳ t (1 < t < T) E[εit|xi1, xi2,…,xit,ci] = (tùy thuộc vị trí t) Một số giả thiết Moment cấp 1, cấp 2,… ma trận Xi hữu hạn (theo cá thể) n > k, T > k Hạng ma trận X hạng hệ véc tơ cột Xit ngoại sinh chặt Ước lượng β β véc tơ hệ số (cần ước lượng) biến giải thích Có thể ước lượng (một cách phù hợp) với có mặt ci (không đo được)? Thực phương pháp OLS ? Hầu không dùng thực tế Chiến lược “kiểm soát ci” với số liệu mẫu Sử dụng biến đại diện Phân tích mơ hình kinh tế lượng với số liệu mảng Mơ hình gộp Hồi quy gộp Sự xuất tác động bị bỏ sót yit xitβ ci εit yi Xiβ cii εi y Xβ c ε Khả chệch / không vững hay không hiệu với phương pháp OLS – phụ thuộc vào tác động ‘cố định’ hay ‘ngẫu nhiên’ Sử dụng phương pháp OLS với mơ hình có tác động cá thể Sử dụng biến đo đại diện cho ci Dùng OLS để ước lượng ta thu b = X X -1 X'y = (1/n)Σi=1 n XiXi -1 (1/n)Σi=1 n Xiyi Cov(b) = ˆ2 X X -1 Kết ước lượng với STATA Phân tích mơ hình kinh tế lượng với số liệu mảng Mơ hình tác động cố định Các giả thiết mơ hình Các cách diễn đạt mơ hình yit xitβ ci εit yi Xiβ cii εi y Xβ c ε Giả thiết ci tương quan với Xit E[εit|Xi,ci] = Dùng biến giả đại diện yit xitβ j=1 n jdijt εit , dijt = 1(i=j) 10 Mơ hình sai số hỗn hợp Mơ hình hồi quy tổng qt với giả thiết khác yit xitβ εit ui E[εit | Xi ] 2 2u u2 2u Var[εi uii ] u2 2 u2 u2 E[εit2 | Xi ] σ2 E[ui | Xi ] 2 2 u u2 u 2E[ui | Xi ] σu yi Xiβ εi uii Dạng ma trận y1 X1 ε1 u1i1 y2 X2 β ε2 u2i2 yn Xn εn unin = Xβ+ε+u = Xβ+ w 19 Ma trận phương sai sai số hỗn hợp 2 2u u2 2u Var[εi+uii ] u2 2 u2 u2 2 u2 2 u u = 2IT u2ii = 2IT u2ii = Ωi Ω1 Var[w | X] Ω2 0 Ωn So sánh mơ hình tác động cố định tác động ngẫu nhiên Tác động ngẫu nhiên Ít tham số Ước lượng hiệu Giả thiết trực giao khó thỏa mãn (ci Xi) Tác động cố định Mẫu lớn – ước lượng cho β thông thường vững Nhiều tham số với mơ hình LSDV 20