CHƢƠNG 3 : PHƢƠNG PHÁP NGHIÊN CỨU
3.1. Hồi quy với dữ liệu bảng
3.1.2. Phương pháp ước lượng dữ liệu bảng
Sau khi tiếp cận các nghiên cứu thực nghiệm trước đây để xây dựng mô hình nghiên cứu và thu thập dữ liệu, với bộ dữ liệu nghiên cứu thuộc dữ liệu bảng thì tác giả sẽ trình bày các phương pháp ước lượng cho dữ liệu bảng được sử dụng trong luận văn.
Đầu tiên, phương pháp ước lượng cho mô hình Pooled OLS, FEM và REM được sử dụng cho luận văn này. Sự khác biệt giữa 3 mô hình này được trình bày như sau:
Mô hình hồi quy gộp (Pooled OLS Model)
Khi các đối tượng là đồng nhất, không tồn tại có sự khác biệt về đặc điểm riêng giữa các đối tượng (Zi = 0), hoặc đặc điểm riêng không tác động đến biến phụ thuộc Yit thì có thể dùng ước lượng OLS để hồi quy dữ liệu bảng.
Mô hình Pooled OLS có dạng: Yit = β1 + β2X2it +…+ βkX ki + uit
Mô hình hồi quy tác động cố định (FEM-Fixed Effects Model)
Khi các đối tượng là không đồng nhất, có tồn tại sự khác biệt về đặc điểm riêng giữa các đối tượng (Zi ≠ 0), đặc điểm riêng Zi có tác động đến biến phụ thuộc
Yit và có tương quan với các biến độc lập Xit. Vì vậy, biến Zi sẽ phải đưa vào mô hình, nếu đưa Zi vào sai số uit thì mô hình sẽ bị nội sinh do biến độc lập có tương quan với sai số. Biến Zi đưa vào mô hình nằm trong thành phần của hằng số, biến Zi
được xem như là một tham số của mô hình.
Mô hình hồi quy tác động cố định có dạng là: Yit = β1 Xit1 + β2 Xit2 + Zi + uit
Vì biến Zi có tương quan với các biến độc lập Xit cho nên mô hình bị đa cộng tuyến vì vậy không thể dùng phương pháp OLS để ước lượng. Có 3 phương pháp ước lượng mô hình tác động cố định (FEM): hồi quy với biến giả (LSDV), hồi quy trong cùng nhóm (within regression) và hồi quy sai phân (difference regression).
Hồi quy với biến giả (LSDV)
Chuyển FEM sang dạng mô hình biến giả bình phương tối thiểu (LSDV- Least Squares Dummy Variable). Để đo lường chênh lệch hệ số chặn giữa những đối tượng (n đối tượng), ta dùng n-1 biến giả thêm vào mô hình. Khi đó mô hình trở thành :
Yit = β1 + β2 X2it +…+ βk Xkit + ∑ jDjit + uit
Trong đó Djit là một biến giả tương ứng với một đối tượng trong mẫu, biến giả này được định nghĩa như sau:
Djit = 0 nếu không là đối tượng j
Hồi quy trong cùng nhóm (within regression)
Chuyển dạng bên trong của mô hình FEM. Chuyển dạng bên trong bằng cách tính biến số đã trừ trung bình để loại trừ thành phần αi khỏi mô hình.
Yit = β1 + β2 X2it +…+ βk Xkit + αi + uit (1) Ῡit = β1 + β2 ̅2it +…+ βk ̅kit + αi + ̅it (2)
(1) - (2) (Yit - Ῡit) = β2 (X2it - ̅2it) +…+ βk (Xkit - ̅kit) + (uit - ̅it)
Mô hình lúc này có thể ước lượng bằng phương pháp OLS, hồi quy (Yit - Ῡit) theo (X2it - ̅2it) và (Xkit - ̅kit) để thu được ước lượng của các hệ số β2… βk.
Hồi quy sai phân (difference regression)
Chuyển FEM sang dạng sai phân, để loại bỏ thành phần αi khỏi mô hình. Yit = β1 + β2 X2it +…+ βk Xkit + αi + uit (1)
Yi,t-1 = β1 + β2 X2i,t-1 +…+ βk Xki,t-1 + αi + ui,t-1 (2) (1) - (2) ∆Yit = β2 ∆X2it+…+ βk ∆Xkit +∆uit
Mô hình lúc này có thể ước lượng bằng phương pháp OLS, hồi quy ∆Yit theo ∆X2it… ∆Xkit để thu được ước lượng của các hệ số β2… βk.
Mô hình hồi quy tác động ngẫu nhiên (REM-Random Effects Model)
Khi các đối tượng là không đồng nhất, có tồn tại sự khác biệt về đặc điểm riêng giữa các đối tượng (Zi ≠ 0), đặc điểm riêng Zi có tác động đến biến phụ thuộc
Yit và không có tương quan với các biến độc lập Xit. Vì vậy, biến Zi sẽ không cần phải đưa vào mô hình, mà biến Zi có thể để trong sai số uit (vì không bị hiện tượng nội sinh). Biến Zi nằm trong thành phần sai số của mô hình.
Trong đó: ωit = Zi + uit (ωit là sai số phức hợp, gồm sai số của biến Zi đại diện cho các yếu tố không quan sát được thể hiện sự khác nhau giữa các đối tượng nhưng không thay đổi theo thời gian và uit là sai số chung cho mọi đối tượng)
Phƣơng pháp ƣớc lƣợng GMM
Các phương pháp ước lượng tuyến tính cổ điển của mô hình dữ liệu bảng như Pooled OLS, Fixed effect (FE, LSDV, FD) và REM được sử dụng chủ yếu để ước lượng các mô hình dữ liệu bảng tĩnh tuyến tính. Đối với mô hình dạng bảng động (mô hình dạng bảng động là mô hình có xuất hiện biến trễ của biến phụ thuộc làm biến độc lập) thì ước lượng bằng phương pháp OLS sẽ không còn đáng tin cậy và cho kết quả ước lượng bị thiên lệch. Khi đó, phương pháp ước lượng GMM được xem là lựa chọn thay thế phù hợp.
GMM (Generized Method of Moments) được gọi là phương pháp moment tổng quát, được sử dụng trong các ước lượng dữ liệu bảng động tuyến tính hoặc các dữ liệu bảng vi phạm tính chất HAC-Heteroskedasticity and AutoCorrelation (đa cộng tuyến và tự tương quan). Mô hình bảng động tuyến tính là mô hình dữ liệu bảng tồn tại các vấn đề tự tương quan của các sai số, cũng như tính chất động của mô hình được thể hiện qua các biến trễ phụ thuộc (vấn đề biến nội sinh) sẽ làm thiên chệch kết quả ước lượng.
Một số đặc điểm khi sử dụng phương pháp GMM:
Dữ liệu bảng có T nhỏ, N lớn (rất nhiều quan sát với ít mốc thời gian).
Tồn tại mối quan hệ tuyến tính giữa biến phụ thuộc với các biến giải thích.
Mô hình động với 1 hoặc 2 vế của phương trình có chứa biến trễ.
Các biến độc lập không phải là một biến ngoại sinh ngặt, nghĩa là chúng có thể tương quan với các phần dư hoặc tồn tại biến nội sinh trong mô hình.
Tồn tại vấn đề phương sai thay đổi hoặc tự tương quan ở các sai số đo lường.
Tồn tại các tác động cố định riêng rẽ.
Tồn tại phương sai thay đổi và tự tương quan trong mỗi đối tượng (nhưng không tồn tại giữa các đối tượng).
Để ước lượng dữ liệu bảng động có 2 phương pháp sau: D-GMM và S-GMM.
Phƣơng pháp DGMM (Difference GMM)
Xét phương trình gốc (level equation):
Yit = β1 + β2X2it +…+ βkX ki + ɵYi,t-1 + αi + uit (1)
Xét phương trình sai phân (difference equation / first-differenced equation): ∆Yit = β1 + β2 ∆X2it +…+ βk ∆X ki +ɵ∆Yi,t-1 +∆uit (2)
Ta có: ∆Yi,t-1 = Yi,t-1 - Yi,t-2 và ∆Uit = Uit - Yi,t-1
Yi,t-2 có tương quan với biến bị nội sinh ∆Yi,t-1 nhưng không tương quan với sai số ∆Uit Yi,t-2 có thể dùng làm biến công cụ, tương tự Yi,t-3, Yi,t-4…cũng có thể dùng làm biến công cụ. Arellanol Bond (1995) đề xuất dùng GMM trên phương trình sai phân để xử lý nội sinh của ∆Yi,t-1 và xử lý tự tương quan của ∆Uit.
Việc xử lý nội sinh cho phương trình sai phân bằng GMM được gọi là phương pháp DGMM (Difference GMM). Hay nói cách khác, dùng GMM trên phương trình sai phân gọi là DGMM.
Phƣơng pháp SGMM (System GMM)
Theo Blundell and Bond (1998) nếu biến phụ thuộc y gần với bước ngẫu nhiên thì kết quả ước lượng của phương pháp D-GMM sẽ kém hiệu quả bởi vì các dữ liệu quá khứ chứa ít thông tin để dự báo sự thay đổi trong tương lai, vì thế các biến trễ không biến đổi đại diện không tốt cho các biến biến đổi trong mô hình.
Để tăng tính hiệu quả Blundell and Bond phát triển một phương pháp tiếp cận mới gọi là phương pháp ước lượng S-GMM được đề cập trong Arellano and Bover (1995) nhằm loại bỏ vấn đề thiên chệch động. S-GMM sẽ giải quyết vấn đề biến công cụ yếu đối với mô hình bảng động.
Xét phương trình gốc bị nội sinh do Yi,t-1 tương quan với sai số gộp Vit = αi + uit. Biến công cụ phù hợp cho phương trình gốc là biến ∆Yi,t-1 (∆Yi,t-1 = Yi,t-1 - Yi,t-2). Biến ∆Yi,t-1 là biến công cụ phù hợp vì: ∆Yi,t-1 có tương quan với Yi,t-1 và không
tương quan với sai số gộp Vit vì đã khử αi. Khi đó, ta có thể xử lý nội sinh cho phương trình gốc với biến công cụ ∆Yi,t-1 vừa tìm được.
Tuy nhiên, việc gộp phương trình gốc và phương trình sai phân như một hệ SUR sẽ đem lại ước lượng hiệu quả hơn so với việc chạy từng phương trình. Do đó, khi gộp phương trình gốc và phương trình sai phân ta được phương pháp SGMM (System GMM).