Sau khi tiếp cận các nghiên cứu thực nghiệm trƣớc đây để xây dựng mô hình nghiên cứu và thu thập dữ liệu, với bộ dữ liệu nghiên cứu thuộc dữ liệu bảng thì tác giả
sẽ trình bày lý thuyết phân tích định lƣợng về các phƣơng pháp ƣớc lƣợng cho dữ liệu bảng đƣợc sử dụng trong luận văn. Đầu tiên, phƣơng pháp ƣớc lƣợng cho mô hình Pooled OLS, FEM và REM đƣợc sử dụng cho luận văn này. Sự khác biệt giữa 3 mô hình này đƣợc trình bày nhƣ sau:
Mô hình hồi quy gộp (Pooled OLS Model)
Khi các đối tƣợng là đồng nhất, không tồn tại có sự khác biệt về đặc điểm riêng giữa các đối tƣợng (Zi = 0), hoặc đặc điểm riêng không tác động đến biến phụ thuộc Yit
thì có thể dùng ƣớc lƣợng OLS để hồi quy dữ liệu bảng. Mô hình Pooled OLS có dạng: Yit = β1 + β2X2it +…+ βkX ki + uit
Mô hình hồi quy tác động cố định (FEM-Fixed Effects Model)
Khi các đối tƣợng là không đồng nhất, có tồn tại sự khác biệt về đặc điểm riêng giữa các đối tƣợng (Zi ≠ 0), đặc điểm riêng Zi có tác động đến biến phụ thuộc Yitvà có tƣơng quan với các biến độc lập Xit. Vì vậy, biến Zi sẽ phải đƣa vào mô hình, nếu đƣa Zi vào sai số uit thì mô hình sẽ bị nội sinh do biến độc lập có tƣơng quan với sai số. Biến Zi đƣa vào mô hình nằm trong thành phần của hằng số, biến Zi đƣợc xem nhƣ là một tham số của mô hình. Mô hình hồi quy tác động cố định có dạng là: Yit = β1 Xit1 + β2 Xit2 + Zi + uit . Vì biến Zi có tƣơng quan với các biến độc lập Xit cho nên mô hình bị đa cộng tuyến vì vậy không thể dùng phƣơng pháp OLS để ƣớc lƣợng. Có 3 phƣơng pháp ƣớc lƣợng mô hình tác động cố định (FEM): hồi quy với biến giả (LSDV), hồi quy trong cùng nhóm (within regression) và hồi quy sai phân (difference regression).
• Hồi quy với biến giả (LSDV)
Chuyển FEM sang dạng mô hình biến giả bình phƣơng tối thiểu (LSDV- Least Squares Dummy Variable). Để đo lƣờng chênh lệch hệ số chặn giữa những đối tƣợng (n đối tƣợng), ta dùng n-1 biến giả thêm vào mô hình. Khi đó mô hình trở thành : Yit = β1 + β2 X2it +…+ βk Xkit + ∑ j= jDjit + uit. Trong đó Djit là một biến giả tƣơng ứng
với một đối tƣợng trong mẫu, biến giả này đƣợc định nghĩa nhƣ sau: Djit = 1 nếu là đối tƣợng j và Djit = 0 nếu không là đối tƣợng j
• Hồi quy trong cùng nhóm (within regression)
Chuyển dạng bên trong của mô hình FEM. Chuyển dạng bên trong bằng cách tính biến số đã trừ trung bình để loại trừ thành phần αi khỏi mô hình.
Yit = β1 + β2 X2it +…+ βk Xkit + αi + uit (1) Ῡit = β1 + β2X̅2it +…+ βkX̅kit + αi + �̅it (2)
(1) - (2) � (Yit - Ῡit) = β2 (X2it - X̅2it) +…+ βk (Xkit - X̅kit) + (uit- �̅it)
Mô hình lúc này có thể ƣớc lƣợng bằng phƣơng pháp OLS, hồi quy (Yit - Ῡit) theo (X2it
-X̅2it) và (Xkit - X̅kit) để thu đƣợc ƣớc lƣợng của các hệ số β2… βk. • Hồi quy sai phân (difference regression)
Chuyển FEM sang dạng sai phân, để loại bỏ thành phần αi khỏi mô hình. Yit = β1 + β2 X2it +…+ βk Xkit + αi + uit (1) Yi,t- 1 = β1 + β2 X2i,t-1 +…+ βk Xki,t-1 + αi + ui,t-1 (2)
(1) - (2) � ∆Yit = β2 ∆X2it+…+ βk ∆Xkit + ∆ uit
Mô hình lúc này có thể ƣớc lƣợng bằng phƣơng pháp OLS, hồi quy ∆Yit theo ∆X2it… ∆Xkit để thu đƣợc ƣớc lƣợng của các hệ số β2… βk.
Mô hình hồi quy tác động ngẫu nhiên (REM-Random Effects Model)
Khi các đối tƣợng là không đồng nhất, có tồn tại sự khác biệt về đặc điểm riêng giữa các đối tƣợng (Zi ≠ 0), đặc điểm riêng Zi có tác động đến biến phụ thuộc Yit và không có tƣơng quan với các biến độc lập Xit. Vì vậy, biến Zi sẽ không cần phải đƣa vào mô hình, mà biến Zi có thể để trong sai số uit (vì không bị hiện tƣợng nội sinh). Biến Zi nằm trong thành phần sai số của mô hình. Mô hình hồi quy tác động ngẫu nhiên có dạng là: Yit = β1 Xit1 + β2 Xit2 + ωit . Trong đó: ωit = Zi + uit (ωit là sai số phức
hợp, gồm sai số của biến Zi đại diện cho các yếu tố không quan sát đƣợc thể hiện sự khác nhau giữa các đối tƣợng nhƣng không thay đổi theo thời gian và uit là sai số chung cho mọi đối tƣợng)
Phƣơng pháp ƣớc lƣợng GMM
Các phƣơng pháp ƣớc lƣợng tuyến tính cổ điển của mô hình dữ liệu bảng nhƣ Pooled OLS, Fixed effect (FE, LSDV, FD) và REM đƣợc sử dụng chủ yếu để ƣớc lƣợng các mô hình dữ liệu bảng tĩnh tuyến tính. Đối với mô hình dạng bảng động (mô hình dạng bảng động là mô hình có xuất hiện biến trễ của biến phụ thuộc làm biến độc lập) thì ƣớc lƣợng bằng phƣơng pháp OLS sẽ không còn đáng tin cậy và cho kết quả ƣớc lƣợng bị thiên lệch. Khi đó, phƣơng pháp ƣớc lƣợng GMM đƣợc xem là lựa chọn thay thế phù hợp.
GMM (Generized Method of Moments) đƣợc gọi là phƣơng pháp moment tổng quát, đƣợc sử dụng trong các ƣớc lƣợng dữ liệu bảng động tuyến tính hoặc các dữ liệu bảng vi phạm tính chất HAC-Heteroskedasticity and AutoCorrelation (đa cộng tuyến và tự tƣơng quan). Mô hình bảng động tuyến tính là mô hình dữ liệu bảng tồn tại các vấn đề tự tƣơng quan của các sai số, cũng nhƣ tính chất động của mô hình đƣợc thể hiện qua các biến trễ phụ thuộc (vấn đề biến nội sinh) sẽ làm thiên chệch kết quả ƣớc lƣợng. Một số đặc điểm khi sử dụng phƣơng pháp GMM: dữ liệu bảng có T nhỏ, N lớn (rất nhiều quan sát với ít mốc thời gian). Tồn tại mối quan hệ tuyến tính giữa biến phụ thuộc với các biến giải thích. Mô hình động với 1 hoặc 2 vế của phƣơng trình có chứa biến trễ. Các biến độc lập không phải là một biến ngoại sinh ngặt, nghĩa là chúng có thể tƣơng quan với các phần dƣ hoặc tồn tại biến nội sinh trong mô hình. Tồn tại vấn đề phƣơng sai thay đổi hoặc tự tƣơng quan ở các sai số đo lƣờng. Tồn tại các tác động cố định riêng rẽ. Tồn tại phƣơng sai thay đổi và tự tƣơng quan trong mỗi đối tƣợng (nhƣng không tồn tại giữa các đối tƣợng). Để ƣớc lƣợng dữ liệu bảng động có 2 phƣơng pháp sau: D-GMM và S-GMM.
Xét phƣơng trình gốc (level equation):Yit = β1 + β2X2it +…+ βkX ki + ɵYi,t-1 + αi + uit(1) Xét phƣơng trình sai phân (difference equation / first-differenced equation): ∆Yit = β1
+ β2∆X2it +…+ βk∆X ki + ɵ∆Yi,t-1 + ∆uit(2) Ta có: ∆Yi,t-1 = Yi,t-1 - Yi,t-2 và ∆Uit = Uit - Yi,t-1
Yi,t-2 có tƣơng quan với biến bị nội sinh ∆Yi,t-1 nhƣng không tƣơng quan với sai số ∆Uit
� Yi,t-2 có thể dùng làm biến công cụ, tƣơng tự Yi,t-3, Yi,t-4…cũng có thể dùng làm biến công cụ. Arellanol Bond (1995) đề xuất dùng GMM trên phƣơng trình sai phân để xử lý nội sinh của ∆Yi,t-1 và xử lý tự tƣơng quan của ∆Uit. Việc xử lý nội sinh cho phƣơng trình sai phân bằng GMM đƣợc gọi là phƣơng pháp DGMM (Difference GMM). Hay nói cách khác, dùng GMM trên phƣơng trình sai phân gọi là DGMM.
Phƣơng pháp SGMM (System GMM)
Theo Blundell and Bond (1998) nếu biến phụ thuộc y gần với bƣớc ngẫu nhiên thì kết quả ƣớc lƣợng của phƣơng pháp D-GMM sẽ kém hiệu quả bởi vì các dữ liệu quá khứ chứa ít thông tin để dự báo sự thay đổi trong tƣơng lai, vì thế các biến trễ không biến đổi đại diện không tốt cho các biến biến đổi trong mô hình. Để tăng tính hiệu quả Blundell and Bond phát triển một phƣơng pháp tiếp cận mới gọi là phƣơng pháp ƣớc lƣợng S-GMM đƣợc đề cập trong Arellano and Bover (1995) nhằm loại bỏ vấn đề thiên chệch động. S-GMM sẽ giải quyết vấn đề biến công cụ yếu đối với mô hình bảng động. Xét phƣơng trình gốc bị nội sinh do Yi,t-1 tƣơng quan với sai số gộp Vit = αi + uit. Biến công cụ phù hợp cho phƣơng trình gốc là biến ∆Yi,t-1 (∆Yi,t-1= Yi,t-1 - Yi,t-2). Biến ∆Yi,t-1 là biến công cụ phù hợp vì: ∆Yi,t-1 có tƣơng quan với Yi,t-1 và không tƣơng quan với sai số gộp Vit vì đã khử αi. Khi đó, ta có thể xử lý nội sinh cho phƣơng trình gốc với biến công cụ ∆Yi,t-1 vừa tìm đƣợc. Tuy nhiên, việc gộp phƣơng trình gốc và phƣơng trình sai phân nhƣ một hệ SUR sẽ đem lại ƣớc lƣợng hiệu quả hơn so với việc chạy từng phƣơng trình. Do đó, khi gộp phƣơng trình gốc và phƣơng trình sai phân ta đƣợc phƣơng pháp SGMM (System GMM).