CHƯƠNG 2 PHƯƠNG PHÁP NGHIÊN CỨU
2.2 XÂY DỰNG GIẢ THIẾT
2.3.2 Mơ hình tác động cố định – FEM
Với giả định mỗi thực thể (doanh nghiệp) đều có những đặc điểm riêng biệt có thể ảnh hưởng đến các biến giải thích, mơ hình FEM phân tích mối tương quan này giữa phần dư của mỗi thực thể với các biến giải thích, qua đó kiểm sốt và tách ảnh hưởng của các đặc điểm riêng biệt không đổi theo thời gian ra khỏi các biến giải thích để có thể ước lượng được những ảnh hưởng thực của biến giải thích lên biến phụ thuộc.
Mơ hình ước lượng được sử dụng:
Yi,t= Ci + βiXi,t+ uit
Trong đó: Yi,t : Biến phụ thuộc
Xi,t : Biến độc lập
i : Thực thể (doanh nghiệp )
t : Thời gian (năm)
Ci : Hệ số chặn cho từng thực thể nghiên cứu (i=1,2,…,n)
βi : Hệ số góc đối với nhân tố Xi
uit : Phần dư
Mơ hình trên đã thêm vào chỉ số (i) cho hệ số chặn C để phân biệt hệ số chặn của từng doanh nghiệp khác nhau có thể khác nhau, sự khác biệt này có thể do đặc điểm khác nhau của từng doanh nghiệp hoặc do sự khác nhau trong chính sách quản lý, hoạt động của doanh nghiệp.
2.3.3 Mơ hình tác động ngẫu nhiên – REM
Điểm khác biệt giữa mơ hình tác động ngẫu nhiên và mơ hình tác động cố định có thể hiện ở sự biến động giữa các thực thể.
Nếu sự biến động giữa các thực thể có tương quan đến biến độc lập – biến giải thích trong mơ hình tác động cố định thì trong mơ hình tác động ngẫu nhiên sự biến động giữa các thực thể được giả sử là ngẫu nhiên và khơng tương quan đến các biến giải thích.Chính vì vậy, nếu sự khác biệt giữa các thực thể có ảnh hưởng đến biến phụ thuộc thì mơ hình REM sẽ thích hợp hơn so với mơ hình FEM. Trong đó, phần dư của mỗi thực thể (khơng tương quan với biến giải thích) được xem là một biến giải thích mới.
Ý tưởng cơ bản của mơ hình tác động ngẫu nhiên cũng bắt đầu từ mơ hình:
Yi,t= Ci + βiXi,t+ uit
Thay vì trong mơ hình trên, Ci là cố định thì trong mơ hình REM có giả định rằng nó là một biến ngẫu nhiên với trung bình là Cvà giá trị hệ số chặn được mô tả:
Ci = C + εi (i=1,2,…,n)
εi: sai số ngẫu nhiên có trung bình bằng 0 và phương sai là σ2 €
Thay vào mơ hình ta có:
Yi,t= C+ βiXi,t+ εi + uit hay
Yi,t = C + βiXi,t+ wit với wit = εi + uit
- εi: Sai số thành phần của các đối tượng khác nhau (đặc điểm riêng khác nhau của từng doanh nghiệp)
- uit: Sai số thành phần kết hợp khác của cả đặc điểm riêng theo từng đối tượng và theo thời gian.
Nhìn chung, mơ hình FEM hay mơ hình REM tốt hơn cho nghiên cứu phụ thuộc vào giả định có hay khơng sự tương quan giữa εi và các biến giải thích X.
Nếu giả định rằng khơng tương quan thì mơ hình REM phù hợp hơn và ngược lại. Kiểm định Hausman là một trong những phương pháp để lựa chọn giữa mơ hình FEM và mơ hình REM.
2.3.4 Kỹ thuật ước lượng D-GMM (GMM Arellano Bond) 2.3.4.1 Mơ hình hồi quy sử dụng biến cơng cụ 2.3.4.1 Mơ hình hồi quy sử dụng biến cơng cụ
Đối với các phương trình hồi quy đã đề cập ở trên, khi đưa vào các biến trễ thì ước lượng bằng FE sẽ bị chệch khi mơ hình có T nhỏ và N lớn (Judson et al., 1996). Nickell (1981) và Kiviet (1995) giải thích rằng các hệ số hồi quy sẽ khơng chệch khi T tiến đến vô cùng, nghĩa là ước lượng FE chỉ cho kết quả tốt khi chuỗi thời gian của dữ liệu bảng lớn. Nói cách khác, có một số vấn đề nảy sinh khi tiến hành ước lượng các phương trình nói trên:
(1) Các biến có thể được xem là nội sinh bởi vì quan hệ nhân quả có thể xảy ra theo hai chiều: từ biến giải thích đến các biến được giải thích và ngược lại. Việc hồi quy các biến này có thể dẫn đến sự tương quan với phần dư, tức xảy ra hiện tượng nội sinh làm chệch kết quả.
(2) Tác động cố định hàm chứa sai số trong phương trình bao gồm tính đặc thù của các biến không quan sát được (vi) và sai số đặc thù quan sát được (eit):
uit = vi + eit
(3) Dữ liệu bảng trong các nghiên cứu có thời gian ngắn và số quan sát lớn. Nói cách khác, các phương pháp ước lượng dữ liệu bảng như Fixed Effect hoặc Random Effects nêu trên được sử dụng chủ yếu để ước lượng các mơ hình dữ liệu bảng tuyến tính tĩnh. Với mơ hình này, sự tồn tại của các vấn đề như tự tương quan của các sai số, cũng như tính chất động của mơ hình được thể hiện qua các biến trễ phụ thuộc (vấn đề biến nội sinh) sẽ làm thiên chệch kết quả ước lượng. Mơ hình dữ liệu bảng tồn tại các vấn đề này được gọi là mơ hình dữ liệu bảng tuyến tính động và có thể ước lượng bằng phương pháp sử dụng các biến công cụ (Instrumental Variables – hồi quy IV). Ý tưởng của phương pháp hồi quy này là tìm một bộ biến, được gọi là biến công cụ thỏa mãn hai điều kiện:
(1) Tương quan với các biến giải thích trong phương trình; (2) Khơng tương quan với phần dư.
Những biến công cụ như vậy được dùng để loại bỏ sự tương quan giữa các biến giải thích và phần dư. Cụ thể như sau:
Xem xét mơ hình đơn giản:
Yi = 𝜷Xi + ei
Trong đó: i : là quan sát thứ i,
Yi : là biến phụ thuộc,
Xi : là biến độc lập,
ei : là phần dư của mơ hình.
Khi đó, hệ số ước lượng 𝛽 sẽ được xác định như sau: 𝜷OLS = 𝒙′𝒚
𝒙′𝒙 =𝒙′(𝒙𝜷+𝒆)
𝒙′𝒙
Trong đó x, y, e là các ma trận cột (n x 1). Nếu x và e không tương quan với
nhau thì 𝛽 ước lượng được là vững và không chệch. Tuy nhiên nếu điều ngược lại xảy ra, hệ số ước lượng sẽ bị chệch, mơ hình khơng cịn hiệu quả, tác động của biến
x lên biến y bị bóp méo.
Một biến cơng cụ z, tương quan với biến giải thích x nhưng khơng tương quan với phần dư e sẽ được đưa vào mơ hình, phương pháp hồi quy IV sử dụng biến giả để xác định hệ số ước lượng như sau:
𝜷IV = 𝒛′𝒚𝒛′𝒙 =𝒛
′(𝒙𝜷+𝒆) 𝒛′𝒙
Vì biến z khơng tương quan với e nên hệ số ước lượng là vững và khơng
chệch. Phương pháp này có thể tổng qt lên với một mơ hình nhiều biến. Ta gọi X là ma trận n x K các biến giải thích, Z là ma trận n x L các biến công cụ với K là số lượng biến giải thích, L là số lượng biến công cụ và n là số quan sát của mỗi biến. Khi đó, phương pháp IV có thể được dùng để ước lượng mô hình và hệ số ước lượng sẽ được xác định như sau: 𝜷IV = (Z’X)-1Z’Y. Điều kiện để xác định được giá
trị ước lượng là L ≥ K
2.3.4.2 Thử tục ước lượng GMM và kiểm định cơ bản
Có nhiều phương pháp hồi quy dựa trên nền tảng của hồi quy IV như Phương pháp Bình phương tối thiểu hai giai đoạn (TSLS), Phương pháp Maximum Likelihood trong điều kiện giới hạn thông tin (LIML), Phương pháp ước lượng moment tổng quát (GMM).
Phương pháp GMM này có 2 dạng ước lượng thay thế lẫn nhau là D-GMM và S-GMM. Nghiên cứu này tập trung sử dụng ước lượng GMM sai phân nhằm khắc phục những khuyết tật của mơ hình FE vi phạm các kiểm định nói trên.
GMM được Lars Peter Hansen trình bày lần đầu tiên vào năm 1982 trong bài viết “Large Sample Properties of Generalized Methods of Moments Estimators” được đăng trong Econometrica, Vol. 50, page 1029-1054. Sau đó, D-GMM được hồn chỉnh bởi Arellano Bond (1991) dựa trên cơ sở đề xuất bởi Holtz Eakin et al. (1988). Một cách tổng quan, GMM là phương pháp tổng quát của rất nhiều phương pháp ước lượng phổ biến như OLS, GLS, MLE,….Ngay cả trong điều kiện giả thiết nội sinh bị vi phạm, phương pháp GMM cho ra các hệ số ước lượng vững, không chệch, phân phối chuẩn và hiệu quả.
Như đã đề cập ở trên, để ước lượng được hệ số 𝜷, chúng ta cần một bộ L
vector các biến công cụ (trong ước lượng GMM còn được gọi là các điều kiện moment) và số lượng biến công cụ phải khơng ít hơn số biến trong mơ hình (L ≥
K). Điều kiện để một biến được chọn là biến cơng cụ là nó khơng được tương quan
với phần dư, điều này có nghĩa là: E(Ztut(𝜷)) = 0
Ý tưởng chủ đạo của phương pháp GMM là thay thế giá trị các biến công cụ bằng giá trị trung bình của mẫu
E(Ztut(𝜷)) = 𝟏𝑻 ∑ 𝒁𝒕 tut(𝜷) = 𝟏𝑻 Z’u(𝜷) = 0
Và đi tìm Vector 𝛽 thoả mãn phương trình trên.
Khi số lượng điều kiện moment lớn hơn số biến trong mơ hình (L>K) thì phương trình khơng thể xác định một nghiệm chính xác duy nhất. Khi đó mơ hình được gọi là overidentified. Trong trường hợp đó, chúng ta phải thực hiện tính tốn lại nhằm xác định giá trị 𝜷 làm cho điều kiện moment E(Ztut(𝜷)) gần bằng 0 nhất
có thể, khái niệm gần được hiểu là khoảng cách với giá trị 0 là nhỏ nhất, khoảng cách đó được xác định như sau: J(𝜷,WT) = 𝟏
𝑻 . u(𝜷)′Z. WT-1Z’u(𝜷)
Ma trận ngẫu nhiên, cân xứng và khơng âm WT (kích thước LxL) được gọi là
vào khoảng cách J. Phương pháp ước lượng GMM sẽ xác định giá trị ước lượng 𝜷 để khoảng cách J là nhỏ nhất.
Trong ước lượng D-GMM, cần phân biệt biến được công cụ (instrumented) và biến công cụ (instrument). Nếu các biến được dự đoán là nội sinh (tương đương với ngoại sinh khơng nghiêm ngặt) thì sắp xếp vào nhóm biến được cơng cụ theo tiếp cận GMM; và khi đó chỉ có giá trị trễ của các biến này mới là các cơng cụ thích hợp. Nếu các biến giải thích được xác định là ngoại sinh nghiêm ngặt cũng như các biến công cụ được thêm vào (nếu có) thì xếp vào nhóm biến cơng cụ (iv_instrument variable). Các biến được cho là ngoại sinh nghiêm ngặt thì giá trị hiện tại và trễ của chúng đều là các cơng cụ thích hợp (Judson et al., 1996). Ngoài ra, để kiểm định Sargan khơng bị yếu thì số lượng các biến công cụ được lựa chọn về nguyên tắc phải nhỏ hơn hoặc bằng số lượng các nhóm.
Phương pháp ước lượng D-GMM được thiết kế thích hợp cho dữ liệu bảng với T nhỏ và N lớn (Roodman, 2006), sử dụng sai phân bậc nhất sẽ khiến tác động cố định đặc thù bị loại trừ bởi chính đặc tính khơng đổi theo thời gian của nó:
∆uit = uit – uit-1 = (vi + eit) – (vi + eit-1) = (vi – vi) + (eit – eit-1) = ∆eit
Tính hợp lý của các cơng cụ được sử dụng trong phương pháp D-GMM được đánh giá qua các thống kê Sargan/ Hansen1
và Arellano Bond (AR).
Kiểm định Sargan để xác định tính chất phù hợp của các biến cơng cụ trong mơ hình GMM. Đây là kiểm định giới hạn về nội sinh (over-identifying restrictions) của mô hình. Kiểm định Sargan với giả thuyết H0: “Biến công cụ là ngoại sinh”, nghĩa là không tương quan với sai số của mơ hình. Vì thế, giá trị ρ của thống kê Sargan càng lớn càng tốt.
Kiểm định Arellano Bond về tự tương quan (autocorrelation) với giả thuyết H0: “Mơ hình khơng xảy ra hiện tượng tự tương quan” và được áp dụng cho số dư sai phân. Kiểm định tiến trình AR(1) trong sai phân bậc 1 thường bác bỏ giả thuyết
1 Trong ước lượng với tùy chọn Robust, Stata trình bày thống kê Hansen thay cho thống kê Sargan với giả thuyêt H0 giống như nhau.
H0, có thể giải thích điều này: ∆eit = eit – eit-1 và ∆eit-1 = eit-1 – eit-2 nên cả hai đều có
eit-1 . Cho nên, kiểm định AR(2) quan trọng hơn bởi vì nó kiểm tra tự tương quan ở
các cấp độ.
Tóm lại, phương pháp D-GMM sử dụng các độ trễ thích hợp của các biến được công cụ để tạo nên các biến cơng cụ. Ngồi ra, D-GMM cịn khai thác dữ liệu gộp của bảng và ràng buộc độ dài chuỗi dữ liệu thời gian của các đơn vị bảng trong bảng dữ liệu. Từ đó, cho phép sử dụng một cấu trúc trễ thích hợp để khai thác đặc tính năng động của dữ liệu.
2.3.4.3 Tính chất của phương pháp ước lượng D-GMM:
Khi số lượng mẫu phù hợp giá trị 𝛽 ước lượng được sẽ vững, khi đó giá trị
ước lượng được sẽ càng gần với giá trị thực của nó. Ước lượng GMM sẽ cho ra các giá trị ước lượng tuân theo quy luật phân phối chuẩn, đây là một thuộc tính rất quan trọng vì đó là cơ sở để chúng ta xây dựng giá trị dự đoán ở các độ tin cậy (confidence bands) và thực hiện các kiểm định khác. Phương pháp GMM cũng cho ra kết quả là các giá trị ước lượng hiệu quả, nghĩa là giá trị phương sai trong mô hình ước lượng là nhỏ nhất.
Một cách tổng quan, GMM là phương pháp tổng quát của rất nhiều phương pháp ước lượng phổ biến
+ OLS là trường hợp đặc biệt của GMM khi mà các biến cơng cụ cũng chính là các biến ước lượng (các biến là nội sinh):
E[xt(yt – x’t𝜷)] = 0
+ GLS (Generalized Least Squares) là trường hợp đặc biệt của GMM khi:
E[xt(yt – x’t𝜷)/𝜹2
(xt)] = 0
+ MLE (Maximum Likelihood Estimation) là trường hợp đặc biệt của GMM khi:
E[𝜵𝜽lnf(xt,𝜽)] = 0
Tuy nhiên phương pháp này cũng có những hạn chế, ta sẽ nhắc đến vấn đề này như là hạn chế của đề tài.
CHƯƠNG 3. KẾT QUẢ NGHIÊN CỨU 3.1 PHÂN TÍCH MƠ TẢ 3.1 PHÂN TÍCH MƠ TẢ
3.1.1 Kiểm định tính dừng
Bảng 3.1: Kết quả kiểm định nghiệm đơn vị của các biến
STT Tên biến Giá trị thống kê t Kết luận Bậc tích hợp 1 GOP (-2.8521)*** Chuỗi dừng I(0)
2 TQ (-9.1124)*** Chuỗi dừng I(0)
3 CCC (-2.9205)*** Chuỗi dừng I(0) 4 RCP (-2.7055)*** Chuỗi dừng I(0) 5 ICP (-2.7331)*** Chuỗi dừng I(0) 6 PDP (-2.8444)*** Chuỗi dừng I(0)
7 SIZE (-2.4949)* Chuỗi dừng I(0)
8 GROWTH (-3.4884)*** Chuỗi dừng I(0) 9 LEV (-2.7010)*** Chuỗi dừng I(0) 10 FAR (-6.2426)*** Chuỗi dừng I(0) 11 VNOI (-3.8546)*** Chuỗi dừng I(0) 12 GDP (-2.5326)*** Chuỗi dừng I(0)
Ghi chú: (i) Các chỉ số trong ngoặc là thống kê t-statistic
(ii) ***, ** và * tương ứng với mức ý nghĩa 1%, 5% và 10%
Bảng 3.1, Kết quả kiểm định nghiêm đơn vị của các biến cho thấy tất cả các biến đều có tính dừng ở mức ý nghĩa 1%, chỉ có biến SIZE dừng ở mức ý nghĩa 10%. Từ đây, nghiên cứu sẽ sử dụng các biến trên để kiểm định các mơ hình.
3.1.2 Thống kê mô tả
Bảng 3.2 cho thấy kết quả thống kê mô tả các biến sẽ sử dụng trong mơ hình, có thể thấy giá trị trung bình của TQ mẫu tổng thể là 1.227515, có giá trị nhỏ nhất là 0.3401552 và giá trị lớn nhất là 20.93303, độ lệch tiêu chuẩn của biến TQ là 0.9624401. Ngành hàng cơng nghiệp có giá trị trung bình TQ cao nhất 1.60182, tiếp theo là ngành hàng dịch vụ 1.282687, ngành hàng tiêu dùng 1.178376 và cuối cùng là ngành xây dựng và bất động sản với giá trị trung bình TQ là 1.115. Xét về tính đồng đều thì ngành xây dựng và bất động sản có các doanh nghiệp có hiệu quả thị trường đồng đều hơn hẳn các ngành còn lại với độ lệch chuẩn của TQ thấp hơn cả, là 0.6513847.
Bảng 3.2: Thống kê mô tả Tất cả các doanh nghiệp thuộc mẫu
Variable Obs Mean Std. Dev. Min Max
TQ 1442 1.227515 0.9624401 .3401552 20.93303 GOP 1442 0.221104 0.1660637 -0.437384 2.006957 CCC 1442 178.7528 274.8073 -472.8597 4267.384 RCP 1442 97.67849 111.226 2.215931 1313.537 ICP 1442 127.7452 242.3137 0.0051897 4501.42 PDP 1442 47.00072 55.92894 0.001552 608.0137 SIZE 1442 26.77653 1.419784 23.1799 30.8014 GROWTH 1442 0.1968307 0.5419828 -0.878277 11.37014 LEV 1442 0.4807884 0.2183142 0.031092 0.9275434 FAR 1442 0.1066005 0.1355418 -0.0142399 0.9813 VNOI 1442 0.0681388 0.097183 0.0061047 2.080895 GDP 1442 0.191856 0.0696686 0.1044247 0.2961181
Các doanh nghiệp thuộc ngành hàng Tiêu dùng
Variable Obs Mean Std. Dev. Min Max
TQ 840 1.178376 0.6926393 0.3401552 5.577873 GOP 840 0.2437412 0.1523474 -0.437384 0.9857011 CCC 840 130.8309 105.5641 -42.12642 1115.54 RCP 840 67.81306 58.0341 2.52691 569.5834 ICP 840 97.76763 87.79847 1.054838 976.7868 PDP 840 35.01556 33.9351 0.001552 255.5628 SIZE 840 26.71111 1.428894 23.1799 30.76983 GROWTH 840 0.2000337 0.5985169 -0.7246315 11.37014 LEV 840 0.4698179 0.2023523 0.031092 0.9275434 FAR 840 0.0930282 0.1196141 -0.0142399 0.9813 VNOI 840 0.0660262 0.0642085 0.0083072 0.5678168 GDP 840 0.191856 0.069686 0.1044247 0.2961181
Các doanh nghiệp thuộc ngành hàng Công nghiệp
Variable Obs Mean Std. Dev. Min Max
TQ 154 1.60182 1.879264 0.4968272 20.09.303
GOP 154 0.2381846 0.1500406 0.0362836 0.7675446
ICP 154 56.8884 44.77879 1.002346 244.5868 PDP 154 46.1068 76.09823 0.2570073 585.1.867 SIZE 154 27.45916 1.419091 24.76689 30.8014 GROWTH 154 0.2145127 0.3663404 -0.5305989 2.154175 LEV 154 0.4170643 0.2416781 0.0319569 0.8439173