Hướng dẫn chạy mô hình OLS, FEM, REM trên stata Làm luận văn thạc sĩ Kèm theo file dữ liệu Excel để thực hành Dành cho học viên cao hoc chuyên ngành kinh tế, tài chính, ngân hàng có thể áp dụng để chạy số liệu cho việc làm luận văn tốt nghiệp cao học
Trang 1Sử dụng dữ liệu của 47 công ty ngành Bất động sản niêm yết trên thị trường chứng khoán Việt Nam trong giai đoạn 05 năm từ năm 2010 đến năm
2014, tổng mẫu thu được là 235 (47 cty x 5 năm = 235 quan sát) Với kết quả này, kích thước mẫu đủ khả năng để tiến hành phân tích hồi quy và kết quả phân tích đủ độ tin cậy cho việc kết luận về bài nghiên cứu
Mô tả các biến được sử dụng trong mô hình
vọng
Nguồn tham khảo Phụ thuộc
MP Giá thị trường CP Giá CP trên TTCK niêm yết
Độc lập
ROE Tỷ suất sinh
EPS Thu nhập một CP LNST CP thường/S.lượng CP
thường đang lưu hành BQ (+)
BV Giá trị sổ sách một
TD Tỷ số nợ trên TTS Tổng nợ/TTS (-)
SIZE Quy mô doanh
nghiệp Logarit Tổng tài sản (+)
GROWTH Tốc độ tăng trưởng
TTS
(TTS năm nay – TTS năm trước)/TTS năm trước (+)
Mô hình nghiên cứu dự kiến có phương trình như sau:
MP it = β 0 + β 1 ROE it + β 2 ROA it + β 3 EPS it + β 4 BV it + β 5 PE it + β 6 PB it +
β 7 TD it + β 8 SIZE it + β 9 GROWTH it + ε it
Syntax:
Trang 2import excel “đường dẫn đến file dữ liệu”, sheet(“tên sheet”) firstrow nhập
dữ liệu từ excel
encode MACK, gen (MACK1) Tạo biến MACK1 do biến MACK có dạng
string, Stata không hiểu
xtset MACK1 YEAR định dạng dữ liệu thành dạng panel data theo K/gian và
T/gian
1 Thống kê mô tả các biến trong mô hình nghiên cứu
Syntax: sum MP ROE ROA EPS PE BV PB TD SIZE GROWTH Thống kê
mô tả các biến
Kết quả:
GROWTH 235 1.145251 .3094645 .6268703 3.857517 SIZE 235 6.160365 545282 5.048065 7.956578
TD 235 .5323776 .1634513 .0757027 .9154871
PB 235 1.019757 .9786483 .1499423 7.057057
BV 235 14284.98 7089.425 2900 36600
PE 205 57.43438 135.7086 1.92392 1024.499 EPS 235 1253.241 1591.287 0 9397.78 ROA 235 .0286103 .0555953 -.2122973 .2735206 ROE 235 .0686651 .1503401 -.6839968 .6296915
MP 235 12378.72 9076.464 1900 61500 Variable Obs Mean Std Dev Min Max
2 Phân tích mối tương quan giữa các biến
Syntax: corr MP ROE ROA EPS PE BV PB TD SIZE GROWTH chạy tương quan các biến
Trang 3GROWTH 0.3204 0.3915 0.3130 0.1523 -0.0905 -0.2251 0.4658 0.1393 0.1381 1.0000 SIZE 0.4005 0.0971 0.0615 0.0522 -0.0218 0.0820 0.2844 0.1573 1.0000
TD 0.1185 0.2086 -0.1282 0.1020 0.0238 -0.0215 0.2066 1.0000
PB 0.6362 0.4967 0.3446 0.1125 -0.0236 -0.3787 1.0000
BV 0.2219 -0.0174 0.0630 0.4760 -0.2168 1.0000
PE -0.1462 -0.2933 -0.2966 -0.3154 1.0000
EPS 0.5297 0.7453 0.7399 1.0000
ROA 0.4631 0.8713 1.0000
ROE 0.5148 1.0000
MP 1.0000
MP ROE ROA EPS PE BV PB TD SIZE GROWTH
3 Kết quả các mô hình hồi quy
Mô hình nghiên cứu sử dụng dữ liệu bảng (panel data) được hồi quy theo 3
cách: pooled, random effect (ảnh hưởng ngẫu nhiên) và fixed effect (ảnh hưởng
cố định) Để tìm hiểu xem phương pháp hồi quy nào là phù hợp nhất trong ba
phương pháp trên, chúng ta sử dụng các kiểm định: kiểm định F, kiểm định
Lagrangian Multiplier (LM test, Breusch và Pagan, 1980) và kiểm định
Hausman (Hausman, 1978)
3.1 Mô hình POLS
Mô hình pooled: Mô hình hồi quy pooled để kiểm định ảnh hưởng của các biến
độc lập đối với biến phụ thuộc Mô hình pooled thực chất là việc sử dụng dữ
liệu bảng để phân tích bằng hình thức sử dụng tất cả dữ liệu bằng cách sắp xếp
chồng không phân biệt từng cá thể riêng, tức là mô hình này sử dụng dữ liệu
như một phân tích OLS thông thường Phương pháp bình phương bé nhất (OLS)
được sử dụng để ước lượng đường thẳng hồi quy bởi vì nó cho phép sai số cực
tiểu giữa các điểm ước lượng trên đường thẳng hồi quy và những điểm quan sát
thực tế của đường thẳng hồi quy là phù hợp nhất
Trang 4Syntax: reg MP ROE ROA EPS PE BV PB TD SIZE GROWTH Chạy mô
hình hồi quy OLS
Kết quả:
_cons -17773.08 4103.785 -4.33 0.000 -25866.58 -9679.579 GROWTH 985.992 1202.593 0.82 0.413 -1385.766 3357.75 SIZE 2800.898 654.5824 4.28 0.000 1509.928 4091.868
TD -3501.179 2823.266 -1.24 0.216 -9069.236 2066.878
PB 6637.919 467.0285 14.21 0.000 5716.844 7558.995
BV 3387856 .0714769 4.74 0.000 1978185 .4797527
PE 1.77139 2.65712 0.67 0.506 -3.468994 7.011773 EPS 2.678211 .4775668 5.61 0.000 1.736352 3.62007 ROA 2039.249 21022.25 0.10 0.923 -39420.91 43499.41 ROE -17709.54 9401.39 -1.88 0.061 -36251 831.9219
MP Coef Std Err t P>|t| [95% Conf Interval]
Total 1.7050e+10 204 83580760.4 Root MSE = 4755 Adj R-squared = 0.7295 Residual 4.4090e+09 195 22610310.7 R-squared = 0.7414 Model 1.2641e+10 9 1.4046e+09 Prob > F = 0.0000 F(9, 195) = 62.12 Source SS df MS Number of obs = 205
Syntax: est store POLS Lưu Mô hình dưới tên POLS, để so sánh với các Mô
hình sau này
- Kiểm định không bị hiện tượng đa cộng tuyến trong mô hình
Syntax: vif
Trang 5Theo lý thuyết kinh tế lượng, khi sử dụng nhân tử phóng đại phương sai VIF, mô hình có VIF >10 trong khi R2>0.9 thì
mô hình có biến đa cộng tuyến cao với các biến khác
Trong mô hình đang thử nghiệm, VIF trung bình là 3.76, R2 = 7414 xem như hiện tượng đa cộng tuyến trong mô hình được đánh giá là không nghiêm trọng (theo Gujrati, 2003)
Tuy nhiên, trong mô hình đang nghiên cứu ta có biến ROE có VIF>10 Khi so sánh dấu của hệ số tương quan giữa ROE
3.2 Mô hình FEM (mô hình hồi quy tác động cố định)
Mô hình ảnh hưởng cố định (FEM – Fixed effects model): Mô hình này giả định mỗi thực thể đều có những đặc điểm riêng biệt ảnh hưởng đến biến giải thích, FEM phân tích mối tương quan giữa phần dư của mỗi thực thể với các biến giải thích qua đó kiểm soát và tách ảnh hưởng của các đặc điểm riêng biệt ra khỏi các biến giải thích để ước lượng những ảnh hưởng thực của biến giải thích lên biến được giải thích (biến phụ thuộc) Mô hình ước lượng sử dụng:
Yit = β1i + β2Xit + uit (1)
Yit: biến phục thuộc
Xit: biến độc lập
i: doanh nghiệp; t: thời gian (năm)
β1i: hệ số chặn cho từng cá thể nghiên cứu
β2: hệ số góc đối với biến giải thích X
uit: phần dư
Mean VIF 3.76
PE 1.17 0.852392
SIZE 1.18 0.846013
GROWTH 1.36 0.734538
TD 1.88 0.531993
PB 2.04 0.489158
BV 2.44 0.410395
EPS 5.43 0.184093
ROA 7.92 0.126234
ROE 10.37 0.096408
Variable VIF 1/VIF
Trang 6Mô hình trên đã thêm vào chỉ số i cho hệ số chặn β1 để phân biệt hệ số chặn của từng doanh nghiệp khác nhau có thể khác nhau do đặc điểm khác nhau của từng doanh nghiệp hoặc do sự khác nhau trong chính sách quản lý, hoạt động của doanh nghiệp
Syntax: xtreg MP ROE ROA EPS PE BV PB TD SIZE GROWTH, fe Chạy
MH hồi quy FE
Kết quả:
Trang 7F test that all u_i=0: F(50, 145) = 3.76 Prob > F = 0.0000 rho .92387712 (fraction of variance due to u_i)
sigma_e 3638.3938
sigma_u 12675.328
_cons -142882.2 38349.48 -3.73 0.000 -218678.4 -67086 GROWTH 2397.017 1166.513 2.05 0.042 91.45148 4702.582 SIZE 25236.82 7000.768 3.60 0.000 11400.08 39073.55
TD -28213.06 6723.797 -4.20 0.000 -41502.37 -14923.75
PB 7498.537 521.4591 14.38 0.000 6467.894 8529.179
BV 155983 .2241242 0.70 0.488 -.2869894 .5989554
PE 2.276915 2.416078 0.94 0.348 -2.498366 7.052196 EPS 2.570255 .4434001 5.80 0.000 1.693893 3.446618 ROA 9755.006 21583.19 0.45 0.652 -32903.29 52413.3 ROE -23562.97 9496.801 -2.48 0.014 -42333.02 -4792.931
MP Coef Std Err t P>|t| [95% Conf Interval]
corr(u_i, Xb) = -0.8809 Prob > F = 0.0000 F(9,145) = 57.26
overall = 0.4216 max = 5 between = 0.4119 avg = 4.0 within = 0.7804 min = 1 R-sq: Obs per group:
Group variable: MACK1 Number of groups = 51 Fixed-effects (within) regression Number of obs = 205
Syntax: est store FEM Lưu Mô hình dưới tên FEM, để so sánh với các Mô
hình khác
3.3 Mô hình REM (mô hình hồi quy tác động ngẫu nhiên)
Mô hình ảnh hưởng ngẫu nhiên (REM – Random Effects Model): Giả định của
mô hình FEM là có sự biến động giữa các cá thể và có liên quan đến biến giải
thích thì giả định của mô hình REM sự biến động giữa các cá thể là ngẫu nhiên
Trang 8và không tương quan đến các biến giải thích Như vậy, sự khác biệt giữa mô hình FEM và mô hình REM ở sự biến động của các cá thể, nếu sự khác biệt giữa các cá thể có ảnh hưởng đến biến phụ thuộc thì REM sẽ thích hợp hơn so với FEM Trong mộ hình REM phần dư của mỗi thực thể (không tương quan với biến giải thích) được xem là một biến giải thích mới Ý tưởng của mô hình REM cũng bắt đầu từ mô hình:
Yit = β1i + β2Xit + uit (1)
Nếu trong (1) β1i là cố định thì trong REM có giả định rằng nó là một biến ngẫu nhiên với trung bình là β1 và giá trị hệ số chặn được mô tả như sau: β1i = β1 + εi (i = 1,2,3,…,n)i (i = 1,2,3,…,n)
εi (i = 1,2,3,…,n)i: sai số ngẫu nhiên có trung bình bằng 0 và phương sai là б2
Thay vào mô hình trên ta có: Yit = β1 + βXit + εi (i = 1,2,3,…,n)i + uit hay Yit = β1 + βXit + wit (2) với wit = εi (i = 1,2,3,…,n)i + uit
εi (i = 1,2,3,…,n)i: sai số thành phần của các đối tượng khác nhau (đặc điểm riêng khác nhau của từng doanh nghiệp)
uit: sai số thành phần kết hợp khác của đặc điểm riêng theo từng đối tượng và theo thời gian
Syntax: xtreg MP ROE ROA EPS PE BV PB TD SIZE GROWTH, re Chạy
MH hồi quy RE
Kết quả:
Trang 9rho .40081927 (fraction of variance due to u_i)
sigma_e 3638.3938
sigma_u 2975.8091
_cons -21774.87 5936.865 -3.67 0.000 -33410.91 -10138.83 GROWTH 1713.477 1100.163 1.56 0.119 -442.8033 3869.757 SIZE 3404.694 984.033 3.46 0.001 1476.025 5333.363
TD -6706.076 3194.503 -2.10 0.036 -12967.19 -444.9654
PB 6714.805 437.6454 15.34 0.000 5857.035 7572.574
BV 4271168 .0842875 5.07 0.000 2619163 .5923173
PE 1.715764 2.392245 0.72 0.473 -2.97295 6.404477 EPS 2.881886 .4311705 6.68 0.000 2.036807 3.726965 ROA 4715.721 20436.97 0.23 0.818 -35340.01 44771.45 ROE -21964.95 9128.096 -2.41 0.016 -39855.69 -4074.215
MP Coef Std Err z P>|z| [95% Conf Interval]
corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0000 Wald chi2(9) = 564.48
overall = 0.7317 max = 5 between = 0.7234 avg = 4.0 within = 0.7511 min = 1 R-sq: Obs per group:
Group variable: MACK1 Number of groups = 51 Random-effects GLS regression Number of obs = 205
Syntax: est store REM Lưu Mô hình dưới tên REM, để so sánh với các Mô
hình khác
3.4 Kiểm định lựa chọn mô hình phù hợp
Kiểm định Hausman
Syntax: Hausman FEM REM Kiểm định Hausman mô hình FEM và REM
Trang 10(V_b-V_B is not positive definite)
Prob>chi2 = 0.8898
= 2.30
chi2(6) = (b-B)'[(V_b-V_B)^(-1)](b-B)
Test: Ho: difference in coefficients not systematic
B = inconsistent under Ha, efficient under Ho; obtained from xtreg
b = consistent under Ho and Ha; obtained from xtreg GROWTH 2397.017 1713.477 683.5401 387.8057
SIZE 25236.82 3404.694 21832.12 6931.265
TD -28213.06 -6706.076 -21506.98 5916.469
PB 7498.537 6714.805 783.7318 283.5244
BV .155983 4271168 -.2711338 .2076711
PE 2.276915 1.715764 .5611513 .3385263
EPS 2.570255 2.881886 -.3116307 .1034198
ROA 9755.006 4715.721 5039.285 6940.036
ROE -23562.97 -21964.95 -1598.021 2620.517
FEM REM Difference S.E.
(b) (B) (b-B) sqrt(diag(V_b-V_B)) Coefficients
So sánh lựa chọn mô hình
Syntax: esttab POLS FEM REM, star(* 0.1 ** 0.05 *** 0.01) Kết xuất 3 MH
ra dạng bảng
Nếu lệnh esttab chưa có sẵn trong Stata, cài đặt như sau:
Syntax: ssc install estout
Tên biến Mô hình Pooled Mô hình FEM Mô hình REM ROE -17709.5*(-1.88) -23563.0**(-2.48) -21965.0**(-2.41)
Trang 11BV 0.339***-4.74 0.156-0.7 0.427***-5.07
SIZE 2800.9***-4.28 25236.8***-3.6 3404.7***-3.46 GROWTH -0.82986 2397.0**-2.05 1713.5-1.56 _Cons -17773.1***(-4.33) -142882.2***(-3.73) -21774.9***(-3.67)
0.9898
Các biến ROA, PE không có ý nghĩa thống kê, biến ROE có hệ số hồi quy trái dấu so với hệ số tương quan → có cần thực hiện việc loại bỏ biến ra khỏi các
mô hình và chạy lại mô hình
Để lựa chọn ra mô hình phù hợp nhất trong 3 mô hình vừa thống kê ở trên, chúng ta tiến hành các kiểm định:
- Kiểm định F-test: so sánh mô hình Pooled Regression và Fixed effects model với giả thuyết H0: chọn Pooled Regression Kết quả cho thấy với mức ý nghĩa 1%, ta có: F = 0,0000 < 1% nên bác bỏ giả thuyết H0 → chọn Fixed effects model
- Kiểm định Hausman test: so sánh mô hình Fixed effects model và Random effects model với giả thuyết H0: chọn Random effects model Kết quả cho thấy với mức ý nghĩa 1%, ta có Prob = 2,30% > 1% nên chấp thuận giả thuyết H0 → chọn Random effects model
5 Kiểm định phương sai của sai số thay đổi
Trang 12Cách 1:
Phương sai của sai số thay đổi sẽ làm cho các ước lượng thu được bằng phương pháp OLS vững nhưng không hiệu quả, các kiểm định hệ số hồi quy không còn đáng tin cậy Từ đó dẫn đến hiện tượng ngộ nhận các biến độc lập trong mô hình nghiên cứu có ý nghĩa, lúc đó kiểm định hệ số hồi quy và R bình phương không dùng được Bởi vì phương sai của sai số thay đổi làm mất tính hiệu quả của ước lượng, nên cần thiết phải tiến hành kiểm định giả thuyết phương sai của sai số không đổi bằng kiểm định White, với giả thuyết H0: Không có hiện tượng phương sai thay đổi
Syntax:
reg MP ROE ROA EPS PE BV PB TD SIZE GROWTH
imtest, white Kiểm định White mô hình POLS
Total 183.56 63 0.0000
Kurtosis 3.10 1 0.0784
Skewness 13.09 9 0.1585
Heteroskedasticity 167.37 53 0.0000
Source chi2 df p
Cameron & Trivedi's decomposition of IM-test
Prob > chi2 = 0.0000
chi2(53) = 167.37
against Ha: unrestricted heteroskedasticity
White's test for Ho: homoskedasticity