3 DỮ LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU 14 U
3.3 Mơ hình nghiên cứu: 21
Những tác động của sự thay đổi trong sản xuất công nghiệp, chỉ số giá tiêu dùng, lãi suất, cung tiền M2 và tỷ giá hối đoái lên tỷ suất sinh lợi thị trường mới nổi và tiền mới nổi được ước lượng hồi quy tuyến tính trên dữ liệu bảng. Trong đó sự thay đổi trong chỉ số thị trường chứng khốn, chỉ số sản xuất cơng nghiệp, chỉ số giá tiêu dùng, lãi suất, cung tiền và tỷ giá hối đoái được lấy logarit của kỳ t – kỳ (t-1)
lgr = f(lgIPI, lgCPI, lgbond, lgM2, lgER) (1)
Dữ liệu bảng:
Dữ liệu bảng còn được gọi bằng các tên khác như là dữ liệu gộp chung (gộp chung các quan sát chéo và chuỗi thời gian), là sự kết hợp của dữ liệu chéo và chuỗi thời gian.
Mơ hình dữ liệu bảng hữu ích vì những lý do sau:
• Nghiên cứu được sự khác biệt giữa các đơn vị chéo mà trước đây chúng ta hay sử dụng biến giả dummy;
• Nâng cao được số quan sát của mẫu và phần nào khắc phục được hiện tượng đa cộng tuyến;
• Chứa đựng nhiều thơng tin hơn các dữ liệu khác;
• Nghiên cứu được động thái thay đổi của các đơn vị chéo theo thời gian Các mơ hình hồi quy dữ liệu bảng được thực hiện gồm Pooled model – mơ hình gộp, Fixed effect model (FEM)- mơ hình cố định và Random effect model (REM) – mơ hình ngẫu nhiên.
3.3.1 Mơ hình gộp Pooled:
Mơ hình gộp Pooled là mơ hình được hồi quy bằng cách sử dụng tất cả dữ liệu xếp chồng không phân biệt từng cá thể, đơn vị chéo. Các cá thể trong bài nghiên cứu này là quốc gia). Tức là mơ hình này sử dụng dữ liệu như một phân tích OLS bình thường. Với từng cá thể, mỗi sai số là ảnh hưởng của yếu tố không quan sát được và không thay đổi theo thời gian và đặc trưng cho mỗi cá thể. Do đó mơ hình này có thể bỏ qua những khác biệt giữa các cá thể, giữa các thời gian quan sát. Mơ hình (1) có dạng
lgR it = α + β1 lgIP it +β2 lgCPI it +β3 lgbond it +β4 lgM2 it +β5 lgER it +eit (2) Trong đó:
• α, β1,β2,β3,β4,β5: hằng số không thay đổi theo i hay t, là hệ số hồi quy thể hiện mối tương quan giữa các nhân tố vĩ mô và thị trường chứng khốn.
• eit: sai số của phương trình bao gồm sai số do ảnh hưởng của yếu tố không quan sát được, do đặc trưng của cá thể và những thay đổi theo thời gian.
• Các biến phụ thuộc, độc lập được miêu tả ở bảng 3.1
Mơ hình được ước lượng bằng phương pháp bình phương bé nhất
3.3.2 Mơ hình ảnh hưởng cố định (Fixed effect model –FEM):
Mơ hình FEM giả định rằng hệ số gốc là không đổi cho các cá thể trong mơ hình, hệ số chặn thay đổi theo từng cá thể nhưng không thay đổi theo thời gian lgRit = αi + β1lgIP it +β2lgCPI it +β3lgbond it +β4lgM2 it +β5lgER it + eit (3) Trong đó:
• hệ số chặn αi thay đổi cho các cá thể trong mơ hình, phản ảnh những ảnh hưởng không đồng nhất từ các biến không quan sát được giữa các cá thể
• βk là ma trận cột thể hiện hệ số gốc chung không thay đổi cho tất cả các cá thể trong mẫu.
• eit là sai số của mơ hình và có phân phối chuẩn N(0,σe2). FEM có thể ước lượng bằng 2 phương pháp
o Ước lượng bình phương bé nhất với biến giả (the least squares dummy variable estimator-LSDV): phương pháp này không giải quyết được với số lượng cá thể trong nghiên cứu lớn
o Ước lượng ảnh hưởng cố định (the fixed effects estimator): ước lượng này chủ yếu tìm các nhân tố chung βk trong mơ hình..
Để biết mơ hình FEM có ý nghĩa về mặt thống kê hay khơng, thực hiện kiểm định Likelihood Ratio cho FEM. Trong hồi quy ở mơ hình (3), giả thiết đặt ra cho kiểm định:
• H0: αi=0, tức khơng tồn tại những khác biệt giữa các cá thể trong mơ hình Ỵdùng Pooled hiệu quả hơn FEM
• H1: có ít nhất tồn tại một αi≠0
Nếu H0 bị từ chối thì cho thấy có tồn tại mơ hình ảnh hưởng cố định có ý nghĩa về mặt thống kê vì vậy FEM thích hợp hơn Pooled và ngược lại
3.3.3 Mơ hình ảnh hưởng ngẫu nhiên (Random effect model –REM)
Mơ hình REM cũng giả định rằng hệ số gốc là không đổi cho các các thể, tuy nhiên hệ số chặn là ngẫu nhiên. Mơ hình REM tương tự mơ hình FEM tuy nhiên hệ số chặn αi = α +ui, trong đó α là hệ số chặn trung bình của tất cả các đơn vị chéo và ui là sai số ngẫu nhiên phản ánh những ảnh hưởng khác nhau giữa các cá thể với giả định E(ui) = 0; Var (ui) = E(u2i) = σu2; Cov (ui,uj)= 0 với i≠j. Mơ hình có dạng:
lgR it = α + β1 lgIP it +β2 lgCPI it +β3 lgbond it +β4 lgM2 it +β5 lgER it +eit +ui (4) trong đó:
Để biết mơ hình REM có ý nghĩa về mặt thống kê hay khơng, thực hiện kiểm định Breusch-Pagan Lagrange multiplier cho REM. Trong hồi quy ở phương trình (4), giả thiết đặt ra:
• H0: var (u)= 0 phương sai của những đặc tính riêng của cá thể bằng 0
Ỵdùng Pooled hiệu quả hơn REM
• H1: var (u) ≠0
Nếu H0 bị từ chối thì cho thấy có tồn tại var(u) ≠0 có ý nghĩa về mặt thống kê, vì vậy REM tốt hơn Pooled và ngược lại
Ngồi ra, khi mơ hình Pooled khơng có ý nghĩa thống kê thì để chọn FEM hoặc REM thì sử dụng Hausman test với giả thiết:
• H0: sự khác biệt giữa các hệ số mơ hình FEM và REM là ngẫu nhiên Ỵdùng REM hiệu quả hơn FEM
• H1: sự khác biệt mang tính hệ thống – FEM hiệu quả hơn REM Nếu H0 bị từ chối, mơ hình FEM hiệu quả hơn và có ý nghĩa về mặt thống kê
3.3.4 Kiểm tra phương sai thay đổi, tự tương quan cho sai số:
Do dữ liệu bảng là tập hợp của nhiều cá thể nên dễ xảy ra hiện tượng phương sai thay đổi. Trong bài nghiên cứu, Tác giả sử dụng Wald test để kiểm tra phương sai thay đổi. Khi phương sai thay đổi thì ước lượng sẽ khơng cịn hiệu quả, kiểm định hệ số hồi quy khơng cịn đáng tin cậy.
Dữ liệu chuỗi thời gian thường tự tương quan. Trong bài nghiên cứu, Tác giả sử dụng Lagram-Multiplier test để kiểm định tương quan chuỗi. Tương tự phương sai thay đổi, tự tương quan cũng làm ước lượng không hiệu quả, và kiểm định hệ số hồi quy khơng cịn đáng tin cậy
3.3.5 Khắc phục phương sai thay đổi và tự tương quan:
Khắc phục hiện tượng phương sai thay đổi và tự tương quan bằng phương pháp lước lượng bình phương bé nhất hiệu chỉnh sai số chuẩn bằng tuỳ chọn robust cho phương sai thay đổi, cluster robust cho phương sai thay đổi và tự tương quan. Và ước lượng bình phương nhỏ nhất tổng quát (General Least Square) để khắc phục phương sai thay đổi, tự tương quan trên dữ liệu bảng