Hình 3 .1 Quy trình nghiên cứu
Hình 3.3 Các nhân tố trong mơ hình hồi quy
3.2. Dữ liệu và phƣơng pháp thu thập:
3.2.1. Dữ liệu nghiên cứu:
Trong chương 1, tác giả đã trình bày tổng quan vấn đề nghiên cứu, câu hỏi nghiên cứu và mục tiêu nghiên cứu của đề tài. Các nghiên cứu thực nghiệm được trình bày ở chương 2. Theo mục tiêu nghiên cứu và những nghiên cứu trước đây tác giả quan tâm việc kiểm định tác động của những nhân tố như: đòn bẩy, dòng tiền, tốc độ tăng trưởng và doanh thu lên quyết định đầu tư của các công ty Việt Nam niêm yết trên HOSE. Nghiên cứu này sử dụng dữ liệu của 65 công ty Việt Nam niêm yết trên HOSE trong giai đoạn từ năm 2007 đến năm 2012 để có được mẫu nghiên cứu 5 năm. Trong cơng thức hồi quy có những biến được lấy độ trễ nên dữ liệu được tính từ năm 2007 cho các biến như: địn bẩy, doanh thu và tốc độ tăng trưởng.
Tác giả loại bỏ những công ty không đầy đủ số liệu, các cơng ty tài chính, ngân hàng, bảo hiểm, quản lý quỹ,….các cơng ty có giá trị vốn hóa trên thị trường tại thời điểm nghiên cứu < 100 tỷ đồng. Dữ liệu với những thông tin chi tiết từng công ty, những mục quan tâm như: Bảng cân đối kế toán, Bảng kết quả hoạt động kinh doanh, Bảng lưu chuyển tiền tệ, giá trị vốn hóa thị trường, giá trị thị
trường của cổ phiếu…..dữ liệu này thu thập từ những website chứng khoán như
www.hsx.vn, www.cophieu68.com , www.stox.vn , www.cafef.vn , stockbiz.vn .
3.2.2. Thiết kế nghiên cứu và phƣơng pháp nghiên cứu:
Nghiên cứu được thực hiện theo phương pháp nghiên cứu định lượng dựa trên mơ hình hồi quy thường (pooling regression), mơ hình tác động cố định (fixed effect), mơ hình tác động ngẫu nhiên (random effect) trên dữ liệu bảng để (panel data) để ước lượng tác động của đòn bẩy, dòng tiền, doanh thu, Q (đại diện cho cơ hội tăng trưởng) lên đầu tư của các công ty niêm yết trên HOSE như thế nào? Sau khi có bộ dữ liệu tác giả sử dụng cơng thức tính như ở (Phụ lục 01) để tính tốn các biến giải thích và nhập dữ liệu vào phần mềm Eviews 6 trên Windows. Các dạng dữ liệu phổ biến: dữ liệu theo chuỗi thời gian, dữ liệu chéo theo không gian và dữ liệu bảng. Tác giả sử dụng dữ liệu bảng (panel data) hay còn gọi là dữ liệu kết hợp các dữ liệu theo chuỗi thời gian và không gian, tiêu biểu cho sự biến thiên theo thời gian của các đơn vị chéo theo không gian, liên quan đến toán học và thống kê khá phức tạp. Tuy nhiên, tác giả chỉ nghiên cứu một phần then chốt cơ bản của dữ liệu bảng. Một số ưu điểm dữ liệu bảng: do kết hợp các chuỗi theo thời gian của các quan sát theo không gian, dữ liệu bảng cung cấp những dữ liệu có nhiều thơng tin hơn, đa dạng hơn, ít cộng tuyến hơn giữa các biến, nhiều bậc tự do và hiệu quả hơn nhưng khơng có nghĩa rằng khơng có vấn đề khi lập mơ hình dữ liệu bảng.
3.3. Phƣơng pháp kiểm định mơ hình:
Thứ nhất, kiểm định đa cộng tuyến (correlations) đây là một cách quan trọng khác để kiểm tra các biến là xem xét khả năng đa cộng tuyến tiềm ẩn, điều này được thực hiện bằng cách tạo ra ma trận tương quan giữa các biến giải thích với nhau. Cách nhận biết hiện tượng đa cộng tuyến dễ nhìn thấy các hệ số tương
quan giữa các biến gần bằng +/- 1 (bằng 1 là tương quan hồn tồn). Ngồi ra cần kiểm tra mơ hình có R2 rất cao và trị thống kê T (t-statistic) thấp, hoặc dấu của hệ số hồi quy khác với dấu kỳ vọng cũng là dấu hiệ dễ nhận ra hiện tượng đa cộng tuyến.
Thứ hai, tác giả kiểm định tự tương quan nhiễu (Durbin – Watson (d)): để kiểm
định hiện tượng tự tương quan bậc nhất đối với các biến độc lập cố định (không ngẫu nhiên).
εi,t = ρεi,t-1 + zi,t
với zi,t là biến độc lập và ρ hệ số tự tương quan.
Kết quả phù hợp thì giá trị d phải nằm trong khoảng từ 1 đến 3 là ít có hiện tượng tự tương quan bậc nhất. Tự tương quan bậc nhất ký hiệu là AR(1) nghĩa là sai số εt chỉ tương quan với εt-1 (sai số một kỳ trước đó).
Thứ ba, tác giả thực hiện hai kiểm định Likelihood và Hausman để xác định
được mơ hình nào phù hợp nhất khi sử dụng phương pháp OLS và LSDV (least square dummy variable) như trên, nếu không vi phạm các giả thiết ràng buộc, các kết quả phù hợp, tác giả sẽ tiến hành lựa chọn mơ hình theo tiêu chí R2 hiệu chỉnh cao, trị tuyệt đối thống kê T-statistic > giá trị bảng tra phân phối Student thì biến giải thích có ý nghĩa thống kê trong mơ hình, Pro (T-statistic)<α thì mơ hình phù hợp và chỉ số AIC và Schwarz thấp.
Khi ước lượng các mơ hình hồi quy dữ liệu bảng có nhiều cách tiếp cận khác nhau: các tiếp cận mơ hình hồi quy thơng thường (pooling regression), mơ hình tác động cố định (FEM), mơ hình tác động ngẫu nhiên (REM). Khi số liệu theo chuỗi thời gian lớn và số mẫu lớn thì hai phương pháp FEM và REM không khác biệt nhiều; khi mẫu lớn và thời gian ngắn thì mơ hình FEM phù hợp hơn. Tác giả sử dụng kiểm định Hausman và Likelihood Ratio để quyết định lựa chọn mơ hình FEM hay REM hay OLS thơng thường.
K
Trong chương này tác giả trình bày phương pháp nghiên cứu: dữ liệu, mơ hình, biến và các giả thiết nghiên cứu, các giả thiết của phương pháp ước lượng OLS, LSDV (FEM), REM: kiểm định giả thiết hệ số hồi quy, kiểm định sự tự tương quan, sự phù hợp của mơ hình. Tác giả sử dụng phương pháp nghiên cứu định lượng như trên với mẫu 65 công ty niêm yết trên HOSE giai đoạn từ năm 2007 đến năm 2012. Biến đầu tư được đo lường bằng đầu tư thuần chia cho tài sản cố định hữu hình thuần, biến địn bẩy được đo lường bằng tổng nợ trên tổng tài sản và nợ dài hạn trên tổng tài sản. Ngồi ra tác giả cịn sử dụng một số biến khác để kiểm tra ảnh hưởng của chúng lên quyết định đầu tư của công ty như: dòng tiền, doanh thu và biến giả Q (cơ hội tăng trưởng).
CHƢƠ NG 4 : NỘI DUNG VÀ CÁC KẾT QUẢ NGHIÊN
CỨU
4.1. Phân tích sơ lƣợc cơ sở dữ liệu của các công ty niêm yết trên Sở GDCK TP.HCM (HOSE):
Mẫu nghiên cứu bao gồm 65 công ty niêm yết trên Sở giao dịch chứng khoán TP.HCM. Trong mẫu 65 cơng ty có: 14 cơng ty sản xuất – kinh doanh, 6 cơng ty bao bì nhựa, 1 cơng ty cảng dịch vụ/Logictics, 5 công ty cao su, 4 công ty dược phẩm/y tế, 2 công ty khống sản, 6 cơng ty năng lượng điện/khí/gas, 5 cơng ty ngành thép, 7 cơng ty thực phẩm, 2 công ty thương mại tổng hợp, 7 công ty thủy sản, 2 công ty vận tải, 4 công ty xây dựng – VLXD. Mẫu nghiên cứu xếp theo nhóm ngành: sản xuất chiếm tỷ trọng cao nhất 95%, ngành thương mại chiếm 3.5%, ngành dịch vụ chiếm 1.5%.