3.4.1. Phương pháp thu thập dữ liệu
Nghiên cứu sử dụng dữ liệu thứ cấp giai đoạn 2009 – 2013 để phân tích mô hình tác động của cơ cấu vốn đến hiệu quả kinh doanh của các doanh nghiệp ngành kinh doanh bất động sản niêm yết trên Sở giao dịch chứng khoán thành phố Hồ Chí Minh .
Các dữ liệu tài chính sử dụng cho nghiên cứu được thu thập từ các trang web tài chính và từ chính các báo cáo tài chính của các doanh nghiệp được lựa chọn. Sau khi xem xét dữ liệu của các doanh nghiệp niêm yết trên sở chứng khoán thành phố Hồ Chí Minh (HOSE) chỉ có 36 doanh nghiệp thuộc nhóm ngành kinh doanh bất động sản thỏa mãn đầy đủ dữ liệu cho giai đoạn 2009 - 2013.
Ngoài ra tác giả sử dụng các báo cáo nghiên cứu của những nhà nghiên cứu trước về đề tài này, các báo cáo ngành kinh doanh bất động sản niên yết trên Sở giao dịch chứng khoán TP. HCM; các trang web chuyên ngành tài chính cũng được sử dụng để thu thập thông tin cần thiết cho nghiên cứu.
Dữ liệu trong nghiên cứu này tạo thành dữ liệu bảng (panel data) là dữ liệu chéo theo chuỗi thời gian (cross sectional time-series data). Cấu trúc dữ liệu bảng được kết hợp từ 2 thành phần: thành phần dữ liệu chéo (cross – section) và thành phần dữ liệu theo chuỗi thời gian (time series). Việc kết hợp 2 loại dữ liệu có nhiều lợi thế và thuận lợi trong phân tích, đặc biệt khi muốn quan sát, phân tích sự biến động của các nhóm đối tượng nghiên cứu sau các biến cố hay theo thời gian cũng như phân tích sự khác biệt giữa các giữa các nhóm đối tượng nghiên cứu. Theo Gujarati (2004), dữ liệu bảng có những ưu điểm sau:
+ Vì dữ liệu bảng liên quan đến các cá nhân, doanh nghiệp, đất nước, v.v… theo thời gian, nên nhất định phải có tính dị biệt (không đồng nhất) trong các đơn vị này. Kỹ thuật ước lượng dữ liệu bảng có thể chính thức xem xét đến tính dị biệt đó bằng cách xem xét các biến số có tính đặc thù theo từng cá nhân.
+ Thông qua kết hợp các chuỗi theo thời gian của các quan sát theo không gian, dữ liệu bảng cung cấp những dữ liệu có nhiều thông tin hơn, đa dạng hơn, ít cộng tuyến hơn giữa các biến số, nhiều bậc tự do hơn và hiệu quả hơn.
+ Dữ liệu bảng có thể phát hiện và đo lường tốt hơn những ảnh hưởng mà không thể quan sát trong dữ liệu chuỗi thời gian thuần túy hay dữ liệu chéo theo không gian thuần túy.
+ Dữ liệu bảng giúp ta nghiên cứu những mô hình hành vi phức tạp hơn. Ví dụ, các hiện tượng như lợi thế kinh tế theo qui mô và thay đổi kỹ thuật có thể được xem xét thông qua dữ liệu bảng tốt hơn so với dữ liệu theo chuỗi thời gian thuần túy hay theo không gian thuần túy.
+ Bằng cách thu thập những số liệu có sẵn cho vài nghìn đơn vị, dữ liệu bảng có thể tối thiểu hóa sự thiên lệch có thể xảy ra nếu ta tổng hợp các cá nhân hay các doanh nghiệp thành số liệu tổng.
3.4.2. Mô tả dữ liệu nghiên cứu
Như đã trình bày ở những mục trên, với bộ dữ liệu gồm 36 doanh nghiệp ngành kinh doanh bất động sản được thu thập trong thời gian 05 năm (2009 - 2013), tổng mẫu thu được là 180 quan sát (36 doanh nghiệp x 5 năm = 180 quan sát).
Thu thập dữ liệu về giá cổ phiếu, thu nhập trên mỗi cổ phiếu, chỉ số tỉ lệ cổ tức, chỉ số lạm phát, chỉ số lãi suất cho vay, chỉ số tốc độ tăng trưởng kinh tế như sau :
G: Tốc độ tăng tổng sản phẩm trong nước theo giá so sánh 1994 ( năm trước =100), đơn vị tính : % . Biến này được thu thập từ trang web cục thống kê gso.gov.vn .
INF: Tỷ lệ lạm phát theo giá so sánh 1994( năm trước =100), đơn vị tính : %, biến này được thu thập từ trang web tổng cục thống kê gso.gov.vn.
INT : Lãi suất cho vay, biến này được thu thập từ trang web cục thống kê gso.gov.vn .
DIV : Tỷ lệ cổ tức, biến này được thu thập từ trang web vietstock.vn
EPS : Thu nhập trên mỗi cổ phiếu, biến này được thu thập từ trang web vietstock.vn.
3.4.3 Phương pháp phân tích dữ liệu nghiên cứu và ước lượng mô hình nghiên cứu.
Trong quá trình nghiên cứu và thực hiện đề tài, tác giả vận dụng một số phương pháp nghiên cứu khoa học sau:
Phương pháp thống kê mô tả: phương pháp này liên quan đến việc thu thập thông tin, đến tình trạng hiện tại của đối tượng nghiên cứu, sắp xếp mô tả các dữ kiện, tính toán các chỉ tiêu, giải thích các kết quả đạt được, nhằm nêu bật mô hình các nhân tố tác động đến giá cổ phiếu.
Phương pháp phân tích bằng mô hình kinh tế lượng: sử dụng mô hình kinh tế lượng nghiên cứu các yếu tố chi phối đến giá cổ phiếu thị trường chứng khoán. Phương pháp nghiên cứu chủ yếu là phương pháp định tính, phương pháp định lượng, thống kê, thông qua công cụ phần mềm Stata 12 dựa trên bảng tính Excel.
Các vấn đề trong hồi quy dữ liệu bảng trong phân tích cơ bản thường có các mô hình chính sau: POOL, FEM, REM sau đó khi cần phân tích từng bước và sâu hơn người ta mới quan tâm đến các mô hình SUR, IVs,…Việc sử dụng các mô hình này phần nào đã giải thích về việc dùng các kiểm định thống kê.
Mô hình POOL thực chất là mô hình OLS bình thường, điều này xảy ra khi chúng ta sử dụng dữ liệu bảng như một mảng dữ liệu bình thường không phân biệt theo năm và như vậy khi hồi quy mô hình POOL chính là mô hình OLS. Điều này cho thấy nếu như mô hình POOL thực sự phù hợp với dữ liệu hơn 2 mô hình sau thì việc chúng ta sử dụng phân tích bằng mô hình FEM, REM không còn nhiều ý nghĩa. Điều đó dẫn đến trường hợp lúc này chúng ta chỉ cần xem xét mô hình Pool cho dữ liệu có được và thực hiện các kiểm định bình thường. Đây là một cách giải thích cho sự thiếu vắng các kiểm định trong các nghiên cứu về dữ liệu bảng khi mà các nhà nghiên cứu cần tập trung vào các mô hình FEM, REM để phân tích.
Với phương pháp ước lượng dữ liệu bảng, mô hình có thể viết lại thành mô hình hồi quy gộp (pooled model) như sau:
Yit = β0 + β’Xit + εit
Trong đó Yit là biến phụ thuộc và Xit là các biến giải thích trong mô hình. Mô hình hồi quy gộp chỉ đơn giản là phương pháp ước lượng bình phương nhỏ nhất
(POOLED MODEL). Tuy nhiên, phương pháp POOLED MODEL này sẽ thích hợp nếu không có sự tồn tại các yếu tố riêng biệt (từng doanh nghiệp) và yếu tố thời gian. Theo Gujarati (2004), việc sử dụng phương pháp POOLED MODEL bỏ qua bình diện không gian và thời gian của dữ liệu kết hợp, kết quả ước lượng có thể sẽ bị thiên lệch. Vì thế phương pháp ước lượng tác động cố định (FEM) và tác động ngẫu nhiên (REM) sẽ phù hợp hơn vì không bỏ qua các yếu tố thời gian và yếu tố riêng biệt.
Mô hình FEM cho rằng mỗi thực thể (doanh nghiệp) đều có những đặc điểm riêng biệt, có thể ảnh hưởng đến các biến giải thích, có sự tương quan giữa phần dư của mỗi thực thể (có chứa các đặc điểm riêng) với các biến giải thích. FEM có thể kiểm soát và tách ảnh hưởng của các đặc điểm riêng biệt (không đổi theo thời gian) này ra khỏi các biến giải thích để chúng ta có thể ước lượng những ảnh hưởng thực (real effects) của 47 biến giải thích lên biến phụ thuộc. Các đặc điểm riêng biệt (không đổi theo thời gian) này là đơn nhất đối với một thực thể và không tương quan với đặc điểm của các thực thể khác. Mô hình FEM có dạng như sau:
Yit = αi + β’Xit + εit
Trong đó αi cho thấy rằng các tung độ gốc của các công ty có thể khác nhau. Sự khác biệt có thể là do các đặc điểm riêng của từng công ty, như phong cách quản lý hay triết lý quản lý.
Không giống như mô hình FEM, mô hình REM xem đặc điểm riêng giữa các thực thể được giả sử là ngẫu nhiên và không tương quan đến các biến giải thích. REM xem các phần dư của mỗi thực thể (doanh nghiệp) là một biến giải thích mới. Mô hình REM có dạng như sau:
Yit = (α+ui)+ β’Xit + εit αi = (α+ui)
Trong đó ui là sai số ngẫu nhiên phản ánh sự khác nhau của các cá nhân (doanh nghiệp) có giá trị trung bình bằng 0.
Mô hình REM sử dụng phương pháp ước lượng bình phương tối thiểu tổng quát (GLS). Phương pháp ước lượng này cho phép xem xét đến cơ cấu tương quan của phần dư trong mô hình REM.
Để lựa chọn mô hình ước lượng nào là phù hợp cho nghiên cứu, tác giả sử dụng kiểm định Hausman với giả thuyết H0: không có sự tương quan giữa các sai số đặc trưng giữa các đối tượng với các biến giải thích trong mô hình. Nếu giá trị p- value < 0.05, bác bỏ H0. Nếu bác bỏ H0, dẫn đến kết luận ước lượng REM không phù hợp, nên sử dụng ước lượng FEM và ngược lại.
Trong trường hợp nếu mô hình tác động ngẫu nhiên (REM) được lựa chọn, tác giả tiếp tục kiểm tra tính hợp lệ của mô hình tác động ngẫu nhiên bằng cách áp dụng thử nghiệm Breusch Pagan Lagrange. Nếu kết quả thử nghiệm này bác bỏ giả thuyết H0: “Không có tác động ngẫu nhiên” thì mô hình tác động ngẫu nhiên được lựa chọn và ngược lại.
Với các mô hình dữ liệu bảng, mô hình được ước lượng có giả định là phương sai của phần dư (residuals) là đồng đều. Khi tồn tại phương sai thay đổi trong mô hình thì kết quả ước lượng sẽ không còn hiệu quả vì thế cần khắc phục hiện tượng này. Hơn nữa, vấn đề tương quan chuỗi cũng thường gặp trong dữ liệu bảng, vì thế kết quả ước lượng sẽ không còn hiệu quả.
Tóm tắt chương 3:
Chương này tác giả trình bày quy trình thực hiện các phương pháp nghiên cứu qua 2 giai đoạn nghiên cứu sơ bộ và nghiên cứu chính thức. Trong đó, nghiên cứu nghiên cứu sơ bộ là một nghiên cứu định tính sử dụng phương pháp thảo luận nhóm tập trung. Kết quả nghiên cứu định tính khẳng định các yếu tố tác động đến giá cổ phiếu theo mô hình lý thuyết đề xuất, đó là: Giá cổ phiếu (PS); Tỷ lệ cổ tức (DIV); Thu nhập trên mỗi cổ phiếu (EPS); Lãi suất cho vay (INT); Tỷ lệ lạm phát (INF); Tốc độ tăng trưởng kinh tế (G); Quy mô của công ty (Size). Nghiên cứu chính thức là một nghiên cứu định lượng trình bày phương pháp thu thập dữ liệu, mô tả dữ liệu và phương pháp và quy trình phân tích dữ liệu để kiểm định mô hình và các giả thuyết nghiên cứu.
CHƯƠNG 4
PHÂN TÍCH DỮ LIỆU VÀ KẾT QUẢ NGHIÊN CỨU
4.1 THÔNG TIN VỀ CÁC BIẾN NGHIÊN CỨU 4.1.1 Thông tin về các biến
Như đã trình bày ở những mục trên, Biến phụ thuộc là Giá Cổ Phiếu (PS) và các biến giải thích bao gồm: (DIV) Tỷ lệ cổ tức, (EPS) Thu nhập trên mỗi cổ phiếu, ( INT) Lãi suất cho vay, ( INF) Tỷ lệ lạm phát, (G) Tốc độ tăng trưởng kinh tế và (Size) Quy mô của công ty, được thể hiện qua bảng thống kê mô tả sau đây:
Bảng 4.1: Thông tin về các biến
PS DIV EPS G INF INT SIZE
Trung bình 16,21732 14,39004 1.692,894 6,39 12,57939 0,151051 27,95455
Lớn nhất 64,5 130 9.365,8 6,89 19,89 0,19 31,65324
Bé nhất 0,9 0 -4.817 5,31 6,52 0,12 25,01298
Nguồn: Kết quả từ phần mềm Stata 12
Kết quả thống kê mô tả ở bảng 4.1 cho thấy có sự chênh lệch khá lớn giữa giá trị giá cổ phiếu của các công ty bất động sản. Do giá trị cổ phiếu có sự chênh lệch nên điều dễ hiểu khi mà tỷ lệ cổ tức DIV và Thu nhập trên mỗi cổ phiểu EPS của các công ty cũng có sự chênh lệch rõ rệt.
4.1.2 Ma trận tương quan
Bảng 4.2 Ma trận tương quan
PS DIV EPS G INF INT SIZE
PS 1 DIV 0,339 1 EPS 0,563 0,596 1 G 0,092 -0,086 0,011 1 INF -0,201 -0,095 -0,080 -0,535 1 INT -0,148 -0,268 -0,175 0,675 0,202 1 SIZE 0,393 0,116 0,038 0,193 -0,057 0,178 1
Ma trận hệ số tương quan chỉ ra mối quan hệ hai chiều (tương quan giữa từng cặp biến, hệ số tương quan mang dấu (-) cho thấy tồn tại mối tương quan ngược chiều và ngược lại hệ số tương quan mang dấu (+) cho thấy tồn tại mối tương quan cùng chiều giữa hai cặp biến.
Kết quả cho thấy các biến DIV, EPS, G và SIZE có tương quan cùng chiều với biến PS (hệ số tương quan mang dấu +); và các biến INF, INT đều có quan hệ ngược chiều với PS. Tuy nhiên với mục đích tìm ra mỗi quan hệ nhân quả giữa các biến độc lập (tác động của DIV, EPS, G, INF, INT, Size lên biến PS) tác giả tiến hành thực hiện hồi quy để xem xét mối quan hệ này.
4.2 PHÂN TÍCH HỒI QUY
4.2.1Phương pháp POOLED MODEL
Bảng 4.3 Ước lượng Pooled model
Biến độc lập Hệ số hồi quy Độ lệch chuẩn Giá trị t Prob.
EPS 0,0031 0,0004 7,79 0,000 G 5,0501 3,9748 1,27 0,206 INTT -148,9657 77,3633 -1,93 0,056 SIZE 3,7849 0,5365 7,05 0,000 INF 0,1102 0,3054 0,36 0,719 DIV -0,0625 0,0450 -1,39 0,166 Cons -105,0283 22,9562 -4,58 0,000 Số quan sát 179 R2 0,4937 Giá trị F 27,95
Nguồn: Kết quả từ phần mềm Stata 12
Kết quả ước lượng pooled model cho thấy hệ số R2 = 0,4937; đồng thời giá trị thống kê F = 27,95 có ý nghĩa thống kê ở mức 1%. Điều đó cho thấy ước lượng Pooled model có thể là một ước lượng phù hợp.
4.2.2 Phương pháp tác động cố định (FEM)
Sau khi tiến hành chạy phương pháp Pooled Model tác giả tiến hành chạy phương pháp tác động cố định Fixed effect (FEM), sau đó tiến hành kiểm định về sự khác nhau giữa hệ số chặn của các công ty.
Bảng 4.4 Phương pháp tác động cố định (FEM)
Biến độc lập Hệ số hồi quy Độ lệch chuẩn Thống kê t Prob.
EPS 0,0026 0,0004 5,77 0,000 G 3,9934 3,2265 1,24 0,218 INTT -154,0565 65,7371 -2,34 0,021 SIZE 7,0172 2,2531 3,11 0,002 INF 0,1185 0,2440 0,49 0,628 DIV -0,0181 0,0439 0,41 0,681 Cons -188,2975 60,1496 -3,13 0,002 Số quan sát 179 R2 0,5217 Giá trị F 24,91
Nguồn: Kết quả từ phần mềm Stata 12
Kết quả thống kê F (6.137) = 24,91 có mức ý nghĩa thống kê 1% cho thấy mô hình có ý nghĩa thống kê tức là có sự khác biệt giữa các đối tượng (công ty).
Sau khi chạy 2 phương pháp POOLED MODEL và Fixed effect tác giả tiến hành kiểm định hệ số chặn cho FEM:
Bảng 4.5 Kiểm định hệ số chặn
Effects Test Statistic d.f. Prob.
Cross-section F 4,8803 (35,137) 0,0000
Cross-section Chi-square 144,9027 35 0,0000
Kết quả cho thấy với giá trị chi bình phương và giá trị p-value bằng 0,000 nhỏ hơn 0,05 cho thấy có sự khác biệt giữa hệ số chặn trong mô hình cũng như của các công ty. Do vậy mô hình POOLED MODEL không phù hợp để phân tích mục tiêu của đề tài.
4.2.3 Phương pháp tác động ngẫu nhiên (REM)
Tác giả tiếp tục chạy phương pháp Random effect:
Bảng 4.6 Phương pháp tác động ngẫu nhiên (REM)
Biến độc lập Hệ số hồi quy
Độ lệch
chuẩn Thống kê t Prob.
EPS 0,0029 0,004 7,26 0,000 G 4,6068 3,1294 1,47 0,141 INTT -136,7676 61,7671 -2,21 0,027 SIZE 4,0550 0,8466 4,79 0,000 INF 0,0882 0,2374 0,37 0,710 DIV -0,0094 0,0411 -0,23 0,819 Cons -111,6986 26,1034 -4,28 0,000 Số quan sát 179 R2 0,5149 Wald-Chi bình phương 176,55
Nguồn: Kết quả từ phần mềm Stata 12
Kết quả ước lượng theo phương pháp tác động ngẫu nhiên cũng cho giá trị Wald – chi bình phương là 176,55 và mức ý nghĩa 1% .
4.2.4 Kiểm định ước lượng
4.2.4.1 Kiểm định Hausman
Sau khi chạy phương pháp Random effect tác giả sử dụng kiểm định Hausman để lựa chọn phương pháp phù hợp (fixed effect hay random effect cho việc phân tích hồi quy).
Với : Chi bình phương = ( b-B)’ [(Vb – VB)ˆ(-1)] (b-B) = 4,19
Prob>Chi2 = 0,5028
Với giá trị p-value lớn hơn 0.05 cho thấy phương pháp phù hợp là phương pháp Random effect. Tác giả tiếp tục kiểm tra tính hợp lệ của phương pháp tác động ngẫu nhiên bằng cách áp dụng thử nghiệm Breusch Pagan Lagrange
Với Ho : “không có tác động ngẫu nhiên” Và (Var U) = 0
Hệ số Var Sqrt(Var)