STT Nhân tố Mã hóa Đo lƣờng
1 Quy mô SIZE LNSIZE = Ln (Tổng tài sản)
2 Tăng trƣởng doanh thu SGROW SGROW = ((Doanh thut — Doanh thut-1)/ Doanh thut-1)*100% 3 Tỷ suất sinh lời trên
tổng tài sản
ROA ROA = (EBIT/Tổng tài
sản)*100% 4 Hệ số giá trị thị trƣờng
trên giá trị sổ sách
MB LnMB = Ln (Giá trị thị
trƣờng/ Giá trị sổ sách)*100%
5 Đòn bẩy LEV LEV = (Tổng nợ vay/ Tổng
tài sản)*100%
6 Dòng tiền CFO CFO = (Dòng tiền từ hoạt
động/ Tổng tài sản)*100%
(Nguồn: tác giả tổng hợp)
3.4 Phƣơng pháp nghiên cứu. 3.4.1 Chọn mẫu nghiên cứu: 3.4.1 Chọn mẫu nghiên cứu:
Đề tài sử dụng dữ liệu đƣợc thu thập từ các công ty BĐS niêm yết trên TTCK VN.
Các công ty BĐS niêm yết trên TTCK VN đƣợc chọn vào mẫu thỏa mãn các tiêu chí sau:
+ Có đ y đủ các thơng tin c n thiết về số liệu tài chính trên BCTC đặc biệt là các chỉ tiêu lợi nhuận của các DN này.
+ Các cổ phiếu đƣợc niêm yết liên tục từ năm 2014 đến năm 2018
Theo Tabachnick và Fidell (2001), trong nghiên cứu định lƣợng thì số mẫu cho hồi quy đa biến: n > 50+8*k (n: số mẫu, k: số biến độc lập). Nhƣ vậy kích
thƣớc mẫu nghiên cứu của bài luận văn này gồm 660 quan sát là phù hợp (660 > 98 ((=50+8*6).
3.4.2 Phƣơng pháp thu thập dữ liệu
Bài nghiên cứu sử dụng dữ liệu sơ cấp, dữ liệu thứ cấp đƣợc thu thập từ TTCK, BCTC hằng năm của các công ty BĐS niêm yết trên TTCK VN đƣợc công bố trên trang web www.cophieu68.vn hay www.cafef.vn
3.4.3 Phƣơng pháp xử lý dữ liệu
Dữ liệu đƣợc trình bày dạng bảng theo năm thể hiện số liệu của các công ty BĐS niêm yết trên TTCK VN.
Đ u tiên, tác giả thực hiện: thống kê mô tả để thấy đƣợc tổng quan về số liệu của các biến. Mỗi biến trong bảng thống kê bao gồm: tên biến, số quan sát, giá trị trung bình, sai số chuẩn, giá trị thấp nhất, giá trị cao nhất.
Tiếp theo tác giả sử dụng phƣơng pháp phân tích dữ liệu bảng với mơ hình hồi quy tuyến tính. Có 4 mơ hình hồi quy dùng để phân tích dữ liệu bảng là: OLS, REM, FEM, GMM. Ngồi mơ hình hồi quy kết hợp thơng thƣờng OLS, bài nghiên cứu cịn tiến hành hồi quy cả trên ba mơ hình đặc trƣng của dữ liệu bảng là FEM, REM, GMM để có đƣợc một kết quả chính xác, đáng tin cậy hơn. Sau đó tiến hành các kiểm định để lựa chọn mơ hình phù hợp nhất với nghiên cứu thực nghiệm ở điều kiện là các cơng ty BĐS niêm yết trên TTCK VN.
Mơ hình hồi quy gộp (OLS)
Υit = β1+ β2X2it + β3X3it + … + βkXkit + uit (1) Υit: Biến phụ thuộc của công ty thứ i trong năm t.
Xkit: Biến phụ độc lập thứ k của công ty thứ i trong năm t. β1: Hệ số tung độ gốc của mơ hình.
βk: Hệ số dốc của biến độc lập thứ k. uit: Sai số của công ty thứ i trong năm t.
Hệ số β chỉ có một hay khơng có sự khác biệt giữa các cá nhân. Mơ hình tác động cố định, mơ hình tác động ngẫu nhiên sẽ khắc phục các nhƣợc điểm của mơ hình này.
Mơ hình tác động cố định (FEM)
Υit = β1i+ β2X2it + β3X3it + … + βkXkit + uit (2) β1i: Hệ số tung độ gốc của cơng ty thứ i.
Mơ hình tác động ngẫu nhiên (REM)
Ý tƣởng cơ bản là bắt đ u bằng phƣơng trình (2), thay vì xem β1i là cố định, ta giả định đó là một biến ngẫu nhiên với một giá trị trung bình là β1 (khơng có ký hiệu i ở đây). Giá trị tung độ gốc cho một cơng ty riêng lẻ có thể đƣợc biểu thị là:
β1i = β1 + εii = 1, 2, …, N
Trong đó εi là số hạng sai số ngẫu nhiên với một giá trị trung bình bằng 0, phƣơng sai bằng σε2
Các cơng ty đó có một giá trị trung bình chung đối với tung độ gốc (β1), sự khác biệt cá nhân về giá trị tung độ gốc của từng công ty đƣợc phản ánh trong số hạng sai số εi.
Υit = β1+ β2X2it + β3X3it + … + βkXkit + εi + uit (3) Phƣơng pháp ƣớc lƣợng GMM
GMM là phƣơng pháp hiệu quả, ƣu việt hơn cả nên cũng khá phức tạp.
Để ƣớc lƣợng đƣợc hệ số β, c n một bộ L vector các biến công cụ, số lƣợng biến cơng cụ phải khơng ít hơn số biến giải thích trong mơ hình (L ≥ K).
Điều kiện để một biến đƣợc chọn là biến công cụ là nó khơng đƣợc tƣơng quan với ph n dƣ, điều này có nghĩa là:
( ( ))
Thay thế giá trị các biến công cụ bằng giá trị trung bình của mẫu là ý tƣởng chủ đạo của phƣơng pháp GMM :
( ( )) ∑ ( ) ( )
và đi tìm Vector β thỏa mãn phƣơng trình trên.
Khi số lƣợng điều kiện moment lớn hơn số biến trong mơ hình (L > K) thì phƣơng trình khơng thể xác định một nghiệm chính xác duy nhất (có nhiều nghiệm có thể thỏa mãn phƣơng trình). Khi đó mơ hình đƣợc gọi là overidentified. Trong trƣờng hợp đó, chúng ta phải thực hiện tính tốn lại nhằm xác định giá trị β làm cho điều kiện moment ( ( )) ―g n‖ bằng 0 nhất có thể, khái niệm ―g n‖ đƣợc
hiểu là khoảng cách với giá trị 0 là nhỏ nhất, khoảng cách đó đƣợc xác định nhƣ sau:
( ̂ ) ( ) ( )
Ma trận ngẫu nhiên, cân xứng không âm ̂ (kích thƣớc L x L) đƣợc gọi là ma trận trọng số vì nó thể hiện mức đóng góp của các điều kiện moment khác nhau vào khoảng cách J. Phƣơng pháp ƣớc lƣợng GMM sẽ xác định giá trị ƣớc lƣợng β để khoảng cách J là nhỏ nhất.
Tính chất của phƣơng pháp ƣớc lƣợng GMM: khi số lƣợng mẫu phù hợp giá trị β ƣớc lƣợng đƣợc sẽ vững, khi đó giá trị ƣớc lƣợng đƣợc sẽ càng g n với giá trị thực của nó. Ƣớc lƣợng GMM sẽ cho ra các giá trị ƣớc lƣợng tuân theo phân phối chuẩn, đây là thuộc tính rất quan trọng vì đó là cơ sở để chúng ta xây dựng giá trị dự đoán các độ tin cậy và thực hiện các kiểm định khác. Phƣơng pháp GMM cũng cho ra kết quả là các giá trị ƣớc lƣợng hiệu quả, nghĩa là giá trị phƣơng sai trong mơ hình ƣớc lƣợng là nhỏ nhất.
3.5 Các kiểm định trong mơ hình dữ liệu bảng 3.5.1 Kiểm định lựa chọn mơ hình tốt nhất
Kiểm định Breuch – Pagan LM
Kiểm định trên nhằm lựa chọn mơ hình OLS hay REM phù hợp cho hồi quy dữ liệu mẫu.
H0: mơ hình OLS thì thích hợp H1: mơ hình REM thì thích hợp
Nếu p-value của kiểm định Breuch – Pagan LM có ý nghĩa thống kê cho phép kết luận giả thuyết H0 bị bác bỏ, khi đó ta kết luận là REM phù hợp hơn để sử dụng. Ngƣợc lại, OLS phù hợp cho mơ hình nếu chấp nhận giả thuyết H0.
Kiểm định sự tồn tại ảnh hƣởng cố định
Kiểm định trên nhằm lựa chọn mơ hình PM hay FEM phù hợp cho bộ dữ liệu của mẫu.
H0: mơ hình PM thì thích hợp H1: mơ hình FEM thì thích hợp
Nếu p-value của kiểm định sự tồn tại ảnh hƣởng cố định có ý nghĩa thống kê cho phép kết luận giả thuyết H0 bị bác bỏ, khi đó ta kết luận là FEM phù hợp hơn để sử dụng. Ngƣợc lại, PM phù hợp cho mơ hình nếu chấp nhận giả thuyết H0.
Kiểm định Hausman
Kiểm định trên nhằm lựa chọn mơ hình FEM hay REM phù hợp cho hồi quy dữ liệu mẫu, dựa trên giả định khơng sự tƣơng quan giữa biến giải thích và yếu tố ngẫu nhiên εi vì tƣơng quan là nguyên nhân tạo nên sự khác biệt giữa FEM, REM.
H0: mơ hình REM thì thích hợp H1: mơ hình FEM thì thích hợp
Nếu p-value của kiểm định Hausman có ý nghĩa thống kê cho phép kết luận giả thuyết H0 bị bác bỏ, khi đó ta kết luận là FEM phù hợp hơn để sử dụng. Ngƣợc lại, REM phù hợp cho mơ hình nếu chấp nhận giả thuyết H0.
3.5.2 Kiểm định hiện tƣợng đa cộng tuyến
Trong luận văn này tác giả sử dụng 2 tiêu chuẩn sau:
Tồn tại tƣơng quan cặp cao giữa các biến độc lập
tƣơng quan giữa hai biến độc lập lớn hơn 0.8 thì mơ hình xảy ra hiện tƣợng đa cộng tuyến. Tuy nhiên tiêu chuẩn này thƣờng khơng chính xác, nên để có kết luận kiểm định chính xác hơn, ngƣời ta sử dụng thêm tiêu chuẩn nhân tử phóng đại phƣơng sai.
Nhân tử phóng đại phƣơng sai (VIF: Variance Inflation Factor)
Với Rj2 là hệ số xác định trong hồi quy phụ biến độc lập Xj theo các biến độc lập còn lại.
Quy tắc kinh nghiệm: VIFj > 10 Rj2> 0,9 có hiện tƣợng đa cộng tuyến cao giữa biến độc lập Xj, các biến độc lập còn lại.
3.5.3 Kiểm định hiện tƣợng tự tƣơng quan
Tự tƣơng quan là hiện tƣợng có sự tƣơng quan giữa các quan sát trong cùng bảng số liệu
Hiện tƣợng này thƣờng xảy ra đối với dữ liệu chuỗi thời gian. Vì tự tƣơng quan thƣờng xảy ra với số liệu theo thời gian nên phƣơng trình hồi quy là :
Yt = 1 + β2X2t + β3X3t + …+ βkXkt + Ut
Nếu sai số Ut chỉ tƣơng quan với Ut-1 (sai số một kỳ trƣớc đó) thì ta có hiện tƣợng tự tương quan bậc nhất, ký hiệu là AR(1)
Phƣơng trình tự tƣơng quan bậc nhất nhƣ sau :
ρ: hệ số tự tƣơng quan
εt : Sai số ngẫu nhiên khơng cịn tự tƣơng quan
Nếu Ut tƣơng quan với m kỳ trƣớc đó thì ta có hiện tƣợng tự tương quan bậc m, ký hiệu là AR(m) : t t t U U 1 1 1 ( i, j| ) 0 Cov U U X t m t m t t t U U U U 1 12 2...
Nguyên nhân của tự tƣơng quan: do việc xử lý số liệu, do việc nội suy số liệu, do lập mơ hình.
Hậu quả của tự tƣơng quan: Các hệ số hồi quy ƣớc lƣợng đƣợc khơng cịn tính BLUE. Các ƣớc lƣợng tính đƣợc bằng OLS khơng cịn là ƣớc lƣợng hiệu quả.
Các phƣơng pháp kiểm tra hiện tƣợng tự tƣơng quan:
Kiểm định tự tƣơng quan với dữ liệu bảng: Dùng kiểm định Wooldridge (2002), Drukker (2003) đặt giả thuyết nhƣ sau:
Giả thuyết H0: Mơ hình khơng có hiện tƣợng tự tƣơng quan bậc 1 Giả thuyết H1: Mơ hình có hiện tƣợng tự tƣơng quan bậc 1
Với giá trị Prob>F >5% của kiểm định Wooldridge nhƣ trên, ta kết luận chấp nhận giả thuyết H0, có nghĩa là khơng có hiện tƣợng tự tƣơng quan, ngƣợc lại.
―Đối với dữ liệu thời gian: kiểm định Durbin-Watson, kiểm định Breusch- Godfrey‖.
3.5.4 Kiểm định hiện tƣợng phƣơng sai sai số thay đổi
Trong quá trình hồi quy, tác giả sẽ tập trung xem xét lại bản chất của vấn đề nghiên cứu, đồ thị ph n dƣ, dùng một số kiểm định Goldfeld-Quandt, Breusch- Pagan, White, Park trên OLS, phƣơng pháp Greene (2000) trên dữ liệu bảng để kiểm tra xem mơ hình đã vi phạm giả thuyết hồi quy - hiện tƣợng phƣơng sai thay đổi.
KẾT LUẬN CHƢƠNG 3
Chƣơng 3 tác giả trình bày quy trình nghiên cứu, sau đó đi sâu vào từng bƣớc nghiên cứu bao gồm xác định vấn đề nghiên cứu, xây dựng mơ hình, giả thuyết nghiên cứu, phƣơng pháp thu thập số liệu cách lấy dữ liệu của các biến, các phƣơng pháp phân tích dữ liệu, kiểm định mơ hình. Kết quả nghiên cứu sẽ đƣợc trình bày ở chƣơng tiếp theo của đề tài.
CHƢƠNG 4: KẾT QUẢ NGHIÊN CỨU, BÀN LUẬN
Chƣơng 3 đã trình bày về mơ hình nghiên cứu, phƣơng pháp, cách đo lƣờng các biến. Tiếp theo, đề tài sẽ đƣa ra kết quả kiểm định thống kê trả lời câu hỏi về mối quan hệ tuyến tính của biến quan sát giải thích cho biến độc lập. Bên cạnh đó xem xét độ lớn, hƣớng ảnh hƣởng của các biến đối với biến phụ thuộc.
4.1 Phân tích thống kê mơ tả giữa các biến trong mơ hình
Nghiên cứu này thu thập dữ liệu từ báo cáo tài chính, báo cáo hợp nhất đã đƣợc kiểm toán của các doanh nghiệp bất động sản niêm yết trên thị trƣờng chứng khoán Việt Nam, cụ thể, tác giả thu thập số liệu từ 132 doanh nghiệp (trình bày ở phụ lục 1 của nghiên cứu) trong 5 năm, từ năm 2014 đến năm 2018. Kết quả thống kê mô tả ở bảng 4.1 dƣới đây: