Tác giả đã sử dụng nguồn dữ liệu để phân tích là các báo cáo tài chính đã đƣợc kiểm toán của 150 công ty đƣợc niêm yết trên Sở giao dịch chứng khoán thành phố Hồ Chí Minh (HSX) và Sở giao dịch chứng khoán Hà Nội (HNX) trong giai đoạn 2008 – 2014. Nguồn dữ liệu là các Báo cáo tài chính hợp nhất hằng năm đã đƣợc kiểm toán gồm Bảng cân đối kế toán, Bảng Báo cáo kết quả hoạt động kinh doanh, Báo cáo lƣu chuyển tiền tệ và Bảng thuyết minh báo cáo tài chính. Các dữ
liệu đƣợc thu thập chủ yếu từ website: http://www.hsx.vn, http://www.hnx.vn,
http://vietstock.vn, đó là một trong những nguồn dữ liệu thứ cấp đáng tin cậy và đƣợc sử dụng rộng rãi nhất hiện nay. Số liệu đƣợc lấy có đơn vị đến triệu đồng. Vì biến đầu tƣ phụ thuộc vào dữ liệu của các biến độc lập năm trƣớc đó nên thực sự 150 công ty này phải hoạt động liên tục và có báo cáo tài chính cũng nhƣ dữ liệu đóng cửa của ngày giao dịch cuối cùng từ năm 2007. Tác giả đã loại trừ những công ty bảo hiểm, tài chính, ngân hàng, bởi lẽ việc xử lý kế toán về lợi nhuận và doanh thu của những công ty này có những đặc thù riêng; những quan sát không có đầy đủ thông tin liên quan đến giá thị trƣờng hằng năm của mỗi doanh nghiệp và thiếu dữ liệu tài chính cho việc xây dựng các biến.
Dữ liệu đƣợc sắp xếp theo hai chiều: năm, công ty và nhân tố. Để phù hợp với phƣơng pháp hồi quy, dữ liệu đƣợc sắp xếp nhƣ sau: các biến đƣợc sắp xếp theo hàng ngang, hàng dọc là các dữ liệu 7 năm của 150 doanh nghiệp đƣợc thể hiện trên 7 dòng (nhƣ vậy có tất cả 150 x 7 = 1050 dòng). Dây là dữ liệu dạng bảng có cân xứng (Balanced Panel).
Bảng 3.2. Thống kê mô tả biến và phân loại theo ngành. STT Tên nhóm ngành Mã chứng khoán Số lƣợng 1 Công nghiệp TBX, SD5, PMS, QNC, DAC, VCG, C92, VE1, SDC, NHC, BT6, CCM, VTS, SDN, HT1, HLY, SCJ, S99, CII, SJC, SD4, DC4, BCC, MEC, TV4, VTO, L10, S12, BTS, B82, PJT, VC3, SDY, L43, HUT, LUT, VC5, MCO, SVN, VNE, TJC, SD2, THB, DXV, SJE, BHT, SJC, BHT, SIC, HU3, DIC, VE9, C47, VFR, V21, CDC, LBM,KKC, HGC
59
2 Công nghệ viễn
thông SGT, FPT, SRA 3
3 Cao su, nhựa DPR, TRC, HRC, DRC, NTP 5
4 Bất động sản KBC, VIC, HAG, SJS, SZL, NTL, SDA, RCL, HDC, LCG, D11 11
5 Dƣợc phẩm - y tế - hóa chất
DHG, IMP, DMA, TRA, TSC, DCL, DHT, JVC, OPC, MKV,
VMD 11
6 Dich vụ tiêu dùng
PET, EBS, OCH, DAE, SGD, CTC, HEV, PAN, TCM, HBE,
TPH, RIC 12 7 Dịch vụ tiện ích HJS, KHP, UIC 3 8 Dịch vụ - du lịch SGH, TCT 2 9 Dầu khí DPM, PVC, PVC, PVT, PVS 5 10 Chế biến thực phẩm SAF, VHC 2 11 Giáo dục BST 1 12 Hàng tiêu dùng ACL, SCD, NPS, BHS, TNG, VTL, NSC, HHC, SGC, VNM 10
13 Khoáng sản BMC, KSH, TC6 3 14 Năng lƣợng
điện, khí, ga VSH, SFC, PPC, TYA, LGC 5
15 Nguyên vật liệu BMP, CAP, HAI, SMC, HC, THT, TKU, NKG, SPP, LCM 10
16
Sản xuất - kinh doanh, thƣơng
mại
PAC, HPG, VBH, SSC, SVI 5
17 Vận tải, kho bãi VSC, TMS, DXP 3
TỔNG CỘNG 150
(Nguồn: Mẫu từ các công ty niêm yết trên thị trường chứng khoán Việt Nam)
3.3. Phƣơng pháp nghiên cứu
Mô hình nghiên cứu của bài sử dụng dữ liệu bảng (panel data) đƣợc chia hồi quy theo 3 cách: pooling, random effect (hiệu ứng ngẫu nhiên) và fixed effect (hiệu ứng cố định). Để tìm hiểu xem phƣơng pháp hồi quy nào là phù hợp nhất trong ba phƣơng pháp trên, tôi sử dụng hai kiểm định là Lagrangian Mutiplier (LM test, Breusch và Pagan 1980) và kiểm định Hausman (Hausman, 1978).
Lý giải một cách rõ ràng cho phƣơng pháp định lƣợng này nhằm kiểm tra sự tác động của đòn bẩy lên đầu tƣ theo mô hình, bài nghiên cứu sử dụng dữ liệu dạng bảng (panel data). Theo Baltagi dữ liệu dạng bảng có ƣu điểm hơn các dữ liệu theo chuỗi thời gian và không gian vì:
Dữ liệu dạng bảng có liên quan đến doanh nghiệp, vùng miền, vv…
theo thời gian nhất định có tính dị biệt (nghĩa là không đồng nhất) trong các dữ liệu này. Kỹ thuật ƣớc lƣợng dữ liệu bảng có thể chính thức xem xét đến tính dị biệt đó bằng cách xem xét các biến số đó có tính chất đặc thù theo từng doanh nghiệp, vùng miền…
Thông qua kết hợp các chuỗi theo thời gian của các quan sát theo
không gian, dữ liệu bảng cung cấp những dữ liệu có nhiều thông tin hơn, đa dạng hơn, ít đa cộng tuyến hơn giữa các biến số, nhiều bậc tự do hơn và hiệu quả hơn.
Dữ liệu bảng có thể phát hiện và đo lƣờng tốt hơn những ảnh hƣởng mà không thể quan sát trong chuỗi dữ liệu thời gian thuần túy hay dữ liệu chéo theo không gian thuần túy.
Cuối cùng, bằng cách thu thập dữ liệu có sẵn của vài nghìn đơn vị, dữ
liệu bảng có thể tối thiểu hóa sự chênh lệch có thể xảy ra nếu ta tổng hợp các doanh nghiệp thành số liệu tổng.
Đối với mô hình tác động ngẫu nhiên, phƣơng pháp nhân tử Lagrange (LM) với kiểm định Breusch-Pagan đƣợc sử dụng để kiểm chứng tính phù hợp của ƣớc
lƣợng. Theo đó giả thuyết Ho là tác động riêng lẻ không quan sát đƣợc uit = 0. Bác
bỏ giả thuyết Ho là tác động riêng lẻ không quan sát đƣợc uit ≠ 0 và phù hợp với mô
hình tác động ngẫu nhiên.
Để lựa chọn giữa hai mô hình tác động ngẫu nhiên và tác động cố định, nhiều nhà kinh tế học đã sử dụng nhiều tiêu chí nhƣ sau:
Nếu tác động riêng lẻ không quan sát đƣợc uit là có tƣơng quan với
một hay nhiều biến độc lập trong mô hình thì mô hình đúng là mô hình tác động cố định
Nếu trƣờng hợp không có tƣơng quan thì mô hình tác động ngẫu
nhiên phù hợp hơn. Trong trƣờng hợp này, chúng ta có thể sử dụng kiểm định Hausman để kiểm định vấn đề các tác động riêng lẻ không
quan sát đƣợc uit có tƣơng quan với một hoặc một số biến giải thích.
Gỉa thuyết Ho là không có tƣơng quan, mô hình tác động ngẫu nhiên là phù hợp. Bác bỏ giả thuyết Ho là có tƣơng quan, mô hình tác động cố định là phù hợp.
Ngoài phƣơng pháp hồi quy trên, bài nghiên cứu thực hiện các kiểm định dƣới đây để giải quyết các vấn đề có thể ảnh hƣởng đến việc ƣớc lƣợng mô hình fix effect:
Kiểm định đa cộng tuyến: Hiện tƣợng đa cộng tuyến xảy ra khi các
biến độc lập có tƣơng quan cao với nhau. Bài nghiên cứu sẽ dùng cách quan sát hệ số tƣơng quan giữa các biến, đồng thời sử dụng nhân tử phóng đại phƣơng sai VIF để phát hiện hiện tƣợng này.
Kiểm định tự tƣơng quan: Nếu bỏ qua hiện tƣợng tự tƣơng quan thì các hệ số ƣớc lƣợng từ hồi quy vẫn không chệch nhƣng nó sẽ không còn hiệu quả nữa dẫn đến khả năng đƣa ra kết luận sai. Kiểm định Durbin - Watson đƣợc thiết kế để kiểm định giả thuyết không có hiện tƣợng tự tƣơng quan.
Kiểm định phƣơng sai thay đổi: khi xảy ra hiện tƣợng phƣơng sai
thay đổi thì các giá trị sai số chuẩn có đƣợc không còn phù hợp và do vậy bất kỳ kết luận nào cũng sẽ không còn đúng. Kiểm định White đƣợc dùng để kiểm định giả thuyết không có hiện tƣợng phƣơng sai thay đổi.
Phƣơng pháp hồi quy này áp dụng cho toàn mẫu, nhằm kiểm tra sự tác động của đòn bẩy tài chính lên quyết định đầu tƣ của 150 doanh nghiệp hoạt động liên tục trên sàn chứng khoán Việt Nam trong giai đoạn 2008 – 2014 theo các bƣớc sau:
Bƣớc 1: Thống kê mô tả dữ liệu theo từng biến đƣợc sử dụng trong mô hình Bƣớc 2: Xem xét sự tƣơng quan giữa các biến bằng ma trận hệ số tƣơng quan, sau đó hồi quy phƣơng trình (theo mô hình) cho toàn mẫu bằng cách sử dụng 3 phƣơng pháp hồi quy.
Bƣớc 3: Sử dụng 2 phƣơng pháp kiểm định Lagrangian Multiplier (LM) (Breusch và Pagan, 1980) và Hausman (Hausman, 1978) nhằm tìm ra phƣơng pháp hồi quy nào là phù hợp nhất.
Bƣớc 4: Tiến hành các kiểm định cơ bản của giả thuyết liên quan đến mô hình phù hợp nhất: Kiểm định đa cộng tuyến, kiểm định tự tƣơng quan, kiểm định phƣơng sai thay đổi.
Bƣớc 5: Tiến hành giải thích các kết quả đạt đƣợc
Sau đó, phân mẫu ra thành các công ty tăng trƣởng cao và các công ty tăng trƣởng thấp dựa trên chỉ số Tobin‟s Q (Tobin‟s Q lớn hơn 1 là nhóm công ty tăng trƣởng cao và ngƣợc lại Tobin‟s Q nhỏ hơn 1 là nhóm công ty tăng trƣởng thấp) để xem xét sự tác động nghịch biến của đòn bẩy tài chính lên quyết định đầu tƣ ở các công ty có cơ hội tăng trƣởng cao có sự khác biệt nhƣ thế nào so với các công ty có cơ hội tăng trƣởng thấp. Cách phân loại này đƣợc sử dụng trong nhiều nghiên cứu
trƣớc đó nhƣ của Lang và cộng sự (1996) hay Aivazian và cộng sự (2005),
PGS.TS. Nguyễn Thị Ngọc Trang & Trang Thúy Quyên (2013).