bằng hoặc trên 51% vốn cố phần thì biến giả bằng 1. Ngƣợc lại, nếu Nhà nƣớc chiếm dƣới 51% vốn cổ phần thì biến giả bằng 0. Lê Thị Mỹ Phƣơng (2014), Phan Thanh Hiệp (2016) đều cho thấy có mối quan hệ thuận chiều giữa sở hữu nhà nƣớc và cấu trúc vốn của DN tại các DN Việt Nam trong mẫu nghiên cứu.
Giả thiết nghiên cứu H6: DN thuộc sở hữu Nhà nước thì có tỷ lệ nợ cao.
Số năm hoạt động của DN AGE đƣợc xác định bằng cách lấy logarit tự nhiên khoảng thời gian năm hiện tại trừ đi cho năm thành lập của DN. Diamond (1991), Tian and Estrin (2007), Chen and Strange (2005), Sunitha Vijayakumaran & Ratnam Vijayakumaran (2018) cho thấy giữa số năm hoạt động của DN với tỷ lệ nợ của DN có mối quan hệ thuận chiều với nhau.
Giả thiết nghiên cứu H7: Số năm hoạt động của DN có quan hệ thuận chiều với tỷ lệ nợ của DN.
Bảng 3.1: Mô tả chi tiết các biến trong mô hình hồi quy Biến Biến
phụ thuộc:
Ý nghĩa Dữ liệu thu thập Kỳ
vọng Nghiên cứu trƣớc Biến phụ thuộc TLEV Phản ánh cấu trúc vốn của DN Tỷ lệ tổng nợ/tổng tài sản / Biến độc lập ROA Khả năng sinh lời của DN
Lợi nhuận sau
thuế/tổng tài sản -
Wahab và Ramli (2014), Obeid Gharaibeh (2015), Lê Đạt Chí (2013), Đặng Quỳnh Anh, Quách Thị Hải Yến (2014)
SIZE Quy mô của
DN
Logarit tổng tài
sản của DN +
Wahab và Ramli (2014), Obeid Gharaibeh (2015),
Đặng Thị Quỳnh Anh (2014), Phan Thanh Hiệp (2016)
TANG Tài sản cố định của DN Tỷ lệ tài sản cố định/tổng tài sản +/- Huang và Song (2006), Wahab và Ramli (2014), Obeid Gharaibeh (2015), Harc (2015), Alghusin (2015), Đoàn Ngọc Phi Anh (2010)
GROW
Cơ hội tăng trƣởng của DN
(Doanh thu năm sau – doanh thu năm trƣớc)/doanh thu năm trƣớc + Obeid Gharaibeh (2015), Trƣơng Đông Lộc và Võ Thị Kiều Trang (2008) TAX Thuế suất thuế thu nhập doanh nghiệp Thuế thu nhập DN/Lợi nhuận trƣớc thuế -
Huang và Song (2006), Lê Đạt Chí (2013), Đặng Quỳnh Anh, Quách Thị Hải Yến (2014) GOV Tỷ lệ sở hữu của Nhà nƣớc Tỷ lệ vốn cổ phần do Nhà nƣớc nắm giữ/vốn chủ sở hữu. Nếu tỷ lệ này lớn hơn hoặc bằng 51% thì biến sẽ nhận giá trị 1. Nếu tỷ lệ này nhỏ hơn 51% thì nhận giá trị 0. + Lê Thị Mỹ Phƣơng (2014),
Phan Thanh Hiệp (2016)
AGE
Số năm hoạt động của DN
Logarit tự nhiên của khoảng thời gian tính từ khi
+
Diamond (1991), Tian and Estrin (2007), Chen and Strange (2005), Sunitha
Nguồn: Tổng hợp của tác giả
3.2 Dữ liệu nghiên cứu
Để thực hiện nghiên cứu, đề tài sử dụng bộ dữ liệu đƣợc thu thập từ báo cáo tài chính đã đƣợc kiểm toán của các DN phi tài chính niêm yết trên thị trƣờng chứng khoán Việt Nam với tiêu chí số quan sát lớn nhất và đủ số liệu trong giai đoạn 2008 – 2018. Theo tiêu chí này, đề tài tiến hành thu thập dữ liệu và hoàn thiện bộ dữ liệu của 511 DN niêm yết triên sàn chứng khoán HOSE và HNX trong giai đoạn nghiên cứu. Nhƣ vậy, dữ liệu nghiên cứu là dữ liệu bảng theo chiều thời gian và không gian. Nói cách khác, dữ liệu bảng là sự kết hợp giữa dữ liệu chéo theo không gian và dữ liệu theo chuỗi thời gian.
Dữ liệu bảng nhiều ƣu điểm để sử dụng trong các nghiên cứu định lƣợng: - Vì dữ liệu bảng liên quan đến các đối tƣợng (gồm cá nhân, doanh nghiệp, tiểu bang, đất nƣớc, v.v…) theo thời gian, nên nhất định phải có tính riêng biệt (không đồng nhất) trong các đơn vị này. Kỹ thuật ƣớc lƣợng dữ liệu bảng có thể chính thức xem xét đến tính riêng biệt đó bằng cách xem xét các biến số có tính đặc thù theo từng đối tƣợng.
- Thông qua kết hợp các chuỗi theo thời gian của các quan sát theo không gian, dữ liệu bảng cung cấp “những dữ liệu có nhiều thông tin hơn, đa dạng hơn, ít cộng tuyến hơn giữa các biến số, nhiều bậc tự do hơn và hiệu quả hơn.”
- Thông qua nghiên cứu các quan sát theo không gian lặp lại, dữ liệu bảng phù hợp hơn để nghiên cứu tính động của thay đổi. Tình trạng thất nghiệp, luân chuyển công việc, và tính lƣu chuyển lao động sẽ đƣợc nghiên cứu tốt hơn với dữ liệu bảng. - Dữ liệu bảng có thể phát hiện và đo lƣờng tốt hơn những ảnh hƣởng mà không thể quan sát trong dữ liệu chuỗi thời gian thuần túy hay dữ liệu chéo theo không gian thuần túy. Ví dụ, ảnh hƣởng của luật tiền lƣơng tối thiểu đối với việc làm và thu nhập có thể đƣợc nghiên cứu tốt hơn nếu chúng ta xem xét các đợt gia
thành lập đến năm 2018
Vijayakumaran & Ratnam Vijayakumaran (2018)
tăng tiền lƣơng tối thiểu liên tiếp nhau trong mức lƣơng tối thiểu của liên bang và (hoặc) tiểu bang.
- Dữ liệu bảng giúp ta nghiên cứu những mô hình hành vi phức tạp hơn. Ví dụ, các hiện tƣợng nhƣ lợi thế kinh tế theo qui mô và thay đổi kỹ thuật có thể đƣợc xem xét thông qua dữ liệu bảng tốt hơn so với dữ liệu theo chuỗi thời gian thuần túy hay theo không gian thuần túy.
- Bằng cách thu thập những số liệu có sẵn cho vài nghìn đơn vị, dữ liệu bảng có thể tối thiểu hóa sự thiên lệch có thể xảy ra nếu ta tổng hợp các cá nhân hay các doanh nghiệp thành số liệu tổng.
Có thể nói, dữ liệu bảng có thể làm phong phú các phân tích thực nghiệm theo những cách thức mà không chắc có thể đạt đƣợc, nếu ta chỉ sử dụng các dữ liệu theo chuỗi thời gian hay không gian thuần túy.
3.3 Phƣơng pháp nghiên cứu và các kiểm định mô hình
Những phƣơng pháp ƣớc lƣợng cơ bản với dữ liệu bảng bao gồm: Pooled regression model (mô hình Pooled), Fixed effect model (FEM), Random effect model (REM), Feasible Generalized Least Squares (mô hình FGLS)....1
3.3.1 Phƣơng pháp hồi quy Pooled OLS
Giả sử mẫu quan sát bao gồm N doanh nghiệp, trong T năm, nhƣ vậy dữ liệu bảng sẽ bao gồm NxT quan sát. Phƣơng trình hồi quy tổng quát có dạng:
Yit = Xitβ + Zi + αit Trong đó:
Y: vector tập hợp các biến phụ thuộc X: vector tập hợp các biến độc lập
Z: vector gồm các biến không thay đổi theo thời gian, đại diện cho những đặc điểm riêng của từng DN
i: chỉ số thể hiện doanh nghiệp i (𝑖 ⃗⃗⃗⃗⃗⃗⃗ ) t: chỉ số thể hiện năm quan sát ((𝑖 ⃗⃗⃗⃗⃗⃗ )
1 Theo Kinh tế lƣợng cơ sở - Edition 4 – Chƣơng 16: các mô hình hồi quy dữ liệu bảng – Chƣơng trình giảng dạy kinh tế Fulbright. Tác giả Damodar N. Gujarati, Biên dịch: Kim Chi, Hiệu đính: Đinh Công Khải.
α: sai số
Mô hình Pooled thực chất là ƣớc lƣợng bình phƣơng nhỏ nhất (OLS), khi chúng ta sử dụng dữ liệu bảng nhƣ một tập hợp các quan sát bình thƣờng, không phân biệt theo năm hay theo quốc gia. Theo mô hình này, Zi chỉ là một hằng số, nghĩa là các DN không có đặc điểm riêng khác nhau, nên phƣơng trình tổng quát trở thành:
Yit = Xitβ + αit
Mô hình Pooled không có tính thực tế cao do các giả định khi hồi quy OLS. Vì thế, phƣơng pháp hồi quy theo mô hình ảnh hƣởng cố định và mô hình ảnh hƣởng ngẫu nhiên thƣờng đƣợc sử dụng hơn. Khi mô hình vi phạm các điều kiện về phƣơng sai và/hoặc tự tƣơng quan, ƣớc lƣợng FGLS đƣợc sử dụng tốt hơn. Khi mô hình có hiện tƣợng nội sinh, phƣơng pháp GMM nên là ƣớc lƣợng đƣợc lựa chọn vì nó giúp xử lý vi phạm nội sinh của mô hình. Mô hình nghiên cứu của đề tài không có hiện tƣợng nội sinh, nên phƣơng pháp ƣớc lƣợng mà đề tài sử dụng bao gồm FEM, REM và FGLS.
3.3.1. Phƣơng pháp hồi quy theo mô hình ảnh hƣởng cố định (FEM)
Phƣơng pháp hồi quy ảnh hƣởng cố định – FEM đƣợc ƣớc lƣợng trên giả định hệ số độ dốc là hằng số nhƣng tung độ gốc thay đổi theo các đối tƣợng. Mô hình hồi quy theo FEM đƣợc viết:
Yit = β1i + β2 X2,it + β3 X3,it +….. + βk Xk,it + uit (*) Với:
Yit: biến phụ thuộc
β1i: cho thấy rằng tung độ gốc của mỗi đối tƣợng thay đổi theo thời gian nhƣng các hệ số (độ dốc) của các biến độc lập không thay đổi theo các đối tƣợng theo thời gian. Giả định này có nghĩa là mỗi đối tƣợng đều có những đặc điểm riêng biệt, có thể ảnh hƣởng đến các biến giải thích nhƣng các đặc điểm riêng biệt này là đơn nhất đối với 1 thực thể và không tƣơng quan với đặc điểm của các thực thể khác.
Xk (k=1,n): các biến độc lập u: sai số
Ƣớc lƣợng FEM đƣợc thực hiện dựa trên các giả thiết: - Sai số có phân phối chuẩn ( uit~N(0, ))
- Không có hiện tƣợng đa cộng tuyến trong mô hình ( Rank(X) =k)
- Các biến độc lập và sai số không tƣơng quan với nhau hay các biến độc lập trong mô hình phải là biến ngoại sinh ( E(uit/X) = 0)
- Phƣơng sai sai số không thay đổi ( Var(uit) = σ2
= const) - Mô hình không có hiện tƣợng nội sinh
Phƣơng pháp ƣớc lƣợng FEM còn đƣợc gọi là phƣơng pháp bình phƣơng tối thiểu các biến giả (Least Squares Dummy Variable - LSDV). Theo ƣớc lƣợng LSDV, phƣơng trình (*) đƣợc viết dƣới dạng:
Yit = α1 +α2D2i + α3D3i + … + αkDki + β2X2,it + β3X3,it +….. + βkXk,it + uit Khi sử dụng phƣơng pháp ƣớc lƣợng FEM trên dữ liệu bảng sẽ có những thuận lợi nhƣ:
+ FEM có thể kiểm soát và tách ảnh hƣởng của các đặc điểm riêng biệt (không đổi theo thời gian) này ra khỏi các biến giải thích, để chúng ta có thể ƣớc lƣợng những ảnh hƣởng thực của biến giải thích lên biến phụ thuộc. + Trong trƣờng hợp uit có tƣơng quan với các biến độc lập, ƣớc lƣợng FEM vẫn đảm bảo đƣợc tính vững của hệ số ƣớc lƣợng.
Tuy nhiên, ƣớc lƣợng FEM có quá nhiều biến đƣợc tạo ra trong mô hình (các biến giả), vì thế có khả năng làm giảm bậc tự do và làm tăng khả năng đa cộng tuyến của mô hình. Ngoài ra, ƣớc lƣợng FEM không đo lƣờng đƣợc tác nhân không thay đổi theo thời gian nhƣ giới tính, màu da, hay chủng tộc.
3.3.2 Phƣơng pháp hồi quy theo mô hình ảnh hƣởng ngẫu nhiên (REM)
Mô hình FEM do có nhiều biến tạo ra trong mô hình làm mất đi một số bậc tự do và nếu sự mất đi này không cần thiết thì sẽ nhƣ thế nào. Hơn nữa, FEM giả định không có sự khác biệt giữa các đối tƣợng. Điều này dẫn tới ý tƣởng cho sự ra đời của phƣơng pháp hồi quy theo mô hình ảnh hƣởng ngẫu nhiên – REM. Mô hình REM quan tâm đến sự khác biệt của mỗi đối tƣợng và có những giả định:
Đặc điểm riêng giữa các đối tƣợng đƣợc giả sử là ngẫu nhiên và không tƣơng quan đến các biến độc lập trong mô hình.
Các phần dƣ của mỗi thực thể ( không tƣơng quan với biến độc lập) là một biến độc lập mới.
Nếu xem các đối tƣợng trong mô hình có đặc điểm riêng, khi đó β1i không là cố định, mà giả định đó là một biến ngẫu nhiên với một giá trị trung bình là β1 và sự khác biệt tiêng về giá trị tung độ gốc của từng đối tƣợng đƣợc phản ánh trong số hạng sai số εi
β1i = β1 + εi (i=1,2…N)
Trong đó, εi là số hạng sai số ngẫu nhiên với một giá trị trung bình bằng 0 và phƣơng sai bằng .
(*) trở thành: Yit = β1 + εi + β2 X2,it + β3 X3,it +….. + βk Xk,it + uit (**) Đặt wit = εi + uit
(**) viết lại:
Yit = β1 + β2 X2,it + β3 X3,it +….. + βk Xk,it + wit (***) Trong đó, wit : sai số
Mô hình FEM cũng giống nhƣ REM, mô hình FEM cũng cần thỏa mãn các yêu cầu:
- Kỳ vọng trung bình của sai số bằng 0 ( E(wit = 0)) - Sai số có phân phối chuẩn ( uit~N(0, ) và εi~N(0, ))
- Không có hiện tƣợng đa cộng tuyến trong mô hình ( Rank(X) =k)
- Các biến độc lập và sai số không tƣơng quan với nhau hay các biến độc lập trong mô hình phải là biến ngoại sinh ( E(uit/X) = 0)
- Phƣơng sai sai số không thay đổi ( Var(uit) = σ2
= const) - Mô hình không có hiện tƣợng nội sinh
3.3.3 Lựa chọn mô hình
- So sánh giữa mô hình Pooled và FEM:
Mô hình Pooled giả định tung độ gốc của các đối tƣợng không khác biệt nhau về cả mặt thời gian và cả không gian, trong khi FEM giả định tung độ gốc của mỗi đối tƣợng thay đổi theo thời gian nhƣng các hệ số (độ dốc) của các biến độc lập không thay đổi theo các đối tƣợng theo thời gian. Vậy để lựa chọn mô hình Pooled
kiểm định cho ra kết quả có Prob > F nhỏ hơn 0.05 thì bác bỏ giả thiết Ho. Lúc này mô hình FEM thích hợp hơn.
- So sánh giữa FEM và REM:
Để lựa chọn giữa mô hình FEM hay REM, kiểm định Hausman sẽ đƣợc thực hiện. Với giả định đƣa ra về mối tƣơng quan giữa thành phần sai số theo đối tƣợng εi và các biến độc lập X sẽ giúp lựa chọn mô hình FEM hay REM là thích hợp hơn. Nếu giả định rằng εi và các biến X không tƣơng quan, thì REM có thể phù hợp, trong khi nếu εi và các biến X tƣơng quan, thì FEM có thể thích hợp. Kiểm định Hausman xây dựng vào năm 1978 giúp chúng ta lựa chọn mô hình thích hợp dựa trên kiểm định giả thuyết: Ho: Cov(Xit, ui) = 0. Khi kết quả kiểm định cho kết quả Prob > Chi2 nhỏ hơn 0.05 thì bác bỏ giả thiết, hay lúc này mô hình FEM sẽ thích hợp hơn là mô hình REM.
- So sánh giữa mô hình Pooled và REM:
Kiểm định Breusch – Pagan Larganian multiplier sẽ đƣợc thực hiện để lựa chọn mô hình Pooled OLS hay là mô hình REM có hiệu quả hơn trong giải thích mối quan hệ giữa các biến. Giả thiết Ho: chênh lệch giữa các đối tƣợng trong mô hình hồi quy bằng 0, hay phƣơng sai các sai số ngẫu nhiên bằng 0. Nếu kết quả kiểm định là Prob > Chi2 nhỏ hơn 0.05 thì bác bỏ giả thiết Ho, lúc đó, mô hình hồi quy REM phù hợp hơn.
3.3.4. Phƣơng sai và tự tƣơng quan của mô hình
Khi thực hiện hồi quy trên dữ liệu bảng, dù chọn mô hình nào trong 3 mô hình trên thì cũng cần kiểm định yêu cầu mô hình không có phƣơng sai thay đổi, không có tự tƣơng quan nhƣ đã nêu trong phần giới thiều về mô hình Pooled, REM và FEM. Đó là vì dữ liệu gồm các quan sát ở nhiều đối tƣợng khác nhau, là nguyên nhân dẫn đến hiện tƣợng phƣơng sai thay đổi, và các quan sát ở nhiều thời gian khác nhau, nên có thể gặp phải vấn đề tự tƣơng quan. Để phát hiện những vấn đề này, đề tài dùng các kiểm định thích hợp cho dữ liệu bảng trên phần mềm Stata với các giả thuyết:
+ Kiểm định Ho: Phƣơng sai thuần nhất
+ Kiểm định Ho: Có tự tƣơng quan bậc nhất
Nếu bác bỏ Ho, mô hình không có tự tƣơng quan bậc nhất.
3.3.5 Phƣơng pháp ƣớc lƣợng FGLS
Các phƣơng pháp ƣớc lƣợng OLS, FEM, REM chỉ cho kết quả vững và không chệch với giả thiết là sai số của mô hình hồi quy tổng thể có phƣơng sai không thay đổi, tức là chúng có cùng phƣơng sai, nói cách khác là có phƣơng sai đồng nhất. Bên cạnh đó, mô hình hồi quy cũng không có quan hệ tƣơng quan chuỗi giữa các sai số, tức là không có hiện tƣợng tự tƣơng quan. Nếu bị vi phạm một trong hai giả thiết, các hệ số hồi quy của mô hình ƣớc lƣợng không còn là ƣớc lƣợng hiệu quả nhất. Trong trƣờng hợp này, phƣơng pháp GLS (Generalied Least Squares) đƣợc lựa chọn để khắc phục vi phạm này. Phƣơng pháp GLS đƣợc đặt dƣới giả định rằng mô hình là hoàn toàn xác định, có sự khác biệt về phƣơng sai sai số ở mỗi nhóm đối tƣợng, nhƣng là không đổi trong phạm vi từng đối tƣợng. Với những giả thiết nhƣ vậy, GLS đem lại ƣớc lƣợng tiệm cận hiệu quả và vững.
Theo Greene (2012), khi có phƣơng sai thay đổi và tự tƣơng quan thì ma trận hiệp phƣơng sai có dạng: Varcov( ) = ∑ , với ∑ là ma trận đối xứng, xác định dƣơng. Do đó tồn tại ma trận P không suy biến sao cho ∑-1= P‟P