STT TÊN BIẾN KÝ
HIỆU ĐO LƯỜNG NGUỒN Biến phụ thuộc
1 Quyết định của
nhà đầu tư INVDE 𝑙𝑛 (
𝑘ℎố𝑖 𝑙ượ𝑛𝑔 đặ𝑡 𝑚𝑢𝑎𝑡 𝑘ℎố𝑖 𝑙ượ𝑛𝑔 đặ𝑡 𝑏á𝑛𝑡) Nwaobia và các cộng sự (2016) Biến độc lập 2 Quản trị lợi
nhuận EM Mơ hình Jones điều chỉnh Dechow và các cộng sự (1995)
3 Loại công ty
kiểm toán AUDIT
Biến giả:
1: được kiểm toán bởi Big4 0: các trường hợp còn lại Houcine và Kolsi (2017) 4 Khả năng sinh lời ROE 𝐿ợ𝑖 𝑛ℎ𝑢ậ𝑛 𝑡ℎ𝑢ầ𝑛𝑡 𝑉ố𝑛 𝑐ℎủ 𝑠ở ℎữ𝑢𝑡 Thomas và Zhang (2002) 5 Địn bẩy tài chính LEV 𝑇ổ𝑛𝑔 𝑛ợ 𝑝ℎả𝑖 𝑡𝑟ả𝑡 𝑇ổ𝑛𝑔 𝑡à𝑖 𝑠ả𝑛𝑡 Perotti và Wagenhofer (2014), Bar-Yosef và Prencipe (2013) 6 Tăng trưởng
doanh thu GRO
𝐷𝑜𝑎𝑛ℎ 𝑡ℎ𝑢 𝑡ℎ𝑢ầ𝑛𝑡
𝐷𝑜𝑎𝑛ℎ 𝑡ℎ𝑢 𝑡ℎ𝑢ầ𝑛𝑡−1
Perotti và Wagenhofer (2014)
7 Quy mô tài sản SIZE 𝑙𝑛(𝑇ổ𝑛𝑔 𝑡à𝑖 𝑠ả𝑛𝑡)
Biddle et. al. (2009), Houcine và Kolsi
(2017)
3.3. Mẫu nghiên cứu và thu thập dữ liệu
Mẫu nghiên cứu bao gồm các cơng ty phi tài chính được niêm yết trên hai sàn giao dịch của Việt Nam là Sở giao dịch Chứng khốn Thành phố Hồ Chính Minh (sàn HOSE) và Sở giao dịch Chứng khoán Hà Nội (sàn HNX). Mẫu nghiên cứu bao gồm cả các cơng ty có niêm yết trong giai đoạn 2013-2017, dù hiện tại một số cơng ty đã khơng cịn được niêm yết trên hai sàn này nữa.
Mẫu nghiên cứu không bao gồm các cơng ty tài chính như ngân hàng, cơng ty chứng khốn và cơng ty bảo hiểm do tính đặc thù của loại hình cơng ty tài chính
và do mẫu báo cáo tài chính của các cơng ty này có sự khác biệt so với các cơng ty phi tài chính. Ngồi ra, do một số biến của mô hình hồi quy (3.1) và mơ hình đo lường quản trị lợi nhuận (3.2) địi hỏi số liệu của năm tài chính liền trước (như biến GRO, ΔREC,…), mẫu dữ liệu nghiên cứu cũng loại bỏ các quan sát thiếu hụt số liệu tài chính của năm liền trước.
Dữ liệu tài chính và dữ liệu giao dịch phần lớn được tác giả tự thu thập từ Vietstock (vietstock.vn), đơn vị chuyên cung cấp thơng tin tài chính. Dữ liệu tài chính bao gồm các thơng tin trên báo cáo tài chính năm đã kiểm toán của các doanh nghiệp trong mẫu nghiên cứu. Tác giả sử dụng các chỉ tiêu liên quan thuộc bảng cân đối kế toán, báo cáo kết quả hoạt động kinh doanh và báo cáo lưu chuyển tiền tệ để phục vụ cho việc tính tốn các biến trong mơ hình. Dữ liệu giao dịch thống kê khối lượng đặt mua và đặt bán của mỗi cổ phiếu theo năm, được dùng để tính tốn biến phụ thuộc của mơ hình. Thơng tin về cơng ty kiểm tốn cho báo cáo tài chính của các doanh nghiệp trong mẫu quan sát được tác giả thu thập từ CafeF (cafef.vn) và báo cáo tài chính đã kiểm tốn của doanh nghiệp. Dựa trên danh sách phân loại ngành nghề của Vietstock, tác giả tập hợp phân loại các doanh nghiệp trong mẫu nghiên cứu theo 8 ngành nghề chính, bao gồm (1) Thực phẩm, (2) Năng lượng, (3) Vận tải, (4) Công nghệ, (5) Thương mại, (6) Sản xuất, (7) Nguyên vật liệu và (8) Bất động sản (BĐS) & Xây dựng.
Mẫu nghiên cứu cuối cùng có dạng dữ liệu bảng không cân bằng (unbalanced panel data), bao gồm 2.980 quan sát của 669 công ty niêm yết trên sàn HOSE và HNX trong giai đoạn 5 năm từ năm 2013 đến năm 2017. Dữ liệu bảng (panel data) là sự kết hợp dữ liệu theo chuỗi không gian (cross-sections) và thời gian (time-series). Chuỗi khơng gian mà tác giả nói đến chính là các doanh nghiệp có niêm yết trên sàn HOSE và HNX trong giai đoạn nghiên cứu. Chuỗi thời gian chính là 5 năm từ năm 2013 đến năm 2017. Trong giai đoạn này, có sự thay đổi về số lượng các doanh nghiệp niêm yết trên sàn. Nhiều doanh nghiệp tiến hành niêm yết lần đầu ra cơng chúng, cũng có nhiều doanh nghiệp rơi vào diện bị hủy niêm yết bắt buộc. Chính vì thế, một số doanh nghiệp có thể khơng niêm yết xun suốt trên
sàn trong toàn bộ khoảng thời gian 5 năm quan sát. Do vậy, số liệu của dữ liệu bảng bị khuyết ở một số năm đối với một số doanh nghiệp và làm cho dữ liệu bảng trở nên không cân bằng (unbalanced panel data).
3.4. Phương pháp hồi quy và lựa chọn mơ hình phù hợp
Tác giả tiến hành hồi quy mơ hình (3.1) theo phương pháp bình phương nhỏ nhất cho dữ liệu bảng (Panel Least Square). Do mẫu được chọn là dữ liệu bảng không cân bằng, tác giả áp dụng 3 mơ hình hồi quy dữ liệu bảng khác nhau: Mơ
hình Pooled OLS, Mơ hình hiệu ứng cố định (Fixed Effect Model – FEM) và Mơ
hình hiệu ứng ngẫu nhiên (Random Effect Model – REM). Các kiểm định cần thiết
sẽ được thực hiện để chọn ra mơ hình phù hợp nhất trong 3 mơ hình này, bao gồm kiểm định F, kiểm định nhân tử Lagrange (LM) và kiểm định Hausman.
3.4.1. Mơ hình Pooled OLS
Cách tiếp cận dữ liệu bảng theo mơ hình Pooled OLS sẽ bỏ qua tất cả các hiệu ứng theo thời gian và theo không gian. Tức là, mơ hình này khơng xem các doanh nghiệp là khác nhau và cũng khơng cho rằng có sự khác nhau theo thời gian của các nhân tố. Mơ hình Pooled OLS loại bỏ đặc trưng riêng của doanh nghiệp như khả năng quản lý, triết lý kinh doanh,…và cũng loại bỏ luôn các biến cố theo thời gian như chu kỳ kinh tế, chính sách vĩ mơ,…
Như vậy, mơ hình Pooled OLS sẽ giống với mơ hình hồi quy gốc (3.1) và được ước lượng theo phương pháp bình phương nhỏ nhất thơng thường (OLS). Các hệ số hồi quy β0, …, β6 của mơ hình Pooled OLS được giả định là như nhau cho tất cả các quan sát. Mối quan hệ giữa quyết định của nhà đầu tư và các biến độc lập trong mơ hình sẽ khơng thay đổi đối với các doanh nghiệp khác nhau và giữ nguyên theo thời gian.
3.4.2. Mơ hình hiệu ứng cố định (FEM)
Mơ hình hiệu ứng cố định (FEM) sẽ xem xét đến ảnh hưởng của hiệu ứng thời gian (period effect) và/hoặc hiệu ứng không gian (cross-sectional effect) đến
đối tượng quan sát. Các hiệu ứng này sẽ được đưa vào mơ hình thơng qua các biến giả đại diện cho doanh nghiệp và năm quan sát.
Khi xét ảnh hưởng của hiệu ứng thời gian, tung độ gốc (β0) có thể khác
nhau đối với các năm khác nhau, nhưng không thay đổi khi được quan sát trong cùng một năm nhất định, dù các doanh nghiệp là khác nhau đi nữa (Gujarati, 2003, pp.643-644). Khi đó, mơ hình hồi quy gốc (3.1) khi xét ảnh hưởng của hiệu ứng thời gian được viết lại như sau:
INVDEi,t = (λ0 + λ1*Y13 + …+ λ4*Y16) + β1 EMi,t + β2 AUDITi,t + β3 ROEi,t
+ β4 LEVi,t + β5 GROi,t + β6 SIZEi,t + εi,t (3.3)
Trong đó:
λ0, λ1, …, λ4, β1, …, β6 là các hệ số hồi quy; ε là phần dư;
Y13,…,Y16 là các biến giả năm; Y13 nhận giá trị bằng 1 với những quan sát trong năm 2013, nhận giá trị bằng 0 với những năm còn lại;
INVDE: quyết định của nhà đầu tư; EM: mức độ quản trị lợi nhuận;
AUDIT: loại cơng ty kiểm tốn cho báo cáo tài chính vào năm t; ROE: khả năng sinh lời của công ty i;
LEV: địn bẩy tài chính; GRO: tăng trưởng doanh thu;
SIZE: quy mô tài sản.
Đối với mơ hình FEM khi xem xét hiệu ứng thời gian, tung độ gốc (β0) đã được viết lại bằng cụm (λ0 + λ1*Y13 + …+ λ4*Y16). Tác giả lưu ý rằng, mơ hình
này khơng có biến giả Y17 đại diện cho năm 2017, mà chỉ có bốn biến giả Y13, Y14, Y15, Y16 đại diện cho bốn năm từ năm 2013 đến năm 2016 để tránh hiện tượng đa cộng tuyến hoàn hảo giữa các biến giả này.
Tương tự, khi xét ảnh hưởng của hiệu ứng khơng gian, tung độ gốc (β0) có thể khác nhau đối với các doanh nghiệp khác nhau, nhưng không thay đổi qua thời gian (Gujarati, 2003, p.642). Mơ hình hồi quy hồi quy gốc (3.1) khi xét ảnh hưởng của hiệu ứng không gian được viết lại như sau:
INVDEi,t = (α0 + α1*DN1 + α2*DN2 +…+ αN-1*DNN-1) + β1 EMi,t +
β2 AUDITi,t + β3 ROEi,t + β4 LEVi,t + β5 GROi,t + β6 SIZEi,t + εi,t (3.4)
Trong đó:
α0, α1, …, αN-1, β1, …, β6 là các hệ số hồi quy; ε là phần dư; N là tổng số doanh nghiệp quan sát;
DNi là các biến giả đại diện cho doanh nghiệp thứ i; DN1 nhận giá trị bằng 1 với những quan sát của doanh nghiệp thứ 1, nhận giá trị bằng 0 với những quan sát của các doanh nghiệp còn lại;
INVDE: quyết định của nhà đầu tư; EM: mức độ quản trị lợi nhuận;
AUDIT: loại cơng ty kiểm tốn cho báo cáo tài chính vào năm t; ROE: khả năng sinh lời của công ty i;
LEV: địn bẩy tài chính; GRO: tăng trưởng doanh thu;
SIZE: quy mô tài sản.
Tương tự như các biến giả năm ở mơ hình (3.3), mơ hình (3.4) này cũng chỉ đưa (N-1) biến giả đại diện cho (N-1) doanh nghiệp vào mơ hình và tung độ gốc (β0) đã được viết lại bằng cụm (α0 + α1*DN1 + α2*DN2 +…+ αN-1*DNN-1).
Cuối cùng, khi xét ảnh hưởng của cả hiệu ứng không gian và hiệu ứng thời gian, mơ hình (3.1) được viết lại như sau (Gujarati, 2003, p.644):
INVDEi,t = (α0 + α1*DN1 + α2*DN2 +…+ αN-1*DNN-1) + ( λ0 + λ1*Y13 + …+
λ4*Y16) + β1 EMi,t + β2 AUDITi,t + β3 ROEi,t + β4 LEVi,t + β5 GROi,t + β6 SIZEi,t + εi,t
(3.5)
Trong đó:
α0, α1, …, αN-1, λ0, λ1, …, λ4, β1, …, β6 là các hệ số hồi quy; ε là phần dư;
DNi là các biến giả đại diện cho doanh nghiệp thứ i; N là tổng số doanh nghiệp quan sát;
Y13, Y14,…,Y16 là các biến giả năm; INVDE: quyết định của nhà đầu tư; EM: mức độ quản trị lợi nhuận;
AUDIT: loại cơng ty kiểm tốn cho báo cáo tài chính vào năm t; ROE: khả năng sinh lời của cơng ty i;
LEV: địn bẩy tài chính; GRO: tăng trưởng doanh thu; SIZE: quy mô tài sản.
Mơ hình hiệu ứng cố định sát với thực tiễn hơn so với mơ hình Pooled OLS do mỗi doanh nghiệp đều có những đặc điểm rất khác nhau và tình hình thị trường tài chính ở Việt Nam cũng thay đổi rất nhiều qua các năm nghiên cứu. Tuy nhiên, một bất lợi rất lớn khi sử dụng mơ hình này là việc tạo ra q nhiều biến giả. Chẳng hạn, với số lượng doanh nghiệp quan sát khá lớn (N lớn), mơ hình (3.4) và (3.5) sẽ tạo ra (N-1) biến giả tương ứng với (N-1) doanh nghiệp để xem xét ảnh hưởng của hiệu ứng không gian. Điều này làm giảm bậc tự do của dữ liệu đi rất nhiều và đồng thời tăng nguy cơ đa cộng tuyến của mơ hình. Một bất lợi khác của FEM chính là việc mơ hình này khơng thể đo lường được các tác nhân không thay đổi theo thời gian (chẳng hạn như ngành nghề kinh doanh) do các tác nhân này sẽ tạo hiện tượng đa cộng tuyến hồn hảo với các biến giả nói trên.
3.4.3. Mơ hình hiệu ứng ngẫu nhiên (REM)
Mơ hình hiệu ứng ngẫu nhiên (REM) cịn có tên gọi khác là mơ hình các thành phần sai số (Error Components Model – ECM). REM tương đối giống với mơ hình FEM cố định hiệu ứng không gian (mơ hình 3.4). Tuy nhiên, mơ hình REM này khác mơ hình FEM ở chỗ FEM có riêng từng tung độ gốc cho mỗi doanh nghiệp (thể hiện ở cụm α0 + α1*DN1 + α2*DN2 +…+ αN-1*DNN-1), trong khi REM sử dụng một hệ số tung độ gốc (α0) chung cho tất cả các doanh nghiệp. Phần khác biệt giữa tung độ gốc của mỗi doanh nghiệp với tung độ gốc chung (α0) sẽ nằm trong thành phần ngẫu nhiên (ui). Giá trị tung độ gốc chung (α0) là giá trị trung bình của tất cả các hệ số tung độ gốc nếu sử dụng mơ hình FEM. Điều này được giải thích như sau:
α0,i = α0 + ui
Trong đó:
i = 1, 2, …, N với N là số doanh nghiệp;
α0,i là tung độ gốc của doanh nghiệp i nếu sử dụng FEM; α0 là tung độ gốc chung được sử dụng trong REM;
ui là thành phần ngẫu nhiên phản ánh đặc điểm khác biệt của doanh nghiệp i. Khi đó, phần dư (hạng nhiễu) của mơ hình mới sẽ được viết lại như sau:
wi,t = ui + εi,t
với i = 1, 2, …, N; t = 1, 2, …, 5 (t thể hiện năm)
Với mơ hình REM, mơ hình hồi quy gốc (3.1) sẽ có dạng như sau:
INVDEi,t = α0 + β1 EMi,t + β2 AUDITi,t + β3 ROEi,t + β4 LEVi,t + β5 GROi,t +
β6 SIZEi,t + (ui + εi,t ) (3.6)
Trong đó:
β1, …, β6 là các hệ số hồi quy của các biến độc lập;
(ui + εi,t) là phần dư;
INVDE: quyết định của nhà đầu tư; EM: mức độ quản trị lợi nhuận;
AUDIT: loại công ty kiểm tốn cho báo cáo tài chính vào năm t; ROE: khả năng sinh lời của cơng ty i;
LEV: địn bẩy tài chính; GRO: tăng trưởng doanh thu; SIZE: quy mô tài sản.
Như vậy, hạng nhiễu mới wi,t sẽ bao gồm hai thành phần: ui là thành phần sai số theo mỗi doanh nghiệp, và εi,t là thành phần sai số kết hợp theo không gian (doanh nghiệp) và thời gian (năm).
Với cùng một doanh nghiệp i, phần dư wi,t sẽ có hiện tượng tự tương quan theo thời gian do có cùng hạng nhiễu thành phần ui (Baltagi, 2005, p.15; Gujarati, 2003, pp.647-649; Wooldridge, 2002, pp.257-258). Do vậy, tác giả sử dụng phương pháp bình phương nhỏ nhất tổng quát khả thi (Feasible Generalized Least Squares – FGLS) để ước lượng mơ hình REM. Đây cũng là phương pháp ước lượng phù hợp nhất cho mơ hình REM (Brooks, 2008, pp.498-499; Gujarati, 2003, pp.647-649). Ngoài ra, hiện tượng phương sai thay đổi cũng xảy ra với dữ liệu bảng không cân bằng. Phương pháp FGLS cũng giải quyết vấn đề này bằng việc nới lỏng giả định phương sai không thay đổi của phương pháp OLS (Greene, 2002, pp.296-297; Gujarati, 2003, pp.395-398). Phần mềm Eviews 7.0 luôn sử dụng phương pháp FGLS khi ước lượng mơ hình REM.
Mặc dù REM giúp giảm thiểu được rất nhiều bất lợi của FEM, nhưng REM có một giả định rất quan trọng: hạng nhiễu thành phần ui khơng được có mối tương quan với các biến độc lập khác của mơ hình (tức là các biến như EM hay ROE). Giả
định này có thể được xem xét thơng qua kiểm định Hausman. Một giả định khác của mơ hình REM đó là khơng có sự tương quan chéo (cross-sectional dependence) của phần dư (corr(wi,t , wj,t) = 0 với i ≠ j). (Wooldridge, 2002, pp.257-260).
3.4.4. Lựa chọn mơ hình phù hợp
Để lựa chọn mơ hình phù hợp nhất trong 3 mơ hình Pooled OLS, FEM và REM, tác giả sẽ tiến hành kiểm định F, kiểm định nhân tử Lagrange (LM) và kiểm định Hausman.
Kiểm định F được sử dụng để xem xét các ước lượng của các biến giả được thêm vào trong mơ hình FEM. Như đã đề cập, mơ hình FEM đưa hiệu ứng khơng gian và thời gian vào mơ hình gốc thơng qua các biến giả đại diện cho năm quan sát (Yt) và cho doanh nghiệp quan sát (DNi). Kiểm định F có giả thuyết H0 rằng tất cả các hệ số hồi quy của các biến giả này đều bằng 0 (H0: α1 = … = αN-1 = λ1 = … = λ4 = 0). Giả thuyết đối ứng Ha tương ứng với việc có ít nhất một hệ số hồi quy của các biến giả là khác 0. Nếu giả thuyết H0 bị bác bỏ, hiệu ứng không gian và/hoặc hiệu ứng thời gian của mơ hình FEM là có ý nghĩa thống kê, và do vậy mơ hình FEM sẽ phù hợp hơn mơ hình Pooled OLS thuần túy. Ngược lại, nếu giả thuyết H0 không bị bác bỏ, việc thêm các biến giả vào mơ hình khơng góp phần tăng lên tính hiệu quả của mơ hình hồi quy gốc, và do vậy mơ hình Pooled OLS nên được sử dụng.
Kiểm định nhân tử Lagrange (LM) của Breusch và Pagan (1980) được sử dụng để kiểm chứng tính phù hợp giữa 2 mơ hình REM và Pooled OLS. Theo đó, giả thuyết H0 cho rằng phương sai của thành phần ngẫu nhiên phản ánh đặc điểm của doanh nghiệp là bằng 0 (H0: 𝜎𝑢2 = 0). Nếu giả thuyết H0 bị bác bỏ, hiệu ứng ngẫu nhiên là tồn tại và có ý nghĩa thống kê. Trường hợp này, mơ hình REM sẽ phù hợp hơn mơ hình Pooled OLS do có khả năng giải quyết tốt hơn trong vấn đề phương sai thay đổi. Ngược lại, giả thuyết H0 không bị bác bỏ sẽ mang ý nghĩa rằng khơng có sự khác nhau giữa mơ hình Pooled OLS và mơ hình REM, và do vậy mơ hình Pooled OLS sẽ được lựa chọn.
Tác giả sử dụng kiểm định Hausman (1978) để lựa chọn giữa hai mơ hình FEM và REM. Như đã đề cập, một giả định rất quan trọng của mơ hình hiệu ứng ngẫu nhiên là việc hạng nhiễu thành phần ui khơng được có mối tương quan với bất kỳ biến độc lập nào. Hausman đã kiểm định giả định này với giả thiết như sau:
H0 : hạng nhiễu thành phần ui không tương quan với bất kỳ biến độc lập nào. Ha : hạng nhiễu thành phần ui có tương quan với ít nhất một biến độc lập.
Nếu kết quả kiểm định Hausman bác bỏ giả thiết H0 thì giả định của mơ hình hiệu ứng ngẫu nhiên đã bị vi phạm, các ước lượng sẽ bị lệch (Baltagi, 2005, p.66). Khi đó, mơ hình hiệu ứng ngẫu nhiên sẽ trở nên khơng phù hợp, mơ hình hiệu ứng cố định sẽ cho kết quả ước lượng tốt hơn. Hay nói cách khác, tác giả sẽ sử dụng