7. Tổng quan tài liệu nghiên cứu
2.5. PHƢƠNG PHÁP PHÂN TÍCH
2.5.1. Mô hình hồi quy dữ liệu bảng
- Dữ liệu bảng là các quan sát về một chỉ tiêu nào đó mà tại đó, đơn vị chéo theo không gian đƣợc khảo sát theo thời gian. Nói vắn tắt, dữ liệu bảng có cả bình diện không gian cũng nhƣ thời gian.
- Dữ liệu bảng ngày càng đƣợc sử dụng nhiều trong nghiên cứu kinh tế bởi một số ƣu điểm sau (Badi H. Baltagi, 2013):
+ Dữ liệu bảng liên quan đến các cá nhân, doanh nghiệp, thành phố, đất nƣớc,… theo thời gian, nên nhất định phải có tính dị biệt (không đồng nhất) trong các đơn vị này. Kỹ thuật ƣớc lƣợng dữ liệu bảng có thể chính thức xem xét đến tính dị biệt đó bằng cách xem xét các biến số có tính đặc thù theo từng cá nhân. Ta sử dụng thuật ngữ cá nhân theo ý nghĩa chung bao gồm các đơn vị vi mô nhƣ các cá nhân, các doanh nghiệp thành phố hay đất nƣớc.
+ Thông qua kết hợp các chuỗi theo thời gian của các quan sát theo không gian, dữ liệu bảng cung cấp những dữ liệu có nhiều thông tin hơn, đa dạng hơn, ít cộng tuyến hơn giữa các biến số, nhiều bậc tự do hơn và hiệu quả hơn.
+ Thông qua nghiên cứu các quan sát theo không gian lặp lại, dữ liệu bảng phù hợp hơn để nghiên cứu tính động của thay đổi.
+ Dữ liệu bảng có thể phát hiện và đo lƣờng tốt hơn những ảnh hƣởng mà không thể quan sát trong dữ liệu chuỗi thời gian thuần túy hay dữ liệu chéo theo không gian thuần túy.
+ Dữ liệu bảng giúp ta nghiên cứu những mô hình hành vi phức tạp hơn. Ví dụ, các hiện tƣợng nhƣ lợi thế kinh tế theo qui mô và thay đổi kỹ thuật có thể đƣợc xem xét thông qua dữ liệu bảng tốt hơn so với dữ liệu theo chuỗi thời gian thuần túy hay theo không gian thuần túy.
+ Bằng cách thu thập những số liệu có sẵn cho vài nghìn đơn vị, dữ liệu bảng có thể tối thiểu hóa sự thiên lệch có thể xảy ra nếu ta tổng hợp các cá nhân hay các doanh nghiệp thành số liệu tổng.
Nói vắn tắt, dữ liệu bảng có thể làm phong phú các phân tích thực nghiệm theo những cách thức mà không chắc có thể đạt đƣợc nếu ta chỉ sử dụng các dữ liệu theo chuỗi thời gian hay không gian thuần túy. Vỡi dữ liệu nghiên cứu theo thời gian (2013-2015) và theo không gian (50 công ty khác nhau), kết hợp lại đƣợc 150 quan sát. Vì vậy, phƣơng pháp hồi quy với dữ liệu bảng (panel data) đƣợc tác giả đƣa vào sử dụng là hoàn toàn hợp lý
2.5.2. Ƣớc lƣợng mô hình
a. Mô hình tác động cố định (Fixed Effects Model)
Xét một mối quan hệ kinh tế, với biến phụ thuộc, Y, và các biến giải thích quan sát đƣợc, X1, X2…, Xn và một hoặc nhiều biến không quan sát đƣợc. Chúng ta có dữ liệu bảng cho Y, X1, X2, Xn. Dữ liệu bảng bao gồm N - đối tƣợng và T - thời điểm, và vì vậy chúng ta có N×T quan sát. Mô hình hồi quy tuyến tính cổ điển không có hệ số cắt đƣợc xác định bởi:
Yit = β1X1it +β2X2it +…+ βnXnit + μit với i = 1, 2, …, N và t = 1, 2,…, T Trong đó Yit là giá trị của Y cho đối tƣợng i ở thời điểm t; Xnit là giá trị của Xn đối tƣợng i ở thời điểm t, và μit là sai số của đối tƣợng i ở thời điểm t.
Mô hình hồi quy tác động cố định, là một dạng mở rộng của mô hình hồi quy tuyến tính cổ điển, đƣợc cho bởi:
Yit = β1X1it +β2X2it +…+ βnXnit +νi + εit
Trong đó μit = νi + εit. Sai số của mô hình hồi quy tuyến tính cổ điển đƣợc tách làm hai thành phần. Thành phần νi đại diện cho các yếu tố không quan sát đƣợc khác nhau giữa các đối tƣợng nhƣng không thay đổi theo thời gian. Thành phần εit đại diện cho những yếu tố không quan sát đƣợc khác nhau giữa các đối tƣợng và thay đổi theo thời gian.
Có hai phƣơng pháp ƣớc lƣợng đƣợc sử dụng để ƣớc lƣợng các tham số của mô hình tác động cố định: ƣớc lƣợng hồi quy biến giả bình phƣơng tối thiểu với mỗi biến giả là đại diện cho mỗi đối tƣợng quan sát của mẫu và ƣớc lƣợng tác động cố định (Fixed effects estimator).
+ Khi N lớn, việc sử dụng ƣớc lƣợng LSDV sẽ rất cồng kềnh hoặc không khả thi. Chẳng hạn, chúng ta muốn ƣớc lƣợng mô hình xác định lƣợng, có mẫu N = 1000 ngƣời lao động. Để sử dụng ƣớc lƣợng hồi quy biến giả bình phƣơng tối thiểu, chúng ta sẽ cần tạo ra 1000 biến giả và chạy hồi quy OLS (phƣơng pháp bình phƣơng nhỏ nhất) hơn 1000 biến. Trong trƣờng hợp nhƣ vậy, ƣớc lƣợng tác
động cố định sẽ thích hợp hơn.
Nguyên tắc của ƣớc lƣợng tác động cố định đƣợc hiểu nhƣ sau. Để đánh giá tác động nhân quả của biến độc lập Xn lên biến phụ thuộc Y, ƣớc lƣợng tác động cố định sử dụng sự thay đổi trong Xn, và Y theo thời gian. Gọi Zi là kí hiệu cho một biến không quan sát đƣợc khác nhau giữa các đối tƣợng nhƣng không đổi theo thời gian và vì vậy bao gồm cả phần sai số trong đó. Bởi vì Zi không thay đổi theo thời gian nên nó không thể giải thích bất kì sự thay đổi nào trong Yit. Vì vậy, loại trừ tác động cố định của Zi lên Yit bằng cách sử dụng dữ liệu sự thay đổi của Yit theo thời gian.
b. Mô hình tác động ngẫu nhiên (Random Effects Model)
Xét một mối quan hệ kinh tế bao gồm một biến phụ thuộc, Y, và các biến giải thích quan sát đƣợc, X1, X2…, Xn. Chúng ta có dữ liệu bảng cho Y, X1, X2…, Xn. Dữ liệu bảng gồm có N đối tƣợng và T thời điểm, và vì vậy chúng ta có N×T quan sát.
Mô hình tác động ngẫu nhiên đƣợc viết dƣới dạng: Yit = β1X1it +β2X2it +…+ βnXnit + νi + εi
Với i = 1, 2, …, N và t = 1, 2, …, T
Trong đó, sai số cổ điển đƣợc chia làm 2 thành phần. Thành phần νi đại diện cho tất các các yếu tố không quan sát đƣợc mà thay đổi giữa các đối tƣợng nhƣng không thay đổi theo thời gian. Thành phần εit đại diện cho tất cả các yếu tố không quan sát đƣợc mà thay đổi giữa các đối tƣợng và thời gian. Giả sử rằng νi đƣợc cho bởi:
νi = α0 + ωi, với i = 1, 2, …, N Trong đó, νi lại đƣợc phân chia làm hai thành phần: i) thành phần bất định α0,
Giả định rằng, ωi cho mỗi đối tƣợng đƣợc rút ra từ một phân phối xác suất độc lập với giá trị trung bình bằng 0 và phƣơng sai không đổi, đó là, E(ωi) = 0, Var(ωi) = σω2, Cov(ωi,ωs) = 0
N biến ngẫu nhiên ωi đƣợc gọi tác động ngẫu nhiên (random effects). Mô hình tác động ngẫu nhiên có thể đƣợc viết lại:
Yit = α0X1it + β2X2it +…+ βnXnit + μit
Trong đó μit= ωi + εit. Một giả định quan trọng trong mô hình tác động ngẫu nhiên là thành phần sai số μit không tƣơng quan với bất kì biến giải thích nào trong mô hình.
Ƣớc lƣợng OLS cho mô hình tác động ngẫu nhiên sẽ cho các tham số ƣớc lƣợng không chệch nhƣng lại không hiệu quả. Hơn nữa, ƣớc lƣợng OLS bỏ qua sự tự tƣơng quan trong thành phần sai số μit, do đó thống kê t sẽ không còn chính xác. Để kết quả ƣớc lƣợng không chệch và hiệu quả, chúng ta có thể sử dụng ƣớc lƣợng GLS khả thi (FGLS) để khắc phục hiện tƣợng sai số nhiễu tự tƣơng quan. Ƣớc lƣợng FGLS còn đƣợc gọi là ƣớc lƣợng tác động ngẫu nhiên (Random effects estimator).
2.5.3. Lựa chọn mô hình
Câu hỏi đặt ra là mô hình nào sẽ là mô hình phù hợp: FEM hay REM. Kiểm định Hausman sẽ đƣợc sử dụng để lựa chọn phƣơng pháp ƣớc lƣợng phù hợp giữa hai phƣơng pháp ƣớc lƣợng tác động cố định và tác động ngẫu nhiên (Baltagi, 2013 & Gujarati, 2004). Thực chất kiểm định Hausman để xem xét có tồn tại tự tƣơng quan giữa εi và các biến độc lập hay không.
Giả thiết:
H0: εi và biến độc lập không tƣơng quan H1: εi và biến độc lập có tƣơng quan
Khi giá trị p_value < 0.05 ta bác bỏ H0, khi đó εi và biến độc lập tƣơng quan với nhau ta sử dụng mô hình tác động cố định (FEM). Ngƣợc lại, ta sử
dụng mô hình tác động ngẫu nhiên (REM).
2.5.4. Phân tích tƣơng quan và đa cộng tuyến
a. Phân tích tương quan
Hệ số tƣơng quan (r) là một chỉ số thống kê đo lƣờng mối liên hệ tƣơng quan giữa hai biến số X và Y.
Cho hai biến số x và y từ n mẫu, hệ số tƣơng quan Pearson đƣợc ƣớc tính bằng công thức sau đây:
Trong đó: x , y : giá trị trung bình mẫu của biến x, y
Hệ số tƣơng quan (r) có giá trị từ -1 đến 1. Hệ số tƣơng quan (r) bằng 0 (hay gần 0) có nghĩa là hai biến số không có liên hệ gì với nhau. Ngƣợc lại, nếu hệ số tƣơng quan bằng -1 hay 1 có nghĩa là hai biến số có một mối liên hệ tuyệt đối. Nếu giá trị của hệ số tƣơng quan là âm (r <0) có nghĩa là khi x tăng cao thì y giảm (và ngƣợc lại, khi x giảm thì y tăng). Nếu giá trị hệ số tƣơng quan là dƣơng (r > 0) có nghĩa là khi x tăng cao thì y cũng tăng, và khi x giảm thì y cũng giảm theo.
r > 0,8 : x và y tƣơng quan mạnh, tồn tại đa cộng tuyến. r = 0,4 đến 0,8 : x và y tƣơng quan trung bình.
r < 0,4 : x và y tƣơng quan yếu.
b. Đa cộng tuyến
Thông thƣờng các biến độc lập không có mối quan hệ tuyến tính, nếu quy tắc bị vi phạm sẽ có hiện tƣợng đa cộng tuyến. Nhƣ vậy, đa cộng tuyến là hiện tƣợng các biến độc lập trong mô hình phụ thuộc lẫn nhau và thể hiện đƣợc dƣới dạng hàm số.
Y = β1 + β2X2i + β3X3i + …+ βkXki + Ui (i= 1, 𝑛 )
Các biến X2, X3,…, Xk gọi là các đa cộng tuyến hoàn hảo hay còn gọi là đa cộng tuyến chính xác nếu tồn tại λ2, λ3..., λk không đồng thời bằng 0 sao cho:
λ2X2 + λ3X3 +…+ λkXk = 0 với mọi i
Các biến X2, X3,…, Xk gọi là các đa cộng tuyến không hoàn hảo nếu tồn tại λ2, λ3..., λk không đồng thời bằng 0 sao cho:
λ2X2 + λ3X3 +…+ λkXk + Vi = 0 với Vi là sai số ngẫu nhiên Các giải pháp khắc phục đa cộng tuyến:
- Loại bỏ biến: Vì tính đa cộng tuyến là do những mối quan hệ chặt chẽ giữa các biến độc lập, cách chắc chắn nhất để loại bỏ hoặc giảm bớt các tác động của tính đa cộng tuyến là bỏ một hoặc nhiều biến độc lập ra khỏi mô hình.
- Tăng kích thước mẫu: Giải pháp này thích hợp cho hiện tƣợng đa cộng tuyến do cỡ mẫu nhỏ, vì tăng cỡ mẫu sẽ làm cải thiện độ chính xác của một ƣớc lƣợng và do đó, giảm thiểu đƣợc những yếu tố phản tác dụng của tính đa cộng tuyến. Đôi khi chỉ cần tăng thêm một số quan sát là khắc phục đƣợc hiện tƣợng đa cộng tuyến. Tuy nhiên, việc tăng dữ liệu đôi khi đồng nghĩa với việc tăng chi phí, nhất là đối với dữ liệu sơ cấp.
- Bỏ qua đa cộng tuyến: Nếu t > 2 hoặc R2 của mô hình cao hơn R2
của mô hình hồi quy phụ thì bỏ qua đa cộng tuyến. Nếu nhà nghiên cứu ít quan tâm đến việc diễn dịch từng hệ số riêng lẻ nhƣng lại chú trọng hơn vào việc dự báo, thì tính đa cộng tuyến có thể không phải là một vấn đề nghiêm trọng. Ngay cả khi có tƣơng quan cao giữa các biến độc lập, nếu nhƣ các hệ số hồi quy là có ý nghĩa, có những dấu và giá trị có ý nghĩa, thì không cần quan tâm vào vấn đề đa cộng tuyến. Bởi, nếu một hệ số hồi quy có ý nghĩa ngay cả trong trƣờng hợp có sự hiện diện của đa cộng tuyến thì đó mới là một kết quả mạnh.
- Sử dụng thông tin tiền nghiệm: sử dụng kết quả của các mô hình kinh tế lƣợng trƣớc ít có đa cộng tuyến. Chẳng hạn
Β3 = 0,1 β2. Chạy mô hình với điều kiện tiền nghiệm Y = β1X1 + β2X2+ 0,1 β2X3+ e
Y = β1 + β2X trong đó X = X2 + 0,1X3
Khi ƣớc lƣợng đƣợc β2 thì suy ra β3 từ mối quan hệ tiền nghiệm trên.
2.6. MÔ HÌNH NGHIÊN CỨU
Để xác định ảnh hƣởng của cấu trúc sở hữu đến hiệu quả hoạt động của các công ty trong mẫu nghiên cứu có thể lựa chọn nhiều mô hình toán khác nhau. Đề tài lựa chọn mô hình hồi quy dạng bảng để nghiên cứu ảnh hƣởng của cấu trúc sở hữu đến hiệu quả hoạt động của các công ty niêm yết trên thị trƣờng chứng khoán Việt Nam. Mô hình hồi quy tổng thể có dạng:
H1: Sở hữu Nhà nước có tác động tiêu cực tới hiệu quả hoạt động của các công ty niêm yết.
Mô hình 1: HQHĐ = β1 + β2SO + β3Xit + eit
H2: Sở hữu nước ngoài có tác động tích cực tới hiệu quả hoạt động của các công ty niêm yết.
Mô hình 2: HQHĐ = α1 + α2FO + α3Xit + Ωit
H3: Hiệu quả hoạt động của các công ty niêm yết có mối quan hệ hình chữ U ngược với mức độ tập trung sở hữu Nhà nước.
Mô hình 3: HQHĐ = µ1 + µ2SO + µ3SO2 + µ4Xit + yit
H4: Hiệu quả hoạt động của các công ty niêm yết có mối quan hệ hình chữ U thuận với mức độ tập trung sở hữu nước ngoài.
Mô hình 4: HQHĐ = π1 + π2FO + π3FO2 + π4Xit +φit
Trong đó :
- HQHĐ : Tobin – Q / ROA / ROE - SO : sở hữu trong nƣớc
- FO : sở hữu nƣớc ngoài
• LEV : hệ số nợ • AGE : tuổi công ty • SIZE : quy mô công ty • LID : tính thanh khoản • PRO : lợi nhuận gộp biên • GROWTH : tăng trƣởng
KẾT LUẬN CHƢƠNG 2
Trên cơ sở vận dụng các lý thuyết tài chính, lý thuyết kinh tế và các nghiên cứu thực nghiệm để đƣa ra mối quan hệ giữa cấu trúc sở hữu và hiệu quả hoạt động của công ty.
Trong chƣơng này, tác giả đi vào phân tích đặc điểm của dữ liệu nghiên cứu, xây dựng công thức tính các biến độc lập và biến phụ thuộc đƣợc sử dụng trong mô hình nghiên cứu. Dữ liệu thu thập của 50 công ty niêm yết trên sàn chứng khoán Việt Nam trong 3 năm (2013 - 2015), đƣợc thiết kế dƣới dạng dữ liệu bảng (panel data) nhằm đƣa ra mô hình nghiên cứu ứng dụng kinh tế lƣợng: Mô hình các ảnh hƣởng cố định (FEM) và mô hình các ảnh hƣởng ngẫu nhiên (REM). Sử dụng kiểm định Hausman để lựa chọn mô hình phù hợp nhằm đƣa ra những kết luận sát thực.
CHƢƠNG 3
KẾT QUẢ NGHIÊN CỨU
3.1. THỐNG KÊ MÔ TẢ NGHIÊN CỨU
Thống kê mô tả
Nghiên cứu sử dụng số liệu của của 50 công ty thu thập trong 3 năm 2013 - 2015. Tổng số liệu quan sát đƣợc là 150 quan sát. Theo Bảng 3.1 phân tích thống kê mô tả cho kết quả nhƣ sau:
-Chỉ số Tobin Q của các công ty đƣợc quan sát nằm trong khoản từ 0.1 đến 11.1 và trung bình là 1.2, độ lệch chuẩn 1.2101. Có những công ty chỉ số Tobin Q thấp hơn 1 và có những công ty chỉ số này rất cao, nhƣ vậy nhận định cũng có công ty không đƣợc đánh giá cao của thị trƣờng và có công ty thì đƣợc thị trƣờng cho rằng có rất nhiều tiềm năng phát triển.
-Tỷ suất lợi nhuận trên vốn chủ sở hữu (ROE) của các công ty đƣợc niêm yết trên sàn Chứng khoán Việt Nam trong giai đoạn từ năm 2013 - 2015 nằm trong khoản từ 0% đến 45%, trung bình là 14.27%, độ lệch chuẩn 10.318%. Tƣơng tự tỷ suất lợi nhuận trên tổng tài sàn (ROA) cũng nằm trong khoản từ 0% đến 29%, trung bình là 8.05%, độ lệch chuẩn 6.454%. Tuy nhiên trung bình của ROA lẫn ROE đểu chƣa cao nếu so sánh với lãi suất ngân hàng trong giai đoạn này.