c. Quy mô doanh nghiệp
2.4. PHƯƠNG PHÁP PHÂN TÍCH
2.4.1.Mô hình hồi quy dữ liệu bảng
- Dữ liệu bảng là các quan sát về một chỉ tiêu nào đó mà tại đó, đơn vị chéo theo không gian được khảo sát theo thời gian. Nói vắn tắt, dữ liệu bảng có cả bình diện không gian cũng như thời gian.
- Dữ liệu bảng ngày càng được sử dụng nhiều trong nghiên cứu kinh tế bởi một số ưu điểm sau (Badi H. Baltagi, 2013)
- Dữ liệu bảng liên quan đến các cá nhân, doanh nghiệp, thành phố, đất nước,Ầ theo thời gian, nên nhất định phải có tắnh dị biệt (không đồng nhất) trong các đơn vị này. Kỹ thuật ước lượng dữ liệu bảng có thể chắnh thức xem xét đến tắnh dị biệt đó bằng cách xem xét các biến số có tắnh đặc thù theo từng cá
nhân. Ta sử dụng thuật ngữ cá nhân theo ý nghĩa chung bao gồm các đơn vị vi mô như các cá nhân, các doanh nghiệp thành phố hay đất nước.
- Thông qua kết hợp các chuỗi theo thời gian của các quan sát theo không gian, dữ liệu bảng cung cấp những dữ liệu có nhiều thông tin hơn, đa dạng hơn, ắt cộng tuyến hơn giữa các biến số, nhiều bậc tự do hơn và hiệu quả hơn.
- Thông qua nghiên cứu các quan sát theo không gian lặp lại, dữ liệu bảng phù hợp hơn để nghiên cứu tắnh động của thay đổi.
- Dữ liệu bảng có thể phát hiện và đo lường tốt hơn những ảnh hưởng mà không thể quan sát trong dữ liệu chuỗi thời gian thuần túy hay dữ liệu chéo theo không gian thuần túy.
- Dữ liệu bảng giúp ta nghiên cứu những mô hình hành vi phức tạp hơn. Vắ dụ, các hiện tượng như lợi thế kinh tế theo qui mô và thay đổi kỹ thuật có thể được xem xét thông qua dữ liệu bảng tốt hơn so với dữ liệu theo chuỗi thời gian thuần túy hay theo không gian thuần túy.
- Bằng cách thu thập những số liệu có sẵn cho vài nghìn đơn vị, dữ liệu bảng có thể tối thiểu hóa sự thiên lệch có thể xảy ra nếu ta tổng hợp các cá nhân hay các doanh nghiệp thành số liệu tổng.
Nói vắn tắt, dữ liệu bảng có thể làm phong phú các phân tắch thực nghiệm theo những cách thức mà không chắc có thể đạt được nếu ta chỉ sử dụng các dữ liệu theo chuỗi thời gian hay không gian thuần túy. Vỡi dữ liệu nghiên cứu theo thời gian (2012-2014) và theo không gian (32 công ty khác nhau), kết hợp lại được 96 quan sát. Vì vậy, phương pháp hồi quy với dữ liệu bảng (panel data) được tác giả đưa vào sử dụng là hoàn toàn hợp lý.
2.4.2.Ước lượng mô hình
a. Mô hình tác động cố định (Fixed Effects Model)
Xét một mối quan hệ kinh tế, với biến phụ thuộc, Y, và các biến giải thắch quan sát được, X1, X2Ầ, Xnvà một hoặc nhiều biến không quan sát
được. Chúng ta có dữ liệu bảng cho Y, X1, X2, Xn. Dữ liệu bảng bao gồm N- đối tượng và T-thời điểm, và vì vậy chúng ta có NừT quan sát. Mô hình hồi quy tuyến tắnh cổ điển không có hệ số cắt được xác định bởi:
Yit = β1X1it +β2X2it +Ầ+ βnXnit + μit với i = 1, 2, Ầ, N và t = 1, 2, Ầ, T Trong đó Yit là giá trị của Y cho đối tượng i ở thời điểm t; Xnit là giá trị của Xn cho đối tượng i ở thời điểm t, và μit là sai số của đối tượng i ở thời điểm t.
Mô hình hồi quy tác động cố định, là một dạng mở rộng của mô hình hồi quy tuyến tắnh cổ điển, được cho bởi:
Yit = β1X1it +β2X2it +Ầ+ βnXnit +νi + εit
Trong đó μit = νi + εit. Sai số của mô hình hồi quy tuyến tắnh cổ điển được tách làm hai thành phần. Thành phần νi đại diện cho các yếu tố không quan sát được khác nhau giữa các đối tượng nhưng không thay đổi theo thời gian. Thành phần εit đại diện cho những yếu tố không quan sát được khác nhau giữa các đối tượng và thay đổi theo thời gian.
Có hai phương pháp ước lượng được sử dụng để ước lượng các tham số của mô hình tác động cố định: ước lượng hồi quy biến giả bình phương tối thiểu với mỗi biến giả là đại diện cho mỗi đối tượng quan sát của mẫu và ước lượng tác động cố định (Fixed effects estimator).
+ Khi N lớn, việc sử dụng ước lượng LSDV sẽ rất cồng kềnh hoặc không khả thi. Chẳng hạn, giả sử chúng ta muốn ước lượng mô hình xác định lương, có mẫu N = 1000 người lao động. Để sử dụng ước lượng hồi quy biến giả bình phương tối thiểu, chúng ta sẽ cần tạo ra 1000 biến giả và chạy hồi quy OLS(phương pháp bình phương nhỏ nhất) hơn 1000 biến. Trong trường hợp như vậy, ước lượng tác động cố định sẽ thắch hợp hơn.
Nguyên tắc của ước lương tác động cố định được hiểu như sau. Để đánh giá tác động nhân quả của biến độc lập Xn lên biến phụ thuộc Y, ước lượng tác
động cố định sử dụng sự thay đổi trong Xn, và Y theo thời gian. Gọi Zi là kắ hiệu cho một biến không quan sát được khác nhau giữa các đối tượng nhưng không đổi theo thời gian và vì vậy bao gồm cả phần sai số trong đó. Bởi vì Zi không thay đổi theo thời gian nên nó không thể giải thắch bất kì sự thay đổi nào trong Yit. Vì vậy, loại trừ tác động cố định của Zilên Yitbằng cách sử dụng dữ liệu sự thay đổi của Yit theo thời gian.
b. Mô hình tác động ngẫu nhiên (Random Effects Model)
Xét một mối quan hệ kinh tế bao gồm một biến phụ thuộc, Y, và các biến giải thắch quan sát được, X1, X2Ầ, Xn. Chúng ta có dữ liệu bảng cho Y, X1, X2Ầ, Xn. Dữ liệu bảng gồm có N đối tượng và T thời điểm, và vì vậy chúng ta có NừT quan sát.
Mô hình tác động ngẫu nhiên được viết dưới dạng: Yit = β1X1it +β2X2it +Ầ+ βnXnit + νi + εit
Với i = 1, 2, Ầ, N và t = 1, 2, Ầ, T
Trong đó, sai số cổ điển được chia làm 2 thành phần. Thành phần νiđại diện cho tất các các yếu tố không quan sát được mà thay đổi giữa các đối tượng nhưng không thay đổi theo thời gian. Thành phần εit đại diện cho tất cả các yếu tố không quan sát được mà thay đổi giữa các đối tượng và thời gian. Giả sử rằng νiđược cho bởi:
νi = α0 + ωi, với i = 1, 2, Ầ, N
Trong đó, νi lại được phân chia làm hai thành phần: i) thành phần bất định α0, ii) thành phần ngẫu nhiên ωi.
Giả định rằng, ωi cho mỗi đối tượng được rút ra từ một phân phối xác suất độc lập với giá trị trung bình bằng 0 và phương sai không đổi, đó là, E(ωi) = 0, Var(ωi) = σω2, Cov(ωi,ωs) = 0
N biến ngẫu nhiên ωi được gọi tác động ngẫu nhiên (random effects). Mô hình tác động ngẫu nhiên có thể được viết lại:
Yit = α0X1it + β2X2it +Ầ+ βnXnit + μit
Trong đó μit= ωi + εit. Một giả định quan trọng trong mô hình tác động ngẫu nhiên là thành phần sai số μit không tương quan với bất kì biến giải thắch nào trong mô hình.
Ước lượng OLS cho mô hình tác động ngẫu nhiên sẽ cho các tham số ước lượng không chệch nhưng lại không hiệu quả. Hơn nữa, ước lượng OLS bỏ qua sự tự tương quan trong thành phần sai số μitdo đó thống kê t sẽ không còn chắnh xác. Để kết quả ước lượng không chệch và hiệu quả, chúng ta có thể sử dụng ước lượng GLS khả thi (FGLS) để khắc phục hiện tượng sai số nhiễu tự tương quan. Ước lượng FGLS còn được gọi là ước lượng tác động ngẫu nhiên (Random effects estimator).
2.4.3.Lựa chọn mô hình
Câu hỏi đặt ra là mô hình nào sẽ là mô hình phù hợp: FEM hay REM. Kiểm định Hausman sẽ được sử dụng để lựa chọn phương pháp ước lượng phù hợp giữa hai phương pháp ước lượng tác động cố định và tác động ngẫu nhiên (Baltagi, 2013 & Gujarati, 2004). Thực chất kiểm định Hausman để xem xét có tồn tại tự tương quan giữa εi và các biến độc lập hay không.
Giả thiết:
H0: εi và biến độc lập không tương quan H1: εi và biến độc lập có tương quan
Khi giá trị p_value <0.05 ta bác bỏ H0, khi đó εi và biến độc lập tương quan với nhauta sử dụng mô hình tác động cố định (FEM).Ngược lại, ta sử dụng mô hình tác động ngẫu nhiên (REM).
2.4.4.Phân tắch tương quan và đa cộng tuyến
a. Phân tắch tương quan
Hệ số tương quan (r) là một chỉ số thống kê đo lường mối liên hệ tương quan giữa hai biến số X và Y
Cho hai biến số x và y từ n mẫu, hệ số tương quan Pearson được ước tắnh bằng công thức sau đây:
r =
Trong đó: , , : giá trị trung bình mẫu của biến x, y
Hệ số tương quan (r) có giá trị từ -1 đến 1. Hệ số tương quan (r) bằng 0 (hay gần 0) có nghĩa là hai biến số không có liên hệ gì với nhau. Ngược lại, nếu hệ số tương quan bằng -1 hay 1 có nghĩa là hai biến số có một mối liên hệ tuyệt đối. Nếu giá trị của hệ số tương quan là âm (r <0) có nghĩa là khi x tăng cao thì y giảm (và ngược lại, khi x giảm thì y tăng). Nếu giá trị hệ số tương quan là dương (r > 0) có nghĩa là khi x tăng cao thì y cũng tăng, và khi x giảm thì y cũng giảm theo.
> 0,8 : x và y tương quan mạnh, tồn tại đa cộng tuyến. = 0,4 đến 0,8 : x và y tương quan trung bình.
< 0,4 : x và y tương quan yếu. b. Đa cộng tuyến
Thông thường các biến độc lập không có mối quan hệ tuyến tắnh, nếu quy tắc bị vi phạm sẽ có hiện tượng đa cộng tuyến. Như vậy, đa cộng tuyến là hiện tượng các biến độc lập trong mô hình phụ thuộc lẫn nhau và thể hiện được dưới dạng hàm số.
Giả sử ta phải ước lượng hàm hồi quy Y gồm k biến giải thắch X1, X2, X3, Ầ, Xk
Y = β1 + β2X2i + β3X3i + Ầ+ βkXki + Ui (i= )
Các biến X2, X3,Ầ, Xk gọi là các đa cộng tuyến hoàn hảo hay còn gọi là đa cộng tuyến chắnh xác nếu tồn tại λ2, λ3..., λk không đồng thời bằng 0 sao cho:
λ2X2 + λ3X3 +Ầ+ λkXk = 0 với mọi i
Các biến X2, X3,Ầ, Xk gọi là các đa cộng tuyến không hoàn hảo nếu tồn tại λ2, λ3..., λk không đồng thời bằng 0 sao cho:
λ2X2 + λ3X3 +Ầ+ λkXk + Vi = 0 với Vi là sai số ngẫu nhiên Các giải pháp khắc phục đa cộng tuyến:
- Loại bỏ biến: Vì tắnh đa cộng tuyến là do những mối quan hệ chặt chẽ giữa
các biến độc lập, cách chắc chắn nhất để loại bỏ hoặc giảm bớt các tác động của tắnh đa cộng tuyến là bỏ một hoặc nhiều biến độc lập ra khỏi mô hình.
- Tăng kắch thước mẫu: Giải pháp này thắch hợp cho hiện tượng đa cộng tuyến
do cỡ mẫu nhỏ, vì tăng cỡ mẫu sẽ làm cải thiện độ chắnh xác của một ước lượng và do đó, giảm thiểu được những yếu tố phản tác dụng của tắnh đa cộng tuyến. Đôi khi chỉ cần tăng thêm một số quan sát là khắc phục được hiện tượng đa cộng tuyến. Tuy nhiên, việc tăng dữ liệu đôi khi đồng nghĩa với việc tăng chi phắ, nhất là đối với dữ liệu sơ cấp.
- Bỏ qua đa cộng tuyến: Nếu > 2 hoặc R2 của mô hình cao hơn R2 của mô hình hồi quy phụ thì bỏ qua đa cộng tuyến. Nếu nhà nghiên cứu ắt quan tâm đến việc diễn dịch từng hệ số riêng lẻ nhưng lại chú trọng hơn vào việc dự báo, thì tắnh đa cộng tuyến có thể không phải là một vấn đề nghiêm trọng. Ngay cả khi có tương quan cao giữa các biến độc lập, nếu như các hệ số hồi quy là có ý nghĩa, có những dấu và giá trị có ý nghĩa, thì không cần quan tâm vào vấn đề đa cộng tuyến. Bởi, nếu một hệ số hồi quy có ý nghĩa ngay cả trong trường hợp có sự hiện diện của đa cộng tuyến thì đó mới là một kết quả mạnh.
- Sử dụng thông tin tiền nghiệm: sử dụng kết quả của các mô hình kinh tế lượng
trước ắt có đa công tuyến. Vắ dụ: chúng ta có thể biết tác động biên của của cải lên tiêu dùng chỉ bằng 1/10 so với tác động biên của thu nhập lên tiêu dùng. Chẳng hạn
Β3 = 0,1 β2. Chạy mô hình với điều kiện tiền nghiệm Y = β1X1 + β2X2+ 0,1 β2X3+ e
Y = β1 + β2X trong đó X = X2 + 0,1X3
Khi ước lượng được β2 thì suy ra β3 từ mối quan hệ tiền nghiệm trên.
2.4.5.Kiểm định độ phù hợp của mô hình
Trong mô hình hồi quy, một mô hình được cho là không có sức mạnh giải thắch khi toàn bộ các hệ số hồi quy riêng phần đều bằng không.
Giả thuyết: H0 : = = Ầ = = 0
H1 : Có ắt nhất một trong những giá trị không bằng 0 Trị thống kê kiểm định đối với giả thiết này là:
= =
Từ số liệu trong bảng phân phối Fisher, trị số F tương ứng với bậc tự do
k Ờ 1 cho tử số và n Ờ k cho mẫu số, và với mức ý nghĩa cho trước , ta có .
So sánh và : chấp nhận H0
bác bỏ H0
Nếu p_value tắnh được nhỏ hơn mức ý nghĩa () thì bác bỏ giả thuyết H0
KẾT LUẬN CHƯƠNG 2
Trên cơ sở vận dụng các lý thuyết tài chắnh, lý thuyết kinh tế và các nghiên cứu thực nghiệm để đưa ra mối quan hệ giữa tỷ lệ nợ, tỷ lệ nợ ngắn hạn, tỷ lệ nợ dài hạn và ROA, tỷ trọng tài sản cố định, tổng tài sản, thời gian hoạt động của doanh nghiệp, tốc độ tăng trưởng, hệ số biến thiên ROA.
Trong chương này, tác giả đi vào phân tắch đặc điểm của dữ liệu nghiên cứu, xây dựng công thức tắnh các biến độc lập và biến phụ thuộc được sử dụng trong mô hình nghiên cứu. Dữ liệu thu thập của 32 doanh nghiệp nhóm ngành dầu khắ niêm yết trên sàn chứng khoán Việt Nam trong 3 năm (2012 - 2014), được thiết kế dưới dạng dữ liệu bảng (panel data) nhằm đưa ra mô hình nghiên cứu ứng dụng kinh tế lượng: Mô hình các ảnh hưởng cố định (FEM) và mô hình các ảnh hưởng ngẫu nhiên (REM). Sử dụng kiểm định Hausman để lựa chọn mô hình phù hợp nhằm đưa ra những kết luận sát thực.
CHƯƠNG 3