7. Tổng quan tài liệu nghiên cứu
2.3. ĐO LƢỜNG BIẾN PHỤ THUỘC VÀ BIẾN ĐỘC LẬP
2.3.1. Đo lƣờng biến phụ thuộc
Cấu trúc tài chắnh thể hiện chắnh sách tài trợ của doanh nghiệp nên khi phân tắch cấu trúc tài chắnh cần xem xét khả năng sử dụng nguồn vốn tự có của doanh nghiệp hay phải sử dụng nguồn vốn từ bên ngoài. Các chỉ tiêu phản
ánh cấu trúc tài chắnh: Tỷ lệ nợ, tỷ lệ nợ ngắn hạn và tỷ lệ nợ dài hạn. Các chỉ tiêu đƣợc tắnh nhƣ sau:
2.3.2. Đo lƣờng các biến độc lập
Hiệu quả sử dụng vốn (EFFI): Bauer (2004), Deesomsak et al. (2004),
Gaud et al. (2005), Huang and Song (2006) and Bassey et al. (2014), Smith (2012), Alzomaia (2014) và Baltaci & Ayadin (2014) đo lƣờng khả năng sinh lời bằng lợi nhuận sau thuế/Tổng tài sản (ROA). Các tác giả cho rằng, ROA cung cấp cho nhà đầu tƣ thông tin về các khoản lãi vay đƣợc tạo ra từ lƣợng vốn đầu tƣ (hay lƣợng tài sản). Tài sản của một công ty đƣợc hình thành từ vốn vay và vốn chủ sở hữu. Cả hai nguồn này đều sử dụng để tài trợ cho các hoạt động của công ty. Hiệu quả của việc chuyển vốn đầu tƣ thành lợi nhuận đƣợc thể hiện qua ROA. Đây cũng là điều mà các doanh nghiệp và các nhà đầu tƣ quan tâm khi tiến hành các hoạt động vay và cho vay.
Cấu trúc tài sản (TANGI): đƣợc đo lƣờng thông qua chỉ tiêu tỷ trọng
TSCĐhữu hình. Việc sử dụng chỉ tiêu này cũng đƣợc áp dụngtrong các nghiên cứu của Patrik Baurer (2004), H.A. Khrawish và A.H. Ali Khraiwesh (2008) và Đoàn Ngọc Phi Anh (2010). Tỷ trọng tài sản cố định hữu hình của một công ty có thể đƣợc coi là đại diện cho sự đảm bảo có thực đối với các chủ nợ. Patrik Baurer (2004) đã nhấn mạnh đến tầm quan trọng của tài sản cố định trong việc ảnh hƣởng đến quyết định vay nợ của công ty vì tài sản cố
Tỷ lệ nợ = Tổng nợ phải trả Tổng tài sản Tỷ lệ nợ ngắn hạn = Nợ ngắn hạn Tổng tài sản Tỷ lệ nợ dài hạn = Nợ dài hạn Tổng tài sản
định ắt chịu sự bất cân xứng thông tin và chúng có giá trị đƣợc đảm bảo hơn so với tài sản vô hình trong trƣờng hợp công ty phá sản.
Quy mô doanh nghiệp (SIZE): đƣợc đo lƣờng bằng chỉ tiêu doanh thu.
Biến này cũng đƣợc sử dụng ở các nghiên cứu của Titman và Wessels (1988), Huang và Song (2001), Đoàn Ngọc Phi Anh (2010) và Lê Thị Mỹ Phƣơng (2012).Titman và Wessels (1988) chọn chỉ tiêu tổng doanh thu thay vì chỉ tiêu tổng tài sản để đo lƣờng quy mô doanh nghiệp. Lý do là vì một vài công ty chỉ có ắt tài sản nhƣng lại có nhiều nhân viên có năng lực và trình độ nên vẫn có thể đƣa công ty phát triển lớn mạnh. Tuy nhiên điều này lại không đƣợc liệt kê trong tài sản do không thể đo lƣờng đƣợc. Do đó biến doanh thu lại thắch hợp hơn khi sử dụng để đo lƣờng quy mô của doanh nghiệp.
Thời gian hoạt động (AGE): Biến đƣợc đo lƣờng thông qua chỉ tiêu
thời gian hoạt động của doanh nghiệp. Cách đo lƣờng này đƣợc sử dụngtrong các nghiên cứu của Shumi Akhtar & Barry Oliver (2009), Murray Z. Frank và Vidhan K. Goyal (2009) và Lê Thị Mỹ Phƣơng (2012).
Sự tăng trưởng của doanh nghiệp (GROW): Biến này đƣợc đề cập
trong các nghiên cứu của Titman và Wessels (1988), Nguyen và Ramachandran (2006), Biger và các cộng sự (2008), Dzung và các cộng sự (2012). Chỉ tiêu đƣợc sử dụng để đo lƣờng biến là tốc độ tăng trƣởng của tổng tài sản qua các năm.
Rủi ro kinh doanh (RISK): Dựa trên các nghiên cứucủa Huang và
Song (2001), Pandey (2001), Nguyen và Ramachandran (2006)biến này đƣợc đo lƣờng thông qua độ lệch chuẩn của tỷ suất sinh lời của tài sản.
2.4. PHƢƠNG PHÁP PHÂN TÍCH 2.4.1. Mô hình hồi quy dữ liệu bảng 2.4.1. Mô hình hồi quy dữ liệu bảng
-Dữ liệu bảng là các quan sát về một chỉ tiêu nào đó mà tại đó, đơn vị chéo theo không gian đƣợc khảo sát theo thời gian. Nói vắn tắt, dữ liệu bảng có cả bình diện không gian cũng nhƣ thời gian.
-Dữ liệu bảng ngày càng đƣợc sử dụng nhiều trong nghiên cứu kinh tế bởi một số ƣu điểm sau (Badi H. Baltagi, 2013)
-Dữ liệu bảng liên quan đến các cá nhân, doanh nghiệp, thành phố, đất nƣớc,Ầ theo thời gian, nên nhất định phải có tắnh dị biệt (không đồng nhất) trong các đơn vị này. Kỹ thuật ƣớc lƣợng dữ liệu bảng có thể chắnh thức xem xét đến tắnh dị biệt đó bằng cách xem xét các biến số có tắnh đặc thù theo từng cá nhân. Ta sử dụng thuật ngữ cá nhân theo ý nghĩa chung bao gồm các đơn vị vi mô nhƣ các cá nhân, các doanh nghiệp thành phố hay đất nƣớc.
-Thông qua kết hợp các chuỗi theo thời gian của các quan sát theo không gian, dữ liệu bảng cung cấp những dữ liệu có nhiều thông tin hơn, đa dạng hơn, ắt cộng tuyến hơn giữa các biến số, nhiều bậc tự do hơn và hiệu quả hơn.
-Thông qua nghiên cứu các quan sát theo không gian lặp lại, dữ liệu bảng phù hợp hơn để nghiên cứu tắnh động của thay đổi.
-Dữ liệu bảng có thể phát hiện và đo lƣờng tốt hơn những ảnh hƣởng mà không thể quan sát trong dữ liệu chuỗi thời gian thuần túy hay dữ liệu chéo theo không gian thuần túy.
-Dữ liệu bảng giúp ta nghiên cứu những mô hình hành vi phức tạp hơn. Vắ dụ, các hiện tƣợng nhƣ lợi thế kinh tế theo qui mô và thay đổi kỹ thuật có thể đƣợc xem xét thông qua dữ liệu bảng tốt hơn so với dữ liệu theo chuỗi thời gian thuần túy hay theo không gian thuần túy.
-Bằng cách thu thập những số liệu có sẵn cho vài nghìn đơn vị, dữ liệu bảng có thể tối thiểu hóa sự thiên lệch có thể xảy ra nếu ta tổng hợp các cá nhân hay các doanh nghiệp thành số liệu tổng.
Nói vắn tắt, dữ liệu bảng có thể làm phong phú các phân tắch thực nghiệm theo những cách thức mà không chắc có thể đạt đƣợc nếu ta chỉ sử dụng các dữ liệu theo chuỗi thời gian hay không gian thuần túy. Vỡi dữ liệu nghiên cứu theo thời gian (2012-2014) và theo không gian (32 công ty khác nhau), kết hợp lại đƣợc 96 quan sát. Vì vậy, phƣơng pháp hồi quy với dữ liệu bảng (panel data) đƣợc tác giả đƣa vào sử dụng là hoàn toàn hợp lý.
2.4.2. Ƣớc lƣợng mô hình
a. Mô hình tác động cố định (Fixed Effects Model)
Xét một mối quan hệ kinh tế, với biến phụ thuộc, Y, và các biến giải thắch quan sát đƣợc, X1, X2Ầ, Xnvà một hoặc nhiều biến không quan sát đƣợc. Chúng ta có dữ liệu bảng cho Y, X1, X2, Xn. Dữ liệu bảng bao gồm N- đối tƣợng và T-thời điểm, và vì vậy chúng ta có NừT quan sát. Mô hình hồi quy tuyến tắnh cổ điển không có hệ số cắt đƣợc xác định bởi:
Yit = β1X1it +β2X2it +Ầ+ βnXnit + μit với i = 1, 2, Ầ, N và t = 1, 2, Ầ, T Trong đó Yit là giá trị của Y cho đối tƣợng i ở thời điểm t; Xnit là giá trị của Xn cho đối tƣợng i ở thời điểm t, và μit là sai số của đối tƣợng i ở thời điểm t.
Mô hình hồi quy tác động cố định, là một dạng mở rộng của mô hình hồi quy tuyến tắnh cổ điển, đƣợc cho bởi:
Yit = β1X1it +β2X2it +Ầ+ βnXnit +νi + εit
Trong đó μit = νi + εit. Sai số của mô hình hồi quy tuyến tắnh cổ điển đƣợc tách làm hai thành phần. Thành phần νi đại diện cho các yếu tố không quan sát đƣợc khác nhau giữa các đối tƣợng nhƣng không thay đổi theo thời
gian. Thành phần εit đại diện cho những yếu tố không quan sát đƣợc khác nhau giữa các đối tƣợng và thay đổi theo thời gian.
Có hai phƣơng pháp ƣớc lƣợng đƣợc sử dụng để ƣớc lƣợng các tham số của mô hình tác động cố định: ƣớc lƣợng hồi quy biến giả bình phƣơng tối thiểu với mỗi biến giả là đại diện cho mỗi đối tƣợng quan sát của mẫu và ƣớc lƣợng tác động cố định (Fixed effects estimator).
+ Khi N lớn, việc sử dụng ƣớc lƣợng LSDV sẽ rất cồng kềnh hoặc không khả thi. Ch ng hạn, giả sử chúng ta muốn ƣớc lƣợng mô hình xác định lƣơng, có mẫu N = 1000 ngƣời lao động. Để sử dụng ƣớc lƣợng hồi quy biến giả bình phƣơng tối thiểu, chúng ta sẽ cần tạo ra 1000 biến giả và chạy hồi quy OLS(phƣơng pháp bình phƣơng nhỏ nhất) hơn 1000 biến. Trong trƣờng hợp nhƣ vậy, ƣớc lƣợng tác động cố định sẽ thắch hợp hơn.
Nguyên tắc của ƣớc lƣơng tác động cố định đƣợc hiểu nhƣ sau. Để đánh giá tác động nhân quả của biến độc lập Xn lên biến phụ thuộc Y, ƣớc lƣợng tác động cố định sử dụng sự thay đổi trong Xn, và Y theo thời gian. Gọi Zi
là kắ hiệu cho một biến không quan sát đƣợc khác nhau giữa các đối tƣợng nhƣng không đổi theo thời gian và vì vậy bao gồm cả phần sai số trong đó. Bởi vì Zi không thay đổi theo thời gian nên nó không thể giải thắch bất kì sự thay đổi nào trong Yit. Vì vậy, loại trừ tác động cố định của Zilên Yitbằng cách sử dụng dữ liệu sự thay đổi củaYittheo thời gian.
b. Mô hình tác động ngẫu nhiên (Random Effects Model)
Xét một mối quan hệ kinh tế bao gồm một biến phụ thuộc, Y, và các biến giải thắch quan sát đƣợc, X1, X2Ầ, Xn. Chúng ta có dữ liệu bảng cho Y, X1, X2Ầ, Xn. Dữ liệu bảng gồm có N đối tƣợng và T thời điểm, và vì vậy chúng ta có NừT quan sát.
Với i = 1, 2, Ầ, N và t = 1, 2, Ầ, T
Trong đó, sai số cổ điển đƣợc chia làm 2 thành phần. Thành phần νiđại diện cho tất các các yếu tố không quan sát đƣợc mà thay đổi giữa các đối tƣợng nhƣng không thay đổi theo thời gian. Thành phần εit đại diện cho tất cả các yếu tố không quan sát đƣợc mà thay đổi giữa các đối tƣợng và thời gian. Giả sử rằng νiđƣợc cho bởi:
νi = α0 + ωi, với i = 1, 2, Ầ, N
Trong đó, νi lại đƣợc phân chia làm hai thành phần: i) thành phần bất định α0, ii) thành phần ngẫu nhiên ωi.
Giả định rằng, ωi cho mỗi đối tƣợng đƣợc rút ra từ một phân phối xác suất độc lập với giá trị trung bình bằng 0 và phƣơng sai không đổi, đó là, E(ωi) = 0, Var(ωi) = σω2, Cov(ωi,ωs) = 0
N biến ngẫu nhiên ωi đƣợc gọi tác động ngẫu nhiên (random effects). Mô hình tác động ngẫu nhiên có thể đƣợc viết lại:
Yit = α0X1it + β2X2it +Ầ+ βnXnit + μit
Trong đó μit= ωi + εit. Một giả định quan trọng trong mô hình tác động ngẫu nhiên là thành phần sai số μit không tƣơng quan với bất kì biến giải thắch nào trong mô hình.
Ƣớc lƣợng OLS cho mô hình tác động ngẫu nhiên sẽ cho các tham số ƣớc lƣợng không chệch nhƣng lại không hiệu quả. Hơn nữa, ƣớc lƣợng OLS bỏ qua sự tự tƣơng quan trong thành phần sai số μitdo đó thống kê t sẽ không còn chắnh xác. Để kết quả ƣớc lƣợng không chệch và hiệu quả, chúng ta có thể sử dụng ƣớc lƣợng GLS khả thi (FGLS) để khắc phục hiện tƣợng sai số nhiễu tự tƣơng quan. Ƣớc lƣợng FGLS còn đƣợc gọi là ƣớc lƣợng tác động ngẫu nhiên (Random effects estimator).
2.4.3. Lựa chọn mô hình
Kiểm định Hausman sẽ đƣợc sử dụng để lựa chọn phƣơng pháp ƣớc lƣợng phù hợp giữa hai phƣơng pháp ƣớc lƣợng tác động cố định và tác động ngẫu nhiên (Baltagi, 2013 & Gujarati, 2004). Thực chất kiểm định Hausman để xem xét có tồn tại tự tƣơng quan giữa εi và các biến độc lập hay không.
Giả thiết:
H0: εi và biến độc lập không tƣơng quan H1: εi và biến độc lập có tƣơng quan
Khi giá trị p_value <0.05 ta bác bỏ H0, khi đó εi và biến độc lập tƣơng quan với nhauta sử dụng mô hình tác động cố định (FEM).Ngƣợc lại, ta sử dụng mô hình tác động ngẫu nhiên (REM).
2.4.4. Phân tắch tƣơng quan và đa cộng tuyến
a. Phân tắch tương quan
Hệ số tƣơng quan (r) là một chỉ số thống kê đo lƣờng mối liên hệ tƣơng quan giữa hai biến số X và Y
Cho hai biến số x và y từ n mẫu, hệ số tƣơng quan Pearson đƣợc ƣớc tắnh bằng công thức sau đây:
r = ∑ ̅ ̅ √∑ ̅ ∑ ̅
Trong đó: ̅, ̅, : giá trị trung bình mẫu của biến x, y
Hệ số tƣơng quan (r) có giá trị từ -1 đến 1. Hệ số tƣơng quan (r) bằng 0 (hay gần 0) có nghĩa là hai biến số không có liên hệ gì với nhau. Ngƣợc lại, nếu hệ số tƣơng quan bằng -1 hay 1 có nghĩa là hai biến số có một mối liên hệ tuyệt đối. Nếu giá trị của hệ số tƣơng quan là âm (r <0) có nghĩa là khi x tăng cao thì y giảm (và ngƣợc lại, khi x giảm thì y tăng). Nếu giá trị hệ số tƣơng quan là dƣơng (r > 0) có nghĩa là khi x tăng cao thì y cũng tăng, và khi x giảm thì y cũng giảm theo.
> 0,8 : x và y tƣơng quan mạnh, tồn tại đa cộng tuyến. = 0,4 đến 0,8 : x và y tƣơng quan trung bình.
< 0,4 : x và y tƣơng quan yếu.
b. Đa cộng tuyến
Thông thƣờng các biến độc lập không có mối quan hệ tuyến tắnh, nếu quy tắc bị vi phạm sẽ có hiện tƣợng đa cộng tuyến. Nhƣ vậy, đa cộng tuyến là hiện tƣợng các biến độc lập trong mô hình phụ thuộc lẫn nhau và thể hiện đƣợc dƣới dạng hàm số.
Giả sử ta phải ƣớc lƣợng hàm hồi quy Y gồm k biến giải thắch X1, X2, X3,Ầ, Xk
Y = β1 + β2X2i + β3X3i + Ầ+ βkXki + Ui (i= )
Các biến X2, X3,Ầ, Xk gọi là các đa cộng tuyến hoàn hảo hay còn gọi là đa cộng tuyến chắnh xác nếu tồn tại λ2, λ3..., λk không đồng thời bằng 0 sao cho:
λ2X2 + λ3X3 +Ầ+ λkXk = 0 với mọi i
Các biến X2, X3,Ầ, Xk gọi là các đa cộng tuyến không hoàn hảo nếu tồn tại λ2, λ3..., λk không đồng thời bằng 0 sao cho:
λ2X2 + λ3X3 +Ầ+ λkXk + Vi = 0 với Vi là sai số ngẫu nhiên Các giải pháp khắc phục đa cộng tuyến:
-Loại bỏ biến: Vì tắnh đa cộng tuyến là do những mối quan hệ chặt chẽ
giữa các biến độc lập, cách chắc chắn nhất để loại bỏ hoặc giảm bớt các tác động của tắnh đa cộng tuyến là bỏ một hoặc nhiều biến độc lập ra khỏi mô hình.
-Tăng kắch thước mẫu: Giải pháp này thắch hợp cho hiện tƣợng đa cộng
tuyến do cỡ mẫu nhỏ, vì tăng cỡ mẫu sẽ làm cải thiện độ chắnh xác của một ƣớc lƣợng và do đó, giảm thiểu đƣợc những yếu tố phản tác dụng của tắnh đa cộng tuyến. Đôi khi chỉ cần tăng thêm một số quan sát là khắc phục đƣợc hiện
tƣợng đa cộng tuyến. Tuy nhiên, việc tăng dữ liệu đôi khi đồng nghĩa với việc tăng chi phắ, nhất là đối với dữ liệu sơ cấp.
-Bỏ qua đa cộng tuyến: Nếu | |> 2 hoặc R2 của mô hình cao hơn R2 của
mô hình hồi quy phụ thì bỏ qua đa cộng tuyến. Nếu nhà nghiên cứu ắt quan tâm đến việc diễn dịch từng hệ số riêng lẻ nhƣng lại chú trọng hơn vào việc dự báo, thì tắnh đa cộng tuyến có thể không phải là một vấn đề nghiêm trọng. Ngay cả khi có tƣơng quan cao giữa các biến độc lập, nếu nhƣ các hệ số hồi quy là có ý nghĩa, có những dấu và giá trị có ý nghĩa, thì không cần quan tâm vào vấn đề đa cộng tuyến. Bởi, nếu một hệ số hồi quy có ý nghĩa ngay cả trong trƣờng hợp có sự hiện diện của đa cộng tuyến thì đó mới là một kết quả mạnh.
-Sử dụng thông tin tiền nghiệm: sử dụng kết quả của các mô hình kinh tế
lƣợng trƣớc ắt có đa công tuyến. Vắ dụ: chúng ta có thể biết tác động biên của của cải lên tiêu dùng chỉ bằng 1/10 so với tác động biên của thu nhập lên tiêu dùng. Ch ng hạn
Β3 = 0,1 β2. Chạy mô hình với điều kiện tiền nghiệm Y = β1X1 + β2X2+ 0,1 β2X3+ e
Y = β1 + β2X trong đó X = X2 + 0,1X3
Khi ƣớc lƣợng đƣợc β2 thì suy ra β3 từ mối quan hệ tiền nghiệm trên.
2.4.5. Kiểm định độ phù hợp của mô hình
Trong mô hình hồi quy, một mô hình đƣợc cho là không có sức mạnh