37
3.4.2.2. Kiểm định đa cộng tuyến (Multicollinearity test)
Một trong các giả định của mơ hình hồi quy tuyến tính cổ điển là các biến giải thích (biến độc lập) phải độc lập với nhau. Nếu các biến độc lập trong một mơ hình hồi quy đa biến có mối liên hệ cao, tương quan lớn thì sẽ xảy ra vấn đề đa cộng tuyến. Đa cộng tuyến làm cho các hệ số hồi quy có sai số chuẩn tương đối lớn so với giá trị của các hệ số. Thậm chí, trong một vài trường hợp, mặc dù các hệ số hồi quy không mang ý nghĩa thống kê nhưng đa cộng tuyến làm cho độ tương thích của mơ hình (R2) vẫn ở mức rất cao.
Để kiểm tra đa cộng tuyến, tác giả sử dụng ma trận tương quan (correlation matrix). Theo quy ước thông thường được chấp nhận, nếu sự tương quan giữa hai biến độc lập lớn hơn 0.5 thì xem như mơ hình hồi quy gặp phải vấn đề đa cộng tuyến.
Có một vài cách có thể được sử dụng để xử lý vấn đề đa cộng tuyến. Thứ nhất, ta có thể loại bỏ các biến cộng tuyến với nhau ra khỏi mơ hình. Một cách khác là biến đổi các biến tương quan cao thành dạng tỷ số hoặc tăng độ lớn mẫu thống kê. Cách cuối cùng là khơng thay đổi gì cả nếu mỗi hệ số đều có độ lớn và dấu phù hợp.
3.4.2.3. Các kiểm định nhằm tìm ra phƣơng pháp hồi quy dữ liệu bảng phù hợp nhất: Mơ hình Pooled OLS, Ảnh hƣởng cố định, Ảnh hƣởng ngẫu nhiên
Phương pháp pooled OLS là phương pháp ước lượng bình phương nhỏ nhất thông thường được áp dụng cho dữ liệu vừa có tính chất là dữ liệu chéo (cross-sectional) vừa có tính chất chuỗi thời gian (time series). Pooled OLS giả định rằng các hằng số và hệ số góc thì khơng đổi theo thời gian và khơng đổi giữa các cá thể. Do đó, phương pháp pooled OLS không kể đến việc khác nhau giữa các các thể và sự thay đổi theo thời gian.
Ngược lại, mô hình ảnh hưởng cố định lại kể đến tính đặc thù của các cá thể. Nếu ảnh hưởng đặc thù của các cá thể khơng được phát hiện nhưng nó lại tương quan với các
38
biến độc lập thì ước lượng bình phương nhỏ nhất sẽ khơng khách quan và khơng nhất qn. Mơ hình ảnh hưởng cố định giả định rằng sự khác biệt cá thể được phản ánh lên các giao điểm tọa độ, có nghĩa là mỗi cá thể có một hằng số cố định riêng mặc dù hệ số góc của chúng giống nhau. Mơ hình ảnh hưởng cố định kiểm sốt các yếu tố đặc thù không đổi theo thời gian bằng cách loại bỏ chúng ra khỏi mơ hình để chúng ta có thể đánh giá được ảnh hưởng đơn thuần của các biến độc lập lên biến phụ thuộc.
Tương phản với mơ hình ảnh hưởng cố định, mơ hình ảnh hưởng ngẫu nhiên giả định rằng các hiệu ứng đặc thù được phản ánh bới một biến ngẫu nhiên, khơng liên hệ với các biến độc lập. mơ hình này cho phép ước lượng được các yếu tố đặc thù đã bị loại bỏ khỏi trong mơ hình ảnh hưởng cố định.
Để lựa chọn được phương pháp phân tích hồi quy phù hợp nhất cho dữ liệu bảng, các kiểm định F, kiểm định nhân tử Lagrange và kiểm định Hausman được sử dụng.
Đầu tiên, kiểm định F được tiến hành để chọn giữa phương pháp pooled OLS và phương pháp ảnh hưởng cố định. Theo giả thiết Ho của F-test, các hằng số (phản ánh tính đặc thù) thì giống nhau giữa các cá thể, đơn vị. Nếu giả thiết Ho bị bác bỏ, phương pháp ảnh hưởng cố định được cho là phù hợp hơn.
Trong trường hợp giả thiết Ho không bị bác bỏ và phương pháp pooled OLS được lựa chọn, chúng ta nên tiến hành kiểm định nhân tử Lagrange để kiểm tra xem phương pháp pooled OLS hay phương pháp ảnh hưởng ngẫu nhiên thì phù hợp hơn. Giả thiết Ho được đưa ra là phương sai giữa các cá thể bằng 0. Nếu giả thiết này không bị bác bỏ, phương pháp pooled OLS sẽ được chọn vì là phương pháp phù hợp nhất. Ngược lại, phương pháp pháp ảnh hưởng ngẫu nhiên sẽ được chọn.
Nếu kết quả của kiểm định F và kiểm định nhân tử Lagrange cho ảnh hưởng ngẫu nhiên đều mang ý nghĩa thống kê, ta sẽ tiến hành kiểm định Hausman để chọn giữa phương pháp ảnh hưởng cố định và ảnh hưởng ngẫu nhiên. Giả thiết Ho cho kiểm định này là khơng có sự khác biệt giữa các hệ số ước lượng của phương pháp ảnh hưởng cố
39
định và ảnh hưởng ngẫu nhiên. Nếu giả thiết Ho bị bác bỏ, có thể kết luận rằng phương pháp ảnh hưởng cố định thì hiệu quả hơn, và ngược lại.
Sau khi tiến hành các kiểm định này, phương pháp phân tích dữ liệu bảng phù hợp và hiệu quả nhất sẽ được lựa chọn.
3.4.2.4. Kiểm định chẩn đoán phƣơng sai thay đổi và sự tự tƣơng quan
3.4.2.4.1. Kiểm định chẩn đoán phƣơng sai thay đổi: kiểm định Breusch-Pagan
Một trong các giả định của mơ hình hồi quy tuyến tính cổ điển là phương sai của sai số phải không đổi. Một khi vấn đề phương sai thay đổi xảy ra, các ước lượng vẫn khách quan và nhất quán, tuy nhiên lại kém hiệu quả vì phương sai giữa các ước lượng này không cịn là con số nhỏ nhất. Từ đó, các sai số chuẩn khơng cịn đáng tin cậy, có thể quá lớn hoặc quá nhỏ, làm cho các kết luận trở nên khơng chính xác.
Hai kiểm định được dùng phổ biến để chẩn đoán đoán phương sai thay đổi là kiểm định White và kiểm định Breusch-Pagan. Tuy nhiên do mẫu thống kê của nghiên cứu này không quá lớn nên kiểm định Breusch-Pagan sẽ phù hợp hơn. Giả thiết Ho là phương sai của các sai số thì đồng nhất. Nếu Ho bị bác bỏ, chứng tỏ rằng có tồn tại vấn đề phương sai thay đổi trong mẫu dữ liệu.
3.4.2.4.2. Kiểm định chẩn đoán tự tƣơng quan: kiểm định Wooldridge
Sự tự tương quan xảy ra khi hiệp phương sai giữa các sai số theo thời gian hoặc giữa các cá thể khác khơng, hay nói cách khác hiệp phương sai giữa các sai số có sự tương quan với nhau. Hậu quả của vấn đề này cũng tương tự như vấn đề phương sai thay đổi đã nêu ở trên, làm cho các ước lượng trở nên kém hiệu quả.
Kiểm định Wooldridge nhằm kiểm định sự tự tương quan bậc nhất (first order autocorrelation). Dưới giả thiết Ho, các sai số không tương quan với các giá trị trước đó gần nhất của nó. Giả thiết Ho bị bác bỏ cho thấy sự tồn tại sự tự tương quan.
40
3.4.2.4.3. Các biện pháp khắc phục cho vấn đề phƣơng sai thay đổi và tự tƣơng quan
Trong trường hợp có tồn tại vấn đề phương sai thay đổi và tự tương quan, ta có thể dùng ước lượng sai số chuẩn White (White’s standard error estimates) và ước lượng sai số chuẩn Rogers (Rogers’s standard error estimates) để khắc phục, nhằm làm cho kết quả ước lượng trở nên chính xác hơn.
41
C ƢƠNG 4: PHÂN TÍCH DỮ LIỆU 4.1. Thống kê mơ tả
Bộ dữ liệu phục vụ cho nghiên cứu bao gồm 298 quan sát, được lấy từ 45 công ty thuộc ngành logistics tại Việt Nam, cho giai đoạn 7 năm từ năm 2011 đến năm 2017.
Thống kê mơ tả cho tồn bộ mẫu dữ liệu giai đoạn 2011-2017 được trình bày trong Bảng 4.1.
Bảng 4.1. Thống kê mô tả các biến
Biến (Variable) Số quan sát (Obs) Trung bình (Mean) Sai số chuẩn (Std. Dev.) Giá trị nhỏ nhất (Min) Giá trị lớn nhất (Max) ROA 298 0.1108081 0.1078704 -0.1189679 0.7168318 SDA 298 0.0499326 0.0647376 0 0.4337961 LDA 298 0.1035493 0.1372620 0 0.6029061 DA 298 0.1534818 0.1674745 0 0.6160223 CEE 298 0.3160193 0.1995693 -0.0255566 1.0570230 HCE 298 3.0105540 2.6643440 -0.2751975 28.051110 SCE 298 0.5877574 0.461751 0.1113283 6.4847570 VAIC 298 3.9143310 2.7765390 1.0613030 29.237470 SIZE 298 11.652600 0.5667879 10.605450 13.052740 SG 298 0.5682962 7.3972840 -0.8509265 127.45790 Biến (Variable) Số quan sát (Obs) Phân vị thứ 10 (10th percentile) Phân vị thứ 25 (25th percentile) Trung vị (Median) Phân vị thứ 75 (75th percentile) ROA 298 0.0189191 0.0479915 0.0881657 0.1320297 SDA 298 0 0 0.0235118 0.0806657 LDA 298 0 0 0.0274555 0.1869669 DA 298 0 0 0.0873524 0.2801355 CEE 298 0.1336282 0.2006985 0.2677385 0.3655390 HCE 298 1.3916290 1.5690230 2.4029550 3.4691960 SCE 298 0.2875876 0.3757021 0.5878578 0.7145680 VAIC 298 2.0254510 2.3976180 3.3445280 4.4905900 SIZE 298 11.000950 11.297750 11.544000 11.955810 SG 298 -0.1373948 -0.0253363 0.1004079 0.2198442
42
4.1.1. Tỷ suất sinh lời trên tổng tài sản (ROA)
Bảng 4.2. Thống kê mô tả biến ROA - Tỷ suất sinh lời trên tổng tài sản
ROA Percentiles Smallest 1% -0.0739758 -0.1189679 5% 0.0021406 -0.0847381 10% 0.0189191 -0.0739758 Obs 298 25% 0.0479915 -0.0638180 Sum of Wgt. 298 50% 0.0881657 Mean 0.1108081 Largest Std. Dev. 0.1078704 75% 0.1320297 0.5523390 90% 0.2422193 0.5797314 Variance 0.0116360 95% 0.2985788 0.6023404 Skewness 2.2389630 99% 0.5797314 0.7168318 Kurtosis 10.442340
Từ Bảng 4.2 có thể thấy các cơng ty thuộc ngành logistics Việt Nam có tỷ suất sinh lời trên tổng tài sản (ROA) trung bình ở mức 11.08%. Giá trị trung vị (median) ROA ở mức 0.0881657 cho thấy rằng 50% trong tổng số các (quan sát mẫu) doanh nghiệp trong ngành có tỷ suất ROA khơng vượt quá 8.82%. Phân vị thứ 10 nhận một giá trị dương 0.0189191 cũng ngụ ý rằng ít nhất 90% số công ty trong mẫu thống kê hoạt động kinh doanh có lời với ROA trên 1.89%, khơng rơi vào tình trạng thua lỗ. Đáng chú ý nhất là Công ty cổ phần Dịch vụ Hàng hóa Nội Bài với tỷ lệ ROA luôn trên mức 50% trong giai đoạn từ 2011 đến 2017, đỉnh điểm đạt 71.68% vào năm 2013. Trong khi đó, Cơng ty cổ phần PGT Holdings là cơng ty có tỷ suất sinh lời trên tổng tài sản thấp nhất với một tỷ số âm khá lớn, lên đến -11.897% vào năm 2017 và -7.398% vào năm 2016. Độ lệch chuẩn 10.787% cho thấy có sự khác biệt tương đối lớn giữa tỷ suất ROA của các công ty trong cùng ngành qua các năm.
43