Xử lý dữ liệu

Một phần của tài liệu TÁC ĐỘNG CỦA TĂNG TRƯỞNG NỢ TỚI HIỆUQUẢ HOẠT ĐỘNG DOANH NGHIỆP NGÀNH DẦUKHÍ NIÊM YẾT GIAI ĐOẠN 2016 ĐẾN 2020 10598557-2395-012227.htm (Trang 68 - 75)

Đầu tiên 31 doanh nghiệp thương mại dầu khí niêm yết trên sàn chứng khoán Việt Nam tính đến thời điểm hiện tại, được thu thập từ trang web www.cafef.vn giai đoạn từ 2016 -2020, tác giả đã bổ sung công ty không có số liệu đầy đủ bằng cách thực hiện viết tay từ báo cáo tài chính của doanh nghiệp. Riêng các số liệu vĩ mô được tác giả thu thập từ các trang web thống kê của tổng cục thống kê VN www.gso.gov.vn, www.vietstock.vn...

Tác giả đã sử dụng phần mềm Excel để xử lý dữ liệu cơ bản, tính toán và tạo ra giá

trị của những biến số cần phân tích trong mô hình. Từ đó xây dựng một dữ liệu dạng bảng thông qua việc kết hợp các chuỗi dữ liệu theo thời gian (từ 2016 -2020) của các dữ liệu nghiên cứu theo không gian (các doanh nghiệp thương mại dầu khí niêm yết trên sàn chứng khoán Thành phố Hồ Chí Minh).

3.3.5 Phương pháp nghiên cứu

3.3.5.1 Hồi quy dữ liệu

(Baltagi, 2005) đưa ra dạng tổng quát của hồi quy dữ liệu bảng, được trình bày như

sau:

Yit = α + βitXit + + uit

Xit: Giá trị của X đối với doanh nghiệp i tại thời điểm t βit: Hệ số góc

Uit: Sai số ngẫu nhiên của doanh nghiệp i tại thời điểm t i = 1, 2, 3... N: Doanh nghiệp thứ i

Gujarati (2011) đã đưa ra nhiều mô hình hồi quy dữ liệu bảng, các mô hình được tác giả sử dụng trong nghiên cứu này là: Pooled OLS, FEM và REM.

3.3.5.2 Mô hình Pooled OLS

Mô hình Pooled OLS là mô hình hồi quy đơn giản, không xem xét yếu tố thời gian

và không gian của dữ liệu, chỉ ước lượng hồi quy OLS thông thường. Do đó, các hệ số trong mô hình không thay đổi theo thời gian và theo từng doanh nghiệp. Tuy nhiên, hạn chế của mô hình này là thường xảy ra hiện tượng tự tương quan do hệ số Durbin Watson

khá thấp (Gujarati & Porter, 2010).

Yit = α + β2 X2it + β3 X3it + uit

Trong đó:

i: Đơn vị chéo thứ i; t: Thời gian t; uit: Sai số ngẫu nhiên.

3.3.5.3 Mô hình các ảnh hưởng cố định (FEM)

Mô hình tác động cố định (FEM) Với giả định mỗi đơn vị đều có những đặc điểm riêng biệt có thể ảnh hưởng đến các biến giải thích, FEM phân tích mối tương quan này giữa phần dư của mỗi đơn vị với các biến giải thích qua đó kiểm soát và tách ảnh hưởng của các đặc điểm riêng biệt (không đổi theo thời gian) ra khỏi các biến giải thích để chúng ta có thể ước lượng những ảnh hưởng thực (net effects) của biến giải thích lên biến phụ thuộc.

Mô hình trên đã thêm vào chỉ số i cho hệ số chặn “c” để phân biệt hệ số chặn của từng doanh nghiệp khác nhau có thể khác nhau, sự khác biệt này có thể do đặc điểm khác

nhau của từng doanh nghiệp hoặc do sự khác nhau trong chính sách quản lý, hoạt động của doanh nghiệp (Gujarati & Porter, 2010)

Trong đó

Yit: Thời gian (năm). Xit: Biến độc lập

Ci (i=1...n): Hệ số chặn cho từng đơn vị nghiên cứu. β: Hệ số góc đối với nhân tố X.

Uit: Phần dư

3.3.5.4 Mô hình các ảnh hưởng ngẫu nhiên (REM)

Điểm khác biệt giữa mô hình ảnh hưởng ngẫu nhiên và mô hình ảnh hưởng cố định

được thể hiện ở sự biến động giữa các đơn vị. Nếu sự biến động giữa các đơn vị có tương

quan đến biến độc lập - biến giải thích trong mô hình ảnh hưởng cố định thì trong mô hình ảnh hưởng ngẫu nhiên sự biến động giữa các đơn vị được giả sử là ngẫu nhiên và không tương quan đến các biến giải thích.

Chính vì vậy, nếu sự khác biệt giữa các đơn vị có ảnh hưởng đến biến phụ thuộc thì REM sẽ thích hợp hơn so với FEM. Trong đó, phần dư của mỗi thực thể (không tương

quan với biến giải thích) được xem là một biến giải thích mới. Mô hình REM trình bày như sau:

Yit =β1i + β2 X2it + β3 X3it + uit

Với: β1i = β1 + εi

Trong đó, εi là hạng nhiễu ngẫu nhiên với trung bình là 0 và phương sai là σ2 Thay

vào công thức ở trên, ta có phương trình sau:

uit: Thành phần sai số kết hợp giữa đơn vị chéo và chuỗi thời gian.

4.2.6 Các kiểm định lựa chọn

Do dữ liệu thu thập là dữ liệu dạng bảng (panel data) nên phương pháp phân tích hồi quy với dữ liệu bảng được áp dụng trong nghiên cứu này. Trong đó, có 3 mô hình có

thể được sử dụng bao gồm:

Mô hình bình phương tối thiểu dạng gộp (Pooled Ordinary least squares - Pooled OLS): là mô hình không kiểm soát được từng đặc điểm riêng của từng đối tượng trong nghiên cứu;

Mô hình tác động cố định (Fixed Effects Model - FEM): được phát triển từ mô hình

Pooled OLS khi có thêm kiểm soát nhằm kiểm soát từng đặc điểm khác nhau giữa các đối tượng và có sự tương quan giữa biến độc lập với phần dư của mô hình;

Mô hình tác động ngẫu nhiên (Random Effects Model - REM): được phát triển từ mô hình Pooled OLS khi có thêm kiểm soát nhằm kiểm soát từng đặc điểm khác nhau giữa các đối tượng nhưng không có sự tương quan giữa biến độc lập với phần dư của mô

hình.

Để phân tích ảnh hưởng của đòn bẩy tài chính, tăng trưởng doanh thu và các ràng buộc tài chính đến hiệu quả hoạt động của doanh nghiệp, tác giả tiến hành ước lượng hồi

quy lần lượt với 3 mô hình: mô hình Pooled OLS, mô hình FE và mô hình RE.

Sau đó, tác giả tiếp tục sử dụng kiểm định F - test, kiểm định Hausman để lựa chọn

mô hình phù hợp nhất cho bài nghiên cứu trong điều kiện Việt Nam. Bên cạnh đó, các kiểm định về tự tương quan, phương sai thay đổi và đa cộng tuyến cũng được thực hiện. Kỹ thuật hồi quy GLS (Generralized Least Squares) sẽ được sử dụng nếu tồn tại hiện

- POOLED OLS và FEM REM Kiểm định F - test với 2 giả thuyết: H0: Mô hình Pooled OLS phù hợp H1: Mô hình FEM phù hợp

p-value (F) < mức ý nghĩa => bác bỏ giả thuyết H0, mô hình FEM phù hợp với nghiên cứu.

p-value (F) > mức ý nghĩa => chấp nhận giả thuyết H0 nghĩa là không có bằng chứng cho thấy các đặc điểm riêng khác nhau nên mô hình Pooled OLS phù hợp với nghiên cứu.

- FEM và REM

Để cho thấy sự phù hợp mô hình FEM hay REM khi ước lượng, tác giả thực hiện kiểm định Hausman. Nếu giả thuyết H0 bị bác bỏ, mô hình REM sẽ vi phạm định lí Gaus

Markov dẫn đến ước lượng bị chệch và không nhất quán. Ngược lại, mô hình FEM vẫn đưa ra kết quả ước lượng không chệch và nhất quán. Tóm lại, giả thuyết sau được đặt ra:

H0: không có tương quan giữa biến độc lập và thành phần ngẫu nhiên (Mô hình REM là hợp) H1: có tương quan giữa các biến độc lập và thành phần ngẫu nhiên (Mô hình FEM là phù hợp) p-value < mức ý nghĩa => bác bỏ giả thuyết H0, mô hình FEM phù hợp với nghiên cứu

p-value > mức ý nghĩa => chấp nhận giả thuyết H0, mô hình REM phù hợp với nghiên cứu

Kiểm định Hausman

(Gujarati & Porter, 2010) thực hiện kiểm định Hausman để lựa chọn sử dụng giữa 2 mô hình FEM và REM. Hai giả thuyết được đưa ra:

H1: Có tương quan giữa thành phần sai số của đơn vị chéo và biến giải thích p -value < mức ý nghĩa, bác bỏ giả thuyết H0, mô hình FEM phù hợp.

p -value > mức ý nghĩa, chấp nhận giả thuyết H0, mô hình REM phù hợp.

Kiểm định đa cộng tuyến

Để củng cố lập luận cho rằng mô hình không bị đa cộng tuyến, tác giả thực hiện kiểm định thông qua hệ số phóng đại phương sai VIF (variance inflation factor).

Nếu VIF < 2: không bị đa cộng tuyến.

Nếu hệ số phóng đại phương sai VIF > 2 thì có dấu hiệu đa cộng tuyến. Nếu VIF > 10 thì chắc chắn có đa cộng tuyến

Kiểm định phương sai thay đổi

Kiểm định Wald được thực hiện để xác định liệu mô hình có bị phương sai thay đổi hay không với giả thuyết:

H0: Mô hình có phương sai không đổi H1: Mô hình có phương sai thay đổi

p-value < α (5%) => bác bỏ giả thuyết H0, suy ra mô hình có phương sai thay đổi p-value > α (5%) => chấp nhận giả thuyết H0, mô hình có phương sai không đổi

Kiểm định tự tương quan

Kiểm định Wooldridge được thực hiện để xác định liệu mô hình có bị tự tương quan hay không với giả thuyết:

H0: Mô hình không có tự tương quan

H1: Mô hình có tự tương quan p-value < mức ý nghĩa => bác bỏ H0, suy ra mô hình có tự tương quan

ROA TTDT TSHH DE TTNO SIZE Trung bình 0.029 4 0 0.024 0.2040 9 1.473 3 0.015 1 5.900 Trung vị______ 0.025 - 0.1874 1.212 0.021 5.668 Độ lệch chuẩn 0.082 3 3 0.356 0.1525 0 1.241 1 0.479 2 0.781 Nhỏ nhất______ -0.3617 - 0.0054 0.067 -1.1477 4.370 Lớn nhất______ 0.207 2 2.381 2 0.6953 6.026 1 2.095 1 7.800 8 Số quan sát 15 5 5 15 155 155 ________155 155 TÓM TẮT CHƯƠNG 3

Chương 3 đã trình bày các vấn đề về quy trình nghiên cứu, cách thức thu thập dữ liệu và phương pháp xử lý, phân tích dữ liệu. Bên cạnh đó tác giả cũng trình bày cách thức xử lý và phân tích dữ liệu nghiên cứu với các mô hình Pooled OLS, FEM, REM và GLS cũng như các kiểm định cần thiết để lựa chọn mô hình phù hợp. Ket quả của các mô hình sẽ được trình bày cụ thể trong chương tiếp theo.

CHƯƠNG 4 KẾT QUẢ VÀ BÀN LUẬN.

Một phần của tài liệu TÁC ĐỘNG CỦA TĂNG TRƯỞNG NỢ TỚI HIỆUQUẢ HOẠT ĐỘNG DOANH NGHIỆP NGÀNH DẦUKHÍ NIÊM YẾT GIAI ĐOẠN 2016 ĐẾN 2020 10598557-2395-012227.htm (Trang 68 - 75)

Tải bản đầy đủ (DOCX)

(133 trang)
w