Tác giả sử dụng phần mềm STATA 14 làm công cụ hỗ trợ xử lý dữ liệu và sẽ được trình bày dưới dạng bảng (Panel data), trong đó chuỗi dữ liệu thời gian 8 năm từ năm 2013 đến 2020 với 512 số quan sát. Tác giả tiến hành thực hiện nghiên cứu theo các
bước cụ thể như sau:
Bước 1: Thống kê dữ liệu nghiên cứu
Thống kê các biến giúp tác giả quan sát và mô tả mẫu dữ liệu nghiên cứu một cách rõ ràng và bao quát thông qua các hệ số giá trị trung bình, độ lệch chuẩn, giá trị lớn
nhất/ nhỏ nhất của các biến trong mô hình nghiên cứu. Bước 2: Kiểm tra hiện tượng tương quan
Đây là hiện tượng xảy ra khi các biến độc lập trong mô hình nghiên cứu có sự tương quan chặt chẽ và phụ thuộc lẫn nhau nên gây ra hiện tượng đa cộng tuyến. Hiện tượng này làm ít ý nghĩa thống kê và các ước lượng không thật sự chính xác. Do đó, sẽ dễ đi đến không có cơ sở bác bỏ giả thuyết "không" và điều này có thể không đúng. Hệ số phóng đại phương sai VIF và ma trận tương quan sẽ được sử dụng để khắc phục hiện
32
tượng đa cộng tuyến, mô hình không có đa cộng tuyến khi hệ số tương quan giữa các biến độc lập nhỏ hơn 0,8 và hệ số VIF của các biến nhỏ hơn 4.
Bước 3: Phân tích hồi quy
Tác giả tiến hành hồi quy các mô hình Pooled OLS (POLS), Mô hình hồi tác động cố định FEM và Mô hình hồi tác động ngẫu nhiên REM. Mô hình FEM có thể phân tích mối tương quan giữa phần sai số của mỗi công ty với các biến độc lập theo giả định rằng
mỗi công ty đều có các đặc điểm riêng biệt có thể ảnh hưởng đến biến độc lập, qua đó kiểm tra và tách ảnh hưởng của các đặc điểm riêng biệt này (không thay đổi theo thời gian) ra khỏi các biến độc lập để có thể ước lượng tác động thực sự của biến độc lập lên biến phụ thuộc. Trong khi, mô hình REM cho thấy sự khác biệt giữa các công ty được giả sử là ngẫu nhiên và không tương quan đến độc lập.
Bước 4: Lựa chọn mô hình hồi quy phù hợp
Sau khi phân tích kết quả hồi quy của các mô hình, tác giả thực hiện việc kiểm định lựa chọn giữa các mô hình này. Các phương pháp kiểm định để lựa chọn mô hình hồi quy bao gồm: Kiểm định F để lựa chọn giữa mô hình Pooled OLS và FEM; Kiểm định Hausman để lựa chọn giữa mô hình FEM và REM; Kiểm định Breusch - Pagan Larganian multiplier (LM) dùng để lựa chọn giữa Pooled OLS và REM.
Bước 5: Kiểm định các khuyết tật trong mô hình - Kiểm định hiện tượng tự tương quan
Hiện tượng tự tương quan là sự tương quan giữa các thành phần của dãy quan sát theo thời gian hoặc không gian. Khi xuất hiện tự tương quan, các ước lượng của phương
pháp bình phương bé nhất Pooled OLS là không hiệu quả. Vậy nên, các sai số ngẫu nhiên
Biến Giá trị trung bình Độ lệch chuẩn Giá trị nhỏ nhất Giá trị lớn nhất Số quan sát DOE 1,6869 1,9267 0,0331 18,2548 512 EPs 1.5417 2,3243 -5,55 17,75 512 ROA 0,0354 0,0582 -0,4947 0,2538 512 TANG 0,0744 0,1194 0 0,8660 512 LIQ 2,704 2,4279 0,2268 21,5839 512 SIZE 6,2544 0,6297 5,0490 8,6258 512 GROW 4,6521 90,001 -0,9824 2035,963 512 INT 0,0788 0,0108 007 0,104 512 UNIQ 0,7286 0,6410 -10,2217 7,8727 512 TAX 0,1557 0,1714 -1,0594 2,1223 512 33
thuyết quan trọng của một mô hình hồi quy tuyến tính cổ điện. Hiện tượng này có thể được phát hiện nhờ nhiều cách như phương pháp đồ thị, kiểm định Berusch-Godfrey,...
- Kiểm định hiện tượng phương sai thay đổi
Là hiện tượng mà phương sai của các sai số ước lượng không bằng nhau. Nguyên nhân chính dẫn đến sự xuất hiện của hiện tượng này có lẽ là do sự tồn tại của các quan sát của biến mà có giá trị quá khác biệt so với các quan sát còn lại trong biến. Hoặc là các quan sát của cùng một biến nhưng lại được đo lường với những thang đo khác nhau. Những cách phát hiện hiện tượng này là dùng đồ thị hoặc dùng các kiểm định là kiểm
định Breusch-Pagan và kiểm định White. Để khác phục các khuyết tật trên, đối với mô hình FEM, có thể khác bằng mô hình sai số chuẩn mạnh (Robust Standard errors). Còn với mô hình REM, khắc phục hiện tượng tự tương quan và hiện tượng phương sai thay đổi bằng ước lượng FGLS hay được gọi là ước lượng tác động ngẫu nhiên (Random effects estimator).
34
CHƯƠNG 4: KẾT QUẢ NGHIÊN CỨU VÀ THẢO LUẬN