Trình tự xử lý số liệu bao gồm: Thống kê và mô tả dữ liệu, khảo sát tương quan giữa các cặp biến độc lập và biến kiểm sốt, đánh giá mức độ phù hợp của mơ hình hồi quy và kiểm định khuyết tật của mơ hình.
Dữ liệu của các doanh nghiệp thu thập được sắp xếp theo thời gian một cách riêng biệt theo từng biến và có cùng thời gian quan sát nên đây là dạng bảng dữ liệu cân bằng.
2.5.1 Trình bày thống kê mơ tả dữ liệu
Số liệu được bình bày dưới dạng bảng thống kê mô tả, mỗi biến được mô tả qua các nội dung như: tên biến, số mẫu, số trung bình, giá trị cực đại và cực tiểu.
2.5.2 Khảo sát các cặp tương quan giữa các biến độc lập
Theo Nguyễn Trọng Hoài (2006), việc khảo sát các cặp tương quan giữa các biến độc lập được thực hiện bằng cách thiết lập ma trận hệ số tương quan để tìm ra những cặp biến có hệ số tương quan cao. Gujarati K. (1995) cho rằng, để loại trừ vấn đề đa cộng tuyến cần nghiên cứu kỹ hệ số tương quan giữa các biến, nếu chúng vượt q 0.8, mơ hình hồi quy sẽ gặp vấn đề đa cộng tuyến nghiêm trọng. Do đó, để giảm thiểu đa cộng tuyến, đề tài sẽ loại bỏ ra khỏi mơ hình hồi quy đối với cặp biến có hệ số tương quan lớn hơn 0.8.
2.5.3 Đánh giá độ phù hợp của mơ hình hồi quy
Sau khi ước lượng được mơ hình hồi quy, cần đánh giá về sự phù hợp của mơ hình. Theo Hồng Ngọc Nhậm (2008), việc đánh giá mức độ phù hợp của mơ hình hồi quy có thể căn cứ vào các tiêu chí sau:
- Xem xét dấu của các hệ số ước lượng có phù hợp với lý thuyết và các nghiên cứu trước hay không. Các biến được lựa chọn phải đáp ứng được yêu cầu đầu tiên này.
- Dấu của hệ số các biến trong mơ hình phù hợp với lý thuyết và các nghiên cứu trước mà hệ số này phải khác 0 và có ý nghĩa thống kê.
- Cuối cùng, giá trị R2 được xem xét để đánh giá mức độ giải thích của các biến độc lập, biến kiểm soát tới biến phụ thuộc trong mơ hình nghiên cứu. R2 gọi là hệ số xác định và là một thước đo thường được sử dụng trong các nghiên cứu. R2 nhận giá trị từ 0 đến 1, càng gần 1 thì mơ hình đã xây dựng càng phù hợp. Tác giả Huỳnh Đạt Hùng (2011) cho rằng, theo kinh nghiệm thực tế với số liệu chuỗi thời gian thì R2 > 0,9 là tốt và đối với số liệu chéo thì R2 > 0,7 đã được xem là tốt.
Ngồi ra, tác giả sử dụng kiểm định Breusch-Pagan Lagrange Multiplier (LM test) và kiểm định Hausman để lựa chọn mơ hình Pool OLS, FEM hay REM phù hợp cho việc hồi quy dữ liệu mẫu:
- Giả thuyết Ho được đưa ra trong kiểm định LM là phương sai qua các đơn vị là không đổi. Nếu giá trị p-value của hệ số Chi2 của kiểm định nhỏ hơn 0.05 thì cho phép bác bỏ giả thuyết Ho: phương sai qua các đơn vị là khơng đổi, do có sự khác biệt giữa các doanh nghiệp việc lựa chọn mơ hình REM là phù hợp hơn so với Pool OLS.
- Giả thuyết Ho của kiểm định Hausman là tác động không được quan sát khơng có mối tương quan với các biến giải thích. Nếu bác bỏ giả thiết Ho thì có thể
kết luận mơ hình ảnh hưởng ngẫu nhiên là khơng phù hợp và có thể lựa chọn mơ hình ảnh hưởng cố định (FEM).
2.5.4 Kiểm định khuyết tật mơ hình
Căn cứ vào mơ hình được lựa chọn, tác giả sẽ lựa chọn các kiểm định phù hợp để đánh giá có các khuyết tật trong mơ hình hồi quy hay khơng như: kiểm định đa cộng tuyến, tự tương quan, kiểm định phương sai thay đổi.