Thống kê mô tả các biến
Thống kê mô tả từng biến độc lập và biến phụ thuộc bao gồm giá trị trung bình, độ lệch chuẩn, giá trị nhỏ nhất và giá trị lớn nhất.
Căn cứ trên mô hình chính thức này, nghiên cứu tiến hành kiểm định sự phù hợp của mô hình.
Kiểm định hiện tượng đa cộng tuyến
Thuật ngữ đa cộng tuyến có nghĩa là sự tồn tại mối quan hệ tuyến tính “hoàn hảo” hoặc chính xác giữa một số hoặc tất cả các biến giải thích trong một mô hình hồi quy.
Các hệ quả của đa cộng tuyến là: Nếu tồn tại cộng tuyến hoàn hảo giữa các biến, thì hệ số hồi qui của chúng là không xác định và các sai số chuẩn của chúng là vô hạn. Nếu cộng tuyến cao nhưng không hoàn hảo thì việc ước lượng của các hệ số hồi qui là có thể thực hiện được nhưng sai số chuẩn của chúng có khuynh hướng rất lớn. Kết quả là, các giá trị tổng thể của các hệ số không thể được ước lượng một cách chính xác, dẫn đến không hồi quy được hoặc kết quả của mô hình không chính xác.
Để kiểm định xác định hệ số tương quan (ri) giữa các biến thông qua hàm Corr, nếu ri < 0.5, được xem là không xảy ra hiện tượng đa cộng tuyến.
Kiểm định về hiện tượng tự tương quan (Durbin – Watson)
Hiện tượng tự tương quan là hiện tượng khi các sai số trong mô hình có mối quan hệ với nhau, nguyên nhân sử dụng dữ liệu thời gian, độ trễ của số liệu, hiện tượng quán tính của số liệu, hậu quả dẫn đến ước lượng sẽ bị chệch. Để kiểm định hiện tượng tự tương quan sử dụng hàm Estat Dwatson để tính d (Durbin_watson), nếu d tiến về 2 thì mô hình không xảy ra hiện tượng tự tương quan.
Phương pháp kinh nghiệm được sử dụng để phát hiện tự tương quan như sau:
Khi 0<d<1: Mô hình có tự tương quan dương
Khi 1<d<3: Mô hình không có tự tương quan
60
Kiểm định hiện tượng phương sai thay đổi
Là do giả thuyết về phương sai không đổi của mô hình bị vi phạm, nguyên nhân là bản chất của các đại lượng kinh tế, bản thân con người học hỏi theo thời gian hoặc do sự tiến bộ trong đo lường và xử lý số liệu. Nó sẽ làm ảnh hưởng đến kết quả không chệch của ước lượng.
Để kiểm định phương sai thay đổi, sử dụng hàm Hettest trong Stata_SE12 để xác định P.value, nếu P.value < 5% không xảy ra hiện tượng phương sai thay đổi và ngược lại.
Kiểm định Hausman về sự phù hợp của mô hình
Phương pháp dữ liệu bảng là phương pháp thích hợp khi kết hợp phương pháp dữ liệu chéo và dữ liệu thời gian của nhiều đối tượng giống nhau ở nhiều thời điểm khác nhau. Phương pháp này bao quát được các khía cạnh không gian và thời gian, dữ liệu bảng cân bằng được sử dụng. Phương pháp này là phù hợp nhất do loại bỏ những vấn đề thuộc kinh tế lượng, bỏ sót các biến đo lường có tương quan mạnh với các biến được giải thích.
Phương trình tổng quát của mô hình Fixed Effect:
Cách tiếp cận này xem xét từng đơn vị theo không gian và thời gian. Nghĩa là
cho tung độ gốc thay đổi theo không gian hoặc thời gian và giả định rằng hệ số
độ dốc là hằng số. Theo bài nghiên cứu này, ta xem xét tung độ gốc thay
đổi theo không gian.
Kí hiệu i vào số hạng tung độ gốc để cho thấy các tung độ gốc của 24 NH được nghiên cứu có thể khác nhau, sự khác biệt này do đặc điểm riêng của từng NH.
Phương trình tổng quát của mô hình Random Effect viết dưới dạng:
61
Thay vì xem là cố định, ta giả định đó là biến ngẫu nhiên với giá trị trung bình là . Khi đó, giá trị tung độ góc cho một NH riêng lẻ có thể được biểu thị là:
i = 1, 2, ..., N (2)
Trong đó là sai số ngẫu nhiên với giá trị trung bình bằng 0 và phương sai
bằng .
Từ (1) và (2) mô hình tổng quát cho 24 NH:
Trong đó : sai số theo không gian; :Sai số theo không
gian và chuỗi thời gian kết hợp.
Kiểm định Hausman để lựa chọn phương pháp ước lượng phù hợp giữa hai phương pháp ước lượng tác động cố định (FEM) và ước lượng tác động ngẫu nhiên (REM).
Giả thuyết: H0: Ước lượng của FEM và REM không khác nhau H1: Ước lượng của FEM và REM khác nhau
Nếu P-value < 0.05: Bác bỏ giả thuyết H0 nên REM không phù hợp và sử dụng mô hình FEM.
Nếu P-value > 0.05: Chấp nhận giả thuyết H0. Nên sử dụng mô hình REM.