Mô hình sử dụng số liệu của 18 QTDND (theo không gian) và trong khoản thời gian từ 2008 đến năm 2014 (theo thời gian) do vậy khóa luận đề xuất sử dụng phương pháp hồi quy với dữ liệu bảng (Panel data). Dữ liệu bảng là dữ liệu kết hợp giữa chuỗi thời gian và các quan sát chéo. Phân tích bằng hồi quy dữ liệu bảng giúp nhà nghiên cứu có nhiều thông tin tốt hơn, ít hiện tượng đa cộng tuyến giữa các biến hơn, nhiều bậctự do hơn và hiệu quả cao hơn(Gurajati, 2003).
Đối với dữ liệu bảng có 3 mô hình có thể sử dụng tùy vào đặc điểmvà phạm vi nghiên cứu(Gurajati, 2003), bao gồm:
Mô hình Pooled OLS12là mô hình kết hợp tất cả các quan sát, bỏ qua kích thước dữ liệu gộp theo không gian và thời gian mà chỉ ước lượng hồi quy OLS thông thường; là mô hìnhđơn giản nhất khi không xem xét tới sự khác biệt giữa cácQTDND.
Mô hình Fixed effect13 phát triển thêm từ Pooled khi có đưa thêm sự khác nhau giữa các QTDNDvà có sự tương quan giữa phần dư của mô hình và các biến độc lập.
Mô hình Random effect14cũng giống như mô hình Fixed về sự khác nhau giữa các QTDND nhưng không có mối quan hệ nào giữa phần dư và các biến độc lập của mô hình. 12 Chi tiết tại Phụ lục E 13 Chi tiết tại Phụ lục G 14 Chi tiết tại phụ lục H
Mỗi phương pháp ước lượng dựa trên những giả thuyết quan trọng về mô hình đưa ra, cụ thể:
Đối với OLS: Giả thuyết sai số trong mô hình có giá trị trung bình bằng không (0) và phương sai của sai số là không đổi.
Đối với FEM: Giả thuyết rằng sai số của từng đối tượng là không đổi theo thời gian và cóảnh hưởng đến các biến độc lập.
Đối với REM: Giả tuyết rằng sai cố của từng đối tượng là biến ngẫu nghiên và không có tác động đến biến độc lập.
Sau khi thực hiện hồi quy theo các phương pháp, khóa luận sẽ sử dụng các công cụ để kiểm định các giả thuyết quan trọng của từng mô hình, từ đó lựa chọn phương pháp ước lượng phù hợp nhất, cụ thể:
* Giữa OLS và REM: Sử dụng kiểm định Breusch –Pagan với giả thuyết: - Ho: Phần sai số không tồn tại tác động ngẫu nhiên.
- H1: Phần sai số tồn tại tác động ngẫu nhiên.
Nếu p-value (Bptest) < 0,05 (5%): Bác bỏ Ho, chấp nhận H1 (nghĩa là phương sai thay đổi), do vậy mô hìnhước lượng REM là phù hợp hơn.
* Giữa OLS và FEM: Sử dụng công cụ Redundant Fixed Effects Test để kiểm định giả thuyết:
- Ho: Phần sai số không tồn tại tác động ngẫu nhiên. - H1: Phần sai số tồn tại tác động ngẫu nhiên.
Nếu p-value (cross-section F) < 0,05 (5%): Bác bỏ Ho, chấp nhận H1, do vậy mô hìnhước lượng FEM phù hợp hơn.
* Trong trường hợp cả REM và FEM đều phù hợp hơn so với OLS, khóa luận sẽ sử dụngKiểm định Hausman với giả thuyết:
- Ho: Không có sự tương quan giữa đặc điểm riêng của từng đối tượng với các biến giải thích.
- H1: Có sự tương quan giữa đặc điểm riêng của từng đối tượng với các biến giải thích.
Nếu p-value (Hausman test) < 0,05 (5%): Bác bỏ Ho, chấp nhận H1, do vậy mô hìnhước lượng REM sẽ phù hợp hơn.