CHƯƠNG 1 : CƠ SỞ LÝ LUẬN VÀ TỔNG QUAN NGHIÊN CỨU
3.1. Phương pháp nghiên cứu
Đối với số liệu mảng, các mô hình xử lý số liệu truyền thống thường được sử dụng là mô hình OLS gộp (Pooled OLS), mô hình tác động cố định và mô hình tác động ngẫu nhiên.
3.1.1. Mô hình hỗn hợp (Pooled OLS)
Mô hình hỗn hợp là mô hình được giả định về tung độ gốc và hệ số độ dốc không thay đổi theo thời gian và theo các đơn vị (các quốc gia). Phương pháp ước lượng cho mô hình hỗn hợp là bình phương nhỏ nhất cổ điển. Nói cách khác, mô hình POLS giả định không tồn tại nhân tố ci (nhân tố về sự khác biệt đặc trưng giữa các đơn vị nhưng không đo lường được) trong mô hình.
3.1.2. Mô hình hiệu ứng cố định (FE)
Mô hình hiệu ứng cố định là mô hình được giả định cho các trường hợp sau: (i) Các hệ số độ dốc là không đổi nhưng tung độ gốc thay đổi theo các đơn vị; (ii) Các hệ số độ dốc là không đổi nhưng tung độ góc thay đổi theo các đơn vị và theo thời gian; (iii) Tất cả các hệ số đều thay đổi theo các đơn vị; (iv) Tất cả các hệ số đều thay đổi theo các đơn vị và theo thời gian. Như vậy, mô hình hiệu ứng cố định khẳng định có sự khác biệt đặc trưng giữa các đơn vị và theo thời gian, sự khác biệt này có tương quan với các biến giải thích và FE đánh giá được ảnh hưởng của sự khác biệt đặc trưng đó đến biến được giải thích.
Xét một mối quan hệ kinh tế, với biến phụ thuộc, Y, và hai biến giải thích quan sát được, X11 và X22, và một hoặc nhiều biến không quan sát được. Chúng ta có dữ liệu bảng cho Y, X11, và X22. Dữ liệu bảng bao gồm N-đối tượng và T-thời điểm, và vì vậy chúng ta có NxT quan sát. Mô hình hồi quy tuyến tính cổ điển không có hệ số cắt được xác định bởi:
Yitit = β11Xit1it1 + β22Xit2it2 + μitit với i = 1, 2, …, N và t = 1, 2, …, T
Trong đó Yitit là giá trị của Y cho đối tượng i ở thời điểm t; Xit1it1 là giá trị của X11 cho đối tượng i ở thời điểm t, Xit2it2 là giá trị của X22 cho đối tượng i ở thời điểm t, và μitit là sai số của đối tượng i ở thời điểm t.
Mô hình hồi quy tác động cố định, là một dạng mở rộng của mô hình hồi quy tuyến tính cổ điển, được cho bởi:
Yitit = β11Xit1it1 + β22Xit2it2 + νii + εitit
Trong đó μitit = νii + εitit. Sai số của mô hình hồi quy tuyến tính cổ điển được tách làm hai thành phần. Thành phần νii đại diện cho các yếu tố không quan sát được khác nhau giữa các đối tượng nhưng không thay đổi theo thời gian. Thành phần εitit đại diện cho những yếu tố không quan sát được khác nhau giữa các đối tượng và thay đổi theo thời gian.
Phương pháp ước lượng mô hình tác động cố định:
Có hai phương pháp ước lượng được sử dụng để ước lượng các tham số của mô hình tác động cố định. i) Ước lượng hồi quy biến giả tối thiểu LSDV với mỗi biến giả là đại diện cho mỗi đối tượng quan sát của mẫu. ii) Ước lượng tác động cố định (Fixed effects estimator).
· Khi N lớn, việc sử dụng ước lượng LSDV sẽ rất cồng kềnh hoặc không khả thi. Chẳng hạn, giả sử chúng ta muốn ước lượng mô hình xác định lương. Chúng ta có mẫu N = 1000 người lao động. Để sử dụng ước lượng LSDV, chúng ta sẽ cần tạo ra 1000 biến giả và chạy hồi quy OLS cho hơn 1000 biến. Trong trường hợp như vậy, ước lượng tác động cố định sẽ thích hợp hơn.
· Nguyên tắc của ước lương tác động cố định được hiểu như sau. Để đánh giá tác động nhân quả của các biến độc lập X11 và X22 lên biến phụ thuộc Y, ước lượng tác động cố định sử dụng sự thay đổi trong X11, X22, và Y theo thời gian. Gọi Zii kí hiệu cho một biến không quan sát được khác nhau giữa các đối tượng nhưng không đổi theo thời gian và vì vậy bao gồm cả phần sai số trong đó. Bởi vì Zii không thay đổi theo thời gian nên nó không thể gây ra bất kì sự thay đổi nào trong YitYit; Sở dĩ như vậy là vì không thay đổi theo thời gian, Zii không thể
giải thích bất kì sự thay đổi nào trong YitYit theo thời gian. Vì vậy, loại trừ tác động cố định của Zii lên YitYitbằng cách sử dụng dữ liệu sự thay đổi trong YitYit theo thời gian.
3.1.3. Mô hình hiệu ứng ngẫu nhiên (RE)
Mô hình hiệu ứng ngẫu nhiên là mô hình được giả định có sự khác biệt đặc trưng giữa các đơn vị, nhưng sự khác biệt này là ngẫu nhiên và không tương quan với biến giải thích. Nói cách khác trong mô hình RE có tồn tại ci và không có tương quan giữa ci với các biến giải thích. Phương pháp ước lượng cho mô hình RE là bình phương nhỏ nhất tổng quát. Mô hình RE ưu việt hơn mô hình FE như chỉ sử dụng một hệ số chặn duy nhất cho tất cả các đơn vị chéo, giá trị này là giá trị trung bình của tất cả các đơn vị chéo và đo lường được những nhân tố không đổi theo thời gian.
Xét một mối quan hệ kinh tế bao gồm một biến phụ thuộc, Y, và hai biến giải thích quan sát được, X11 và X22. Chúng ta có dữ liệu bảng cho Y, X11, và X22. Dữ liệu bảng gồm có N đối tượng và T thời điểm, và vì vậy chúng ta có NxT quan sát.
Mô hình tác động ngẫu nhiên được viết dưới dạng:
YitYit = β11Xit1Xit1 + β22Xit2Xit2 + νii + εitεit với i = 1, 2, …, N và t = 1, 2, …, T
Trong đó, sai số cổ điển được chia làm 2 thành phần. Thành phần ν ii đại diện cho tất các các yếu tố không quan sát được mà thay đổi giữa các đối tượng nhưng không thay đổi theo thời gian. Thành phần εit đại diện cho tất cả các yếu tố không quan sát được mà thay đổi giữa các đối tượng và thời gian. Giả sử rằng vii được cho bởi:
vii = α00 + ωii, với i = 1, 2, …, N
Trong đó, vii lại được phân chia làm hai thành phần: i) thành phần bất định a00, ii) thành phần ngẫu nhiên ωii.
Giả định rằng, ωi cho mỗi đối tượng được rút ra từ một phân phối xác suất độc lập với giá trị trung bình bằng 0 và phương sai không đổi, đó là, E(ωii) = 0 Var(ωii) = sω2 Cov(ωi,ωs) = 0
Mô hình tác động ngẫu nhiên có thể được viết lại:
YitYit = α00Xit1Xit1 + β22Xit2Xit2 + μitit
Trong đó: μitit = ωii + εitit. Một giả định quan trọng trong mô hình tác động ngẫu nhiên là thành phần sai số μit không tương quan với bất kì biến giải thích nào trong mô hình.
Phương pháp ước lượng mô hình tác động ngẫu nhiên:
Ước lượng OLS cho mô hình tác động ngẫu nhiên sẽ cho các tham số ước lượng không chệch nhưng lại không hiệu quả. Hơn nữa, các ước lượng của sai số chuẩn và do đó thống kê t sẽ không còn chính xác. Sở dĩ như vậy là vì ước lượng OLS bỏ qua sự tự tương quan trong thành phần sai số μit. Để kết quả ước lượng không chệch và hiệu quả, chúng ta có thể sử dụng ước lượng GLS khả thi (FGLS) để khắc phục hiện tượng sai số nhiễu tự tương quan. Ước lượng FGLS còn được gọi là ước lượng tác động ngẫu nhiên (Random effects estimator).
3.1.4. Lựa chọn mô hình
Câu hỏi đặt ra là mô hình nào sẽ là mô hình phù hợp: Pooled OLS, FE hay RE. Sự phù hợp của ước lượng tác động ngẫu nhiên và tác động cố định được kiểm chứng trên cơ sở so sánh với ước lượng thô.
· Cụ thể, ước lượng tác động cố định được kiểm chứng bằng kiểm định F với giả thuyết Ho cho rằng tất cả các hệ số vi đều bằng 0 (nghĩa là không có sự khác biệt giữa các đối tượng hoặc các thời điểm khác nhau). Bác bỏ giả thuyết Ho với mức ý nghĩa cho trước (mức ý nghĩa 5% chẳng hạn) sẽ cho thấy ước lượng tác động cố định là phù hợp. Đối với ước lượng tác động ngẫu nhiên, phương pháp nhân tử Lagrange (LM) với kiểm định Breusch-Pagan được sử dụng để kiểm chứng tính phù hợp của ước lượng. Theo đó, giả thuyết Ho cho rằng sai số của ước lượng thô không bao gồm các sai lệch giữa các đối tượng var(vi) = 0 (hay phương sai giữa các đối tượng hoặc các thời điểm là không đổi). Bác bỏ giả thuyết Ho, cho thấy sai số trong ước lượng có bao gồm cả sự sai lệch giữa các nhóm, và phù hợp với ước lượng tác động ngẫu nhiên.
· Kiểm định Hausman sẽ được sử dụng để lựa chọn phương pháp ước lượng phù hợp giữa hai phương pháp ước lượng tác động cố định và tác động ngẫu nhiên
(Baltagi, 2008; Gujarati, 2004). Giả thuyết Ho cho rằng không có sự tương quan giữa sai số đặc trưng giữa các đối tượng (vi) với các biến giải thích Xit trong mô hình. Ước lượng RE là hợp lý theo giả thuyết Ho nhưng lại không phù hợp ở giả thuyết thay thế. Ước lượng FE là hợp lý cho cả giả thuyết Ho và giả thuyết thay thế. Tuy nhiên, trong trường hợp giả thuyết Ho bị bác bỏ thì ước lượng tác động cố định là phù hợp hơn so với ước lượng tác động ngẫu nhiên. Ngược lại, chưa có đủ bằng chứng để bác bỏ Ho nghĩa là không bác bỏ được sự tương quan giữa sai số và các biến giải thích thì ước lượng tác động cố định không còn phù hợp và ước lượng ngẫu nhiên sẽ ưu tiên được sử dụng.
Dữ liệu nghiên cứu
Dữ liệu sử dụng trong nghiên cứu này bao gồm số liệu về thu ngân sách của 63 tỉnh, thành phố trực thuộc trung ương của Việt Nam trong 5 năm từ 2011-2015 được thu thập từ Quyết toán thu ngân sách tại các tỉnh thành phố trung ương trong giai đoạn 2011-2015. Số liệu về tăng trưởng kinh tế, dân số, tỷ trọng sản xuất nông nghiệp, lâm nghiệp và thủy sản trong GDP, đầu tư trực tiếp nước ngoài, xuất nhập khẩu của 63 tỉnh, thành phố từ Tổng cục thống kê. Số liệu về năng lực cạnh tranh cấp tỉnh được thu thập từ Phòng Thương mại và Công nghiệp Việt Nam VCCI.