4. Nội dung nghiên cứu và các kết quả nghiên cứu
4.2. Phương pháp hồi quy:
Dữ liệu được sử dụng để nghiên cứu thực nghiệm là dữ liệu panel (là dữ liệu đa chiều hay dữ liệu mảng), chứa các quan sát của chuỗi thời gian và của nhiều đối tượng (ởđây
là các biến), qua đó nghiên cứu được động thái theo thời gian của các biến. Dữ liệu mảng sử dụng hiệu quả nhất khi chúng ta không chắc chắn hay nghi ngờ rằng các biến kết quả phụ thuộc vào các biến giải thích không quan sát được tương quan với các biến giải thích quan sát được. Dữ liệu bảng có nhiều ưu điểm hơn so với dữ liệu gộp, chứa
đựng nhiều thông tin hơn và phần nào khắc phục được hiện tượng đa cộng tuyến. Trong phân tích dữ liệu mảng, người ta thường sử dụng 2 mô hình cơ bản fixed effects
model (FEM – mô hình tác động cố định) và random effects model (REM – mô hình
tác động ngẫu nhiên) -Kurt S. (2012).
Mô hình ảnh hưởng cốđịnh có dạng chung là:
là ảnh hưởng cụ thể của các tác nhân không biến thiên theo thời gian, và bởi vì chúng ta giả sử chúng cốđịnh theo thời gian, nên mô hình này được gọi là mô hình ảnh
hưởng cốđịnh.
theo đó, hai thành phần sai số độc lập với nhau.
Trong bài nghiên cứu này, chúng tôi tiến hành chạy dữ liệu với cả 3 phương pháp ước lượng: hồi quy Pooled OLS, Fixed effects model và Random effect model để tìm ra mối tương quan giữa các biến.Trong đó: Ước lượng OLS gộp không quan tâm đến cấu
trúc mảng của dữ liệu mà chỉ đơn giản là đi ước lượng các hệ số và các quan sát là các dữ liệu thuần túy, sai số chuẩn thường có của phương pháp này thì không đúng và các
kiểm định (t-, F-, z-, Wald-) dựa trên đó thì không có ý nghĩa. Sai số chuẩn phù hợp có
thể được ước lượng bằng phương pháp cluster-robust. Kết quả là các hệ số bị lệch và mâu thuẫn với nhau vì biến bị bỏ qua sẽ có thể có tương quan với các biến hồi quy khác. Kiểm định với hai phương pháp còn lại được xem là có ý nghĩa hơn.
Kiểm định Hausman
Hausman test được sử dụng để so sánh hai phương pháp ước lượng. Bài nghiên cứu sẽ
sử dụng Hausman test để kiểm định mô hình nào phù hợp hơn giữa FEM và REM
Điểm khác biệt cơ bản giữa fixed effect model và random effect model là fixed effect không giảđịnh là không có sựtương quan giữa các biến, trong khi đó random effect thì giảđịnh không có sựtương quan giữa các biến. Mô hình fixed effect sử dụng biến giả, nên nó có thể làm giảm đáng kể bậc tự do. Do vậy random effect model có thểđược ưa thích hơn. Tuy nhiên, trong trường hợp các biến có sự tương quan thì giả định của
random effect model không được thỏa mãn, khi đó mô hình sẽđưa ra ước lượng chệch.
Để tiến hành Hausman test, ta có giả thuyết
H0: Các biến kiểm soát và biến giải thích không có tương quan (tức là nên sử dụng random effects model)
Trong đó:
- : vector các hệ sốước lượng từ Fixed effects model
- : vector các hệ sốước lượng từ Random effects model
- (. ): ma trận tương quan tương ứng của hệ sốước lượng từ 2 mô hình
Sau khi kiểm định, dựa trên giá trị p-value, chúng ta sẽ kết luận được các biến có tương
quan hay không và lựa chọn kết quả của mô hình phù hợp nhất.
Tính đồng thời (Simultaneity) trong kinh tế lượng
Lí thuyết về các phương trình đồng thời đã trở thành một vấn đề quan trọng trong nghiên cứu kinh tế (Robert D. Coleman, PhD (2006)) Điều này dựa trên thực tế là bất kì nhà nghiên cứu nào cũng cần phải chú ý đến các vấn đề nội sinh có thể xảy ra trong hồi quy các biến độc lập, trong một phương trình duy nhất hoặc một hệphương trình.
Tính đồng thời trong kinh tế lượng xảy ra khi biến độc lập và biến phụ thuộc có tác
động qua lại lẫn nhau tại cùng một thời điểm. Để giải quyết vấn đề này, nghiên cứu của Erik B. và J. Krishnakumar (2007) đề cập đến các phương pháp tổng quát để có thể
tiếp cận toàn diện và giải quyết tính đồng thời, đó là phương pháp 2-stage least-square và 3-stage least-square. Hai phương pháp sử dụng cùng một cấu trúc phương trình và
có những điểm tương đồng nhất định. Tuy nhiên, để giúp đưa ra các ước lượng tối ưu
cho các hệ sốtương quan trong mô hình, theo nghiên cứu của Theil (1962), bài nghiên cứu này sẽ sử dụng phương pháp 3-stage least-square.