Các vấn đề trong hồi quy dữ liệu bảng trong phân tích cơ bản thường có các mô hình chính sau: POOL, FEM, REM sau đó khi cần phân tích từng bước và sâu hơn người ta mới quan tâm đến các mô hình SUR, IVs,…Việc sử dụng các mô hình này phần nào đã giải thích về việc dùng các kiểm định thống kê.
Mô hình POOL thực chất là mô hình OLS bình thường, điều này xảy ra khi chúng ta sử dụng dữ liệu bảng như một mảng dữ liệu bình thường không phân biệt theo năm và như vậy khi hồi quy mô hình POOL chính là mô hình OLS. Điều này cho thấy nếu như mô hình POOL thực sự phù hợp với dữ liệu hơn 2 mô hình sau thì việc chúng ta sử dụng phân tích bằng mô hình FEM, REM không còn nhiều ý nghĩa. Điều đó dẫn đến trường hợp lúc này chúng ta chỉ cần xem xét mô hình OLS cho dữ liệu có được và thực hiện các kiểm định bình thường. Đây là một cách giải thích cho sự thiếu vắng các kiểm định trong các nghiên cứu về dữ liệu bảng khi mà các nhà nghiên cứu cần tập trung vào các mô hình FEM, REM để phân tích.
Với phương pháp ước lượng dữ liệu bảng, mô hình (1) có thể viết lại thành mô hình hồi quy gộp (pooled model) như sau:
Yit = β0 + β’Xit + εit
Trong đó Yit là biến phụ thuộc và Xit là các biến giải thích trong mô hình.
Mô hình hồi quy gộp chỉ đơn giản là phương pháp ước lượng bình phương nhỏ nhất (OLS). Tuy nhiên, phương pháp OLS này sẽ thích hợp nếu không có sự tồn tại các yếu tố riêng biệt (từng doanh nghiệp) và yếu tố thời gian. Theo Gujarati (2004), việc sử dụng phương pháp OLS bỏ qua bình diện không gian và thời gian của dữ liệu kết hợp, kết quả ước lượng có thể sẽ bị thiên lệch. Vì thế phương pháp ước lượng tác động cố định (FEM) và tác động ngẫu nhiên (REM) sẽ phù hợp hơn vì không bỏ qua các yếu tố thời gian và yếu tố riêng biệt.
Mô hình FEM cho rằng mỗi thực thể (doanh nghiệp) đều có những đặc điểm riêng biệt, có thể ảnh hưởng đến các biến giải thích, có sự tương quan giữa phần dư của mỗi thực thể (có chứa các đặc điểm riêng) với các biến giải thích. FEM có thể kiểm soát và tách ảnh hưởng của các đặc điểm riêng biệt (không đổi theo thời gian) này ra khỏi các biến giải thích để chúng ta có thể ước lượng những ảnh hưởng thực (net effects) của
47
biến giải thích lên biến phụ thuộc. Các đặc điểm riêng biệt (không đổi theo thời gian) này là đơn nhất đối với một thực thể và không tương quan với đặc điểm của các thực thể khác. Mô hình FEM có dạng như sau:
Yit = αi + β’Xit + εit
Trong đó αi cho thấy rằng các tung độ gốc của các công ty có thể khác nhau. Sự khác biệt có thể là do các đặc điểm riêng của từng công ty, như phong cách quản lý hay triết lý quản lý.
Không giống như mô hình FEM, mô hình REM xem đặc điểm riêng giữa các thực thể được giả sử là ngẫu nhiên và không tương quan đến các biến giải thích. REM xem các phần dư của mỗi thực thể (doanh nghiệp) là một biến giải thích mới. Mô hình REM có dạng như sau:
Yit = (α+ui)+ β’Xit + εit
αi = (α+ui)
Trong đó ui là sai số ngẫu nhiên phản ánh sự khác nhau của các cá nhân (doanh nghiệp) có giá trị trung bình bằng 0 và phương sai là
Mô hình REM sử dụng phương pháp ước lượng bình phương tối thiểu tổng quát (GLS). Phương pháp ước lượng này cho phép xem xét đến cơ cấu tương quan của phần dư trong mô hình REM.
Để lựa chọn mô hình ước lượng nào là phù hợp cho nghiên cứu tác giả sử dụng kiểm định Hausman với giả thuyết H0: không có sự tương quan giữa các sai số đặc trưng giữa các đối tượng với các biến giải thích trong mô hình. Nếu giá trị p-value < 0.05, bác bỏ H0. Nếu bác bỏ H0, dẫn đến kết luận ước lượng REM không phù hợp, nên sử dụng ước lượng FEM và ngược lại.
Trong trường hợp nếu mô hình tác động ngẫu nhiên (REM) được lựa chọn, tác giả tiếp tục kiểm tra tính hợp lệ của mô hình tác động ngẫu nhiên bằng cách áp dụng thửnghiệm Breusch Pagan Lagrange. Nếu kết quả thử nghiệm này bác bỏ giả thuyết H0: “Không có tác động ngẫu nhiên” thì mô hình tác động ngẫu nhiên được lựa chọn. Ngược lại, chúng ta áp dụng mô hình hồi quy gộp với phương pháp ước lượng bình phương bé nhất thông thường (OLS).
48
Với các mô hình dữ liệu bảng, mô hình được ước lượng có giả định là phương sai của phần dư (residuals) là đồng đều. Khi tồn tại phương sai thay đổi trong mô hình thì kết quả ước lượng sẽ không còn hiệu quả vì thế cần khắc phục hiện tượng này. Hơn nữa, vấn đề tương quan chuỗi cũng thường gặp trong dữ liệu bảng, vì thế kết quả ước lượng sẽ không còn hiệu quả. Do đó, tác giả sử dụng phương pháp White cross-section 13để khắc phục hiện tượng phương sai không đồng đều và tự tương quan.
49
CHƯƠNG 4. KẾT QUẢ NGHIÊN CỨU VÀ THẢO LUẬN