Nếu một trong các giả thiết ban đầu của OLS bị vi phạm (phương sai thay đổi, tự tương quan, đa cộng tuyến). Khi đó, các ước lượng thu được sẽ bị bóp méo và sẽ là sai lầm nếu sử dụng chúng để phân tích. Phương pháp cơ bản trong trường hợp có thể sử dụng phương pháp hồi quy theo mô hình các ảnh hưởng cố định (FEM) hoặc ảnh hưởng ngẫu nhiên (REM) để ước lượng các dữ liệu dạng bảng. Kiểm định Hausman để lựa chọn mô hình ảnh hưởng ngẫu nhiên và mô hình ảnh hưởng cố định.
Mô hình ảnh hưởng cố định (FEM)
Với giả định mỗi thực thể đều có những đặc điểm riêng biệt có thể ảnh hưởng đến các biến độc lập, FEM phân tích mối tương quan này giữa phần dư của mỗi thực thể với các biến độc lập qua đó kiểm soát và tách ảnh hưởng của các đặc điểm riêng
biệt (không đổi theo thời gian) ra khỏi các biến giải thích để chúng ta có thể ước lượng những ảnh hưởng thực của biến độc lập lên biến phụ thuộc.
Mô hình ước lượng sử dụng: Yit = Ci + β Xit + uit *
Trong đó: Yit: biến phụ thuộc – với i:doanh nghiệp và t: thời gian (năm).
Xi,t: biến độc lập
Ci (i=1….n): hệ số chặn cho từng thực thể nghiên cứu. β: hệ số góc đối với nhân tố X.
ui,t : phần dư.
Mô hình trên đã thêm vào chỉ số i cho hệ số chặn c để phân biệt hệ số chặn của từng doanh nghiệp khác nhau có thể khác nhau, sự khác biệt này có thể do đặc điểm khác nhau của từng doanh nghiệp hoặc do sự khác nhau trong chính sách quản lý, hoạt động của doanh nghiệp.
Mô hình ảnh hưởng ngẫu nhiên (REM)
Điểm khác biệt giữa mô hình ảnh hưởng ngẫu nhiên và mô hình ảnh hưởng cố định được thể hiện ở sự biến động giữa các thực thể.Nếu sự biến động giữa các thực thể có tương quan đến biến độc lập trong mô hình ảnh hưởng cố định thì trong mô hình ảnh hưởng ngẫu nhiên sự biến động giữa các thực thể được giả sử là ngẫu nhiên và không tương quan đến các biến giải thích.
Chính vì vậy, nếu sự khác biệt giữa các thực thể có ảnh hưởng đến biến phụ thuộc thì REM sẽ thích hợp hơn so với FEM. Trong đó, phần dư của mỗi thực thể (không tương quan với biến giải thích) được xem là một biến giải thích mới.
Ý tưởng cơ bản của mô hình ảnh hưởng ngẫu nhiên cũng bắt đầu từ mô hình: Yit = Ci + β Xit + uit
Thay vì trong mô hình trên, Ci là cố định thì trong REM có giả định rằng nó là một biến ngẫu nhiên với trung bình là C1 và giá trị hệ số chặn được mô tả như sau:
Ci = C + εi (i=1,...n)
εi: Sai số ngẫu nhiên có trung bình bằng 0 và phương sai là Thay vào mô hình ta có:
Yit = C + β Xit + εi + uit hay Yit = C + β Xit + wit với wit = εi + uit
εi: Sai số thành phần của các đối tượng khác nhau (đặc điểm riêng khác nhau của từng doanh nghiệp)
uit: Sai số thành phần kết hợp khác của cả đặc điểm riêng theo từng đối tượng và theo thời gian
3.4.4. Bước 4: Ước lượng các hệ số hồi quy OLS
Nhược điểm của ước lượng OLS có thể nhận diện sai do hiện tượng tự tương quan, hiện tượng đa cộng tuyến hoặc phương sai thay đổi sẽ dẫn đến kết quả ước lượng sai; Do đó, sau khi thực hiện kiểm định OLS chúng ta thực hiện kiểm định các giả định của mô hình.
Kiểm tra hiện tượng đa cộng tuyến:
Mô hình cổ điển là mô hình lý tưởng với giả thiết các biến giải thích không tương quan với nhau. Nghĩa là mỗi biến chứa đựng một số thông tin riêng về biến phụ thuộc và thông tin đó lại không có trong biến độc lập khác. Khi đó ta nói không có hiện tượng đa cộng tuyến. Kiểm tra hiện tượng đa cộng tuyến bằng cách sử dụng tương quan cặp giữa các biến độc lập cao và nhân tử phóng đại phương sai (VIF). Nếu các cặp tương quan giữa các biến độc lập cao (lớn hơn 0,8) thì có thể xảy ra hiện tượng đa cộng tuyến. Tuy nhiên tiêu chuẩn này thường không chính xác. Có những thường trường hợp tương quan cặp không cao nhưng vẫn xảy ra đa cộng tuyến. Do đó, để đảm bảo tính chính xác trong nghiên cứu có sử dụng nhân tử phóng đại phương sai để kiểm tra hiện tượng đa cộng tuyến.
Nhân tử phóng đại phương sai: VIFj=1/ (1-Rj2)
Theo quy tắc kinh nghiệm, nếu VIF >10 thì xảy ra hiện tượng đa cộng tuyến
Kiểm tra hiện tượng tự tương quan: tự tương quan là sự tương quan giữa các thành phần của chuỗi quan sát được sắp xếp theo thứ tự thời gian (trong chuỗi thời gian) hoặc không gian (trong số liệu chéo). Nghĩa là trong mô hình hồi quy cổ điển OLS ta giả thiết rằng không có tương quan giữa các Ui, Cov (Ui,Uj) = 0 (j ≠ i), sai số ứng với quan sát nào đó không bị ảnh hưởng bởi sai số ứng với quan sát khác. Kiểm định tự tương quan thông qua: kiểm định Durbin-Watson test
Trường hợp hệ số Dunrbin – Watson từ 1 đến 3 kết luận không có hiện tượng tự tương quan
Trường hợp hệ số Dunrbin – Watson < 1 kết luận có hiện tượng tự tương quan dương
Trường hợp hệ số Dunrbin – Watson > 3 kết luận có hiện tượng tự tương quan âm
Kiểm tra hiện tượng phương sai thay đổi: Kiểm địnhBreusch & Pagan (1979)
Bước 1: Chạy mô hình gốc: Y = β1 + β2X2 + β3X3 + β4X4 + β5X5 + u
Bước 2: Tạo biến phần dư GENR U1=RESID2
Bước 3: Chạy hồi quy phụ: U1 = α1 + α2X2 + α3X3 + α4X4 + α5X5 + u --> Tìm R2 phụ
Bước 4: Tính trị số LM = n* R2 phụ
Bước 5: Tìm thống kê Chi bình phương =@QCHISQ(1-α, p-1) Trong đó: p là số hệ số hồi quy của mô hình hồi quy phụ (bước 3)
Bước 6: Dựa vào hồi quy phụ ởbước 3, ta đặt giả thuyết sau: Ho: α2 = α3 = α4 = α5 = 0 (Không có phương sai sai số thay đổi) H1: có ít nhất 1 α ởtrên khác 0 (Có phương sai sai số thay đổi)
Trường hợp xảy ra hiện tượng phương sai sai số thay đổi thì ta dùng FGLS Feasible Generalized Least Squares (FGLS) để khắc phục hiện tượng phương sai sai số thay đổi