Hồi quy giả tạo ( spurious rergressio n)

Xét 2 chuỗi số liệu t , Xt tạo bởi các biến độc lập có bước ngẫu nhiên:

t = t-1 + 1t 1t ~ iid (0,12) Và t = t-1 + 1t 2t ~ iid (0, 22) Và mô hình:

t = 1 + 2Xt + ut (1) Vì Y và X là các biến độc lập, ta có thể mong đợi giả thuyết H0 là hệ số của biến X bằng 0 sẽ không bị bác bỏ. Tuy nhiên, trên cơ sở những kết quả phân tích của

Monte-Carlo, Granger và Newbold (1974) đã chứng minh H0: 2 = 0 bác bỏ trong 76% phép thử.

Ước lượng hồi quy OLS: t = 1 + 2Xt + utlà giả tạo, không có ý nghĩa và kết quả ước lượng không dùng được. Nguyên nhân là cả t và Xt đều I(1). Vì thế, nói chung là số dư cũng sẽ I(1). Tuy nhiên, ước lượng OLS đặt giả định là phần dư độc lập, cùng phân bố với trung bình bằng 0, phương sai không đổi và không tự tương quan. Nghĩa là, chuỗi không chỉ I(0) - chúng ta đã biết AR(1) tạo nên một chuỗi số liệu I(0) - mà còn là nhiễu trắng. Như vậy, utlà bước ngẫu nhiên và không thoả mãn những điều kiện đó. Ngay cả đối với trường hợp mẫu lớn, tình trạng này cũng không mất đi, điều đó chứng tỏ là mẫu càng lớn thì khả năng H0: 2 = 0 bị bác bỏ một cách sai lầm lại càng lớn.

Rõ ràng, bởi vì biến Xt và t bước ngẫu nhiên và I(1) nên sai phân bậc 1 của chúng Xt và t là chuỗi I(0) và hồi quy OLS:

t = 1 + 2Xt + t (2)

cũng có số dư là I(0). Tuy nhiên, trong triển vọng cân bằng dài hạn  = X = 0. Nếu thay giá trị này vào phương trình, kết quả rút gọn sẽ là 0 = 0. Khi thực hiện phép lấy sai phân, thông tin dài hạn sẽ bị mất. Vì vậy nên đưa vào mô hình cả 2 tác động ngắn hạn và dài hạn, chúng ta tránh việc chỉ đưa vào kết quả sai phân cấp 1 của các biến I(1).

Như vậy hiện tượng hồi quy giả tạo sinh ra do cả biến phụ thuộc và giải thích đều là các chuỗi không dừng.

Để mô tả cho trường hợp hồi quy giả tạo, ta xét mô hình quan hệ của tiêu dùng cá nhân (PCE) và thu nhập khả dụng (PDI).

Mô hình thông thường là: PCEi = 1 + 2PDIi + ui (3) Tuy nhiên, theo thời gian t có thể hồi quy:

PCEt = 1 + 2PDIt + ut

lại là một hồi quy giả tạo. Thật vậy, kết quả hồi quy mô hình này cũng với tệp số liệu ch12bt20:

PCˆEt  171.4412 0.9672 PDI t1 (4) t -7.4809 119.8711 R2=0.994 d=0.5316 Nếu căn cứ vào các kiểm định t và R2 thì chúng ta có thể cho rằng: quan hệ phụ thuộc tương quan của tiêu dùng vào thu nhập khả dụng là rất chặt chẽ và kết quả hoàn toàn phù hợp với các quan hệ kinh tế chung. Tuy

quá lớn trong khi d quá nhỏ gợi ý một sai lầm nào đó

khi dùng kết quả trên để phân tích, có thể là hồi quy giả tạo. Chúng ta hãy xét tiếp kết quả của hai hồi quy sau:

10432 0432 . 0 7704 . 0 711 . 91 ˆ     PCEt t PCE t (5) t 1.6358 1.2983 -1.3276 1 1579 . 0 8834 . 2 2089 . 326 ˆ     PDIt t PDI t (6) t 2.7368 2.5243 -2.5751

Các giá trị của t (theo bảng MacKinnon) cho thấy các hệ số của các biến trễ khác không không có ý nghĩa, nói cách khác cả hai biến đang xét không dừng. Quả thật, với hai hồi quy (5) và (6), ta thấy hồi quy PCE theo PDI với quan sát theo thời gian là một hồi quy giả tạo.

Granger và Newbold cho rằng R2 > d là dấu hiện chứng tỏ hồi quy là giả tạo.

Để khắc phục hồi quy giả tạo, có thể đưa thêm biến xu thế vào mô hình. Lúc đó hệ số của biến giải thích chỉ còn phản ánh thuần tuý ảnh hưởng của biến giải thích đối với biến phụ thuộc, còn thành phần xu thế được thể hiện qua hệ số của biến xu thế.

Tuy nhiên việc đưa thêm biến xu thế vào mô hình chỉ chấp nhận được khi biến xu thế là phi ngẫu nhiên. Để xác định xem biến xu thế có phải là phi ngẫu nhiên hay không ta phải hồi quy mô hình:

Yt = 1 + 2Tt + Yt-1 + ut

và dùng kiểm định DF để kiểm định nghiệm đơn vị. Nếu qua kiểm định này mà Yt là chuỗi không dừng ( có nghiệm đơn vị) thì biến xu thế là ngẫu nhiên. Nếu Yt là chuỗi dừng ( không có nghiệm đơn vị) thì biến xu thế là phi ngẫu nhiên.

Hồi quy giả tạo ( spurious rergressio n)

Đồng liên kết ( cointegratio n)