X Y (β + U) U
c. Kiểm định Durbin-watson ở mức ý nghĩa phần dư của phương trỡnh hồi quy với 5% : d Kiểm định sau là kiểm định gỡ và cú kết luận gỡ?
8.3.1 Phát hiện ra sự có mặt của các biến không cần thiết
Giả sử ta có mô hình hồi quy sau:
Yi = β1 + β2X2i + β3X3i + β4X4i + β5X5i + Ui (8.14) Tr-ớc hết l-u ý rằng , nếu lí thuyết cho rằng tất cả các biến X2, X3, X4, X5 đều quyết định Y thì ta phải giữ chúng ở trong mô hình cho dù sau kiểm định thực nghiệm ta nhận thấy rằng hệ số của một biến X nào đó không có ý nghĩa thống kê. Tuy nhiên, nếu trong mô hình có biến ‚kiểm tra‛, m¯ ta để chúng ở trong mô hình để tránh sự chệch do bỏ sót thì chúng ta ph°i tiến hành kiểm định xem sự có mặt của nó ở trong mô hình có thực sự cần thiết hay không. Giả sử
X5 là biến mà ta không biết chắc chắn thuộc vào mô hình hay không thì cách đơn giản là -ớc
l-ợng hồi quy (8.14) và kiểm định hệ số của X5 có bằng không hay không.
Người biờn soạn: TS. Trần Ngọc Minh 206
Giả thiết đối H1: β5≠ 0
Thống kê kiểm định là t = 5
5
ˆβ ˆ
Se(β ) phân phối t Student với n-5 bậc tự do. Nếu giá trị t tính
đ-ợc không v-ợt quá giá trị tới hạn t ở mức ý nghĩa đã chọn thì ta không bác bỏ giả thiết H0.
Nếu ta bác bỏ giả thiết H0 thì biến X5 có thể thuộc vào mô hình.
Tr-ờng hợp ta không chắc chắn rằng cả X4 và X5 có thực sự cần thiết ở trong mô hình hay không thì giả thiết H0: β4 = β5 = 0. Khi đó ta sử dụng kiểm định F đã biết.
Nh- vậy việc phát hiện ra sự có mặt của các biến không cần thiết trong mô hình không phải là việc khó khăn, tuy nhiên chúng ta cần l-u ý rằng trong việc tiến hành các kiểm định về chỉ định này, ta đã có một mô hình trong đầu mà ta thừa nhận là mô hình đúng. Khi đã cho mô hình đó, ta có thể tìm ra một hay một số biến X có thực sự là thích hợp không bằng các kiểm định t và F.
8.3.2.Kiểm định các biến bị bỏ sót
Giả sử chúng ta có mô hình hồi quy tuyến tính sau:
Yt = β0 + β1Xt + Ut (8.15)
Để kiểm định xem mô hình có bị chỉ định sai do thiếu một biến Zt hay không ta phải -ớc
l-ợng mô hình:
Yt = β0 + β1Xt + β2Zt + Ut và kiểm định giả thiết H0: β2 = 0
Nếu ta sẵn có số liệu về Zt thì không có vấn đề gì, những cái cần làm là hồi quy Yt đối với Xt và Zt và kiểm định hệ số của Zt có bằng không hay không.
Tr-ờng hợp không có sẵn quan sát về Z thì chúng ta sẽ sử dụng xấp xỉ ˆZđối với Z. Khi đó
phép kiểm định thích hợp đối với các biến bị bỏ sót là -ớc l-ợng mô hình: Yt = β0 + β1Xt + β2 ˆZt + Vt
và kiểm định giả thiết β2 = 0. Trong tr-ờng hợp ch-a biết biến Z thì có thể thực hiện bằng các cách sau:
1. Kiểm định RESET của Ramsey :
Ramsey đã đề xuất sử dụng Y ,Yˆ ˆt2 t3 làm xẩp xỉ cho Z
t. Trong đó ˆYt là giá trị dự đoán của Yt từ hồi quy của Yt đối với Xt.
Các b-ớc kiểm định RESET nh- sau:
B-ớc 1: hồi quy Yt theo Xt và thu đ-ợc ˆYt (ta gọi mô hình này là mô hình cũ).
B-ớc 2: Hồi quy Yt đối với Xt,Y ,Yˆ ˆt2 t3 (mô hình hồi quy này đ-ợc gọi là mô hình mới) và kiểm
định giả thiết cho rằng các hệ số của Y ,Yˆ ˆt2 t3 bằng 0.
B-ớc 2: Tính 2 2 new old 2 new R - R /m F = 1 - R / n - k
Trong đó: R2old là hệ số xác định của mô hình cũ 2
new
R là hệ số xác định của mô hình mới.
Người biờn soạn: TS. Trần Ngọc Minh 207
k là số hệ số của mô hình mới. Nếu n khá lớn F có phân phối F(m,n-k).
B-ớc 4: Nếu F có ý nghĩa tại mức 5% ta có thể chấp nhận giả thiết cho rằng mô hình (8.15) đ-ợc xác định không đúng.
2. Kiểm định d. Durbin- Watson: Thủ tục kiểm định này gồm các b-ớc:
B-ớc 1: Ước l-ợng mô hình ban đầu, Chẳng hạn: Yi = β0 + β1Xi + Ui
Từ kết quả -ớc l-ợng này, ta thu đ-ợc các phần d- ei.
B-ớc 2: Nếu ta nghi ngờ biến Z đã bị bỏ sót, sắp xếp các phần d- theo thứ tự tăng dần của biến Z, tr-ờng hợp không có số liệu của biến Z ta có thể sắp xếp ei theo một trong các biến độc lập. B-ớc 3: Tính d: n 2 i i-1 i=1 n 2 i i=1 e - e d = e B-ớc 4: Kiểm định:
H0: Dạng hàm đúng (không có tự t-ơng quan).
H1: Dạng hàm sai (có tự t-ơng quan)
Dựa vào bảng Durbin-Watson với mức ý nghĩa để kết luận về H0.
Thí dụ8.2: các biến số : Y, X2 và X3, n = 20 Ta -ớc l-ợng đ-ợc các mô hình sau :
t
ˆY = 9,7702 + 0,52372 X2 + 0,69302 X3, R2 = 0,7815 tính đ-ợc các ˆYt và et
“ Kiểm định Ramsey ‘s Reset : tr-ớc hết -ớc l-ợng mô hình: Yt = β0 + β2X2t + β3X3t + α2 2 t ˆY + vt Ta thu đ-ợc : t ˆY = 7,7604 + 0,995 X2 + 1,318 X3 - 0,083405 t 2 ˆY , R2 = 0,78296 F = 2new 2old 2 new (R -R )/m (1-R )/(n-k) = (0, 78296 0, 7875) / 1 (1 0, 78296) / (20 4) = 0,133872 Trong khi đó : F0,05(1,16) = 4,49. F = 0,133872 < F0,05(1,16) Không bác bỏ giả thiết H0.
Túm lại, làm sao để chọn mụ hỡnh tốt nhất?
Cú thể sử dụng chiến lược từ đơn giản đến tổng quỏt hoặc ngược lai.
Chiến lược từ đơn giản đến tổng quỏt cũn gọi là thuật toỏn tiến (forward regression):
Bước 1: Tỡm biến X với R2 (hay F test) cao nhất và phõn tớch biến này để tỡm trị số p. Vớ dụ tỡm được X1:
Yi = α + β1*X1 + ε
Bước 2: Tỡm trong cỏc biến cũn lại, biến nào cú R2 (hay F test) cao nhất và tỡm trị số p. Vớ dụ tỡm được biến X2:
Người biờn soạn: TS. Trần Ngọc Minh 208 Yi = α + β1*X1 + β2*X2 + ε
Tiếp tục cỏc bước cũn lại như bước 2. Nếu biến khụng cú ý nghĩa thống kờ thỡ ngừng tỡm.