2 Kiểm định tính dừng của chuỗi thời gian
2.2 Kiểm định nghiệm đơn vị đối với tính dừng
Một phương pháp kiểm định tính dừng khác được sử dụng khá phổ biến đó là kiểm định nghiệm đơn vị. Để nghiên cứu phương pháp này, ta hãy xem xét mơ hình tự hồi quy bậc 1 (AR(1)) như sau:
Yt=ρYt−1+Zt (2.9)
4G.M. Ljung và G.P.E. Box,Về một cách đo lường khơng thích hợp trong các mơ hình chuỗi thời gian, Biometrika, Quyển 66, 1978, trang 66-72.
trong đó |ρ|<1 (xem Ví dụ 2.4), Zt là số hạng chỉ sai số ngẫu nhiên xuất phát từ các giả định cổ điển rằng nó có giá trị trung bình bằng 0, phương sai σ2 và khơng tự tương quan. Số hạng này còn được biết đến dưới cái tên làsai số nhiễu ngẫu nhiên hay sai số nhiễu trắng (white noise error) theo thuật ngữ của khoa học kỹ thuật ứng dụng.
Nếu trong thực tế hệ số của Yt−1 là bằng 1 thì ta nói chúng ta đang phải đối mặt với vấn đề nghiệm đơn vị, tức là tình huống chuỗi khơng có tính dừng5. Thật vậy:
Y1 = Y0+Z1
Y2 = Y1+Z2 =Y0+Z1+Z2 ...
Yt = Yt−1+Zt =...=Y0+Z1+Z2+...+Zt
trong đó Y0 là hằng số và tổng Z1+Z2+...+Zt thể hiện một di động ngẫu nhiên mà như ta đã biết trong Ví dụ 2.2 đây là một q trình ngẫu nhiên khơng dừng, do đó q trình Yt = Yt−1 +Zt khơng có tính dừng. Do vậy, nếu ta thực hiện hồi quy theo cơng thức (2.9) và tìm ra ρ= 1 thì ta nói rằng biến ngẫu nhiên Yt
có nghiệm đơn vị. Với ý tưởng trên, Dickey và Fuller6 đã đề xuất quy tắc kiểm định tính dừng dựa trên việc kiểm định nghiệm đơn vị như sau:
2.2.1. Kiểm định Dickey-Fuller
Quy tắc 2.5. Xét bài toán kiểm định giả thiết H, đối thiết K với mức ý nghĩa α cho mơ hình AR(1) Yt =ρYt−1+Zt như sau:
H :ρ= 1
K :ρ <1
Với bρ là ước lượng của ρ dựa trên mẫu thu được. Đặt τ := ρb
p
V ar(ρ)b
. (2.10)
5Một quan điểm kỹ thuật: Ta có thể viết (2.9) thànhYt−ρYt−1 =Zt. Sử dụng tốn tử độ trễBsao choBYt=
Yt−1, B2Yt=Yt−2...khi đó ta có thể viết (2.9) dưới dạng(1−ρB)Yt =Zt. Thuật ngữnghiệm đơn vị là để nói tới nghiệm của đa thức1−ρxtrong tốn tử độ trễ.
6D.A. Dickey và W.A. Fuller,Phân bổ của các hàm ước lượng đối với các chuỗi thời gian tự hồi quy với nghiệm đơn vị, Tạp chí của Hiệp hội Thống kê Hoa kỳ, Quyển 74, 1979, trang 427-431.
Khi đó, ta bác bỏ giả thiết H nếu|τ|>|tα|. Giá trị tα được gọi là giá trị tới hạn, giá trị này được rút ra từ bảng phân phối Student với mức ý nghĩa α hoặc lấy từ các bảng Dickey-Fuller hoặc bảng MacKinnon Dickey-Fuller7.
Khi thực hiện kiểm định nghiệm đơn vị, nếu ta có thể bác bỏ giả thiếtH :ρ= 1
điều này tương đương ta có thể kết luận chuỗi thời gian {Yt} với Yt :=ρYt−1+Zt
là chuỗi thời gian dừng.
Ngồi ra, phương trình (2.9) cịn được trình bày dưới dạng:
∆Yt = (ρ−1)Yt−1+Zt
= δYt−1+Zt (2.11)
trong đó, δ = ρ−1 và ∆Yt := Yt−Yt−1 được gọi là sai phân bậc 1 của Yt. Với định nghĩa này, hai phương trình (2.9) và (2.11) là tương đương. Tuy nhiên, lúc này giả thiết H trong quy tắc kiểm định Dickey-Fuller sẽ là δ = 0.
Nếu thực sự δ= 0, ta có thể viết (2.11) dưới dạng ∆Yt =Yt−Yt−1 =Zt.
Phương trình trên cho ta thấy rằng sai phân bậc 1 của chuỗi thời gian di động ngẫu nhiên là một chuỗi thời gian dừng do có giả định Zt là thuần túy ngẫu nhiên.
Lưu ý: Thống kê τ trong kiểm định Dickey-Fuller không tuân theo luật phân bố Student. Giả thiết H còn được gọi là giả thiết rỗng (null hypothesis).
2.2.2. Kiểm định Dickey-Fuller gia tăng
Vì lý do về mặt lý thuyết và thực tiễn, kiểm định Dickey-Fuller được áp dụng đối với các hồi quy ở dạng:
∆Yt = δYt−1+Zt (2.12)
∆Yt = β1+δYt−1+Zt (2.13)
∆Yt = β1+β2t+δYt−1+Zt (2.14)
7Các bảng Dickey-Fuller chưa phải hoàn toàn đầy đủ, chúng đã được mở rộng một cách đáng kể bởi MacKinnon thông qua các mô phỏng Monte Carlo (xem thêm trong J.G. MacKinnon,Critical Values for Co-Integration Teststrong R.F. Engle và C.W. J. Granger (eds)Long-Run Economic Relationships, Oxford University Press, p. 267-276). Trong các chương trình phần mềm thống kê như EVIEWS, ET, MICROTSP, SHAZAM... đều có thể cho ra các giá trị tới hạn Dickey-Fuller và MacKinnon của kiểm định Dickey-Fuller.
ở đây β1, β2 là các hằng số thực, t là biến xu thế hoặc biến thời gian và {Zt} là các biến ngẫu nhiên không tự tương quan. Trong mỗi trường hợp nói trên giả thiết H sẽ là δ= 0, tức là có nghiệm đơn vị.
Trong trường hợp các sai số Zt là các biến ngẫu nhiên tự tương quan, ta sẽ biến đổi (2.14) về dạng: ∆Yt = β1+β2t+δYt−1+ k X i=1 θi(Yt−i−Yt−i−1) +εt = β1+β2t+δYt−1+ k X i=1 θi∆Yt−i+εt (2.15)
Số lượng sai phân (k) cần có thường được xác định bằng thực nghiệm sao cho số hạng sai sốεt (thường là nhiễu trắng) là độc lập với chuỗi. Số k còn được gọi là
chiều dài độ trễ. Giả thiết H được sử dụng vẫn là H :ρ= 1 hoặc H :δ = 0. Khi
kiểm định Dickey-Fuller được áp dụng cho các mơ hình có dạng (2.15) nó được gọi là Kiểm định Dickey-Fuller gia tăng (ADF - Augmented Dickey-Fuller).
Kết quả của kiểm định nghiệm đơn vị theo kiểm định Dickey-Fuller gia tăng thường rất nhạy cảm với sự lựa chọn chiều dài độ trễ k. Tiêu chuẩn thông tin
AIC (Akaike’s Information Criterion) do Hirotsugu Akaike phát triển năm 1973 thường được sử dụng để chọn lựa k tối ưu cho mơ hình ADF. Trong tiêu chuẩn này, giá trị k sẽ được lựa chọn sao cho thống kê AIC đạt giá trị nhỏ nhất. Giá trị
k này sẽ được tìm một cách tự động khi sử dụng phần mềm EVIEWS để thực hiện kiểm định nghiệm đơn vị.
Ngoài các kiểm định Dickey-Fuller và Dickey-Fuller gia tăng, có một số kiểm định khác để kiểm định nghiệm đơn vị cũng thường được sử dụng như kiểm định Dickey-Fuller GLS (được đề xuất năm 1996 bởi Elliott, Rothenberg và Stock), kiểm định Phillips-Perron và kiểm định Kwiatkowski-Philips-Schmidt-Shin...
2.2.3. Kiểm định tính tự tương quan của các sai số ngẫu nhiên
Như đã nói ở trên, kiểm định Dickey-Fuller chỉ áp dụng trong trường hợp sai số {Zt} là các biến ngẫu nhiên không tự tương quan. Trong trường hợp {Zt} là các biến ngẫu nhiên tự tương quan ta áp dụng kiểm định Dickey-Fuller gia tăng. Để kiểm định tính tự tương quan của các sai số ngẫu nhiên này ta có kiểm định do James Durbin và Geoffrey Watson phát triển năm 1952 như sau:
Quy tắc 2.6. (Kiểm định Durbin-Watson) Xét mơ hình hồi quy tuyến tính Y =β0+β1X1+...+βkXk+ε
trong đó βi (i= 0,1, ..., k) là các hệ số chưa biết, ε được gọi là phần dư hay sai số hệ thống, sai số ngẫu nhiên.
Tiến hành n quan sát độc lập, đồng thời về k+ 1 biến X1, X2, ..., Xk, Y. Giả sử các số liệu quan sát được tuân theo mô hình sau
y1 = β0+β1x11+...+βkx1k+ε1 y2 = β0+β1x21+...+βkxnk+ε1
...
yn = β0+β1xn1+...+βkxnk+εn
Khi đó, để kiểm định tính tự tương quan của các sai số ngẫu nhiên ε1, ε2, ..., εn với mức ý nghĩa α ta làm như sau:
Đặt r := n X i=2 b εi−1bεi ! / n X i=1 b ε2i ! khi đó thống kê DW := n X i=2 (bεi−bεi−1)2/ n X i=1 b ε2i ≈2(1−r) (2.16)
tuân theo phân phối Durbin-Watson. Thực hiện tra bảng phân vị của phân phối Durbin-Watson ứng với mức ý nghĩa α, k biến độc lập, cỡ mẫu n ta tìm được hai giá trị d1(k, n, α) và d2(k, n, α). Thực hiện so sánh DW với d1, d2 và kết luận dựa trên các phương án như sau:
- Nếu 0≤DW < d1 hoặc 4−d1 < DW ≤4 thì các εi là tự tương quan. - Nếu d1≤DW ≤d2 hoặc 4−d2 ≤DW ≤4−d1 thì chưa thể kết luận được. - Nếu d2< DW < 4−d2 thì các εi khơng tự tương quan.
Chú ý 2.1. Nếu DW ≈2 thì các εi là khơng tự tương quan.