2 Kiểm định tính dừng của chuỗi thời gian
2.1 Kiểm định tính dừng dựa vào hệ số tự tương quan mẫu
2.1.1. Hệ số tự tương quan mẫu
Giả sử có các quan sát{xt}của chuỗi thời gian{Xt}. Khi đó, ước lượng khơng chệch của hệ số tự hiệp phương sai γX(h) là hệ số tự hiệp phương sai mẫubγX(h)
được cho bởi
b γX(h) = 1 n n−|h| X t=1 xt+|h|−X¯ xt−X¯
và hệ số tự tương quan mẫu là
b
ρX(h) = bγX(h)
bγX(0)
(với độ trễ của thời gian là h). Trong đó:
- n là số quan sát của đại lượng X;
- xt là thể hiện của Xt tại thời điểm t;
- X¯ là giá trị trung bình của các thể hiện của chuỗi thời gian, với
¯ X = 1 n n X i=1 xi.
Công thức trên cho ta thấy bγX(h) và bρX(h) đo mối tương quan giữa đoạn số liệu x1, x2, ..., xn−h với đoạn số liệu xh+1, xh+2, ..., xn cách nhau một độ trễ của thời gian là h.
Đồ thị thể hiện ρbX(h) ở độ trễ của thời gian làh được gọi là lược đồ tương quan mẫu (sample correlogram).
2.1.2. Quy tắc kiểm định tính dừng dựa vào hệ số tự tương quan mẫu
Năm 1946, M.S. Barlett đã chỉ ra rằng3 khi mẫu khá lớn, nếu một chuỗi thời gian là ngẫu nhiên và dừng thì các hệ số tự tương quan ρbX(h) với h = 1,2, ...
sẽ có phân phối xấp xỉ chuẩn với trung bình bằng 0 và có độ lệch tiêu chuẩn là 1/√
n, tức là ρbX(h) ∼= N(0,1/n). Do vậy, khi cho trước độ tin cậy 1−α với
0< α <1 ta có thể thiết lập khoảng tin cậy −uα/2/√
n;uα/2/√
n,
trong đóuα/2 được rút ra từ bảng phân vị của phân phối chuẩn tắc ứng với mức ý nghĩa α.
Quy tắc 2.1. (Kiểm định Barlett) Với độ tin cậy 1−α, nếu giá trị bρX(h) thỏa mãn điều kiện
−uα/2/√
n <ρbX(h)< uα/2/√
n (2.6)
thì ρX(h) được xem là xấp xỉ 0.
Nếu ρbX(h) khơng thỏa mãn điều kiện (2.6), ta nói ρX(h) là khác 0 thực sự.
Từ các phân tích ở trên, ta có quy tắc chung để kiểm định tính dừng của một chuỗi thời gian dựa vào hệ số tương quan mẫu như sau:
Quy tắc 2.2. Quy tắc chung kiểm định tính dừng của chuỗi thời gian dựa vào hệ số tương quan mẫu:
Nếu các hệ số tự tương quan mẫu bρX(h) của một chuỗi đều thỏa điều kiện (2.6) thì ta xem dãy số liệu đã cho được phân bổ một cách ngẫu nhiên và có tính dừng. Ngược lại, nếu tồn tại giá trị ρbX(h) khơng thỏa mãn điều kiện (2.6) thì trong chuỗi đang xét nhất thiết phải có tồn tại một mối liên kết nào đó (có thể vẫn dừng!).
3On the theoretical Specification of Sampling properties of Autocorrelated Time Series, Journal of the Royal Statis- tical Society, series B, Vol.27, 1946, p. 27-41
Trên cơ sở Quy tắc 2.2, Box và Pierce đã đưa ra quy tắc dưới đây để kiểm định về sự đồng thời bằng 0 của các hệ số tương quan:
Quy tắc 2.3. (Kiểm định Box-Pierce) Xét bài toán kiểm định giả thiết H, đối thiết K sau với mức ý nghĩa α:
H :ρX(1) =ρX(2) =...=ρX(k) = 0
K :∃k0∈(1, k) sao cho ρX(k0)6= 0
Với n là kích thước mẫu, k là độ dài của trễ. Đặt
Q:=n k X h=1 b ρ2X(h). (2.7)
Khi đó, Q∼χ2(k) và ta bác bỏ giả thiết H khi Q > χ2α(k).
Một cải tiến của kiểm định Box-Pierce ta có kiểm định Ljung-Box như sau:
Quy tắc 2.4. (Kiểm định Ljung-Box4) Vẫn xét bài toán kiểm định giả thiết H, đối thiết K với mức ý nghĩa α:
H :ρX(1) =ρX(2) =...=ρX(k) = 0
K :∃k0∈(1, k) sao cho ρX(k0)6= 0
Với n là kích thước mẫu, k là độ dài của trễ. Đặt
LB :=n(n+ 2) k X h=1 b ρ2X(h) n−h. (2.8)
Khi đó, LB ∼χ2(k) và ta bác bỏ giả thiết H khi LB > χ2α(k).
Mặc dù trong các mẫu lớn, cả hai thống kê Q và LB đều tuân luật phân bố
χ2 với k bậc tự do, tuy nhiên, thống kê LB được đánh giá là có nhiều tính chất tốt hơn so với thống kê Q (về mặt thống kê) đối với các mẫu nhỏ.