Hàm tự tương quan đo lường độ phụ thuộc tuyến tính giữa các cặp quan sát y(t) và y(t+k), ứng với thời đoạn k = 1,2,... (k còn gọi là độtrễ). Với mỗi độ trễ k, hàm tự tương quan tại độ trễ k được xác định qua độ lệch giữa các biến ngẫu nhiên Yt, Yt+k so với giá trị trung bình, và được chuẩn hoá qua phương sai (variance).
Giả sử rằng các biến ngẫu nhiên trong chuỗi dừng thay đổi quanh giá trị trung bình µ với phương sai hằng số ơ2. Hàm tự tương quan tại các độ trễ khác nhau sẽ có các giá trị khác nhau.
Trong thực tế, ta có thể ước lượng hàm tự tương quan tại độ trễ thứ k qua phép biến đổi trung bình của tất cả các cặp quan sát, phân biệt bằng các độ trễ k, với giá trị trung bình mẫu là µ, được chuẩn hóa bởi phương sai ơ2. Chẵng hạn, cho một chuỗi N điểm, giá trị rk của hàm tự tương quan tại độ trễ thứ k được tính như sau [ 1 ]:
rk = ∑ với µ = ∑ 𝜎2 = ∑
y, : dữ liệu chuỗi thời gian dừng tại thời điểm t
yl+k: dữ liệu chuỗi thời gian dừng tại thời điểm t+k
µ : giá trị trung bình của chuỗi thời gian dừng
rk : giá trị tương quan giữa y,vàyl+k tại độ trễ k
rk=0 thì không có hiện tượng tự quan, rk ± 1
Về mặt lý thuyết, chuỗi thời gian dừng khi tất cả các rk = 0 hay chỉ vài rkkhác không. Do chúng ta xét hàm tự tương quan mẫu, do đó sai sốmẫu sẽ xuất hiện, vì vậy ta giải thích hiện tượng tự tương quan khi rk =0 theo ý nghĩa thống kê
Để kiểm định có phải là mô hình AR hay không hay rk = 0 theo ý nghĩa thông kê, ta sử dụng kiểm định t cho những mẫu lớn. Khi n khá lớn, các hệ số rk sẽ gần như tuân theo phân phối chuẩn và có µ= 0.
Gọi v là phương sai, v được xác định theo công thức:
v = Như vậy, giá trị tới hạn t được tính như sau: t =
√
Nếu chúng ta muốn kiểm định pk ở mức ý nghĩa 5%, ta sử dụng giá trị tới hạn là 2 để so sánh với thống kê khi kiểm tra các giả thiết:
t = √ √ ∑ Trong đó, k = độ trễ n = số quan sát j = 1,2,…k-1 (j <k) Nếu t <2 thì ta sẽ không có AR (pk< 0). VÍ DỤ
Giả sử ta có một chuỗi gồm 15 giá trị đưa vào, giá trị trung bình mẫu 48.4 và phương sai mẫu là 92.6
42, 59, 35, 66, 37, 58, 49, 63, 52, 45, 36, 50, 43, 39, 52
Hình 1.1 mô tả hàm tự tương quan ACF của chuỗi tại 10 độ trễ đầu tiên. Thanh đầu hiển thị giá trị của hàm tự tương quan tại độ trễ 0, luôn có giá trị 1 vì mỗi quan sát
luôn tự tương quan với chính nó. Thanh thứ nhì mô tả giá trị của hàm tự tương quan tại độ trễ thứ nhất, dao động trung bình giữa các quan sát liên tục: 42 và 59, 59 và 35, 35 và 66,... Áp dụng tiếp tục nguyên tắc tương tự với tất cả các độ trễ khác.
Hình 3. 4 Hàm tự tương quan ACF cho chuỗi ví dụ
Dấu hiệu và độ rộng của một giá trị trên hàm tự tương quan xác định hướng chung và thứ tự của mối quan hệ giữa các cặp quan sát. Trong ví dụtrên, hàm tự tương quan âm (-0.48) tại độ trễ thứ nhất cho thấy khi một thời điểm tăng, thời điểm kế giảm và ngược lại. Nói cách khác, hàm tự tương quan dương tại độ trễ thứ hai cho thấy thời điểm phân chia giữa hai độ trễ có khuynh hướng tăng/ giảm với nhau. Nói chung, hàm tự tương quan ACF thể hiện thay đổi (hình sin) giảm dần về không. Khi hàm tự tương quan ACF giảm đột ngột, có nghĩa rkrất lớn ở độ trễ 1,2 và có ý nghĩa thống kê (|t|>2). Những rk này được xem là những “đỉnh” và ta nói rằng hàm tự tương quan ACF giám đột ngột sau độ trễ k nếu không có những “đỉnh” ở độ trễ lớn hơn k. Hầu hết hàm tự tương quan ACF sẽ giảm đột ngột sau độ trễ 1, 2.
Nếu hàm tự tương quan ACF của chuỗi thời gian không dừng không giảm đột ngột mà trái lại giảm nhanh nhưng đều: không có đỉnh, ta gọi chiều hướng này là “tắt dần” . Xem minh hoạ trong hình 1.3, hàm tự tương quan ACF có thể “tắt dần” trong vài dạng sau:
Dạng phân phối mẫu (hình 2.2 a và b)
Kết hợp cả hai dạng 1 và 2.
Sự khác nhau giữa hiện tượng “tắt dần” nhanh và “tắt dần” chậm đều được phân biệt khá tùy tiện.