sự tăng đột biến đáng kể ở độ trễ 1 và giảm dần về 0, đánh giá thấy chuỗi đáp ứng tính dừng, nên chúng ta có thể thử nghiệm các mơ hình với các thành phần AR hoặc MA theo độ trễ 1.
Hình 4.15. Mơ hình ACF với =
Hình 4.16. Mơ hình PACF với =
Bây giờ chúng ta áp dụng mơ hình. Gói thư viện forecast cho phép người dùng xác định rõ bậc của mơ hình bằng cách sử dụng hàm ARIMA() hoặc tự động tạo một tập hợp tối ưu (p, d, q) sử dụng auto.arima().
Hai trong số các tiêu chí được sử dụng rộng rãi nhất là tiêu chí thông tin Akaike (AIC) và các tiêu chuẩn thơng tin Baysian (BIC). Các tiêu chí này có liên quan chặt chẽ và được hiểu là ước tính số lượng thơng tin sẽ bị mất nếu một mơ hình cụ thể được chọn. Khi so sánh các mơ hình, người ta muốn giảm thiểu AIC và BIC.
Bước 5: Trình diễn
Ta có thể chỉ định cấu trúc khơng theo mùa ARIMA và phù hợp với mơ hình để khử dữ liệu theo mùa. Các tham số (1, 1, 1) được đề xuất bởi quy trình tự động; mơ hình kết hợp sự khác biệt về bậc 1 và sử dụng thuật ngữ tự động của độ trễ đầu tiên và mơ hình trung bình động auto.arima().
Ta đã có một mơ hình dự báo, chúng ta có thể bắt đầu bằng cách kiểm tra các ơ ACF và PACF.
Hình 4.17. Mơ hình ( , , )
Có một mơ hình ACF / PACF và các ơ mẫu cịn lại lặp lại ở độ trễ 7. Điều này cho thấy mơ hình của chúng ta có thể tốt hơn với một đặc tả khác, như = 7 ℎ ặ = 7.
Chúng ta có thể lặp lại quá trình phù hợp cho phép thành phần (7) và kiểm tra lại mơ hình chẩn đốn. Lần này, khơng có hiện tượng tự tương quan đáng kể nào. Nếu mơ hình khơng được chỉ định chính xác, thì thường sẽ được phản ánh dưới dạng các xu hướng, độ lệch, hoặc bất kỳ mẫu nào khác khơng được mơ hình nắm bắt. Lý tưởng nhất, dư lượng sẽ trơng giống như nhiễu trắng, có nghĩa là chúng thường được phân phối. Hàm tsdisplay() có thể được sử dụng để vẽ các mơ hình chẩn đốn này. Các mơ hình cịn lại cho thấy phạm vi lỗi nhỏ hơn, ít nhiều tập trung xung quanh 0. Chúng ta có thể quan sát thấy AIC nhỏ hơn đối với cấu trúc (1, 1, 7).
Hình 4.18. Mơ hình ARIMA (1, 1, 7)
Chúng ta có thể thơng qua mơ hình trong R để dự báo h giai đoạn trong tương lai, với tham số h được xác định theo chu kỳ 30 ngày liên tiếp có ghi nhận số liệu cúm của tập dữ liệu.
Hình 4.19. Mơ hình dự báo với hệ số (1, 1, 1)
Đường màu xanh nhạt ở trên cho thấy sự phù hợp do mơ hình cung cấp. Một phương pháp nữa là dự trữ một phần dữ liệu của chúng ta dưới dạng tập hợp "giữ" (hold-out), phù hợp với mơ hình và sau đó so sánh dự báo với các giá trị được quan sát thực tế.