3 Quyết định Bayes trong mô hình chuỗi thời gian
3.1.1 Bảng dự phòng
Trong các mô hình này, một thống kê đầy đủ là bảng dự phòng. Đó là một bảng nhập các số lượng được phân loại của các biến phân loại khác nhau.
Ví dụ 3.1[10]: Dữ liệu môi trường được thu thập từ cục bảo tồn New York (dữ liệu ozone) và từ các dịch vụ thời tiết quốc gia Mỹ (dữ liệu khí tượng). Bộ dữ liệu này liên quan đến 2 phép đo lặp đi lặp lại hơn 111 ngày liên tục. Cụ thể là, trung bình ozone u từ 1h-3h chiều tại đảo Roosevelt, nhiệt độ tối đa hàng ngày v (độ F) tại sân bay LaGuardia. Ngoài ra, có thêm tháng ω (từ 5/5 → 9/9). Chúng ta có bảng dự phòng sau đây:
month 5 6 7 8 9 ozone temp [1,31] [57,79] 17 4 2 5 18 (79,97] 0 2 3 3 2 (31,168] [57,79] 6 1 0 3 1 (79,97] 1 2 21 12 8
Bảng dự phòng này có 5.2.2 = 20 số hạng, được rút ra từ 3 biến phân loại u, v, và ω. Mỗi số hạng trong bảng là một số nguyên được mô hình như là một biến Poisson. Nếu chúng ta biểu thị số lượng bởiy = (y1, y2, ..., yn), i= 1, ..., n, ta có thể giả sử yi ∼ P(µi), và ta có hàm hợp lý l(µ|y) = n Y i=1 1 µi!µi yi exp(−µi), trong đó µ = (µ1, ...., µn).
Khi chúng ta thể hiện các tham số trung bình µi của mô hình log-tuyến tính như
log (µi) = xiTβ.
Véc tơ hiệp biến xi được tạo ra duy nhất của các chỉ số. Ma trận tỷ lệ X với các hàng bằng xi có các thành phần là các số 0 hoặc 1. Cho một bảng dự phòng, lựa chọn các biến chỉ số bao gồm trong xi có thể khác nhau, phụ thuộc vào mối quan hệ giữa các biến phân loại. Chẳng hạn, trong dữ
X, ta có log (µT) = I X b=1 βbu1b(uT) + J X b=1 βbv1b(vT) + K X b=1 βbω1b(ωT), Cụ thể là:log µl(i,j,k) = βiu+βjv+βkω(1 ≤ i ≤ I, 1≤ j ≤J, 1≤ k ≤K). Trong đó l(i, j, k) tương ứng với chỉ số của (i, j, k) trong bảng, cụ thể là khi u= i, v = j, ω = k.
Bằng cách tương tự với phân tích phương sai (ANOVA), chúng ta có thể biểu diễn công thức trên như là
log µl(i,j,k) = λ+ λui +λvj +λωk +λuvij +λuωik +λvωjk +λuvωijk (3.1) Trong đó λ là trung bình tổng thể, λui là sự chênh lệch biên duyên so với λ khi u = i, λuvij là sự chênh lệch tương tác so với (λ + λui + λvj) khi (u, v) = (i, j)...
Biểu diễn (3.1) là không đồng nhất. Chúng ta sẽ áp đặt các hạn chế đồng nhất trên các tham số như trong mô hình ANOVA. Một quy ước chung là thiết lập bằng 0 các tham số tương ứng với loại đầu tiên của mỗi biến. Chẳng hạn, cho bảng dự phòng 2×2 với 2 biến u và v. Các hạn chế có thể:
λu1 = λv1 = λ11uv = λuv12 = λuv21 = 0.
Để thuận tiện ký hiệu, chúng ta giả sử dưới đây β là véc tơ của các tham số sau khi áp dụng hạn chế "đồng nhất" và X là ma trận với các cột ương ứng bị loại bỏ.