Bảng dự phòng

Một phần của tài liệu (LUẬN văn THẠC sĩ) quyết định bayes và bài toán occam’s razor (Trang 60 - 63)

3 Quyết định Bayes trong mơ hình chuỗi thời gian

3.1.1 Bảng dự phòng

Trong các mơ hình này, một thống kê đầy đủ là bảng dự phịng. Đó là một bảng nhập các số lượng được phân loại của các biến phân loại khác nhau.

Ví dụ 3.1[10]: Dữ liệu môi trường được thu thập từ cục bảo tồn New York (dữ liệu ozone) và từ các dịch vụ thời tiết quốc gia Mỹ (dữ liệu khí tượng). Bộ dữ liệu này liên quan đến 2 phép đo lặp đi lặp lại hơn 111 ngày liên tục. Cụ thể là, trung bình ozone u từ 1h-3h chiều tại đảo Roosevelt, nhiệt độ tối đa hàng ngày v (độ F) tại sân bay LaGuardia. Ngồi ra, có thêm tháng ω (từ 5/5 → 9/9). Chúng ta có bảng dự phịng sau đây:

month 5 6 7 8 9 ozone temp [1,31] [57,79] 17 4 2 5 18 (79,97] 0 2 3 3 2 (31,168] [57,79] 6 1 0 3 1 (79,97] 1 2 21 12 8

Bảng dự phịng này có 5.2.2 = 20 số hạng, được rút ra từ 3 biến phân loại

u, v, và ω. Mỗi số hạng trong bảng là một số ngun được mơ hình như là một biến Poisson. Nếu chúng ta biểu thị số lượng bởiy = (y1, y2, ..., yn), i= 1, ..., n, ta có thể giả sử yi ∼ P(µi), và ta có hàm hợp lý l(µ|y) = n Y i=1 1 µi!µi yiexp(−µi), trong đó µ = (µ1, ...., µn).

Khi chúng ta thể hiện các tham số trung bình µi của mơ hình log-tuyến tính như

log (µi) = xiTβ.

Véc tơ hiệp biến xi được tạo ra duy nhất của các chỉ số. Ma trận tỷ lệ X với các hàng bằng xi có các thành phần là các số 0 hoặc 1. Cho một bảng dự phòng, lựa chọn các biến chỉ số bao gồm trong xi có thể khác nhau, phụ thuộc vào mối quan hệ giữa các biến phân loại. Chẳng hạn, trong dữ

X, ta có log (µT) = I X b=1 βbu1b(uT) + J X b=1 βbv1b(vT) + K X b=1 βbω1b(ωT), Cụ thể là:log µl(i,j,k) = βiu+βjv+βkω(1 ≤ i ≤ I, 1≤ j ≤J, 1≤ k ≤K).

Trong đó l(i, j, k) tương ứng với chỉ số của (i, j, k) trong bảng, cụ thể là khi u= i, v = j, ω = k.

Bằng cách tương tự với phân tích phương sai (ANOVA), chúng ta có thể biểu diễn cơng thức trên như là

log µl(i,j,k) = λ+ λui +λvj +λkω +λuvij +λuωik +λvωjk +λuvωijk (3.1) Trong đó λ là trung bình tổng thể, λui là sự chênh lệch biên duyên so với λ khi u = i, λuvij là sự chênh lệch tương tác so với (λ + λui + λvj) khi

(u, v) = (i, j)...

Biểu diễn (3.1) là không đồng nhất. Chúng ta sẽ áp đặt các hạn chế đồng nhất trên các tham số như trong mơ hình ANOVA. Một quy ước chung là thiết lập bằng 0 các tham số tương ứng với loại đầu tiên của mỗi biến. Chẳng hạn, cho bảng dự phịng 2×2 với 2 biến u và v. Các hạn chế có thể:

λu1 = λv1 = λ11uv = λuv12 = λuv21 = 0.

Để thuận tiện ký hiệu, chúng ta giả sử dưới đây β là véc tơ của các tham số sau khi áp dụng hạn chế "đồng nhất" và X là ma trận với các cột ương ứng bị loại bỏ.

Một phần của tài liệu (LUẬN văn THẠC sĩ) quyết định bayes và bài toán occam’s razor (Trang 60 - 63)

Tải bản đầy đủ (PDF)

(82 trang)