4 Phương pháp biến phụ trợ MCMC
4.3 Thuật toán Moller
Các không gian mẫu, ví dụ là không gian mẫu logistic tự động, mẫu Potts và mẫu tự động chuẩn tắc được sử dụng trong việc mô hình hóa nhiều bài toán kỹ thuật. Ví dụ: các phân tích hình ảnh, sơ đồ bệnh án,các phân tích di truyền địa lý và nhiều bài toán khác nữa.
Một vấn đề chủ yếu đối với các mẫu này là các hằng số chuẩn hóa rất khó sử dụng. Vấn đề này có thể được mô tả như sau: giả sử ta có tập dữ liệu X lấy ra từ mẫu thống kê có hàm thống kê hợp lý:
f (x|θ) = 1
Z (θ)exp{−U (x, θ)}, x ∈ X, θ ∈ Θ (4.4) trong đó θ là tham số, Z (θ) là hằng số chuẩn hóa phụ thuộc θ và không thể sử dụng trong dạng đóng. Đặt f (θ) là hàm mật độ tiên nghiệm của θ. Phân phối hậu nghiệm của θ với x đã cho được xác định như sau:
f (θ|x) ∝ 1
Z (θ)exp{−U (x, θ)}f (θ) (4.5) Thuật toán MH không thể áp dụng trực tiếp cho mô phỏng từ f (θ|x) bởi vì xác suất chấp nhận đòi hỏi phải tính tỷ số khó ZZ((θθ0)) trong đó θ0 là giá trị đề nghị. Moller và cộng sự đã có một bước tiến quan trọng đó là đề xuất bổ sung phân phối f (θ|x) bằng các biến ngẫu nhiên phụ trợ sao cho tỷ số hằng số chuẩn hóa ZZ((θθ0)) có thể được thay đổi trong các mô phỏng. Thuật toán Moller có thể được mô tả như sau:
Đặt y là biến phụ trợ, có cùng không gian trạng thái với x. Đặt
f (θ, y|x) =f (x|θ)f (θ)f (y|θ, x) (4.6) là phân phối nối của θ và có điều kiện trên x, trong đó f (y|θ, x) là phân phối của biến ngẫu nhiên phụ trợ y. Để mô phỏng từ (4.6) bằng cách sử dụng thuật toán MH, ta có thể sử dụng phân phối đề nghị
q(θ0, y0|θ, y) =q(θ0|θ, y)q(y0|θ0) (4.7) với tương ứng biến đổi thông thường trên vector tham số θ → θ0qua một bước lấy mẫu chính xác tiếp theo của lấy mẫu y0 từ q(.|θ0). Nếu q(y0|θ0) được đặt là f (y0|θ) thì tỷ số MH có thể được viết như sau:
r(θ, y, θ0, y0|x) = f (x|θ0)f (θ0)f (y0|θ0, x)q(θ|θ0, y0)f (y|θ)
f (x|θ)f (θ)f (y|θ, x)q(θ0|θ, y)f (y0|θ0) (4.8) trong đó hằng số chuẩn hóa chưa biết Z (θ) có thể được thay đổi. Để tính toán được dễ dàng, Moller đề nghị đặt thêm các phân phối đề nghị q(θ0|θ, y) = q(θ0|θ) và q(θ|θ0, y0) =q(θ|θ0) và các phân phối phụ trợ: f (y|θ, x) =f y θb;f (y0|θ0, x) = f y0 θb (4.9)
trong đó θblà một ước lượng của θ, ví dụ có thể thu được bằng cách cực đại một hàm thống kê hợp lý giả. Tóm lại, thuật toán Moller khởi đầu với một điểm tùy ý θ(0) và một mẫu chính xác y(0) rút ra từ f y
θb và các bước lặp giữa 3 bước được thể hiện như sau:
Định nghĩa 4.3. Thuật toán Moller
1. Sinh ra θ0 từ phân phối đề nghị q(θ0|θt)
2. Sinh ra một mẫu chính xác y0từ phân phối f (y|θ0)
3. Chấp nhận (θ0, y0) với xác suất min (1, r) trong đó:
r = f (x|θ0)f (θ0)f y0 θbq(θt|θ0)f (y|θt) f (x|θt)f (θt)f y θb q(θ0|θt)f (y0|θ0)
Nếu điều kiện trên thỏa mãn đặt (θt+1, yt+1) = (θ0, y0), ngược lại ta đặt (θt+1, yt+1) = (θt, yt)