Chương 2. Khoảng tin cậy Bayes
2.2. Phân bố hậu nghiệm không có biểu diễn giải tích cụ thể
2.2.3. Phương pháp MCMC với khoảng tin cậy Bayes
Phương pháp Monte Carlo được coi như công cụ hữu hiệu để đưa ra khoảng tin cậy đối xứng cho tham số trong trường hợp ( | ) không có biểu diễn giải tích cụ thể. Tư tưởng áp dụng tương đối đơn giản: tiến hành rút mẫu mô phỏng MCMC có tính chất ergodic * + từ phân bố ( | ), sau đó sắp xếp thứ tự thành dãy { ( )}. Khi đó khoảng tin cậy đối xứng ( ) sẽ được ước lượng bởi giá trị và . / quantile của mẫu { ( )} ([23]).
b. Khoảng HPD
Trong trường hợp vecto tham số trong ( ) có số chiều cao, phân bố hậu nghiệm biên duyên ( | ) thường không thể biểu diễn được dưới dạng giải tích chính xác, vì thế khoảng HPD không thể có kết quả chính xác. Phương pháp Monte Carlo là công cụ rất hữu hiệu để giải quyết vấn đề này.
Phương pháp Monte Carlo đã được nhiều nhà toán học (Box&Tiao 1992 ([9]), Tanner 1996 ([30])) nghiên cứu và ứng dụng trong việc tìm xấp xỉ cho số (trong ( )), bằng cách sử dụng giá trị -quantile của mẫu các biến ngẫu nhiên độc lập cùng phân phối ( | ).
Đặt ( | ) là -quantile của (tức thỏa mãn ( ) ). Giả sử
*( ) + là mẫu MCMC rút từ phân bố hậu nghiệm đồng thời ( | ), khi đó Gelfand&Smith ([14]) khẳng định rằng * + là mẫu MCMC mô phỏng cho phân bố hậu nghiệm biên duyên ( | ).
Gọi ( | ) với . Ta chọn ( ) là giá trị lớn nhất ở vị trí thứ của dãy
* +, thế thì ( ) là ( )-quantile mẫu của . Khi đó, Hyndman ([15]) kết luận ( ) là ước lượng cho . Thật vậy, chọn ̂ ( ) với , - (là phần nguyên của ), ta có ̂ khi , vì thế ( ̂ ) ( ) khi .
Để có được khoảng HPD cho tham số , ta đặt ( ) là giá trị nhỏ nhất thứ của mẫu
* + và đặt:
( ) ( ( ) ( ,( ) -))
với ,( ) -. Định lý sau là cơ sở để xác định khoảng HPD.
Định lý 2.2.3. ([25]) Cho * + là mẫu MCMC có tính chất ergodic được sinh từ phân bố ( | ) và đặt ( ) ( ( ) ( ,( ) -)), trong đó được chọn sao cho:
( ) ( ,( ) -) ( ) ,( ) -( ( ,( ) -) ( ))
tức là ( ) là khoảng ngắn nhất trong số các khoảng ( ). Nếu ( | ) là một đỉnh và phương trình ( ) có nghiệm duy nhất, thì ta có:
( ) ( ) h.c.c khi
trong đó ( ) được định nghĩa trong ( ). Như vậy, để tìm khoảng HPD ( ) , ta sẽ chọn khoảng ngắn nhất trong trong tất cả các khoảng tin cậy Bayes ( ) .
Chứng minh.
Đặt ( ) ( | ) * ( | ) + là hàm quantile và ( ) là hàm quantile thực nghiệm, tức là: ( ) { ( ) nếu
( ) nếu Ta sẽ chứng minh:
( ) ,( ) -( ( ,( ) -) ( )) ( ) h.c.c Thật vậy, vì ( | ) là một đỉnh nên ta có:
( ) ( ) ( ( ) ( ))
Theo định lý ergodic ta lại có: ∑ * + ( | ) h.c.c , từ đó suy ra:
( ) ( ) ( ) h.c.c Manson (1982) chỉ ra rằng:
( ) | ( ) ( )| h.c.c
Đặt * ( | ) + và * ( | ) +. Xét 3 trường hợp:
Trường hợp 1. Nếu thì theo ( ) ta có:
|
,( ) -( ( ,( ) -) ( ))
( ( ) ( ))|
| ( ) ( )|
| ( ) ( )| h.c.c
Trường hợp 2. Nếu và thì ( ) và ( ) . Khi đó theo ( ), sẽ tồn tại số ( ) sao cho
( )
( ( ) ( ))
( ( ) ( )) ( )
Chọn ( ) thỏa mãn 2 điều kiện
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) Gọi là số nguyên thỏa mãn
( ,( ) -) ( )
,( ) -( ( ,( ) -) ( )) Ta thấy rằng:
{ } {
( ( ,( ) -) ( ))
,( ) -( ( ,( ) -) ( ))}
{
( ( ,( ) -) ( )) ( )}
{
,( ) -( ( ,( ) -) ( )) ( )}
, (,( ) -
) (, -
) ( )-
{
,( ) -( ( ,( ) -) ( )) ( )}
(,( ) -
) (, -
) ( ) ( ) ( ) h.c.c
Và:
,( ) -( ( ,( ) -) ( )) ( ) h.c.c
Từ đó suy ra: . / ( ).
Tương tự ta cũng có . / ( ) ta có:
{|
,( ) -( ( ,( ) -) ( ))
( ( ) ( ))| } ({ } { }
{|
,( ) -( ( ,( ) -) ( ))
( ( ) ( ))|
( ) }) ({ } { } {|
,( ) -( ( ,( ) -) ( ))
( ( ) ( ))| }) { } { } ,
|( ( ) ( )| - *
| ( ) ( )|
Vậy từ ( ) ( ) ( ) ta có
,( ) - ( ( ,( ) -) ( ))
( ( ) ( )) h.c.c
Trường hợp 3. Nếu hoặc , chứng minh tương tự trường hợp 1 và 2.
Như vậy ta đã chứng minh được ( ). tiếp theo ta cần chỉ ra rằng ( ) ( ) h.c.c
Vì phương trình ( ) có nghiệm duy nhất nên tồn tại số sao cho , ( ) ( ( ) ( )) ( ) ( ) Và thì
( ) ( ) ( )( ( ) ( )) Từ đó ta sẽ chỉ ra được: h.c.c ( ). thật vậy đặt:
(
( ) ( )( ( ) ( )) ( )) Dễ thấy
{ } *
,( ) -{ ( ,( ) -) ( )}
( ){ ( ,( ) -) ( )} {|
,( ) -{ ( ,( ) -) ( )} ( )| } {|
( ){ ( ,( ) -) ( )} ( )| } {|
,( ) -{ ( ,( ) -) ( )} ( )| } {|
( ){ ( ,( ) -) ( )}
( )( ( ) ( ))| }
Theo ( ) ta có {|
( ){ ( ,( ) -) ( )}
( )( ( ) ( ))| } Suy ra . / , tương tự ta cũng có . / (đpcm)
Chú ý 2.2.4. i) Phương trình tối ưu ( ) có nghiệm duy nhất khi đạo hàm của ( | ) khác hàm hằng trên mọi khoảng liên thông.
ii) Khi ( ) không có nghiệm duy nhất, nghĩa là có nhiều hơn một khoảng ( ) có độ dài ngắn nhất như nhau, ta sẽ chọn khoảng có cận dưới nhỏ nhất để đảm bảo tính duy nhất cho ( ) (là ước lượng cho ( )).
Định lý 2.2.3 không chỉ hữu ích trong việc tìm ra khoảng HPD cho tham số , mà còn giúp ta tính được khoảng HPD cho một hàm của và . Giả sử ta có ( ) là hàm đã biết. Box&Tiao ([9]) đã khẳng định rằng khoảng HPD không bất biến đối với các phép biến đổi phi tuyến tính. Thậm chí trong trường hợp đơn giản ( ), khoảng HPD của không thể là . ( ( )) ( ( ,( ) -))/ nếu không phải là hàm tuyến tính. Tuy nhiên, định lý 2.2.3 có thể mở rộng trong trường hợp ước lượng cho . Cụ thể trong hệ quả sau.
Hệ quả 2.2.5. ([25]) Cho *( ) + là mẫu MCMC có tính ergodic từ phân bố đồng thời ( | ). Đặt ( ) và { ( )} là giá trị sắp thứ tự từ * +. Khi đó khoảng HPD ( ) ước lượng cho được xấp xỉ bởi:
( ) ( ) ( ( ) ( ,( ) -)) Trong đó được chọn sao cho:
( ) ( ,( ) -) ( ) ,( ) -( ( ,( ) -) ( ))
Định lý 2.2.3 được sử dụng để chứng minh trực tiếp cho hệ quả này. Hệ quả này cho phép ta tính được khoảng HPD cho ( ) mà không cần đến biểu diễn giải tích cho hàm mật độ biên duyên của (và thường rất khó tìm).