Bài toán ước lượng tham số vị trí của phân phối Cauchy

Một phần của tài liệu Tìm hiểu về khoảng tin cậy bayes (Trang 66 - 71)

Chương 3. Khoảng tin cậy và khoảng tin cậy Bayes

3.7. Bài toán ước lượng tham số vị trí của phân phối Cauchy

Ta phải tìm khoảng ước lượng cho tham số vị trí của phân phối Cauchy. Giả sử mẫu * + được lấy từ phân phối Cauchy, tức là

( ) ( | )

( )

3.7.2. Lời giải theo phương pháp tần suất

a. Sử dụng thống kê trung bình mẫu làm ước lượng

Phân bố Cauchy có dạng đối xứng, vì thế sẽ tiện lợi nếu ta dùng ước lượng ( ) ( ) ( )

cho tham số , với phân bố của thống kê này ( | ) giống phân bố Cauchy ban đầu (đây là đặc điểm nổi bật của luật Cauchy). Tuy nhiên đây cũng là hạn chế khi chọn thống kê mẫu để ước lượng cho , vì và đều có phân bố giống nhau, chúng sẽ cho cùng một kết quả cả về ước lượng điểm và khoảng tin cậy (với cùng độ dài).

Đặt trong trường hợp riêng biệt, khi ta có và , sẽ là không hợp lý nếu chọn hay làm thống kê ước lượng cho . Để khách quan, trong bài toán này ta sẽ chọn để nghiên cứu. Như vậy ta có

( | )

( ) Suy ra

( ) ( | ) ( )

Vì là phân bố đối xứng, nên khoảng tin cậy ( ) ngắn nhất cho chính là khoảng đối xứng ( ) ( ), với được tìm như sau

( | ) ( | ) ( ( ) ( )), suy ra ( ) (

)

Vậy khoảng tin cậy ngắn nhất cho tương ứng với . gọi khoảng này là CI .

b. Thêm thống kê “nửa khoảng”

Vấn đề đặt ra là liệu thống kê đã sử dụng hết thông tin từ mẫu chưa? Ta sẽ thử thêm thống kê “nửa khoảng”

( ) ( )

có cho ta thêm thông tin có ý nghĩa nào hay không, với phân bố cho cũng là Cauchy nhưng với giá trị median bằng . Như vậy ta quan tâm đến 2 biến mới là ( ).

Tiến hành đổi biến từ phân bố ( | ) ( | ) ( | ). Dễ thấy Jacobian của phép đổi biến này là 2, từ đó phân bố đồng thời là

( ) ( | )

, ( ) -, ( ) -

( ) là độc lập nhưng ( ) thì không. Do đó, phân bố tích lũy của với điều kiện và là

( ) ( | )

, ( ) ( )- * ( )

( ) +

Với phân bố tích lũy mới này, khoảng tin cậy cùng độ dài với ( ) khẳng định ở mức không phải là mà là

( ) ( ) , ( ) ( )-

* ( ) ( ) + Ta có bảng kết quả sau

( ) ( )

( )

Bảng 3. 2. Mức tin cậy của "khoảng tin cậy 90%" tương ứng với các giá trị khác nhau của thống kê

cho ta số liệu thực về mức tin cậy ( ) dựa trên khoảng tin cậy , với nhiều giá trị khác nhau của , cột thứ 3 là tỉ lệ trên toàn bộ các mẫu ( ) . / cho giá trị

( ) lớn hơn .

c. Nhận xét về kết quả của hai cách xử lý

Qua kết quả trên, ta thấy rằng giá trị ( ) thực sự đóng góp lượng thông tin đáng kể trong kết luận về khoảng tin cậy cho tham số. Khi lặp lại số lượng lớn lần lấy mẫu ngẫu nhiên, khoảng CI sẽ cho kết luận đúng trong các trường hợp, tuy nhiên lại không hợp lý trong từng trường hợp riêng lẻ.

- Trong các trường hợp khoảng giá trị của mẫu là nhỏ (ví dụ như hay ), khoảng CI khá rộng, ta có thể chọn khoảng hẹp hơn mà vẫn đưa ra kết luận đúng với các trường hợp.

- Trong các trường hợp khoảng giá trị mẫu rất lớn (ví dụ như hay lớn hơn ), khoảng CI lại cho kết luận chỉ đúng với chưa đến các trường hợp.

Những khuyết điểm trên của khoảng CI có thể khắc phục được bằng cách sử dụng phân bố có điều kiện ( ), sau đó dựa vào ( ) để chọn ra khoảng tin cậy khác nhau sao cho đó là khoảng ngắn nhất trong lớp con các mẫu cho kết quả đúng các trường hợp. Gọi khoảng được tìm như vậy là UR .

Bây giờ ta sẽ so sánh kết quả tính được từ khoảng UR với khoảng CI bằng phương pháp thực nghiệm. Tiến hành chạy 100 mẫu * + từ phân bố Cauchy có tham số vị trí là , tham số tỉ lệ là 1. Sau đó với từng mẫu, tính giá trị đối với khoảng UR, so sánh với đối với khoảng CI. Ta nhận được các kết quả sau

- các khoảng UR sẽ chứa giá trị đúng của tham số vị trí ; - các trường hợp khoảng UR ngắn hơn khoảng CI ( );

- các trường hợp với khoảng giá trị khá nhỏ cho khoảng UR ngắn hơn lần so với CI ( );

- các trường hợp khoảng UR ngắn hơn 3 lần so với CI ( );

- các mẫu với khoảng giá trị rộng nhất, khoảng CI chứa giá trị đúng của ít hơn .

Như vậy, đối với số ít các mẫu “tồi” (có khoảng giá trị rộng), không thể đưa ra ước lượng nào chính xác cho , và khoảng tin cậy ( ) (với độ rộng không đổi) không truyền tải được độ chắc chắn. Để bù đắp cho điều này và giữ cho khả năng thành công trung bình cho các mẫu là , khoảng tin cậy buộc phải đưa ra kết quả trong trường hợp mẫu “tốt” với độ rộng lớn hơn mức cần thiết. Điều này đối lập với khoảng UR, trong phần lớn các trường hợp cho ta khoảng ngắn hơn nhiều.

3.7.3. Lời giải theo phương pháp Bayes Hàm hợp lý cho mẫu * + là

( | )

, ( ) -, ( ) -

Chọn tiên nghiệm đều cho , ta sẽ nhận được phân bố hậu nghiệm là

( ) ( | ) ( )

, ( ) -, ( ) -

, ( ) -, ( ) -

Để tìm khoảng tin cậy Bayes ngắn nhất cho , ta tìm phân phối tích lũy ( ) ( | )

, ( ) ( )-

* ( ) ( ) + Nhận thấy rằng đây chính là phân phối tích lũy ( ), tức là khoảng UR chính là khoảng tin cậy Bayes ngắn nhất! Tuy nhiên việc tiếp cận đến phân phối này nhanh hơn và tự nhiên hơn rất nhiều so với cách giải theo phương pháp tần suất: thống kê ( ) xuất hiện trong quá trình tìm ra phân bố hậu nghiệm cho .

Một phần của tài liệu Tìm hiểu về khoảng tin cậy bayes (Trang 66 - 71)

Tải bản đầy đủ (PDF)

(79 trang)