Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 79 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
79
Dung lượng
1,44 MB
Nội dung
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN - Trịnh Thị Ngọc Lan TÌM HIỂU VỀ KHOẢNG TIN CẬY BAYES LUẬN VĂN THẠC SĨ KHOA HỌC Hà Nội – Năm 2015 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN - Trịnh Thị Ngọc Lan TÌM HIỂU VỀ KHOẢNG TIN CẬY BAYES Chuyên ngành: Lý thuyết xác suất Thống kê toán học Mã số: 60460106 LUẬN VĂN THẠC SĨ KHOA HỌC NGƯỜI HƯỚNG DẪN KHOA HỌC: TS TRỊNH QUỐC ANH Hà Nội – Năm 2015 LỜI CẢM ƠN Luận văn hồn thành hướng dẫn nhiệt tình TS Trịnh Quốc Anh Thầy dành nhiều thời gian hướng dẫn giải đáp thắc mắc tơi suốt q trình làm luận văn Tơi muốn bày tỏ lòng biết ơn sâu sắc đến thầy Qua xin gửi tới quý thầy cô Khoa Toán – Cơ – Tin học, trường Đại học Khoa học Tự nhiên, đại học Quốc gia hà Nội, thầy tham gia giảng dạy khóa cao học 2013 – 2015, lời cảm ơn sâu sắc công lao dạy dỗ suốt trình học tập tơi Trường Để hồn thành chương trình đào tạo hồn thiện luận văn này, thời gian vừa qua nhận nhiều giúp đỡ quý báu, lớn lao từ gia đình bạn bè Vì vậy, này, muốn gửi lời cảm ơn tới người Hà Nội ngày 01 tháng 12 năm 2015 Học viên Trịnh Thị Ngọc Lan Mục lục Danh mục hình vẽ, bảng biểu Danh mục từ viết tắt MỞ ĐẦU Chương Cơ sở lý thuyết 12 1.1 Thống kê tần suất 12 1.1.1 Họ mũ thống kê đủ 12 1.1.2 Tính khơng chệch ước lượng liên quan 13 1.1.3 Khoảng tin cậy 14 1.2 Thống kê Bayes 15 1.2.1 Ước lượng Bayes 15 1.2.2 Phân phối tiên nghiệm 18 1.2.3 Khoảng tin cậy Bayes 20 Chương Khoảng tin cậy Bayes 25 2.1 Phân bố hậu nghiệm có biểu diễn giải tích cụ thể 26 2.1.1 Khoảng tin cậy Bayes đối xứng 26 2.1.2 Khoảng HPD 26 2.2 Phân bố hậu nghiệm khơng có biểu diễn giải tích cụ thể 27 2.2.1 Phương pháp Monte Carlo 28 2.2.2 Phương pháp Monte Carlo xích Markov 31 2.2.3 Phương pháp MCMC với khoảng tin cậy Bayes 32 2.3 Bài tốn mơ 38 Chương Khoảng tin cậy khoảng tin cậy Bayes 44 3.1 Bài tốn sai khác hai giá trị trung bình 46 3.1.1 Phát biểu toán 46 3.1.2 Lời giải theo phương pháp tần suất 46 3.1.3 Lời giải theo phương pháp Bayes 47 3.1.4 Nhận xét 50 3.2 Bài toán so sánh hai phương sai 51 3.2.1 Phát biểu toán 51 3.2.2 Lời giải theo phương pháp tần suất 51 3.2.3 Lời giải theo phương pháp Bayes 52 3.2.4 Nhận xét 52 3.3 Bài toán tham số tỉ lệ phân bố mũ 53 3.3.1 Phát biểu toán 53 3.3.2 Lời giải theo phương pháp tần suất 53 3.3.3 Lời giải theo phương pháp Bayes 54 3.3.4 Các thiếu sót hai lời giải 55 3.3.5 Cải tiến thiếu sót đặc tính “chuỗi” 56 3.3.6 Nhận xét 57 3.3.7 Cải tiến thiếu sót thơng tin tiên nghiệm 58 3.4 Tổng kết hai cách tiếp cận tốn ước lượng phía 60 3.5 Bài toán ước lượng cho tham số phân bố mũ rút gọn E θ, 61 3.5.1 Phát biểu toán 61 3.5.2 Lời giải theo phương pháp tần suất 61 3.5.3 Lời giải theo phương pháp Bayes 62 3.5.4 Nhận xét 63 3.6 Bài toán ước lượng tham số tỉ lệ phân bố nhị thức 64 3.6.1 Phát biểu toán 64 3.6.2 Lời giải theo phương pháp tần suất 64 3.6.3 Lời giải theo phương pháp Bayes 65 3.7 Bài tốn ước lượng tham số vị trí θ phân phối Cauchy 66 3.7.1 Phát biểu toán 66 3.7.2 Lời giải theo phương pháp tần suất 67 3.7.3 Lời giải theo phương pháp Bayes 70 3.8 Tổng quát trường hợp khoảng tin cậy khoảng tin cậy Bayes cho kết giống phân phối có tham số vị trí 71 KẾT LUẬN 73 TÀI LIỆU THAM KHẢO 74 Phụ lục A Các phân phối xác suất thường gặp 77 Danh mục hình vẽ, bảng biểu Hình 1.2 Sơ đồ trình tìm ước lượng Bayes cho tham số 18 Hình 1.2 So sánh khoảng tin cậy đối xứng khoảng HPD 95% 23 Hình 1.2 Khoảng (vùng) tin cậy HPD cho tham số trường hợp phân bố hậu nghiệm có hai đỉnh 24 Hình 2.2 Mô Monte Carlo cho phân bố hậu nghiệm với cỡ mẫu tăng dần 29 Hình 2.3 Mơ phân phối tiên nghiệm tham số 𝛾 40 Hình 2.3 Mô phân phối hậu nghiệm tham số γ 40 Bảng So sánh khoảng tin cậy 95% cho tham số 𝒇 theo hai phương pháp tần suất Bayes 66 Bảng Mức tin cậy "khoảng tin cậy 90%" tương ứng với giá trị khác thống kê 𝑦 69 Danh mục từ viết tắt HPD Mật độ hậu nghiệm cao MCMC Monte Carlo xích Markov UMVU Khơng chệch với phương sai bé ƯLKC Ước lượng không chệch MỞ ĐẦU Tính cấp thiết đề tài Suy luận Bayes suy luận thống kê mà quan sát hay chứng dùng để cập nhật suy luận xác suất cho việc giả thuyết Cái tên "Bayes" bắt nguồn từ việc sử dụng định lý Bayes trình suy luận, thước đo cho mức độ mà chứng làm thay đổi tin tưởng vào giả thuyết (luôn gắn liền với xác suất tiên nghiệm) Mặc dù việc lựa chọn xác suất tiên nghiệm cho giả thuyết coi chủ quan, dẫn đến xác suất khác nhau, chứng từ quan sát lặp lặp lại có xu hướng đưa xác suất hậu nghiệm lại gần Suy luận bayes ngày trở nên phổ biến suy luận thống kê Mặc dù Thomas Bayes đề cập đến từ kỷ 18, phải đến kỷ 20, suy luận thống kê có tảng tốn học vững với cơng trình Ronald Fisher, Karl Pearson, Jerzy Neyman, De Finetti Abraham Wald, suy luận Bayes trở thành vấn đề tranh cãi không kết quả, cách làm mà tư tưởng thực hiện, so với suy luận tần suất Trong thời gian dài từ trước chiến hai, phương pháp tần suất phát triển mạnh Tần suất thắng thống trị khắp khoa thống kê Mỹ, từ Berkeley, Stanford đến Harvard, Chicago Phương pháp Bayes nghiên cứu vài khoa thống kê nhỏ (khi đó) Carnegie Mellon Duke Ngày nay, khoa học thống kê bớt dần tính triết lý giáo điều mà dịch dần tính thực dụng phải đối đầu với vấn đề có liệu phức tạp Phương pháp Bayes thực cơng cụ hữu ích nhiều tình thống kê sống, mà tần suất tỏ khơng hiệu (ví dụ lĩnh vực trí tuệ nhân tạo) Suy luận Bayes bước tiếp nhận ưa chuộng, dạy học hầu hết khoa thống kê Tuy nhiên khác biệt Bayes tần suất ngun, câu chuyện Bayes tần suất khơng nóng hổi tính thời sự, mà mang nhiều sắc thái vơ thú vị Chính lý này, tơi chọn đề tài: “Tìm hiểu khoảng tin cậy Bayes” cho luận văn Đối tƣợng nghiên cứu Đối tượng nghiên cứu luận văn là: cách xây dựng hai khoảng tin cậy Bayes sử dụng chủ yếu suy luận thống kê: khoảng đối xứng khoảng chứa xác suất hậu nghiệm cao (HPD); sở so sánh với khoảng tin cậy tần suất để giống khác hai cách tiếp cận Phạm vi nghiên cứu Nội dung lý thuyết khoảng tin cậy Bayes xây dựng luận văn song song với tiêu chí xây dựng khoảng tin cậy chương trình thống kê đại học, từ đưa so sánh tương ứng hai cách tiếp cận Ngồi luận văn đề cập đến phương pháp mô Monte Carlo công cụ số để giải toán ước lượng nêu Mục đích nghiên cứu Làm rõ chất phương pháp Bayes suy luận thống kê Trên sở đó, khoảng ước lượng chọn làm đối tượng để đánh giá ý nghĩa kết mà phương pháp Bayes mang lại Phƣơng pháp nghiên cứu - Phân tích tổng hợp lý thuyết - Phân loại hệ thống hóa lý thuyết Bố cục luận văn Ngoài phần mở đầu, kết luận, danh mục tài liệu tham khảo, phụ lục, danh mục bảng, nội dung luận văn gồm chương: Chương Cơ sở lý thuyết, trình bày điểm quan điểm, sở toán học để xây dựng ước lượng khoảng tin cậy theo hai phương pháp: tần suất Bayes Chương Khoảng tin cậy Bayes Sử dụng phương pháp tần suất để tìm khoảng tin cậy cho 𝑓, lời giải không cho kết cuối với dạng biểu diễn giải tích chung mà phải dùng nhiều bảng giá trị cho phân bố nhị thức tương ứng Số lần thành công đặc trưng biến ngẫu nhiên Bernoulli 𝑋𝑖 = ⇒𝑇 𝑋 = 𝑛 𝑛 𝑖=1 𝑋𝑖 với xác suất 𝑓 , 𝑖 = 1, … , 𝑛 với xác suất − 𝑓 tổng số lần thành công 𝑛 lần thử Dễ thấy 𝑇 𝑋 thống kê đủ cho 𝑓, ước lượng UMVU cho 𝑓 Theo giả thiết, có 𝑟 thành cơng 𝑛 phép thử, tức 𝑛 𝑖=1 𝑋𝑖 = 𝑟, suy giá trị ước lượng cho 𝑓 𝑇 𝑋 = khoảng tin cậy 100 − 𝑃 % cho 𝑓 𝑓1 , 𝑓2 thỏa mãn 𝑓𝑖 = 𝑘𝑖 𝑛 𝑟 𝑛 = 𝑓 Khi 𝑖 = 1,2 , với 𝑘2 𝑓𝑘 − 𝑓 3.20 𝑛−𝑘 ≤1−𝑃 𝑘=𝑘 Trong 𝑘1 , 𝑘2 chọn cho biểu thức bên trái gần với − 𝑃 Công việc thực nhờ bảng số tương ứng cho phân phối Bernoulli Khi 𝑛 đủ lớn, ta xấp xỉ phân bố mẫu 𝑓 phân bố chuẩn với trung bình 𝑓 phương sai 𝑓 1−𝑓 𝑛 Khi ta nhận khoảng tin cậy 95% cho 𝑓 hai trường hợp cụ thể Bảng 3.1 3.6.3 Lời giải theo phương pháp Bayes Với Bayes, toán Xác suất để 𝑟 thành công xảy 𝑛 phép thử 𝑝 𝑥 𝑓 = 𝑓𝑟 − 𝑓 𝑛−𝑟 Sử dụng tiên nghiệm cho 𝑓 (khả xảy thành công thất bại nhau), phân bố hậu nghiệm tỉ lệ với 𝑓 𝑟 − 𝑓 𝑛−𝑟 (đây dạng phân phối beta), với giá trị trung bình 𝐸𝑓 = 𝑓 = 𝑟+1 𝑛+2 phương sai 𝐷𝑓 = 𝑓 1−𝑓 𝑛 +3 Như 𝑓 không gần 1, ước lượng tốt cho 𝑓 𝑓 ± 𝜎 Nếu 𝑟 ≫ (𝑛 − 𝑟) ≫ 5, phân bố hậu nghiệm 𝑓 xấp xỉ phân bố chuẩn 𝑁 𝑓, 𝜎 Khi khoảng chứa 100𝑃% xác suất hậu nghiệm cho 𝑓 𝑓 ± 𝑞𝜎 , 𝑞 (1 + 𝑃)/2-percentile phân bố chuẩn; ví dụ với mức 90, 95 99% giá trị tương ứng 𝑞 = 1.645, 1.960, 2.576 Ta tiến hành so sánh khoảng tin cậy tần suất khoảng tin cậy Bayes mức 90% tương ứng với 𝑞 = 1.645 Ta có bảng sau: 𝑟 = 10, 𝑛 = 20 𝑟 = 13, 𝑛 = 26 Tần suất 0.316,0.684 0.339,0.661 Bayes 0.328,0.671 0.347,0.652 Bảng So sánh khoảng tin cậy 95% cho tham số f theo hai phƣơng pháp tần suất Bayes Tổng quát hơn, ta kết luận: khoảng tin cậy Bayes nằm khoảng tin cậy tần suất với mức ý nghĩa cho trước Tuy nhiên với toán sử dụng bảng tra để tìm kết xấp xỉ, sai số bảng thường lớn sai khác hai kết nên tính ưu việt khoảng tin cậy Bayes khơng thể rõ Bài tốn sau minh chứng cụ thể cho so sánh này, đồng thời cho thấy với cách làm Bayes, tất tính tốn biểu diễn giải tích tường minh đơn giản 3.7 Bài toán ƣớc lƣợng tham số vị trí 𝜽 phân phối Cauchy 3.7.1 Phát biểu tốn Ta phải tìm khoảng ước lượng 90% cho tham số vị trí 𝜃 phân phối Cauchy Giả sử mẫu 𝑥1 , 𝑥2 lấy từ phân phối Cauchy, tức 3.21 𝑝 𝑥𝜃 = 1 𝜋 1+ 𝑥−𝜃 3.7.2 Lời giải theo phương pháp tần suất a Sử dụng thống kê trung bình mẫu làm ước lượng Phân bố Cauchy có dạng đối xứng, tiện lợi ta dùng ước lượng 3.22 𝜃 ∗ 𝑥1 , 𝑥2 = 𝑥 + 𝑥2 cho tham số 𝜃, với phân bố thống kê 𝑝 𝑑𝜃 ∗ 𝜃 giống phân bố Cauchy ban đầu (đây đặc điểm bật luật Cauchy) Tuy nhiên hạn chế chọn thống kê mẫu để ước lượng cho 𝜃, 𝑥1 , 𝑥2 𝜃 ∗ có phân bố giống nhau, chúng cho kết ước lượng điểm khoảng tin cậy (với độ dài) Đặt trường hợp riêng biệt, ta có 𝑥1 = 𝑥2 = 5, không hợp lý chọn 𝑥1 hay 𝑥2 làm thống kê ước lượng cho 𝜃 Để khách quan, toán ta chọn 𝜃 ∗ để nghiên cứu Như ta có 𝑝 𝜃∗ 𝜃 = 1 𝜋 + 𝜃∗ − 𝜃 Suy 3.23 𝑃 𝜃∗ < 𝜃′ 𝜃 = 1 + arctan 𝜃 ′ − 𝜃 𝜋 Vì phân bố đối xứng, nên khoảng tin cậy 100 − 𝑃 % ngắn cho 𝜃 khoảng đối xứng 𝜃 − 𝑞, 𝜃 + 𝑞 3.24 , với 𝑞 tìm sau 𝑃 = 𝑃 𝜃 ∗ < 𝜃 + 𝑞|𝜃 − 𝑃 𝜃 ∗ < 𝜃 − 𝑞 𝜃 = 3.25 𝜋𝑃 = arctan 𝑞 ⇒ 𝑞 = tan 𝜋 arctan 𝑞 − arctan −𝑞 , suy 𝜋𝑃 Vậy khoảng tin cậy 90% ngắn cho 𝜃 tương ứng với 𝑞 = tan 81° = 6.31 gọi khoảng CI 90% b Thêm thống kê “nửa khoảng” Vấn đề đặt liệu thống kê 𝜃 ∗ sử dụng hết thông tin từ mẫu chưa? Ta thử thêm thống kê “nửa khoảng” 3.26 𝑦= 𝑥 − 𝑥2 có cho ta thêm thơng tin có ý nghĩa hay khơng, với phân bố cho 𝑦 Cauchy với giá trị median Như ta quan tâm đến biến 𝜃 ∗ , 𝑦 Tiến hành đổi biến từ phân bố 𝑝 𝑥1 , 𝑥2 𝜃 = 𝑝 𝑥1 𝜃 𝑝 𝑥2 𝜃 Dễ thấy Jacobian phép đổi biến 2, từ phân bố đồng thời 3.27 𝑝 𝜃∗, 𝑦 𝜃 = 𝜋2 + 𝜃∗ − 𝜃 + 𝑦 + 𝜃∗ − 𝜃 − 𝑦 𝑥1 , 𝑥2 độc lập 𝜃 ∗ , 𝑦 khơng Do đó, phân bố tích lũy 𝜃 ∗ với điều kiện 𝜃 𝑦 3.28 𝑃 𝜃 ∗ < 𝜃 ′ 𝜃, 𝑦 = 1 + arctan 𝜃 ′ − 𝜃 + 𝑦 + arctan 𝜃 ′ − 𝜃 − 𝑦 2𝜋 1 + 𝜃′ − 𝜃 + 𝑦 + ln 4𝜋𝑦 + 𝜃′ − 𝜃 − 𝑦 2 Với phân bố tích lũy này, khoảng tin cậy độ dài 2𝑞 với 3.24 khẳng định mức 𝑃 = arctan 𝑞 mà 𝜋 3.29 𝑤 𝑦, 𝑞 = arctan 𝑞 + 𝑦 + arctan 𝑞 − 𝑦 𝜋 Ta có bảng kết sau 𝑦 𝑤 𝑦, 6.31 𝐹 𝑦 0.998 1.000 0.991 0.296 + 1+ 𝑞+𝑦 ln 2𝜋𝑦 1+ 𝑞−𝑦 2 0.952 0.156 0.702 0.105 0.227 0.079 10 0.111 0.064 12 0.069 0.053 14 0.047 0.046 > 14 4𝑞 𝜋 + 𝑦2 𝜋𝑦 Bảng Mức tin cậy "khoảng tin cậy 90%" tƣơng ứng với giá trị khác thống kê y cho ta số liệu thực mức tin cậy 𝑤 𝑦, 6.31 dựa khoảng tin cậy 90%, với nhiều giá 𝜋 𝑦 trị khác 𝑦, cột thứ tỉ lệ toàn mẫu 𝐹 𝑦 = arctan cho giá trị 𝑥1 − 𝑥2 lớn 𝑦 c Nhận xét kết hai cách xử lý Qua kết trên, ta thấy giá trị 𝑥1 − 𝑥2 thực đóng góp lượng thơng tin đáng kể kết luận khoảng tin cậy cho tham số Khi lặp lại số lượng lớn lần lấy mẫu ngẫu nhiên, khoảng CI 90% cho kết luận 90% trường hợp, nhiên lại không hợp lý trường hợp riêng lẻ - Trong trường hợp khoảng giá trị mẫu nhỏ (ví dụ 𝑦 = 0,2, hay 4), khoảng CI 90% rộng, ta chọn khoảng hẹp mà đưa kết luận với 90% trường hợp - Trong trường hợp khoảng giá trị mẫu lớn (ví dụ 𝑦 = 12, 14 hay lớn 14), khoảng CI 90% lại cho kết luận với chưa đến 10% trường hợp Những khuyết điểm khoảng CI 90% khắc phục cách sử dụng phân bố có điều kiện 3.28 , sau dựa vào 3.29 để chọn khoảng tin cậy khác cho khoảng ngắn lớp mẫu cho kết 90% trường hợp Gọi khoảng tìm UR 90% Bây ta so sánh kết tính từ khoảng UR 90% với khoảng CI 90% phương pháp thực nghiệm Tiến hành chạy 100 mẫu 𝑥1𝑖 , 𝑥2𝑖 100 𝑖=1 từ phân bố Cauchy có tham số vị trí 𝜃 = 4, tham số tỉ lệ Sau với mẫu, tính giá trị 𝑞1𝑖 khoảng UR, so sánh với 𝑞2 khoảng CI Ta nhận kết sau - 90% khoảng UR chứa giá trị tham số vị trí 𝜃; - 88% trường hợp khoảng UR ngắn khoảng CI 𝑞1𝑖 < 𝑞2 ; - 17% trường hợp với khoảng giá trị nhỏ cho khoảng UR ngắn 4.5 lần so với CI 4.5𝑞1𝑖 < 𝑞2 ; - 54% trường hợp khoảng UR ngắn lần so với CI 3𝑞1𝑖 < 𝑞2 ; - 14% mẫu với khoảng giá trị rộng nhất, khoảng CI chứa giá trị 𝜃 90% Như vậy, số mẫu “tồi” (có khoảng giá trị rộng), khơng thể đưa ước lượng xác cho 𝜃, khoảng tin cậy 3.24 (với độ rộng không đổi) không truyền tải 90% độ chắn Để bù đắp cho điều giữ cho khả thành cơng trung bình cho mẫu 90%, khoảng tin cậy buộc phải đưa kết trường hợp mẫu “tốt” với độ rộng lớn mức cần thiết Điều đối lập với khoảng UR, phần lớn trường hợp cho ta khoảng ngắn nhiều 3.7.3 Lời giải theo phương pháp Bayes Hàm hợp lý cho mẫu 𝑥1 , 𝑥2 𝑝 𝑥1 , 𝑥2 𝜃 = 𝜋 + 𝜃 − 𝑥1 + 𝜃 − 𝑥2 Chọn tiên nghiệm cho 𝜃, ta nhận phân bố hậu nghiệm 3.30 + 𝑥1 − 𝑥2 2 = 𝜋 + 𝜃 − 𝑥1 + 𝜃 − 𝑥2 𝑝 𝜃 𝑥1 , 𝑥2 + 𝑦2 = 𝜋 + 𝜃 − 𝑥1 + 𝜃 − 𝑥2 2 Để tìm khoảng tin cậy Bayes 90% ngắn cho 𝜃, ta tìm phân phối tích lũy 𝑃 𝜃 < 𝜃 ′ 𝑥1 , 𝑥2 3.31 = 1 + arctan 𝜃 ′ − 𝑥1 + arctan 𝜃 ′ − 𝑥2 2𝜋 + 1 + 𝜃 ′ − 𝑥2 ln 4𝜋𝑦 + 𝜃 ′ − 𝑥1 2 Nhận thấy phân phối tích lũy 3.28 , tức khoảng UR 90% khoảng tin cậy Bayes 90% ngắn nhất! Tuy nhiên việc tiếp cận đến phân phối nhanh tự nhiên nhiều so với cách giải theo phương pháp tần suất: thống kê 𝑦= 𝑥1 − 𝑥2 xuất trình tìm phân bố hậu nghiệm cho 𝜃 3.8 Tổng quát trƣờng hợp khoảng tin cậy khoảng tin cậy Bayes cho kết giống phân phối có tham số vị trí Phần ta xét phân phối có tham số vị trí, mà phân phối Cauchy ví dụ lớp phân phối Xét phân bố mẫu 3.32 𝑝 𝑥1 , 𝑥2 , … , 𝑥𝑛 𝜃 = 𝑓 𝑥1 , … , 𝑥𝑛 𝜃 𝜃 tham số vị trí, tức 3.33 𝑓 𝑥1 + 𝑎, … , 𝑥𝑛 + 𝑎 𝜃 + 𝑎 = 𝑓 𝑥1 , … , 𝑥𝑛 𝜃 , −∞ < 𝑎 < ∞ Thực phép đổi biến từ 𝑥1 , … , 𝑥𝑛 sang 𝑦1 , … , 𝑦𝑛 : 3.34 3.35 𝑦1 = 𝑥 = 𝑛 𝑦𝑖 = 𝑥𝑖 − 𝑥1 , 𝑛 𝑖=1 𝑥𝑖 𝑖 = 2,3, … , 𝑛 Từ 3.33 , 3.34 , 3.35 ta có phân bố mẫu 𝑦1 , … , 𝑦𝑛 có dạng 3.36 𝑝 𝑦1 , … , 𝑦𝑛 𝜃 = 𝑔 𝑦1 − 𝜃; 𝑦2 , … , 𝑦𝑛 Nếu 𝑦1 thống kê đủ, khoảng tin cậy dựa phân bố 𝑝 𝑦1 , … , 𝑦𝑛 𝜃 cho kết giống khoảng 3.24 Để có khoảng UR, ta phải sử dụng phân bố với điều kiện thống kê phụ 𝑦2 , … , 𝑦𝑛 , tức 3.37 𝑝 𝑦1 𝑦2 , … , 𝑦𝑛 ; 𝜃 = 𝐾 𝑔 𝑦1 − 𝜃, 𝑦2 , … , 𝑦𝑛 𝐾 số chuẩn hóa Tuy nhiên, ta có phân bố hậu nghiệm Bayes cho tham số 𝜃 dựa tiên nghiệm đều, hoàn toàn giống 3.37 : 3.38 𝑝 𝜃 𝑥1 , … , 𝑥𝑛 = 𝑝 𝜃 𝑦1 , … , 𝑦𝑛 = 𝐾 𝑔 𝑦1 − 𝜃, 𝑦2 , … , 𝑦𝑛 Như vậy, việc hiệu chỉnh tiêu chuẩn đánh giá phương pháp tần suất, khoảng tin cậy “tốt nhất” cho tham số vị trí 𝜃 hồn tồn giống khoảng tin cậy Bayes hậu nghiệm (dựa tiên nghiệm đều) với mức tin cậy Đối với tham số tỉ lệ 𝜎, sử dụng phép đổi biến: 𝛾 = ln 𝜎 , 𝑥𝑖 = ln 𝑞𝑖 𝑖 = 1, 𝑛 , ta nhận khoảng tin cậy khoảng tin cậy Bayes (dựa tiên nghiệm Jeffreys 𝑝 𝜎 = 1/𝜎) KẾT LUẬN Luận văn làm nội dung sau: Xây dựng khoảng tin cậy Bayes (đối xứng HPD) trường hợp phân bố hậu nghiệm tham số có biểu diễn giải tích cụ thể Khẳng định tồn cách tìm cơng thức tính khoảng tin cậy Bayes, kèm ví dụ áp dụng Xây dựng khoảng tin cậy Bayes (đối xứng HPD) trường hợp phân bố hậu nghiệm tham số khơng có biểu diễn giải tích cụ thể Sử dụng phương pháp Monte Carlo xích Markov để tìm ước lượng cho khoảng đối xứng HPD, kèm tốn mơ minh họa So sánh kết khoảng tin cậy khoảng tin cậy bayes dựa toán cụ thể, trường hợp thống kê tần suất gặp khó khăn (khi khơng có thống kê đủ để ước lượng cho tham số, cách xử lý tham số nhiễu trường hợp tổng quát), nhiên thống kê Bayes đưa cách làm đơn giản đưa kết tốt hơn; đồng thời nêu khoảng tin cậy Bayes nằm khoảng tin cậy tần suất Cuối chương, luận văn đề cập đến kết tổng quát cho trường hợp khoảng tin cậy khoảng tin cậy Bayes cho kết giống phân phối có tham số vị trí tham số tỉ lệ Tuy nhiên, trình độ thời gian hạn chế nên luận văn khơng thể tránh khỏi thiếu sót Vì vậy, mong nhận góp ý từ Thầy Cơ bạn đọc để luận văn hồn chỉnh TÀI LIỆU THAM KHẢO Tiếng Việt Đào Hữu Hồ (2015), Lý thuyết ước lượng, NXB Đại học Quốc gia Hà Nội Nguyễn Văn Hữu, Đào Hữu Hồ, Hồng Hữu Như (2004), Thống kê tốn học, NXB Đại học Quốc gia Hà Nội Đặng Hùng Thắng (2010), Mở đầu lý thuyết xác suất ứng dụng, NXB Giáo dục Việt Nam, Vĩnh Phúc Đặng Hùng Thắng (2009), Thống kê ứng dụng, NXB Giáo dục, Thái Nguyên Đặng Hùng Thắng (2012), Xác suất nâng cao, NXB Đại học Quốc gia Hà Nội Tiếng Anh Allan – Birnbaum (2011), “The Neyman – Pearson Theory as Decision Theory, and as Inference theory, with a criticism of the Lindly – Savage Argument for Bayesian Theory”, Springer Andrew Gelman, John B Carlin, Hal S Stern, Donald B Rubin (2009), “Bayesian Data analysis”, Second Edition, Taylor & Francis e-Library Box George E.P & Tiao George C (1992), “Bayesian Inference in Statistical Inference”, Willy – Interscience Publication Christian P Robert, George Casella (2010), “Introducing Monte Carlo Methods with R”, Springer Science + Business Media 10 Christian P Robert, George Casella (2004), Monte Carlo Statistical Methods, Springer – Verlag 11 Christian P Robert (2007), “The Bayesian Choice from Decisoin – Theoretic Foundations to Computational Implementation”, Second Editon, Springer Science + Business media, USA 12 Hyndman R J (1996), “Computing and Graphing Highest Density Regions”, The American Statistician, Vol 50, 791 – 800 13 Jake Vander Plas (2014), “Frequentism and Bayesianism: a Python – driven Primer”, Science Institute, University of Washington 14 Jaynes E.T (1976), “Confidence intervals and Bayesian intervals”, Foundation of Probability theory, Statistical Inference, and Statistical Theories of Science, Vol II, 175 – 257 15 John A Rice (2007), “Mathematical Statistics and Data ananlysis”, Third Edition, Thomson Brooks/Scole 16 Julian Besag (2001), “Markov chain Monte Carlo for Statistical Inference”, University of Washington, USA 17 Justin L Tobias (?), “Bayesian Interval Estimation”, Econ 690, Purdue University 18 Kandethody M Ramachandran, Chris P Tsokos (2009), “Mathematical Statistics with Applications”, Elsevier inc 19 Matthew S Johson (2009), “Introduction to Bayesian Statistics with WinBUGS, Part II – Bayesian inference, MCMC algorithm and Diagnosing Convergence”, Columbia University, New York, USA 20 Michael I Jordan (2010), “Jeffreys Priors and Reference Priors”, Bayesian Modeling and Inference, Lecture 21 Ming – Hui Chen & Qi – Man Shao (1998), “Monte Carlo Estimation of Bayesian Credible and HPD Interval”, Jounal of Computational and Graphical Statistics, 69 – 92 22 Ming – Hui Chen, Qi – Man Shao, Joseph G Ibrahim (2000), “Monte Carlo Methods in Bayesian Computation”, Springer Science + Business Media New York 23 Peter D Hoff (2009), “A First Course in Bayesian Statistical Methods”, Springer Science + Business media, USA 24 Tanner M A (1996), “Tools for Statistical Inference”, Third edition, Springer, New York 25 William M Bostald (2007), “Introduction to Bayesian Statistics, Second Edition”, John Willey & Sons, Inc Publication Phụ lục A Các phân phối xác suất thƣờng gặp A.1 Phân phối nhị thức 𝑩 𝒏, 𝒑 0≤𝑝≤1 𝑝 𝑥 𝑝 = 𝐶𝑛𝑥 𝑝 𝑥 − 𝑝 𝑛−𝑥 , 𝑥 = 0,1,2, … , 𝑛 𝐸𝑋 = 𝑛𝑝, 𝐷𝑋 = 𝑛𝑝 − 𝑝 Khi 𝑛 = 1, ta có 𝐵 1, 𝑝 phép thử Bernoulli A.2 Phân phối Poisson 𝐏𝐨𝐢𝐬 𝜆 𝜆>0 𝑝 𝑥𝜆 = 𝜆𝑥 𝑒 −𝜆 , 𝑥 = 0,1,2, … 𝑥! 𝐸𝑋 = 𝜆, 𝐷𝑋 = 𝜆 A.3 Phân phối 𝑼 𝒂, 𝒃 𝑥 ∈ 𝑎, 𝑏 𝑝 𝑥|𝑎, 𝑏 = 𝑏 − 𝑎 𝑥 ∉ 𝑎, 𝑏 𝐸𝑋 = 𝑎+𝑏 𝑏−𝑎 , 𝐷𝑋 = 12 A.4 Phân phối mũ 𝑬 𝜇, 𝜆 𝑝 𝑥; 𝜇, 𝜆 = 𝜆𝑒 −𝜆 𝑥−𝜇 𝑥 ≥ 𝜇 𝑥 < 𝜇 𝜆 > tham số tỉ lệ, 𝜇 tham số vị trí 1 𝜆 𝜆2 𝐸𝑋 = , 𝐷𝑋 = Hàm phân phối tích lũy tương ứng: 𝑃 𝑥, 𝜆 = A.5 Phân phối chuẩn 𝑵𝒑 𝜽, 𝚺 − 𝑒 −𝜆 𝑥−𝜇 𝑥 ≥ 𝜇 𝑥 < 𝜇 𝜃, 𝔁 ∈ ℝ𝑝 Σ ma trận xác định dương đối xứng cấp 𝑝 × 𝑝 , 𝑝 𝔁|𝜇, 𝜎 = 𝑝 2𝜋 det Σ 𝔼𝜃 ,Σ 𝔁 = 𝜽, 𝔼𝜃 ,Σ 𝔁 − 𝜃 𝔁 − 𝜃 exp − 𝑡 𝔁 − 𝜃 𝑡 Σ−1 𝔁 − 𝜃 = Σ A.6 phân phối gamma 𝓖 𝜶, 𝜷 𝛼, 𝛽 > 0, 𝑝 𝑥 𝛼, 𝛽 = 𝛽𝛼 𝛼−1 −𝛽𝑥 𝑥 𝑒 , Γ 𝛼 𝑥>0 𝔼𝛼,𝛽 𝑋 = 𝛼/𝛽, 𝔻𝛼,𝛽 𝑋 = 𝛼/𝛽2 Các trường hợp đặc biệt phân phối gamma là: phân phối mũ 𝒢 1, 𝛽 , phân phối khi-bình phương 𝒢 𝜈 (thường ký hiệu 𝜒𝜈2 ) , 2 A.7 Phân phối beta 𝓑 𝜶, 𝜷 𝛼, 𝛽 > 0, 𝑝 𝑥 𝛼, 𝛽 = với 𝐵 𝛼, 𝛽 = Γ 𝛼 Γ 𝛽 Γ 𝛼 +𝛽 𝔼𝛼,𝛽 𝑋 = 𝑥 𝛼 −1 − 𝑥 𝐵 𝛼, 𝛽 𝛽 −1 , 0≤𝑥≤1 𝛼 𝛼+𝛽 , 𝔻𝛼,𝛽 𝑋 = 𝛼𝛽 𝛼 +𝛽 𝛼 +𝛽 +1 A.8 Phân phối student 𝓣𝒑 𝝂, 𝜽, 𝚺 𝜈 > 0, 𝜃, 𝔁 ∈ ℝ𝑝 Σ ma trận xác định dương đối xứng cấp 𝑝 × 𝑝 , 𝑝 𝑥|𝜈, 𝜃, Σ = Γ 𝑝 𝜈𝜋 det Σ Γ 𝜈+𝑝 𝜈 𝔁 − 𝜃 𝑡 Σ −1 𝔁 − 𝜃 1+ 𝜈 𝔼𝜃 ,Σ 𝔁 = 𝜃 𝜈 > 𝔼𝜃 ,Σ 𝔁 − 𝜃 𝔁 − 𝜃 𝑡 = 𝜈Σ ν−2 𝜈>2 − 𝜈 +𝑝 Với 𝑝 = 1, ta nhận phân phối Cauchy 𝒞 𝜃, 𝜎 (tương ứng với bậc tự 𝜈 = 1), ví dụ quan trọng phân bố không tồn kỳ vọng phương sai A.7 Phân phối bình phƣơng 𝝌𝟐 𝒏 𝑝 𝑥|𝑛 = Γ 𝑛 𝑛 2 𝑛 𝑥 𝑥 −1 𝑒 −2 , 𝑥>0 𝐸𝑋 = 𝑛, 𝐷𝑋 = 2𝑛 Nếu 𝑋𝑖 ~𝑁 0,1 , 𝑖 = 1, 𝑛 𝑛 𝑖=1 𝑋𝑖 Nếu 𝑋𝑖 ~𝑁 𝜇, 𝜎 , 𝑖 = 1, 𝑛; 𝑋 = 𝑛 ~𝜒 𝑛 𝑛 𝑖=1 𝑋𝑖 𝑋 𝑖 −𝑋 𝑛 𝑖=1 𝜎 ~𝜒 𝑛 − A.8 Phân phối Fisher-Snedecor 𝓕 𝒏, 𝒎 𝑝 𝑥|𝑚, 𝑛 = 𝐸𝑋 = 𝑚 𝑚 −2 , 𝐷𝑋 = 𝑛+𝑚 Γ Γ 𝑛 𝑚 𝑛 Γ 2𝑚 𝑛+𝑚 −2 𝑛 𝑚 −2 𝑚 −4 𝑚 𝑛 𝑛 𝑥 −1 1+ 𝑛 𝑚 𝑥 𝑛 +𝑚 , 𝑥>0 𝑚>4 Khi 𝑚, 𝑛 → ∞ phân bố Fisher 𝐹 𝑛, 𝑚 xấp xỉ phân phối chuẩn 𝑁 1,0 Nếu 𝑋~𝜒 𝑛 , 𝑌~𝜒 𝑚 𝐹 = 𝑚𝑋 𝑛𝑌 ~𝐹 𝑛, 𝑚 ... nghĩa, ta tìm nhiều khoảng tin cậy Bayes Luận văn xin đề cập đến hai loại chính: khoảng tin cậy Bayes đối xứng khoảng tin cậy Bayes chứa mật độ hậu nghiệm cao (khoảng HPD) a Khoảng tin cậy Bayes. .. hợp khoảng tin cậy khoảng tin cậy Bayes cho kết số giống - Đánh giá độ phức tạp hai cách tiếp cận toán ước lượng khoảng - Nêu tính chất “đẹp”: khoảng tin cậy Bayes hẹp so với khoảng tin cậy, ... dựng ước lượng khoảng tin cậy theo hai phương pháp: tần suất Bayes Chương Khoảng tin cậy Bayes - Đi sâu vào cách xây dựng hai khoảng tin cậy Bayes thường dùng: khoảng đối xứng khoảng chứa xác