So sánh giữa thống kê cổ điển và thống kê bayes dùng phân phối nhị thức và phân phối chuẩn

TRƯỜNG ĐẠI HỌC AN GIANG KHOA SƯ PHẠM KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC SO SÁNH GIỮA THỐNG KÊ CỔ ĐIỂN VÀ THỐNG KÊ BAYES DÙNG PHÂN PHỐI NHỊ THỨC VÀ PHÂN PHỐI CHUẨN NGUYỄN KIM CHUNG AN GIANG, 03 - 2020 TRƯỜNG ĐẠI HỌC AN GIANG KHOA SƯ PHẠM KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC SO SÁNH GIỮA THỐNG KÊ CỔ ĐIỂN VÀ THỐNG KÊ BAYES DÙNG PHÂN PHỐI NHỊ THỨC VÀ PHÂN PHỐI CHUẨN NGUYỄN KIM CHUNG DTO160673 GIẢNG VIÊN HƯỚNG DẪN: PHẠM THỊ THU HƯỜNG AN GIANG, 03 - 2020 Khóa luận ”So sánh thống kê cổ điển thống kê Bayes dùng phân phối Nhị thức phân phối chuẩn” sinh viên Nguyễn Kim Chung thực hướng dẫn TS Phạm Thị Thu Hường Tác giả báo cáo kết nghiên cứu Hội đồng khoa học Đào tạo thông qua ngày / / Thư ký Phản biện Phản biện Cán hướng dẫn Chủ tịch hội đồng LỜI CẢM ƠN Trong trình nghiên cứu thực khóa luận, tơi cố gắng nỗ lực Để hồn thành tốt khóa luận này, nhận động viên, giúp đỡ tận tình q thầy, cơ, gia đình bạn bè Nhân xin gửi lời cảm ơn chân thành Tơi xin bày tỏ lịng biết ơn chân thành đến thầy cô thuộc môn Tốn hướng dẫn giảng dạy tơi suốt năm trường, chân thành cảm ơn Cô Phạm Thị Thu Hường - người trực tiếp hướng dẫn, giúp đỡ kiến thức, tài liệu phương pháp để tơi hồn thành nghiên cứu Do trình độ có hạn lần nghiên cứu khoa học khơng tránh khỏi có thiếu sót định Tơi mơng nhận ý kiến đóng góp dẫn Thầy, Cơ giáo Tơi xin cảm ơn kính chúc q Thầy, Cơ dồi sức khỏe, đạt nhiều thành công công tác giáo dục! Long Xuyên, ngày 29 tháng 03 năm 2020 Người thực Nguyễn Kim Chung i TÓM TẮT Thống kê Bayes gần phát triển với hỗ trợ khoa học máy tính Có khác cách phát triển cách tạo nên lý thuyết cho tham số thống kê cổ điển thống kê Bayes Thống kê cổ điển xem tham số ước lượng số Trong đó, thống kê Bayes xem tham số ước lượng biến ngẫu nhiên Và có nhiều điểm khác cỡ mẫu, cách sử dụng thông tin tiên nghiệm tham số cần quan tâm Mục đích tài liệu cho thấy khác hai cách phân tích thống kê, áp dụng thống kê cổ điển thống kê Bayes vào phân phối Nhị thức phân phối chuẩn thấy thống kê Bayes mở rộng thống kê cổ điển mơ hình cụ thể Tài liệu tổ chức thành chương Chương trình bày số kiến thức vài phân phối phổ biến thống kê Chương trình bày lí thuyết việc ước lượng tham số theo thống kê cổ điển Chương trình bày lí thuyết việc ước lượng tham số theo thống kê Bayes Phần kết luận trình bày chương ii LỜI CAM KẾT Tôi xin cam đoan cơng trình nghiên cứu riêng tơi Các nội dung số liệu cơng trình nghiên cứu trích dẫn rõ ràng Những kết luận khoa học cơng trình nghiên cứu chưa cơng bố cơng trình khác Long Xun, ngày 29 tháng 03 năm 2020 Người thực Nguyễn Kim Chung iii Mục lục Kiến thức chuẩn bị 1.1 Phân phối nhị thức 1.1.1 Quá trình Bernoulli 1.1.2 Định nghĩa phân phối nhị thức 1.1.3 Kì vọng, phương sai cho biến ngẫu nhiên có phân phối Nhị thức 1.2 Phân phối chuẩn 1.2.1 Định nghĩa phân phối chuẩn: 1.2.2 Kì vọng, phương sai cho biến ngẫu nhiên có phân phối chuẩn 1.3 Phân phối Beta 1.3.1 Định nghĩa phân phối Beta 1.3.2 Kì vọng phương sai cho biến ngẫu nhiên có phân phối Beta 1.4 Định lí giá trị trung tâm ƯỚC LƯỢNG THAM SỐ THEO THỐNG KÊ PHỐI NHỊ THỨC VÀ PHÂN PHỐI CHUẨN 2.1 Ước lượng điểm 2.1.1 Ước lượng điểm cho trung bình tổng thể 2.1.2 Ước lượng điểm cho tỉ lệ tổng thể 2.2 Ước lượng khoảng 2.2.1 Ước lượng khoảng cho trung bình tổng thể 2.2.2 Ước lượng khoảng cho tỉ lệ tổng thể CỔ ĐIỂN CHO PHÂN ƯỚC LƯỢNG THAM SỐ THEO THỐNG KÊ BAYES 3.1 Ước lượng tham số cho phân phối Nhị thức 3.1.1 Mơ hình 3.1.2 Thiết lập phân phối tiên nghiệm 3.1.2.1 Phân phối tiên nghiệm rời rạc không thông tin 3.1.2.2 Phân phối tiên nghiệm có thơng tin iv 2 3 4 7 10 12 12 12 13 13 13 15 17 17 17 18 18 20 3.1.2.3 3.2 Phân phối tiên nghiệm liên tục không thông tin Ước lượng tham số trung bình tổng thể 3.2.1 Cỡ mẫu n = 3.2.1.1 Phân phối tiên nghiệm liên hiệp 3.2.1.2 Phân phối tiên nghiệm khơng có thơng tin 3.2.2 Cỡ mẫu n > 3.2.2.1 Phân phối tiên nghiệm liên hiệp 3.2.2.2 Phân phối tiên nghiệm khơng có thơng tin KẾT LUẬN 4.1 So sánh thống kê cổ điển thống 4.1.1 Việc phân tích số liệu thống kê 4.1.2 Yêu cầu cỡ mẫu 4.1.3 Cách lập luận 4.2 Kết luận v kê Bayes tin có thơng 22 25 26 26 27 28 29 30 33 33 33 34 34 34 Danh sách hình vẽ 3.1 3.2 3.3 3.4 3.5 3.6 3.7 Biểu đồ tần suất hàm likelihood phân phối hậu nghiệm phân phối tiên nghiệm rời rạc khơng có thơng tin Biểu đồ tần suất hàm likelihood phân phối hậu nghiệm phân phối tiên nghiệm rời rạc có thơng tin Biểu đồ tần suất hàm likehood phân phối hậu nghiệm phân phối tiên nghiệm liên tục khơng có thơng tin Biểu đồ tần suất hàm likelihood phân phối hậu nghiệm phân phối tiên nghiệm liên tục có thơng tin với phương sai lớn Biểu đồ tần suất hàm likelihood phân phối hậu nghiệm phân phối tiên nghiệm liên tục có thơng tin với phương sai lớn Phân phối hậu nghiệm cho µ khơng có thơng tin tiên nghiệm Phân phối tiên nghiệm có thơng tin, hàm likelihood phân hối hậu nghiệm cho trung bình µ vi 19 21 23 24 25 31 31 Danh sách bảng 3.1 3.2 Hàm likelihood phân phối hậu nghiệm trường hợp sử dụng phân phối tiên nghiệm rời rạc khơng có thơng tin Hàm likelihood phân phối hậu nghiệm trường hợp sử dụng phân phối tiên nghiệm rời rạc có thơng tin vii 19 21 Hình 3.3: Biểu đồ tần suất hàm likehood phân phối hậu nghiệm phân phối tiên nghiệm liên tục khơng có thông tin Phân phối tiên nghiệm không thông tin, hàm likelihood phân phối hậu nghiệm thể hình 3.3 Chúng ta thấy rằng, phân phối tiên nghiệm phân phối phẳng khơng có ảnh hưởng đến phân phối hậu nghiệm Phân phối hậu nghiệm hoàn toàn phụ thuộc vào hàm likehood Ở đây, khoảng tin cậy 95% cho p (0.540, 0.773), ước lượng 40 ≈ 0.645 điểm cho p E(p|Y = 39) = 40+22 Trong thực tế, thường có số kiến thức phân phối tiên nghiệm, giả sử trường hợp biết phân phối tiên nghiệm có kì vọng 0.75 Chúng ta chọn a b cho kì vọng phân phối tiên nghiệm 0.75 với phương sai lớn để mẫu liệu ảnh hưởng mạnh đến phân phối hậu nghiệm a = 0.75 nên suy b = 1/3 Phân phối tiên nghiệm Có thể chọn a = 1, a+b phẳng (0, 1) Dựa công thức (3.1.2), có: 61 P r(p|Y = y = 39) ∝ P r(Y = 39|p)P r(p) ∝ p39 (1 − p)21 p1−1 (1 − p) −1 = p39 (1 − p) Suy θ|y ∼ Beta(40, 64/3) 23 Hình 3.4: Biểu đồ tần suất hàm likelihood phân phối hậu nghiệm phân phối tiên nghiệm liên tục có thơng tin với phương sai lớn Phân phối hậu nghiệm thể với hàm likelihood phân phối tiên nghiệm hình 3.4 Phân phối hậu nghiệm dựa hàm likelihood Điều phân phối tiên nghiệm phẳng không ảnh hưởng đến phân phối hậu nghiệm nhân với hàm likelihood Khoảng tin cậy 95% cho p (0.53, 0.765) , ước 40 ≈ 0.652 lượng điểm cho p E(p|Y = 39) = 40+64/3 Chúng ta chọn phân phối tiên nghiệm thông tin với phương sai nhỏ, a = 0.75 với a b lớn Cho a = 90, suy b = 30 Phân phối sát nghĩa thỏa a+b với kì vọng 0.75 Điều thể có nhiều hiểu biết phân phối tiên nghiệm tỉ lệ ném thành công gần với 0.75 Dựa công thức 3.2, có: P r(p|Y = y = 39) ∝ P r(Y = 39|p)P r(p) ∝ p39 (1 − p)21 p89 (1 − p)29 = p128 (1 − p)50 Suy θ|y ∼ Beta(129, 51) 24 Hình 3.5: Biểu đồ tần suất hàm likelihood phân phối hậu nghiệm phân phối tiên nghiệm liên tục có thơng tin với phương sai lớn Phân phối tiên nghiệm, hàm likehood phân phối hậu nghiệm vẽ hình 3.5 Chúng ta thấy phân phối hậu nghiệm bị ảnh hưởng hàm likelihood phân phối tiên nghiệm Khoảng tin cậy 95% cho p (0.649, 0.780), rõ ràng xác dùng phân phối tiên nghiệm Uniform Ướ lượng điểm cho p lúc 40 ≈ 0.717 E(p|Y = 39) = 40+22 Chúng ta thấy phân phối hậu nghiệm trải (phương sai nhỏ hơn) hàm likelihood phân phối tiên nghiệm Nói cách khác, có thơng tin phân phối tiên nghiệm, sử dụng để tăng độ xác việc cho ước lượng tham số chưa biết Ngoài ra, sử dụng phân phối tiên nghiệm khơng liên hiệp vài trường hợp Đó khơng thuận tiện khơng thể sử dụng phân phối tiên nghiêm liên hiệp, thơng tin tiên nghiệm từ nghiên cứu trước hay từ chuyên gia dạng giống với hàm likelihood 3.2 Ước lượng tham số trung bình tổng thể Giả sử biến ngẫu nhiên Y có phân phối chuẩn với trung bình µ phương sai σ , nghĩa 25 Y ∼ N (µ, σ ) Chúng ta muốn nghiên cứu trung bình tổng thể µ biến ngẫu nhiên Y Trong phân tích Bayes, tham số chưa biết µ xét biến ngẫu nhiên có phân phối Trong mục trình bày theo cách phân tích Bayes để tìm phân phối cho tham số chưa biết µ hai trường hợp cỡ mẫu n = cỡ mẫu n > 3.2.1 Cỡ mẫu n = Sử dụng quy tắc Bayes, phân phối trung bình tổng thể cho liệu biểu diễn sau: P r(µ|Y = y) = P r(Y = y|µ)P r(µ) ∝ P r(Y = y|µ)P r(µ), P r(Y = y) (3.2.1) bỏ qua mẫu số độc lập với tham số µ Trong trường hợp này, hàm likelihood là: −1/2 P r(Y = y|µ) = (2πσ ) (y − µ)2 (y − µ)2 exp − ∝ exp − , 2σ 2σ hàm mật độ phân phối chuẩn Để tính phân phối hậu nghiệm cần thiết lập phân phối tiên nghiệm Trong mục giới thiệu phân phối tiên nghiệm liên hiệp phân phối tiên nghiệm khơng có thơng tin 3.2.1.1 Phân phối tiên nghiệm liên hiệp Sử dụng phân phối tiên nghiệm liên hiệp nghĩa dùng phân phối tiên nghiệm có dạng giống với hàm likelihood Cụ thể trường hợp hàm likelihood có phân phối chuẩn, nên phân phối tiên nghiệm sử dụng có dạng phân phối chuẩn Phân phối tiên nghiệm hàm likelihood có dạng sau: P r(µ) ∝ (σ02 )−1/2 exp − (µ − µ0 ) (Phân phối tiên nghiệm), 2σ0 −1/2 P r(Y = y|µ) ∝ (σ ) exp − (µ − y) (hàm likelihood) 2σ Khi đó, từ cơng thức (3.2.1) ta có phân phối hậu nghiệm sau: 26 P r(µ|Y = y) ∝ P r(Y = y|µ)P r(µ) ∝ exp − y µ20 y µ0 − 2µ + 2+ µ + + σ σ02 σ σ02 σ0 σ Đặt a= y µ0 µ20 y ; b = + + + ; c = σ σ02 σ2 σ2 σ02 σ Ta được: p(y|µ, σ ) ∝ exp − (µ a − 2µb + c) " 2 # a b ∝ exp − (bỏ qua số hạng khơng chứa µ) µ− a Khi kì vọng phương sai phân phối hậu nghiệm là: E(µ|Y = y) = b y/σ + µ0 /σ02 = = µ1, a 1/σ + 1/σ02 V ar(µ|Y = y) = 1 = = σ1 a 1/σ + 1/σ02 Do đó, phân phối hậu nghiệm cho trung bình có dạng: µ|Y = y ∼ N y/σ + µ0 /σ02 , 2 1/σ + 1/σ0 1/σ + 1/σ02 Như vậy, tìm khoảng tin cậy cho trung bình tổng thể µ từ phân y/σ +µ0 /σ02 phối hậu nghiệm Ước lượng điểm cho µlà E(µ|Y = y) = 1/σ2 +1/σ 3.2.1.2 Phân phối tiên nghiệm khơng có thơng tin Đơi khơng có thơng tin µ trước thu thập mẫu liệu Một cách để phản ánh thơng tin phân phối tiên nghiệm đặt σ02 → ∞.Khi phân phối tiên nghiệm có phương sai vơ hạn có tổng tích phân khơng Khi σ02 → ∞, ta có: µ1 = E(µ|Y = y) = y/σ + µ0 /σ02 y/σ → = y, 1/σ + 1/σ02 1/σ 27 σ12 = V ar(µ|y) = 1/σ → σ2 + 1/σ0 Khi đó, −1/2 P r(µ|Y = y) → (σ ) exp − (µ − y)2 2σ (đây hàm likelihood) Nói cách khác, sử dụng phân phối tiên nghiệm khơng có thơng tin phân phối hậu nghiệm dựa vào hàm likehood 3.2.2 Cỡ mẫu n > Giả sử có mẫu với cỡ n, lấy độc lập từ phân phối N (µ, σ ) Hàm likelihood lúc là: P r(Y |µ) = n Y P r(Y = yt |µ) t=1 n X = (2πσ ) exp(− (yt − µ)2 ) 2σ t=1 ! n X ∝ exp − (yt − µ)2 2σ t=1 P Khai triển tổng bình phương nt=1 (yt − µ)2 , ta được: −n/2 n X t=1 2 (yt −µ) = nµ −2µ n X t=1 (3.2.2) Pn n n n X X X 2 2 2 t=1 yt yt + yt = nµ −n.2µ + yt +ny −ny = n(µ−y) + yt2 −ny n t=1 t=1 t=1 Do đó, từ cơng thức (3.2.2), hàm likelihood có dạng sau: X 2 yt − ny P r(Y |µ) ∝ exp − n(µ − y) exp − 2σ 2σ ∝ exp − n(µ − y) 2σ Số hạng thứ hai số nên bỏ qua Hàm likelihood tương đương với hàm mật độ phân phối chuẩn, với trung bình y phương sai σn 28 3.2.2.1 Phân phối tiên nghiệm liên hiệp Do hàm likelihood có dạng phân phối chuẩn, nên sử dụng phân phối tiên nghiệm liên hiệp nghĩa chọn phân phối tiên nghiệm có dạng phân phối chuẩn Phân phối tiên nghiệm hàm likelihood có dạng sau: P r(µ) ∝ (σ02 )−1/2 exp 2 − n(µ − µ0 ) (phân phối tiên nghiệm), 2σ0 −1/2 P (Y |µ, σ ) ∝ (σ /n) exp − n(µ − y)2 2σ (hàm likelihood) Khi phân phối hậu nghiệm có dạng sau: P (µ|Y ) ∝ P r(Y |µ)P r(µ) 1 2 ∝ exp − n(µ − µ0 ) − n(µ − y) 2σ0 2σ y + y¯2 ) n (µ − 2µµ0 + µ20 ) n (µ2 − 2µ¯ + = exp − σ02 σ2 n n n¯ y nµ0 nµ20 ny 2 = exp − µ + − 2µ + + + σ σ02 σ2 σ0 σ0 σ Đặt a= n n¯ y nµ0 nµ20 ny n + ; b = + ; c = + σ σ02 σ2 σ02 σ02 σ Khi phân phối hậu nghiệm trở thành: P r(Y |µ) ∝ exp µ a − 2µb + c " 2 # b a ∝ exp − µ− a Ta có kì vọng phương sai phân phối hậu nghiệm sau: E(µ|y) = n¯ y /σ + µ0 /σ02 = µ1 , n/σ + 1/σ02 V ar(µ|Y ) = n/σ = σ12 + 1/σ02 Vậy phân phối hậu nghiệm cho trung bình là: 29 µ|Y ∼ N ny/σ + µ0 /σ02 , 2 n/σ + 1/σ0 n/σ + 1/σ02 (3.2.3) Bây giờ, tìm khoảng tin cậy cho µ từ phân phối hậu nghiệm ny/σ +µ0 /σ02 Ước lượng điểm cho µ lúc E(µ|Y ) = n/σ2 +1/σ 3.2.2.2 Phân phối tiên nghiệm khơng có thơng tin Để phản ánh khơng có thơng tin phân phối tiên nghiệm, ta đặt σ02 → ∞ Khi phân phối tiên nghiệm có phương sai vơ hạn có tổng tích phân khơng Khi σ02 → ∞ ta có kì vọng phương sai phân phối hậu nghiệm sau: E(µ|Y ) = ny/σ + µ0 /σ02 ny/σ → = y¯, n/σ + 1/σ02 n/σ V ar(µ|Y ) = σ2 → n/σ + 1/σ02 n Do phối hậu nghiệm có dạng sau: −1/2 P r(µ|Y ) → (σ /n) exp − (µ − y¯) 2σ Hay µ|Y ∼ N (¯ y, σ2 ) n (3.2.4) Nói cách khác, sử dụng phân phối tiên nghiệm khơng có thơng tin phân phối hậu nghiệm dựa hàm likehood Ví dụ: Một nhà máy sản xuất ống nước thiết lập quy trình sản xuất với phương sai σ = 1mm sản xuất ống nước có đường kính phân phối chuẩn Một mẫu 30 ống nước thu thập ngẫu nhiên ngày sản xuất, với trung bình mẫu đường kính ống nước 34.2mm Chúng ta muốn ước lượng trung bình tổng thể µ đường kính ống nước Giả sử khơng có thơng tin tiên nghiệm trung bình, sử dụng cơng thức (3.2.4) có phân phối hậu nghiệm sau: µ|Y ∼ N y = 34.2, σ = 30 30 Hình 3.6: Phân phối hậu nghiệm cho µ khơng có thơng tin tiên nghiệm Phân phối hậu nghiệm cho µ khơng có thơng tin tiên nghiệm vẽ hình 3.6 Khoảng tin cậy 95% cho µ (33.842, 34.558), ước lượng điểm cho µ 34.2 Xét tốn với số thay đổi nhỏ Giả sử công nhân trước nhà máy thu thập liệu ngày xây dựng biểu đồ tần suất, sau làm mịn biểu đồ nhận thấy hình dáng phân phối tiên nghiệm xấp xỉ tốt phân phối chuẩn N(µ0 = 34.9, σ02 = 0.01) Khi sử dụng cơng thức (3.2.3) để có trung bình phương sai phân phối hậu nghiệm cho đường kính trung bình tổng thể sau: µ|Y ∼ N (µ1 = 34.74, σ12 = 0.0077) Hình 3.7: Phân phối tiên nghiệm có thơng tin, hàm likelihood phân hối hậu nghiệm cho trung bình µ 31 Phân phối tiên nghiệm có thơng tin, hàm likelihood phân hối hậu nghiệm cho trung bình µ vẽ hình 3.7 Ta thấy rằng, phân phối hậu nghiệm hẹp (phương sai nhỏ hơn) hàm likelihood phân phối tiên nghiệm Có điều kết hợp hai nguồn thơng tin có ước lượng chắn cho trung bình Khoảng tin cậy 95% cho µ lúc (34.57, 34.91), ước lượng điểm cho µ 34.74 32 Chương KẾT LUẬN Chương trình bày nội dung so sánh thống kê cổ điển thống kê Bayes, cụ thể so sánh việc phân tích số liệu thống kê, cỡ mẫu cách lập luận hai loại thống kê Ngoài ra, chương tổng kết đề trình bày kết thu tồn khóa luận 4.1 4.1.1 So sánh thống kê cổ điển thống kê Bayes Việc phân tích số liệu thống kê Để dùng thống kê Bayes phân tích mơ hình thống kê cần xác định số thông tin sau: - Dữ liệu quan sát - Hàm likelihood p(y|θ) với tham số θ - Phân phối tiên nghiệm p(θ) Khi có thông tin xác định hàm mật độ phân phối hậu nghiệm, từ có kết luận, kết phân tích cho tham số cần tìm Để dùng thống kê cổ điển phân tích mơ hình thống kê cần xác định số thông tin sau: - Dữ liệu quan sát y - Hàm likehood p(y|θ) Trong phân tích cổ điển, phương pháp tập trung vào liệu tay bỏ qua chứng cớ từ nghiên cứu thông tin tiên nghiệm Nếu biết thông tin tiên nghiệm liệu, thơng tin hữu ích để tăng độ xác tham số chưa biết 33 4.1.2 Yêu cầu cỡ mẫu Trong phân tích cổ điển, kết dựa định lí giới hạn trung tâm Vậy nên, giả thuyết cần thiết cho việc sử dụng mô hình cổ điển cỡ mẫu phải đủ lớn Trong phân tích Bayes, giả sử khơng cần thiết việc tạo nên lập luận cho tham số chưa biết, cỡ mẫu thực 4.1.3 Cách lập luận Sự khác biệt thú vị rõ ràng hai cách phân tích là, phân tích Bayes, tham số chưa biết xem biến ngẫu nhiên Vậy nên chúng có phân phối Trong quan điểm frequentist, tham số chưa biết xem số, không thay đổi qua phép thử lặp lại Với suy nghĩ tiếp cận khác nhau, phân tích cổ điển cho ước lượng tham số trong thống kê Bayes, vẽ phân phối tham số 4.2 Kết luận Khóa luận trình bày vấn đề sau: - Chương I: Trình bày số kiến thức sở, cụ thể khái niệm, kì vọng, phương sai, phân phối nhị thức, phân phối chuẩn phân phối Beta - Chương II: Trình bày ước lượng tham số chưa biết theo thống kê cổ điển, cụ thể trình bày ước lượng điểm ước lượng khoảng cho tỉ lệ tổng thể trung bình tổng thể phân phối nhị thức phân phối chuẩn - Chương III: Trình bày ước lượng tham số chưa biết theo thống kê Bayes, cụ thể trình bày ước lượng điểm ước lượng khoảng cho tỉ lệ tổng thể trung bình tổng thể phân phối nhị thức phân phối chuẩn Ngồi ra, khóa luận thu số kết sau: - Thực so sánh thống kê Bayes thống kê cổ điển, cho thấy điểm khác cách phân tích hai loại thống kê, cụ thể điểm khác cỡ mẫu, cách sử dụng thông tin tiên nghiệm tham số cần quan tâm - Thực viết code dùng cho việc vẽ hình tính khoảng tin cậy Hướng mở rộng nghiên cứu tiếp: Nghiên cứu cách phân tích liệu theo thống kê Bayes phân phối khác, tham số khác Ngồi nghiên cứu kiểm định giả thuyết thống kê Bayes 34 TÀI LIỆU THAM KHẢO Andrew Gelman, John B Carlin, Hal S Stern and Donald B Rubin (2013) Bayes Data Analysis Chapman and Hall Diệp Hồng Ân (2016) Giáo trình xác suất thống kê A Đại học An Giang Đào Hữu Hồ (2007) Xác suất thống kê Nhà xuất đại học quốc gia Hà Nội Đinh Văn Gắng (1999) Lý thuyết Xác suất Thống kê NXB Giáo dục Việt Nam Jon Wakefield (2013) Bayes and Frequentist Regression Methods Departments of Statistics and Biostatistics University of Washington Seattle, Washington USA Karl-Rudolf Koch (2007) Introduction to Bayes Statistics University of Bonn Institute of Theoretical Geodesy Nguyễn Duy Tiến Vũ Viết Yên (2006) Lý thuyết xác suất Nhà xuất giáo dục Sheldon Ross (1998) First Course in Probability University of California, Berkeley 35 PHỤ LỤC A Công thức xác suất điều kiện quy tắc Bayes Xác suất điều kiện: Trong không gian mẫu Ω, cho biến cố B có P r(B) > biến cố A Xác suất A với điều kiện B, kí hiệu P r(A|B), khả xảy biến cố A biến cố B xảy Xác suất tính tỉ số: P r(A | B) = P r(A ∩ B) P r(B) Quy tắc Bayes P r(A | B) = P r(B | A)P r(A) P r(B | A)P r(A) P r(B | A)P r(A) =P =R P r(B) P r(B | Ai )P r(Ai ) P r(B | A)P r(A)dA i B Bỏ qua mẫu số quy tắc Bayes Tại mẫu số bỏ qua sử dụng quy tắc Bayes cho phân phối xác suất? Theo quy tắc Bayes, ta có: P r(θ|Y ) = P r(Y |θ)P r(θ) P r(Y, θ) (∗) =R P r(Y ) P r(Y, θ)dθ Ta kiểm tra P r(θ|Y ) hàm mật độ xác suất, thật vậy: Z Z P r(θ|Y )dθ = P r(Y, θ) R P r(Y, θ)dθ R P r(Y, θ)dθ dθ = R = P r(Y, θ)dθ Do số (khơng liên quan đếnθ) ta có khơng quan tâm đến, chúng R gọp lại thành số C để đảm bảo cho P r(θ|Y )dθ = Như cơng thức (∗) viết lại thành: P r(θ|Y ) = CP r(Y |θ)P r(θ) ∝ P r(Y |θ)P r(θ) C Các code dùng khóa luận: - Code dùng cho vẽ hình 3.3: curve(dbeta(x,1,1),col = "blue", xlab = "prior", ylab = "Probability", xlim=c(0,1), ylim=c(0,15)), curve(dbeta(x,40,22),col = "blue", xlab = "likelihood", ylab = "Probability", xlim=c(0,1), ylim=c(0,15)), 36 curve(dbeta(x,40,22),col = "blue", xlab = "posterior", ylab = "Probability", xlim=c(0,1), ylim=c(0,15)) - Code dùng cho vẽ hình 3.4: curve(dbeta(x,1,1/3),col = "blue", xlab = "prior", ylab = "Probability", xlim=c(0,1), ylim=c(0,15)), curve(dbeta(x,40,22),col = "blue", xlab = "likelihood", ylab = "Probability", xlim=c(0,1), ylim=c(0,15)), curve(dbeta(x,40,64/3),col = "blue", xlab = "posterior", ylab = "Probability", xlim=c(0,1), ylim=c(0,15)) - Code dùng cho vẽ hình 3.5: curve(dbeta(x,90,30),col = "blue", xlab = "prior", ylab = "Probability", xlim=c(0,1), ylim=c(0,15)), curve(dbeta(x,40,22),col = "blue", xlab = "likelihood", ylab = "Probability", xlim=c(0,1), ylim=c(0,15)), curve(dbeta(x,129,51),col = "blue", xlab = "posterior", ylab = "Probability", xlim=c(0,1), ylim=c(0,15)) - Code dùng cho vẽ hình 3.6: curve(dnorm(x, 34.2,sqrt( 1/30)),col = "blue", xlab = "posterior", ylab = "Probability", xlim=c(32,36), ylim=c(0,2.5)) - Code dùng cho vẽ hình 3.7: curve(dnorm(x, 34.9, 0.1),col = "blue", xlab = "prior", ylab = "Probability", xlim=c(32,36), ylim=c(0,4)), curve(dnorm(x, 34.2,sqrt( 1/30)),col = "blue", xlab = "likelihood", ylab = "Probability", xlim=c(32,36), ylim=c(0,2.5)), curve(dnorm(x, 34.74, sqrt(0.0077)),col = "blue", xlab = "posterior", ylab = "Probability", xlim=c(32,36), ylim=c(0,6)) - Code dùng để tính khoảng tin cậy dùng cho phân phối Beta: q_lower

Định dạng
Số trang	47
Dung lượng	499,85 KB