Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 52 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
52
Dung lượng
438,13 KB
Nội dung
TRƯỜNG ĐẠI HỌC AN GIANG KHOA SƯ PHẠM KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC TÌM HIỂU MỘT SỐ PHÂN PHỐI XÁC SUẤT VÀ ÁP DỤNG ĐỂ CHỌN PHÂN PHỐI TIÊN NGHIỆM TRONG THỐNG KÊ BAYES NGUYỄN THỊ NGỌC MAI AN GIANG, 05 - 2021 TRƯỜNG ĐẠI HỌC AN GIANG KHOA SƯ PHẠM KHĨA LUẬN TỐT NGHIỆP ĐẠI HỌC TÌM HIỂU MỘT SỐ PHÂN PHỐI XÁC SUẤT VÀ ÁP DỤNG ĐỂ CHỌN PHÂN PHỐI TIÊN NGHIỆM TRONG THỐNG KÊ BAYES NGUYỄN THỊ NGỌC MAI DTO170711 GIẢNG VIÊN HƯỚNG DẪN: PHẠM THỊ THU HƯỜNG AN GIANG, 05 - 2021 Khóa luận tốt nghiệp ”Tìm hiểu số phân phối xác suất áp dụng để chọn phân phối tiên nghiệm thống kê Bayes” sinh viên Nguyễn Thị Ngọc Mai thực hướng dẫn TS Phạm Thị Thu Hường Tác giả báo cáo kết nghiên cứu Hội đồng khoa học Đào tạo thông qua ngày ./ / Cán chấm Cán chấm TS PHAN VĂN LONG EM THS DIỆP HOÀNG ÂN GIẢNG VIÊN HƯỚNG DẪN TS PHẠM THỊ THU HƯỜNG i LỜI CẢM TẠ Trong trình nghiên cứu thực khóa luận, tơi cố gắng hồn thành Để hồn thành tốt khóa luận này, tơi nhận giúp đỡ tận tình quý thầy, cơ, gia đình bạn bè Nhân tơi xin gửi lời cảm ơn chân thành Tôi xin bày tỏ lòng biết ơn chân thành đến thầy thuộc mơn Tốn hướng dẫn giảng dạy tơi suốt q trình học tập trường, chân thành cảm ơn Cô Phạm Thị Thu Hường - người trực tiếp hướng dẫn, giúp đỡ kiến thức, tài liệu phương pháp để tơi hồn thành nghiên cứu Do trình độ có hạn lần nghiên cứu khoa học khơng tránh khỏi có thiếu sót định Tơi mong nhận ý kiến đóng góp dẫn Thầy, Cô giáo Tôi xin cảm ơn kính chúc q Thầy, Cơ dồi sức khỏe, đạt nhiều thành công công việc Long Xuyên, ngày 17 tháng 05 năm 2021 Người thực Nguyễn Thị Ngọc Mai ii LỜI CAM KẾT Tôi xin cam đoan cơng trình nghiên cứu riêng tơi Các nội dung số liệu cơng trình nghiên cứu trích dẫn rõ ràng Những kết luận khoa học cơng trình nghiên cứu chưa cơng bố cơng trình khác Long Xuyên, ngày 17 tháng 05 năm 2021 Người thực Nguyễn Thị Ngọc Mai iii MỤC LỤC CHƯƠNG MỞ ĐẦU 1.1 Lí chọn đề tài 1.2 Đối tượng phạm vị nghiên cứu 1.2.1 Đối tượng nghiên cứu 1.2.2 Phạm vi nghiên cứu 1.3 Mục tiêu nghiên cứu 1.4 Phương pháp nghiên cứu .1 1.5 Cấu trúc khóa luận CHƯƠNG BIẾN NGẪU NHIÊN .3 2.1 Biến ngẫu nhiên 2.1.1 Khái niệm biến ngẫu nhiên 2.1.2 Phân loại biến ngẫu nhiên 2.1.3 Hàm phân phối .4 2.1.4 Hàm mật độ xác suất 2.2 Các số đặc trưng biến ngẫu nhiên 2.2.1 Kỳ vọng 2.2.2 Phương sai 2.2.3 Độ lệch chuẩn .7 CHƯƠNG MỘT SỐ PHÂN PHỐI XÁC SUẤT 3.1 Phân phối nhị thức .8 3.1.1 Định nghĩa 3.1.2 Kỳ vọng, phương sai biến ngẫu nhiên có phân phối nhị thức 3.2 Phân phối chuẩn 10 3.2.1 Định nghĩa 10 iv 3.2.2 Kỳ vọng, phương sai biến ngẫu nhiên có phân phối chuẩn 12 3.2.3 Phân phối chuẩn tắc 14 3.3 Phân phối mũ 15 3.3.1 Định nghĩa 15 3.3.2 Kỳ vọng, phương sai biến ngẫu nhiên có phân phối mũ 15 3.4 Phân phối Gamma 17 3.4.1 Định nghĩa 17 3.4.2 Kỳ vọng, phương sai biến ngẫu nhiên có phân phối Gamma .19 3.5 Phân phối Beta 21 3.5.1 Định nghĩa 21 3.5.2 Kỳ vọng, phương sai biến ngẫu nhiên có phân phối Beta 21 3.6 Phân phối Chi bình phương 24 3.6.1 Định nghĩa 24 3.6.2 Kỳ vọng, phương sai biến ngẫu nhiên có phân phối Chi bình phương .25 3.7 Phân phối Student 26 3.7.1 Định nghĩa 26 3.7.2 Kỳ vọng, phương sai biến ngẫu nhiên có phân phối Student .27 CHƯƠNG THỐNG KÊ BAYES VÀ CÁCH TÌM PHÂN PHỐI TIÊN NGHIỆM 29 4.1 Thống kê Bayes 29 4.2 Cách tìm phân phối tiên nghiệm thống kê Bayes 30 4.2.1 Phân phối tiên nghiệm có thơng tin khơng có thơng tin .30 4.2.2 Phân phối tiên nghiệm có liên hợp khơng có liên hợp 31 4.3 Cách chọn phân phối tiên nghiệm cho ước lượng tỉ lệ, trung bình 32 4.3.1 Chọn phân phối tiên nghiệm cho ước lượng tỉ lệ tổng thể 32 4.3.2 Chọn phân phối tiên nghiệm cho ước lượng trung bình tổng thể 37 CHƯƠNG KẾT LUẬN 42 v 5.1 Một số phân phối xác suất thường gặp 42 5.2 Cách áp dụng số phân phối xác suất vào việc xác định phân phối tiên nghiệm 42 5.3 Kết luận 42 TÀI LIỆU THAM KHẢO .44 vi CHƯƠNG MỞ ĐẦU 1.1 Lí chọn đề tài Có nhiều luật phân phối khác như: phân phối nhị thức, phân phối chuẩn, phân phối Beta, dùng thống kê Mỗi loại phân phối thể áp dụng cho dạng số liệu cụ thể Và áp dụng phù hợp vào lĩnh vực khác thực tiễn Đối với thống kê Bayes, tham số cần ước lượng xem biến ngẫu nhiên phụ thuộc vào thông tin tiên nghiệm hàm likelihood Vì việc xác định phân phối tiên nghiệm dạng phân phối cho hàm likelihood quan trọng ước lượng Bayes để xác định phân phối cho hàm hậu nghiệm Chúng ta hồn tồn xác định phân phối tiên nghiệm qua số phân phối xác suất phổ biến Để tìm hiểu rõ hơn, cần tiến hành tìm hiểu số phân phối xác suất thường gặp áp dụng để chọn phân phối tiên nghiệm trường hợp ước lượng cụ thể Đó lí tơi chọn đề tài: ”Tìm hiểu số phân phối xác suất áp dụng để chọn phân phối tiên nghiệm thống kê Bayes” 1.2 Đối tượng phạm vị nghiên cứu 1.2.1 Đối tượng nghiên cứu Lý thuyết số phân phối xác suất cách chọn phân phối tiên nghiệm cho ước lượng tham số thống kê Bayes 1.2.2 Phạm vi nghiên cứu Nghiên cứu số phân phối xác suất ước lượng tham số thống kê Bayes Cụ thể ước lượng cho tỉ lệ tổng thể trung bình tổng thể thống kê Bayes 1.3 Mục tiêu nghiên cứu Mục tiêu đề tài trình bày số phân phối xác suất cách áp dụng việc xác định phân phối tiên nghiệm cho ước lượng tham số thống kê Bayes 1.4 Phương pháp nghiên cứu Đề tài sử dụng số phương pháp nghiên cứu bản: Phân tích, tổng hợp, hệ thống hóa, tham khảo tài liệu tham khảo ý kiến giáo viên hướng dẫn 1.5 Cấu trúc khóa luận Khóa luận bao gồm chương: Chương 1: Mở đầu Chương 2: Biến ngẫu nhiên Chương 3: Một số phân phối xác suất Chương 4: Thống kê Bayes cách tìm phân phối tiên nghiệm Chương 5: Kết luận hình thống kê, ta có phương trình hàm likelihood Do đó, để hình thành phân phối xác suất cho p (θ | y), cần phải xác định dạng phương trình hay phân phối xác suất p (θ) Trong phân tích Bayesian, tham số chưa biết xem biến ngẫu nhiên Vậy nên có phân phối tham số gọi phân phối hậu nghiệm p (θ | y) Trong quan điểm cổ điển, tham số chưa biết xem số, không thay đổi qua phép thử lặp lại Với suy nghĩ tiếp cận khác nhau, phân tích cổ điển giá trị xấp xỉ khoảng giá trị xấp xỉ cho tham số cần tìm trong thống kê Bayesian, vẽ phân phối tham số cần tìm Phân phối tiên nghiệm thể thông tin tiên nghiệm mà biết trước xem liệu Có nhiều cách để xây dựng phân phối tiên nghiệm làm cho cách phân tích Bayes tổng quát cách phân tích cổ điển Trong khóa luận giới thiệu số phân phối tiên nghiệm cách xác định dạng phương trình cho phân phối tiên nghiệm p (θ) 4.2 Cách tìm phân phối tiên nghiệm thống kê Bayes Trong khóa luận này, chúng tơi trình bày bốn loại phân phối tiên nghiệm: phân phối tiên nghiệm có thơng tin, phân phối tiên nghiệm khơng có thơng tin, phân phối tiên nghiệm liên hợp phân phối tiên nghiệm không liên hợp Trong đó, chúng tơi có so sánh cách chọn loại: phân phối tiên nghiệm có thơng tin khơng có thơng tin, phân phối tiên nghiệm liên hợp không liên hợp 4.2.1 Phân phối tiên nghiệm có thơng tin khơng có thơng tin - Phân phối tiên nghiệm có thơng tin Với phân phối tiên nghiệm có thơng tin, có thơng tin tham số mà quan tâm Điều có nghĩa là, có kinh nghiệm thân chuyên gia tham số thực nghiên cứu trước tham số Nên ta có thơng tin giá trị trung bình độ phân tán tham số cần tìm Trong trường hợp, phân phối tiên nghiệm có thơng tin, ta chọn phân phối tiêu chuẩn mà ta biết (như phân phối chương 3) để mơ tả cho phương trình phân phối tiên nghiệm p (θ) Các phân phối tiêu chuẩn có hình dạng gần với thơng tin có việc ước lượng sau dễ dàng xác Ở đây, tham số cho phân 30 phối tiêu chuẩn mà ta chọn lựa cho phân phối tiên nghiệm p (θ) dựa thơng tin mà ta có θ - Phân phối tiên nghiệm khơng có thơng tin Với phân phối tiên nghiệm khơng có thơng tin, khơng biết tham số mà ta quan tâm Điều có nghĩa là, khơng có kinh nghiệm, khơng có thơng tin nghiên cứu trước tham số Ở trường hợp này, thống kê Bayes có cách ước lượng tham số giống thống kê cổ điển Điều có nghĩa là, để ước lượng tham số θ dựa hàm likelihood Để chọn hàm số cho phân phối tiên nghiệm khơng có thơng tin, thơng thường chọn phân phối phẳng Cụ thể phân phối (Uniform distribution) miền xác định tham số θ, phân phối Beta (1,1), phân phối chuẩn, Cauchy với điều kiện phân phối chọn phải có phương sai lớn hai phân phối phải bao phủ miền xác định tham số θ có giá trị vơ lớn Hình 1: Các phân phối Beta(1,1), Beta(0.5,0.5) dùng cho phân phối tiên nghiệm khơng có thơng tin 4.2.2 Phân phối tiên nghiệm có liên hợp khơng có liên hợp - Phân phối tiên nghiệm có liên hợp Chúng ta biết được, để xác định dạng phân phối hậu nghiệm p (θ | y), cần phải xác định dạng phương trình hay phân phối xác suất p (θ) hàm likelihood p (y | θ) Cho nên, để xác định dạng hàm số cho phân phối hậu nghiệm p (θ | y) thường chọn phân phối tiên nghiệm cho p(θ) có dạng phân phối với hàm likelihood Điều dẫn đến kết thường xác định hàm phân phối hậu nghiệm Các phân phối có dạng tiêu chuẩn trình bày chương Khi xác định dạng phân phối cho phân phối hậu nghiệm, việc ước lượng tham số cần quan tâm 31 dễ dàng xác Với lí đó, phân phối tiên nghiệm có liên hiệp thường chọn thống kê Bayes - Phân phối tiên nghiệm khơng có liên hợp Với phân phối tiên nghiệm khơng có liên hợp, chọn phân phối cho p (θ) cách khơng cần quan tâm đến dạng hàm likelihood Như vậy, sau áp dụng công thức Bayes, có phương trình cho p (θ | y) Tuy nhiên, hàm số thường khơng có trùng với dạng tiêu chuẩn Do đó, để ước lượng cho tham số cần quan tâm, cần phải áp dụng thuật toán phức tạp Metropolis Hashtings, Gibb samples Trong khn khổ khóa luận này, chúng tơi khơng cho ví dụ phân phối tiên nghiệm khơng có liên hợp 4.3 Cách chọn phân phối tiên nghiệm cho ước lượng tỉ lệ, trung bình 4.3.1 Chọn phân phối tiên nghiệm cho ước lượng tỉ lệ tổng thể Trong thực tế, tỉ lệ p tổng thể thường có phân phối liên tục khoảng [0; 1] Quy tắc Bayes áp dụng cho tỉ lệ tổng thể liên tục sau P r (p | Y = y) = P r (Y = y | p) P r (p) ∝ P r (Y = y | p) P r (p) P r (Y = y) (3.1) Trong P r (Y = y | p) = Cny py (1 − p)n−y ∼ Beta (y + 1, n − y + 1) Ta sử dụng phân phối tiên nghiệm liên hợp Phân phối tiên nghiệm liên hợp phân phối có dạng giống với hàm likelihood Cụ thể trường hợp này, hàm likelihood có phân phối Beta, nên phân phối tiên nghiệm sử dụng có dạng phân phối Beta a) Nếu khơng có thơng tin p, tức phân phối tiên nghiệm khơng có thơng tin Khi cho giá trị p có xác suất Việc lựa chọn phân phối tiên nghiệm trường hợp p ∼ U nif orm [0, 1] P r (p) = chọn p ∼ Beta (1, 1) Khi 32 P r (Y = y | p) ∼ Beta (y + 1, n − y + 1) b) Trong thực tế, thường có số kiến thức phân phối tiên nghiệm Giả sử rằng, trường hợp biết phân phối tiên nghiệm có kỳ vọng p0 Chúng ta chọn a b cho kì vọng phân phối tiên nghiệm p0 với phương sai lớn để số liệu quan sát ảnh hưởng mạnh đến phân phối hậu nghiệm Trong trường hợp này, có thơng tin p (θ), thông tin chưa chi tiết cụ thể Có thể, chọn a = 1, a/(a + b) = p0 nên suy b = (1 − p0 ) /p0 Phân phối prior phẳng (0, 1) Dựa cơng thức 3.1, có P r (p | Y ) ∝ P r (Y = y | p) P r (p) ∝ py+1 (1 − p)n−y+1 p1−1 (1 − p)(1−p0 )/p0 = py+1 (1 − p)n−y+1+(1−p0 )/p0 c) Chúng ta chọn phân phối tiên nghiệm có thơng tin với phương sai nhỏ, nghĩa thỏa a/ (a + b) = p0 với a b lớn Điều thể có nhiều hiểu biết phân phối tiên nghiệm tỉ lệ gần thành cơng gần với p0 Ví dụ 4.1: Giả sử trường hợp cụ thể, có cở mẫu 60 (n = 60) liệu quan sát Y = y = 39, tỉ lệ thành công người chơi chuyên nghiệp giả sử p Chúng ta cần ước lượng tỉ lệ p với liệu quan sát - Với trường hợp phân phối tiên nghiệm khơng có thơng tin chọn có phân phối Khi đó, cơng thức (3.1) trở thành 21 P r(p | Y = y = 39) ∝ P r (Y = 39 | p) P r (p) ∝ p39 (1 − p) ∼ Beta (40, 22) 33 Hình 2: Phân phối tiên nghiệm khơng có thông tin, hàm likelihood phân phối hậu nghiệm - Với trường hợp phân phối tiên nghiệm có thơng tin với kì vọng 0.75 phương sai lớn, ta chọn p (θ) ∼ Beta 1, 13 Khi đó, cơng thức (3.1) trở thành P r (p | Y = y = 39) ∝ P r (Y = 39 | p) P r (p) ∝ p39 (1 − p)21 p1−1 (1 − p)1/3−1 = p39 (1 − p)61/3 Suy 64 θ | y ∼ Beta 40, 34 Hình 3: Phân phối tiên nghiệm có thơng tin với phương sai nhỏ, hàm likelihood phân phối hậu nghiệm - Với trường hợp phân phối tiên nghiệm có thơng tin với kì vọng 0.75 phương sai nhỏ, ta chọn p (θ) ∼ Beta (90, 30) Khi đó, cơng thức (3.1) trở thành P r (p | Y = y = 39) ∝ P r (Y = 39 | p) P r (p) ∝ p39 (1 − p)21 p89 (1 − p)29 = p128 (1 − p)50 Suy θ | y ∼ Beta (129, 51) 35 Hình 4: Phân phối tiên nghiệm có thơng tin với phương sai nhỏ, hàm likelihood phân phối hậu nghiệm Phân phối hậu nghiệm thể với hàm likelihood phân phối tiên nghiệm hình hình Phân phối hậu nghiệm dựa hàm likelihood Điều phân phối tiên nghiệm phẳng không ảnh hưởng đến phân phối hậu nghiệm nhân với hàm likelihood Khoảng tin cậy 95% cho p (0.53, 0.765) Phân phối tiên nghiệm, hàm likelihood phân phối hậu nghiệm vẽ hình Chúng ta thấy phân phối hậu nghiệm bị ảnh hưởng hàm likelihood phân phối tiên nghiệm Khoảng tin cậy 95% cho p (0.649, 0.780) , rõ ràng xác dùng phân phối tiên nghiệm Uniform Chúng ta thấy phân phối hậu nghiệm trải (phương sai nhỏ hơn) hàm likelihood phân phối tiên nghiệm Nói cách khác, có thơng tin phân phối tiên nghiệm, sử dụng để tăng độ xác cho việc ước lượng tham số chưa biết 36 4.3.2 Chọn phân phối tiên nghiệm cho ước lượng trung bình tổng thể Giả sử biến ngẫu nhiên Y có phân phối chuẩn với trung bình µ phương sai σ , nghĩa Y ∼ N µ, σ Chúng ta muốn nghiên cứu trung bình tổng thể µ biến ngẫu nhiên Y Trong phân tích Bayesian, tham số chưa biết µ xét biến ngẫu nhiên có phân phối xác suất Trong mục trình bày theo cách phân tích Bayesian để tìm phân phối cho tham số chưa biết µ với điều kiện biết phương sai σ Giả sử có mẫu với cỡ n, lấy độc lập từ phân phối N (µ, σ ) Hàm likelihood lúc n Y P r (Y = yt | µ) P r (Y | µ) = t=1 n X (yt − µ)2 = 2πσ exp − 2σ t=1 ! n X ∝ exp − (yt − µ) 2σ t=1 ! −n/2 Khai triển tổng bình phương n P (3.2) (yt − µ)2 , ta t=1 n X 2 (yt − µ) = nµ − 2µ t=1 n X yt + n P = nµ − n.2µ yt t=1 = n (µ − y)2 + yt2 t=1 t=1 n X n n X + ny + n X yt2 − ny t=1 yt2 − ny t=1 Do đó, từ cơng thức (3.2) , hàm likelihood có dạng sau " 1 P r (Y | µ) ∝ exp − n (µ − y)2 exp − 2σ 2σ ∝ exp − n µ − y 2σ 37 n X t=1 !# yt2 − ny Số hạng thứ hai số với tham số µ nên bỏ qua Hàm likelihood tương đương với hàm mật độ phân phối chuẩn, với trung bình y phương sai σ /n a) Phân phối tiên nghiệm có thơng tin liên hợp Do hàm likelihood có dạng phân phối chuẩn, nên sử dụng phân phối tiên nghiệm liên hợp nghĩa chọn phân phối tiên nghiệm có dạng phân phối chuẩn Ta chọn p (θ) ∼ N (µ0 , σ02 ) Phân phối tiên nghiệm hàm likelihood có dạng sau P r (µ) ∝ exp − (µ − µ0 )2 2σ0 −1/2 σ02 P r Y | µ, σ ∝ σ2 n −1/2 (phân phối tiên nghiệm) exp − n (µ − y)2 2σ (hàm likelihood) Khi phân phối hậu nghiệm có dạng sau P r (µ | Y ) ∝ P r (Y | µ) P r (µ) 1 2 ∝ exp − (µ − µ0 ) − n (µ − y) 2σ0 2σ (µ − 2µ.µ0 + µ20 ) n (µ2 − 2µy + y ) = exp − + σ02 σ2 n ny µ0 µ20 ny = exp − µ + − 2µ + + 2+ σ σ02 σ2 σ0 σ0 σ Ta đặt a= ny µ0 µ20 ny n + ; b = + ; c = + σ σ02 σ2 σ02 σ02 σ Phân phối hậu nghiệm trở thành P r (µ | Y ) ∝ exp µ2 a − 2µb + c " 2 # a b ∝ exp − µ− a Ta có kì vọng phương sai phân phối hậu nghiệm sau b ny/σ + µ0 /σ02 E (µ | y) = = = µ1 a n/σ + 1/σ02 38 V ar (µ | Y ) = 1 = = σ12 2 a n/σ + 1/σ0 Vậy phân phối hậu nghiệm cho trung bình P r (µ | Y ) ∼ N ny/σ + µ0 /σ02 , 2 n/σ + 1/σ0 n/σ + 1/σ02 (3.3) Chúng ta tìm khoảng tin cậy cho µ từ phân phối hậu nghiệm b) Phân phối tiên nghiệm khơng có thơng tin liên hợp Để phản ánh khơng có thơng tin phân phối tiên nghiệm, ta đặt σ02 → ∞ Khi phân phối tiên nghiệm có phương sai vơ hạn Khi đó, ước lượng cho giá trị trung bình tổng thể phụ thuộc hồn tồn vào hàm likelihood ước lượng có kết ước lượng giống với thống kê cổ điển Khi σ02 → ∞ ta có kì vọng phương sai phân phối hậu nghiệm sau E (µ | Y ) = n.y/σ + µ0 /σ02 ny/σ → = y n/σ + 1/σ02 n/σ V ar (µ | Y ) = σ2 → n/σ + 1/σ02 n Do phân phối hậu nghiệm có dạng sau P r (µ | Y ) → σ2 n −1/2 exp − n (µ − y) 2σ Hay P r (µ | Y ) ∼ N σ2 y, n (3.4) Nói cách khác, sử dụng phân phối tiên nghiệm thơng tin việc rút kết luận thống kê cho phân phối hậu nghiệm dựa hàm likelihood phân phối hàm phân phối hậu nghiệm trùng với phân phối hàm likelihood Ví dụ 4.2: Một nhà máy sản xuất ống nước thiết lập quy trình sản xuất với phương sai σ = 1mm sản xuất ống nước có đường kính phân phối chuẩn Một mẫu 30 ống nước 39 thu thập ngẫu nhiên ngày sản xuất, với trung bình mẫu đường kính ống nước 34.2mm Chúng ta muốn ước lượng trung bình tổng thể µ đường kính ống nước Giả sử khơng có thơng tin tiên nghiệm trung bình, sử dụng cơng thức (3.4) có phân phối hậu nghiệm sau P r (µ | Y ) ∼ N y = 34.2, σ = 30 Phân phối hậu nghiệm cho µ khơng có thơng tin tiên nghiệm vẽ hình Khoảng tin cậy 95% cho µ (34.704, 35.096) Hình 5: Hàm likelihood phân phối hậu nghiệm cho trường hợp phân phối tiên nghiệm liên hợp khơng có thơng tin Xét tốn với số thay đổi nhỏ Giả sử công nhân trước nhà máy thu nhập liệu ngày xây dựng biểu đồ tần suất, sau làm mịn biểu đồ nhận thấy hình dáng phân phối tiên nghiệm xấp xỉ tốt phân phối chuẩn N (µ0 = 34.9, σ02 = 0.01) Khi sử dụng cơng thức (3.4)ở để có trung bình phương sai phân phối hậu nghiệm cho đường kính trung bình tổng thể sau: P r (µ | Y ) ∼ N µ1 = 34.74, σ12 = 0.0077 Phân phối tiên nghiệm có thơng tin, hàm likelihood phân phối hậu nghiệm cho trung bình µ vẽ hình Ta thấy rằng, phân phối hậu nghiệm hẹp (phương sai nhỏ hơn) hàm likelihood phân phối tiên nghiệm Có điều chúng 40 ta kết hợp hai nguồn thông tin có ước lượng chắn cho trung bình Khoảng tin cậy 95% cho µ lúc (34.57, 34.91) Hình 6: Hàm phân phối tiên nghiệm liên hợp có thơng tin, hàm likelihood phân phối hậu nghiệm 41 CHƯƠNG KẾT LUẬN Trong chương này, tổng kết đề trình bày kết thu tồn khóa luận 5.1 Một số phân phối xác suất thường gặp Trong luận văn này, trình bày số phân phối xác suất thường sử dụng thống kê như: phân phối nhị thức, phân phối chuẩn, phân phối Beta, Rõ trình bày trình bày định nghĩa, kỳ vọng phương sai biến ngẫu nhiên phân phối xác suất Bên cạnh đó, phân phối chuẩn phân phối Beta hai phân phối áp dụng việc xác định phân phối tiên nghiệm cho ước lượng tham số thống kê Bayes 5.2 Cách áp dụng số phân phối xác suất vào việc xác định phân phối tiên nghiệm Sự khác biệt hai cách phân tích là, phân tích Bayesian, tham số chưa biết xem biến ngẫu nhiên Vậy nên chúng có phân phối Trong phân tích cổ điển, tham số chưa biết xem số, không thay đổi qua phép thử lặp lại Để dùng thống kê Bayesian phân tích mơ hình thống kê cần xác định số thông tin sau: Dữ liệu quan sát được, hàm likelihood p(y|θ) với tham số θ, phân phối tiên nghiệm p(θ) Khi có thơng tin xác định phân phối xác suất tham số cần tìm Vì việc xác định phân phối tiên nghiệm hàm likelihood quan trọng Trong luận văn này, chúng tơi trình bày cách xác định phân phối tiên nghiệm ước lượng cho tỉ lệ tổng thể trung bình tổng thể Cụ thể ước lượng cho tỉ lệ tổng thể, để tìm phân phối tiên nghiệm áp dụng phân phối Beta Còn ước lượng cho trung bình tổng thể, để tìm phân phối tiên nghiệm áp dụng phân phối chuẩn 5.3 Kết luận Khóa luận trình bày vấn đề sau: - Chương 2: Trình bày khái niệm biến ngẫu nhiên, hàm liên quan đến biến ngẫu nhiên số đặc trưng biến ngẫu nhiên 42 - Chương 3: Trình bày số phân phối xác suất thường gặp như: phân phối nhị thức, phân phối chuẩn, phân phối mũ, Cụ thể trình bày định nghĩa, kỳ vọng phương sai biến ngẫu nhiên phân phối xác suất - Chương 4: Giới thiệu thống kê Bayes trình bày cách ước lượng tham số theo thống kê Bayes Cụ thể ước lượng cho tỉ lệ tổng thể ước lượng trung bình tổng thể 43 TÀI LIỆU THAM KHẢO [1] Andrew Gelman, John B Carlin, Hal S Stern and Donald B Rubin (2013) Bayesian Data Analysis Chapman and Hall [2] Diệp Hoàng Ân (2016) Giáo trình xác suất thống kê A Đại học An Giang [3] Dương Phú Điền (2020) Giáo trình xác suất thống kê kinh tế Đại học An Giang [4] Robert V.Hogg, Elliot A Tanis, Dale L Zimmerman (2013) Probability And Statistical Inference New York [5] Sheldon Ross (2002) A First Course In Probability University of California, Berkeley 44