1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận văn tốt nghiệp một số suy luận bayes trong xác suất và thống kê

58 20 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 58
Dung lượng 498,23 KB

Nội dung

TRƯỜNG ĐẠI HỌC CẦN THƠ KHOA KHOA HỌC TỰ NHIÊN BỘ MƠN TỐN  LUẬN VĂN TỐT NGHIỆP ĐẠI HỌC MỘT SỐ SUY LUẬN BAYES TRONG XÁC SUẤT VÀ THỐNG KÊ GIÁO VIÊN HƯỚNG DẪN SINH VIÊN THỰC HIỆN Ths VÕ VĂN TÀI TRẦN THỊ HẢI NGUN BỘ MƠN TỐN – KHOA KHTN NGÀNH: TOÁN ỨNG DỤNG – K32 CẦN THƠ - 05/2010 LỜI CẢM ƠN - -Tôi xin bày tỏ lịng kính trọng biết ơn sâu sắc tới Thầy Võ Văn Tài, người hướng dẫn, giúp đỡ suốt thời gian làm luận văn Tôi xin chân thành cảm ơn quý Thầy Cô Khoa Khoa học tự nhiên, đặc biệt Bộ mơn tốn trang bị cho kiến thức bản, kỹ cần thiết để làm luận văn Xin cám ơn bạn giúp đỡ trình học tập tìm tài liệu để tơi hồn thành luận văn Xin bày tỏ lịng biết ơn đặc biệt đến Cha, Mẹ người thân dạy dỗ, động viên tạo điều kiện tốt cho tơi suốt q trình học tập Dù cố gắng với tận tâm Thầy hướng dẫn trình độ cịn hạn chế nên luận văn không tránh thiếu sót Rất mong nhận đóng góp ý kiến Thầy Cô bạn Tôi xin chân thành cảm ơn Cần Thơ, tháng 05 năm 2010 Sinh viên thực Trần Thị Hải Nguyên DANH MỤC CÁC BẢNG STT TÊN BẢNG NỘI DUNG TRANG Bảng 1.1 Bảng phân phối xác suất hậu nghiệm qua giai đoạn Bảng 1.2 Bảng phân phối xác suất X qua nhiều giai đoạn Bảng 1.3 Bảng phân phối xác suất hậu nghiệm µ qua giai đoạn Bảng 1.4 Bảng phân phối xác suất hậu nghiệm µ qua nhiều giai đoạn Bảng 4.1 Bảng 4.2 12 Các bước kiểm định tham số trung bình tỷ lệ phương pháp truyền thống 11 32 Các bước so sánh hai trung bình hai tỷ lệ phương pháp truyền thống 34 MỤC LỤC PHẦN MỞ ĐẦU 1 Giới thiệu Cấu trúc luận văn PHẦN NỘI DUNG Chương BẢNG PHÂN PHỐI XÁC SUẤT HẬU NGHIỆM 1.1 Một số phân phối xác suất rời rạc đặc biệt… 1.1.1 Phân phối Bernoulli 1.1.2 Phân phối nhị thức 1.1.3 Phân phối Poisson 1.2 Định lý Bayes cho biến rời rạc 1.2.1 Khái niệm 1.2.2 Định lý Bayes 1.3 Bảng phân phối xác suất hậu nghiệm 1.3.1 Bảng phân phối xác suất hậu nghiệm qua giai đoạn 1.3.2 Bảng phân phối xác suất hậu nghiệm X qua nhiều giai đoạn 1.4 Bảng phân phối xác suất hậu nghiệm tham số phân phối nhị thức 1.5 Bảng phân phối xác suất hậu nghiệm tham số trung bình 10 1.5.1 Mẫu quan sát qua đoạn 10 1.5.2 Mẫu quan sát qua nhiều giai đoạn 12 Chương HÀM MẬT ĐỘ XÁC SUẤT HẬU NGHIỆM 15 2.1 Một số phân phối xác suất liên tục đặc biệt 15 2.1.1 Phân phối chuẩn 15 2.1.2 Phân phối Gamma phân phối mũ 16 2.1.3 Phân phối Beta 17 2.2 Định lý Bayes cho biến liên tục 18 2.3 Hàm mật độ xác suất hậu nghiệm 19 2.3.1 Hàm mật độ xác suất hậu nghiệm có quan sát 19 2.3.2 Hàm mật độ xác suất hậu nghiệm có nhiều quan sát 19 2.3.3 Hàm mật độ xác suất hậu nghiệm cho tham số phân phối nhị thức 20 2.3.4 Hàm mật độ xác suất hậu nghiệm cho tham số phân phối chuẩn 23 Chương SUY LUẬN BAYES CHO ƯỚC LƯỢNG KHOẢNG THAM SỐ THỐNG KÊ 26 3.1 Ước lượng khoảng tham số trung bình tỷ lệ phương pháp truyền thống 26 3.1.1 Ước lượng trung bình 26 3.1.2 Ước lượng tỷ lệ 27 3.2 Ước lượng khoảng tham số trung bình 27 3.3 Ước lượng tham số tỷ lệ 29 3.3.1 Bài toán 29 3.3.2 Phương pháp tần số 29 Chương SUY LUẬN BAYES CHO KIỂM ĐỊNH THAM SỐ THỐNG KÊ BAYES 32 4.1 Kiểm định tham số trung bình tỷ lệ 32 4.1.1 Phương pháp truyền thống 32 4.1.2 Phương pháp P-giá trị 34 4.2 Suy luận Bayes kiểm định tham số trung bình 38 4.3 Suy luận Bayes so sánh khác hai trung bình … 40 4.3.1 Mẫu ngẫu nhiên độc lập đến từ hai phân phôi chuẩn 40 4.3.2 So sánh cặp 43 4.4 Suy luận Bayes kiểm định tham số tỷ lệ … 45 4.5 Suy luận Bayes so sánh khác hai tỷ lệ 48 KẾT LUẬN 51 TÀI LIỆU THAM KHẢO 52 LỜI CẢM ƠN - -Tơi xin bày tỏ lịng kính trọng biết ơn sâu sắc tới Thầy Võ Văn Tài, người hướng dẫn, giúp đỡ suốt thời gian làm luận văn Tôi xin chân thành cảm ơn quý Thầy Cô Khoa Khoa học tự nhiên, đặc biệt Bộ mơn tốn trang bị cho kiến thức bản, kỹ cần thiết để làm luận văn Xin cám ơn bạn giúp đỡ trình học tập tìm tài liệu để tơi hồn thành luận văn Xin bày tỏ lòng biết ơn đặc biệt đến Cha, Mẹ người thân dạy dỗ, động viên tạo điều kiện tốt cho tơi suốt q trình học tập Dù cố gắng với tận tâm Thầy hướn g dẫn trình độ cịn hạn chế nên luận văn không tránh thiếu sót Rất mong nhận đóng góp ý kiến Thầy Cô bạn Tôi xin chân thành cảm ơn Cần Thơ, tháng 05 năm 2010 Sinh viên thực Trần Thị Hải Nguyên PHẦN MỞ ĐẦU Giới thiệu Định lý Bayes định lý quan trọng xác suất có nhiều ứng dụng thực tế Ý tưởng định lý Bayes xác suất vi ệc tính xác suất hậu nghiệm biến cố dựa việc biết xác suất biến cố tiên nghiệm Chính điều làm cho định lý Bayes có tính ứng dụng cao, thực tế đa số biến cố chịu tác động biến cố khác Định lý Bayes biến ngẫu nhiên rời rạc mở rộng cho biến liên tục tảng cho thống kê Bayes Hiện người ta chia phương pháp thống kê thành hai loại: Thống kê tần số thống kê Bayes Thống kê tần số phương pháp thống kê phổ biến, dựa kết quan sát mẫu mà không cần để ý đến thông tin liên quan số liệu biết trước Thống kê Bayes dựa thông tin liệu biết trước vấn đề quan sát để suy luận cho thống kê Các nhà thống kê khơng cịn bàn cải tính ưu việt thống kê Bayes so với thống kê truyền thống Đặc biệt trước phát triển mạnh mẽ công nghệ thông tin, đặc biệt phần mềm tốn học, việc lưu trữ thơng tin thuận lợi thống kê Bayes có điều kiện phát triển Trong luận văn sử dụng định lý Bayes để xem xét vấn đề liên quan phổ biến xác suất thống kê Trong xác suất sử dụng định lý Bayes để thiết lập bảng phân phối xác suất hậu nghi ệm qua nhiều giai đoạn, xem xét cụ thể cho tham số phân phối nhị thức phân phối chuẩn Trong thống kê sử dụng định lý Bayes để giải toán ước lượng kiểm định tham số thống kê Đây phần tảng quan trọng thống kê Cấu trúc luận văn Luận văn trình bày gồm có phần mở đầu, phần nội dung tài liệu tham khảo Phần nội dung gồm chương: Chương 1: Bảng Phân phối xác suất hậu nghiệm Giới thiệu định lý Bayes cho biến rời rạc, từ ứng dụng để thiết lập bảng phân phối xác suất hậu nghiệm qua nhiều giai đoạn cho đại lượng ngẫu nhiên rời rạc Bảng phân phối xác suất hậu nghiệm xem xét cụ thể cho tham số tỷ lệ phân phối nhị thức tham số trung bình phân phối chuẩn Chương 2: Hàm mật độ xác suất hậu nghiệm Giới thiệu định lý Bayes cho biến liên tục, từ ứng dụng thiết lập hàm mật độ xác suất hậu nghiệm qua nhiều giai đoạn cho đại lượng ngẫu nhiên liên tục Hàm mật độ xác suất hậu nghiệm xem xét cụ thể cho tham số tỷ lệ phân phối nhị thức tham số trung bình phân phối chuẩn Chương 3: Suy luận Bayes cho ước lượng khoảng tham số thống kê Sử dụng định lý Bayes để giải toán ước lượng tham số phổ biến thống kê: Ước lượng tham số trung bình ước lượng tham số tỷ lệ Chương 4: Suy luận Bayes cho kiểm định tham số thống kê Sử dụng định lý Bayes để giải toán kiểm định giả thiết tham số thống kê Cụ thể kiểm định tham số trung bình, tham số tỷ lệ, so sánh hai trung bình so sánh hai tỷ lệ Chương BẢNG PHÂN PHỐI XÁC SUẤT HẬU NGHIỆM 1.1 MỘT SỐ PHÂN PHỐI XÁC SUẤT RỜI RẠC ĐẶC BIỆT 1.1.1 Phân phối Bernoulli a) Hàm mật độ xác suất Biến ngẫu nhiên rời rạc X gọi có phân phối Bernoulli với tham số p ( ≤ p ≤ ) nhận giá trị với P( X = 0) = p P( X = 1) = q = − p Nghĩa mật độ xác suất xác định sau:  p x q1− x x = 0, f ( x | p) =  x ≠ 0, 0 b) Tham số đặc trưng Kỳ vọng: E ( X ) = p + 0.q = p Phương sai: Var ( X ) = E ( X ) − [ E ( X )]2 = 12 p + 2.q − p = pq 1.1.2 Phân phối nhị thức a) Hàm mật độ xác suất Biến ngẫu nhiên rời rạc X gọi có phân phối nhị thức với tham số n p hàm mật độ xác suất có dạng sau: C nx p x q1− x x = 0, 1, , n f ( x | n, p ) =  x ≠ 0, 1, , n 0 b) Tham số đặc trưng Kỳ vọng: E ( X ) = np Phương sai: Var ( X ) = npq Chý ý: Nếu X , X , …, X n biến ngẫu nhiên rời rạc, độc lập có phân phối nhị thức X i ~ B(n, p) Khi biến ngẫu nhiên X = X + X + + X n có phân phối nhị thức B(n, p) n = n1 + n2 + + nn 10 1.1.3 Phân phối Poisson a) Hàm mật độ xác suất Đại lượng ngẫu nhiên rời rạc X gọi có phân phối Poisson với tham số λ hàm mật độ xác suất có dạng sau:  λx  − λ  f ( x | λ ) =  x! x = 0, 1, , n  x ≠ 0, 1, , n 0 b) Tham số đặc trưng Kỳ vọng: E ( X ) = λ Phương sai: Var ( X ) = λ Chú ý: i) Nếu X , X , , X n biến ngẫu nhiên rời rạc, độc lập có phân phối Poisson với trung bình λ i, i = 1, 2, n Khi đóến bingẫu nhiên X = X + X + + X n có phân phối Poisson với tham số trung bình λ = λ1+ λ2 +…+ λn ii) Phân phối Poisson trường hợp đặc biệt phân phối nhị thức B(n, p) n lớn p nhỏ 1.2 ĐỊNH LÝ BAYES CHO BIẾN RỜI RẠC 1.2.1 Khái niệm Gọi S không gian mẫu phép thử, ta gọi n biến cố A1 , A2 , , An hình thức chia S thỏa mãn điều kiện:  A1 + A2 + + An = S   Ai A j = φ Gọi B biến cố S Nếu A1 , A2 , , An hình thức chia S A1 B, A2 B, , An B hình thức chia B 1.2.2 Định lý Bayes Giả sử A1 , A2 , , An hình thức chia S, B biến cố P ( Ai | B ) = P ( Ai ) P ( B | Ai ) n ∑ P( A ) P( B | A ) i =1 i i (1.1) 44 4.2 SUY LUẬN BAYES TRONG KIỂM ĐỊNH THAM SỐ TRUNG BÌNH a) Bài tốn Giả sử đại lượng ngẫu nhiên X có phân phối chuẩn với tham số trung bình µ chưa biết Giả sử µ có phân phối tiên nghiệm chuẩn chưa biết trước Chọn giả thiết H: µ = µ µ > µ0 đối thiết H :  µ < µ Với độ tin cậy − α cho trước ta  µ ≠ µ cần kiểm tra giả thiết hay đối thiết b) Các bước thực Các bước thực phần 4.1.2.a khác bước tính P- giá trị Bởi giả thiết H theo (2.7), ta có phân phối hậu nghiệm µ phân phối chuẩn N (m' , s ' ) Vì P- giá trị xác định sau: Nếu chọn đối thiết µ > µ  m'− µ  Pv = 0.5 − ϕ    s'  Nếu chọn đối thiết µ < µ  m'− µ  Pv = 0.5 + ϕ    s'  Nếu chọn đối thiết µ ≠ µ  m'− µ  Pv = − ϕ    s'  Ví dụ 4.1 Chiều dài chi tiết máy đại lượng ngẫu nhiên có phân phối chuẩn với phương sai 4, trung bình ch ưa biết Một báo cáo cho chiều dài trung bình chi tiết máy 31 cm Nghi ngờ chiều dài lớn 31 cm, người ta chọn mẫu gồm 12 phần tử, tính chiều dài trung bình 32 a) Bằng phương pháp tần số, với độ tin cậy 95% kiểm tra điều nghi ngờ có khơng? b) Giả sử biết độ dài chi tiết máy có tiên nghiệm phân phân phối chuẩn với trung bình 30 cm độ lệch chuẩn cm Hãy kiểm tra điều nghi ngờ với mức ý nghĩa 5% 45 Giải a) Gọi µ trung bình chiều dài chi tiết máy Chọn giả thiết H: µ = 31 cm đối thiết H : µ > 31 cm   Ta có Pv = 0.5 − ϕ  ( y − µ ) n     σ   (32 − 31) 12   = 0.5 − ϕ (1.73) = 0.5 − 0.4582 = 0.0418 = 0.5 − ϕ     Vì P v < α = 5% nên ta bác bỏ giả thiết, chấp nhận đối thiết, nghĩa điều nghi ngờ có sở b) Ta có phân phối hậu nghiệm µ phân phối chuẩn µ ~ N (m' , s ' ) Trong m' = n ys + mσ 12.32.4 + 30.2 = = 31.96 2 + 12.4 ns + σ σ 2s2 4.4 s' = = = 0.33 σ + ns + 12.4 2 Chọn giả thiết H: µ =31 cm đối thiết H : µ >31 cm  m'− µ  Pv = 0.5 − ϕ    s'   (31.96 − 31)  = 0.5 − ϕ   0.33   = 0.5 − 0.4525 = 0.0475 Vì Pv < α = 5% nên ta bác bỏ giả thiết Vậy điều nghi ngờ Chú ý: Bài toán kiểm tra giả thiết hai phía giải thơng qua tốn ước lượng khoảng Nếu µ nằm khoảng ước lượng, ta chấp nhận giả thiết, ngược lại ta bác bỏ giả thiết Chẳng hạn ước lượng khoảng ước lượng cho trung bình hậu nghiệm trung bình (m'− uγ s' , m'+ uγ s ') 46 4.3 SUY LUẬN BAYES TRONG SO SÁNH SỰ KHÁC NHAU CỦA HAI TRUNG BÌNH 4.3.1 Mẫu ngẫu nhiên độc lập đến từ hai phân phối chuẩn Giả sử X X hai ại đ lượng ngẫu nhiên có phân phối c huẩn: X ~ N ( µ1 , σ 12 ), X ~ N ( µ , σ 22 ) Chúng ta muốn so sánh µ µ dựa hai mẫu quan sát độc lập X X với độ tin cậy − α cho trước a) Trường hợp 1: Phương sai i) Biết phương sai σ 12 = σ 22 = σ Bài tốn ước lượng: Giả sử ta có hai mẫu độc lập ( y11 , , y n ), ( y12 , , y n ) hai đại lượng ngẫu nhiên X X Do phân phối hậu nghiệm chúng độc lập Giả sử µ1 ~ N (m1 , s12 ) µ ~ N (m2 , s 22 ) , µ1 | y11 , , y n ~ N (m'1 , s '12 ) µ | y12 , , y n ~ N (m' , s ' 22 ) Trong trung bình phương sai hậu nghiệm xác định bới công thức (2.7) Lúc phân phối hậu nghiệm µ d = µ1 − µ xác định sau: µ d | y11 , , y n , y12 , , y n ~ N (m' d , s ' 2d ) Trong m' d = m'1 −m' s ' 2d = s '12 + s ' 22 Ước lượng khoảng cho khác hai trung bình (m' d ( −uγ s ' d , m' d +u γ s ' d ) = m'1 − m' −u γ s '12 + s ' 22 , m'1 −m' +u γ s '12 + s ' 22 ) Chú ý: Khi σ chưa biết ta thay chúng phương sai mẫu điều chỉnh σ = s12 cho tổng thể thứ σ = s 22 cho tổng thể thứ hai 47 Bài toán kiểm định: µ d > Chọn giả thiết H: µ d = đối thiết H ∈  µ d < ,  µ d ≠ µ d = µ1 − µ Tính P- giá trị Nếu chọn H : µ d >  m' Pv = 0.5 − ϕ  d  s' d     m' Pv = 0.5 + ϕ  d  s' d     m' Pv = − ϕ  d  s' d    Nếu chọn H : µ d < Nếu chọn H : µ d ≠ Nếu PV ≤ α ta bác bỏ giả thiết, chấp nhận đối thiết ngược lại Ví dụ 4.2 Tốc độ ánh sáng đại lượng ngẫu nhiên có phân phối chuẩn với độ lệch chuẩn 100, tốc độ trung bình chưa biết Một nhà vật lý thực lần thí nghiệm Lần thử đo 20 lần có tốc độ ánh sáng trung bình 299909 lần thứ hai đo 23 lần có tốc độ ánh sáng trung bình 299756 Giả sử tố c độ ánh sáng có phân phối tiên nghiệm chuẩn N(300000, 5002) a) Ước lượng khác lần thí nghiệm với độ tin cậy 95% b) Với mức ý nghĩa 5% nhà vật lý kết luận tốc độ trung bình ánh sáng thí nghiệm lần đầu lớn lần sau? Giải a) Gọi µ1 tốc độ trung bình ánh sáng thí nghiệm µ tốc độ trung bình ánh sáng thí nghiệm hai Đặt µ d = µ1 − µ Ta có phân phối hậu nghiệm µ1 phân phối chuẩn µ1 ~ N (m'1 , s '12 ) 48 Trong m'1 = n1 ys12 + m1σ 20.299909.500 + 300000.100 = 299909.98 = 20.500 + 100 n1 s12 + σ s '12 = σ s12 100 2.500 = = 499 n1 s12 + σ 20.500 + 100 Tương tự µ có phân phối hậu nghiệm chuẩn µ ~ N (m' , s ' 22 ) Trong m' = n2 ys 22 + m2σ 23.299756.500 + 300000.100 = = 299756.42 23.500 + 100 n2 s 22 + σ s ' 22 = σ s12 100 2.500 = = 434.03 n1 s12 + σ 23.500 + 100 Phân phối hậu nghiệm µ d có phân phối chuẩn N (m' d , s ' 2d ) Trong m' d = m'1 −m' = 299909.98 − 299756.42 = 152.76 s ' 2d = s '12 + s ' 22 = 499 + 434.03 = 933.03 ⇒ s ' d = 933.03 = 30.55 Do khoảng tin cậy 95% cho khác hai trung bình (152.76 − 1.96.30.55, 152.76 + 1.96.30.55) = (92.89, 212.64 ) b) chọn H: µ d = H : µ d > Tính Pv  m' Pv = 0.5 − ϕ  d  s' d  152.76   = 0.5 − ϕ   ≈ 0.5 − 0.5 =  30.55   Vì PV < α = 0.05 bác bỏ giả thiết, chấp nhận đối thiết Vậy tốc độ trung bình ánh sáng lần đầu lớn lần sau ii) Chưa biết phương sai σ Trong trường hợp trước hết ta ước lượng phương sai từ liệu Sau sử dụng phương sai gộp cho việc thay σ Cụ thể S poole = (n1 − 1) s12 + (n2 − 1) s 22 n1 + n2 − 49 b) Trường hợp 2: Phương sai không Khi biết phương sai σ 12 σ 22 ta áp dụng cơng thức (2.7) để tính phương sai hậu nghiệm s '12 s ' 22 Lúc phương sai hậu nghiệm d xác định s ' 2d = s '12 + s ' 22 Trong trường hợp chưa biết phương sai, sử dụng phương sai mẫu để tìm phương sai hậu nghiệm s '12 s ' 22 Lúc phương sai hậu nghiệm d xác định s ' 2d = s '12 + s ' 22 4.3.2 So sánh cặp a) Bài toán Giả sử đối tượng ta quan sát dấu hiệu qua giai đoạn , số liệu cụ thể sau: Giai đoạn Giai đoạn x1 y1 x2 y2 … … xn yn Với độ tin cậy − α cho trước ta cần kiểm tra dấu hiệu X qua giai đoạn có khác khơng? b) Các bước thực Đặt d i = xi − yi với d i có phân phối chuẩn d i ~ N ( µ d , σ d2 ) với µ d chưa biết Giả sử phân phối tiên nghiệm d i phân phối chuẩn d i ~ N (md , s d2 ) Theo (2.7) có phân phối hậu nghiệm µ d phân phối chuẩn N (m' d , s ' 2d ) Trong s ' d2 = σ d2 s d2 σ d2 + ns d2 m' d = m / s d2 + n y / σ d2 n / σ d2 + / s d2 Khi bước kiểm tra khác dấu hiệu X qua giai đoạn thực sau: µ d > Chọn H: µ d = H :  µ d <  µ d ≠ Tính P- giá trị  m' d  s' d Nếu đối thiết µ d > Pv = 0.5 − ϕ     50  m' d  s' d     m' d  s' d    Nếu đối thiết µ d < Pv = 0.5 + ϕ  Nếu đối thiết µ d ≠ Pv = − ϕ  Trả lời: Nếu PV < α : Bác bỏ H , chấp nhận H Nếu PV > α : Chấp nhận H , bác bỏ H Chú ý: Khi σ d2 chưa biết ta thay phương sai mẫu điều chỉnh d Ví dụ 4.3 Để kiểm tra quy trình chăn ni bị sửa, người ta thí nghiệm 15 cặp bị sinh lai chia thành nhóm Nhóm I ni theo phương pháp cũ, nhóm II ni theo phương pháp Kết lượng sữa cho bảng sau: Cặp bò 10 11 12 13 14 15 Lượng sữa nuôi theo PPI (x) 3525 4321 4763 4899 3234 3469 3439 3658 3385 3226 3671 3501 3842 3998 4004 Lượng sữa nuôi theo PPII (y) 3340 4279 4910 4866 3125 3680 3965 3849 3297 3124 3218 3246 4245 4186 3711 Gọi X lượng sữa nuôi theo phương pháp 1, Y lượng sữa ni theo phương pháp Giả sử d có phân phối tiên nghiệm chuẩn N(0, 2002) với độ tin cậy 95% khẳng định ni theo phương pháp tốt phương pháp cũ không? Giải Ta có d = x − y 51 Cặp bị 10 11 12 13 14 15 Lượng sữa nuôi theo PPI (x) 3525 4321 4763 4899 3234 3469 3439 3658 3385 3226 3671 3501 3842 3998 4004 Lượng sữa nuôi theo PPII (y) 3340 4279 4910 4866 3125 3680 3965 3849 3297 3124 3218 3246 4245 4186 3711 d = x− y 185 42 -147 33 109 -211 -526 -191 88 102 453 255 -403 -188 293 Trung bình độ lệch chuẩn d md = −7.067 , σ d = 267.192 Khi phân phối hậu nghiệm µ d N (m' d , s ' 2d ) , với m/s d2 + n d / σ / 200 + 15.(−7.067) /(267.192) = m' d = = −6.316 15 /(267.192) + / 200 n / σ + / s d2 s ' d2 = σ s d2 σ + ns d2 = (267.192) 200 = 4253.349 (267.192) + 15.200 Chọn giả thiết H: µ d = đối thiết H : µ d < P- giá trị xác định cụ thể  m' Pv = 0.5 + ϕ  d  s' d   − 6.316   = 0.5 + ϕ   = 0.4811 4253 349    Vì Pv > 5% nên ta chấp nhận giả thiết Vậy phương pháp chưa có hiệu phương pháp cũ 4.4 SUY LUẬN BAYES TRONG KIỂM ĐỊNH THAM SỐ TỶ LỆ a) Bài toán Giả sử đại lượng ngẫu nhiên X có phân phối nhị thức với xác suất xảy biến cố cần quan tâm p chưa biết Lấy mẫu gồm n phần tử ta có m phần tử quan 52 tâm xảy Với độ tin cậy − α cho trước ta cần kiểm tra giả thiết đối thiết sau: i) Chọn giả thiết H : p = p0 đối thiết H : p > p ii) Chọn giả thiết H : p = p0 đối thiết H : p < p iii) Chọn giả thiết H : p = p0 đối thiết H : p ≠ p b) Phương pháp i) Gọi pˆ xác suất hậu nghiệm p Ta có hàm mật độ xác suất pˆ g ( p | m) Việc kiểm tra giả thiết thực giống phương pháp P- giá trị cần phương pháp tần số với f = E ( g ( p | m)) độ lệch chuẩn S = Var ( g ( p | m)) ii) Về mặt thực tế, gọi Y số lần xảy biến cố cần quan tâm thực n lần phép thử độc lập giống nhau, ta sử dụng nguyên tắc kiểm định sau: n Nếu P(Y ≥ m | H ) < α ⇔ ∑ C ni ( p0 ) i (q0 ) n−i < α bác bỏ giả thiết, chấp nhận đối thiết i =m n Nếu P(Y ≤ m | H ) < α ⇔ ∑ C ni ( p0 ) i (q0 ) n−i < α bác bỏ giả thiết, chấp nhận đối thiết i =m n Nếu P(Y ≥ m | H ) < α ⇔ 2∑ C ni ( p0 ) i (q0 ) n−i < α bác bỏ gi ả thiết, chấp nhận đối i =m thiết Chú ý: Nếu chọn xác suất tiên nghiệm Beta(a, b) g ( p | m) có hàm mật độ xác  a' a ' b'   với a ' = a + m , suất Beta(a + m, b + n − m ) ~ N  , + ' ' a b + ) ( ' + ' + ) ( ' ' a b a b   b ' = b + n − m Lúc f B = a' s B = a '+b' a ' b' (a '+b' ) (a '+b'+1) Các P- giá trị xác định trường hợp i), ii) iii) sau:  f B − p0  sB     f B − p0  sB    i) Pv = 0.5 − ϕ  ii) Pv = 0.5 + ϕ  53  f B − p0  sB iii) Pv = − ϕ     Ví dụ 4.4 Một phương pháp điều trị bệnh truyền thống cho loại bệnh có tỷ lệ khỏi bệnh 60% Người ta điều trị bệnh phương pháp Một nhóm 10 người cho điều trị phương pháp mới, có người khỏi bệnh Hỏi phương pháp có tốt phương pháp ban đầu khơng với mức ý nghĩa 5% a) Nếu sử dụng phương pháp tần số kết luận xem phương pháp có tốt phương pháp ban đầu không ? b) Khi xem xét 10 người số người khỏi bệnh ta kết luận phương pháp tốt phương pháp ban đầu ? c) Giả sử phân phối tiên nghiệm cho tỷ lệ khỏi bệnh phương pháp Beta(1, 1) Hỏi phương pháp có tốt phương pháp ban đầu khơng ? Giải a) Gọi p tỷ lệ người khỏi bệnh Chọn H: p = 60% H : p > 60%  ( f − p0 ) n     = 0.5 − ϕ  (0.8 − 0.6) 10  Pv = 0.5 − ϕ    0.6.0.4  p0 q0    = 0.5 − ϕ (1.29 ) = 0.5 − 0.4015 = 0.0985 Vì P v > 0.05 nên chấp nhận giả thiết Nghĩa ta chưa có sở nói phương pháp tốt phương pháp ban đầu b) Gọi Y số người khỏi bệnh quan sát 10 người phương pháp Yi 10 P(Y= y i |p= 0.6) 0.0001 0.0016 0.0106 0.0425 0.1115 0.2007 0.2508 0.2150 0.1209 0.0403 0.0060 Kết luận Chấp nhận H Chấp nhận H Chấp nhận H Chấp nhận H Chấp nhận H Chấp nhận H Chấp nhận H Chấp nhận H Chấp nhận H Bác bỏ H Bác bỏ H 54 n Nếu P(Y ≥ m | H ) < α ⇔ ∑ C ni ( p0 ) i (q0 ) n−i < α ta chấp nhận đối thiết i =m Vì m = nên P(Y ≥ m) = P(Y = 9) + P(Y = 10) = 0.0403 + 0.0060 = 0.0464 Lúc ta bác bỏ H, chấp nhận H Vậy 10 người kiểm tra theo phương pháp số người khỏi bệnh phải từ trở lên có đủ sở kết luận phương pháp tốt phương pháp cũ c) P- giá trị theo phương pháp Bayes tính sau : Ta có f B = E ( p) = s B2 = D( p ) = a* a+m 1+ = = = 0.75 * * a + m + n + b − m + 10 + a +b a *b * 9.3 = 0.0144 = * * * * (a + b ) (a + b + 1) (9 + 3) (9 + + 1) Chọn H: p = 60% H : p > 60%  ( f − p0 ) n   = 0.5 − ϕ  0.75 − 0.6  Pv = 0.5 − ϕ  B     sB  0.0144    = 0.5 − ϕ (1.25) = 0.5 − 0.3944 = 0.1056 Vì PV > α nên ta chấp nhận H, bác bỏ H Vậy chưa có sở kết luận phương pháp tốt phương pháp ban đầu 4.5 SUY LUẬN BAYES TRONG SÓ SÁNH SỰ KHÁC NHAU CỦA HAI TỶ LỆ a) Bài toán Giả sử hai tổng thể w w có tỷ lệ phần tử có tính chất A chưa biết Gọi p , p tỷ lệ phần tử có tính chất A w1 w2 Chọn mẫu gồm n phần tử từ w1 ta có m n phần tử từ w2 ta có m phần tử có tính chất A Giả sử p có phân phối tiên nghiệm Beta(a , b ) p có phân phối tiên nghiệm Beta(a , b ) Với độ tin cậy − α cho trước cân giải tốn: Ước lượng trung bình khác tỷ lệ p d = p1 − p Kiểm tra giả thiết phía hai phía với p d 55 b) Giải toán Giả sử hai phân phối Beta(a , b ) Beta(a , b ) độc lập, hai phân phối hậu nghiệm p p Beta: p1 ~ Beta(a1* , b1* ), p ~ Beta(a 2* , b2* ) độc lập nhau,  a1* = a1 + m1 , b1* = b1 + n1 − m1  * * a = a + m2 , b2 = b2 + n2 − m2 Người ta chứng minh phân phối Beta xấp xỉ phân phối chuẩn với trung bình phương sai phân phối Beta Do phân phối hậu nghiệm p d = p1 − p có phân phối chuẩn N (m' d , s ' 2d ) , m' d = s ' d2 = a1* a 2* − a1* + b1* a 2* + b2* a1*b1* a 2*b2* + (a1* + b1* ) (a1* + b1* + 1) (a 2* + b2* ) (a 2* + b2* + 1) Do i) Khoảng cách ước lượng cho khác hai tỷ lệ với độ tin cậy 1- α s' s'    m' d −uγ d , m' d +u γ d  n n  ii) Kiểm tra giả thiết với độ tin cậy 1- α Chọn giả thiết đối thiết i) H : p d = H : p d > ii) H : p d = H : p d < iii) H : p d = H : p d ≠ P- giá trị xác định tương ứng sau:  m' d  s' d     m' d  s' d     m' d  s' d    i) PV = 0.5 + ϕ  ii) PV = 0.5 − ϕ  iii) PV = − ϕ  56 Trả lời: Nếu PV < α ta bác bỏ giả thiết, chấp nhận đối thiết Nếu PV > α ta có kết luận ngược lại Ví dụ 4.5 Để đánh giá thói quen hút thuốc nam nữ nước tây Âu, người ta chọn mẫu 200 người gồm 100 nam 100 nữ Kết có 22 sinh viên nam hút thuốc số sinh viên nữ hút thuốc 32 Giả sử tỷ lệ sinh viên hút thuốc nam nữ có phân phối tiên nghiệm Beta(1, 2) Với độ tin cậy 95% khẳng định tỷ lệ sinh viên hút thuốc nam nữ không? Giải Gọi p tỷ lệ sinh viên nữ hút thuốc lá, p tỷ lệ sinh viên nữ hút thuốc Ta có p d ~ N (m' d , s ' 2d ) với m' d = s ' d2 = a1* a 2* − a1* + b1* a 2* + b2* a1*b1* a 2*b2* + (a1* + b1* ) (a1* + b1* + 1) (a 2* + b2* ) (a 2* + b2* + 1) Mà a1* = a1 + m1 = + 32 = 33 b1* = n1 + b1 − m1 = 100 + − 32 = 70 a 2* = a + m2 = + 22 = 23 b2* = n2 + b2 − m2 = 100 + − 22 = 80 Khi m' d = s ' d2 = 33 23 − = 0.097 33 + 70 23 + 80 33.70 23.80 + = 0.00376 (33 + 70) (33 + 70 + 1) (23 + 80) (23 + 80 + 1) Chọn H : p d = H : p d ≠  m'   0.097   Pv = − ϕ  d  = − ϕ   0.00376   s' d  = − 2ϕ (1.58) = − 2.0.4429 = 0.1142 Vì Pv > 5% nên ta chấp nhận giả thiết 57 Vậy tỷ lệ hút thuốc nam nữ khác KẾT LUẬN Dựa định lý Bayes cho biến rời rạc liên tục, luận văn trình bày cách có hệ thống suy luận Bayes quan trọng Đối với biến rời rạc, suy luận ứng dụng việc thiết lập bảng phân phối xác suất hậu nghiệm qua hai giai đoạn nhiều hai giai đoạn Bảng phân phối xác suất xem xét chi tiết cho tham số tỷ lệ phân phối nhị thức tham số trung bình phân phối chuẩn Đối với biến liên tục, suy luận Bayes sử dụng để thiết lập hàm mật độ xác suất hậu nghiệm Hàm mật độ xác suất hậu nghiệm thiết lập cho tham số tỷ lệ phân phối nhị thức tham số trung bình phân phối chuẩn Dựa hàm mật độ xác suất hậu nghiệm thiết lập, suy luận Bayes giải hai toán quan trọng thống kê Đó tốn ước lượng tham số kiểm định tham số thống kê Cả hai toán xem xét đến hai tham số quan trọng: Tham số trung bình tham số tỷ lệ Qua tìm hiểu tài liệu để thực luận văn này, em nhận thấy suy luận Bayes áp dụng nhiều lĩnh vực khác ước lượng hàm mật độ xác suất, phân tích hồi quy, Thống kê Bayes phát triển mạnh mẽ khía cạnh thống kê truyền thống Trong tương lai phát triển chắn mạnh mẽ việc thu nhận lưu trữ liệu khơng cịn vấn đề khó khăn trước phát triển mạnh mẽ công nghệ thông tin Luận văn khảo sát suy luận Bayes xác suất thống kê Nhiều vấn đề liên quan đến suy luận Bayes chưa xem xét, đặc biệt nhiều ứng dụng cụ thể định lý Bayes chưa đề cặp Trong thời gian tới em cố gắng bổ sung để luận văn hoàn thiện 58 TÀI LIỆU THAM KHẢO - A Tiếng Việt [1] Nguyễn Văn Hộ, Xác suất thống kê, Nhà xuất giáo dục, 2001 [2] Võ Văn Tài, Bài giảng môn thống kê Bayes, Đại học Cần Thơ, 2008 [3] Đặng Hùng Thắng, Thống kê ứng dụng, Nhà xuất giáo dục, 2004 B Tiếng Anh [4] Andrew R.Webb, Statistical Pattern Recognition, John Wiley, London, 1999 [5] Bernardo JM and Smith AFM, Bayesian Theory, John Wiley, London, 1994 [6] Morris H DeGroot, Probability and statistics, Addison-Wesley, United States, 1986 [7] Peter M Lee, Baysian statistic an introduction, Oxford University Press Inc, New York, 2004 ... pháp thống kê thành hai loại: Thống kê tần số thống kê Bayes Thống kê tần số phương pháp thống kê phổ biến, dựa kết quan sát mẫu mà không cần để ý đến thông tin liên quan số liệu biết trước Thống. .. tin thuận lợi thống kê Bayes có điều kiện phát triển Trong luận văn sử dụng định lý Bayes để xem xét vấn đề liên quan phổ biến xác suất thống kê Trong xác suất sử dụng định lý Bayes để thiết... trước Thống kê Bayes dựa thông tin liệu biết trước vấn đề quan sát để suy luận cho thống kê Các nhà thống kê khơng cịn bàn cải tính ưu việt thống kê Bayes so với thống kê truyền thống Đặc biệt

Ngày đăng: 24/04/2021, 09:21

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w