Phương pháp bayes ước lượng tham số đại lượng ngẫu nhiên rời rạc

ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC SƯ PHẠM KHOA TOÁN LÊ THỊ PHẤN PHƯƠNG PHÁP BAYES ƯỚC LƯỢNG THAM SỐ ĐẠI LƯỢNG NGẪU NHIÊN RỜI RẠC KHÓA LUẬN TỐT NGHIỆP Người hướng dẫn: ThS.LÊ VĂN DŨNG Đà Nẵng - 2012 LỜI CẢM ƠN Trong suốt khoá học (2008 - 2012) Trường Đại học Sư phạm ĐHĐN, với nổ lực thân giúp đỡ thầy cô giáo trường, đặc biệt thầy giáo khoa Tốn giúp tơi có vốn tri thức vững vàng để hoàn thành luận văn tốt nghiệp Trong thời gian làm luận văn, giúp đỡ giáo viên hướng dẫn Th.S Lê Văn Dũng mặt, từ nhiều phía tơi hồn thành thời gian qui định Tơi xin chân thành cảm ơn đến : - Các thầy cô giáo khoa Tốn giảng dạy cho tơi kiến thức chuyên môn làm sở để thực tốt luận văn tốt nghiệp tạo điều kiện cho hồn thành tốt khố học - Đặc biệt, tơi xin gửi lời cảm ơn chân thành đến Th.S Lê Văn Dũng người theo sát bảo hướng cho tơi lời khun q báu cung cấp thông tin khoa học để định hướng tốt làm luận văn tốt nghiệp - Nhân xin gởi lời cảm ơn đến gia đình, bạn bè giúp đỡ động viên vật chất lẫn tinh thần suốt trình làm luận văn tốt nghiệp Mặc dù luận văn hoàn thành thời gian qui định điều kiện thời gian kiến thức cịn hạn chế nên luận văn tơi khơng tránh khỏi thiếu sót Vì vậy, tơi mong nhận đóng góp ý kiến thầy cô bạn để tạo điều kiện cho luận văn tơi hồn thiện Đà Nẵng, tháng 05 năm 2012 Sinh viên thực Lê Thị Phấn MỤC LỤC Chương Kiến Thức Cơ Sở 1.1 Không gian xác suất 1.1.1 Phép thử 1.1.2 Không gian mẫu 1.1.3 Độ đo xác suất 1.2 Công thức Bayes 1.2.1 Xác suất có điều kiện 1.2.2 Công thức Bayes 1.3 Đại lượng ngẫu nhiên 1.3.1 Hàm phân phối xác suất 1.3.2 Đại lượng ngẫu nhiên rời rạc 1.3.3 Đại lượng ngẫu nhiên liên tục 1.4 Đại lượng ngẫu nhiên độc lập 1.5 Các tham số đặc trưng đại lượng ngẫu nhiên 1.5.1 Kỳ vọng toán 1.5.2 Phương sai 1.5.3 Độ lệch tiêu chuẩn 1.6 Các phân phối xác suất sử dụng chương sau 1.6.1 Phân phối Bernoulli 1.6.2 Phân phối Nhị Thức 1.6.3 Phân phối Poisson 1.6.4 Phân phối Đều 1.6.5 Phân phối Beta 1.6.6 Phân phối Gamma 1.7 Vectơ ngẫu nhiên 8 8 9 10 11 11 11 12 12 13 13 13 14 14 14 14 15 16 16 17 17 1.7.1 1.7.2 1.7.3 Định nghĩa Hàm phân phối xác suất đồng thời Hàm mật độ xác suất đồng thời 17 18 18 Chương Phương pháp Bayes ước lượng tham số 2.1 Phân phối xác suất có điều kiện 2.1.1 Định nghĩa 2.1.2 Trường hợp Y đại lượng ngẫu nhiên rời rạc 2.1.3 Trường hợp Y đại lượng ngẫu nhiên liên tục 2.2 Ước lượng tham số phân phối Bernoulli 2.2.1 Công thức ước lượng khoảng tham số 2.2.2 Ví dụ 2.2.3 Ví dụ 2.3 Ước lượng tham số phân phối Nhị Thức 2.3.1 Công thức ước lượng khoảng tham số 2.3.2 Ví dụ 2.4 Ước lượng tham số phân phối Poisson 2.4.1 Công thức ước lượng tham số 2.4.2 Ví dụ 2.4.3 Ví dụ 2.5 Ứng dụng phương pháp Bayes ước lượng tham số đại lượng ngẫu nhiên rời rạc sống 19 19 19 19 19 20 21 22 22 23 24 24 25 26 27 28 29 LỜI MỞ ĐẦU Lí chọn đề tài Ngày nay, Xác suất thống kê môn học sở giảng dạy trường đại học, cao đẳng Khơng cịn ứng dụng nhiều ngành kinh tế, kỹ thuật, sinh học, y học, Nó giúp cách tổ chức đạo, sản xuất, phân phối lưu thơng, góp phần dự báo kinh tế, đánh giá chất lượng sản phẩm, suất lao động, thu nhập xử lý khối lượng lớn số liệu thông tin, Phương pháp Bayes phương pháp dùng để kết hợp đối tượng nghiên cứu bên ngoài, đại diện đường cong xác suất Phương pháp Bayes xem phương pháp tính tốn cơng trình nghiên cứu, khơng dựa riêng vào độ tin cậy định lý Bayes cung cấp cách thích hợp để đo lường kết hợp đối tượng nghiên cứu Phương pháp Bayes mô tả không chắn nhận thức luận cách sử dụng ngôn ngữ xác suất Trong phương pháp này, mức độ tin cậy vào trạng thái tự nhiên qui định cụ thể Và mạnh dễ dàng đưa dự đốn Ý tưởng phương pháp thống kê Bayes thơng qua thơng số trung bình, tỉ lệ, độ lệch chuẩn, có luật phân phối riêng Các luật phân phối thể bất định thơng số, mà cịn phản ánh kiến thức thơng số Đối với thơng kê cổ điển thơng số cố định khơng có luật phân phối Đây điểm khác biệt mang tính toán học thống kê Bayes thống kê cổ điển Với lí tơi định chọn đề tài nghiên cứu cho luận văn : Phương Pháp Bayes Ước Lượng Tham Số Đại Lượng Ngẫu Nhiên Rời Rạc Mục đích nghiên cứu Phương pháp Bayes dùng để ước lượng tham số đại lượng ngẫu nhiên rời rạc Đây phương pháp hữu hiệu hạn chế số nhược điểm thống kê cổ điển Phương pháp đánh giá cách mạng quan trọng xác suất thống kê Đối tượng nghiên cứu Đề tài nghiên cứu Phương pháp Bayes ước lượng tham số đại lượng ngẫu nhiên rời rạc Phạm vi nghiên cứu Nghiên cứu tài liệu xác suất, phương pháp Bayes nước Phạm vi nghiên cứu tập trung chủ yếu vào ước lượng tham số phân phối Phương pháp nghiên cứu Để thuận tiện cho việc nghiên cứu, sử dụng phần mềm R để thực phương pháp Bayes, R ngơn ngữ tương đối dễ sử dụng linh hoạt để tính tốn vấn đề khó thực tế nghiên cứu đặc biệt phần mềm miễn phí Thu thập báo khoa học, tài liệu liên quan đến đề tài Tham khảo tài liệu mạng Internet Địa : http://cran.cs.pu.edu.tw/ Ý nghĩa khoa học Luận văn trình bày có hệ thống với mục rõ ràng chặt chẽ Phương pháp Bayes ước lượng tham số đại lượng ngẫu nhiên rời rạc Bên cạnh đó, luận văn cịn đưa ví dụ áp dụng thực tế việc ước lượng tham số đại lượng ngẫu nhiên rời rạc Do đó, luận văn góp phần tạo số tài liệu tham khảo cho sinh viên ngành toán Cấu trúc luận văn Bố cục bao gồm chương : • Chương Kiến thức sở • Chương Phương pháp Bayes ước lượng tham số Do thời gian thực khóa luận khơng nhiều, kiến thức cịn hạn chế nên làm khóa luận khơng tránh khỏi hạn chế sai sót Tơi mong nhận góp ý ý kiến phản biện quý thầy cô bạn Tôi xin chân thành cảm ơn! Đà Nẵng, tháng 05 năm 2012 Sinh viên Lê Thị Phấn CHƯƠNG KIẾN THỨC CƠ SỞ 1.1 1.1.1 Không gian xác suất Phép thử Trong tốn học có khái niệm khơng có định nghĩa mà mơ tả chúng hình ảnh tư trực quan Chẳng hạn hình học khái niệm điểm, đường thẳng, mặt phẳng khái niệm khơng có định nghĩa Trong xác suất, khái niệm phép thử khái niệm khơng có định nghĩa Ta hiểu phép thử việc thực nhóm điều kiện để quan sát tượng có xảy hay khơng Phép thử gọi ngẫu nhiên ta dự báo trước xác kết xảy ta thực phép thử 1.1.2 Khơng gian mẫu Tập hợp tất kết xảy phép thử ngẫu nhiên Ta thường kí hiệu Ω Cho không gian mẫu Ω Ta xét lớp F tập Ω thoã mãn điều kiện: +∅∈F + Nếu A ∈ F Ac ∈ F + Nếu A1 , A2 , , An , ∈ F ∞ n=1 An ∈ F Lớp F gọi σ-đại số tập Ω 1.1.3 Độ đo xác suất Một hàm tập hợp P : F → R gọi độ đo xác suất thoã mãn điều kiện sau: + Với A ∈ F, ≤ P(A) ≤ + P(Ω) = + Nếu A1 ,A2 , ,An , đôi không giao nhau(Ai ∩ Ai = ∅ với ∞ i = j) P ( ∞ n=1 An ) P (An ) = n=1 Khi phần tử F gọi biến cố P(A) gọi xác suất xảy biến cố A Bộ ba (Ω, F, P ) gọi không gian xác suất 1.2 1.2.1 Công thức Bayes Xác suất có điều kiện * Định nghĩa Xác suất biến cố A với điều kiện biến cố B xảy gọi xác suất có điều kiện biến cố A Ký hiệu P(A/B) định nghĩa sau: P (A/B) = P (A ∩ B) P (B) * Hệ P (A ∩ B) = P (A).P (B/A) P (B).P (A/B) P (A) > P (B) > Tổng quát ta có : P (A1 , A2 , , An ) = P (A1 )P (A2 /A1 )P (A3 /A1 A2 ) P (An /A1 A2 An−1 ) Công thức gọi công thức nhân xác suất 18 1.7.2 Hàm phân phối xác suất đồng thời Hàm phân phối vecto ngẫu nhiên X hàm số n biến xác định sau: F (x1 , x2 , , xn ) = P (X1 < x1 , X2 < x2 , , Xn < xn ) với (x1 , x2 , , xn ) ∈ Rn 1.7.3 Hàm mật độ xác suất đồng thời Cho véctơ ngẫu nhiên X = (X1 , X2 , , Xn ) có hàm phân phối F (x1 , x2 , , xn ) Nếu tồn hàm số f (x1 , x2 , , xn ) ≥ với (x1 , x2 , xn ) ∈ Rn cho: x1 x2 F (x1 , x2 , , xn ) = xn −∞ −∞ f (x1 , x2 , , xn )dx1 dx2 xn −∞ Khi hàm số f (x1 , x2 , , xn ) gọi hàm mật độ véctơ ngẫu nhiên X CHƯƠNG PHƯƠNG PHÁP BAYES ƯỚC LƯỢNG THAM SỐ 2.1 Phân phối xác suất có điều kiện Cho hai đại lượng ngẫu nhiên X Y , mục tơi trình bày khái niệm phân phối xác suất đại lượng ngẫu nhiên X điều kiện Y = y 2.1.1 Định nghĩa Cho hai đại lượng ngẫu nhiên X Y , y giá trị Y Hàm phân phối xác suất đại lượng ngẫu nhiên X điều kiện Y = y FX/Y =y (x) = lim+ ε→0 P (X < x, y ≤ Y ≤ y + ε) , x∈R P (y ≤ Y ≤ y + ε)) giới hạn bên phải tồn với x ∈ R 2.1.2 Trường hợp Y đại lượng ngẫu nhiên rời rạc Cho hai đại lượng ngẫu nhiên X Y y phần tử thuộc miền giá trị E đại lượng ngẫu nhiên Y (P (Y = y) > 0) Hàm phân phối xác suất đại lượng ngẫu nhiên X điều kiện Y = y hàm số FX/Y =y (x) = P (X < x/Y = y) = 2.1.3 P (X < x, Y = y) P (Y = y) Trường hợp Y đại lượng ngẫu nhiên liên tục Cho đại lượng ngẫu nhiên X có hàm mật độ fX (x) đại lượng ngẫu nhiên Y có hàm mật độ fY (x) thỏa mãn fY (x) = với mọix ∈ R, y 19 20 giá trị đại lượng ngẫu nhiên Y Gọi fX,Y (x, y) hàm mật độ xác suất đồng thời vectơ ngẫu nhiên (X, Y ) Hàm phân phối xác suất đại lượng ngẫu nhiên X điều kiện Y = y hàm số x FX/Y =y (x) = fX,Y (t, y) dt f (y) Y −∞ Định lý 2.1.1 Cho đại lượng ngẫu nhiên X có hàm mật độ fX (x), đại lượng ngẫu nhiên Y có hàm mật độ fY (x), fX,Y (x, y) hàm mật độ xác suất đồng thời vectơ ngẫu nhiên (X, Y ), f (x/y) = fX/Y =y (x) hàm mật độ X điều kiện Y = y, f (y/x) = fY /X=x (x) hàm mật độ Y điều kiện X = x Khi đó, f (x/y) = 2.2 fX (x)f (y/x) fY (y) Ước lượng tham số phân phối Bernoulli Cho đại lượng ngẫu nhiên rời rạc X có phân phối Bernoulli với tham số θ (0 ≤ θ ≤ 1) có hàm mật độ f (x/θ) = θx (1 − θ)x với x ∈ {0, 1} Giả sử ta chưa biết θ Ta xem θ giá trị đại lượng ngẫu nhiên p có phân phối đoạn [0; 1] Hàm mật độ p : g(x) = x ∈ [0; 1] x ∈ / [0; 1] Giả sử X1 , X2 , , Xn đại lượng ngẫu nhiên độc lập, phân phối xác suất với X, f (x1 , x2 , , xn /θ) hàm mật độ đồng thời vectơ ngẫu nhiên (X1 , X2 , , Xn ) với điều kiện p = θ, f (y1 , y2 , , yn ) hàm mật độ đồng thời vectơ ngẫu nhiên (X1 , X2 , , Xn ), g (θ/x1 , x2 , , xn ) hàm mật độ p với điều kiện : (X1 , , Xn ) = (x1 , , xn ) Bây ta cần dựa vào mẫu số liệu x1 , x2 , , xn để ước lượng p Áp dụng Định lí 2.1.1 ta có : g (θ) f (x1 , x2 , , xn /θ) g (θ/x1 , x2 , , xn ) = f (x1 , x2 , , xn ) n n xi n− Vì g (θ) = f (x1 , x2 , , xn /θ) = θi=1 (1 − θ) i=1 xi nên ta cần tìm 21 f (x1 , x2 , , xn ) g(θ/x1 , x2 , , xn )dθ = nên suy Theo tính chất hàm mật độ ta có : 0 n n xi xi n− θi=1 (1 − θ) i=1 dθ = p(x1 , x2 , , xn ) 1 ⇒ f (x1 , x2 , , xn ) n n xi xi n− θi=1 (1 − θ) i=1 dθ = 1 n n xi ⇒ f (x1 , x2 , , xn ) = xi n− θi=1 (1 − θ) i=1 dθ n xi = k ta : Đặt i=1 θk (1 − θ)n−k dθ = f (x1 , x2 , , xn ) = Γ(k + 1)Γ(n − k + 1) Γ(n + 2) với Γ(x) hàm Gamma Do : g(θ/x1 , x2 , , xn ) = Γ(n + 2) θk (1 − θ)n−k Γ(k + 1)Γ(n − k + 1) Như vậy, θ có phân phối đoạn [0; 1] với điều kiện mẫu số liệu x1 , x2 , , xn p có phân phối Beta với tham số a = k + n b = n − k + với k = xi i=1 2.2.1 Công thức ước lượng khoảng tham số Cho x1 , x2 , , xn mẫu số liệu đại lượng ngẫu nhiên X có phân phối Bernoulli với tham số θ Nếu θ có phân phối [0; 1] với độ tin cậy − α, ước lượng khoảng θ với điều kiện mẫu số liệu : θα/2 ≤ θ ≤ θ1−α/2 22 Trong đó, θα/2 θ1−α/2 phân vị phân phối Beta : Beta(k + 1, n − k + 1) với k = y1 + y2 + + yn xác định : P (Beta < θα/2 ) = α/2 P (Beta > θ1−α/2 ) = α/2 2.2.2 Ví dụ Trong khảo sát cảm nhận hạnh phúc phụ nữ có độ tuổi từ 65 trở lên người ta thăm dị ngẫu nhiên 129 người có 118 người trả lời hạnh phúc Với độ tin cậy 95% ước lượng khoảng tỉ lệ phụ nữ tuổi từ 65 trở lên cảm thấy hạnh phúc Giải Theo giả thiết ta có : n = 129 , k = 118 , α = 0.05 Như : a = 119 b = 12 Ta tìm θα/2 θ1−α/2 phần mềm R : > a < −119; b < −12 > qbeta(c(0.025, 0.975), a, b) [1] 0.8536434 0.9513891 Như ta có ước lượng khoảng p với độ tin cậy 95% [0.85; 0.95] * Chú ý : Nếu áp dụng phương pháp ước lượng cổ điển k − 1.96 n k k (1 − ) n n ≤ p ≤ k − 1.96 n n k k (1 − ) n n n ta ước lượng khoảng [0.86; 0.963] 2.2.3 Ví dụ Chọn ngẫu nhiên 10 sản phẩm nhà máy thấy có phế phẩm Với độ tin cậy 95% ước lượng khoảng tỉ lệ phế phẩm nhà máy 23 Giải Ở ví dụ ta khơng thể áp dụng phương pháp ước lượng cổ điển vi phạm điều kiện k > 10 n − k > 10 Bây ta sử dụng phương pháp Bayes để ước lượng : Theo giả thiết ta có : n = 10 , k = , α = 0.05 Như : a = b = Ta tìm θα/2 θ1−α/2 phần mềm R : > a < −3; b < −9 > qbeta(c(0.025, 0.975), a, b) [1] 0.06021773 0.51775585 Như ta có ước lượng khoảng p với độ tin cậy 95% [0.06; 0.52] 2.3 Ước lượng tham số phân phối Nhị Thức Cho đại lượng ngẫu nhiên X có phân phối nhị thức Bin (n, θ) với hàm mật độ f (x/θ) = Cnx θx (1 − θ)n−x , x ∈ {1, 2, , n} Giả sử chưa biết θ Để ước lượng θ ta xem θ giá trị đại lượng ngẫu nhiên p có phân phối đoạn [0; 1] Hàm mật độ p : x ∈ [0; 1] g(x) = x ∈ / [0; 1] Với giá trị quan sát với X = x, hàm mật độ p là: f (x/θ)g(θ) Cnx θx (1 − θ)n−x g(θ) = g(θ/x) = g(x) f (x) = c(x)θx (1 − θ)n−x g(θ) Khi c(x) hàm phụ thuộc vào x không phụ thuộc vào θ, với g(θ) = tìm c(x) qua công thức sau : c(x)θy (1 − θ)n−x dθ 1= 24 θx (1 − θ)n−x dθ = c(x) Γ(y + 1)Γ(n − y + 1) = c(y) Γ(n + 2) Γ(n + 2) c(x) = Γ(x + 1)Γ(n − x + 1) Thay c(x) vào công thức g(θ/x) ta : Γ(n + 2) g(θ/x) = θx (1 − θ)n−x Γ(x + 1)Γ(n − x + 1) Γ(n + 2) θ(x+1)−1 (1 − θ)(n−x+1)−1 = Γ(x + 1)Γ(n − x + 1) Như vậy, xem θ có phân phối đoạn [0; 1] với giá trị quan sát X = x, θ có phân phối xác suất Beta(y + 1, n − y + 1) 2.3.1 Công thức ước lượng khoảng tham số Cho x giá trị quan sát đại lượng ngẫu nhiên X có phân phối nhị thức B(n, θ) với tham số θ Nếu θ có phân phối đoạn [0; 1] với độ tin cậy − α, ước lượng khoảng θ ứng với giá trị quan sát x là: θα/2 ≤ θ ≤ θ1−α/2 Trong đó, θα/2 θ1−α/2 phân vị phân phối Beta : Beta(x + 1, n − x + 1) xác định : P (Beta < θα/2 ) = α/2 P (Beta > θ1−α/2 ) = α/2 2.3.2 Ví dụ Các sản phẩm nhà máy A đóng gói thành hộp hộp 20 sản phẩm Chọn ngẫu nhiên hộp sản phẩm nhà máy thấy hộp có phế phẩm Với độ tin cậy 95% ước lượng khoảng tỉ lệ phế phẩm nhà máy 25 Giải Tương tự,Ở ví dụ ta khơng thể áp dụng phương pháp ước lượng cổ điển vi phạm điều kiện y > 10 Ta sử dụng phương pháp Bayes để ước lượng : Theo giả thiết ta có : n = 20 , y = , α = 0.05 Như : a = b = 16 Ta tìm θα/2 θ1−α/2 phần mềm R : > a < −6; b < −16 > qbeta(c(0.025, 0.975), a, b) [1] 0.1128094 0.4716598 Như ta có ước lượng khoảng θ với độ tin cậy 95% [0.11; 0.47] 2.4 Ước lượng tham số phân phối Poisson Cho đại lượng ngẫu nhiên rời rạc X có phân phối Poisson với tham số θ (θ > 0) có hàm mật độ f (x/θ) = θ xe −θ x! , x ∈ N = {0, 1, 2, .} Giả sử ta chưa biết θ Ta xem θ giá trị đại lượng ngẫu nhiên Y , gọi g(x) hàm mật độ Y Giả sử X1 , X2 , Xn đại lượng ngẫu nhiên độc lập,cùng phân phối xác suất với đại lượng ngẫu nhiên X (có phân phối Poisson với tham số θ) Khi đó, hàm mật độ xác suất đồng thời (X1 , X2 , Xn ) với điều kiện Y = θ : θα/2 ≤ θ ≤ θ1−α/2 Gọi hàm mật độ đại lượng ngẫu nhiên Y với điều kiện (X1 , , Xn ) = (x1 , , xn ) g(θ/x1 , , xn ), ta có : g(θ/x1 , , xn ) = g(θ)f (x1 , , xn /θ) f (x1 , , xn ) 26 Với x1 , , xn cho trước ta có g(θ/x1 , , xn ) =c1 (x1 , , xn )g(θ)f (x1 , , xn /θ) = c2 (x1 , , xn )g(θ)θ Vì vậy, chọn g(θ) = dgamma(θ, a, b) = ba a+ g(θ/x1 , , xn ) = c2 (x1 , , xn ) θ Γ(a) n i=1 xi −nθ e ba a−1 −bθ θ e Γ(a) n i=1 xi −1 −(n+b)θ e n xk , b + n) = C(x1 , , xn , a, b)dgamma(θ, a + k=1 Vì : +∞ g(θ/x1 , , xn )dθ = −∞ n +∞ xk , b + n)dθ = dgamma(θ, a + −∞ k=1 nên C(x1 , , xn , a, b) = Do đó, n g(θ/x1 , xn ) = dgamma(θ, a + xk , b + n) k=1 Như vậy, xem θ có phân phối Gamma(a, b) với điều kiện mẫu số liệu x1 , , xn , θ có phân phối Gamma(a + nk=1 xk , b + n) 2.4.1 Công thức ước lượng tham số Cho x1 , x2 , , xn mẫu số liệu đại lượng ngẫu nhiên X có phân phối Poisson(θ) Nếu tham số θ có phân phối Gamma(a, b) với độ tin cậy 1−α ước lượng khoảng θ với điều kiện mẫu số liệu : θα/2 ≤ θ ≤ θ1−α/2 Trong đó,θα/2 θ1−α/2 phân vị phân phối G=Gamma (a + n k=1 yk , b + n): P (G < θα/2 ) = α/2 P (G > θ1−α/2 ) = α/2 27 2.4.2 Ví dụ Biết số khách hàng vào mua hàng cửa hàng ngày có phân phối Poisson Theo dõi 15 ngày thấy có tổng cộng 165 khách vào mua Với độ tin cậy 95% ước lượng khoảng số khách vào trung bình ngày cửa hàng Giải Chú ý ta áp dụng phương pháp cổ điển để ước lượng khoảng kì vọng cho trường hợp Gọi X số khách vào mua hàng cửa hàng ngày X ∼ P ois(θ) n Theo giả thiết ta có : n = 15 , xi = 165 i=1 Chọn a = 2, b = Giả sử θ ∼ gamma (2, 1) Sử dụng công thức ước lượng tham số phân phối Poisson ta có: θ| {n = 15, xi = 165} ∼ gamma (2 + 165, + 15) = gamma (167, 16) Chúng ta tìm θ với độ tin cậy 95% phần mềm R : > a < −2; b < −1 > n < −15; sy < −165 > (a + sy)/(b + n) [1]10.4375 > (a + sy − 1)/(b + n) [1]10.375 > qgamma (c(0.025, 0.975), a + sy, b + n) [1] 8.914482 12.078861 8.914482 ≤ θ ≤ 12.078861 Như ước lượng khoảng khách ngày cửa hàng [8.91, 12.07] 28 2.4.3 Ví dụ Trong điều tra General Social Survey vào năm 1990 trình độ giáo dục số 155 phụ nữ 40 tuổi , kết điều tra là: - 111 phụ nữ đại học có tổng cộng 217 đứa - 44 phụ nữ có đại học có tổng cộng 66 đứa Giả sử số phụ nữ có phân phối Poisson độ tin cậy 95%, ước lượng khoảng số trung bình phụ nữ có đại học phụ nữ khơng có đại học Giải Gọi X số phụ nữ có đại học, Y số phụ nữ khơng có đại học Khi đó, X ∼ P ois(θ1 ), Y ∼ P ois(θ2 ) Từ giả thiết ta có: n1 + Nhóm phụ nữ khơng có đại học : n1 = 111 , n2 + Nhóm phụ nữ có đại học : n2 = 44 , xi = 217 i=1 yi = 66 i=1 Chọn a = 2, b = Giả sử {θ1 , θ2 } ∼ Gamma (a = 2, b = 1) Sử dụng cơng thức ước lượng có: θ1 | {n1 = 111, xi = 217} ∼ gamma (2 + 217, + 111) = gamma (219, 112) θ2 | {n2 = 44, yi = 66} ∼ Gamma (2 + 66, + 44) = Gamma (68, 45) Chúng ta tìm θ1 , θ2 với độ tin cậy 95% phần mềm R : > a < −2; b < −1 > n1 < −111; sy1 < −217 > n2 < −44; sy2 < −66 > (a + sy1) / (b + n1) [1] 1.955357 > (a + sy1 − 1) / (b + n1) [1] 1.946429 > qgamma (c (0.025, 0.975) , a + sy1, b + n1) [1] 1.704943 2.222697 29 > (a + sy2) / (b + n2) [1] 1.511111 > (a + sy2 − 1) / (b + n2) [1] 1.488889 > qgamma (c (0.025, 0.975) , a + sy2, b + n2) [1] 1.173437 1.890836 Vậy 1.704943 ≤ θ1 ≤ 2.222679 1.173437 ≤ θ2 ≤ 1.890836 2.5 Ứng dụng phương pháp Bayes ước lượng tham số đại lượng ngẫu nhiên rời rạc sống Phương pháp Bayes có nhiều ứng dụng : y học, tài chánh, chứng khoán, lý thuyết tìm kiếm, có ứng dụng trí tuệ nhân tạo hệ chuyên gia Các kỹ thuật suy luận Bayes phần kỹ thuật nhận dạng mẫu máy tính kể từ cuối thập kỷ 1950 Cịn có mối quan hệ ngày chặt chẽ phương pháp Bayes kỹ thuật giả lập Monte Carlo xử lý mơ hình phức tạp hình thức đóng phân tích Bayes, cấu trúc mơ hình đồ thị cố hữu tất mơ hình thơng kê, mơ hình phức tạp nhất, tạo điều kiện cho thuật toán giả lập hiệu lấy mẫu Gibbs dạng khác thuật toán Metropolis-Hastings Gần đây, suy luận Bayes trở nên thơng dụng lý này; ứng dụng BEAST MrBayes cho phép ước lượng đồng thời nhiều tham số nhân học tiến hóa Khi áp dụng cho phân loại thống kê năm gần đây, suy luận Bayesian sử dụng để nhận diện spam (thư nhũng lạm) Các ứng dụng dùng suy luận Bayes để lọc spam bao gồm Bogofilter, SpamAssassin, InBoxer, Mozilla Việc phân loại spam giới thiệu chi tiết Bộ phân loại Bayes đơn giản Trong số ứng dụng, lôgic mờ lựa chọn thay suy luận Bayes Tuy nhiên, lôgic mờ suy luận Bayes không tương thích tốn 30 học ngữ nghĩa Nói chung, ta hiểu mức độ lôgic mờ xác suất ngược lại 31 KẾT LUẬN Kết đạt : Nêu tóm tắt nội dung quan trọng cần cho nội dung Phân tích ước lượng tham số đưa công thức ước lượng khoảng tham số phân phối Bernoulli, phân phối Nhị Thức phân phối Poisson Đưa ví dụ thực tế phương pháp Bayes ước lượng tham số đại lượng ngẫu nhiên rời rạc minh họa tính tốn thơng qua phần mềm R Đóng góp khóa luận bao gồm: Tìm hiểu trình bày lại nội dung kiến thức sở xác suất thống kê Đề cập số phân phối dùng nội dung Nêu ước lượng tham số phân phối Bernoulli, phân phối Nhị Thức phân phối Poisson Tuy nhiên thời gian thực khóa luận khơng nhiều cịn có sai sót tơi mong nhận góp ý quý thầy cô bạn TÀI LIỆU THAM KHẢO [1] Lê Văn Dũng, Tôn Thất Tú (2012), Bài giảng Lý thuyết xác suất ứng dụng [2] Nguyễn Duy Tiến (2007), Cơ sở lý thuyết xác suất, NXB ĐHQG Hà Nội [3] Đặng Hùng Thắng (2009), Thống kê ứng dụng, NXB Giáo dục [4] Carlin, B P., Louis, T A (2000) Bayes And Empirical Bayes Methods For Data Analysis, Chapman & Hall/CRC [5] Hoff, P.D (2009) A First Course In Bayesian Statistical Methods, Springer [6] Lindley, D.V (1972) Bayesian Statistic, A review, CBMS-NSF Regional Conference Series in Applied Mathematics 32 ... luận văn : Phương Pháp Bayes Ước Lượng Tham Số Đại Lượng Ngẫu Nhiên Rời Rạc Mục đích nghiên cứu Phương pháp Bayes dùng để ước lượng tham số đại lượng ngẫu nhiên rời rạc Đây phương pháp hữu hiệu... ràng chặt chẽ Phương pháp Bayes ước lượng tham số đại lượng ngẫu nhiên rời rạc Bên cạnh đó, luận văn cịn đưa ví dụ áp dụng thực tế việc ước lượng tham số đại lượng ngẫu nhiên rời rạc Do đó, luận... ước lượng tham số đưa công thức ước lượng khoảng tham số phân phối Bernoulli, phân phối Nhị Thức phân phối Poisson Đưa ví dụ thực tế phương pháp Bayes ước lượng tham số đại lượng ngẫu nhiên rời

Định dạng
Số trang	33
Dung lượng	284,25 KB