Xấp xỉ phân phối chuẩn

39 204 0
Xấp xỉ phân phối chuẩn

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC SƯ PHẠM KHOA TOÁN −−−⋆−−− NGUYỄN THỊ THỤC ĐOAN XẤP XỈ PHÂN PHỐI CHUẨN Chun ngành: Cử nhân Tốn ứng dụng KHĨA LUẬN TỐT NGHIỆP Người hướng dẫn: T.S.LÊ VĂN DŨNG Đà Nẵng - 05/ 2015 LỜI CẢM ƠN! Trong suốt trình học tập hồn thành luận văn này, tơi nhận hướng dẫn, giúp đỡ tận tình q Thầy Cơ, gia đình bạn bè Với lịng kính trọng biết ơn sâu sắc tơi xin bày tỏ lời cảm ơn chân thành tới : - Ban chủ nhiệm Khoa Tốn, thầy cán khoa Toán, trường Đại học Sư Phạm, Đại học Đà Nẵng nhiệt tình giảng dạy giúp đỡ tơi suốt q trình học tập trường - Đặc biệt, tơi xin bày tỏ lịng biết ơn sâu sắc đến thầy T.S Lê Văn Dũng người hết lòng giúp đỡ, dạy bảo, động viên, tạo điều kiện thuận lợi để tơi hoàn thành luận văn tốt nghiệp - Nhân tơi xin gởi lời cảm ơn đến gia đình, bạn bè giúp đỡ động viên vật chất lẫn tinh thần suốt trình làm luận văn tốt nghiệp Mặc dù luận văn hoàn thành thời gian qui định điều kiện thời gian kiến thức hạn chế nên luận văn tơi khơng tránh khỏi thiếu sót Vì vậy, tơi mong nhận đóng góp ý kiến thầy cô bạn để tạo điều kiện cho luận văn tơi hồn thiện Đà Nẵng, tháng 05 năm 2015 Sinh viên Nguyễn Thị Thục Đoan MỤC LỤC Lời cảm ơn! Lời mở đầu Kiến Thức Cơ Sở 1.1 Không gian xác suất 1.2 Biến ngẫu nhiên 1.3 Các tham số đặc trưng Biến ngẫu nhiên 1.4 Một số phân phối xác suất quan trọng Xấp xỉ phân phối chuẩn 13 2.1 Định lý giới hạn trung tâm 13 2.2 Một số ví dụ 13 2.3 Xấp xỉ phân phối chuẩn phân phối nhị thức 15 2.4 Những ví dụ khái quát định lý giới hạn trung tâm 24 2.5 Xấp xỉ phân phối chuẩn phân phối Poisson Gamma 29 2.6 Các gợi ý thực tiễn xấp xỉ phân phối chuẩn 33 2.7 Tóm tắt nội dung 34 Kết luận 36 Tài liệu tham khảo 37 LỜI MỞ ĐẦU Lí chọn đề tài Lý thuyết xác suất thống kê phận toán học nghiên cứu tượng ngẫu nhiên ứng dụng chúng vào thực tế Ngày nay, lý thuyết xác suất thống kê sử dụng để nghiên cứu tìm qui luật chi phối đưa phương pháp tính tốn xác suất tượng ngẫu nhiên Nó cơng cụ khơng thể thiếu ta nói đến dự báo, bảo hiểm, cần đánh giá may, nguy rủi ro, Nhà toán học Pháp Laplace kỉ 19 tiên đốn : "Mơn khoa học hứa hẹn trở thành đối tượng quan trọng tri thức nhân loại Rất nhiều vấn đề quan trọng đời sống thực tế thuộc toán lý thuyết xác suất" Và "xấp xỉ phân phối chuẩn" toán Mục đích nghiên cứu • Hệ thống lại kiến thức sở lý thuyết xác suất học • Tìm hiểu mở rộng thêm kiến thức xấp xỉ phân phối chuẩn Phương pháp nghiên cứu • Nghiên cứu lí luận: Trước tiên đọc tài liệu liên quan đến nội dung đề tài • Hệ thống hóa kiến thức sở không gian xác suất, biến ngẫu nhiên số phân phối xác suất quan trọng để áp dụng vào tìm hiểu xấp xỉ phân phối chuẩn • Hỏi,trao đổi tham khảo ý kiến giáo viên hướng dẫn,nghiên cứu xấp xỉ phân phối chuẩn Xấp xỉ phân phối chuẩn SVTH: Nguyễn Thị Thục Đoan • Đưa khái niệm, định lý, ví dụ, chứng minh rõ ràng xấp xỉ phân phối chuẩn Cấu trúc luận văn Bố cục bao gồm chương : • Chương Kiến thức sở,hệ thống hóa kiến thức liên quan để hổ trợ cho việc tìm hiểu xấp xỉ phân phối chuẩn • Chương Xấp xỉ phân phối chuẩn Do thời gian thực khóa luận khơng nhiều, kiến thức cịn hạn chế nên làm khóa luận khơng tránh khỏi hạn chế sai sót Tơi mong nhận góp ý ý kiến phản biện quý thầy cô bạn đọc Tôi xin chân thành cảm ơn! Đà Nẵng, tháng 05 năm 2015 Sinh viên Nguyễn Thị Thục Đoan CHƯƠNG KIẾN THỨC CƠ SỞ 1.1 Khơng gian xác suất 1.1.1 Phép thử Trong tốn học có khái niệm khơng có định nghĩa mà mơ tả chúng hình ảnh tư trực quan Chẳng hạn hình học khái niệm điểm, đường thẳng, mặt phẳng khái niệm khơng có định nghĩa Trong xác suất, khái niệm phép thử khái niệm khơng có định nghĩa Ta hiểu phép thử việc thực nhóm điều kiện để quan sát tượng có xảy hay không Phép thử gọi ngẫu nhiên ta khơng thể dự báo trước xác kết xảy ta thực phép thử 1.1.2 Khơng gian mẫu Tập hợp tất kết xảy phép thử ngẫu nhiên gọi không gian mẫu Ta thường kí hiệu Ω Cho khơng gian mẫu Ω Ta xét lớp F tập Ω thoã mãn điều kiện: +∅∈F + Nếu A ∈ F Ac ∈ F + Nếu A1 , A2 , , An , ∈ F ∪∞ n=1 An ∈F Lớp F gọi σ -đại số tập Ω 1.1.3 Độ đo xác suất Một hàm tập hợp P : F → R gọi độ đo xác suất thoã mãn điều kiện sau: Xấp xỉ phân phối chuẩn SVTH: Nguyễn Thị Thục Đoan + Với A ∈ F , ≤ P(A) ≤ + P(Ω) = + Nếu A1 ,A2 , ,An , đôi không giao nhau(Ai ∩ Ai = ∅ với i ̸= j) P( ∞ ∪ An ) = n=1 ∞ ∑ P (An ) n=1 Khi phần tử F gọi biến cố P(A) gọi xác suất xảy biến cố A Bộ ba (Ω, F, P ) gọi không gian xác suất 1.2 Biến ngẫu nhiên Định nghĩa 1.1 Cho không gian xác suất (Ω, F, P ) Ánh xạ X : Ω → R gọi Biến ngẫu nhiên X hàm đo được, tức với a ∈ R, {ω ∈ Ω : X(ω) < a} ∈ F 1.2.1 Hàm phân phối xác suất Định nghĩa 1.2 Cho biến ngẫu nhiên X , hàm số F (x) = P (X < x), x ∈ R gọi hàm phân phối xác suất X 1.2.2 Biến ngẫu nhiên độc lập Cho n Biến ngẫu nhiên X1 , , Xn xác định khơng gian mẫu có hàm phân phối xác suất F1 (x), , Fn (x) Ta nói biến ngẫu nhiênX1 , , Xn độc lập với x1 , , xn ∈ R ta có P (X1 < x1 , , Xn < xn ) = F1 (x1 ) Fn (xn ) 1.2.3 Biến ngẫu nhiên rời rạc biến ngẫu nhiên liên tục Ta gọi X biến ngẫu nhiên rời rạc, có miền giá trị hữu hạn vô hạn đếm Nếu biến ngẫu nhiên X có miền giá trị x1 , x2 , , xn bảng số X P x1 P (X = x1 ) x2 P (X = x2 ) xn P (X = xn ) gọi bảng phân phối xác suất biến ngẫu nhiên X Xấp xỉ phân phối chuẩn SVTH: Nguyễn Thị Thục Đoan Biến ngẫu nhiên X gọi biến ngẫu nhiên liên tục tồn hàm số f : R → R khả tích khơng âm cho với y ∈ R, ∫ y F (y) = f (x)dx, −∞ : F (y) hàm phân phối X Khi đó, f (x) gọi hàm mật độ X 1.3 1.3.1 Các tham số đặc trưng Biến ngẫu nhiên Kỳ vọng toán Cho biến ngẫu nhiên X xác định không gian xác suất (Ω; F; P ), khả tích Lebesgue Kì vọng X , kí hiệu E(X), xác định ∫ E(X) = XdP Ω + Nếu Biến ngẫu nhiên rời rạc X có bảng phân phối xác suất E(X) = ∑ X P x1 p1 x2 p2 xn pn xk pk k + Nếu Biến ngẫu nhiên liên tục X có hàm mật độ f (x) thì: ∫+∞ E(X) = xf (x)dx −∞ 1.3.2 Phương sai Cho Biến ngẫu nhiên X , số D(X) = E(X − E(X))2 gọi phương sai Biến ngẫu nhiên X + Nếu Biến ngẫu nhiên rời rạc X có bảng phân phối xác suất X P x1 p1 x2 p2 xn pn Xấp xỉ phân phối chuẩn V ar(X) = SVTH: Nguyễn Thị Thục Đoan ∑ x2 k pk − k ( ∑ )2 xk pk k + Nếu Biến ngẫu nhiên liên tục X có hàm mật độ f (x) :  +∞ 2 ∫ x2 f (x)dx −  xf (x)dx ∫+∞ V ar(X) = −∞ 1.3.3 −∞ Độ lệch tiêu chuẩn Độ lệch tiêu chuẩn biến ngẫu nhiên X , kí hiệu σ (X) xác định √ công thức: σ (X) = V ar(X) 1.3.4 Trung vị Số thực m gọi trung vị biến ngẫu nhiên X thỏa mãn P (X < m) ≤ 0.5 P (X > m) ≤ 0.5 Kí hiệu med(X) = m 1.4 1.4.1 Một số phân phối xác suất quan trọng Phân phối Bernoulli Định nghĩa 1.3 Biến ngẫu nhiên rời rạc X gọi có phân phối Bernoulli với tham số p(0 < p < 1) X có hàm mật độ xác suất { x p (1 − p)1−x x ∈ {0, 1} p(x; p) = x ∈ / {0, 1} Kí hiệu: X ∼ Ber(p) Nếu X ∼ Ber(p) E(X) = p V ar(X) = p(1 − p) Ví dụ 1.4 Chọn ngẫu nhiên sinh viên Đặt: { sinh viên hút thuốc X= sinh viên khơng hút thuốc Nếu có 20% sinh viên hút thuốc hàm mật độ xác suất X  0.8 x = p(x) = 0.2 x =  x ∈ / {0; 1} Xấp xỉ phân phối chuẩn SVTH: Nguyễn Thị Thục Đoan Định lý 2.13 ( Giới hạn Berry Esseen cho xấp xỉ phân phối chuẩn) Cho X ∼ Bin(n, p) cho Y ∼ N (np, np(1 − p)) Với số thực x, |P (X ≤ x) − P (Y ≤ x)| ≤ − 2p(1 − p) √ np(1 − p) Nên ý giới hạn Berry-Esseen bảo toàn Vậy nên, xấp xỉ phân phối chuẩn xác phát triển giới hạn trên, bảo tồn, 0.1 Chúng tơi khơng khuyến khích sử dụng giới hạn Berry-Esseen để định xấp xỉ phân phối chuẩn cho phân phối nhị thức dùng cách xác Giới hạn đơn giản bảo toàn 2.4 Những ví dụ khái quát định lý giới hạn trung tâm Bây chúng tơi cho vài ví dụ áp dụng định lý giới hạn trung tâm chung để tính xấp xỉ xác suất liên quan đến tổng biến độc lập với phân phối thông thường, khơng thiết tổng biến Bernoulli Ví dụ 2.14 (Phân phối tổng giá trị tung xúc xắc) Giả thiết tung xúc xắc đồng chất n lần Chúng tơi tìm xác phân phối tổng n lần tung xúc xắc cách sử dụng cơng thức Moivre Nó phức tạp Giờ sử dụng định lý giới hạn trung tâm để lấy xấp xỉ phân phối cách đơn giản Cho Xi , ≤ i ≤ n lần tung riêng lẻ Sau đó, tổng n lần Sn = X1 + X2 + · · · + Xn Giá trị trung bình phương sai lần tung riêng lẻ µ = 3.5 σ = 2.92 Vậy nên, với định lý giới hạn trung tâm, Sn ≈ N (3.5n, 2.92n) Ví dụ, tung xúc xắc n = 100 lần Giả sử muốn tìm xác suất để tổng 300 lớn Tính tốn trực tiếp sử dụng công thức Moivre phức tạp chí khơng thể Tuy nhiên sử dụng xấp xỉ phân phối chuẩn 24 Xấp xỉ phân phối chuẩn SVTH: Nguyễn Thị Thục Đoan hiệu chỉnh liên tục, ( 299.5 − 3.5 × 100 √ P (Sn ≥ 300) = − P (Sn ≤ 299) = − Φ 2.92 × 100 = − Φ(−2.96) = Φ(2.96) = 0.9985 ) Ví dụ 2.15 (Làm trịn sai số) Giả thiết n số dương làm tròn đến giá trị nguyên gần sai số làm tròn ei =(giá trị thật Xi – giá trị làm tròn Xi ) phân bố độc lập với U [−0.5, 0.5] Chúng tơi muốn tìm xác suất mà tổng sai số số k độ lớn Một ví dụ điển hình là, quan thuế làm trịn số tiền hồn trả xác tới số nguyên gần nhất, trường hợp tổng sai số tiền lỗ lời từ trình làm trịn Từ cơng thức tổng qt cho giá trị trung bình phương sai phân bố đều, ei có giá trị µ = σ = 12 Từ đó, dùng định lý giới hạn ∑n trung tâm, tổng sai số Sn = i=1 ei có phân phối xấp xỉ chuẩn ( n) Sn ≈ N 0, 12 Ví dụ, n = 1000 P (|Sn | ≤ 20) = P (Sn ≤ 20) − P (Sn ≤ −20) ) ( =P S 20 √nn ≤ √ n 12 ( −P −20 S ) √nn ≤ √ n 12 12 12 ≈ Φ(2.19) − Φ(−2.19) = 0.9714 Chúng ta thấy được, bỏ sai số dương âm, quan thuế không hay kiếm nhiều tiền từ việc làm trịn Ví dụ 2.16 (Tổng đồng nhất) Ở ví dụ trước, chúng tơi tính xấp xỉ phân phối tổng n đồng độc lập [−0.5, 0.5] phân phối chuẩn Chúng ta làm tương tự cho tổng đồng độc lập khoảng [a, b] Rất thú vị để hỏi mật độ xác tổng n đồng khoảng [a, b] Vì biến đồng khoảng [a, b] 25 Xấp xỉ phân phối chuẩn SVTH: Nguyễn Thị Thục Đoan chuyển thành khoảng đơn vị khoảng [−1, 1], phép biến đổi tuyến tính ngược lại, chúng tơi hỏi mật độ xác tổng n đồng khoảng [−1, 1] Chúng tơi muốn so sánh mật độ xác với xấp xỉ phân phối chuẩn với nhiều giá trị n Khi n = 2, mật độ tổng hình tam giác đoạn [−2, 2], đa thức phần theo tuyến tính Nói chung, mật độ tổng n đồng độc lập [−1, 1] đa thức phần độ n − 1, có đường cong khác đồ thị mật độ Cơng thức xác : ( ) ∑[ n+x ] k n n−1 |x| ≤ n; ( ) Mặt khác, định lý giới hạn trung tâm lấy xấp xỉ mật độ tổng N 0, n3 Khá fn (x) = 2n (n−1)! k=0 (−1) k (n + x − 2k) thú vị so sánh đồ thị mật độ xác mật độ xấp xỉ phân phối chuẩn cho nhiều giá trị n Chúng ta thấy đồ thị 4-6 xấp xỉ phân phối chuẩn gần xác n = Ví dụ 2.17 Một người chạy nước rút trung bình 140cm, với độ lệch chuẩn 5cm sải chân Xác suất xấp xỉ để người chạy 100m 70 bước ? 72 bước ? Gọi quãng đường người n bước chạy X1 , X2 , , Xn giả sử n, X1 , X2 , · · · , Xn biến độc lập Mỗi Xi có giá trị trung bình µ = 140 σ = 25 Vậy nên, với định lý giới hạn trung tâm, tổng quãng đường chạy n bước, Sn = X1 + X2 + · · · + Xn , xấp xỉ N (140n, 25n) Có thể nói người chạy 100m = 10, 000cm n bước giống nói Sn ≥ 10, 000 Do đó, xác suất chạy 100m 70 bước ( 10, 000 − 140 × 70 √ 25 × 70 P (S70 ≥ 10, 000) = − P (S70 < 10, 000) ≈ − Φ ) = − Φ(4.78) ≈ Bây tăng lên 72 bước, ( P (S72 ≥ 10, 000) = − P (S72 < 10, 000) ≈ − Φ = − Φ(−1.89) = 0.9706 26 10, 000 − 140 × 72 √ 25 × 72 ) Xấp xỉ phân phối chuẩn SVTH: Nguyễn Thị Thục Đoan Hình 4: Hàm mật độ xác xấp xỉ phân phối chuẩn với tổng phân phối đều, n = Hình 5: Hàm mật độ xác xấp xỉ phân phối chuẩn với tổng phân phối đều, n = Hình 6: Hàm mật độ xác xấp xỉ phân phối chuẩn với tổng phân phối đều, n = 27 Xấp xỉ phân phối chuẩn SVTH: Nguyễn Thị Thục Đoan Ví dụ 2.18 (Phân bố sản phẩm) Cho xúc xắc đồng chất tung 20 lần bạn hứa tặng quà giá trị trung bình hình học 20 lần tung vượt 3.5 Xác suất bạn chiến thắng ? Nhớ giá trị trung bình hình học n số dương a1 , a2 , , an định nghĩa (a1 a2 · · · an ) n Lưu ý khơng có cách để tìm phân bố xác sản phẩm 20 lần tung xúc xắc, liệt kê 620 từ điểm Nên đơn giản cách lấy xấp xỉ Làm ? (∏n )1/n ∑n Viết Yi ứng với lần tung thứ i, Xi = log Yi , ta có log = n i=1 log Yi = i=1 Yi ∑ n i=1 Xi Cách sử dụng logarit biến vấn đề sản phẩm thành vấn đề tổng n Mỗi Xi có giá trị trung bình µ = 16 [log + log + · · · + log 6] = log6 6! = 1.097 Cũng [ ] vậy, lần thứ hai Xi 16 (log 1)2 + (log 2)2 + · · · + (log 6)2 = 1.568 Vậy nên, Xi có phương sai σ = 1.568 − 1.0972 = 365 Bây giờ, với định lý giới hạn trung tâm, ( 1∑ 0.365 Xi ≈ N 1.097, n n n ) i=1 Với n = 20, (   (  )1/n )1/n n n ∏ ∏ P Yi > 3.5 = P log Yi > log 3.5 i=1 i=1 ( =P n n ∑ ) Xi > 1.25   ≈ − Φ 1.25 − 1.097  i=1 √ 0.365 20 = − Φ(1.13) = − 0.8708 = 0.1292 Vậy nên, có khoảng 13% xác suất bạn thắng giải Điều làm cho lời mời chào hấp dẫn giá trị trung bình hình học tập hợp số dương nhỏ giá trị trung bình đơn giản Vậy nên, giá trị trung bình đơn giản 20 lần tung vượt 3.5, xác suất 50% bạn thắng giải Ví dụ 2.19 (Cách dùng mạo hiểm định lý giới hạn trung tâm) Cho thời gian tính tiền siêu thị có giá trị trung bình phút sai số phút Bạn 28 Xấp xỉ phân phối chuẩn SVTH: Nguyễn Thị Thục Đoan phải xếp hàng đợi đến lượt phía trước bạn có người đứng chờ Từ kiện này, bạn nói lên điều hữu ích xác suất bạn tính xong tiền vịng nửa giờ? Với cung cấp thông tin giá trị trung bình sai số lần tính tiền khơng cho biết phân bố, khả sử dụng định lý giới hạn trung tâm, n nhỏ, Cho Xi , ≤ i ≤ thời gian tính tiền khách hàng trước bạn X9 thời gian tính tiền bạn Nếu ta sử dụng định lý giới hạn trung tâm, ta có Sn = ∑ Xi ≈ N (36, 9) i=1 Vậy nên, P (Sn ≤ 30) ≈ Φ ( 30 − 36 ) = Φ(−2) = 0.0228 Trong trường hợp này, mà thông tin cung cấp ít, phải dùng định lý giới hạn trung tâm dù mạo hiểm Nếu biết phân bố thời gian tính tiền, ta dễ dang tìm đáp án tương ứng với 2.5 Xấp xỉ phân phối chuẩn phân phối Poisson Gamma Một biến Poisson với tham số nguyên λ = n hiểu tổng n biến Poisson độc lập với giá trị trung bình Tương tự, biến Gamma với tham số α = n λ hiểu tổng n biến mũ độc lập, với giá trị trung bình λ Nên, hai trường hợp này, định lý giới hạn trung tâm bao hàm ý xấp xỉ phân phối chuẩn phân bố Poisson phân phối Gamma cố định n lớn Tuy nhiên, tham số Poisson λ số nguyên tham số Gamma α số nguyên, λ hay α lớn, xấp xỉ phân phối chuẩn cố định Xem hình minh họa Những kết chứng minh trực tiếp cách sử dụng mgf Định lý 2.20 2.21 cho kết xấp xỉ phân phối chuẩn cho phân bố Poisson phân phối Gamma Định lý 2.20 Cho X ∼ P oisson(λ) 29 Xấp xỉ phân phối chuẩn SVTH: Nguyễn Thị Thục Đoan λ → ∞, P ( X−λ √ λ ) ≤ x → Φ(x) với số thực x Hình 7: Poisson pmf với λ = 1, 4, 10 Chú ý, với λ lớn, X ≈ N (λ, λ) Định lý 2.21 Cho X ∼ G(α, λ), với λ cố định, ( ) X−αλ √ α → ∞, P λ α ≤ x → Φ(x) với số thực x Với α lớn, ( X ≈ N αλ, αλ2 ) Ví dụ 2.22 April nhận gọi trung bình ngày nhà Chúng tơi muốn tìm xác suất nhận 100 gọi tháng Cho Xi số gọi April nhận vào ngày thứ i tháng tới Thì số ∑ gọi nhận tháng ni=1 Xi ; giả sử n = 30 Nếu Xi giả sử Poisson với giá trị trung bình ngày độc lập với ∑ nhau, ni=1 Xi ∼ P oi(λ) với λ = 90 Bằng định lý giới hạn trên, sử dụng hệ số hiệu chỉnh liên tục, ( n ∑ P Xi > 100 ) =1−P i=1 ( n ∑ ( i=1 ) Xi ≤ 100 ) 100.5 − 90 √ ≈1−Φ 90 = − Φ(1.11) = − 0.8665 = 0.1335 Phép tính xác xác suất vụng λ lớn Đây lợi sử dụng xấp xỉ phân phối chuẩn 30 Xấp xỉ phân phối chuẩn SVTH: Nguyễn Thị Thục Đoan Ví dụ 2.23 (Tai nạn hạt nhân) Giả sử xác suất xảy tai nạn hạt nhân lò phản ứng hạt nhân vòng năm 0.0005 đất nước có 100 lị hạt nhân Xác suất xảy tai nạn hạt nhân đất nước vịng 250 năm tới bao nhiêu? Gọi Xij số tai nạn xảy năm thứ i lò thứ j Chúng ta cho Xij có phân bố Poisson Tham số, gọi θ, phân bố Poisson xác định từ công thức e−θ = − 0.0005 = 0.9995 ⇒ θ = −log(0.9995) = 0.0005 Cho Xij độc lập, số tai nạn T đất nước vòng 250 năm có phân bố P oi(λ), với λ = θ × 100 × 250 = 0.0005 × 100 × 250 = 12.5 Nếu thực xấp xỉ phân phối chuẩn với hệ số hiệu chỉnh liên tục, ( ) 5.5 − 12.5 √ 12.5 = − Φ(−1.98) = 0.9761 P (T ≥ 6) ≈ − Φ Nên thấy dù xác suất xảy tai nạn lò định năm định nhỏ, cộng dồn thời gian dài xác suất cao Ví dụ 2.24 (Khoảng tin cậy cho giá trị trung bình Poisson) Xấp xỉ phân phối chuẩn cho phân bố Poisson dùng để tìm khoảng tin cậy cho giá trị trung bình phân bố Poisson Chúng ta thấy ví dụ trước khoảng tin cậy cho giá trị trung bình Bây giải trường hợp phân phối Poisson sử dụng xấp xỉ phân phối chuẩn Cho X ∼ P oi(λ) Từ định lý xấp xỉ phân phối chuẩn, λ lớn, X−λ √ λ ≈ N (0, 1) Bây giờ, biến tiêu chuẩn bình thường ngẫu nhiên Z có thuộc tính P (−1.96 ≤ Z ≤ 1.96) = 0.95 Vì ( P ≈ N (0, 1), có X −λ −1.96 ≤ ≤ 1.96 λ ( ⇔P ( ( X−λ √ λ (X − λ)2 ≤ 1.962 λ ) ≈ 0.95 ) ≈ 0.95 ) ⇔ P (X − λ)2 − 1.962 λ ≤ ≈ 0.95 ( ) ) ⇔ P λ2 − λ 2X + 1.962 + X ≤ ≈ 0.95 31 (∗) Xấp xỉ phân phối chuẩn SVTH: Nguyễn Thị Thục Đoan Bây phương trình bậc hai λ2 − λ(2X + 1.962 ) + X = Lấy ( ) √ (2X + 1.962 )2 − 4X ( ) √ 2 2X + 1.96 ± 14.76 + 15.37X = √2 = (X + 1.92) ± 3.69 + 3.84X λ = λ± = 2X + 1.962 ± Phương trình bậc hai λ2 − λ(2X + 1.962 )2 + X ≤ λ hai giá trị λ± , nên ta viết lại (∗) sau P ((X + 1.92) − √ 3.69 + 3.84X ≤ λ ≤ (X + 1.92) + √ 3.69 + 3.84X) ≈ 0.95 (∗∗) Trong thống kê, người ta thường coi tham số λ chưa biết sử dụng thông tin giá trị X để ước tính λ chưa biết Phép tính (∗∗) hiểu là, với xấp xỉ 95% xác suất, λ rơi khoảng giá trị (X + 1.92) − √ √ 3.69 + 3.84X ≤ λ ≤ (X + 1.92) + 3.69 + 3.84X, Nên khoảng [ (X + 1.92) − √ √ ] 3.69 + 3.84X, (X + 1.92) + 3.69 + 3.84X Được gọi xấp xỉ 95% khoảng tin cậy cho λ Chúng ta thấy điều dẫn từ xấp xỉ phân phối chuẩn cho phân bố Poisson Ví dụ 2.25 (Xấp xỉ phân phối chuẩn trường hợp phân phối Gamma) Đái tháo đường số nguyên nhân phát triển bệnh mắt biết đến bệnh màng lưới, gây tổn thương mạch máu võng mạc làm tăng trưởng mạch máu không bình thường, lâu gây mù Thời gian trung bình để phát triển bệnh màng lưới sau người bị đái tháo đường 15 năm, với độ lệch chuẩn năm Giả sử cho X thời gian từ bị đái tháo đường đến phát triển bệnh màng lưới, đặt theo cơng thức X ∼ G(α, λ) Sau đó, ta 32 Xấp xỉ phân phối chuẩn có SVTH: Nguyễn Thị Thục Đoan √ √ 15 αλ = 15; λ α = ⇒ α = = 3.75 ⇒ α = 14.06, λ = 1.07 Giả sử muốn biết phần trăm người mắc bệnh đái tháo đường phát triển bệnh màng lưới vòng 20 năm Vì α = 14.06 lớn, sử dụng xấp xỉ phân phối chuẩn ( 20 − 15 ) P (X ≤ 20) ≈ Φ = Φ(1.25) = 0.8944; Ví dụ, mơ hình Gamma, gần 90% phát triển bệnh màng lưới 20 năm 2.6 Các gợi ý thực tiễn xấp xỉ phân phối chuẩn Chúng tơi trình bày xấp xỉ phân phối chuẩn phân phối nhị thức, Poisson, đồng nhất, phân phối Gamma ví dụ cụ thể chương định lý giới hạn trung tâm Trong trường hợp phân phối nhị thức phân phối Poisson, chúng tơi trình bày xấp xỉ có khơng có hiệu chỉnh liên tục Xấp xỉ phân phối chuẩn hữu ích cho số phân bố tiêu chuẩn khác phân phối khơng có cơng thức phân tích, khơng phải điều dễ dàng Một ví dụ phân bố phân phối Beta nói chung Để dùng vào thực tế cho sinh viên học viên khác, đặt tập hợp công thức xấp xỉ phân phối chuẩn cho lựa chọn phân bố tiêu chuẩn Trong vài trường hợp, cung cấp hai cơng thức, bạn sử dụng hai để so sánh Những công thức dựa công trình nghiên cứu so sánh nhiều người hiệu ;có thể tham khảo thêm Abramowitz Stegun (1970), Patel and Read(1996) Đối với xấp xỉ trường hợp nhị thức âm, mối quan hệ với phân phối nhị thức sử dụng danh sách công thức chúng ta: Cho X ∼ N B(r, θ), Y ∼ Bin(m, θ), Z ∼ Bin(m, − θ); rồi, P (X > m) = P (Y < r) = P (Z > m − r) ⇔ P (X ≤ m) = P (Z ≤ m − r) Tương tự vậy, mật độ Beta với tham số số nguyên có mối quan hệ với phân phối nhị thức Tuy nhiên, xử lý mật độ Beta với thông số chung 33 Xấp xỉ phân phối chuẩn SVTH: Nguyễn Thị Thục Đoan Hàm phân phối Số lượng xấp xỉ Công ( thức xấp ) xỉ P (X ≤ k) Bin(n, p) k+0.5−np √ Φ np(1−p) Φ(z) − √ np(1−p) k+0.5−np z=√ np(1−p) k+0.5−λ √ Φ( ) √ λ P oi(λ) P (X ≤ k) N B(r, θ) P (X ≤ m) ( ) z − ϕ(z) √ Φ(2 k + 0.75 − λ) Sử dụng công thức cho trường hợp nhị thức sử dụng k = m − r, n = m, p = − θ P (X ≤ k) Φ(z), z = Be(a, b) P (X ≤ x) Φ(z), z = P (X ≤ x) a + b > 6, (a + b − 1)(1 − x) ≤ 0.8, 1/3 1/3 u= ) − x)) (√(bx) √, v = (a (1 Φ ( 2x − 2m − ) χ2m √ Φ 2.7 D k+0.5−n N √ D nN (1− ND ) NN−n −1 Hàm (n, D, N ) 9m 3[u(1− 9b )−v(1− 9a1 )] √ u2 /b+v /a [( ) x 1/3 m −1+ 9m ] Tóm tắt nội dung (a) Định lý giới hạn trung tâm cho biến ngẫu nhiên độc lập phân phối xác suất nói X1 , X2 , biến ngẫu nhiên độc lập phân phối xác suất với trung bình hữu hạn µ phương sai hữu hạn σ nếu, với ¯ =X ¯n = n ≥ 1, Sn = X1 + + Xn X ( P n → ∞ Với n lớn, Sn ≈ thì, x thực tế, (√ ( ) ) ¯ ) Sn − nµ √ ≤x nσ Sn n n X −µ ≤x σ =P N (nµ, nσ ) ( → Φ(x) ) X¯ ≈ N µ, σn (b) Cụ thể, phân phối nhị thức, trường hợp Poisson, Gamma, xấp xỉ phân phối chuẩn sau giữ: ( Nếu X = Xn ∼ Bin(n, p), cho thực x, P n → ∞ Nếu X ∼ P oi(λ), cho thực x, P ( X−λ √ λ Nếu X ∼ Gamma(α, λ), cho thực x, P 34 ) √X−np np(1−p) ≤x → Φ(x) ) ≤ x → Φ(x) λ → ∞ ( X−αλ √ λ α ) ≤ x → Φ(x) α → ∞ Xấp xỉ phân phối chuẩn SVTH: Nguyễn Thị Thục Đoan (c) Ngồi cịn có định lý giới hạn địa phương cung cấp cho giá trị xấp xỉ cho P (x = k) trường hợp phân phối nhị thức đảm bảo hội tụ √ mật độ ¯ n(X−µ ) σ cho mật độ tiêu chuẩn thường trường hợp liên tục (d) Đối với xấp xỉ phân phối chuẩn phân phối nhị thức, hai quy tắc thực tế để làm theo sau: (i) Sử dụng hệ số hiệu chỉnh liên tục (ii) Sử dụng quy tắc ngón tay đưa văn để định xem liệu trường hợp đặc biệt xấp xỉ phân phối chuẩn có an tồn để áp dụng hay không Xấp xỉ phân phối chuẩn với hệ số hiệu chỉnh liên tục cho phân phối nhị thức nói ( P (m ≤ X ≤ k) ≈ Φ k+ √ − np np(1 − p) 35 ) ( −Φ m− √ − np np(1 − p) ) KẾT LUẬN Sau thời gian tìm hiểu, học hỏi từ tài liệu thầy TS Lê Văn Dũng cung cấp, hướng dẫn, hồn thành đề tài Kết đạt được: Tổng hợp kiến thức định lý giới hạn trung tâm, định lý giới hạn địa phương Tổng hợp kiến thức xấp xỉ phân phối chuẩn phân phối nhị thức, phân phối Poisson phân phối Gamma; trình bày quy tắc ngón tay để áp dụng cho xấp xỉ phân phối chuẩn phân phối nhị thức; nêu ví dụ xấp xỉ phân phối Do thời gian thực khơng nhiều, kiến thức cịn hạn chế nên khóa luận cịn nhiều thiếu sót, mong nhận ý kiến đóng góp q thầy bạn đọc! 36 TÀI LIỆU THAM KHẢO [1] Abramowitz, M and Stegun, I (1970), Handbook of Mathematical Functions, Dover, New York [2] Bhattacharya, R and Rao, R (1986), Normal Approximation and Asymptotic Expansions, Wiley, New York [3] Charlier, C (1931), Applications de la theorie desprobabilit es K alastronomie, Gauthier-Villars, Paris [4] Dasgupta, A (2008), Asymptotic Theory of Statisticsand Probability, Springer, New York [5] Edgeworth, F (1904), The law of error, Trans Cambridge Philos Soc., 20, 36–65, 113–141 [6] Feller, W (1968), Introduction to Probability Theoryand Its Applications,Vol I, Wiley, New York [7] Feller, W (1971), Introduction to Probability Theory and Its Applications, Vol II, Wiley, New York [8] Hall, P (1992), The Bootstrap and Edgeworth Expansion, Springer, New York [9] Le Cam, L (1986), The central limit theorem around 1935, Statist Sci., 1, 78–91 [10] Patel, J and Read, C (1996), Handbook of the Normal Distribution, Marcel Dekker, New York [11] Pitman, J (1992), Probability, Springer, New York 37 Xấp xỉ phân phối chuẩn SVTH: Nguyễn Thị Thục Đoan [12] Stigler, S (1986), History of Statistics: Measurement of Uncertainty before 1900, Harvard University press, Cambridge, MA 38 ... thức xấp xỉ phân phối chuẩn phân phối nhị thức, phân phối Poisson phân phối Gamma; trình bày quy tắc ngón tay để áp dụng cho xấp xỉ phân phối chuẩn phân phối nhị thức; nêu ví dụ xấp xỉ phân phối. .. 72 ) Xấp xỉ phân phối chuẩn SVTH: Nguyễn Thị Thục Đoan Hình 4: Hàm mật độ xác xấp xỉ phân phối chuẩn với tổng phân phối đều, n = Hình 5: Hàm mật độ xác xấp xỉ phân phối chuẩn với tổng phân phối. .. nhiên số phân phối xác suất quan trọng để áp dụng vào tìm hiểu xấp xỉ phân phối chuẩn • Hỏi,trao đổi tham khảo ý kiến giáo viên hướng dẫn,nghiên cứu xấp xỉ phân phối chuẩn Xấp xỉ phân phối chuẩn

Ngày đăng: 18/05/2021, 12:43

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan