Một biến Poisson với một tham số nguyên λ=n có thể được hiểu là tổng của n biến Poisson độc lập với giá trị trung bình là 1. Tương tự, một biến Gamma với tham số α=n và λ có thể được hiểu là tổng của n biến mũ độc lập, với giá trị trung bình λ. Nên, trong hai trường hợp này, định lý giới hạn trung tâm đã bao hàm ý là một xấp xỉ phân phối chuẩn của phân bố Poisson và phân phối Gamma cố định khin lớn. Tuy nhiên, ngay cả khi tham số Poisson λ không phải là một số nguyên và ngay cả khi tham số Gamma α không phải là số nguyên, nếu λ hay α lớn, xấp xỉ phân phối chuẩn vẫn cố định. Xem hình 7 minh họa.
Những kết quả này có thể được chứng minh trực tiếp bằng cách sử dụng mgf.
Định lý 2.20 và 2.21 cho kết quả xấp xỉ phân phối chuẩn cho phân bố Poisson và phân phối Gamma.
Định lý 2.20. Cho X ∼P oisson(λ) thì
khi λ→ ∞, P (X√−λ
λ ≤x
)→Φ(x) với mọi số thực x
Hình 7: Poisson pmf với λ= 1,4,10 Chú ý, với λ lớn,
X ≈N(λ, λ)
Định lý 2.21. Cho X ∼G(α, λ), với mọi λ cố định, khi α→ ∞, P
(X−αλ λ√
α ≤x
)→Φ(x) với mọi số thực x
Với α lớn,
X ≈N(
αλ, αλ2)
Ví dụ 2.22. April nhận 3 cuộc gọi trung bình mỗi ngày ở nhà. Chúng tôi muốn tìm xác suất cô ấy sẽ nhận trên 100 cuộc gọi trong tháng tiếp theo.
Cho Xi là số cuộc gọi April nhận vào ngày thứ i của tháng tới. Thì số cuộc gọi cô ấy sẽ nhận trong cả tháng sẽ là ∑n
i=1Xi; chúng ta giả sử n = 30. Nếu mỗiXi được giả sử là Poisson với giá trị trung bình là 3 và các ngày độc lập với nhau, thì∑n
i=1Xi∼P oi(λ) với λ = 90. Bằng định lý giới hạn ở trên, sử dụng hệ số hiệu chỉnh liên tục,
P ( n
∑
i=1
Xi >100 )
= 1−P ( n
∑
i=1
Xi≤100 )
≈1−Φ
(100.5−90
√90 )
= 1−Φ(1.11) = 1−0.8665 = 0.1335
Phép tính chính xác của xác suất này sẽ khá là vụng về vì λ lớn. Đây là lợi thế khi sử dụng xấp xỉ phân phối chuẩn.
Xấp xỉ phân phối chuẩn SVTH: Nguyễn Thị Thục Đoan
Ví dụ 2.23. (Tai nạn hạt nhân). Giả sử xác suất xảy ra tai nạn hạt nhân ở bất kỳ lò phản ứng hạt nhân trong vòng 1 năm là 0.0005 và đất nước đó có 100 lò hạt nhân. Xác suất xảy ra ít nhất 6 tai nạn hạt nhân tại đất nước đó trong vòng 250 năm tới là bao nhiêu?
GọiXij là số tai nạn xảy ra trong năm thứ itại lò thứ j. Chúng ta cho rằng mỗi Xij có cùng phân bố Poisson. Tham số, gọi là θ, của phân bố Poisson này được xác định từ công thứce−θ = 1−0.0005 = 0.9995⇒θ =−log(0.9995) = 0.0005. Cho rằng những Xij này đều độc lập, số tai nạn T ở đất nước trong vòng 250 năm cú một phõn bố P oi(λ), với λ=θì100ì250 = 0.0005ì100ì250 = 12.5. Nếu bõy giờ chúng ta thực hiện xấp xỉ phân phối chuẩn với hệ số hiệu chỉnh liên tục,
P(T ≥6)≈1−Φ
(5.5−12.5
√12.5 )
= 1−Φ(−1.98) = 0.9761
Nên chúng ta thấy là dù các xác suất xảy ra tai nạn ở một lò nhất định trong một năm nhất định là nhỏ, nhưng khi cộng dồn và trong thời gian dài thì những xác suất này sẽ cao.
Ví dụ 2.24. (Khoảng tin cậy cho một giá trị trung bình Poisson). Xấp xỉ phân phối chuẩn cho phân bố Poisson có thể được dùng để tìm khoảng tin cậy cho giá trị trung bình của một phân bố Poisson. Chúng ta đã thấy một ví dụ ở trước về khoảng tin cậy cho một giá trị trung bình. Bây giờ chúng ta sẽ giải quyết trường hợp phân phối Poisson sử dụng xấp xỉ phân phối chuẩn.
Cho X ∼ P oi(λ). Từ định lý xấp xỉ phân phối chuẩn, nếu λ lớn, thì X−λ√
λ ≈ N(0,1). Bây giờ, một biến tiêu chuẩn bình thường ngẫu nhiên Z có thuộc tính P(−1.96≤Z ≤1.96) = 0.95. Vì X√−λ
λ ≈N(0,1), chúng ta có P
(
−1.96≤ X−λ
λ ≤1.96 )
≈0.95
⇔P
((X−λ)2
λ ≤1.962 )
≈0.95
⇔P (
(X−λ)2−1.962λ ≤0)
≈0.95
⇔P (
λ2−λ(
2X+ 1.962)
+X2 ≤0)
≈0.95 (∗)
Bây giờ phương trình bậc hai
λ2−λ(2X+ 1.962) +X2= 0 Lấy căn
λ =λ± =
(2X+ 1.962)
±√
(2X+ 1.962)2−4X2 2
=
(2X+ 1.962)
±√
14.76 + 15.37X 2
= (X+ 1.92)±√
3.69 + 3.84X
Phương trình bậc hai λ2−λ(2X+ 1.962)2+X2 là ≤0 khi λ ở giữa hai giá trị λ± , nên ta có thể viết lại (∗) như sau
P((X+ 1.92)−√
3.69 + 3.84X ≤λ ≤(X+ 1.92) +√
3.69 + 3.84X)≈0.95 (∗∗) Trong thống kê, người ta thường coi tham số λ chưa biết và sử dụng thông tin giá trị X để ước tính λ chưa biết. Phép tính (∗∗) được hiểu là, với xấp xỉ 95%
xác suất, λ sẽ rơi trong khoảng giá trị (X+ 1.92)−√
3.69 + 3.84X ≤λ≤(X+ 1.92) +√
3.69 + 3.84X, Nên khoảng
[(X+ 1.92)−√
3.69 + 3.84X,(X+ 1.92) +√
3.69 + 3.84X]
Được gọi là một xấp xỉ 95% khoảng tin cậy cho λ. Chúng ta thấy điều này được dẫn ra từ xấp xỉ phân phối chuẩn cho phân bố Poisson.
Ví dụ 2.25. (Xấp xỉ phân phối chuẩn trong trường hợp phân phối Gamma).
Đái tháo đường là một trong số những nguyên nhân chính phát triển các bệnh về mắt được biết đến như bệnh màng lưới, gõy tổn thương mạch mỏu vừng mạc và làm tăng trưởng các mạch máu không bình thường, về lâu sẽ gây mù. Thời gian trung bình để phát triển bệnh màng lưới sau khi một người bị đái tháo đường là 15 năm, với độ lệch chuẩn là 4 năm.
Giả sử chúng ta cho X là thời gian từ khi bị đái tháo đường đến sự phát triển của bệnh màng lưới, và chúng ta đặt nó theo công thức X ∼G(α, λ) Sau đó, ta
Xấp xỉ phân phối chuẩn SVTH: Nguyễn Thị Thục Đoan
có
αλ= 15;λ√
α= 4⇒√
α= 15
4 = 3.75⇒α= 14.06, λ= 1.07
Giả sử chúng ta muốn biết phần trăm những người mắc bệnh đái tháo đường phát triển bệnh màng lưới trong vòng 20 năm. Vì α = 14.06 là lớn, chúng ta có thể sử dụng xấp xỉ phân phối chuẩn.
P(X ≤20) ≈Φ
(20−15 4
)
= Φ(1.25) = 0.8944;
Ví dụ, dưới mô hình Gamma, gần 90% phát triển bệnh màng lưới trong 20 năm.