Bây giờ chúng tôi cho một vài ví dụ áp dụng của định lý giới hạn trung tâm chung để tính xấp xỉ các xác suất liên quan đến tổng các biến độc lập với phân phối thông thường, không nhất thiết là tổng các biến Bernoulli.
Ví dụ 2.14. (Phân phối của tổng các giá trị khi tung xúc xắc). Giả thiết tung một xúc xắc đồng chất n lần. Chúng tôi đã tìm được chính xác phân phối của tổng n lần tung xúc xắc bằng cách sử dụng công thức Moivre. Nó khá là phức tạp. Giờ chúng tôi sẽ sử dụng định lý giới hạn trung tâm để lấy xấp xỉ phân phối một cách đơn giản hơn.
Cho Xi,1 ≤ i ≤ n là những lần tung riêng lẻ. Sau đó, tổng n lần là Sn = X1+X2+ã ã ã+Xn Giỏ trị trung bỡnh và phương sai của mỗi lần tung riờng lẻ là à= 3.5 và σ2 = 2.92. Vậy nờn, với định lý giới hạn trung tõm,
Sn ≈N(3.5n,2.92n)
Ví dụ, tung một con xúc xắc n = 100 lần. Giả sử chúng ta muốn tìm xác suất để tổng là 300 hoặc lớn hơn. Tính toán trực tiếp sử dụng công thức Moivre sẽ phức tạp và thậm chí là không thể. Tuy nhiên sử dụng xấp xỉ phân phối chuẩn
Xấp xỉ phân phối chuẩn SVTH: Nguyễn Thị Thục Đoan
hiệu chỉnh liên tục,
P(Sn ≥300) = 1−P(Sn ≤299) = 1−Φ
(299.5−3.5ì100
√2.92ì100 )
= 1−Φ(−2.96) = Φ(2.96) = 0.9985
Ví dụ 2.15. (Làm tròn sai số). Giả thiết n là những số dương được làm tròn đến giá trị nguyên gần nhất và sai số làm tròn ei =(giá trị thật của Xi – giá trị đã làm tròn của Xi) được phân bố độc lập với U[−0.5,0.5]. Chúng tôi muốn tìm xác suất mà tổng sai số là một số k về độ lớn. Một ví dụ điển hình là, cơ quan thuế làm tròn số tiền hoàn trả chính xác tới số nguyên gần nhất, trong trường hợp nào thì tổng sai số sẽ là tiền lỗ hoặc lời từ quá trình làm tròn này.
Từ các công thức tổng quát cho giá trị trung bình và phương sai của một phõn bố đều, mỗi ei cú giỏ trị à = 0 và σ2 = 121. Từ đú, dựng định lý giới hạn trung tâm, tổng sai số Sn =∑n
i=1ei có phân phối xấp xỉ chuẩn.
Sn ≈N (
0, n 12
)
Ví dụ, nếu n = 1000 thì
P (|Sn| ≤20) =P (Sn ≤20)−P (Sn ≤ −20)
=P (
Sn
√n
12
≤ 20
√n
12
)
−P (
Sn
√n
12
≤ −20
√n
12
)
≈Φ(2.19)−Φ(−2.19) = 0.9714
Chúng ta thấy được, vì bỏ đi sai số dương và âm, cơ quan thuế sẽ không mất hay kiếm được nhiều tiền từ việc làm tròn.
Ví dụ 2.16. (Tổng các đồng nhất). Ở ví dụ trước, chúng tôi đã tính xấp xỉ phân phối của tổng n đồng nhất độc lập trên [−0.5,0.5] bằng một phân phối chuẩn. Chúng ta có thể làm tương tự cho tổng các đồng nhất độc lập trên bất kỳ khoảng[a, b]nào. Rất là thú vị để hỏi mật độ chính xác của tổngn đồng nhất trên khoảng [a, b]. Vì một biến đồng nhất bất kỳ trên một khoảng [a, b] có thể
được chuyển thành một khoảng trên đơn vị khoảng [−1,1], bằng một phép biến đổi tuyến tính và ngược lại, chúng tôi hỏi mật độ chính xác của tổng n đồng nhất trên khoảng[−1,1]. Chúng tôi muốn so sánh mật độ chính xác này với một xấp xỉ phân phối chuẩn với nhiều giá trị của n.
Khi n = 2, mật độ của tổng là một hình tam giác trong đoạn [−2,2], nó là một đa thức từng phần theo tuyến tính. Nói chung, mật độ tổng của n đồng nhất độc lập trên[−1,1] là một đa thức từng phần của độn−1, có những đường cong khác trong đồ thị mật độ. Công thức chính xác là :
fn(x) = 2n(n1−1)!
∑[n+x2 ]
k=0 (−1)k(n
k
)(n+x−2k)n−1 nếu |x| ≤n;
Mặt khác, định lý giới hạn trung tâm lấy xấp xỉ mật độ tổng bởi N( 0,n3)
. Khá là thú vị khi so sánh đồ thị của mật độ chính xác và mật độ xấp xỉ phân phối chuẩn cho nhiều giá trị của n. Chúng ta thấy được ở đồ thị 4-6 đó là xấp xỉ phân phối chuẩn gần như chính xác khi n= 8.
Ví dụ 2.17. Một người chạy nước rút trung bình 140cm, với độ lệch chuẩn 5cm trong mỗi sải chân. Xác suất xấp xỉ là bao nhiêu để người này chạy 100m trong 70 bước hoặc ít hơn ? 72 bước hoặc ít hơn ?
Gọi quãng đường đi được bởi người này trong n bước chạy là X1, X2, . . . , Xn và giả sử mỗi n, X1, X2,ã ã ã , Xn là cỏc biến độc lập. Mỗi Xi cú giỏ trị trung bỡnh à= 140 và σ2 = 25 Vậy nờn, với định lý giới hạn trung tõm, tổng quóng đường chạy được trongn bước,Sn =X1+X2+ã ã ã+Xn, xấp xỉ N(140n,25n). Cú thể núi người này có thể chạy100m = 10,000cmtrong n bước giống như nói Sn ≥10,000. Do đó, xác suất chạy 100m trong 70 bước hoặc ít hơn là
P (S70 ≥10,000) = 1−P(S70 <10,000)≈1−Φ
(10,000−140ì70
√25ì70 )
= 1−Φ(4.78)≈0 Bây giờ tăng lên 72 bước, thì
P (S72 ≥10,000) = 1−P(S72 <10,000)≈1−Φ
(10,000−140ì72
√25ì72 )
= 1−Φ(−1.89) = 0.9706
Xấp xỉ phân phối chuẩn SVTH: Nguyễn Thị Thục Đoan
Hình 4: Hàm mật độ chính xác và xấp xỉ phân phối chuẩn với tổng của các phân phối đều, n = 2
Hình 5: Hàm mật độ chính xác và xấp xỉ phân phối chuẩn với tổng của các phân phối đều, n = 4
Hình 6: Hàm mật độ chính xác và xấp xỉ phân phối chuẩn với tổng của các phân phối đều, n = 8
Ví dụ 2.18. (Phân bố của một sản phẩm). Cho rằng một xúc xắc đồng chất được tung 20 lần và bạn được hứa tặng quà nếu giá trị trung bình hình học của 20 lần tung vượt quá 3.5. Xác suất bạn chiến thắng là bao nhiêu ? Nhớ là giá trị trung bình hình học của n số dương a1, a2, . . . , an được định nghĩa là (a1a2ã ã ãan)n1.
Lưu ý đầu tiên là chúng ta không có cách để tìm phân bố chính xác của sản phẩm 20 lần tung xúc xắc, và sự liệt kê của620 ra từ điểm cũng không thể được.
Nên chúng ta đơn giản chỉ còn cách lấy xấp xỉ. Làm thế nào ? ViếtYi ứng với lần tung thứi, Xi = logYi, ta cólog(∏n
i=1Yi)1/n
= n1∑n
i=1logYi=
1 n
∑n
i=1Xi. Cách sử dụng logarit này biến vấn đề sản phẩm thành vấn đề về tổng.
Mỗi Xi cú giỏ trị trung bỡnhà= 16[log 1 + log 2 +ã ã ã+ log 6] = log 6!6 = 1.097. Cũng vậy, lần thứ hai của Xi là 16[
(log 1)2+ (log 2)2+ã ã ã+ (log 6)2]
= 1.568. Vậy nên, mỗi Xi có phương sai σ2 = 1.568−1.0972 = .365. Bây giờ, với định lý giới hạn trung tâm,
1 n
∑n i=1
Xi ≈N (
1.097,0.365 n
)
Với n= 20,
P
( n
∏
i=1
Yi )1/n
>3.5
=P
log ( n
∏
i=1
Yi )1/n
>log 3.5
=P (
1 n
∑n i=1
Xi >1.25 )
≈1−Φ
1.25√−1.097
0.365 20
= 1−Φ(1.13) = 1−0.8708 = 0.1292
Vậy nên, chỉ có khoảng 13% xác suất là bạn sẽ thắng giải. Điều làm cho lời mời chào này kém hấp dẫn là vì giá trị trung bình hình học của bất kỳ tập hợp số dương nào cũng nhỏ hơn giá trị trung bình đơn giản của nó. Vậy nên, nếu giá trị trung bình đơn giản của 20 lần tung vượt quá 3.5, xác suất là 50% bạn sẽ thắng giải.
Ví dụ 2.19. (Cách dùng mạo hiểm định lý giới hạn trung tâm). Cho rằng thời gian tính tiền ở siêu thị có giá trị trung bình là 4 phút và sai số là 1 phút. Bạn
Xấp xỉ phân phối chuẩn SVTH: Nguyễn Thị Thục Đoan
phải xếp hàng đợi đến lượt và phía trước bạn có 8 người nữa đang đứng chờ.
Từ những dữ kiện này, bạn có thể nói lên điều gì đó hữu ích về xác suất bạn có thể tính xong tiền trong vòng nửa giờ?
Với chỉ được cung cấp thông tin về giá trị trung bình và sai số của một lần tính tiền nhưng không cho biết gì về phân bố, khả năng là sử dụng định lý giới hạn trung tâm, mặc dù ở đây n nhỏ, chỉ là 9. Cho Xi,1 ≤ i ≤ 8 là thời gian tính tiền của 8 khách hàng trước bạn và X9 là thời gian tính tiền của bạn. Nếu ta sử dụng định lý giới hạn trung tâm, ta sẽ có
Sn =
∑9 i=1
Xi ≈N(36,9) Vậy nên,
P (Sn ≤30)≈Φ
(30−36 3
)
= Φ(−2) = 0.0228
Trong những trường hợp như thế này, khi mà thông tin cung cấp là ít, chúng ta thỉnh thoảng phải dùng định lý giới hạn trung tâm dù nó hơi mạo hiểm. Nếu biết được phân bố của thời gian tính tiền, ta sẽ dễ dang tìm được đáp án tương ứng với nó.