Không gian xác suất
Trong toán học, có những khái niệm không thể định nghĩa mà chỉ có thể mô tả qua hình ảnh hoặc tư duy trực quan, như điểm, đường thẳng và mặt phẳng trong hình học Một khái niệm cơ bản trong xác suất là phép thử, được hiểu là việc thực hiện một nhóm điều kiện để quan sát hiện tượng có xảy ra hay không Phép thử được xem là ngẫu nhiên khi không thể dự đoán chính xác kết quả trước khi thực hiện.
Tập hợp tất cả các kết quả có thể xảy ra của một phép thử ngẫu nhiên được gọi là không gian mẫu Ta thường kí hiệu là Ω.
Cho không gian mẫu Ω Ta chỉ xét 1 lớp F các tập con của Ω thoã mãn 3 điều kiện:
Lớp F như vậy được gọi là σ -đại số các tập con của Ω
Một hàm tập hợp P : F → R được gọi là độ đo xác suất nếu thoã mãn 3 điều kiện sau:
Xấp xỉ phân phối chuẩn SVTH: Nguyễn Thị Thục Đoan
+ Nếu A 1 , A 2 , , A n , đôi một không giao nhau( A i ∩ A i = ∅ với mọi i ̸ = j) thì
Khi đó mỗi phần tử của F được gọi là biến cố và P(A) được gọi là xác suất xảy ra biến cố A Bộ ba (Ω, F , P ) gọi là không gian xác suất.
Biến ngẫu nhiên
Định nghĩa 1.1 Cho không gian xác suất (Ω, F , P ) Ánh xạ X : Ω → R được gọi là Biến ngẫu nhiên nếu X là hàm đo được, tức là với mọi a ∈ R, { ω ∈ Ω :
1.2.1 Hàm phân phối xác suất Định nghĩa 1.2 Cho biến ngẫu nhiên X , hàm số F (x) = P (X < x), x ∈ R được gọi là hàm phân phối xác suất của X
1.2.2 Biến ngẫu nhiên độc lập
Cho n biến ngẫu nhiên X₁, , Xn xác định trên cùng một không gian mẫu với các hàm phân phối xác suất F₁(x), , Fn(x) Các biến ngẫu nhiên này được coi là độc lập nếu với mọi x₁, , xn ∈ R, điều kiện độc lập được thỏa mãn.
1.2.3 Biến ngẫu nhiên rời rạc và biến ngẫu nhiên liên tục
Biến ngẫu nhiên rời rạc X được định nghĩa khi nó có miền giá trị hữu hạn hoặc vô hạn đếm được Nếu biến ngẫu nhiên X có các giá trị x1, x2, , xn, thì có thể lập bảng số để thể hiện các giá trị này.
P P (X = x 1 ) P (X = x 2 ) P (X = x n ) được gọi là bảng phân phối xác suất biến ngẫu nhiên X.
Biến ngẫu nhiên X được gọi là biến ngẫu nhiên liên tục nếu tồn tại một hàm số f :R → R khả tích không âm sao cho với mọi y ∈ R,
−∞ f (x)dx, trong đó : F (y) là hàm phân phối của X
Khi đó, f (x) được gọi là hàm mật độ của X
Các tham số đặc trưng của Biến ngẫu nhiên
Cho biến ngẫu nhiên X xác định trên không gian xác suất (Ω; F ; P ), khả tích Lebesgue Kì vọng của X , kí hiệu là E(X), được xác định bởi
+ Nếu Biến ngẫu nhiên rời rạc X có bảng phân phối xác suất
+ Nếu Biến ngẫu nhiên liên tục X có hàm mật độ f (x) thì:
Cho Biến ngẫu nhiên X , số D(X) = E(X − E(X)) 2 được gọi là phương sai của Biến ngẫu nhiên X
+ Nếu Biến ngẫu nhiên rời rạc X có bảng phân phối xác suất
Xấp xỉ phân phối chuẩn SVTH: Nguyễn Thị Thục Đoan thì V ar(X) =∑ k x 2 k p k −
+ Nếu Biến ngẫu nhiên liên tục X có hàm mật độ f (x) thì :
1.3.3 Độ lệch tiêu chuẩn Độ lệch tiêu chuẩn của biến ngẫu nhiên X , kí hiệu σ (X) được xác định bởi công thức: σ (X) = √
Số thực m được gọi là trung vị của biến ngẫu nhiên X nếu thỏa mãn P (X < m) ≤ 0.5 và P (X > m) ≤ 0.5
Một số phân phối xác suất quan trọng
1.4.1 Phân phối Bernoulli Định nghĩa 1.3.Biến ngẫu nhiên rời rạc X được gọi là cóphân phối Bernoulli với tham số p(0 < p < 1) nếu X có hàm mật độ xác suất p(x; p) =
Nếu X ∼ Ber(p) thì E(X) = p và V ar(X) = p(1 − p)
Ví dụ 1.4 Chọn ngẫu nhiên 1 sinh viên Đặt:
{1 nếu sinh viên đó hút thuốc lá
0 nếu sinh viên đó không hút thuốc lá Nếu có 20% sinh viên hút thuốc lá thì hàm mật độ xác suất của X là p(x) =
Biến ngẫu nhiên rời rạc X được gọi là có phân phối nhị thức với tham số n và p, trong đó n là số nguyên dương (n ∈ N \ { 0 }) và p là xác suất thành công trong một lần thử (0 < p < 1) Hàm mật độ xác suất của phân phối này được biểu diễn bằng công thức p(x; n; p).
Kí hiệu: X ∼ Bin(n, p). Định lý 1.6.
(i) Nếu X 1 , X 2 , , X n là các biến ngẫu nhiên độc lập và có cùng phân phối Ber(p) , thì
(ii) Cho X ∼ Bin(n, p) , khi đó E(X) = np và V ar(X) = np(1 − p)
Ví dụ 1.7 Tung 10 lần một con xúc xắc, gọi X là số lần xuất hiện mặt 1 chấm. Khi đó X ∼ Bin(10; 1/6)
Trong một siêu thị, có tới 75% khách hàng sử dụng thẻ tín dụng để thanh toán Nếu chọn ngẫu nhiên 10 khách hàng, ký hiệu X là số khách hàng thanh toán bằng thẻ tín dụng, thì X tuân theo phân phối nhị thức với tham số n = 10 và p = 0.75, tức là X ∼ Bin(10; 0.75).
1.4.3 Phân phối Poisson Định nghĩa 1.9 Biến ngẫu nhiên rời rạc X được gọi là cóphân phối Poisson với tham số λ (λ > 0) nếu X có hàm mật độ xác suất p(x; λ) = e −λ λ x x! x ∈ N Khi đó, E (X) = λ, V ar(X) = λ
Trong ví dụ này, gọi X là số côn trùng bị dính bẫy trong một ngày, với X có phân phối Poisson và tham số λ = 4.5, tức là trung bình mỗi ngày có 4.5 con côn trùng bị dính bẫy Để tính xác suất có đúng 3 con côn trùng bị dính bẫy trong một ngày, ta áp dụng công thức xác suất phân phối Poisson.
Xấp xỉ phân phối chuẩn SVTH: Nguyễn Thị Thục Đoan Định lý 1.11 Cho X 1 , X 2 , , X n là các biến ngẫu nhiên độc lập và có cùng phân phối P oi(λ) , khi đó S = X 1 + X 2 + + X n ∼ P oi(nλ)
1.4.4 Phân phối chuẩn Định nghĩa 1.12 Biến ngẫu nhiên liên tục X được gọi là cóphân phối chuẩn với tham số à và σ 2 ( −∞ < à < ∞ và σ > 0) nếu X cú hàm mật độ xỏc suất f (x; à, σ) = 1 σ √
Biến ngẫu nhiên chuẩn tắc, ký hiệu là Z, có tham số μ = 0 và σ = 1 Hàm mật độ xác suất của biến này được biểu diễn bằng f(x; 0, 1) = φ(x) = 1.
Hàm phân phối xác suất của Z , kí hiệu Φ(x), là Φ(x) =
2 dt Định lý 1.13 Cho X ∼ N (à, σ 2 ) Khi đú
(iii) Cho X 1 , X 2 , , X n là các biến ngẫu nhiên độc lập và có cùng phân phối chuẩn với tham số à , σ 2 khi đú
Chiều cao của nam thanh niên trưởng thành ở Việt Nam tuân theo phân phối chuẩn N(à, 0.1²) Khi chọn ngẫu nhiên 100 nam thanh niên, cần tính xác suất sai số tuyệt đối giữa chiều cao trung bình của nhóm này không vượt quá 0.03.
Giải: Đặt X k là chiều cao của nam thanh niên thứ k th k = 1, 2, , 100 Khi đó,
100 cú phõn phối chuẩn N (à, 0.01 2 ) Do đú
CHƯƠNG 2 XẤP XỈ PHÂN PHỐI CHUẨN
Định lý giới hạn trung tâm
Định lý 2.1 khẳng định rằng, đối với n biến độc lập X1, X2, , Xn (với n ≥ 1) có cùng phân phối xác suất F, nếu chúng có giá trị trung bình hữu hạn và phương sai hữu hạn σ², thì tổng S_n = X1 + X2 + + Xn và giá trị trung bình X = (X1 + X2 + + Xn) / n sẽ có những tính chất nhất định.
) → Φ(x) khi n → ∞ Nói cách khác, với n đủ lớn
Một số ví dụ
Trong ví dụ 2.2, chúng ta xem xét biến ngẫu nhiên nhị thức X với tham số n và p, trong đó p được cố định ở giá trị 0.1 Mục tiêu là phân tích ảnh hưởng của việc tăng n đến hàm mật độ xác suất (pmf) của X Nhắc lại, pmf nhị thức được xác định bởi công thức P(X = x) = (n x).
Sử dụng công thức p x (1 − p) n − x với các giá trị n = 10, 20, 50 và 100, chúng tôi đã tính toán và phác thảo hàm phân phối xác suất (pmf) của biến ngẫu nhiên X Hình 1 minh họa biểu đồ pmf, thể hiện dưới dạng hệ thống các hình chữ nhật, với chiều cao tương ứng với xác suất của các giá trị x.
Biểu đồ cho thấy rằng khi kích thước mẫu n nhỏ nhất (n = 10), nó nghiêng về một phía Khi n tăng lên, độ nghiêng của biểu đồ giảm dần, và khi n đạt giá trị lớn nhất là 100, biểu đồ có hình dạng giống như cái chuông, tập trung chủ yếu ở các giá trị 10 và 11, tương tự như đồ thị hàm mật độ xác suất của biến ngẫu nhiên chuẩn.
Hệ số độ nghiêng của phân phối nhị thức được tính bằng công thức √(1 − 2p) / √(np(1 − p)), và khi n tiến tới vô cùng với p không đổi, hệ số này sẽ bằng 0, cho thấy sự phân phối ngày càng gần như cân bằng Dù ban đầu có thể bị nghiêng nhiều khi n nhỏ, nhưng với n lớn, phân phối Bin(n, p) có thể được ước lượng bằng phân phối chuẩn N(Np, np(1 − p)) cho mọi p cố định Nếu p gần 0.5, biểu đồ sẽ trông bình thường ngay cả khi n nhỏ (n = 20); ngược lại, nếu p gần 0 hoặc 1, cần có n lớn hơn để tạo ra biểu đồ bình thường Minh họa thực nghiệm cho điều này sẽ được xác minh bởi một định lý dưới đây.
Ví dụ 2.3 trình bày tổng n biến mũ độc lập với kỳ vọng λ, được phân phối theo công thức G(n, λ) Trong đó, phân phối G có tham số n và λ Chúng ta sẽ thiết lập λ = 1 và thay đổi giá trị của n, cụ thể là n = 1, 3, 10, 50, và phác thảo công thức của G(n, λ) tương ứng.
Xấp xỉ phân phối chuẩn SVTH: Nguyễn Thị Thục Đoan
Khi n nhỏ, mật độ phân phối của biến nhị thức bị nghiêng, nhưng khi n tăng, nó dần trở thành hình chuông giống như mật độ chuẩn Cả ví dụ nhị thức và Gamma đều có điểm chung là biến Bin(n, p) trong ví dụ nhị thức là tổng của n biến Ber(p) độc lập, trong khi biến G(n, 1) trong ví dụ Gamma là tổng của n biến Exp(1) độc lập.
Khi số lượng biến ngẫu nhiên độc lập tăng lên, tổng của chúng sẽ có mật độ tương tự như mật độ chuẩn, điều này được định nghĩa bởi định lý giới hạn trung tâm Dù bạn thêm vào kiểu biến nào, việc kết hợp nhiều biến độc lập sẽ dẫn đến việc tổng thể hiện một mật độ chuẩn.
Xấp xỉ phân phối chuẩn của phân phối nhị thức
Định lý giới hạn trung tâm đóng vai trò quan trọng trong việc áp dụng cho phân phối nhị thức, cho phép chúng ta xấp xỉ các xác suất nhị thức phức tạp bằng cách sử dụng phân phối chuẩn Cụ thể, định lý Moivre-Laplace chỉ ra rằng với biến ngẫu nhiên X ∼ Bin(n, p) và với p cố định, chúng ta có thể đưa ra những giá trị chính xác cho sự xấp xỉ phân phối chuẩn của phân phối nhị thức.
Chứng minh rằng nếu X₁, X₂, , Xn là các biến ngẫu nhiên độc lập và có cùng phân phối xác suất Bernoulli với tham số p, thì tổng Sₙ = X₁ + X₂ + + Xn sẽ tuân theo định lý giới hạn địa phương Moivre-Laplace Định lý này áp dụng cho biến ngẫu nhiên X có phân phối nhị phân Bin(n, p) với mọi p cố định và k = 0, 1, 2, , n.
Định lý này được chứng minh thông qua sự xấp xỉ Stirling cho các giai thừa lớn, chỉ bao gồm các giá trị đại số Phần chứng minh này sẽ được bỏ qua.
2.3.1 Hệ số hiệu chỉnh liên tục Định lý giới hạn trung tâm demoivre-laplace cho chúng ta biết rằng nếu
X ∼ Bin(n, p), thì chúng ta có thể lấy xấp xỉ loại ≤ xác suất P (X ≤ k) khi:
Xấp xỉ phân phối chuẩn SVTH: Nguyễn Thị Thục Đoan
Khi áp dụng xấp xỉ chuẩn cho phân phối nhị thức, chúng ta sử dụng một phân bố liên tục để gần đúng phân bố rời rạc với các giá trị nguyên Chất lượng của xấp xỉ này có thể được cải thiện đáng kể bằng cách lấp đầy khoảng cách giữa các số nguyên liên tiếp Cụ thể, chúng ta xem xét biến cố X = x tương ứng với khoảng x − 1/2 ≤ X ≤ x + 1/2 Để xấp xỉ P(X ≤ k), chúng ta mở rộng miền biến cố tới k + 1/2 và thực hiện xấp xỉ P(X ≤ k).
Lấy xấp xỉ phân phối chuẩn với hệ số hiệu chỉnh liên tục là một phương pháp quan trọng trong việc tính toán xác suất nhị thức Việc áp dụng hệ số hiệu chỉnh liên tục là cần thiết để đảm bảo độ chính xác cao trong xấp xỉ phân phối chuẩn Dưới đây là các công thức xấp xỉ phân phối chuẩn với hệ số hiệu chỉnh liên tục để bạn tham khảo.
Chúng ta sẽ sử dụng hệ số hiệu chỉnh liên tục và định lý giới hạn địa phương để tìm các xấp xỉ phân phối chuẩn cho xác suất nhị thức trong một số ví dụ cụ thể.
Ví dụ 2.6 liên quan đến việc tung đồng xu, minh họa cho xấp xỉ phân phối chuẩn của xác suất nhị thức Khi tung một đồng xu 100 lần, ta cần xác định xác suất để có số mặt ngửa từ 45 đến 55 lần Ký hiệu X là số mặt ngửa trong 100 lần tung, với X ∼ Bin(n, p), trong đó n = 100 và p = 0.5 Chúng ta sẽ áp dụng phương pháp xấp xỉ phân phối chuẩn kết hợp với hệ số hiệu chỉnh liên tục để giải quyết bài toán này.
Khi tung đồng xu 100 lần, xác suất mặt ngửa nằm trong khoảng 45% đến 55% là khá cao nhưng không quá cao Để đạt được độ tin cậy 99% rằng xác suất mặt ngửa sẽ nằm trong khoảng này, chúng ta cần xác định số lần tung cần thiết Cụ thể, xác suất mặt ngửa sẽ nằm trong khoảng 45% đến 55% nếu số lần mặt ngửa đạt từ 0.45n đến 0.55n Sử dụng xấp xỉ phân phối chuẩn với hệ số hiệu chỉnh liên tục, chúng ta có thể tính toán số lần tung cần thiết để đảm bảo độ chính xác này.
− 1 (bởi vì với mọi số thực x, Φ(x) − Φ( − x) = 2Φ(x) − 1)
Bây giờ, từ một bảng tiêu chuẩn bình thường, chúng ta tìm thấyΦ(2.575) = 0.995 Vậy nên, chúng ta cân bằng
Để giải phương trình bậc hai 0.05x² − 1.2875x + 0.5 = 0, ta có x = 25.71 Khi bình phương giá trị này, ta được n ≥ (25.71)² = 661.04 Do đó, giá trị xấp xỉ của n trong n lần tung một đồng xu, phần trăm mặt ngửa sẽ dao động từ 45% đến 55% với xác suất 99%, tức là n = 662 Nhiều người thường ước lượng giá trị n cần cao hơn so với dự đoán ban đầu của họ.
Ví dụ 2.7 đề cập đến việc sử dụng xấp xỉ phân phối chuẩn để dự đoán người thắng trong các cuộc bầu chọn Phương pháp này áp dụng cho những xác suất nhị thức, giúp thiết kế các hệ thống bầu cử hiệu quả hơn.
Trong một cuộc bầu chọn với hai ứng cử viên A và B, tỷ lệ bầu chọn lần lượt là 52% cho A và 48% cho B Khi có 1400 người tham gia bỏ phiếu, việc dự đoán người thắng cuộc trở nên thú vị Để tính xác suất dự đoán đúng người chiến thắng, cần xem xét các yếu tố như số lượng phiếu bầu và sự phân bố của chúng Sự phân phối chuẩn có thể giúp chúng ta ước lượng khả năng A hoặc B sẽ giành chiến thắng trong cuộc bầu chọn này.
Ký hiệu X đại diện cho số lượng người bỏ phiếu cho A Cuộc bầu cử sẽ chính xác trong việc dự đoán người chiến thắng khi X vượt quá 700, dựa trên việc áp dụng xấp xỉ phân phối chuẩn hiệu chỉnh liên tục.
Khi khoảng cách ủng hộ giữa hai ứng cử viên đạt 4% hoặc hơn, một cuộc bầu chọn với 1500 lá phiếu có khả năng cao dự đoán đúng người thắng cuộc Tuy nhiên, để xác định chính xác khoảng cách ủng hộ giữa hai ứng cử viên, cần thực hiện các cuộc bầu chọn lớn hơn.
Trong ví dụ 2.8, chúng ta xem xét một cuộc bầu cử với hai ứng cử viên A và B, trong đó tỷ lệ người bầu cho A được ký hiệu là p Khi thực hiện một cuộc bầu cử với n cử tri, mục tiêu của chúng ta là xác định giá trị n cần thiết để với xác suất 95%, chúng ta có thể dự đoán chính xác giá trị của p với sai số tối đa là 2%.
Ký hiệu X đại diện cho số phiếu bầu của A trong tổng số n người tham gia Mục tiêu của chúng ta là ước tính giá trị chính xác của p = X/n và đảm bảo độ tin cậy của ước tính này.
Bây giờ, sử dụng xấp xỉ phân phối chuẩn cho phân phối nhị thức
Từ bảng tiêu chuẩn bình thường, Φ(z) − Φ( − z) ≥ 0.95 khi z = 1.96 Từ đó chúng ta đặt
Những ví dụ về khái quát định lý giới hạn trung tâm
Chúng tôi sẽ trình bày một số ví dụ áp dụng của định lý giới hạn trung tâm để ước lượng các xác suất liên quan đến tổng của các biến độc lập có phân phối chuẩn, không chỉ giới hạn ở tổng các biến Bernoulli.
Khi tung một xúc xắc đồng chất n lần, chúng tôi đã xác định được phân phối chính xác của tổng các giá trị bằng công thức Moivre, mặc dù điều này khá phức tạp Thay vào đó, chúng tôi sẽ áp dụng định lý giới hạn trung tâm để có được một xấp xỉ phân phối đơn giản hơn.
Cho X i , 1 ≤ i ≤ n là những lần tung riêng lẻ Sau đó, tổng n lần là S n =
X 1 + X 2 + ã ã ã + X n Giỏ trị trung bỡnh và phương sai của mỗi lần tung riờng lẻ là à = 3.5 và σ 2 = 2.92 Vậy nờn, với định lý giới hạn trung tõm,
Khi tung một con xúc xắc 100 lần, việc tính xác suất tổng số điểm đạt 300 hoặc cao hơn có thể gặp khó khăn nếu áp dụng công thức Moivre Thay vào đó, chúng ta có thể sử dụng phương pháp xấp xỉ phân phối chuẩn để đơn giản hóa quá trình tính toán.
Xấp xỉ phân phối chuẩn SVTH: Nguyễn Thị Thục Đoan hiệu chỉnh liên tục,
Ví dụ 2.15 đề cập đến việc làm tròn sai số, trong đó n là những số dương được làm tròn đến giá trị nguyên gần nhất Sai số làm tròn e i được xác định là chênh lệch giữa giá trị thật của X i và giá trị đã làm tròn của X i, với phân bố độc lập trong khoảng U [−0.5, 0.5] Mục tiêu là xác định xác suất tổng sai số đạt giá trị k Một ứng dụng thực tiễn là cơ quan thuế làm tròn số tiền hoàn trả tới số nguyên gần nhất, và chúng tôi phân tích các trường hợp khi tổng sai số dẫn đến tiền lỗ hoặc lời từ quá trình làm tròn này.
Giá trị trung bình và phương sai của một phân bố đều được xác định bởi các công thức tổng quát, trong đó giá trị trung bình là a = 0 và phương sai là σ² = 12 Dựa trên những công thức này, ta có thể thiết lập định lý giới hạn trung tâm, cho thấy tổng sai số S_n = ∑_{i=1}^{n} e_i sẽ có phân phối xấp xỉ chuẩn.
Chúng ta thấy được, vì bỏ đi sai số dương và âm, cơ quan thuế sẽ không mất hay kiếm được nhiều tiền từ việc làm tròn.
Trong ví dụ 2.16, chúng ta khám phá tổng của n biến đồng nhất độc lập trên khoảng [−0.5, 0.5] và sử dụng phân phối chuẩn để xấp xỉ Chúng ta có thể áp dụng phương pháp tương tự cho tổng các biến đồng nhất độc lập trên bất kỳ khoảng [a, b] nào Điều thú vị là tìm hiểu mật độ chính xác của tổng n biến đồng nhất trên khoảng [a, b] Bởi vì một biến đồng nhất trên khoảng [a, b] có thể được chuyển đổi sang khoảng [−1, 1] thông qua một phép biến đổi tuyến tính, chúng ta sẽ nghiên cứu mật độ chính xác của tổng n biến đồng nhất trên khoảng này Cuối cùng, chúng ta sẽ so sánh mật độ chính xác này với xấp xỉ phân phối chuẩn cho nhiều giá trị khác nhau của n.
Khi n = 2, mật độ tổng tạo thành một hình tam giác trong khoảng [−2, 2], biểu thị một đa thức từng phần theo tuyến tính Đối với n đồng nhất độc lập trong khoảng [−1, 1], mật độ tổng là một đa thức từng phần bậc n − 1, với các đường cong khác nhau trong đồ thị mật độ Công thức chính xác cho mật độ tổng là: f n (x) = 2^n (n - 1)!
Mặt khác, định lý giới hạn trung tâm lấy xấp xỉ mật độ tổng bởi N (
So sánh đồ thị của mật độ chính xác và mật độ xấp xỉ phân phối chuẩn cho nhiều giá trị của n rất thú vị Đặc biệt, khi n = 8, đồ thị cho thấy xấp xỉ phân phối chuẩn gần như chính xác, như được minh họa trong đồ thị 4-6.
Một người chạy nước rút có chiều dài sải chân trung bình là 140cm và độ lệch chuẩn là 5cm Để tính xác suất người này hoàn thành 100m, ta cần xem xét phân phối chiều dài sải chân của họ.
70 bước hoặc ít hơn ? 72 bước hoặc ít hơn ?
Trong nghiên cứu này, quãng đường mà người này chạy trong n bước được ký hiệu là X₁, X₂, , Xn, với giả định rằng các biến này là độc lập Mỗi giá trị Xᵢ có giá trị trung bình là 140 và phương sai σ² = 25 Theo định lý giới hạn trung tâm, tổng quãng đường chạy được trong n bước, Sₙ = X₁ + X₂ + + Xn, sẽ xấp xỉ phân phối N(140n, 25n) Cụ thể, người này có thể chạy 100m, tương đương với 10,000cm trong n bước, tức là Sₙ ≥ 10,000.
Do đó, xác suất chạy 100m trong 70 bước hoặc ít hơn là
= 1 − Φ(4.78) ≈ 0 Bây giờ tăng lên 72 bước, thì
Xấp xỉ phân phối chuẩn SVTH: Nguyễn Thị Thục Đoan
Hình 4: Hàm mật độ chính xác và xấp xỉ phân phối chuẩn với tổng của các phân phối đều, n = 2
Hình 5: Hàm mật độ chính xác và xấp xỉ phân phối chuẩn với tổng của các phân phối đều, n = 4
Hình 6: Hàm mật độ chính xác và xấp xỉ phân phối chuẩn với tổng của các phân phối đều, n = 8
Khi tung một xúc xắc đồng chất 20 lần, bạn sẽ nhận được quà nếu giá trị trung bình hình học của 20 lần tung vượt quá 3.5 Để tính xác suất chiến thắng, trước tiên cần hiểu rằng giá trị trung bình hình học của n số dương a1, a2, , an được định nghĩa là (a1 * a2 * * an)^(1/n) Việc xác định xác suất này sẽ giúp bạn biết được khả năng nhận quà trong trò chơi.
Chúng ta không thể xác định phân bố chính xác của sản phẩm khi tung 20 lần xúc xắc, và việc liệt kê tất cả các kết quả từ 1 đến 20 là không khả thi Vì vậy, cách duy nhất là sử dụng phương pháp xấp xỉ để tiếp cận vấn đề này.
Viết Y i ứng với lần tung thứ i , X i = log Y i , ta cólog(∏ n i=1 Y i )1/n
Cách sử dụng logarit trong bài toán này giúp chuyển đổi vấn đề về sản phẩm thành vấn đề về tổng Mỗi giá trị trung bình của X_i được tính bằng 1/6 [log 1 + log 2 + + log 6], dẫn đến kết quả là log 6! / 6 = 1.097 Tương tự, lần thứ hai của X_i cũng được tính theo cách tương tự.
= 1.568 Vậy nên, mỗi X i có phương sai σ 2 = 1.568 − 1.097 2 = 365 Bây giờ, với định lý giới hạn trung tâm,
Chỉ có khoảng 13% xác suất để bạn giành chiến thắng, điều này làm cho lời mời chào trở nên kém hấp dẫn Giá trị trung bình hình học của một tập hợp số dương luôn nhỏ hơn giá trị trung bình đơn giản của nó Nếu giá trị trung bình đơn giản của 20 lần tung vượt quá 3.5, thì xác suất chiến thắng của bạn sẽ đạt 50%.
Thời gian thanh toán tại siêu thị có giá trị trung bình là 4 phút, với sai số là 1 phút, minh họa cho cách áp dụng mạo hiểm trong định lý giới hạn trung tâm.
Xấp xỉ phân phối chuẩn SVTH: Nguyễn Thị Thục Đoan phải xếp hàng đợi đến lượt và phía trước bạn có 8 người nữa đang đứng chờ.
Từ những dữ kiện này, bạn có thể nói lên điều gì đó hữu ích về xác suất bạn có thể tính xong tiền trong vòng nửa giờ?
Xấp xỉ phân phối chuẩn của phân phối Poisson và Gamma
Một biến Poisson với tham số nguyên λ = n có thể được xem là tổng của n biến Poisson độc lập với giá trị trung bình 1 Tương tự, một biến Gamma với tham số α = n và λ có thể hiểu là tổng của n biến mũ độc lập với giá trị trung bình λ Do đó, định lý giới hạn trung tâm cho thấy rằng phân phối Poisson và phân phối Gamma sẽ xấp xỉ phân phối chuẩn khi n lớn Điều này vẫn đúng ngay cả khi tham số Poisson λ và tham số Gamma α không phải là số nguyên, miễn là λ hoặc α lớn Hình 7 minh họa cho điều này.
Kết quả có thể được xác minh thông qua hàm sinh moment (mgf) Định lý 2.20 và 2.21 cung cấp các kết quả xấp xỉ phân phối chuẩn cho phân phối Poisson và phân phối Gamma Cụ thể, theo định lý 2.20, nếu X tuân theo phân phối Poisson với tham số λ, thì khi λ tiến tới vô cùng, phân phối của X sẽ xấp xỉ phân phối chuẩn.
X ≈ N (λ, λ) Định lý 2.21 Cho X ∼ G(α, λ) , với mọi λ cố định, khi α → ∞ , P
Ví dụ 2.22 April nhận 3 cuộc gọi trung bình mỗi ngày ở nhà Chúng tôi muốn tìm xác suất cô ấy sẽ nhận trên 100 cuộc gọi trong tháng tiếp theo.
Giả sử X_i là số cuộc gọi mà April nhận vào ngày thứ i của tháng tới, tổng số cuộc gọi trong tháng sẽ được tính bằng ∑ n i=1 X_i, với n = 30 Nếu mỗi X_i tuân theo phân phối Poisson với giá trị trung bình là 3 và các ngày là độc lập, thì tổng số cuộc gọi ∑ n i=1 X_i sẽ phân phối theo Poisson với λ = 90 Theo định lý giới hạn, chúng ta có thể áp dụng hệ số hiệu chỉnh liên tục để tính toán kết quả.
= 1 − Φ(1.11) = 1 − 0.8665 = 0.1335Phép tính chính xác của xác suất này sẽ khá là vụng về vì λ lớn Đây là lợi thế khi sử dụng xấp xỉ phân phối chuẩn.
Xấp xỉ phân phối chuẩn SVTH: Nguyễn Thị Thục Đoan
Trong ví dụ về tai nạn hạt nhân, xác suất xảy ra tai nạn tại bất kỳ lò phản ứng hạt nhân nào trong một năm là 0.0005 Nếu một quốc gia có 100 lò hạt nhân, câu hỏi đặt ra là xác suất xảy ra ít nhất 6 tai nạn hạt nhân trong vòng 250 năm tới là bao nhiêu.
Gọi X ij là số tai nạn xảy ra trong năm thứ i tại lò thứ j Chúng ta cho rằng mỗi
Các biến ngẫu nhiên X ij tuân theo phân bố Poisson với tham số θ, được tính từ công thức e − θ = 0.9995, dẫn đến θ = − log(0.9995) = 0.0005 Giả sử các X ij độc lập, số tai nạn T trong 250 năm tại quốc gia này có phân bố Poisson P oi(λ), với λ = θ × 100 × 250 = 12.5 Chúng ta sẽ thực hiện xấp xỉ phân phối chuẩn với hệ số hiệu chỉnh liên tục.
Mặc dù xác suất xảy ra tai nạn tại một lò trong một năm nhất định là thấp, nhưng khi tích lũy theo thời gian, xác suất này sẽ gia tăng đáng kể.
Khoảng tin cậy cho giá trị trung bình của phân phối Poisson có thể được xác định bằng cách sử dụng xấp xỉ phân phối chuẩn Trong bài viết này, chúng ta sẽ xem xét cách áp dụng phương pháp này để tìm khoảng tin cậy cho giá trị trung bình của một phân phối Poisson, dựa trên ví dụ đã được trình bày trước đó.
Cho X ∼ P oi(λ) Từ định lý xấp xỉ phân phối chuẩn, nếu λ lớn, thì X−λ √ λ ≈
N (0, 1) Bây giờ, một biến tiêu chuẩn bình thường ngẫu nhiên Z có thuộc tính
Bây giờ phương trình bậc hai λ 2 − λ(2X + 1.96 2 ) + X 2 = 0 Lấy căn λ = λ ± =
Phương trình bậc hai λ 2 − λ(2X + 1.96 2 ) 2 + X 2 là ≤ 0 khi λ ở giữa hai giá trị λ ±
, nên ta có thể viết lại ( ∗ ) như sau
Trong thống kê, tham số λ chưa biết thường được ước tính dựa trên thông tin từ giá trị X Phép tính này cho thấy rằng với xác suất xấp xỉ 95%, λ sẽ nằm trong một khoảng giá trị nhất định.
3.69 + 3.84X ] Được gọi là một xấp xỉ 95% khoảng tin cậy cho λ Chúng ta thấy điều này được dẫn ra từ xấp xỉ phân phối chuẩn cho phân bố Poisson.
Đái tháo đường là nguyên nhân chính gây ra các bệnh về mắt, đặc biệt là bệnh màng lưới, dẫn đến tổn thương mạch máu võng mạc và sự phát triển của các mạch máu bất thường, có thể gây mù lòa Trung bình, thời gian để phát triển bệnh màng lưới sau khi mắc đái tháo đường là 15 năm, với độ lệch chuẩn là 4 năm.
Giả sử X đại diện cho khoảng thời gian từ khi mắc bệnh đái tháo đường đến khi phát triển bệnh lý màng lưới, chúng ta có thể mô hình hóa nó bằng công thức X ∼ G(α, λ).
Xấp xỉ phân phối chuẩn SVTH: Nguyễn Thị Thục Đoan có αλ = 15; λ √ α = 4 ⇒ √ α = 15
Trong nghiên cứu về bệnh đái tháo đường, chúng ta muốn xác định tỷ lệ phần trăm bệnh nhân phát triển bệnh màng lưới trong 20 năm Với giá trị α = 14.06 lớn, chúng ta có thể áp dụng xấp xỉ phân phối chuẩn để phân tích kết quả.
Ví dụ, dưới mô hình Gamma, gần 90% phát triển bệnh màng lưới trong 20 năm.
Các gợi ý thực tiễn về xấp xỉ phân phối chuẩn
Chúng tôi đã trình bày các xấp xỉ phân phối chuẩn cho các phân phối nhị thức, Poisson, đồng nhất và Gamma, cùng với các ví dụ cụ thể, thông qua định lý giới hạn trung tâm Đối với phân phối nhị thức và Poisson, chúng tôi đã đề cập đến các xấp xỉ có hoặc không có sự hiệu chỉnh liên tục Xấp xỉ phân phối chuẩn rất hữu ích cho các phân phối tiêu chuẩn khác, đặc biệt là những phân phối không có công thức phân tích dễ dàng, chẳng hạn như phân phối Beta Để hỗ trợ sinh viên và học viên, chúng tôi đã tổng hợp một tập hợp các công thức xấp xỉ phân phối chuẩn cho nhiều phân phối tiêu chuẩn Trong một số trường hợp, chúng tôi cung cấp hai công thức để người dùng có thể so sánh Những công thức này dựa trên nghiên cứu của nhiều tác giả về hiệu quả của chúng, có thể tham khảo thêm từ Abramowitz và Stegun (1970), Patel và Read (1996) Đối với xấp xỉ trong trường hợp nhị thức âm, chúng tôi đã sử dụng các mối quan hệ với phân phối nhị thức trong danh sách công thức của mình.
Mật độ Beta với các tham số số nguyên có mối liên hệ chặt chẽ với phân phối nhị thức Trong bài viết này, chúng tôi sẽ tập trung vào việc xử lý mật độ Beta với các thông số chung.
Hàm phân phối Số lượng xấp xỉ Công thức xấp xỉ
N B (r, θ) P (X ≤ m) Sử dụng công thức cho trường hợp nhị thức sử dụng k = m − r, n = m, p = 1 − θ