Bài giảng Lý thuyết xác suất thống kê toán - Chương 3: Các phân phối xác suất thông dụng cung cấp cho người học các kiến thức về các phân phối của đại lượng ngẫu nhiên rời rạc, phân phối của đại lượng ngẫu nhiên liên tục, phép toán trên các phân phối. Mời các bạn cùng tham khảo.
Trang 1CHƯƠNG 3 Các phân phối xác suất thông dụng
1 Các phân phối của ĐLNN rời rạc
1.1 Phân phối Nhị thức
1.1.1 Định nghĩa và các số đặc trưng
Trong một phép thử, biến cố A xảy ra với xác suất p Thực hiện phép thử n lần độc lập Gọi X là số lần biến cố A xảy ra thì X là ĐLNN Theo công thức Nhị thức:
P(X====k) ==== k k n k
n
C p q −−−−
Trang 2ĐLNN X có phân phối xác suất như trên được được gọi là ĐLNN có phân phối Nhị thức, ký hiệu X
~ B(n, p) Giá trị của X là 0, 1, , n
Đặt q = 1–p Ta tính được:
E(X) ====np Var(X)====npq (n++++1)p – 1 ≤≤≤≤ Mod(X) ≤≤≤≤ (n++++1)p Excel
Pk = P(X=k) =BINOMDIST(k, n, p, 0)
P(X ≤ k) =BINOMDIST(k, n, p, 1)
Trang 3Ví dụ
(1) Lấy ngẫu nhiên có hoàn lại 10 sản phẩm từ lô hàng có 80% chính phẩm Tính xác suất có 8 chính phẩm
Biến cố "lấy được chính phẩm" có xác suất p = 80% Số lần lặp lại phép thử là n = 10 Gọi X là số chính phẩm đếm được thì X ~ B(10; 80%) Xác suất cần tính là P(X=8) Theo công thức:
P(X=8) = 8
10
C (0,8)8(0,2)2 ≈ 30%
=BINOMDIST(8, 10, 80%, 0)
Trang 4(2) Cho X~B(79; 75%), Y~B(30; 25%) Tính Mod(X), Mod(Y)
Lưu ý Mod(X), Mod(Y) đều là số nguyên, ta có:
59≤ Mod(X)≤60 ⇒ Mod(X)=59 hay Mod(X) =60 6,75 ≤ Mod(Y) ≤ 7,75 ⇒ Mod(Y) = 7
(3) Một xạ thủ bắn trúng bia với xác suất 20% Tính xác suất xạ thủ này bắn vào bia 5 phát thì có không quá 2 phát trúng bia
Trang 51.1.2 Xấpxỉ Nhị thức bởi phân phối Chuẩn
Xét B(n, p) Nếu n đủ lớn và p không quá gần 0 hay 1 thì phân phối Nhị thức được xấp xỉ bởi phân phối Chuẩn có cùng kỳ vọng và phương sai:
−
Trang 6Ghi chú
"n đủ lớn và p không quá gần 0 hay 1" nghĩa là
p≥10%, q ≥10%, np>5 và nq>5
Trang 7Ví dụ
Xác suất chữa khỏi bệnh của một loại thuốc là 80% Có 1.000 người dùng thuốc này Tính xác suất có ít ra 790 người khỏi bệnh
Biến cố "một người khỏi bệnh sau khi dùng thuốc" có xác suất p = 85% Số người dùng thuốc là n = 1.000 Gọi X là số người khỏi bệnh sau khi dùng thuốc thì X~B(1.000; 80%) Xác suất cần tính là P(X ≥ 790)
Do n đủ lớn và p không quá gần 0 hay 1 nên B(1.000; 80%) ≈ N(800, 160)
Trang 81.2 Phân phối Poisson
1.2.1 Định nghĩa và các số đặc trưng
ĐLNN rời rạc X nhận các giá trị 0, 1, với P(X=k) định bởi công thức sau gọi là ĐLNN có phân phối Poisson với tham số λ (λ > 0), ký hiệu X ~ P(λ):
Trang 91.2.2 Xấp xỉ Nhị thức bởi phân phối Poisson
Xét ĐLNN B(n, p) Nếu n đủ lớn và p đủ nhỏ thì phân phối Nhị thức được xấp xỉ bởi phân phối Poisson có cùng kỳ vọng:
B(n, p) ≈ P(np) Ghi chú
"n đủ lớn và p đủ nhỏ" nghĩa là n≥20 và p≤5% Điều kiện khác là n≥30, p≤ 10% và np<10
Xấp xỉ sẽ tốt hơn nếu n≥100 và np<10
Trang 10Ví dụ
(1) Xác suất bị đứt trong 1 giờ hoạt động của một ống sợi là 0,2% Một máy dệt có 1.000 ống sợi Tính xác suất trong 1 giờ hoạt động của máy dệt có nhiều hơn 2 ống sợi bị đứt
Biến cố "ống sợi bị đứt" có xác suất p = 0,2% Gọi X là số ống sợi bị đứt trong số n = 1.000 ống sợi thì X~B(1.000, 0,2%) Xác suất cần tính là P(X > 2)
Do n đủ lớn và p đủ nhỏ nên ta xấp xỉ X bởi P(λ) với λ=1.000×0,2%=2 Ta có:
Trang 11(2) Một cộng đồng có khoảng 2% người sống đến 90 tuổi Cộng đồng hiện có 1.000 người
a) Tính trung bình cộng đồng có bao nhiêu người sống đến 90 tuổi?
b) Tính xác suất cộng đồng có đúng 20 người sống đến 90 tuổi
c) Tính xác suất cộng đồng có hơn 20 người sống đến 90 tuổi
(3) Trung bình một ngày bãi giữ xe nhận 600 xe Tính xác suất ngày mai có 700 xe được gởi tại bãi giữ xe này
Trang 121.3 Phân phối Siêu bội
1.3.1 Định nghĩa và các số đặc trưng
Xét tập hợp gồm N phần tử trong đó có M phần tử có tính chất tốt Gọi X là số phần tử có tính chất tốt có được khi lấy ngẫu nhiên n phần tử Xét k là một số nguyên từ max(0, n+M–N) đến min(M, n) Theo công thức Siêu bội ta có:
P(X====k) ==== kM n kN M
n N
C CC
Trang 13E(X) ==== np Var(X) ==== npq N n
N 1
−−−−
−−−− Mod(X) ==== (n 1)(M 1)
Trang 14Ví dụ
(1) Một công ty có 10 chiếc xe trong đó có 3 chiếc Lexus Điều ngẫu nhiên 4 chiếc xe để đi công tác Tính xác suất trong các xe đó có 1 chiếc Lexus
Mô hình Siêu bội
C C
C =50% =HYPGEOMDIST(1, 4, 3, 10)
Trang 15(2) Một lớp 70 sinh viên trong đó có 40 sinh viên giỏi Toán Chọn ngẫu nhiên 10 sinh viên Tính xác suất có ít ra là 3 sinh viên giỏi Toán
Trang 161.3.2 Xấp xỉ Siêu bội bởi phân phối Nhị thức
Nếu n đủ nhỏ so với N, M và p=M/N không quá gần 0 hay 1 thì ta có xấp xỉ:
H(N, M, n) ≈ B(n, M
N ) Ghi chú
"n đủ nhỏ so với N, M và p = M/N không quá gần 0 hay 1" nghĩa là 20n<N, 20n<M và 10% ≤p≤90%
* Khi n đủ nhỏ so với N thì việc lấy ngẫu nhiên có hoàn lại hoặc không hoàn lại là gần như nhau
Trang 17Ví dụ
(1) Lô hàng gồm 10.000 sản phẩm trong số có 9.000 chính phẩm Lấy ra 10 sản phẩm Tính xác suất trong các sản phẩm này có 9 chính phẩm
Mô hình Siêu bội
Gọi X là số chính phẩm có trong 10 sản phẩm lấy ra thì X ~ H(1.000, 900, 10) Cần tính P(X=9)
Vì n đủ nhỏ so với N, M và p=M/N không quá gần 0 hay 1 nên:
H(1.000,900, 10) ≈ B(10,900/1.000) = B(10, 90%) Vậy:
P(X=9) = 9
10
C (90%)9.(10%)1 ≈ 39%
Trang 18(2) Tỷ lệ phế phẩm của nhà máy là 90% Khách hàng lấy 100 sản phẩm để kiểm tra và nếu thấy có
ít ra là 93 chính phẩm thì đồng ý mua sản phẩm của nhà máy Tính xác suất khách hàng đồng ý mua
Gọi N, M là tổng số sản phẩm, chính phẩm của nhà máy, X là số chính phẩm có trong 100 sản phẩm lấy
ra kiểm tra thì X ~ H(N,M,100) Cần tính P(X ≥93)
Do số sản phẩm lấy ra kiểm tra đủ nhỏ so với số sản phẩm cũng như số chính phẩm của nhà máy và tỷ chính phẩm M/N=90% không quá gần 0 hay 1 nên:
H(N,M,100)≈B(100,90%)
Lại do n = 100 đủ lớn và p = 90% không quá gần 0 hay 1 nên B(100,90%) ≈ N(90, 9) Vậy:
Trang 202 Các phân phối của ĐLNN liên tục
2.1 Phân phối Chuẩn
Theo Liapunov, một ĐLNN X là tổng của một số lớn các ĐLNN độc lập và mỗi giá trị của ĐLNN thành phần có vai trò rất nhỏ trong tổng thì X sẽ là một ĐLNN có quy luật phân phối Chuẩn
Xét Z ~ N(0; 1), ta có P(–zα/2 < Z < zα/2) = 1–α Lấy α = 5% thì P(–1,96 < Z < 1,96) = 95%
Điều này chứng tỏ một ĐLNN có phân phối Chuẩn Chính tắc thì 95% giá trị của nó đều nằm trong khoảng (–1,96; 1,96) Nói theo nguyên lý Xác suất Lớn thì hầu hết giá trị của phân phối Chuẩn Chính tắc đều nằm trong khoảng (–1,96;1,96)
Trang 21Lấy α = 5% thì P(Z<1,6449) = 95%
Điều này chứng to một ĐLNN có phân phối Chuẩn Chính tắc thì 95% giá trị của nó đều nhỏ hơn 1,6449 Nói theo nguyên lý Xác suất Lớn thì hầu hết giá trị của phân phối Chuẩn Chính tắc đều nhỏ hơn 1,6449
Trang 22Ví dụ
Trọng lượng ghi trên bao bì của một bao cám là 5Kg với độ lệch chuẩn là 0,1Kg Biết trọng lượng của một bao cám lấy ngẫu nhiên là một ĐLNN có phân phối Chuẩn
a) Một bao cám được coi là đạt tiêu chuẩn nếu trọng lượng sai lệch không quá 200g trọng lượng ghi trên bao bì Tính tỷ lệ bao cám đạt tiêu chuẩn
b) Tính xác suất mua được một bao cám có trọng lượng từ 4,9Kg đến 5,2Kg
c) Trọng lượng tối đa của một bao cám trong số 95% bao cám nhẹ nhất là bao nhiêu?
Trang 23Gọi X là trọng lượng một bao cám (đơn vị: Kg) Theo giả thiết thì X ~ N(µ, σ2) với µ = 5, σ = 0,1
0,1
−) = Φ(2)– Φ(–1)=Φ(2)+Φ(1) ≈ 82%
=NORMDIST(5.2, 5, 1, 1) − NORMDIST(4.9, 5, 1, 1)
Trang 24c) Gọi x là trọng lượng cần tìm Trọng lượng của một bao cám trong số 95% bao cám nhẹ nhất có điểm−Z không quá 1,6449 Vậy:
x 5
0,1
−
= 1,6449 ⇒ x = 5,1645 Trọng lượng tối đa của một bao cám trong số 95% bao cám nhẹ nhất là 5,1645Kg
Trang 252.2 Phân phối Chi Bình phương
Xét X1, X2, …, Xk là các ĐLNN độc lập và có phân phối Chuẩn Chính tắc Đặt:
Trong ứng dụng, ta cần tìm phân vị mức α của phân phối Chi Bình phương χ2~χ2(k), tức là tìm χ2αsao cho P(χ2 >χ2
α) =α Giá trị χ2α được tìm bằng cách tra bảng kê số hoặc dùng hàm Excel =CHIINV(α, k)
Trang 262.3 Phân phối Student
Xét hai ĐLNN độc lập Z~N(0, 1), χ2~χ2(k) Đặt:
Trang 272.4 Phân phối Fisher–Snedecor
Xét hai ĐLNN độc lập là χ2(n1) và χ2(n2) Đặt:
F ==== 22 1 1
(n ) / n(n ) / n
χχχχχχχχ
F là ĐLNN liên tục gọi là có phân phối Fisher–Snedecor bậc tự do n1 và n2, ký hiệu F ~ F(n1, n2) Khi n2 > 4, ta tính được:
Trang 283 Phép toán trên các phân phối
3.1 Tổng của các phân phối Nhị thức
Nếu X1~B(n1, p), X2~B(n2, p), , Xm~B(nm, p) là các ĐLNN độc lập thì tổng của chúng sẽ là ĐLNN có phân phối Nhị thức với n=n1+n2 + +nm Tức là:
B(n1,p) +B(n2, p)+B(nm,p) = B(n1 +n2+ +nm, p)
Trang 29Ví dụ
Lô hàng I (II) gồm 500 (750) sản phẩm trong đó có 200 (300) sản phẩm tốt Mua 5 sản phẩm thuộc lô hàng I và 10 sản phẩm thuộc lô hàng II Tính xác suất mua được 8 sản phẩm tốt
Gọi X1 (X2) là số sản phẩm tốt mua được tại cửa hàng I (II) thì số sản phẩm tốt mua được là
Y = X1 + X2 Xác suất cần tính là P(X = 8) Ta có:
Trang 303.2 Tổng của các phân phối Poisson
Nếu X1~P(λ1), X2~P(λ2), , Xn~P(λn) là các ĐLNN độc lập thì tổng của chúng sẽ là ĐLNN có phân phối Poisson với tham số λ = λ1 + λ2 + + λn Tức là:
P(λ1) + P(λ2) + + P(λn) = P(λ1 + λ2 + + λn)
Trang 31Ví dụ
Máy dệt I (II, III) có 1.000 (1.500, 1.000) ống sợi Xác suất bị đứt một ống sợi trên máy I (II, III) là 0,2% (0,1%, 0,15%) Tính xác suất 3 máy dệt có từ
5 ống sợi các loại bị đứt trở lên
Gọi X1, X2, X3 là số ống sợi loại A, B, C bị đứt thì tổng số ống sợi bị đứt là Y= X1 + X2 + X3 Cần tính P(Y ≥ 5) Ta có:
X1~B(1000;0,2%) X2~B(1500;0,1%) X3~B(1000;0,15%)
Do n đủ lớn và p đủ nhỏ nên X1, X2, X3 được xấp xỉ:
X1≈P(2) X2≈P(1,5) X3 ≈P(1,5)
⇒ Y≈P(2) + P(1,5) + P(1,5) = P(2 + 1,5 + 1,5) = P(5) ⇒ P(Y ≥ 5) = 1 − P(Y ≤ 4) ≈ 56% =1 − POISSON(4, 5, 1)
Trang 323.3 Tổ hợp tuyến tính các phân phối Chuẩn
Nếu X1~N(µ1,σ ), X12 2~N(µ2,σ ), , X22 n~N(µn,σ ) là n2các ĐLNN độc lập thì tổ hợp tuyến tính của chúng
a1X1 + a2X2 + + anXn cũng là ĐLNN có phân phối Chuẩn với kỳ vọng là a1µ1 +a2µ2+ +anµn, phương sai là a12σ +12 a22σ +22 a+ 22σ Tức là: n2
a1N(µ1, σ ) + a12 2N(µ2, σ ) + + a22 nN(µn, σ ) n2
= N(a1µ1+a2µ2+ +anµn, a12σ +12 a22σ +22 a+ 22σ ) n2
Trang 33Ví dụ
Trong một nông trại, trọng lượng trung bình của một con gà trống là 1,5Kg với độ lệch chuẩn 100g, trọng lượng trung bình của một con gà mái là 1,7Kg với độ lệch chuẩn 200g Được biết, trọng lượng của một con gà được chọn ngẫu nhiên là ĐLNN có phân phối Chuẩn Một người mua 2 con gà trống và 3 con gà mái Tính xác suất trọng lượng của 5 con gà này không vượt quá 8,5Kg
Gọi X1 (X2) là trọng lượng (Kg) một con gà trống (mái) Trọnglượng 5 congà được mua làY =2X1+3X2 Cần tính P(X ≤ 8,5)
Trang 34Theo giả thiết X1~N(1,5; 0,12), X2~N(1,7; 0,22) nên
Y = 2X1 + 3X2 là phân phối Chuẩn với kỳ vọng và phương sai là: