Tiểu luận các công thức tính xấp xỉ xác suất và ứng dụng
Trang 1Tiểu luận“Các công thức tính
xấp xỉ xác suất và ứng dụng”
NHÓM 3
Trang 2DANH SÁCH THÀNH VIÊN VÀ NHẬN XÉT CHI TIẾT HOẠT ĐỘNG NHÓM
1 Lê Thị Anh Thư: tìm lý thuyết + bài tập phần “Xấp xỉ phân phối siêu bội bằng phân
3 Võ Thị Thanh Thảo: tìm lý thuyết + bài tập phần “Xấp xỉ phân phối nhị thức bằng
phân phối chuẩn”
NX: Tích cực tham gia các hoạt động nhóm, gửi bài đúng hạn, tìm và dịch được nhiều tài liệu tiếng Anh hay, có nhiều hình ảnh minh họa
4 Phan Thị Ngọc Khuê: tìm lý thuyết + bài tập phần “Xấp xỉ phân phối Poisson bằng
phân phối chuẩn”
NX: Nhiệt tình tham gia trao đổi về bài tiểu luận, tuy chịu trách nhiệm tìm phần khó nhất trong 4 mục xấp xỉ nhưng vẫn gửi bài đúng hạn, nội dung ổn
5 Hồ Thị Quỳnh Trâm: tổng hợp 4 phần, sửa chữa, bổ sung thêm lý thuyết và bài tập
(lượng bổ sung thêm khoảng 30%)
NX: Tích cực tham gia xây dựng và hoàn thành bài tiểu luận, hoàn thành đúng thời hạn
đề ra, tìm được nhiều bài tập bằng tiếng Anh lẫn tiếng Việt
Trang 31 XẤP XỈ PHÂN PHỐI SIÊU BỘI BỞI PHÂN PHỐI NHỊ THỨC
2 Nếu lấy không hoàn lại (phép chọn không lặp) khi đó X~H(N, M, n)
Trường hợp n rất nhỏ so với N, sự khác biệt giữa cách lấy có hoàn lại và không hoàn lại
là không đáng kể và ta có thể dùng phân phối nhị thức để xấp xỉ phân phối siêu bội:
Bài 1: Một lô hàng chứa 10.000 sản phẩm, trong đó có 8.000 sản phẩm tốt và 2.000 sản
phẩm xấu Chọn ngẫu nhiên từ lô hàng ra 10 sản phẩm Tính xác suất chọn được 7 sản phẩm tốt
Bài giải
Gọi X là số sản phẩm tốt có trong 10 sản phẩm chọn ra Khi đó X có phân phối siêu bội
X ~ H(N, M, n) với N = 10.000; M = 8.000; n = 10 Vì n = 10 rất nhỏ so với N = 10.000 nên ta có thể xem như X có phân phối nhị thức X ~ B(n,p)
Bài 2: Một trường gồm có 10000 sinh viên, trong đó có 1000 học kém Một Đoàn
thanh tra đến trường, chọn ngẫu nhiên 100 sinh viên để kiểm tra Tính xác suất để có 20 sinh viên học kém
Trang 4C C C
Vì N = 10000 rất lớn, n = 100 << N= 10000 nên X xấp xỉ phân phối nhị thức: X ~ B(100; 0,1) với p =M/N=1000/10000=0.1
Bài 3: Một cây lan có 60000 cây sắp nở hoa, trong đó có 7000 cây hoa màu đỏ Chọn
ngẫu nhiên 20 cây lan trong vườn này Tính xác suất để chọn được 7 cây lan có hoa màu
Bài 4: Một công ty nhập 5000 thùng hóa chất, trong đó có 1000 thùng kém chất lượng
Công ty này phân phối ngẫu nhiên 10 thùng (không hoàn lại) cho 1 cửa hàng Tính xác suất để cửa hàng này nhận 3 thùng kém chất lượng
Bài giải
Gọi X là ĐLNN chỉ số thùng kém chất lượng trong số 10 thùng được chọn
Trang 5Ta có, X là phân phối siêu bội, X~H(5000, 1000, 10)
Bởi vì n=10 rất nhỏ so với N=5000 nên có thể xem X là một phân phối nhị thức với n=10
Bài 5: Một của hàng có 10000 con cá da trơn, trong đó có 1000 con cá tra Tính các suất
để khi chọn ngẫu nhiên 50 con cá thì được 10 con cá tra
Trang 62 XẤP XỈ PHÂN PHỐI NHỊ THỨC BẰNG PHÂN PHỐI POISSON
2.1 Cơ sở lý thuyết
Khi X B(n, p) mà n khá lớn và p rất nhỏ (p<0,1) ta có thể xem như X~ P(np) Tức là có xấp xỉ
( )( ) ; 1 ; 0,1, 2, , n
Bài 1: Trong một quy trình sản xuất kính, khi sản xuất ra những sản phẩm lỗi hoặc bị sủi
bọt, người ta vẫn đưa ra những sản phẩm không mong muốn này cho bộ phận tiếp thị Biết rằng, trung bình trong 1000 sản phẩm có 1 sản phẩm bị sủi bọt Xác suất để một mẫu ngẫu nhiên gồm 8000 sản phẩm có chứa ít hơn 7 sản phẩm bị sủi bọt
Bài 2: Một ống dệt có 1000 ống sợi Xác suất để trong một giờ máy hoạt động có 1 ống
sợi bị đứt là 0,2% Tìm xác suất để trong 1 giờ có không quá 2 ống sợi bị đứt
Trang 7không xảy ra với xác suất q = 1 – p = 0,998 Do đó, gọi X là tổng số ống sợi bị đứt trong một giờ hoạt động của máy thì X có phân phối nhị thức X ~ B(n, p) với n=1000; p=0,002
Vì n = 1000 khá lớn và p = 0,002 < 0,1 nên ta có thể xem X có phân phối Poisson:
X~P(a) với a=np=2
Xác suất để có không quá 2 ống sợi bị đứt trong một giờ hoạt động của máy là
Bài 3: Một lô hàng thịt đông lạnh đóng gói nhập khẩu chứa 0,6% bị nhiễm khuẩn Tính
xác suất để chọn ngẫu nhiễn 1000 gói thịt từ lô hàng này có
a Không quá 2 gói bị nhiễm khuẩn
b Đúng 40 gói bị nhiễm khuẩn
Bài giải
Gọi X là số gói thịt bị nhiễm khuẩn trong 1000 gói thịt được chọn ngẫu nhiên
Ta có X~B(1000, 0,006) Bởi vì n =1000 khá lớn và p=0,006<0,1 nên ta có thể xem như X~P(np), trong đó np=6 để tính gần đúng P(X 2)
a) Xác suất để có không quá 2 gói bị nhiễm khuẩn là:
Trang 8K
e K
e
) = 0,0902
Bài 5: Nước giải khát được chở từ Sài Gòn đi Vũng Tàu, mỗi xe chở 1000 chai bia Sài
Gòn, 2000 chai Coca và 800 chai nước trái cây Xác suất để một chai mỗi loại bị bể trên đường đi tương ứng là 0,2%; 0,11% và 0,3% Nếu không quá một chai bị bể thì lái xe được thưởng
a Tính xác suất có ít nhất một chai bia Sài Gòn bị bể
b Tính xác suất để lái xe được thưởng
c Lái xe phải chở ít nhất mấy chuyến để có ít nhất một chuyến được thưởng không nhỏ hơn 0,9
Bài giải
Gọi X1 là ĐLNN chỉ số chai bia Sài Gòn bị bể trong một chuyến Khi đó, X1 có phân phối nhị thức X1~(1000; 0,002) Vì n1 = 1000 khá lớn và p1 = 0,002 <0,1 nên ta có thể xem X1 có phân phối Poisson
X1 ~ P(a1) với a1 = n1p1 = 1000.0,002 = 2, nghĩa là X1 ~ P(2)
Hoàn toàn tương tự, gọi X2; X3 lần lượt là các ĐLNN chỉ số chai Coca, chai nước trái cây
bị bể trong 1 chuyến Khi đó X2; X3 có phân phối Poisson:
X2 ~ P(2000.0,0011) = P(2,2)
Trang 9X3 ~ P(800.0,03) = P(2,4) a) Xác suất có ít nhất một chai bia Sài Gòn bị bể là
0 2
b) Xác suất để lái xe được thưởng
Theo đề bài, lái xe được thưởng khi có không quá 1 chai bị bể; nghĩa là
Theo câu b; xác suất để lái xe được thưởng trong 1 chuyến là p=0,0103 Do đó theo công thức Bernoulli ta có:
0,1
1 – 0,98970,9897
Vậy lái xe phải chở ít nhất là 223 chuyến
Bài 6: Một máy tính gồm 1000 linh kiện, 800 linh kiện B và 2000 linh kiện C Xác suất
hỏng của 3 linh kiện đó lần lượt là 0,02%; 0,0125% và 0,005% Máy tính ngưng hoạt động khi số linh kiện hỏng nhiều hơn 1 Các linh kiện hỏng độc lập với nhau
a Tính xác suất để có ít nhất 1 linh kiện B bị hỏng
Trang 10b Tính xác suất để máy tính ngưng hoạt động
c Giả sử trong máy đã có 1 linh kiện hỏng Tính xác suất để máy tính ngưng hoạt động
Bài giải
Gọi X1 là ĐLNN chỉ số linh kiện A bị hỏng trong một máy tính Khi đó, X1 có phân phối nhị thức X1~(1000; 0,002) Vì n1 = 1000 khá lớn và p1 = 0,002 <0,1 nên ta có thể xem X1
có phân phối Poisson
X1 ~ P(a1) với a1 = n1p1 = 1000.0,002 = 2, nghĩa là X1 ~ P(2)
Hoàn toàn tương tự, gọi X2; X3 lần lượt là các ĐLNN chỉ số linh kiện B, linh kiện C bị hỏng trong một máy tính Khi đó X2; X3 có phân phối Poisson:
X2 ~ P(800.0,000125) = P(0,1)
X3 ~ P(2000.0,00005) = P(0,1) a) Xác suất có ít nhất một linh kiện B bị hỏng là
0 0,1
b) Xác suất để máy ngưng hoạt động
Theo đề bài, máy tính ngưng hoạt động khi số linh kiện hỏng nhiều hơn 1; nghĩa là
X1 + X2 + X3 1
Vì X1 ~ P(0,2); X2 ~ P(0,1); X3 ~ P(0,1) nên X1 + X2 + X3 ~ P(0,2+0,1+0,1) = P(0,4) Suy ra xác suất để máy ngưng hoạt động là
Trang 11P(X1 + X2 + X3 1) = 1 – P(X1 + X2 + X3 1) = 1– (P(X1 + X2 + X3 = 0)
0 0,40, 4
0!
Bài 7: Một trường cấp 3 có 900 học sinh Giả sử trong 1 năm trung bình mỗi học sinh
phải nằm ở trạm y tế của trường 1 ngày và khả năng bị bệnh của học sinh phân phối đều cho các ngày của năm Số giường của trạm ý tế tối thiểu là bao nhiêu để tỷ lệ không đủ giường cho người bệnh ít hơn 0,01?
m=7 (thử lần lượt từng giá trị đến khi m=7)
Vậy cần phải có tối thiểu 7 giường để tỷ lệ không đủ giường cho người bệnh ít hơn 0,01
Trang 133 XẤP XỈ NHỊ THỨC BẰNG PHÂN PHỐI CHUẨN
3.1 Cơ sở lý thuyết
Khi sử dụng phân phối nhị thức, nếu n khá lớn thì việc tính toán theo công thức Bernoulli
sẽ gặp khó khăn vì khi đó cỡ mẫu gia tăng chúng ta sẽ mất nhiều công sức hơn để tính số lúy thừa cao của p và q (tức là của (1-p)) và số hạng cần phải tính để cộng lại với nhau cũng nhiều hơn
Lúc đó nếu p nhỏ đến mức npnpq thì có thể dùng phân phối Poisson thay thế cho nhị thức Nhưng nếu p không nhỏ (p>0,1) thì không thể dùng phân phối Poisson để thay thế được Khi đó ta dùng phân phối chuẩn để thay thế cho phân phối nhị thức
Đôi khi rất khó để tính toán xác suất trực tiếp cho một nhị thức (n, p) biến ngẫu nhiên, X Chúng ta cần một bảng khác nhau cho mỗi giá trị của n, p Nếu chúng ta không có một bảng,việc tính toán trực tiếp có thể nhận được kết quả nhanh chóng như rất rườm rà
Ví dụ: Tính P (X ≤ 100) với n = 150, p = 0,35
Đối với các biến ngẫu nhiên bình thường thì việc tính xác là rất dễ dàng, chỉ cần tra bảng Tuy nhiên, chúng ta có thể xấp xỉ phân phối nhị thức bởi một phân phối chuẩn, với cách chọn μ và σ thích hợp
Để có thể hiểu được tại sao điều này có thể xảy ra, chúng ta hãy nghiên cứu quincunx Quincunx là một thiết bị được phát minh bởi Sir Francis Galton trong những năm 1800 trong đó cho thấy khi quan sát nhiều lần các biến nhị thức ngẫu nhiên cho ra một biểu đồ trông giống hình chuông, miễn là số các phép thử không phải là quá nhỏ
(Xem trang web quincunx tại: http://www.rand.org/methodology/stat/applets/clt.html) Nói chung sự phân phối của một biến nhị thức ngẫu nhiên có thể xấp xỉ chính xác bằng một biến ngẫu nhiên chuẩn miễn là np ≥ 5, nq ≥ 5, và giả định rằng sự liên tục được thực hiện để giải thích cho thực tế là chúng ta đang sử dụng một phân phối liên tục (phân phối chuẩn) để xấp xỉ một nhị thức rời rạc
Để xấp xỉ phân phối của X, chúng ta sẽ sử dụng phân phối chuẩn có nghĩa là μ = np, phương sai σ2
Trang 14Từ đó chúng ta rút ra được một biểu đồ dạng thanh của phân phối nhị thức với n,p cho trước xếp chồng lên các phân phối chuẩn để tạo xấp xỉ Lưu ý cách tăng lên khi p dịch chuyển ra khỏi 0,5
Nếu p(x) là phân phối Nhị thức và f(x) là mật độ chuẩn thì xấp xỉ là
1 2
1 2
1 2
b b
Trong sơ đồ trên, các thanh đại diện cho phân phối nhị thức
Trang 15với n = 10, p = 0,5 Đường cong chồng lên trên là mật độ chuẩn f (x) Gía trị chuẩn là μ =
Vì vậy, sử dụng xấp xỉ bằng phân phối chuẩn là cần thiết
Theo sơ đồ, diện tích mật độ chuẩn giữa 3,5 và 4,5 cho biết một xấp xỉ hợp lí cho chiều cao của thanh p(4) Điều này sẽ lý giải rõ ràng tại sao sự điều chỉnh liên tục là hữu ích
* CÔNG THỨC
Đối với ĐLNN X có phân phối nhị thức kiểu B(n,p), khi p không quá gần 0 hoặc 1 và n khá lớn, ta có thể xem X~N(np, npq), q=1-p; tức là có xấp xỉ
1 ( ) n k k n k (k np), 0,1, ,
Bài 1: Các hãng hàng không và khách sạn thường chấp thuận việc đặt phòng trước vượt
quá năng lực phòng nhằm giảm thiểu những tổn thất do đã đặt phòng nhưng không sử dụng Giả định rằng ghi nhận của một khách sạn dọc đường cho thấy, tính trung bình thì
có 10% khách sắp đến của họ sẽ không yêu cầu đặt chỗ trước Nếu khách sạn chấp nhận
Trang 16215 chỗ đặt trước và chỉ có 200 phòng trong khách sạn đó, thì xác suất mà tất cả khách đến yêu cầu một phòng sẽ nhận được phòng là bao nhiêu?
Bài giải
Theo đề, 10% khách sắp đến của họ sẽ không yêu cầu đặt chỗ trước, suy ra 90% khách đến của họ yêu cầu đặt chỗ trước Tức là giả sử nếu có 100 khách đặt chỗ trước thì chỉ có
90 khách đến nhận phòng
Gọi X là ĐLNN chỉ số khách đến yêu cầu một phòng, thì X ~ B(215; 0,9)
Vì n =215 khá lớn và p = 0,9 không quá gần 0 cũng không quá gần 1 nên có thể xấp xỉ X bằng công thức Laplace Trong đó np=215.0,9=193,5 và npq 4, 4
Xác suất để tất cả các khách đến yêu cầu một phòng sẽ nhận được phòng là
Bài 2: Một khách sạn nhận đặt chỗ của 425 khách hàng cho 400 phòng vào ngày 30
tháng 4 vì theo kinh nghiệm của những năm trước cho thấy tỷ lệ khách đặt chỗ nhưng không đến là 10% Tính xác suất:
Trang 17Bài 3: Sáng mai chuyến bay từ Ilberia đến Mandrid có thể chứa 370 hành khách Theo
kinh nghiệm trước đây, Ilberis biết rằng xác suất 1 hành khách giữ vé xuất hiện trong chuyến bay là 0,90 Họ đã bán 400 vé, cố tình đặt trước nhiều chuyến bay Làm thế nào Ilberia có thể tự tin rằng sẽ có hành khách không lên chuyến bay ( hoặc trì hoãn lại chuyến bay) ?
Bài 4: Một nhà máy có 3 phân xưởng cùng sản xuất ra một loại sản phẩm Tỷ lệ sản
phẩm loại II của các phân xưởng tương ứng là: 10%, 20%, 30% Từ một lô hàng 10000 sản phẩm (trong đó có 3000 sản phẩm của phân xưởng 1; 4000 sản phẩm của phân xưởng
2 và 3000 sản phẩm của phân xưởng 3); người ta chọn ngẫu nhiên ra 100 sản phẩm để kiểm tra Nếu thấy có không quá 24 sản phẩm loại II trong số 100 sản phẩm kiểm tra thì mua lô hàng đó Tìm xác suất để lô hàng được mua
Bài giải
Gọi X là số sản phẩm loại II có trong 100 sản phẩm lấy ra từ lô hàng để kiểm tra thì X có phân phối siêu bội
Trang 18Nhưng vì lấy ra 100 sản phẩm từ tập hợp có số lượng lớn là 10000, nghĩa là lấy ít từ một tập hợp có số lượng phần từ lớn nên ta có thể xem X là một phân phối nhị thức với n=100
Bài 5: Độ tin cậy của cầu chì điện là xác suất để cho cầu chì đó, được chọn ngẫu nhiên từ
số sản phẩm sản xuất ra, sẽ hoạt động được trong những điều kiện mà qua đó nó được thiết kế Một mẫu ngẫu nhiên gồm 1000 cầu chì được kiểm tra và x=27 cầu chì lỗi được quan sát Tính xác suất của việc quan sát thấy 27 hoặc nhiều hơn số cầu chì bị lỗi, bằng cách giả định rằng độ tin cậy của cầu chì là 0,98
Bài giải
Xác suất của việc quan sát một sản phẩm bị lỗi khi một cầu chì duy nhất được kiểm tra là
p = 0,02; khi đã biết độ tin cậy của cầu chì là 0,98
Gọi X là số cầu chì bị lỗi quan sát được trong 1000 cầu chì lấy ra thì X ~ B(1000; 0,02)
Vì n = 1000 lớn và n = 0,02 không quá gần 0 cũng không quá gần 1 nên ta có thể dùng công thức Laplace
Trang 19Bài 6: Trong một đợt thi tay nghề, mỗi công nhân dự thi sẽ chọn ngẫu nhiên một trong
hai máy và với máy đã chọn sản xuất 100 sản phẩm Nếu trong 100 sản phẩm sản xuất ra
có từ 80 sản phẩm loại I trở lên thì được nâng bậc thợ Giả sử đối với công nhân A, xác suất để sản xuất được sản phẩm loại I đối với 2 máy tương ứng là 0,7 và 0,9 Tính xác suất để công nhân A được nâng bậc thợ
Bài giải
Gọi A1, A2 tương ứng là các biến cố công nhân A chọn được máy thứ nhất; thứ hai; B là biến cố công nhân A được nâng bậc thợ Áp dụng công thức xác suất đầy đủ, ta có:
P(B) = P(A1) P(B/A1) + P(A2) P(B/A2)
Gọi X1, X2 tương ứng là các biến cố công nhân A chọn được máy thứ nhất, thứ hai
Bài 7: Một phân xưởng có 3 máy cùng sản xuất một loại sản phẩm Tỷ lệ sản phẩm loại
A của máy thứ nhất, thứ hai và thứ ba tương ứng là: 70%, 80%; 90% Các sản phẩm do phân xưởng sản xuất được đóng thành từng hộp, mỗi hộp có 10 sản phẩm (trong đó có 3 sản phẩm do nhà máy thứ nhất sản xuất; 4 sản phẩm do nhà máy thứ hai sản xuất và 3 sản phẩm do nhà máy thứ ba sản xuất Tiến hành kiểm tra lô hàng do phân xưởng sản xuất theo cách sau: Từ lô hàng chọn ngẫu nhiên không hoàn lại 100 hộp, rồi từ các hộp đã
Trang 20chọn lấy ra ngẫu nhiên 1 sản phẩm để kiểm tra Nếu thấy có 80 sản phẩm loại A trở lên thì nhận lô hàng Tính xác suất nhận lô hàng
Bài giải
Gọi B là biến cố nhận lô hàng
Gọi X là ĐLNN chỉ số sản phẩm loại A có trong 100 sản phẩm lấy ra kiểm tra
Theo đề, nếu có 80 sản phẩm loại A trở lên thì nhận lô hàng Suy ra, B(X80)
Gọi p là xác suất lấy được sản phẩm loại A khi lấy ngẫu nhiên một hộp ra để kiểm tra
Áp dụng công thức xác suất đầy đủ, ta tính được:
Bài 8: Sản phẩm của một nhà máy sau khi sản xuất xong được đóng thành từng hộp Mỗi
hộp có 10 sản phẩm Gọi X là số sản phẩm loại I có trong mỗi hộp Cho biết X có phân phối xác suất như sau:
Tiến hành kiểm tra 300 hộp theo cách sau:
Mỗi hộp chọn ngẫu nhiên ra 3 sản phẩm để kiểm tra Nếu thấy cả 3 sản phẩm lấy ra kiểm tra đều là loại I thì nhận hộp đó
a Tính xác suất để số hộp nhận được thuộc khoảng (170; 190)
b Tìm số hộp được nhận có khả năng lớn nhất
Bài giải