Bài toán dẫn đến phân phối Poisson: Gọi X là số lần xuất hiện biến cố A tại những thời điểm ngẫu nhiên trong khoảng thời gian ?1; ?2 thoả mãn: + Số lần xuất hiện A trong khoảng thời gia
Trang 1Chương 3 Một số quy luật phân phối xác suất
thông dụng
1. Quy luật phân phối nhị thức
2. Quy luật phân phối Poisson
3. Quy luật phân phối siêu bội
4. Quy luật phân phối đều
5. Quy luật phân phối mũ
6. Quy luật phân phối chuẩn
7. Một số quy luật phân phối khác
Trang 2§1 Quy luật phân phối nhị thức – B(n; p)
Trang 32 Các tham số đặc trưng
Nếu 𝑋~𝐵(𝑛; 𝑝) thì:
+) 𝐸 𝑋 = 𝑛𝑝,
+) 𝑉 𝑋 = 𝑛𝑝𝑞, với 𝑞 = 1 − 𝑝 +) 𝑛𝑝 − 𝑞 ≤ 𝑚0 ≤ 𝑛𝑝 + 𝑝
Nhận xét: Nếu gọi 𝑋 = “số lần xuất hiện biến cố A”
trong 𝑛 phép thử Becnulli mà 𝑃 𝐴 = 𝑝 trong mỗi phép thử thì 𝑋~𝐵(𝑛; 𝑝)
Trang 4Ví dụ 1: Trong một hòm có chứa 7 linh kiện loại 1 và 3 linh kiện loại 2 Lấy có hoàn lại ra 5 sản phẩm và gọi X
là số linh kiện loại 1 được lấy ra
a) Nêu quy luật phân phối xác suất của X
b) Tính P(X < 3)
c) Tính P(X = 4) trong trường hợp lấy không hoàn lại
Trang 5Ví dụ 2: Một người mỗi ngày đi bán hàng ở 5 chỗ khác nhau Việc bán được hàng ở mỗi nơi là độc lập nhau với xác suất bán được hàng ở mỗi nơi là 0,3
a) Tìm xác suất người đó bán được hàng trong 1 ngày b) Mỗi năm người đó đi bán hàng 300 ngày, tìm số
ngày bán được hàng nhiều khả năng nhất trong năm
Trang 6§2 Quy luật phân phối Poa-sông – P( λ)
𝑷 𝑿 = 𝒙 = 𝒆−𝝀 𝝀
𝒙
𝒙! , 𝒙 = 𝟎, 𝟏, 𝟐, …
Kí hiệu: 𝑿~𝑷 𝝀
Trang 8Bài toán dẫn đến phân phối Poisson: Gọi X là số lần xuất hiện biến cố A tại những thời điểm ngẫu nhiên trong khoảng thời gian (𝑡1; 𝑡2) thoả mãn:
+) Số lần xuất hiện A trong khoảng thời gian (𝑡1; 𝑡2)
không ảnh hưởng tới xác suất xuất hiện A trong các khoảng thời gian kế tiếp
+) “Cường độ” xuất hiện A là không thay đổi, nghĩa là
số lần A xuất hiện trung bình trong khoảng thời gian (𝑡1; 𝑡2) tỉ lệ với độ dài khoảng đó
Chứng minh được 𝑋~𝑃(𝜆) với 𝜆 = 𝑐(𝑡2 − 𝑡1), hằng số 𝑐
được gọi là cường độ xuất hiện của A
Trang 9Ví dụ 1: Ở một tổng đài Bưu điện, các cú điện thoại gọi đến xuất hiện ngẫu nhiên, độc lập với nhau với tốc
độ trung bình 2 cuộc gọi trong 1 phút Tìm xác suất:
a) Có đúng 5 cuộc gọi trong 2 phút
b) Không có cú điện thoại nào trong khoảng thời
gian 30 giây
c) Có ít nhất 1 cú điện thoại trong khoảng thời gian
10 giây
Đ/s: a) ≈ 0,1563 b) ≈ 0,3679 c) ≈ 0,2835
Trang 104 Xấp xỉ phân phối nhị thức bởi phân phối Poisson
Phân bố Poisson là giới hạn của phân bố nhị thức với các tham số 𝒏 và 𝒑 = 𝝀/𝒏 Tức là:
Trang 11Trong trường hợp số phép thử 𝑛 lớn (𝑛 ≥ 20), xác
suất 𝑝 nhỏ (𝑝 ≤ 0,1 sao cho 𝑛𝑝 ≈ 𝑛𝑝𝑞) và tích 𝑛𝑝 = 𝜆 không đổi, các xác suất của phân phối nhị thức có thể tính xấp xỉ như sau:
𝑷 𝑿 = 𝒙 = 𝑪𝒏𝒙𝒑𝒙(𝟏 − 𝒑)𝒏−𝒙≈ 𝝀
𝒙
𝒙! 𝒆−𝝀,
𝒙 = 𝟎, 𝟏, 𝟐, …
Trang 12Đồ thị minh họa các phân phối P(3,5) và B(35; 0,1)
Trang 13§3 Quy luật phân phối siêu bội – H(N, M, n)
Trang 14Định nghĩa: Biến ngẫu nhiên X có thể nhận giá trị trong
tập 𝒎𝒂𝒙 𝟎, 𝒏 + 𝑴 − 𝑵 , … , 𝒎𝒊𝒏(𝒏, 𝑴) với các xác
suất được cho bởi công thức (1) được gọi là có phân
phối siêu bội (siêu hình học) với các tham số N, M và n
Kí hiệu: 𝑿~𝐇(𝐍, 𝐌, 𝐧) (H – Hypergeometric)
Trang 152 Các tham số đặc trưng
Nếu biến ngẫu nhiên X ~ H(N, M, n) thì:
+) 𝐸 𝑋 = 𝑛𝑝, với 𝑝 = 𝑀
𝑁 +) 𝑉 𝑋 = 𝑛𝑝𝑞 𝑁 − 𝑛
𝑁 − 1 , với 𝑞 = 1 − 𝑝
Trang 16Ví dụ: Trong 60 cây vàng có 3 cây không đạt tiêu chuẩn
Từ đó rút ngẫu nhiên đồng thời 10 cây để kiểm tra Tìm trung bình số cây không đạt tiêu chuẩn trong 10 cây này
Trang 173 Xấp xỉ quy luật phân phối siêu bội bởi quy luật nhị thức
công thức xấp xỉ trên khá tốt khi 𝑛 < 0,05𝑁
• Khi N khá lớn so với n Việc lấy ra n phần tử từ tổng thể N phần tử theo phương thức có hoàn lại hay không hoàn lại được coi là như nhau
Trang 18§4 Quy luật phân phối đều – U(a; b)
𝟎, nếu 𝒙 ∉ (𝒂; 𝒃)
Kí hiệu: X ~ U(a; b) (U – Uniform)
Trang 192 Các tham số đặc trưng
Nếu biến ngẫu nhiên X ~ U(a; b) thì:
+) 𝐸 𝑋 = 𝑎 + 𝑏
2 +) 𝑉 𝑋 = (𝑏 − 𝑎)
2
12
Nhận xét: Trong một số lý thuyết kết luận thống kê
người ta thường xuất phát từ quy tắc sau đây: Nếu ta
không biết gì về giá trị của tham số cần ước lượng thì mỗi giá trị có thể có của tham số đó là đồng khả năng Điều đó dẫn đến việc quan niệm tham số cần ước lượng như một biến ngẫu nhiên tuân theo quy luật phân phối đều
Trang 20Ví dụ: Khi thâm nhập vào một thị trường mới, doanh nghiệp không thể khẳng định được một cách chắc chắn doanh số hàng tháng có thể đạt được sẽ là bao nhiêu mà chỉ dự kiến được rằng doanh số tối thiểu sẽ là 20 triệu đồng/tháng và tối
đa là 40 triệu đồng/tháng
Tìm xác suất để doanh nghiệp đạt được doanh
số tối thiểu là 35 triệu đồng/tháng
Trang 21§5 Quy luật phân phối mũ – E(λ)
1 Định nghĩa
Biến ngẫu nhiên liên tục X được gọi là có phân phối
mũ (lũy thừa) với tham số λ (λ > 0) nếu hàm mật độ xác suất của nó có dạng:
𝒇 𝒙 = 𝟎, nếu 𝒙 < 𝟎
𝝀𝒆−𝝀𝒙, nếu 𝒙 ≥ 𝟎
Kí hiệu: X ~ E(λ) (E – Exponential)
Trang 23
2 Các tham số đặc trưng
Nếu biến ngẫu nhiên X ~ E(λ) thì:
+) 𝐸 𝑋 = 1
𝜆 , +) 𝐸 𝑋2 = 2
𝜆2 do đó V(X)= 1
𝜆2
Phân bố mũ có thể được dùng làm mô hình xác suất
cho những biến ngẫu nhiên kiểu “khoảng cách giữa
hai lần xuất hiện”, ví dụ như: khoảng cách giữa hai
cú điện thoại gọi đến, khoảng cách giữa hai gen đột
biến kế tiếp tên một giải DNA, v.v
Trang 24Ví dụ: Tuổi thọ X (tính bằng năm) của một mạch điện
tử trong máy tính là biến ngẫu nhiên có phân phối
mũ, trung bình 6,25 năm Thời gian bảo hành của mạch điện tử là 5 năm
Tính tỉ lệ mạch điện tử bán ra phải thay thế
Trang 25
§6 Quy luật phân phối chuẩn – N(μ; σ2)
1 Định nghĩa
Biến ngẫu nhiên X được gọi là có phân phối chuẩn
với các tham số μ và σ 2 (σ > 0) nếu hàm mật độ xác suất của nó có dạng:
𝒇 𝒙 = 𝟏
𝝈 𝟐𝝅 𝒆−(𝒙−𝝁)𝟐𝟐𝝈𝟐 , ∀𝒙 ∈ 𝑹
Kí hiệu: X ~ N(μ; σ 2 ) (N – Normal)
Trang 26Đồ thị hàm mật độ của phân bố chuẩn
Trang 272 Các tham số đặc trưng
Nếu X ~ N(μ; σ2) thì: +) E(X) = μ
+) V(X) = σ2 +) m = m0 = μ
Trang 30Ví dụ 1: Thời gian X (tính bằng phút) của một khách
hàng chờ để được phục vụ tại một quầy hàng là biến ngẫu nhiên với X ~ N(4,5; 1,21)
a) Tính tỉ lệ khách hàng phải chờ để được phục vụ
từ 3,5 phút đến 6 phút; quá 6 phút
b) Thời gian phải chờ tối thiểu là bao nhiêu, nếu không để quá 5% khách hàng phải chờ phục vụ vượt quá thời gian đó
Trang 314 Quy luật phân phối chuẩn hóa
Định nghĩa: Biến ngẫu nhiên U ~ N(0; 1) được gọi là
có phân phối chuẩn hóa
Hàm mật độ xác suất của biến ngẫu nhiên U có phân
phối chuẩn hóa là:
Trang 32Giá trị tới hạn chuẩn mức α của biến ngẫu nhiên U ~ N(0; 1), kí hiệu là 𝒖𝜶, là giá trị thỏa mãn:
Nhận xét: +) 𝑢1−𝛼 = −𝑢𝛼,
+) Φ0 𝑢𝛼 = 0,5 − 𝛼
𝑷 𝑼 > 𝒖𝜶 = 𝜶
Trang 34Quy tắc: Nếu quy luật phân phối xác suất của biến ngẫu nhiên được nghiên cứu chưa biết, song nó thỏa mãn (1) hoặc (2) thì có thể xem như biến
ngẫu nhiên đó có phân phối xấp xỉ chuẩn
Trang 356 Phân phối xác suất của tổng các biến ngẫu nhiên độc lập tuân theo cùng một quy luật
• Giả sử các biến ngẫu nhiên 𝑋1, 𝑋2, … , 𝑋𝑛 độc lập
với nhau và 𝑿𝒊~𝑵 𝝁𝒊; 𝝈𝒊𝟐 , 𝑖 = 1, … , 𝑛 Khi đó biến ngẫu nhiên
• Nếu 𝑛 biến ngẫu nhiên 𝑋1, 𝑋2, … , 𝑋𝑛 độc lập và
cùng tuân theo một quy luật phân phối xác suất nào
đó thì biến ngẫu nhiên
Trang 367 Xấp xỉ quy luật nhị thức, quy luật Poisson bởi quy
luật phân phối chuẩn
a) Xấp xỉ quy luật nhị thức bởi quy luật chuẩn
Giả sử X ~ B(n; p) với 𝑛, 𝑝 thỏa mãn:
𝑛 > 5 và 1𝑛 1−𝑝𝑝 − 1−𝑝
𝑝 < 0,3 Khi đó:
Trang 37Ví dụ 2: Xác suất để sản phẩm sau khi sản xuất
không được kiểm tra chất lượng bằng 0,2 Tìm xác suất để trong 400 sản phẩm được sản xuất ra có:
a) 80 sản phẩm không được kiểm tra chất lượng b) Từ 70 đến 100 sản phẩm không được kiểm tra
chất lượng
Trang 38Phân phối xác suất của biến ngẫu nhiên nhị thức 𝐵(𝑛, 𝑝) càng gần với phân phối chuẩn khi 𝑛 lớn
Trang 39b) Xấp xỉ quy luật Poisson bởi quy luật chuẩn
Nếu X ~ P(λ) với λ > 20 thì có thể xem là X phân phối xấp xỉ chuẩn với μ = λ và σ2 = λ
Trang 40Phân bố chuẩn là một trong những phân phối quan trọng nhất, vì nhiều phân bố xác suất trong thực tế có dáng điệu khá giống phân bố chuẩn, chẳng hạn, kích thước của các chi tiết do các nhà máy sản xuất ra (nếu quá trình sản xuất diễn ra bình thường), năng suất của cùng một loại cây trồng tại các thửa ruộng
chỉ số IQ (chỉ số trí tuệ), một số chỉ tiêu về sinh lí của những người cùng giới (chẳng hạn chiều cao, vòng ngực, chiều dài cánh tay, v.v ),
Trang 41§7 Một số quy luật phân phối khác
1 Quy luật phân phối khi bình phương - 𝝌𝟐 𝒏
Định nghĩa: Biến ngẫu nhiên χ2 được gọi là có quy luật phân phối khi bình phương với 𝑛 bậc tự do nếu hàm mật độ xác suất có dạng sau
Trang 42Các tham số đặc trưng: E(χ2) = n; V(χ2) = 2n
Giá trị tới hạn mức α của phân phối này là số 𝜒𝛼2(𝑛)
thỏa mãn: 𝑃 𝜒2 > 𝜒𝛼2 𝑛 = 𝛼
Trang 432 Quy luật phân phối Student - 𝐓 𝒏
Định nghĩa: Biến ngẫu nhiên T được gọi là có
phân phối Student với 𝑛 bậc tự do nếu hàm mật độ xác suất của nó có dạng:
𝑓 𝑥 =
0 với 𝑥 ≤ 0 1
𝜋𝑛 .
Γ 𝑛 + 12
𝑥2𝑛
với 𝑥 > 0
Trang 44
Các tham số đặc trưng: E(T) = 0 (bậc tự do n > 1);
V(T) = n−2 (với n > 2) n
mãn 𝑃 𝑋 > 𝑡𝛼𝑛 = 𝛼, có tính chất:
𝑡𝛼(𝑛) = −𝑡1−𝛼(𝑛)
Trang 45Phân bố Poisson mang tên của nhà toán học và vật lí người Pháp Siméon Denis Poisson (1781 – 1840) Trong lí thuyết xác suất, Poisson được biết đến nhiều
nhất bởi phân bố Poisson và quá trình Poisson (một
quá trình ngẫu nhiên ứng với phân bố này) Tên gọi
luật số lớn (ở chương 5) cũng là do Poisson đặt ra
Trang 46Phân phối 𝜒2 𝑛 do Karl Pearson đưa ra năm 1900
Karl Pearson (1857 – 1936), người Anh, được coi là một trong những cha tổ của ngành thống kê toán học Pearson là người lập ra khoa thống kê đầu tiên, năm 1911, tại University College London Nhiều khái niệm cơ bản trong xác suất thống
kê là dựa trên công trình của Pearson, trong đó có: hệ số tương quan, hồi quy tuyến tính, phân loại các phân bố xác suất, kiểm định khi bình phương
Trang 47Phân phối T được nhà thống kê học người Anh, ông William Sealy Gosset (1876 – 1937) đưa ra năm 1908 Khi đó ông đang làm việc cho hãng bia Guinness ở Dublin, do nguyên tắc giữ bí mật của hãng, Gosset không được phép kí tên các bài báo của mình với tên thật, nên lấy bút danh là Student