Bài giảng Xác suất thống kê - Chương 3: Quy luật phân phối xác suất thường gặp cung cấp cho người học các kiến thức: Biến ngẫu nhiên rời rạc, biến ngẫu nhiên liên tục, định lý giới hạn trung tâm. Mời các bạn cùng tham khảo nội dung chi tiết.
Trang 1QUY LUẬT PHÂN
PHỐI XÁC SUẤT
THƯỜNG GẶP
1
2
3.1 Biến ngẫu nhiên rời rạc
• Luật “không - một” A(p) Bernoulli
• Luật nhị thức B(n,p) Binomial
• Luật Poisson P() Poisson
• Luật siêu bội H(N,M, n) Hypergeometric
3
Phân phối Không – một
• Ký hiệu khác: X~A(p)
• Còn gọi là phân phối Bernoulli
• Bảng ppxs:
• Tham số đặc trưng:
4
Phân phối Nhị thức (Binomial)
• Kí hiệu: X~B(n,p)
• Hàm khối xác suất:
• x={0,1,2,3…n}
• n,p gọi là các tham số (parameter)
5
k x n x
n
Khi nào có phân phối B(n,p)
• Định nghĩa Một biến ngẫu nhiên rời rạc X gọi là có
phân phối Nhị thức nếu:
• Một thí nghiệm hoặc một phép thử được thực hiện trong cùng một điều kiện đúng n lần
• Trong mỗi phép thử chỉ có 2 biến cố Một biến cố gọi là
“thành công” và một biến cố “thất bại”
• n phép thử độc lập nhau
• Xác suất thành công, ký hiệu p, là như nhau trong mỗi phép thử Xác suất thất bại là q=1-p
• Biến ngẫu nhiên X = số lần thành công trong n phép thử
6
Trang 2• Một đồng xu được chế tạo sao cho xác suất xuất
hiện mặt ngửa mỗi lần tung là 70% Tung đồng xu
100 lần, theo các cách y hệt nhau Gọi X là số lần
đồng xu xuất hiện mặt ngửa X có phải là biến
ngẫu nhiên có phân phối Nhị thức?
• Một giảng viên đại học lấy mẫu ngẫu nhiên các sinh
viên cho đến khi anh ta tìm thấy bốn sinh viên tình
nguyện đi mùa hè xanh Đặt X là số sinh viên được
lấy mẫy X có phải là biến ngẫu nhiên có phân phối
nhị thức không?
7
• Một cuộc khảo sát với cỡ mẫu n = 1000 người Mỹ trưởng thành ngẫu nhiên được tiến hành Đặt X là
số người sở hữu một chiếc xe thể thao đa dụng (SUV) trong mẫu X có phải là biến ngẫu nhiên nhị thức không?
• Một nhân viên kiểm soát chất lượng điều tra một
lô gồm 15 sản phẩm Anh ta lấy mẫu ngẫu nhiên (không thay thế) 5 sản phẩm từ lô Đặt X bằng số sản phẩm đạt yêu cầu X có phải là biến ngẫu nhiên nhị thức không?
8
Effect of n and p on Shape
9
For small p and small n,
the binomial distribution
is what we call skewed
right
For large p and small n,
the binomial distribution
is what we call skewed
left
Effect of n and p on Shape
10
For p = 0.5 and large and
small n, the binomial distribution
is what we call symmetric.
For small p and large n, the
binomial distribution
approaches symmetry.
Tham số đặc trưng
• Cho bnn X~B(n,p) Ta có:
11
)
)
Ví dụ 3
• Xác suất để 1 bệnh nhân được chữa khỏi khi điều trị một bệnh hiếm gặp về máu là 0,4 Nếu 15 người đồng ý chữa trị thì xác suất:
• A) Có ít nhất 10 người khỏi
• B) Có từ 3 đến 8 người khỏi
• C) Có đúng 5 người khỏi
Là bao nhiêu?
12
Trang 3Ví dụ 4
• Một chuỗi cửa hàng bán lẻ lớn mua một loại thiết
bị điện tử về để bán Nhà sản xuất cho biết tỷ lệ bị
hư hỏng của loại thiết bị này là 3%
a) Bộ phận kiểm tra lấy ngẫu nhiên 20 thiết bị từ lô
hàng được giao Xác suất có ít nhất 1 thiết bị
hỏng là bao nhiêu?
b) Giả sử cửa hàng nhập 10 lô hàng 1 tháng và với
mỗi lô hàng đều được kiểm tra ngẫu nhiên 20
thiết bị Xác suất có đúng 3 lô hàng có chứa ít
nhất 1 thiết bị hỏng trong số 20 thiết bị được
kiểm tra?
13
Ví dụ 5
• Có giả thiết cho rằng 30% các giếng nước ở vùng nông thôn có tạp chất Để có thể tìm hiểu kỹ hơn người ta đi xét nghiệm một số giếng (vì không đủ tiền xét nghiệm hết)
• A) Giả sử giả thiết trên đúng, tính xác suất có đúng
3 giếng có tạp chất
• B) Xác suất có nhiều hơn 3 giếng có tạp chất?
• C) Giả sử trong 10 giếng đã kiểm tra thì có 6 giếng
có tạp chất Có thể kết luận gì về giả thiết trên?
14
Phân phối siêu bội
• Định nghĩa Nếu ta chọn ngẫu nhiên n phần tử,
không hoàn lại, trong một tập hợp gồm N phần tử
với:
• NAphần tử thuộc một loại, giả sử loại A
• Và N- NAphần tử còn lại thuộc loại khác
• Gọi X là số phần tử loại A trong số n phần tử được
chọn Khi này PDF của X dạng
15
A. A
x n x
N N N n N
p x
C
Phân phối siêu bội
• Các giá trị của bnn X thỏa mãn:
• Biến ngẫu nhiên X gọi là có phân phối siêu bội
• Ký hiệu: X~H(N,NA,n)
16
) )
A
A
i x n
ii x N iii n x N N
x n x
N N N n N
p x
C
Các tham số đặc trưng
Trong đó:
17
1
N
A
N
N
ModX
• Ta có:
• Với
• Công thức trên cho ta khoảng chứa ModX
18
k ModX k
0
1 2
A
k
N
Trang 4• Một hồ có 600 con cá, 80 con được đánh dấu bởi
các nhà khoa học Một nhà nghiên cứu chọn ngẫu
nhiên 15 con từ hồ Hãy tìm công thức cho hàm
P.M.F của biến ngẫu nhiên X, với X là số cá được
đánh dấu có trong mẫu lấy ra
19
• Giả sử có 5 người, trong đó có bạn và một người bạn của bạn, xếp hàng một cách ngẫu nhiên Gọi X
là biến ngẫu nhiên thể hiện số người ở giữa bạn
và bạn của mình Hãy xác định PMF của X dưới dạng bảng Hãy kiểm ta tính hợp lý của hàm PMF này
20
Ví dụ 9
• Kiện hàng chứa 40 sản phẩm Bên mua sẽ không
mua kiện hàng nếu có từ 3 sản phẩm lỗi trở lên
Để tiện, bên mua quy ước lấy 5 sản phẩm ra kiểm
tra, nếu có đúng 1 sản phẩm lỗi thì không mua lô
hàng Xác suất tìm thấy đúng 1 sản phẩm lỗi biết
lô hàng có 3 sản phẩm lỗi là bao nhiêu?
21
Ví dụ 10 Trong một cửa hàng bán 100 bóng đèn có 5 bóng hỏng Một người mua ngẫu nhiên 3 bóng Gọi X
là số bóng hỏng người đó mua phải
a) X pp theo qui luật gì? Viết biểu thức?
b) Tính kì vọng, phương sai của bnn X?
c) Tính ModX?
22
Ví dụ 11 Một hộp có 20 sản phẩm trong đó có 6 phế phẩm
Lấy ngẫu nhiên 4 sp từ hộp Gọi X là số phế phẩm
trong 4 sp
a) Luật phân phối xác suất của X
b) Tính E(X), Var(X)?
c) Tìm Mod(X)
23
Quan hệ giữa Nhị thức và siêu bội
24
X H N N n n<<N
N>20n
k n k
n n N
C C
C
Trang 5Ví dụ 12
• Nhà sản xuất thông báo rằng trong số 5000 lốp xe
máy gửi cho một nhà phân phối ở HCM có 1000
lốp có lỗi nhẹ Nếu một người mua ngẫu nhiên 10
lốp xe từ nhà phân phối này thì xác suất có 3 lốp
mắc lỗi là bao nhiêu?
25
Phân phối Poisson
• X: số lần một sự kiện xh trong 1 khoảng thời gian (không gian)
• X=0,1,2,…
• Ví dụ:
• Số lỗi sai trên 1 trang in
• Số khách hàng vào ATM trong 10 phút
• Số người qua ngã tư trong 2 phút
26
Phân phối Poisson P(λ)
Định nghĩa: bnn X gọi là phân phối theo qui luật
Poisson P(λ) nếu có PMF dạng:
• x=0,1,2,3… và λ>0
• Kí hiệu: X~ P(λ)
27
!
x
Điều kiện để xấp xỉ phân phối Poisson
• X: số lần sự kiện xh trong 1 khoảng liên tục
• X tuân theo quá trình xấp xỉ Poisson với tham số λ>0 nếu:
a) Số lượng các sự kiện xh trong những khoảng rời nhau
là độc lập
b) Xác suất có đúng 1 sự kiện xh trong 1 khoảng ngắn có
độ dài h=1/n xấp xỉ với λh = λ(1/n) = λ/n.
c) Xác suất có đúng 2 hoặc nhiều hơn hai sự kiện xh trong một khoảng ngắn là 0 (rất nhỏ)
28
Các tham số và tính chất
• Cho X~ P(λ) Ta có:
• X1, X2là hai bnnđộc lậpvàX1~P(λ1); X2~P(λ2)
Ta có:
29
)
)
1 2 ~ 1 2
Một số ví dụ
• Số lần truy cập vào một máy chủ web trong mỗi phút
• Số cuộc điện thoại tại một trạm điện thoại trong mỗi phút
• Số lượng bóng đèn bị cháy trong một khoảng thời gian xác định
• Số lần gõ bị sai của khi đánh máy một trang giấy
• Số lần động vật bị chết do xe cộ cán phải trên mỗi đơn vị độ dài của một con đường
• Số lượng cây thông trên mỗi đơn vị diện tích rừng hỗn hợp
30
Trang 6Trong một nhà máy dệt, biết số ống sợi bị đứt trong 1
giờ có phân phối Poisson với trung bình là 4 Tính xác
suất trong 1 giờ có
a Đúng 3 ống sợi bị đứt ( biến cố A)
b Có ít nhất 1 ống sợi bị đứt.( bc B)
31
Một trạm điện thoại trung bình nhận được 300 cuộc gọi trong một giờ Tính xác suất:
a) Trạm nhận được đúng 2 cuộc gọi trong vòng 1 phút
b) Trạm nhận được đúng 3 cuộc gọi trong vòng 5 phút
32
Xấp xỉ B(n,p) bằng P(λ)
• Khi n lớn và p nhỏ thì ta có thể xấp xỉ phân phối
Nhị thức bằng phân phối Poisson
• Nghĩa là:
• Trong đó:
• Điều kiện để xấp xỉ tốt:
33
!
x
x x n x
n
x
.
n p E X
hay
Ví dụ 15
• Năm phần trăm (5%) bóng đèn cây thông Giáng sinh
do một công ty sản xuất bị lỗi Giám đốc của bộ phận kiểm soát chất lượng của công ty khá quan ngại và do
đó lấy mẫu ngẫu nhiên 100 bóng đèn ra khỏi dây chuyền lắp ráp Gọi X là số bóng đèn trong mẫu bị lỗi
Xác suất mà mẫu chứa nhiều nhất là ba bóng đèn bị lỗi
là bao nhiêu?
34
3.2 Biến ngẫu nhiên liên tục
• Phân phối đều U(a, b) Uniform
• Phân phối lũy thừa Exponential
• Phân phối chuẩn Normal
• Phân phối Student
• Phân phối Khi bình phương Chi-squared,
• Phân phối Fisher
35
Phân phối đều
Định nghĩa Một biến ngẫu nhiên X gọi là có phân phối
đều U(a,b) nếu hàm mật độ có dạng:
Trong đó: 𝑎 ≤ 𝑥 ≤ 𝑏
36
1
f x
b a
( )
x a
F x
b a
Trang 7Phân phối đều
• Các tham số đặc trưng
37
2
0
)
2
b a
a b
a b
ii ModX x a b MedX
Ứng dụng của phân bố đều
• Bài 1 Lớp có 40 sinh viên, giảng viên cần chia
thành 2 nhóm mỗi nhóm 20 sinh viên Làm cách nào chia nhóm một cách ngẫu nhiên?
• Bài 2 Làm cách nào chọn được ngẫu nhiên 100
sinh viên trong toàn bộ sinh viên đang học tại FTU2 (giả sử gồm 4000 sinh viên) để tham gia khảo sát về chất lượng giảng dạy
• Xem bài viết gốc tại:
• https://newonlinecourses.science.psu.edu/stat 414/node/137/
38
Biểu đồ Q-Q (quantile-quantile plot)
• Làm thế nào chúng ta có thể đánh giá nếu một tập
hợp dữ liệu cụ thể tuân theo phân phối xác suất
cụ thể?
• Cách 1: so sánh các số đặc trưng không đủ
• Cách 2: dùng Q-Q plot (biểu đồ so sánh các phân
vị)
39
Ví dụ 17
• Tập hợp 19 số dưới đây được phát sinh ngẫu nhiên từ phân phối U(0,1) bằng phần mềm Minitabs Hãy xem xét xem các số này có phù hợp với mô hình xác suất cho bởi f(x)=1 với 0<x<1 hay không?
40
Phân phối lũy thừa
Định nghĩa Một biến ngẫu nhiên X gọi là có phân phối
lũy thừa E(𝜆) nếu hàm mật độ có dạng:
Trong đó: 0≤ 𝑥, 𝜆 > 0
41
( ) x
Phân phối lũy thừa
• Các tham số đặc trưng
• Thời gian giữa hai lần xuất hiện trong phân phối Poisson P(𝜆) có phân phối lũy thừa E(1/𝜆)
42
2
)
ln 2
x
iii F x e
Trang 8• Các cuộc gọi đến một tổng đài điện thoại tuân theo
một quy trình Poisson gần đúng với tốc độ trung bình
30 cuộc gọi mỗi giờ Xác suất để tổng đài viên phải chờ
hơn 3 phút để có cuộc gọi tiếp theo là bao nhiêu?
43
• Quãng đường (km) một chiếc xe hơi có thể chạy trước khi phải thay pin ắc quy có phân phối lũy thừa với trung bình là 10.000 km Chủ xe muốn đi
du lịch bụi với quãng đường khoảng 5000km Xác suất để anh ta có thể hoàn thành chuyến đi mà không cần phải thay pin ắc quy là bao nhiêu?
44
Phân phối chuẩn N( , 2)
• Định nghĩa Một biến ngẫu nhiên X gọi là có phân
phối chuẩn N(,2) nếu hàm mật độ có dạng:
• Trong đó:
• Ký hiệu: X ~ N(,2)
45
x
2 2
2
1 ) 2 (
x
Tính chất
46
2
2
) )
X N
Đối xứng Dạng hình chuông “bell sharped”
x f x
Chuẩn hóa phân phối chuẩn
• Định lý Nếu 𝑋~𝑁 𝜇, 𝜎2 thì biến ngẫu nhiên
chuẩn Cụ thể là:
• Phân phối N(0,1) được gọi là phân phối chuẩn
tắc
• Standard Normal Distribution
47
Neáu X N thì:Z X N
Xác suất của phân phối chuẩn
Ta có thể tìm xác suất dạng P(a<X<b) của biến ngẫu nhiên𝑋~𝑁 𝜇, 𝜎2 như sau:
• 1) Xác định miền tính xác suất theo X.
• 2) Biến đổi X, a, b theo công thức:
• 3) Sử dụng bảng Phụ lục xác suất N(0,1) để tìm xác suất mong muốn
48
X
Z
Trang 9Bảng phân phối chuẩn tắc
• Đồ thị của N(0,1)
• Bảng phụ lục xác suất N(0,1) thể hiện giá trị xác
suất dạng:
49
0
z
0
1 2
z x
z e dx
Tính chất của hàm 𝜑(x)
50
)
) 0, 5 5
i z z ii
iii z khi z
z
0
1 2
z x
z e dx
Giá trị tới hạn Zα
• Giá trị tới hạn chuẩn mức α (0 ≤ 𝛼 ≤ 1) là số
thực ký hiệu Zαsao cho với Z~N(0;1) thì:
• Chú ý:
51
P ZZ
0,5 0 1
Z Z Z
Z
Quy tắc k-sigma
• Trong thực nghiệm, nếu một tập số liệu có phân phối chuẩn thì:
• Khoảng 68% dữ liệu nằm trong một độ lệch chuẩn so với trung bình
• Khoảng 95% dữ liệu nằm trong hai độ lệch chuẩn so với trung bình
• khoảng 99,7% dữ liệu nằm trong ba độ lệch chuẩn so với trung bình
52
2
) 0, 6826 ) 2 0,9544
a P X b P X
c P X d P X
Nhận biết phân phối chuẩn
• Q-Q plot
•
http://www.jbstatistics.com/normal-quantile-quantile-plots/
• Ví dụ Liệu các giá trị sau đây có phải được lấy ra
từ một phân phối chuẩn?
• 7.19; 6.31; 5.89; 4.5; 3.77; 4.25; 5.19; 5.79; 6.79
53
Ví dụ 20 1) Cho X là bnn có phân phối chuẩn với E(X)=10 và P(10<X<20)=0,3 Tính xác suất P(0<X<15)?
2) Cho X~N(3,1) và Y~N(4,2) là hai biến ngẫu nhiên độc lập Tìm xác suất P(X>2Y)
54
Trang 10Giả sử thời gian khách phải chờ để được phục vụ tại
một cửa hàng là bnn X, biết X~N(4,5; 1,21)
a) Tính xác suất khách phải chờ từ 3,5 đến 5 phút?
b) Tìm t biết xác suất khách phải chờ không quá t là
không quá 5%?
55
• Tuổi thọ một loại máy lạnh A là bnn X có phân phối N(10; 6,25) Khi bán một máy thì lời 1,4 triệu đồng nhưng nếu máy lạnh phải bảo hành thì lỗ 1,8 triệu đồng Vậy để có tiền lãi trung bình khi bán loại máy lạnh này là 0,9 triệu đồng thì cần qui định thời gian bảo hành là bao lâu?
56
Phân phối Khi bình phương
• Bnn X gọi là có phân phối Khi bình phương với n
bậc tự do nếu hàm mật độ có dạng:
• Ký hiệu:
• Là trường hợp riêng của pp Gamma
57
1 2 2
1
2 2
n
f x
x
2
~
Khi bình phương và Chuẩn
• Định lý Nếu𝑋~𝑁 𝜇, 𝜎2 thì:
• Định lý Cho n biến ngẫu nhiên độc lập cùng có
phân phối chuẩn tắc
• Khi đó:
58
2 2 1
~
n i i
2
~ 1
X
Z
i
Phân phối Khi bình phương
• Nếu X~χ2(n) thì
• Đồ thị dạng:
59
Bậc tự do n và dạng đồ thị
60
2
n
Trang 11Giá trị tới hạn 𝜒2(n; α)
• Giá trị tới hạn mức α (0 ≤ 𝛼 ≤ 1) là số thực ký
hiệu 𝜒2(n;𝛼) sao cho với Z~ 𝜒2(n) thì:
61
2 n;
P Z
2
;
n
Bảng giá trị tới hạn Khi bình phương
62
Ví dụ 23
• Cho 𝑍~𝜒2 20
• Tìm các xác suất sau:
63
2
) 20;0,95
) 10,8508 31, 4104 ?
a
b P Z
Phân phối Student
• Định nghĩa Nếu 𝑋~𝑁 0,1 và 𝑌~𝜒2 𝑛 là hai biến ngẫu nhiên độc lập thì biến ngẫu nhiên:
có phân phối Student hay phân phối t với n bậc tự do
• Ký hiệu: T~𝑡 𝑛
64
X X n
T
n
;
Phân phối Student t(n)
• Định nghĩa Biến ngẫu nhiên X gọi là có phân phối
Student với n bậc tự do nếu hàm mật độ có dạng:
• Kí hiệu: X ~ t(n)
65
1
2 2
,
1
1 2
n
x
n
x
f x
n
Tính chất
66
• Nếu X ~ t(n) thì:
2
F
n
a E T n
n
n
Trang 12• Giá trị tới hạn mức α (0 ≤ 𝛼 ≤ 1) là số thực ký
hiệu 𝑡(𝑛, 𝛼) sao cho với Z~ 𝑡(n) thì:
67
Z tn;
;
0
n n
68
Ví dụ 24
• Cho 𝑍~𝑡 15 Tìm các giá trị tới hạn và xác suất
sau:
69
15;0,025
15;0,975
b P Z
Phân phối Fisher - Snedecor
• Định nghĩa Nếu 𝑋~𝜒2𝑛 ; 𝑌~𝜒2 𝑚 là hai biến ngẫu nhiên độc lập nhau thì biến ngẫu nhiên:
• có phân phối Fisher – Snedecor với (n,m) bậc tự do
• Ký hiệu:
70
/ /
F
Y m
Đồ thị hàm mật độ
71
, F 1,0
m n
F n m N
Tính chất
• Cho X~F 𝑛, 𝑚 thì:
72
2 2
2
F
m n
m
m
m n m
V X
, F 1,0
m n
F n m N
𝑛, 𝑚
Trang 13Giá trị tới hạn phân phối Fisher
• Giá trị tới hạn mức α (0 ≤ 𝛼 ≤ 1) là số thực ký
hiệu F(n, m, α) hay 𝑓(n, m, α) sao cho với F~
𝐹(n,m) thì:
• Tính chất:
73
P F f n m
, ,
f n m
, ,
f n m
f n m
Bảng giá trị tới hạn Fisher
74
Ví dụ 25
• Cho F~F(20; 30) Tìm a, b, c sao cho:
75
3.3 Định lý giới hạn trung tâm
• Central Limit Theorem
• Giả sử X1, X2, , X nlà các biến ngẫu nhiên độc lập và
có cùng phân phối xác suất (bất kỳ dạng nào) với kỳ
vọng μ và phương sai hữu hạn σ2 Khi n đủ lớn thì:
a) Trung bình cộng của Xi, ký hiệu 𝑋, có phân phối xấp xỉ với phân phối chuẩn
c) Và phương sai là V 𝑋 =𝜎𝑛2
76
2
1
,
n n
Ví dụ 28
• Gọi Xi biểu thị thời gian chờ đợi (tính bằng phút)
của khách hàng thứ i Một trợ lý quản lý tuyên bố
rằng, thời gian chờ đợi trung bình của toàn bộ
khách hàng, là 2 phút Người quản lý không tin
vào tuyên bố của trợ lý, vì vậy anh ta quan sát một
mẫu ngẫu nhiên gồm 36 khách hàng Thời gian
chờ trung bình cho 36 khách hàng được quan sát
là 3,2 phút Người quản lý có nên bác bỏ tuyên bố
của trợ lý ( và sa thải anh ta) không?
77
Xấp xỉ xác suất
78
~
n p
X H N N n n<<N
Y ~
P
n q
n rất lớn
p rất nhỏ n rất lớn
p rất lớn