Chương 5 Một số định lý hội tụGiả sử trên không gian xác suất Ω, A, P ta có dãy các biến ngẫu nhiên và biến ngẫu nhiên Y... Một số quy luật số lớn Ta đã biết rằng một biến cố có xác suấ
Trang 1Chương 5 Một số định lý hội tụ
Giả sử trên không gian xác suất (Ω, A, P) ta có dãy các biến ngẫu nhiên
và biến ngẫu nhiên Y
(YXY
Trang 2XY
≥+
−+
≤
22
V× g lµ hµm liªn tôc nªn t¹i x0 víi mäi ε>0 sÏ cã ∃δ>0 sao cho víi mäi
x th× khi x−x0 <δ ta sÏ cã g(x)−g(x0) <ε ¸p dông cho biÕn ngÉu nhiªn ta
cã thÓ viÕt: ∀ε>0, ∃δ>0 sao cho:
Trang 3II Một số quy luật số lớn
Ta đã biết rằng một biến cố có xác suất bằng 0 có thể coi là hầu như không thể có Tương tự một biến cố có xác suất bằng 1 có thể coi là hầu như chắc chắn xẩy ra
Mặt khác một biến cố ngẫu nhiên thường do rất nhiều nguyên nhân ngẫu nhiên gây ra Các nguyên nhân ngẫu nhiên này có thể biểu thị bằng các biến ngẫu nhiên Vì vậy ta phải xem xét các biến ngẫu nhiên này phải thoả mãn những điều kiện gì để tác động tổng cộng của chúng có thể dẫn đến các biến
cố có xác suất bằng 0 (hoặc bằng 1) Việc tìm ra các điều kiện này chính là nội dung của các quy luật số lớn
r E XX
P
ε
≤ε
r x f ( x ) dx dx
) x ( f X
Trang 4≤ +∞∫
∞
ư
11
Ghi chú: Nếu thay X bởi X- E(X) và r = 2
X(EX
ε
≤ε
≥
ưTức là
ε
≤ε
≥
ưE(X) V(X)X
<
ưE(X) V(X)X
b Có phương sai bị chặn đều, tức là tồn tại hằng số C sao cho
với mọi , thì với mọi số C
)X(
V i ≤ i≥1 ε > 0 nhỏ tuỳ ý ta đều có:
1 1
<
Theo tính chất của kỳ vọng toán ta có
Trang 5( ) E(X ) ( )
n
XnEX
Do giả thiêt (a) nên:
V
1 2 1
11
Do giả thiết (b) nên ta suy tiếp:
n
CnCnX
V n 12
Thay các kêt quả ở ( )β và ( )γ vào bất đẳng thức ở ( )α ta đ−ợc:
1 1
11
En
Xn
n
i iLấy giới hạn hai vế:
11
1
n
Clim
XEn
XnPlim
n n
n
i in
1 1
Do xác suất bị chặn trên bởi 1 nên ta suy ra hệ thức phải chứng minh
ý nghĩa: Qua định lý ta thấy biến ngẫu nhiên ∑
Trang 6Một trong các trường hợp đặc biệt này sau này ta sẽ gặp là các
là những biến ngẫu nhiên độc lập, có cùng quy luật phân phối xác suất, do đó có cùng kỳ vọng là
μ và cùng phương sai là Khi ấy, mặc
dù từng biến ngẫu nhiên có thể nhận giá trị sai khác rất nhiều so với
3 Định lý Bernoulli (luật số lớn của Bernoulli)
Phát biểu: Nếu là số lần xuất hiện của biến cố A trong n phép thử độc lập với mỗi phép thử chỉ có hai kêt quả là A và Ā và với xác suất để A xuất hiện trong mỗi phép thử đều là P(A) = p( 0 < p < 1) thì với mọi số nhỏ tuỳ ý
ta đều có:
nS
)n
(p
n ⎯⎯→ →∞ Do đó nếu n khá lớn ta có thể lấy giá trị của làm giá trị xấp xỉ cho p Đây chính là cách xác định xác suất của một biến cố A nào đó theo quan điểm thống kê
nf
<
n n
fV)
fEf
Trang 7Do đó
nn
X
XXEn
SEf
n n
n
SVf
n n
11
2 1
2Thay các kết quả này vào bất đẳng thức trên ta được:
<
ư
n
)p(pp
)p(plimp
fP
lim
n n
4 Định lý Markov ( luật số lớn của Markov)
Phát biểu: Nếu dẫy các biến ngẫu nhiên { }Xn (n =1,2, ) thoả mãn điều kiện:
Thì khi đó với mọi số ε > 0 nhỏ tuỳ ý ta đều có:
1 1
ý nghĩa: Như vậy điều kiện trong định lý Markov rộng hơn các điều kiện trong
định lý Trê_bư_sép ở chỗ không đòi hỏi tính độc lập của các biến ngẫu nhiên thành phần và tính bị chặn đều của các phương sai của chúng
Trang 811
i i
n
i i
Xn
VX
nEXnPNh− đã biết
Xn
E
1 1
11
Xn
V
1 2 1
11
Thay các kết quả này vào bất đẳng thức trên và lấy giới hạn hai vế ta đ−ợc: ( ) ⎟⎠≥ −ε ⎢⎣⎡ ⎜⎝⎛ ⎟⎠⎞⎥⎦⎤
En
XnP
lim
1 2 2
1 1
11
11
∑ ( )→ ( →∞
=
nX
Vn
n
01
1
Thí dụ 1 Hãy xác định số l−ợng tối thiểu các phép thử cần thực hiện trong l−ợc đồ Bernoulli để dựa vào fn ta có xấp xỉ đ−ợc p với độ chính xác 0,1 và độ tin cậy tối thiểu là 95%
Bài giải
Ta phải xác định giá trị tối thiểu của n sao cho:
P(fn −p <0,1)≥0,95
Trang 9Theo định lý Bernoulli ta chỉ biết đ−ợc fn hội tụ theo xác suất về p Tuy nhiên dựa vào bất đẳng thức Trê_b−_sép áp dụng cho fn đã nêu trong phần chứng minh định lý này ta có:
10
1110
),(n
pp,
pf
Vậy ta phải có: ( )
95010
1
),(n
1
),(
Chứng tỏ rằng dẫy biến ngẫu nhiên này tuân theo quy luật số lớn
in
)X(Vn
n i
n i
n
11
11
1 2 1
2 1
Trang 10I Các định nghĩa
Định nghĩa 1
Dãy các biến ngẫu nhiên {Xn} (n = 1, 2,…) được gọi là hội tụ theo quy luật về X nếu: với mọi x thuộc thuộc tập hợp các điểm liên tục của F
)x(F)x(F
Ghi chú 1 Do có sự tương ứng ( 1-1 ) giữa hàm đặc trưng và hàm phân phối
nên điều kiện trên có thể thay bằng:
limgX (t) gX(t)
∞
→
Ghi chú 2 Ta biết quy luật chuẩn là quy luật thường gặp và có nhiều ứng dụng
Vì thế ta sẽ tìm các điều kiện một dãy biến ngẫu nhiên { }Xn (n =1,2 ) sẽ hội
tụ theo quy luật về quy luật N( 0; 1) Chính xác hơn ta có khái niệm tiệm cận chuẩn như sau:
Nếu quy luật phân phối của biến ngẫu nhiên X phụ thuộc vào tham số n và nếu
ta có thể chọn được hai đại lượng m0 và σ (phụ thuộc hoặc không phụ thuộc 0vào n) sao cho khi n → ∞ thì hàm phân phối của biến ngẫu nhiên
0
0σ
Thì ta nói rằng X tiệm cận chuẩn (m0,σ0)
Thí dụ Nếu X tuân theo quy luật χ2(n) thì nó tiệm cận chuẩn (n 2 , n)
Trang 112
−
=Khi đó hàm đặc tr−ng của X~ sẽ là
n it
2
12
2 2
2
12
121
n n
it
n n
it
nite
tnie
2
2
Khai triển Mac_laurin ta có:
n
itn
itn
itn
23
12
2
122
1Suy ra
−
=
n
t)t(g
022
Trang 12Đây là hàm đặc trưng của quy luật N( 0;1) từ đó ta kết luận hàm phân phối của
(n 2 , n)
II Định lý giới hạn trung tâm của liapounov
Phát biểu Cho các biến ngẫu nhiên độc lập Xk (k = 1,2…) có kỳ vọng hữu hạn E(Xk) = ak và phương sai hữu hạn ( ) 2
k k
n V(S ) V X V X
B
1 2 1
1 2
Thì ∑ sẽ tiệm cận chuẩn với m
( )n n n ( )n n
n n
S
)S(ESS
V
)S(ESS
)x(
Trang 13ý nghĩa Điều kiện (*) được gọi là điều kiện Liapounov Nếu điều kiện này
được thoả mãn thì với n khá lớn quy luật phân phối của tổng có thể
coi xấp xỉ là quy luật chuẩn với kỳ vọng là và với
1 1
1 2 1
a
XS
~
1
1 1
sẽ tiến tới hàm đặc trưng của quy luật N( 0;1) khi n →∞, tức là
2
t S
n k k n
1i) Vì vậy trước hết ta xác định theo công thức khai triển đã biết:
1 0
<
θθ
k k
k
r iz
Ta suy ra
1với3
21
0
3 2
1 0
<
θθ
++
3 2
2
<
θθ
+
ư+
Trang 14Do đó ta có thể viết khai triển của gX(t) nh− sau:
g (t) E( )eitX itE(X) t E(X ) R(t)
221
trong đó phần d− R(t) thoả mãn bất đẳng thức
tXEC)t(
Từ đó ta suy ra:
( ) [ ( k k)]
k k
a X it a
taXE.C)t(
Rk ≤ k − k trong đó C là hằng số nào đó
Vì E(Xk −ak)=E(Xk)−ak =ak −ak =0
k k k
k k
ta suy ra:
)at(g)t(
gaX = X
( − ) = ( − )⎜⎜⎝⎛ ⎟⎟⎠⎞
n a X B
a X
B
tg
)t(g
k k n
k k
= −σ ⎜⎜⎝⎛ ⎟⎟⎠⎞ + ⎜⎜⎝⎛ ⎟⎟⎠⎞
n
k n
k
B
RB
21
2 2
= − σ + ⎜⎜⎝⎛ ⎟⎟⎠⎞
n
k n
k
BRtB
12
2
31
n k k n
k
B
ta
XE.CB
Trang 15( ) 3
3
31
tB
aXE.CB
R
n
k k n
n k k
= −
=1
ln
n k k n
ln1
2 2 221V× ln(1+αn)≈αn nÕu αn →0 nªn:
σ
−
n
k n
k n
k n
k
B
tRtBB
tRtB
2
2 2
2 2
22
t(g
ln
n
1
2 2 22
σ
−
k k nn
n
k k
B
tRt
2 2 1 22
−
k k nn
n
BRt
B
B
1
2 2
2
12
R
n
k k n
Trang 16NÕu ®iÒu kiÖn Liapounov ®−îc tho¶ m·n, tøc lµ nÕu
=
na
XEn
n
01
1
3 3
Rn
k k n
01
E k = vµ V( )Xk =b2 vµ cã c¸c m«_men cÊp 3 h÷u
(Em
1 0
( )S V( )S n b nb b n
k kn
3 2
3
1 33
2 3
1
3 3
2
3 3
11
11
bn
nbnb
n
aX
Enb
aXEB
n k
n
k k n
μ
=μ
=μ
Trang 171 ( ) 0
3 2 1 3 3
lima
XEB
lim
n k k n
n
Vậy đối với dãy các biến ngẫu nhiên đang xét ta thấy điều kiện Liapounov
đ−ợc thoả mãn nên ta có kết quả phải chứng minh
ý nghĩa Nh− vậy khi n khá lớn ta có thể coi quy luật phân phối của biến ngẫu
nhiên ∑ là xấp xỉ quy luật chuẩn
n
k k
nn
SEX
SVX
n
bb.nnSV
2 2 2 2
b
;aN
2 kết quả này sẽ đ−ợc ứng dụng ở phần thống kê toán sau này
Hệ quả 2 (Định lý Moivre_laplace hoặc còn gọi là định lý giới hạn tích phân)
Nếu là dãy các biến ngẫu nhiên độc lập, cùng tuân theo quy luật A(p) thì biến ngẫu nhiên sẽ tiêm cận chuẩn với
Trang 18Vì các biến ngẫu nhiên Xk độc lập cùng tuân theo quy luật A(p) nên biến ngẫu nhiên X = , nh− ta đã biết sẽ tuân theo quy luật B(n;p) Vì vậy
Quy luật nhị thức B(n;p) tiêm cận chuẩn với m0 =np và σ0 = npq Từ
đó nếu X tuân theo quy luật B(n;p) và n khá lớn, đồng thời p không quá gần 0
1
x x x
x n x x n x
x x
qpC)
xX(P
Có thể tính xấp xỉ thông qua hàm Φ0(u)đã dùng cho quy luật chuẩn nh− sau:
npq
npXnpq
npx
np
0 2
0
Thí dụ: Xác suất để trong một quá trình sản xuất một sản phẩm trở thành phế phẩm là 0,005 tính xác suất để trong số 10000 sản phẩm đ−ợc lấy ra một cách ngẫu nhiên để kiểm tra thì sẽ không có quá 70 phế phẩm
Bài giải Nếu ký hiệu X là “số phế phẩm có thể gặp phải khi ta lấy ngẫu nhiên ra
C)
x(P)
0
9950005070
Nếu tính trực tiếp từng xác suất trên rồi cộng lại thì rất khó khăn Vì vậy ta
sẽ áp dụng định lý giới hạn tích phân để tính xấp xỉ
Trang 1950707549
5075
49
5000
,,
X,
Px
Sn
Do X tuân theo quy luật nhị thức và nếu đ−ợc xấp xỉ bởi quy luật chuẩn N( np; npq ) thì ta suy ra khi đó khi đó quy luật phân phối của fn cũng có thể coi là xấp xỉ quy luật chuẩn N(p ;
Trang 20Bài giải Nh− vậy ta phải xác định n sao cho
εΦ
≈ε
=
pqnn
pq
n02
tức là
20
pq
n
Do γ đã ấn định nên ta tra bảng giá trị của hàm Φ0(u) ta sẽ tìm đ−ợc giá trị
của U sao cho
Trang 21Chẳng hạn nếu γ=0,95 thì Φ0(u)=0,475 Ta tra bảng được u = 1,96 Nếu ε= 0,1 thì ( )
( )2
2
10
961,
pq,
n≥ Tuỳ trường hợp p chưa biết, ta có thể đánh giá
tiếp bằng cách thay tích pq bởi giá trị lớn nhất của nó là
961
2
2
≈
≥,
,n
Cách ước lượng này ta cũng đã thực hiện bằng cách dùng bất đẳng thức Trê_bư_sép nhưng với quan niệm “đại khái” hơn nhiều
Ghi chú 3 Liên quan tới việc xấp xỉ quy luật nhị thức bởi quy luật chuẩn, ta
còn có định lý giới hạn địa phương sau đây:
pC)x(
nên x =np +u npq ( )1
nưx=nqưu npq ( )2
Trang 22
np
qunp
x+
= 1
nq
punq
xn
−
=
−1
x n x n n x
n x x n n
exn.xne
n.n
qpen.nq
pC)x
π
≈
=
22
2
( )
xn
nqx
np)xn(x
12
.np
n)
xn(
x
n
21
xlnx
np
ln
x x
qu
21
−
=
np
qunp
qunpqu
21
Trang 23nqln
pux
21
pu)npqunq
21
xlnx
n
nqx
npln
xln
−
≈
nq
ppnp
qqu
2
12
1 ux
n
nqx
npln
lim
x n x
xn
nqx
nplim
u x
n x
Trang 24Căn cứ vào (2) và (3) ta thấy khi n khá lớn thì biểu thức ở (1) có thể viết xấp
xỉ là
2
12
npq.)
.npq
u
ϕ
=π
2
1
Đó là điều phải chứng minh
Thí dụ Nếu tính xác suất để trong 10000 sản phẩm lấy ra đã xét ở trên có
504005
,npq
npxu,
Do đó
057
140
ϕ
( ) (01456) 000206
057
140
Ghi chú 4 Định lý Moivre_Laplace cho phép ta xấp xỉ quy luật nhị thức B(n;p)
bởi quy luật chuẩn N(np; npq) Sự xấp xỉ này khá tốt khi np ≥ 5 và n(1-p) ≥ 5
Trang 25Tuy nhiên do B(n;p) là một quy luật rời rạc với các giá trị nguyên, còn quy luật chuẩn là một quy luật liên tục nên để việc xấp xỉ này được tốt hơn công thức xấp xỉ
npq
npx
xxx
0 2
0 2
npq
,npx
xxx
0 2
0 2
1
Sự sửa đổi này cũng còn được áp dụng khi một phân phối rời rạc nhận giá trị nguyên được xấp xỉ bởi phân phối liên tục, tức là khi ta xấp xỉ biểu thức tính xác suất
x x xxpx
xx
bởi tích phân ∫2 ( )
1
x xdxxf
Trong đó p(x) là hàm xác suất của biến ngẫu nhiên rời rạc X, còn f(x) là hàm mật độ của biến ngẫu nhiên liên tục Nếu như X nhận những giá trị nguyên thì để việc xấp xỉ được tốt hơn, người ta thay tích phân trên bởi tích