Định nghĩa Nếu X là biến ngẫu nhiên với hàm phân phối xác suất là Fx thì kỳ vọng toán của nó được ký hiệu và được định nghĩa như sau: EX=∫xdFx 1 Với giả thiết là ∫ xdFx tồn tại.. Nếu Fx
Trang 1Chương 3 Các tham số đặc trưng của
biến ngẫu nhiên
A Các tham số đặc trưng của biến ngẫu nhiên một chiều
i Kỳ vọng toán
1 Định nghĩa
Nếu X là biến ngẫu nhiên với hàm phân phối xác suất là F(x) thì kỳ vọng toán của nó
được ký hiệu và được định nghĩa như sau:
E(X)=∫xdF(x) (1)
Với giả thiết là ∫ xdF(x) tồn tại
Ghi chú: Tích phân nêu trên gọi là tích phân Stieljes của x lấy đối với F(x)
a Nếu F(x) là hàm bậc thang thì tích phân này trở thành
∑
∈
=I
)x(px)
X(
E (2)
Trong đó I là một tập hợp hữu hạn hoặc đếm được các chỉ số
Như vậy (2) là công thức định nghĩa cho kỳ vọng của một biến ngẫu nhiên rời rạc X
b Nếu F(x) có hàm mật độ xác suất là f(x) thì tích phân này trở thành
X(
E (3)
Do đó (3) là công thức định nghĩa của kỳ vọng toán của một biến ngẫu nhiên liên tục X Trong hai công thức (2) và (3), nếu chuỗi hoặc tích phân suy rộng không hội tụ tuyệt đối thì ta bảo biến ngẫu nhiên X tương ứng không có kỳ vọng toán
c Về mặt ý nghĩa thì ta có thể hiểu kỳ vọng toán là giá trị trung bình của biến ngẫu nhiên X hoặc là điểm cân bằng của phân phối
Trang 2Thí dụ 1: Hãy xác định số trung bình các lần suất hiện mặt sấp nếu ta tung hai đồng xu
đối xứng và đồng chất một lần
Bài giải Nếu gọi X là “số lần xuất hiện mặt sấp” thì ta đã thiết lập đ−ợc bảng phân phối xác suất của nó là
12+4
21+4
10
=( ) ( ) ( ))
X(E
Thí dụ 2: Cho X là biến ngẫu nhiên liên tục phân phối đều trong (a; b) tức là hàm mật độ xác suất có dạng:
;a(xa
bC
)b
;a(x)
x(f
b a dx a b x dx
) x ( xf )
34
24
)
Xbaa
bbaXa
bX
E
X
Do đó:
Trang 33 4
a b X
b a P a
b ) X ( E X
P
∫+
+
+ +
4 b a 3
4 a b
4 b a 3
xab
1dxab
=
= (n=1, 2, 3, )
H·y chøng tá r»ng E(X) kh«ng tån t¹i
Bµi gi¶i Tr−íc hÕt ta cã thÓ nghiÖm l¹i r»ng hµm p(x) nªu trªn lµ mét hµm khèi l−îng x¸c suÊt thËt vËy ta thÊy:
2
1
=2
=
= P X n n)
+ 2
1 + 2
1 + 2
1
= 2
1 2
=
x
A)
x(
f ( − ∞ < x < +∞ )
Trang 4a Hãy xác định A để f(x) là hàm mật độ xác suất của một biến ngẫu nhiên liên tục
∫+∞
∞
dx x A
Sau khi tính tích phân ở điều kiện thứ hai ta có:
π
1
=A
Vậy hàm f(x) muốn là hàm mật độ xác suất thì phải có biểu thức cụ thể là:
π ( 1 + 2)
1
=
x )
x (
2
∞ +
+
1 π
1
= +
1
+
1 π
1
= +
1 π
2
x d
lim x
x d
x xdx
Trang 5Tương tự nếu X là một biến ngẫu nhiên liên tục với hàm mật độ xác suất là f(x) thì:
=E X (x f(x)dx)
X(E
ý nghĩa: Khi tính kỳ vọng toán của một biến ngẫu nhiên, Y là hàm số của biến ngẫu
nhiên X thì dùng giá trị của hàm nhưng vẫn dùng phân phối xác suất của X
x , x ,
Khi đó quy luật phân phối xác suất của Y được xác định như sau:
l
I l
i I
l
i j
y ( p
Y(E
l l
xp
Do các tập hợp tạo nên một phép phân hoạch đối với tập hợp các chỉ số i=1, 2, , k và
1
j l I lVì thế
1
= 1
xp)
Y(E
l
l l
Đó là kết quả phải chứng minh
Trang 6Thí dụ 1: Tung hai đồng xu đối xứng và đồng chất mỗi mặt sấp suất hiện đ−ợc tính 5
điểm Hãy xác định số điểm trung bình hy vọng thu đ−ợc trong một lần tung
ta suy ra quy luật phân phối của Y nh− sau:
Do đó
( ) ( ) ( ) = 5
4
110+4
25+4
10
=)Y(
ì 5 + 4
2 1
ì 5 + 4
1 0
ì 5
= ) Y ( E
Thí dụ 2: Cho X là một biến ngẫu nhiên liên tục tuân theo quy luật phân phối đều trong
[0;1] Hãy tính E(Y) với Y= X3
Bài giải
a Cách thứ nhất
Trang 7Trước hết ta xác định quy luật phân phối xác suất của Y bằng cách căn cứ vào quy luật phân phối xác suất của X
XPyYPy
0
= ) x ( f
1x
1x0
0x
0
= x)x(F
1
10
0
= 3
1y)y(
0
= 3
2
ưy)
Vì thế
0 3
1 3
2
ư 1
1
=3
1
=3
1
= y y dy y dy)
Trang 8∫1 ∫
0
1 0
4 3
3
4
1
=0
14
=1
=
= x f(x)dx x dx x)
Y(E
x(p
x(pax)
x(pbax)
baX(E
∑ ∑
+
=I
)x(pb)x(px
=+b) ax b f(x)dx axf(x)dx bf(x)dxaX
(E
=a xf(x)dx b f(x)dx aE(X) b
Hệ quả 1: Cho a = 0 ta đ−ợc E(b) = b
Hệ quả2: Cho b= 0 ta đ−ợc E(aX) = aE(X)
Thí dụ: Với Y là “số điểm thu đ−ợc” nh− đã nêu ở thí dụ 1 mục này ta có Y= 5X vì vậy
E(Y)= E(5X)= 5E(X)
X(CE
X
(
Trang 9) x ( p ) X ( C
Thí dụ: Cho biến ngẫu nhiên liên tục X với hàm mật độ xác suất nh− sau:
0
1 0
) 1 ( 2 ) (
x và x với
x với x x
1
2 ) 1 ( 2 )
( X x x dx x x dx
r (r ) r )
xr
xr r
2+1+
2
=0
−1+2
= +1 +2
b [ (2 + 1)2]= [4 2 + 4 + 1]
XX
EX
24
+2+21+2
24
=1+
2 2
))(
())(
(.X
Trang 10γk( a ) = E [ X ư a ]k
b Nếu a là gốc 0 thì ta có mô_men gốc bậc k là
E(Xk)
k =αNhư vậy kỳ vọng toán E(X) chính là mô_men gốc bậc 1, tức là E(X) =α1
c Nếu a là E(X) thì ta có mô_men trung tâm bậc k là
μk =E[XưE(X)]k
Từ định nghĩa này ta thấy
1
=1
X(EX[
=E(X ) [E(X)] [E(X)]
1 2 2
=E(X ) E(X)Tương tự ta suy ra:
3 1 2
1 3
3 =α ư3α α +2αμ
4 1 2
2 1 3
1 4
4 =α ư4α α +6α α ư3αμ
Ghi chú: Các biểu thức ( k )
aX
E ư , E(Xk) và ( k)
)X(EX
E ư được gọi là các mô_men tuyệt đối Nếu các mô_men tuyệt đối này tồn tại thì các mô_men γk ,α k & μ k tương ứng mới tồn tại
2 Tính chất
Định lý:
Nếu biến ngẫu nhiên X có mô_men bậc k thì nó cũng có mô_men bậc k’ với 0 ≤ k’ ≤ k
Chứng minh
Ta chứng minh cho các trường hợp α k
Theo giả thiết thì
Trang 11' k
)x(dFx)
x(dFx
Tích phân thứ nhất bên vế phải là hữu hạn vì cận tích phân là hữu hạn và k' ≤1
x(dF
x
k x
' k
từ đó suy ra E( X k') < +∞
III phương sai vμ độ lệch tiêu chuẩn
1 Định nghĩa
Giữa những giá trị của X so với giá trị đại diện cho chúng là E(X) có sự phân tán Để
đặc trưng cho độ phân tán này nhiều hay ít, đáng lẽ chúng ta dùng giá trị trung bình của các độ phân tán, tức là dùng biểu thức μ1 = E[XưE(X)] Nhưng theo kết quả đã biết ta thấy luôn bằng 0 Sở dĩ như vậy vì có những giá trị của X lớn hơn E(X) và có những giá của X nhỏ hơn E(X) nên các độ sai lệch của những giá trị này so với E(X) sẽ bù trừ lẫn nhau làm cho giá trị trung bình của các độ sai lệch này bằng 0 Để tránh hiện tượng bù trừ này ta sẽ dùng biểu thức sau đây để đặc trưng cho độ phân tán của các giá trị của X quanh E(X)
1
μ
Định nghĩa: Phương sai của biến ngẫu nhiên X được ký hiệu và được định nghĩa như sau:
Trang 12=
∫
∑
∞ +
∞
ư
2
2 2
2 2
dx)x(f)X(Ex
)x(p)X(Ex)]
X(EX[E)X()
Ghi chú: Việc có được hai biểu thức định nghĩa cụ thể như đã nêu (cho trường hợp X là
biến ngẫu nhiên rời rạc và là biến ngẫu nhiên liên tục) là do ta coi [XưE(X)]2 là ϕ(X)
và áp dụng tính chất đã biết của kỳ vọng
ý nghĩa: Qua biểu thức định nghĩa ta thấy phương sai là trung bình của bình phương các
độ sai lệch giữa các giá trị của X quanh E(X) càng nhiều (tức độ tập trung càng ít) thì giá trị V(X) càng lớn
Thí dụ 1: Hãy tính V(X) với X là “số lần xuất hiện mặt sấp khi tung hai đồng xu đối xứng
và đồng chất một lần”
Bài giải
Ta có bảng phân phối xác suất của X là
X 0 1 2 P(x)
11
ư2+4
21
ư1+4
11
ư0
= ( )2 ( )2 ( )2
)X(
Trang 13=
ab
)x(
f với x ( a ; b )
) b
; a (
b a
abdx
ab.bax)
X
(
V
Ghi chú: Do V(X) có đơn vị đo lường là bình phương của đơn vị đo lường của biến ngẫu
nhiên X nên trong thực tế để biểu thị độ phân tán của các giá trị của X quanh E(X) một cách dễ hình dung hơn người ta còn dùng căn bậc hai của phương sai và gọi tham số này
là độ lệch tiêu chuẩn của biến ngẫu nhiên X với ký hiệu và công thức định nghĩa như sau:
ưα
=
∫
∑
∞ +
∞
ư
2 2
2 2
2 1 2
)]
X(E[dx)x(fx
)]
X(E[)x(p
21+4
10
= 2 2 2 ( )2)
X(V
Thí dụ 2: Nếu tính V(X) của biến ngẫu nhiên liên tục X tuân theo quy luật phân phối đều trong khoảng (a;b) bằng công thức ta có:
2
abx)X(
V b
a
Trang 143 Một số tính chất của phương sai
Ngoài tính chất được xét trong mục này phương sai còn một số tính chất khác nữa mà sau này chúng ta sẽ đề cập tới
=+b) E aX b E(aX b)aX
(V =E[aX+bưaE(X)+b]2
[ ( ) ]2
ư
=Ea X E(X = E[a 2 ( X ư E ( X ) 2]
)X(EXZ
X)X(
Z
σ
1
ưσ
1
=khi đó áp dụng các tính chất của kỳ vọng ta có
Trang 15E[E(X)]
)X()X(E)X()
1
)X()X(E)X
áp dụng các tính chất của phương sai ta được
)X()
X(E)X(
X)X(V)Z(
1
=(Do σ(X)& E(X) là các hằng số ) theo định nghĩa thì σ2(X)=V(X)
nên V(Z)=1
IV một số tham số đặc trưng khác của biến ngẫu nhiên một chiều
1 Giá trị mốt
Giá trị mốt thường đựoc ký hiệu là M0
Nếu X là một biến ngẫu nhiên rời rạc thì giá trị có thể có của nó sẽ đóng vai trò là nếu
k k
p p
p p
Nếu X là một biến ngẫu nhiên liên tục thì giá trị có thể có x sẽ là nếu tại điểm x này hàm mật độ xác suất đạt giá trị cực đại
0M
2 Điểm phân vị và điểm tới hạn
Điểm phân vị bậc q ( 0 ≤ q ≤ 1 ) thường được ký hiệu là Đây là giá trị thoả mãn
điều kiện:
qMq
)MX(
M được gọi là điểm trung vị và được ký hiệu là Me
Ghi chú 2: Ta có P(X >Mq)=1ưP(X ≤Mq)=1ưq Từ đó điểm phân vị bậc q cũng còn
được gọi là điểm tới hạn bậc 1- q
Trang 16a Nếu S > 0 thì phân phối gọi là lệch phải khi đó M0 < Me < E(X)
b Nếu S = 0 thì phân phối có tính đối xứng khi đó M0 =Me =E(X)
c Nếu S < 0 thì phân phối gọi là lệch trái khi đó E(X)<Me <M0
Ba hình sau đây minh hoạ cho ba trường hợp vừa nêu đối với một phân phối liên tục
được thể hiện qua hàm mật độ xác suất f(x)
Ghi chú: Nếu đối xứng qua trục tung thì
Trang 17a Nếu K > 0 thì phân phối gọi là có độ nhọn dương
b Nếu K = 0 thì độ nhọn của phân phối bằng độ nhọn của hàm mật độ xác suất của một quy luật phân phối đặc biệt gọi là quy luật phân phối chuẩn mà sau chương này ta sẽ xét
tới ( đối với phân phối chuẩn sau này ta sẽ thấy =3
σ
μ4
4 , tức là K = 0)
c Nếu K < 0 thì phân phối gọi là có độ nhọn âm
Hình vẽ sau đây sẽ minh hoạ cho ba trường hợp vừa nêu:
0
f(x)
K<0 K=0
K>0
5 Hệ số biến thiên
Hệ số này được ký hiệu và được định nghĩa như sau:
Trang 18
)X(E
)X(
=
∫ ∫
∑ ∑
∞ +
∞
−
∞ +
∞
−
dxdy ) y , x ( f ) y , x (
p ) y , x ( )]
Y , X ( [ E ) R
(
ij j i
( )
) (
b a
Trong đó công thức (a) áp dụng khi X và Y là hai biến ngẫu nhiên rời rạc, còn công thức (b) dùng cho hai biến ngẫu nhiên liên tục X và Y với hàm mật độ xác suất đổng thời
là f(x, y)
2 Một tính chất nữa của kỳ vọng toán
ở phần A ta đã thấy một vài tính chất của kỳ vọng toán Giờ đây ta có thể đ−a ra một tính chất nữa của tham số này nh− sau:
Trang 19+ =∑∑ với quan niệm rằng
i j i j ij
p)y,x()
YX
x )
Y X
) x ( p
Tiếp theo ta có
E X( −Y)= E X[ + −( 1)Y]
] ) 1 [(
) ( X E Y
E + −
=
) ( 1 ) ( X E Y
∞
−
∞ +
∞
−
dxdy)y,x(fyx
pyx]
YX[
E
s k
s j
k i s
k s
,
)b(
)a(
Công thức (a) dùng cho biến ngẫu nhiên rời rạc còn (b) dùng cho biến ngẫu nhiên liên tục
Nhân xét: Từ định nghĩa vừa nêu ta suy ra:
Trang 20XY ( E
XY(E
=⎜⎝⎛∑ ⎟⎠⎞⎜⎜⎝⎛∑ ⎟⎟⎠⎞
j j j i
Trang 21+ +
=4001+6000
=( ) , ( ) , ,)
Trang 22
3 8
1 ).
1 ).(
3 ( 8
1 ).
3 ).(
2 (
8
2 ).
2 ).(
2 ( 8
1 ).
3 ).(
1 ( 8
2 ).
2 ).(
1 ( 8
1 ).
1 ).(
0 ( ) (
= +
+
+ +
+
= XY
13+8
32+8
31+8
10
=( ) ( ) ( ) ( )
)X
(
2
=8
23+8
42+8
21
=( ) ( ) ( )
)Y(E
Như vậy E(X).E(Y) 2=3(=E(XY))
2
3
=Tuy nhiên X và Y không độc lập ta, chẳng hạn ta thấy
=0
2
=8
28
1
=1
=0
= ).P(Y ) X
(
P
c Các kỳ vọng có điều kiện và đường hồi quy
ứng với mỗi giá trị x của X ta có một phân phối có điều kiện của Y và do đó ta có một
kỳ vọng của Y gọi là kỳ vọng có điều kiện của Y đối với X Giá trị kỳ vọng có điều kiện này được ký hiện và định nghĩa như sau (tương ứng với trường hợp các biến ngẫu nhiên rời rạc hay liên tục):
∞
ư
dyxyyf
xypyx
Y
j j
Nếu E(Y x) thay đổi theo x, tức là nếu E(Y x) =ϕ(x) thì hàm được gọi là hàm hồi quy của Y đối với X
)x(ϕTương tự ta có
∞
ư
dxyxxf
yxpxy
X
i i
Trang 23Nếu E(X y)= ψ(y) thì ψ(y) là hồi quy của X đối với Y
ý nghĩa: Hàm hồi quy biểu thị sự phụ thuộc của các giá trị trung bình của X vào Y
Nếu X và Y là hai biến ngẫu nhiên độc lập thì như ta đã biết các phân phối có điều kiện
của Y đối với X sẽ đồng nhất với phân phối biên của Y và do đó
)x(ϕ
)X(E)xY(
E = với mọi
x Như vậy trong trường hợp này đường hồi quy của Y đối với X sẽ là một đường thẳng
song song với trục hoành
Hai hình sau đây sẽ minh hoạ đường hồi quy E(Y x) = E(X) tương ứng với các
trường hợp: a) Y không độc lập với X và b) Y độc lập với X và với X và Y là các biến
ngẫu nhiên liên tục
Thí dụ: Hãy vẽ đường hồi quy của Y (số tiền lãi) theo X (số lần bán được hàng) căn cứ và
bảng phân phối xác suất đồng thời đã xét ở mục III, mục B chương II
xy(p
1 0 0 0 0
Trang 24E(Y X= )0 =0
b Khi X=1
)xy(p
0
3840
2560,
,
3840
1280,
0960
0320,
,
0960
0640,, 0
67266
=2
XY(E
d Khi X= 3
Y 0 100 200 300 400 )
xy(p
Trang 25Mô_men trung tâm bậc (k, s) của biến ngẫu nhiên hai chiều V= (X,Y) đ−ợc ký hiệu
∫ ∫
∑ ∑
∞ +
∞
−
∞ +
∞
−
dxdy y x f Y E y X E x
p Y E y X E x
Y E Y X E X E
s k
i j
ij s j
k i
s k
s k
) , ( ) ( )
(
) ( )
(
) ( )
X(EX[E
0
)Y(V)]
Y(EY[E
2 0
Nh− vậy V(X) và V(Y) đặc tr−ng cho mức độ phân tán của các điểm (x, y) quanh tâm phân phối M [ E(X), E(Y) ] theo chiều của các trục toạ độ x’0x và y’0y Điều này đ−ợc minh hoạ qua hình sau:
Trang 26III Mô_men tương quan vμ hệ số tương quan tuyên tính
∞
ư
∞ +
∞
ư
dxdy )
y , x ( f ) Y ( E y ) X ( E x
p ) Y ( E y ) X ( E
Từ đó suy ra kết quả phải chứng minh
c Với X và Y là hai biến ngẫu nhiên bất kỳ ta sẽ có
)Y,X(Cov)
Y(V)X(V)YX(
=E X Y E(X) E(Y)
=E{ [XưE(X)] [+ YưE(Y)] }2
Trang 27Tính chất 1: Cov (X,Y) = Cov (Y,X)
Tính chất này có thể thấy ngay qua vai trò đối xứng của X và Y trong biểu thức định nghĩa
Tính chất 2: Nếu a và b là hai số thực thì Cov (aX,bY) = ab.Cov(X,Y)
Trang 28độc lập sẽ không có liên hệ tương quan, nhưng ngược lại hai biến ngẫu nhiên không có liên hệ tương quan thì chưa chắc đã độc lập
Ghi chú 2:
Hệ thức vừa nêu Cov(X,Y)=E(XY)ưE(X).E(Y)
Thường được dùng để tính Cov(X, Y) cho nhanh nếu đặt Y là X ta có công thức tính phương sai quen biết:
Cov(X,X)=V(X)=E(X2)ư[E(X)]2
Ghi chú 3:
Qua định nghĩa và qua các tính chất ta thấy Cov(X,Y) là một tham số đặc trưng cho mức độ chặt chẽ trong mối liên hệ giữa hai biến ngẫu nhiên X và Y Cụ thể:
a Nếu Cov(X,Y) > 0 thì ta bảo giữa X và Y có mối liên hệ tương quan thuận chiều
b Nếu Cov(X,Y) <0 thì giữa X và Y có mối liên hệ tương quan ngược chiều
c Nếu Cov(X,Y) = 0 thì như đã nêu trên, ta bảo giữa X và Y không có mối liên hệ tương quan
Tuy nhiên Cov(X,Y) phụ thuộc vào đơn vị đo lường của X và Y Chẳng hạn nếu X là chiều cao đo bằng mét và Y là trọng lượng đo bằng ki-lô-gam của các cá thể thì Cov(X,Y)
sẽ có đơn vị đo lường là m.kg Tuy nhiên nếu ta chuyển sang các đơn vị đo lường là cm và gam thì số đo của Cov(X,Y) sẽ tăng lên 100.000 lần Vì thế, để khắc phục nhược điểm này, từ Cov(X,Y) sẽ xây dựng khái niệm sau
X(
)Y,X(Cov)
Y,X(
σσ
=
b Các tính chất
Tính chất 1:
Trang 29HÖ sè t−¬ng quan tuyÕn tÝnh lµ mét tham sè kh«ng cã thø nguyªn, tøc lµ nÕu X’ = aX
)Y,X(abCov)
bY()aX(
)bY,aX(Cov)
'Y()'X(
)'Y,'X(Cov'
Y
,'
X
σσ
=σ
σ
=σ
σ
=ρ
(X,Y)
)Y()X(
)Y,X(Cov
ρ
=σσ
)Y,X(Cov)
Y,X(
σσ
=ρ
{ [ ][ ] }
)Y()X(
)Y(EY)X(EXE
σσ
−
=
)Y(
)Y(EY)
X(
)X(EXE
Trang 30baX,X()Y,X(
+σσ
+
=+ρ
=ρ
=ρ
a
a)X()X(a
)X(aV)
Y,X(
Trang 31X(
)X(EX
σ
ư
=σ
σ
σ
)X(
)Y()Y(EX)X(
)Y(Y
Đây là dạng phương trình đường thẳng quen thuộc
baX
Y = +
trong đó
)X(
)Y(a
)Y()Y(Eb
Ghi chú 2 Nếu ρ(X,Y) =ư1 ta sẽ sử dụng kết quả đối với V(X~,Y~) và nếu rút Y theo X
ta được phương trình
)X(
)Y()Y(EX)X(
)Y(
σ
σ
ư
=
Ghi chú 3 Nếu rút X theo Y ta cũng được các dạng phương trình tương tự
Ghi chú 4 Qua các tính chất ta thấy ρ(X,Y) là một tham số đánh giá mức độ tuyến tính trong mối liên hệ tương quan giữa X và Y Nếu ρ(X,Y) càng lớn thì mức độ tuyến tính này càng cao, tuy nhiên nếu ρ(X,Y) =0 thì ta chỉ kết luận không có dạng tuyến tính trong mối quan hệ giữa X và Y chứ không hẳn là không có quan hệ Sau đây là một vài hình ảnh minh hoạ ý nghĩa của ρ(X,Y)
Trang 32E(y)
ρ≅1
y
x x x x
x E(x)
ρ≅-1
y
x E(x)
x
x E(x)
ρ≅-1
y
x E(x)
E(y)
ρ≅0
Nh−ng vÉn
cã quan hÖ gi÷a X vµ Y
x x x
y
x E(x)