Bài giảng Lý thuyết xác suất thống kê toán - Chương 2: Đại lượng ngẫu nhiên, phân phối xác suất cung cấp cho người học kiến thức về đại lượng ngẫu nhiên rời rạc, các đặc trưng của đại lượng ngẫu nhiên, đại lượng ngẫu nhiên liên tục. Mời các bạn cùng tham khảo.
Trang 1CHƯƠNG 2 Đại lượng ngẫu nhiên – Phân phối XS
1 Đại lượng ngẫu nhiên rời rạc
1.1 Định nghĩa
Nếu mỗi kết quả của một phép thử ngẫu nhiên được biểu thị bằng một giá trị số, ta có một đại lượng ngẫu nhiên (ĐLNN)
Chính xác hơn, ĐLNN X là một hàm số xác định trên không gian mẫu Ω sao cho mọi tập hợp có dạng (X<x)={ω∈Ω/X(ω)= x} đều là biến cố
Ghi chú
(X<x) là biến cố thì (X>x), (X=x) … đều là biến cố
Trang 2ĐLNN rời rạc là ĐLNN mà các giá trị nó có thể nhận liệt kê được Lúc này biến cố để X nhận
Ví dụ
(1) Tung con xúc sắc, gọi X là số chấm xuất hiện thì
X là một ĐLNN có thể nhận các giá trị 1, 2, 3, 4, 5,
(2) Mua một vé số 5.000đ của thành phố A, gọi X là số tiền trúng số thì X là một ĐLNN rời rạc
(3) Gọi X là số lần tung đồng xu cho đến khi được mặt sấp thì X là ĐLNN rời rạc
Trang 3(4) Chiều cao X (cm) của một sinh viên trong lớp được chọn ngẫu nhiên có thể nhận giá trị là một số thực trong khoảng [140; 220] Các giá trị này không liệt kê được X không phải là ĐLNN rời rạc
Trang 41.2 Bảng phân phối xác suất của ĐLNN rời rạc
Quy luật phân phối xác suất của ĐLNN rời rạc
(bảng PPXS):
Bảng phân phối ký hiệu là (xi, pi), i=1, n
Ta phải có: pi >0,i=1, n và p1 + p2 + + pn =1
Trang 5Ví dụ
(1) Lô hàng gồm 6 chính phẩm và 4 phế phẩm Lấy ngẫu nhiên 2 sản phẩm Gọi X là số chính phẩm Các giá trị có thể nhận của X là 0, 1, 2 Ta có:
p1 =P(X=0)= 24
2 10
C
15 p2 =P(X=1)= 14 16
2 10
(2) Xác suất trị khỏi bệnh của 1 viên thuốc là 90% Bệnh nhân uống từng viên, chưa hết bệnh thì uống tiếp nhưng tối đa 3 viên Gọi X là số viên thuốc bệnh nhân uống Lập bảng phân phối XS của X
P 2/15 8/15 5/15
Trang 62 Các số đặc trưng của ĐLNN
2.1 Kỳ vọng
2.1.1 Định nghĩa
Để đánh giá giá trị trung bình của một ĐLNN,
ta tính kỳ vọng Kỳ vọng của ĐLNN X ký hiệu là E(X) Kỳ vọng của ĐLNN X có bảng phân phối (xi, pi), i=1, n được định nghĩa:
Trang 7750
1550
1050
550
650
450Điểm trung bình: E(X) = 5,82 (điểm)
(2) Một lô hàng gồm 15 chính phẩm và 3 thứ phẩm Chính phẩm được bán với giá 200.000đ còn thứ
Trang 8phẩm bán với giá 150.000đ Tính trung bình thì thu được bao nhiêu tiền khi bán một sản phẩm?
(3) Tung con xúc sắc Nếu xuất hiện mặt 1 hoặc mặt
2 hoặc mặt 3 thì thua 1đ, mặt 4 thì hoà, mặt 5 thì thắng 1đ, mặt 6 thì thắng 2đ Gọi X là số tiền thu được sau mỗi lần chơi Tính kỳ vọng của ĐLNN X (4) Xét ĐLNN X có bảng phân phối (xi, pi), i = 1, m Thực hiện phép thử n lần Gọi ki là số lần X nhận
Trang 9Cho n→∞ thì fi → pi ( i = 1, m) và do đó X → E(X) Vậy khi n đủ lớn thì X ≈ E(X) Ta nói kỳ vọng của một ĐLNN gần bằng với giá trị trung bình của một quan sát của ĐLNN này
Trang 102.1.2 Tính độc lập của ĐLNN rời rạc
Hai ĐLNN rời rạc X, Y gọi là độc lập nếu mỗi biến cố (X = x) đều độc lập với mọi tổ hợp tích của các biến cố có dạng (Y= yj)
Ví dụ
Gọi X là điểm thi môn Toán, Y là ngày sinh, U là số ngày đi học môn toán của một sinh viên trong lớp được chọn ngẫu nhiên thì X, Y là hai ĐLNN độc lập X, U là hai ĐLNN không độc lập
Trang 112.1.3 Tính chất
(i) E(c) = c (c là ĐLNN hằng và bằng c) (ii) E(cX) = cE(X)
(iii) E(X + Y) = E(X) + E(Y)
(iv) E(X.Y) = E(X).E(Y) nếu X, Y độc lập
Trang 12Ví dụ
(1) Một sinh viên sắp thi môn Toán và môn Kinh tế Khả năng đạt điểm như sau:
Điểm Toán 3 4 5 6 7 8 9 Điểm K.Tế 4 5 6 7 8 9
Khả năng (%) 5 10 15 20 25 15 10 Khả năng (%) 5 15 15 30 25 10
Dự kiến điểm trung bình hai môn của sinh viên này là bao nhiêu?
Gọi X, Y là điểm thi môn Toán và môn Kinh tế Cần tính E( (X+Y)/2 ) Ta có:
E(X) = 6,35 E(Y) = 6,85
Trang 13(2) Trong một tuần, một người có thể điểm tâm từ 5 cho đến 7 lần Số tiền phải trả cho mỗi lần điểm tâm thay đổi từ 20 ngàn đến 40 ngàn Chi tiết cho bởi bảng:
Được biết số ngày điểm tâm và chi phí cho mỗi lần điểm tâm không phụ thuộc nhau Trung bình mỗi tuần người này chi bao nhiêu cho điểm tâm?
Trang 142.2 Phương sai
2.2.1 Phương sai của ĐLNN rời rạc
Độ lệnh của X so với E(X) là X – E(X) Tuy nhiên, để tiện cho các phép tính vi tích, người ta xét
lớn thì độ lệch cũng lớn và ngược lại
Để đánh giá mức độ phân tán các giá trị của ĐLNN X quanh giá trị trung bình E(X), ta tính kỳ vọng của độ lệch bình phương và gọi giá trị này là phương sai:
var(X) ==== E([X −−−− E(X)]2) Trong thực tế, phương sai của ĐLNN X được tính theo công thức:
var(X) ==== E(X2) −−−− [E(X)]2
Trang 15Để có cùng đơn vị đo với X, ta lấy căn của phương sai và gọi giá trị này là độ lệch chuẩn:
σ
σ(X) ==== Var(X) Phương sai của ĐLNN X có bảng phân phối (xi, pi), i=1, n được tính theo công thức:
Trang 16Nên mua mì ăn liền nhãn hiệu nào?
Gọi X (Y) là trọng lượng một gói mì nhãn hiệu A (B) được chọn ngẫu nhiên Ta có bảng PPXS của ĐLNN
Trang 17var(X) = E(X2) − [E(X)]2
Trọng lượng trung bình của một gói mì của cả 2
nên gói mì nhãn hiệu A có trọng lượng ổn định hơn Nên mua mì ăn liền nhãn hiệu A
Trang 19Ví duï
Theo tính chaát cuûa phöông sai:
Trang 20(2) Trò chơi A: Tung con xúc sắc Nếu xuất hiện mặt
1 hoặc mặt 2 hoặc mặt 3 thì thua 1đ, mặt 4 thì hoà, mặt 5 thì thắng 1đ, mặt 6 thì thắng 2đ
Trò chơi B: Tung con xúc sắc Nếu xuất hiện mặt chẳn thì thì thắng 2đ, mặt lẻ thì thua 2đ
Cách chơi I: Chơi 2 ván theo trò chơi A và 3 ván theo trò chơi B
Cách chơi II: Chơi 3 ván theo trò chơi A và 2 ván theo trò chơi B
Tính kỳ vọng và phương sai của số tiền thắng cuộc khi chơi theo cách I, cách II Các cách chơi này có công bằng? Cách chơi nào có tính đỏ đen hơn?
Trang 212.3 Giá trị tin chắc nhất của ĐLNN rời rạc
Xét X là ĐLNN rời rạc Nếu phải dự đoán giá trị của X thì ta sẽ chọn giá trị xo sao cho biến cố (X=xo)
chắc nhất của ĐLNN X, ký hiệu Mod(X)
Do
xmax P(X = x) có thể đạt tại nhiều giá trị x nên Mod(X) không chắc duy nhất
Trang 232.4 Trung vị của ĐLNN rời rạc
Xét hai dãy số:
A: 1, 1, 5, 7, 8 B: 3, 3, 4, 6, 6, 9 Giá trị nằm giữa dãy số, gọi là trung vị, bằng bao nhiêu?
Đối với dãy A, trung vị là 5 Đối với B, có hai giá trị nằm giữa là 4 và 6 Ta lấy trung bình của hai giá trị này là 5 làm trung vị
Excel
Để tính trung vị của ĐLNN X có bảng phân phối (xi, pi), i=1, n, ta đưa các số pi về dạng các phân số
Trang 24có chung mẫu số là mi
lặp lại mi lần giá trị xi và sắp thứ tự Trung vị của dãy số này gọi là trung vị của ĐLNN X, ký hiệu Med(X)
Med(X) thoả tính chất:
2
Trang 263 Đại lượng ngẫu nhiên liên tục
Nếu các giá trị mà ĐLNN có thể nhận không liệt kê được thì ĐLNN được gọi là liên tục
Đối với ĐLNN X liên tục, các biến cố đáng quan tâm có dạng (X < a), (X > a), (a < X < b), (X > a), (X < a)
Trọng lượng một con gia súc chọn ngẫu nhiên trong chuồng, nhiệt độ trong phòng vào một thời điểm chọn ngẫu nhiên là các ví dụ về ĐLNN liên tục
Trang 273.1 Hàm phân phối XS và hàm mật độ XS
3.1.1 Hàm phân phối xác suất
Quy luật phân phối xác suất của ĐLNN liên tục
PPXS) Hàm PPXS F của ĐLNN X được định nghĩa:
F(x) ==== P(X < x) Hàm PPXS còn gọi là hàm tích luỹ xác suất
Hàm PPXS F của một ĐLNN phải thỏa:
Trang 28Nếu X là ĐLNN có hàm PPXS liên tục thì:
thì F liên tục Vậy:
P(1<X≤2)=F(2) –F(1)= 1/6
Trang 29(2) Từ bảng phân phối (xi, pi), i=1, n của một ĐLNN rời rạc, ta có thể thành lập hàm phân phối cho ĐLNN này bằng cách đặt:
Trang 303.1.2 Hàm mật độ xác suất
Xét ĐLNN X liên tục có hàm phân phối F Nếu
độ xác suất (hàm MĐXS) của ĐLNN X
Trang 31Hàm mật độ còn có các tính chất sau:
Trang 32Ví dụ
Tìm c để hàm f(x) = ce−x / 22 là hàm mật độ
Trang 333.2 Phân phối Chuẩn
3.2.1 Phân phối Chuẩn chuẩn tắc, hàm Laplace
e2
−
chuẩn tắc, ký hiệu Z ~ N(0; 1)
Trang 34Giá trị của tích phân sau cùng phụ thuộc vào z Hàm Φ theo biến z này có tên là hàm Laplace:
2
z x /20
Trang 35Việc tính giá trị Φ(z) bằng cách tính nguyên hàm là không thực hiện được Người ta dùng phương pháp khác để tính Φ(z) theo z, với bước nhảy 0,01, và ghi thành Bảng kê số hàm Laplace
dùng bảng kê số ta có thể tính các giá trị sau:
Trang 36Ví dụ
(1) P(Z>2) =0,5–Φ(2)
Tra bảng kê số hàm Laplace để tìm Φ(2):
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767 2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
= 0,4719 + 0,4772 = 0,9491
Trang 373.2.2 Phân vị mức α
Xét Z ~ N(0; 1) và một số α∈(0; 0,5) Phân vị
sao cho P(Z>zα)=α
Ta có:
P(Z>zα)=α ⇒ 0,5–Φ(zα)=α ⇒ Φ(zα)=0,5 –α Vậy:
zα ==== ΦΦ–1(0,5–α) α =NORMSINV(1–α)
Trang 38Khi dùng bảng kê số hàm Laplace, nếu tra thấy
Trường hợp trên bảng không tìm thấy giá trị cần tra thì lấy hai giá trị nhỏ hơn, lớn hơn và gần giá trị cần tra nhất rồi dùng quy tắc nội suy
Ghi chú
gọi là phân vị mức α của ĐLNN X
Trang 393.2.3 Phân phối Chuẩn
tham số dương thì X là một ĐLNN liên tục có tên là
Trang 413.3 Các số đặc trưng của ĐLNN liên tục
Xét X là ĐLNN có hàm mật độ f
3.3.1 Kỳ vọng, phương sai, độ lệch chuẩn
−∞
==== ∫∫∫∫+
2 2
σ(X) ==== Var(X) Các tính chất của kỳ vọng và phương sai của ĐLNN rời rạc cũng đúng cho ĐLNN liên tục Lưu ý định nghĩa ĐLNN liên tục X, Y độc lập nếu mỗi biến cố (X < x) đều độc lập với mọi tổ hợp tích của các biến cố có dạng (Y<yj)
Trang 43(2) Xét X ~ N(µ; σ2)
=2*NORMSDIST(3)–1
trung quanh giá trị trung bình với khoảng cách bằng
3 lần độ lệch chuẩn
Trang 443.3.2 Giá trị tin chắc nhất, trung vị
Theo ý nghĩa của hàm mật độ, giá trị tin chắc nhất Mod(X) là giá trị xo sao cho f(xo) =
xmax f (x)
2 nên trung vị Med(X) được định nghĩa là giá trị m sao cho:
Trang 453.3.3 Hệ số bất đối xứng, hệ số nhọn
Để đo mức độ bất đối xứng của đồ thị hàm mật
3
σXét trục E(X) Đồ thị của hàm mật độ đối xứng
Để đo độ nhọn của đồ thị hàm mật độ gần giá trị E(X), ta tính hệ số nhọn Kur(X):
Kur(X) = E([X − E(X)] )4 4
σKur(X) càng lớn thì đồ thị quanh E(X) càng nhọn, xu hướng X bằng E(X) càng cao