Bài Giảng Môn học Xác Suất và Thống Kê

Xác Suất và Thống Kê

Nguyễn Văn Thìn Khoa Toán - Tin Học

Đại Học Khoa Học Khoa Học Tự Nhiên Tp.HCM

Tập hợp - Giải tích tổ hợp

Biến cố và xác suất

Biến ngẫu nhiên và quy luật phân phối xác suất Định nghĩa và phân loại biến ngẫu nhiên

Quy luật phân phối xác suất của biến ngẫu nhiên Các tham số đặc trưng của biến ngẫu nhiên

Định nghĩa

Biến ngẫu nhiên X là một ánh xạ từ không gian các biến cố sơ cấp

ΩvàoR,

X : Ω −→ R

ω 7−→ X =X(ω)

Người ta thường dùng các chữ inX,Y,Z, . . .để ký hiệu các biến ngẫu nhiên và các chữ thườngx,y,z, . . . để chỉ các giá trị của biến ngẫu nhiên.

Biến ngẫu nhiên rời rạc

Biến ngẫu nhiên được gọi là rời rạc nếu tập hợp các giá trị mà nó có thể nhận là một tập hữu hạn hoặc vô hạn đếm được.

Ví dụ

Tung 1 đồng xu cân đối. Gọi X là số chấm xuất hiện thì X có thể nhận các giá trị1,2,3;4,5,6và xác suất

P(X =xi) = 1

Biến ngẫu nhiên liên tục

Biến ngẫu nhiên được gọi là liên tục nếu tập hợp các giá trị mà nó nhận được là một khoảng dạng(a,b) hoặc toàn bộ R

Ví dụ

Các biến ngẫu nhiên sau là biến ngẫu nhiên liên tục: a. Nhiệt độ không khí ở mỗi thời điểm nào đó.

b. Thời gian hoạt động bình thường của một bóng đèn điện tử. . . c. Độ pH của một chất hóa học nào đó.

Định nghĩa

Một hệ thức cho phép biễu diễn mối quan hệ giữa các giá trị có thể có của biến ngẫu nhiên với xác suất nhận các giá trị tương ứng gọi là quy luật phân phối xác suất của biến ngẫu nhiên.

Định nghĩa (Hàm phân phối xác suất)

Hàm phân phối xác suất của biến ngẫu nhiên X (xác định trên không gian các biến cố sơ cấpΩ) là hàm F(x) được định nghĩa

F(x) =P(X <x) (1) với mọi x ∈(−∞,+∞).

Tính chất

Hàm phân phối xác suất F(x)có các tính chất cơ bản sau i) Hàm phân phối là hàm không giảm.

ii) Liên tục trái, có giới hạn phải tại mọi điểm.

iii) F(−∞) = lim

x→−∞F(x) =0, F(+∞) = lim

x→+∞F(x) =1. iv) P(x ≤X <b) =F(b)−F(a) với mọi a,b∈Rvà a≤b.

Biến ngẫu nhiên rời rạcX nhận các giá trị có thểx1,x2, . . . ,xn, . . . với xác suất tương ứng làP(X =xi), ta đặt

f(x) =

P(X =x) khix ∈ {x1, . . . ,xn, . . .}

0 khix ∈ {/ x1, . . . ,xn, . . .}

gọi là hàm giá trị xác suất biến ngẫu nhiên rời rạcX nhận giá trị x, để đơn gia ta gọi là hàm xác suất.

Trong kết quả phép thử ngẫu nhiên, biến ngẫu nhiên rời rạc phải lấy một trong các giá trịx1, . . . ,xn, . . . cho nên hàm phân phối xác suất F(x) =P(X <x) =X xi<x P(X =xi) =X xi<x f(xi) (2)

Lý luận tương tự như trên ta thu được P(X ∈I) =X xi∈I P(X =xi) =X xi∈I f(xi)

Trường hợp đặc biệt là khiI = (−∞,+∞) thì P(X ∈I) = P(−∞<X <+∞)

= X

Để mô tả biến ngẫu nhiênX nhận giá trị nào đó với xác suất tương ứng là bao nhiên thì người ta dùng bảng phân phối xác suất. Bảng phân phối xác suất có hai dòng.

• Dòng thứ nhất là các giá trị có thể của biến ngẫu nhiênX.

• Dòng thứ hai là xác suất biến ngẫu nhiên X nhận các giá trị tương ứng.

Bảng phân phối có dạng như sau:

X x1 x2 · · · xn · · ·

Ví dụ

Gọi X là số nút xuất hiện khi tung một con xúc sắc. Hãy lập bảng phân phối và xác định hàm phân phối xác suất của X .

Ví dụ

Tung đồng thời hai đồng xu cân đối đồng chất. Gọi Y là số mặt sấp xuất hiện khi thực hiện phép thử, hãy lập bảng phân phối xác suất và xác định hàm phân phối xác suất của Y .

Ví dụ

Một người đi thi bằng lái xe, xác suất đậu của anh ta ở mỗi lần thi là 0.3. Anh ta sẽ thi đến khi đạt được bằng lái xe thì thôi. Gọi Z là số lần người đó dự thi. Lập bảng phân phối xác suất của Z .

Định nghĩa

Cho biến ngẫu nhiên liên tục X , hàm số f(x) không âm, xác định trênRvà thỏa các tính chất i) P(X ∈I) = Z I f(x)dx, ∀I ⊂R ii) ∞ Z −∞ f(x)dx =1

hàm số f(x) được gọi là hàm mật độ xác suất của biến ngẫu nhiên X .

Chú ý:

1) Mọi hàm f(x) không âm, và thỏa điều kiện

∞

−∞

f(x)dx =1 đều là hàm phân phối của 1 biến ngẫu nhiên X nào đó. 2) Từ định nghĩa về hàm mật độ ta có hàm phân phối xác suất

của biến ngẫu nhiênX có hàm mật độf(x) là

F(x) =P(X <x) = x Z −∞ f(u)du 3) F0(x) = d dxF(x) =f(x)

Ví dụ Cho hàm f(x) = ( 2x nếu x ∈[0,1] 0 nếu x ∈/ [0,1]

a) Chứng tỏ rằng f(x) là hàm mật độ xác suất của biến ngẫu nhiên X nào đó.

b) Tìm hàm phân phối xác suất F(x)của X . c) Tính xác suất P(0<X < 12).

Ví dụ

Tuổi thọ Y của một thiết bị (đơn vị: giờ) có hàm mật độ xác suất có dạng f(x) = (a x2 nếu x ≥100 0 nếu x <100 với a∈R.

a) Hãy xác định hàm phân phối của Y .

b) Thiết bị được gọi là loại A nếu tuổi thọ của nó kéo dài ít nhất 400 giờ. Tính tỉ lệ loại A.

Định nghĩa (Kỳ vọng của biến ngẫu nhiên rời rạc)

Giả sử biến ngẫu nhiên rời rạc X có bảng phân phối xác suất X x1 x2 · · · xn · · ·

P f(x1) f(x2) · · · f(xn) · · ·

Kỳ vọng của X , ký hiệuE(X), là một số được định nghĩa

E(X) = +∞ X i=1 xiP(X =xi) = +∞ X i=1 xif(xi) (3)

Ví dụ

Một hộp chứa 10 viên bi, trong đó có 3 viên bi nặng 10g, 5 viên nặng 50g, 2 viên nặng 20g. Chọn ngẫu nhiên ra 1 viên bi và gọi X là khối lượng của viên bi đó. TínhE(X).

Ví dụ

Một chùm chìa khóa có 6 chìa, trong đó có 2 chìa mở được cửa. Thừ từng chìa (thử xong bỏ ra ngoài) cho đến khi mở được cửa. Tìm số lần thử trung bình để mở được cửa.

Định nghĩa (Kỳ vọng của biến ngẫu nhiên liên tục)

Giả sử biến ngẫu nhiên liên tục X có hàm mật độ xác suất f(x), kỳ vọng của X là E(X) = +∞ Z −∞ xf(x)dx (4)

Ví dụ

Cho X là một biến ngẫu nhiên có hàm mật độ

f(x) = ( 2x nếu x ∈[0,1] 0 nếu x ∈/ [0,1] Tìm kỳ vọng của X . Ví dụ

Cho biến ngẫu nhiên Y có hàm mật độ xác suất

g(x) = ( 2 x2 nếu x ∈[1,2] 0 nếu x ∈/ [1,2] TìmE(Y).

Tính chất của kỳ vọng

ChoX,Y là hai biến ngẫu nhiên bất kỳ và C ∈Rthì kỳ vọng của biến ngẫu nhiên có các tính chất sau

i) E(C) =C. ii) E(CX) =CE(X).

iii) E(X+Y) =E(X) +E(Y).

iv) Nếu hai biến ngẫu nhiên X và Y độc lập thì E(XY) =E(X)E(Y).

Ý nghĩa của kỳ vọng

• Là giá trị trung bình theo xác suất của tất cả các giá trị có thể có của biến ngẫu nhiên.

Định nghĩa

Nếu biến ngẫu nhiên X có kỳ vọngE(X)thì phương sai, ký hiệu Var(X), được định nghĩa

Var(X) =E(X−E(X))2 (5)

Trong thực tế, để tính phương sai của biến ngẫu nhiên X ta thường sử dụng công thứcVar(X) =E(X2)−(E(X))2. Định nghĩa (Độ lệch chuẩn)

Độ lệch chuẩn của biến ngẫu nhiên X , ký hiệuσ(X), là căn bậc hai củaVar(X).

Tính chất phương sai

Cho hai biến ngẫu nhiênX,Y và hằng số thựcC ∈R, phương sai có các tính chất sau

i) Var(C) =0.

ii) Var(CX) =C2Var(X).

Ví dụ

Một hộp chứa 10 viên bi, trong đó có 3 viên bi nặng 10g, 5 viên nặng 50g, 2 viên nặng 20g. Chọn ngẫu nhiên ra 1 viên bi và gọi X là khối lượng của viên bi đó. TínhE(X),Var(X).

Ví dụ

Cho biến ngẫu nhiên Y có hàm mật độ xác suất

g(x) = ( 2 x2 nếu x ∈[1,2] 0 nếu x ∈/ [1,2] TìmE(Y),Var(X).

• Phương sai là kỳ vọng của bình phương các sai lệch giữaX và E(X), nói cách khác phương sai là trung bình bình phương sai lệch, nó phản ánh mức độ phân tán các giá trị của biến ngẫu nhiên xung quanh giá trị trung bình.

• Trong công nghiệp phương sai biểu thị độ chính xác trong sản xuất. Trong canh tác, phương sai biểu thị mức độ ổn định của năng suất...

Định nghĩa (Trung vị)

Cho biến ngẫu nhiên X bất kỳ, trung vị của X , ký hiệu Med(X), là giá trị m của biến ngẫu nhiên X sao cho

     P(X ≤m)≥ 1 2 P(X ≥m)≥ 1 2 ta viết Med(X) =m.

KhiX là biến ngẫu nhiên có phân phối liên tục thì phân vị của X, Med(X)chính là điểm chia phân phối xác suất thành hai phần bằng nhau nghĩa là

Bài Giảng Môn họcXác Suất và Thống Kê Xác Suất và Thống Kê

Nguyễn Văn Thìn Khoa Toán - Tin Học

Đại Học Khoa Học Khoa Học Tự Nhiên Tp.HCM

Tập hợp - Giải tích tổ hợp

Biến cố và xác suất

Biến ngẫu nhiên và quy luật phân phối xác suất

Một số biến ngẫu nhiên thông dụng Các biến ngẫu nhiên rời rạc Biến ngẫu nhiên liên tục

Định nghĩa (Biến ngẫu nhiên Bernoulli)

Thực hiện một phép thử, ta quan tâm đến biến cố A. Nếu biến cố A xảy ra (thành công) thì X nhận giá trị là 1,(X =1), ngược lại biến ngẫu nhiên X nhận giá trị0. Phép thử này gọi là phép thử Bernoulli. Giả sử xác suất xảy ra biến cố A là p,0≤p ≤1

P(A) =P(X =1) =p và

P A¯

=P(X =0) =1−p=q

Khi đó biến ngẫu nhiên X được gọi là biến ngẫu nhiên Bernoulli với tham số p, ký hiệu X ∼B(1;p).

Bảng phân phối xác suất của biến ngẫu nhiên Bernoulli có dạng

X 1 0

P p q

Dựa vào bảng phân phối xác suất của biến ngẫu nhiên Bernoulli ta dễ dàng tính đượcE(X) =p và Var(X) =pq.

Định nghĩa (Biến ngẫu nhiên nhị thức)

Thực hiện n phép thử Bernoulli độc lập với xác suất thành công trong mỗi phép thử là p. Gọi X là số lần thành công (biến cố A xảy ra) trong n phép thử thì

X =X1+· · ·+Xn

với Xi,(i =1, . . . ,n), là biến ngẫu nhiên Bernoulli. Khi đó X là biến ngẫu nhiên rời rạc với miền giá trị S={0, . . . ,n} và xác suất

P(X =k) =Cnkpkqn−k, k ∈S

X được gọi là có phân phối nhị thức với các tham số n, p ký hiệu X ∼B(n;p).

Định lý (Các đặc trưng của biến ngẫu nhiên nhị thức) Nếu X là biến ngẫu nhiên có phân phối nhị thức B(n,p) thì

i) E(X) =np. ii) Var(X) =npq.

iv) Với x , h là hai số nguyên nguyên dương thì

P(x ≤X ≤x+h) =P(X =x)+P(X =x+1)+· · ·+P(X =x+h).

Ví dụ

Hàng đóng thành kiện, mỗi kiện 10 sản phẩm, trong đó có 3 phế phẩm. Khi kiện hàng được giao cho khách hàng, khách hàng sẽ lấy ngẫu nhiên ra 2 sản phẩm trong kiện để kiểm tra. Nếu cả hai sản phẩm đều tốt, kiện hàng sẽ được nhận, ngược lại kiện hàng sẽ bị trả lại. Gọi X là số kiện hàng được nhận trong số 100 kiện hàng giao cho khách hàng. TìmE(X),Var(X)

Định nghĩa (Phân phối Poisson)

Nếu biến ngẫu nhiên rời rạc X nhận giá trị nguyên dương k, (k =0,1,2, . . .)với xác suất

P(X =k) = λ ke−λ

k! , k =0,1,2, . . .

Thì biến ngẫu nhiên X được gọi là có phân phối Poisson với tham sốλ, ký hiệu X ∼P(λ).

Một số biến ngẫu nhiên thường được xem là tuân theo phân phối Poisson

i) Số lỗi in trong một (hoặc một số) trang sách.

ii) Số người sống lâu trên 100 tuổi trong một cộng đồng dân cư. iii) Số người đến một bưu điện nào đó trong một ngày.

iv) Số tai nạn hoặc sự cố giao thông xảy ra tại một điểm giao thông trong một ngày ...

Ví dụ

Giả sử số lỗi in trong một trang nào đó của quyển sách có phân phối Poisson với tham sốλ= 12. Tính xác suất có ít nhất một lỗi in trong trang này.

Định lý (Các đặc trưng của biến ngẫu nhiên có phân phối Poisson)

Nếu biến ngẫu nhiên X có phân phối Poisson với tham sốλ, X ∼P(λ) thì

i) Kỳ vọngE(X) =λ. ii) Phương saiVar(X) =λ.

Định nghĩa (Phân phối đều)

Biến ngẫu nhiên liên tục X được gọi là có phân phối đều trên đoạn [a;b], ký hiệu X ∼U[a;b], nếu hàm mật độ xác suất của X có dạng f(x) =    1 b−a khix ∈[a,b] 0 nơi khác

Từ định nghĩa trên ta có được hàm phân phối xác suất của X ∼U[a;b] F(x) =      0 khi x <a x−a b−a khi x ∈[a,b] 1 khi x >b

Định lý (Các đặc trưng của biến ngẫu nhiên có phân phối đều) Cho X là biến ngẫu nhiên có phân phối đều trên[a,b]

(X ∼U[a,b]) thì

i) Kỳ vọngE(X) = b−2a. ii) Phương saiVar(X) = (a−12b)2. Ví dụ

Lịch xuất bến của một trạm xe buýt như sau: chiếc xe đầu tiên trong ngày sẽ khởi hành vào lúc 7h, sau 15 phút sẽ có một xe khác đến trạm. Giả sử một hành khách đến trạm trong khoảng thời gian từ 7h - 7h30. Tìm xác suất để hành khách này chờ

a ít hơn 5 phút. b ít nhất 12 phút.

Định nghĩa (Phân phối chuẩn)

Biến ngẫu nhiên liên tục X nhận giá trị trong khoảng(−∞,+∞) được gọi là có phân phối chuẩn tham sốµ,σ nếu hàm mật độ xác suất có dạng f(x) = 1 σ√2π exp − (x−µ)2 2σ2 ! − ∞<x <+∞ (1) trong đóµ,σ là hằng số vàσ >0,−∞< µ <+∞, ký hiệu X ∼N µ;σ2.

Nhờ vào định lý sau, nến ngẫu nhiênX có phân phối chuẩn thì biến ngẫu nhiên tuyến tính củaX cũng có phân phối chuẩn. Định lý (Tính "tuyến tính" của phân phối chuẩn)

Nếu biến ngẫu nhiên X có phân phối chuẩn với kỳ vọngµ, phương saiσ2 và nếu Y =aX+b, (a, b là hằng số và a6=0), thì Y có phân phối chuẩn với kỳ vọng aµ+b và phương sai a2σ2. Định lý

Nếu các biến ngẫu nhiên X1, . . . ,Xn là độc lập và nếu Xi có phân phối chuẩn với kỳ vọngµi và phương saiσi2,(i =1,2, . . . ,n), thì tổng X1+· · ·+Xn có phân phối chuẩn với kỳ vọng là

Bổ đề

Nếu các biến ngẫu nhiên X1, . . . ,Xn là độc lập và Xi có phân phối chuẩn với kỳ vọngµi và phương saiσi2,(i =1, . . . ,n). ai, . . . ,an và b là các hằng số sao cho có ít nhất một ai 6=0, thì biến ngẫu nhiên a1X1+· · ·+anXn+b có phân phối chuẩn với kỳ vọng a1µ1+· · ·+anµn và phương sai a2

1σ12+· · ·+a2 nσ2n.

Định nghĩa (Phân phối chuẩn hóa)

Biến ngẫu nhiên X được gọi là có phân phối chuẩn hóa nếu nó có phân phối chuẩn với tham sốµ=0 vàσ2 =1, ký hiệu

X ∼N(0;1).

Theo quy ước, hàm phân phối của biến ngẫu nhiên chuẩn hóa được ký hiệu làΦ(x), tức Φ(x) = √1 2π Z x −∞ e−y 2 2dy

X ∼N µ;σ thì

σ có phân phối chuẩn hóa hay X−µ

σ ∼N(0;1)

Dựa vào tính chất này ta có thể tính xác suất của biến ngẫu nhiên X ∼N µ;σ2. P(X <b) = P X −µ σ < b−µ σ = Φ b−µ σ (2) Tương tự, vớia<b thì P(a≤X <b) = P(X <b)−P(X <a) = Φ b−µ σ −Φ a−µ σ (3)

NếuX ∼N µ;σ2 thì P(|X −µ|<kσ) =P −k < X−µ σ <k =2Φ(k)−1 Vớik=3 ta có quy tắc 3-sigma:

P(|X −µ|<3σ) =P −k < X −µ σ <k =2Φ(3)−1≈0.9973

"Sai số giữaX vàµkhông quá 3σ là gần chắc chắn (xác suất gần bằng 1)."

Định nghĩa (Phân vị chuẩn hóa) Cho biến ngẫu nhiên X ∼N µ;σ2

, phân vị chuẩn hóa mứcα, ký hiệu xα, là giá trị của biến ngẫu nhiên X thỏa mãn điều kiện

P(X <xα) =α Ví dụ

Đường kính của một chi tiết máy do một máy tiện sản xuất có phân phối chuẩn với kỳ vọng 20mm, phương sai(0.2mm)2. Tính xác suất lấy ngẫu nhiên một chi tiết