Kỳ vọng toán - Định nghĩa Kỳ vọng cho đại lượng ngẫu nhiên rời rạc: Giả sử đại lượng ngẫu nhiên rời rạc X có bảng phân phối xác suất như sau: Khi đó, kỳ vọng của X, ký hiệu là EX được
Trang 2DANH SÁCH SINH VIÊN
Trang 3CHƯƠNG II: CÁC THAM SỐ ĐẶC TRƯNG CỦA ĐẠI LƯỢNG
NGẪU NHIÊN
1 Kỳ vọng toán
- Định nghĩa (Kỳ vọng cho đại lượng ngẫu nhiên rời rạc):
Giả sử đại lượng ngẫu nhiên rời rạc X có bảng phân phối xác suất như sau:
Khi đó, kỳ vọng của X, ký hiệu là E(X) được tính bởi công thức:
E(X) = ∑ni=1xipi
- Định nghĩa (Kỳ vọng cho đại lương ngẫu nhiên liên tục):
Cho X là đại lượng ngẫu nhiên liên tục với hàm mật độ f (x) Nếu ∫−∞+∞xf(x)dx hội tụ tuyệt đối thì giá trị tích phân đó được gọi là kỳ vọng của X:
+ E(X + Y ) = E(X) + E(Y )
+ E(XY ) = E(X)E(Y ) nếu X, Y độc lập
- Ý nghĩa:
+ Kỳ vọng xấp xỉ giá trị trung bình có trọng số theo xác suất của ĐLNN X
+ Kỳ vọng là trung tâm điểm của phân phối mà các giá trị cụ thể của X sẽ tập trung quanh đó
+ Vì vậy, trong sản xuất kinh doanh, nếu cần chọn phương án để nâng cao năng suất hoặc lợi nhuận thì ta chọn phương án làm cho kỳ vọng của năng suất hoặc lợi nhuận cao hơn
2 Phương sai
- Định nghĩa (Phương sai của đại lượng ngẫu nhiên rời rạc):
Phương sai của đại lượng ngẫu nhiên rời rạc X được biểu diễn dưới dạng:
Var(X) = ∑ni=1(xi− E(X))2pi
Trang 4- Định nghĩa (Phương sai của đại lượng ngẫu nhiên liên tục):
Phương sai của đại lượng ngẫu nhiên liên tục X được biểu diễn dưới dạng:
Var(X) = ∫−∞+∞(xi − E(X))2f(x)dxtrong đó, f (x) là hàm mật độ xác suất của X
- Định nghĩa (Số yếu vị (Mode)):
Số yếu vị (hay Mode) của đại lượng ngẫu nhiên X là giá trị xuất hiện nhiều nhất trong dữ liệu
+ Nếu X rời rạc thì mode là giá trị X có xác suất cực đại
+ Nếu X liên tục, thì mode là giá trị X mà tại đó hàm mật độ xác suất nhận giá trị lớn nhất, ký hiệu là mod (X)
Đại lượng ngẫu nhiên X có thể có một hay nhiều mode
- Định nghĩa (Trung vị - median)
Trung vị (hay median) của đại lượng ngẫu nhiên X là trị số m thỏa điều kiện
P(X < m) ≤ 0.5,
và
P(X > m) ≤ 0.5, được ký hiệu là med(X)
Trang 54 Hiệp phương sai (Covariance)
- Hiệp phương sai của vector ngẫu nhiên (X, Y ) được định nghĩa như sau:
Cov(X, Y ) = E[(X − E(X))(Y − E(Y ))]
= E(XY ) − E(X)E(Y ) = ∑ni=1∑mj=1xiyjpij− E(X)E(Y)
- Lưu ý:
+ Nếu X, Y là hai đại lượng ngẫu nhiên độc lập thì
E(XY ) = E(X) × E(Y ), do đó Cov(X, Y ) = 0 Khi đó ta nói X và Y không tương quan
+ Nếu Cov(X, Y ) 6= 0 thì X và Y tương quan Khi đó X, Y là hai đại lượng ngẫu nhiên không độc lập
+ Nếu X = Y thì
Cov(X, X) = Cov(Y , Y ) = E(X2) − [E(X)]2 = Var(X) = Var(Y )
- Ý nghĩa của hiệp phương sai:
Hiệp phương sai đo độ dao động cùng hướng hay ngược hướng của X và Y Ở đây, ta hình dung X và Y dao động quanh trung điểm (kỳ vọng)
Nếu X và Y cùng hướng (cùng trên hoặc cùng dưới) thì Cov(X,Y) > 0
Nếu X và Y ngược hướng thì Cov(X,Y) < 0
+ |RXY| = 1 khi và chỉ khi X và Y phụ thộc tuyến tính Nếu RXY = 1 thì ta nói X và Y
có quan hệ tuyến tính với hệ số dương và ngược lại
+ Nếu X và Y độc lập với nhau thì RXY = 0 Tuy nhiên, nếu RXY = 0 thì chưa chắc X và
Y đã độc lập, khi đó ta nói chúng không tương quan với nhau
Trang 6THỰC HÀNH
Ví dụ 1
Trang 7Histogram của bộ dữ liệu
LỆNH TÍNH TOÁN DỮ LIỆU ĐIỂM TRUNG BÌNH MÔN LTXS CỦA SINH VIÊN
Trang 8• Phương sai điểm quá trình =VAR(F3:F32)
• Điểm trung vị điểm quá trình =MEDIAN(F3:F32)
• Độ lệch chuẩn của điểm quá trình =STDEV(F3:F32)
• Điểm xuất hiện nhiều lần nhất quá trình =MODE(F3:F32)
• Điểm trung bình giữa kỳ =AVERAGE(G3:G32)
• Phương sai điểm giữa kỳ =VAR(G3:G32)
• Điểm trung vị điểm giữa kỳ =MEDIAN(G3:G32)
• Độ lệch chuẩn của điểm giữa kỳ =STDEV(G3:G32)
• Điểm xuất hiện nhiều lần nhất giữa kỳ =MODE(G3:G32)
• Điểm trung bình cuối kỳ =AVERAGE(H22:H32)
• Phương sai điểm cuối kỳ =VAR(H3:H32)
• Điểm trung vị điểm cuối kỳ =MEDIAN(H3:H32)
• Độ lệch chuẩn của điểm cuối kỳ =STDEV(H3:H32)
• Điểm xuất hiện nhiều lần nhất cuối kỳ =MODE(H3:H32)
• Điểm trung bình điểm tổng kết =AVERAGE(I3:I32)
• Phương sai điểm tổng kết =VAR(I3:I32)
• Điểm trung vị điểm tổng kết =MEDIAN(I3:I32)
• Độ lệch chuẩn của điểm tổng kết =STDEV(I3:I32)
• Điểm xuất hiện nhiều lần nhất tổng kết =MODE(I3:I32)
• Hiệp phương sai của điểm cuối kỳ và điểm tổng kết =COVAR(H3:H32;I3:I32)
• Hệ số tương quan của điểm cuối kỳ và tổng kết =CORREL(H3:H32;I3:I32)
• Hiệp phương sai của điểm quá trình và điểm giữa kỳ
• Hiệp phương sai của điểm quá trình và điểm tổng kết =COVAR(F3:F32;I3:I32)
• Hệ số tương quan của điểm quá trình và điểm tổng kết
• Hệ số tương quan của điểm giữa kỳ và điểm tổng kết =COVAR(G3:G32;I3:I32)
• Hiệp phương sai của điểm giữa kỳ và điểm tổng kết =CORREL(G3:G32;I3:I32)
Ví dụ 2:
Trang 10Histogram của bộ dữ liệu
LỆNH TÍNH TOÁN DỮ LIỆU GIÁ TIỀN THEO QUÝ CỦA DÒNG ĐIỆN THOẠI
SAMSUNG GALAXY A NĂM 2022 TẠI TP HỒ CHÍ MINH
• Giá tiền xuất hiện nhiều lần nhất quý 1 =MODE(C3:C22)
• Giá tiền xuất hiện nhiều lần nhất quý 3 =MODE(E3:E22)
• Giá tiền xuất hiện nhiều lần nhất quý 4 =MODE(F3:F22)
Trang 11• Hệ số tương quan quý 2 và 3 =CORREL(D3:D22;E3:E22)
• Giá tiền lớn nhất quý 3 = MAX(E3:E22)
• Giá tiền lớn nhất quý 4 = MAX(F3:F22)
• Giá tiền nhỏ nhất quý 1 = MIN(C3:C22)
• Giá tiền nhỏ nhất quý 2 = MIN(D3:D22)
• Giá tiền nhỏ nhất quý 3 = MIN(E3:E22)
• Giá tiền nhỏ nhất quý 4 = MIN(F3:F22)
• Giá tiền nhỏ hơn 3.000 quý 1 = COUNTIF(C3:C22;"<3000")
• Giá tiền nhỏ hơn 3.000 quý 2 = COUNTIF(D3:D22;"<3000")
• Giá tiền nhỏ hơn 3.000 quý 3 = COUNTIF(E3:E22;"<3000")
• Giá tiền nhỏ hơn 3.000 quý 4 = COUNTIF(F3:F22;"<3000")
• Giá tiền tb nhỏ hơn 3.000 quý 1 = AVERAGEIF(C3:C22;"<3000")
• Giá tiền tb nhỏ hơn 3.000 quý 2 = AVERAGEIF(D3:D22;"<3000")
• Giá tiền tb nhỏ hơn 3.000 quý 3 = AVERAGEIF(E3:E22;"<3000")
• Giá tiền tb nhỏ hơn 3.000 quý 4 = AVERAGEIF(F3:F22;"<3000")
Trang 12CHƯƠNG III: CÁC QUY LUẬT PHÂN PHỐI XÁC SUẤT
I Các quy luật phân phối của đại lượng ngẫu nhiên rời rạc:
1 Quy luật phân phối đều U [a; b]:
2 Quy luật phân phối Bernoulli:
Một phép thử T được gọi là phép thử Bernoulli nếu chỉ có một trong hai biến cố có thể xảy ra; A hoặc 𝐴̅ Từ đó, ta có định nghĩa phân phối Bernoulli dưới đây:
Trong phép thử Bernoulli, đặt X là đại lượng ngẫu nhiên rời rạc, trong đó X = 1 nếu biến cố A xảy ra, X = 0 nếu biến cố A không xảy ra Khi đó ta nói X có phân phối Bernoulli với xác suất p, ký hiệu X ~B (1,p)
Nếu hiệu X ~B (1,p) thì P(X=1) = p; P(X=0) = q Do đó bảng phân phối xác suất của
• Giá trị B( x, n, p )= P( X ≤ x) = ∑x Cnk
k=0 pk(1 − p)n−k
• Cho đại lượng ngẫu nhiên X~B( n, p), khi đó kỳ vọng và phương sai lần lượt là: E(X) = np, Var(X) = npq
4 Quy luật phân phối siêu bội:
Phân phối siêu bội khá gần với phân phối nhị thức Tuy nhiên ở quy luật này, các phép thử không độc lập và xác suất biến cố A xuất hiện khác nhau ở các phép thử
Định nghĩa :
Trang 13• Cho một tập hợp gồm N phần tử, trong đó có m phần tử mang tính chất T Lấy
ra n phần tử ở tập hợp đó Gọi X là số phần tử mang tính chất T trong n phần tử lấy được, khi đó X là một đại lượng ngẫu nhiên nhận giá trị trong tập {0, 1, 2,…, min{m, n}} Phân phối xác suất cùa X được gọi là phân phối siêu bội, ký hiệu X~H(N, m, n)
• Bảng phân phối xác suất của X được biểu diễn dưới dạng:
5 Phân phối Poisson: (s.119)
Phân phối này dựa trên một đại lượng ngẫu nhiên rời rạc, thường dùng để ước lượng
số lần xảy ra trong một khoảng thời gian hoặc không gian xác định
Định nghĩa:
• Gọi x là đại lượng ngẫu nhiên rời rạc chỉ số lần xảy ra trong một khoảng thời gian hoặc không gian xác định nếu 2 tính chất dưới đây được thỏa:
1 Đối với hai khoảng bất kì có độ dài bằng nhau thì xác suất xảy ra bằng nhau
2 Việc xuất hiện hay không trong khoảng này độc lập với việc xuất hiện hay không trong khoảng khác, thì X có phân phối Poisson, ký hiệu X ~ P(λ), bảng phân phối xác suất của X có dạng:
Một số thí nghiệm Poisson:
1 Số lượng xe đến bến trong 1 giờ ( Thời gian là 1 giờ )
2 Số lỗi hỏng trên 1 diện tích vải
Tính chất của phân phối Poisson:
E(X) = Var(X) = λ
II Các quy luật phân phối của đại lượng ngẫu nhiên liên tục
1 Phân phối đều liên tục
Định nghĩa: Phân phối đều liên tục là một phân phối mà xác suất xảy ra như nhau cho mọi kết cục của đại lượng ngẫu nhiên liên tục Phân phối đều liên tục đôi khi còn được
Trang 14gọi là phân phối hình chữ nhật vì khi biểu diễn bằng hình vẽ sẽ có dạng hình chữ nhật Hàm mật độ xác suất của phân phối đều liên tục trên đoạn [a, b] có dạng:
f(x) = {
1
b−a nếu x ∈ [a, b]
0 nếu x ∉ [a, b]
2 Phân phối chuẩn
a) Phân phối chuẩn
Định nghĩa: Đại lượng ngẫu nhiên liên tục X được gọi là có phân phối chuẩn ứng với
kỳ vọng μ, độ lệch chuẩn σ khi hàm mật độ xác suất của nó có dạng:
f(x) = 1
σ√2πe(x− μ)22σ2 , ∀σ > 0, x∈ ℝ
Khi đó, ta ký hiệu X ~ N(μ, σ2)
b) Phân phối chuẩn tắc
Định nghĩa: Phân phối chuẩn trong trường hợp μ = 0, σ = 1 được gọi là phân phối chuẩn tắc Một đại lượng ngẫu nhiên liên tục X có phân phối chuẩn tắc được ký hiệu là
X ~ N(0,1) Khi đó, hàm mật độ xác suất (hay còn gọi là hàm mật độ Gauss) được xác định bởi:
f(x) = 1
√2πe−x22, ∀x∈ ℝ
III Các quy luật phân phối liên tục khác:
1 Phân phối Chi bình phương:
r(n2)2
n 2 nếu x ≥ 0
0 nếu x < 0
trong đó: r(u) = ∫ e0∞ −xxu−1dx
2 Phân phối Student
• Đại lượng ngẫu nhiên liên tục X được gọi là có phân phối Student với bậc tự do
n, ký hiệu là X ~ tn , khi nó có hàm mật độ xác suất
f(x) = r(
n+1
2 ) t(n2)√nπ(1 +x2
n)
n+1 2
• Cho X là đại lượng ngẫu nhiên liên tục có phân phối Student với bậc tự do n Khi đó:
E(X)= 0 với mọi n >1
n−2 với mọi n >2
Trang 15• Giá trị tới hạn Student, ký hiệu ta(n) là giá trị của đại lượng ngẫu nhiên T tuân theo quy luật phân phối Student với n bậc tự do thỏa mãn điều kiện
P(T > ta(n)) = α
ta(n) có tính chất: t1−a(n) = −ta(n)
3 Phân phối Fisher:
• Đại lượng ngẫu nhiên X có quy luật phân phối Fisher – Snedecor với bậc tự do
q−2)2 p+q−2 p(q−4), ∀q > 4
Trang 17b) Xác suất để có đúng 10 khán giả nhận được quà
P(X = 10) =BINOM.DIST(10;30;0,3;False)
* PHÂN PHỐI POISSON
Trang 18LỆNH TÍNH TOÁN DỮ LIỆU THEO PHƯƠNG PHÁP PHÂN PHỐI POISSON a) Xác suất để có 15 con bị dịch tả
Trang 19LỆNH TÍNH TOÁN DỮ LIỆU THEO PHƯƠNG PHÁP PHÂN PHỐI SIÊU BỘI:
- Xác suất để nhân viên lấy được 1 chiếc khẩu trang bị hư trong 5 chiếc khẩu trang
được lấy: P( X=1 ) =HYPGEOM.DIST(1, 5, 7, 20, FALSE)
- Xác suất để nhân viên lấy được nhiều nhất 2 chiếc khẩu trang bị hư trong 5 chiếc
khẩu trang được lấy: P(X≤2) =HYPGEOM.DIST(2, 5, 7, 20,TRUE)
* PHÂN PHỐI CHUẨN
Trang 20LỆNH TÍNH TOÁN DỮ LIỆU THEO PHƯƠNG PHÁP PHÂN PHỐI CHUẨN
a) Xác suất để 1 sinh viên chờ nhiều nhất 30 phút
Trang 21LỆNH TÍNH TOÁN DỮ LIỆU THEO PHƯƠNG PHÁP PHÂN PHỐI CHUẨN
* PHÂN PHỐI STUDENT
LỆNH TÍNH TOÁN DỮ LIỆU THEO PHƯƠNG PHÁP PHÂN PHỐI STUDENT
- P(T< 2,67) =TDIST(A4;B4;C4)
- P( T> 1,92) =TDIST(A5;B4;C4)
Trang 22* PHÂN PHỐI CHI BÌNH PHƯƠNG
LỆNH TÍNH TOÁN DỮ LIỆU THEO PHƯƠNG PHÁP PHÂN PHỐI CHI BÌNH
PHƯƠNG -X~X2(36) → P(X>10) =CHIDIST(10;36)
* PHÂN PHỐI FISHER – SNEDECOR
LỆNH TÍNH TOÁN DỮ LIỆU THEO PHƯƠNG PHÁP PHÂN PHỐI
FISHER – SNEDECOR
- X~F(30,20) → P(X>0,3) =FDIST(A2;B2;C2)