Chương 2 Thống kê mô tả và ước lượng tham số
2.5. Ước lượng khoảng kì vọng
Giả sử biến ngẫu nhiên X ∼ N(µ;σ2) có kì vọng E(X) = µ chưa biết, ước lượng khoảng cho µ có dạng l < µ < u.
Với α∈(0; 1) khá bé cho trước, giả sử ta xác định được các biến ngẫu nhiên
L và U sao cho
P(L < µ < U) = 1−α.
Khi đó với mỗi giá trị l của L và u củaU ta có được một ước lượng khoảng của
µ là l < µ < u.
α gọi là mức ý nghĩa, 1−α gọi là độ tin cậy của ước lượng.
2.5.1. Đã biết phương sai σ2 Phân vị của phân phối chuẩn tắc
Cho α ∈(0; 1) và Z ∼ N(0; 1). Ta gọi giá trị zα là phân vị mức α của phân phối chuẩn tắc Z nếu P(Z ≥zα) =α (tương đương với zα = Φ−1(1−α)).
Các phân vị zα có thể tìm ở bảng I.
Ví dụ 2.10.
z(0,2119) = Φ−1(0,7881) = 0,8; z(0,2981) = Φ−1(0,7019) = 0,53;
Giáo trình thống kê thực hành
Nếu {x1, x2, ..., xn} là một mẫu số liệu của biến ngẫu nhiênX ∼N(µ;σ2) với σ2
đã biết, thì với độ tin cậy 1−α, ước lượng khoảng của µ là
x−zα/2√σ n < µ < x+zα/2 σ √ n, (2.1) trong đó zα/2 tra ở Bảng I.
Ví dụ 2.11. Trọng lượng (kg) sản phẩm của cơng ty A có phân phối chuẩn
N(µ;σ2) với σ = 1 (kg). Chọn ngẫu nhiên 25 sản phẩm người ta tính được trung bình mẫu x= 50,1 (kg). Với độ tin cậy 95% hãy ước lượng khoảng trọng lượng trung bình của sản phẩm cơng ty A.
Giải. α = 0,05 suy ra zα/2=z(0,025) = 1,96 =zα/2√σ n = 1,96 1 √ 25 = 0,4.
Ước lượng khoảng trọng lượng trung bình của sản phẩm: 49,7< µ <50,5.
Chọn cỡ mẫu
Từ cơng thức ước lượng khoảng µ ta thấy rằng sai số của ước lượng |x−µ|
bé hơn hoặc bằng z(α/2)σ
n. Do đó với độ tin cậy 1−α, nếu muốn có ước lượng µ có sai số khơng vượt q ∆ cho trước thì ta cần chọn cỡ mẫu n thỏa mãn
zα/2σ n ≤∆ tương đương với
n≥zα/2σ
∆
2
.
2.5.2. Chưa biết phương sai σ2 và cỡ mẫu lớn (n > 30)
Trong trường hợp chưa biết phương sai nhưng cỡ mẫu lớn thì ta có thể thay
σ bởi ước lượng của nó là s trong cơng thức ước lượng 2.1. Hơn nữa, khi cỡ mẫu lớn thì theo Định lí giới hạn trung tâm, X−µ
σ/√
n có phân phối xác suất xấp xỉ chuẩn tắc. Vì vậy khi cỡ mẫu lớn (thường lấyn >30) thì chúng ta có thể bỏ qua giả thiết phân phối chuẩn của tổng thể.
Nếu {x1, x2, ..., xn} là một mẫu số liệu của biến ngẫu nhiênX ∼N(µ;σ2)với σ2
chưa biết. Với n đủ lớn,
x−zα/2√s
n < µ < x+zα/2 s
√
n
là ước lượng khoảng của µ, với độ tin cậy 100(1−α)%.
Ví dụ 2.12. Một trường đại học tiến hành một nghiên cứu xem trung bình một sinh viên tiêu hết bao nhiêu tiền điện thoại trong một tháng. Một mẫu ngẫu nhiên gồm 59 sinh viên được chọn và thu được kết quả (đơn vị: nghìn đồng)
14 18 22 30 36 28 42 79 36 52 15 47 95 16 27 111 37 63 127 23 31 70 27 11 30 147 72 37 25 7 33 29 35 41 48 15 29 73 26 15 26 31 57 40 18 85 28 32 22 37 60 41 35 26 20 58 33 23 35
Với độ tin cậy 95% hãy ước lượng khoảng số tiền điện thoại trung bình hàng tháng (µ) của một sinh viên.
Giải. Vì cỡ mẫu n = 59> 30 nên ta không cần phải kiểm tra phân phối chuẩn của tổng thể. Từ số liệu trên ta tính được x = 41,12 và s = 27,97. Từ đó tính được khoảng tin cậy 95% của µ là
33,96< µ <49,28.
2.5.3. Chưa biết phương sai σ2 và cỡ mẫu nhỏ (n≤ 30) Phân phối Student
Biến ngẫu nhiên liên tục X được gọi là có phân phối Student n bậc tự do nếu có hàm mật độ fn(x) = Γ( n+1 2 ) √ nπΓ(n2) 1 + x 2 n −n+1 2 ∀x∈R,
trong đó Γ(x) =R0∞ux−1e−udu gọi là hàm Gamma. Kí hiệu X ∼Tn.
Giáo trình thống kê thực hành Đồ thị hàm mật độ fn(x) của phân phối Tn có dạng như sau (fn(x) là hàm số chẵn).
Phân vị mức α của phân phối Studentk bậc tự do là giá trị tα,k sao cho P(Tk ≥
tα,k) = α và được cho ở Bảng II.
Ví dụ 2.13. t0,05;10 = 1,8125.
Nếu {x1, x2, ..., xn} là là một mẫu số liệu của biến ngẫu nhiên X ∼N(µ;σ2) với
σ2 chưa biết, thì với độ tin cậy 1−α, ước lượng khoảng kì vọng µ là
x−tα/2,n−1√s
n < µ < x+tα/2,n−1 s
√
n,
trong đó tα/2,n−1 tra ở Bảng II.
Ví dụ 2.14. Một mẫu số liệu về chiều cao của 25 sinh viên đại học A được chọn ngẫu nhiên người ta tính được trung bình mẫu x = 1,65 (m) với độ lệch chuẩn
s= 0,1 (m). Với độ tin cậy 95% hãy ước lượng khoảng chiều cho trung bình (µ) của sinh viên đại học A biết rằng chiều cao của sinh viên đại học A có phân phối chuẩn.
Giải. Ta có tα/2,n−1=t24(0,025) = 2,0639
=tα/2,n−1√s
Ước lượng khoảng chiều cao trung bình của sinh viên với độ tin cậy 59% là 1,61< µ <1,69.
Ví dụ 2.15. Một mẫu số liệu về trọng lượng (kg) của cá trắm 3 tháng tuổi được lấy ngẫu nhiên trong một trang trại nuôi trồng thủy sản như sau:
1,98 1,01 1,49 0,75 1,54 1,54
1,54 1,85 0,79 1,27 1,19 1,14
1,14 1,41 1,76 1,67 1,58 1,95
0,88 1,36 1,19 1,14
Với độ tin cậy 95% hãy ước lượng khoảng trọng lượng trung bình của cá trắm 3 tháng tuổi ở trang trại trên.
Giải.
Từ biểu đồ xác suất chuẩn ta có thể kết luận trọng lượng của cá trắm 3 tháng tuổi ở trang trại trên có phân phối chuẩn.
x= 1,37; s= 0,355 tα/2,n−1=t0.025,21= 2.080. =tα/2,n−1√s n = 2,080 0,355 √ 22 = 0,157.
Ước lượng khoảng trọng lượng trung bình của cá trắm 3 tháng tuổi ở trang trại: 1,21< µ <1,53.
Giáo trình thống kê thực hành