PHÂN BỐ MẪU & ƯỚC LƯỢNG THAM SỐ THỐNG KÊ Tham số TK tập hợp chính θ Ước lượng θˆ estimator Giá trị ước lượng estimate Tỷ số tỷ lệ p pˆ hay f pˆ hay f • Ước lượng điểm point estimate
Trang 1PHÂN BỐ MẪU & ƯỚC LƯỢNG THAM SỐ THỐNG KÊ
Tham số TK tập
hợp chính θ
Ước lượng θˆ
(estimator)
Giá trị ước lượng (estimate)
Tỷ số (tỷ lệ) p pˆ hay f pˆ hay f
• Ước lượng điểm (point estimate):
θ = θˆ
Ước lượng gọi là không chệch (Unbiased estimators) khi
E(θˆ) = θ Độ chệch (the bias) = E(θˆ) – θ
Tập hợp chính
Mẫu ngẫu nhiên Phương sai σ2
Trung bình µ
Tỷ lệ p
n phần tử Phương sai s2
Trung bình X
Tỷ lệ f=X/n
Trang 2PHÂN PHỐI MẪU
Tập hợp chính ∼ N(µ, σ2) → X ∼ N(µ,σ2/n)
σ
1) (n
1 -n
χ
Cỡ mẫu n lớn (n > 30) → X ∼ N(µ,σ2/n)
Cỡ mẫu n lớn (n > 30) → E(f) = p
→ Var(f) = p(1-p)/n ≈ f(1-f)/n
ƯỚC LƯỢNG CÁC THAM SỐ THỐNG KÊ
• Khoảng ước lượng của µ với độ tin cậy 100(1– α)%:
Tập hợp chính có phân phối chuẩn, giả sử biết trước σ2:
x –
n
σ
Zα/2 < µ < x +
n
σ
Zα/2
Không biết σ2, cỡ mẫu n lớn → σ ≈ s:
x –
n
s
Zα/2 < µ < x +
n s
Zα/2
Trang 3chính có phân phối chuẩn:
x –
n
s
tn-1,α/2 < µ < x +
n
s
tn-1,α/2
• Khoảng ước lượng của σ2 với độ tin cậy 100(1– α)%:
Giả thiết THC có phân phối chuẩn:
2 2 α 1, n
2
χ
1) (n s
−
− < σ2 < 2
2 α 1,1 n
2
χ
1) (n s
−
−
−
• Khoảng ước lượng của ptrong phân phối nhị thức với độ tin cậy 100(1– α)%:
Cỡ mẫu n lớn → chuẩn hóa:
f –
n
f) f(1
Zα/2 − < p < f +
n
f) f(1
Zα/2 −
Trong đó: Zα/2 phân phối chuẩn hóa
tν, α/2 phân phối Student, bật tự do ν 2
α/2 ν,
χ phân phối Chi-square, bật tự do ν
Trang 4• Xác định kích thước lấy mẫu n đối với
khoảng tin cậy của µ:
Biết trước: Độ tin cậy (1-α)
Giả thiết THC có phân phối chuẩn
Trường hợp biết σ2 của THC:
n = α/22 2 2
ε
σ Z
Trường hợp chưa biết σ2 của THC:
n = 2n - 1, α/22 2
ε
s t
• Xác định kích thước lấy mẫu n đối với
khoảng tin cậy của p trong phân phối nhị thức:
n = α/22 2
ε
f) -f(1 Z
W = 2ε
Trang 5Trọng lượng các học sinh lớp 2 có phân phối chuẩn với độ lệch chuẩn = 1,2kg Chọn ngẫu nhiên 25 học sinh thì có trọng lượng trung bình là 19,8kg Tìm khoảng tin cậy 95% đối với trọng lượng trung bình của học sinh lớp 2
Giải: Từ số liệu có:
Độ tin cậy 100(1-α) = 95% => α = 0,05
Biết Sigma tập hợp chính, σ = 1,2
Trung bình mẫu x = 19,8
Cỡ mẫu n = 25
x –
n
σ
Zα/2 < µ < x +
n
σ
Zα/2
Zα/2 = Z0,05 = 1,96
Thay vào ta có 19,33 < µ < 20,27
ε =
n
σ
Zα/2 = 0,4704 là dung sai
Bề rộng khoảng là w = 2ε
• Khi w càng nhỏ thì ước lượng càng chính xác
• Với α và σ cho trước, n càng lớn thì w càng nhỏ
θˆ – ε θˆ θˆ + ε
W = 2ε
Trang 6Ví dụ
Mẫu ngẫu nhiên trọng lượng (kg) của 6 học sinh lớp 2 như sau:
Tìm khoảng tin cậy 90% đối với số trung bình của tất cả học sinh lớp 2 Giả sử phân phối trọng lượng của tất cả học sinh lớp 2 là
chuẩn
Giải: Từ số liệu ta có:
Độ tin cậy 100(1-α) = 90% => α = 0,10
Không biết Sigma tập hợp chính σ
Cỡ mẫu n = 6
Phải tính toán:
Trung bình mẫu x = 19,4833
Độ lệch chuẩn mẫu s = 0,98
x –
n
s
tn-1,α/2 < µ < x +
n
s
tn-1,α/2
tn-1,α/2 = t5 , 0.05 = 2,015
Thay vào ta có 18,67 < µ < 20,29
Trang 7Từ một lô thuốc, chọn ngẫu nhiên mẫu 15 viên thuốc nhức đầu cho thấy độ lệch chuẩn hàm lượng một chất xxyy trong mẫu là 0,8
Tìm khoảng tin cậy 90% của phương sai của lô thuốc Giả sử lô thuốc tuân theo phân phối chuẩn
Giải:
n = 15
s2 = 0,82 = 0,64
100(1-α) = 90% => α = 0,10
2 2 α 1, n
2
χ
1) (n s
−
− < σ2 < 2
2 α 1,1 n
2
χ
1) (n s
−
−
−
χ2
n-1,α/2 = χ2
14, 0.05 = 23,68
Thay vào ta có 0,378 < σ2 < 1,364
Trang 8Ví dụ
Một công ty nhận lô hàng gồm vài ngàn sản phẩm Người giám định lấy ngẫu nhiên 81 sản phẩm và thấy có 8 sản phẩm không đạt yêu cầu Tìm khoảng ước lượng của tỷ lệ sản phẩm không đạt trong toàn
bộ lô hàng với độ tin cậy 90%
Giải:
n = 81
f = 8/81 = 0,099 (tỷ lệ của mẫu)
100(1-α) = 90% => α = 0,1
Vì cỡ mẫu lớn n = 81 nên ta dùng phân phối chuẩn để ước lượng
f –
n
f) f(1
Zα/2 − < p < f +
n
f) f(1
Zα/2 −
Zα/2 = Z0.05 = 1,645
0,099 - 1,645*0,033 < p < 0,099 + 1,645*0,033
0,045 < p < 0,153 Nghĩa là tỷ lệ phế phẩm của toàn lô hàng trong khoảng 4,5%
đến 15,3% Kết luận này có độ tin cậy 90%