Ướclượng tham sốcủatổngthể
Nguồn: thunhan.wordpress.com
(Nội dung phần này được trích từ giáo trình XSTK của Dự án Đào tạo giáo
viên THCS – tác giả Nguyễn Đình Hiển – NXB Đại học Sư Phạm Hà Nội)
Sau khi lấy mẫu và tính một số thống kê ta phải dùng các thống kê để ước lượng
các thamsốcủatổng thể. Có 2 cách tiếp cận:
1. Ướclượng điểm: Giả sử tổngthể có thamsố Θ, sau khi khảo sát mẫu ta tính
được các thống kê, dựa vào các thống kê để đưa ra 1 số T thay thế Θ gọi là ước
lượng điểm của Θ.
• Không chệch: hiểu 1 cách đơn giản là ướclượng không chứa sai số hệ
thống, tức là không thiên về phía đưa ra các giá trị bé hơn Θ hoặc không
thiên về phía đưa ra các giá trị lớn hơn Θ
.
• Hiệu quả: trong các ướclượng có cùng tính chất, chọn ướclượng có
phương sai nhỏ nhất.
• Vững: khi tăng dung lượng mẫu n lên vô hạn thì ướclượng sẽ dần đến Θ
(dần đến theo xác suất).
• Chắc hay bền: không thay đổi nhiều khi trong mẫu có các sốliệu quá nhỏ
hay quá lớn.
Nếu không thể chọn ướclượng tốt trên mọi phương diện thì, tùy theo mục đích, có
thể chọn ướclượng thỏa mãn 1 số tiêu chuẩn trong rất nhiều tiêu chuẩn đưa ra.
Ví dụ:
• Khi có phân phối chuẩn N(μ;σ
2
) thì ướclượng trên nhiều mặt là trung bình
cộng và phương sai mẫu σ
2
• Khi có phân phối nhị thức B(n,p) thì ướclượng tốt củathamsố p là tần
suất.
2. Ướclượng khoảng: Đây là cách tiếp cận có nhiều ứng dụng trong các ngành
khoa học đòi hỏi phải thường xuyên xử lí sốliệu như sinh học, y học, hóa học,
kinh tế… Theo cách tiếp cận này sau khi tính các thống kê của mẫu quan sát, ta
đưa ra khoảng [a;b] chứa thamsố Θ . Cận dưới a và cận trên b tính theo 1 quy tắc
cụ thể dựa trên các thống kê và dựa trên mức độ tin cậy P.
Sau khi chọn mẫu, ta đưa ra khoảng tin cậy [a; b], nếu Θ ở trong [a; b] thì khoảng
tin cậy đưa ra đúng, nếu Θ ở ngoài khoảng [a; b], thì khoảng tin cậy đưa ra sai.
Như vậy mỗi khoảng tin cậy chỉ có thể đúng hoặc sai, xác suất đúng là P, xác suất
sai a = 1 – P, hiểu đơn giản là nếu tính khoảng tin cậy theo quy tắc đã đưa ra thì
trung bình trong 100 trường hợp, P.100 trường hợp có khoảng tin cậy đúng.
Không đi sâu vào lý thuyết, ta đưa ra quy tắc ước lượngthamsố cho ba trường
hợp:
2.1. Ướclượng kỳ vọng μ của phân phối chuẩn khi biết phương sai σ
2
Các bước cần làm để ướclượng μ:
+ Chọn mẫu kích thước n, tính trung bình cộng . Chọn mức tin cậy γ (α = 1 - γ
gọi là mức sai cho phép hay mức ý nghĩa).
+ Dùng bảng tích phân hàm Laplace
để tính giá trị tới hạn
, tức là giá trị u sao cho:
+ Ướclượng m theo bất đẳng thức kép:
(1)
Lưu ý: nếu hàm phân phối chuẩn là
thì tính , tức là giá
trị u sao cho:
. Giá trị này ở 1 số sách còn được cho bởi bảng phân
vị chuẩn
Ví dụ: Cân 36 con gà được trọng lượng trung bình . Hãy ướclượng kỳ
vọng μ ở mức tin cậy 99% nếu trọng lượng gà phân phối chuẩn N(μ; 0,09)
Giải:
Với mức tin cậy 99%:
(Hoặc:
Tra bảng phân vị chuẩn
Ta có khoảng ướclượng trung bình:
Hay:
Ví dụ 2: Phân tích vitamin C của 17 mẫu được . Với mức tin cậy 95%,
hạy ướclượng kỳ vọng μ nếu lượng vitamin phân phối chuẩn N(μ;σ
2
) với σ = 3,98
mg
Với mức tin cậy 95%:
(Hoặc:
Tra bảng phân vị chuẩn
Khi đó khoảng ướclượng hàm lượng vitamin trung bình là:
Hay:
2. Ướclượng kỳ vọng của phân phối chuẩn khi không biết phương sai:
TH1: Khi n đủ lớn (n > 30): thay σ ở công thức (1) bằng độ lệch chuẩn hiệu
chỉnh s.
TH2: Khi n < 30
Các bước cần làm để ướclượng m:
+ Chọn mẫu kích thước n, tính trung bình cộng . Tính phương sai mẫu
+ Dùng bảng phân phối Student, tính giá trị tới hạn , tức là giá trị t ở cột
α, dòng n – 1
+ Ướclượng m theo bất đẳng thức kép:
(2)
Ví dụ: Để ướclượng năng suất một giống ngô, người ta theo dõi 25 mảnh ruộng.
Sau khi thu hoạch được
(đơn vị tạ/ha). Giả thiết năng suất ngô
phân phối chuẩn. Mức tin cậy P = 0,95.
Ta có:
. Tra bảng phân phối Student ta được: t(24; 0,05) =
2,064
Vậy khoảng ướclượng năng suất trung bình của giống ngô:
Hay:
3. Ước lượng xác suất p của phân phối nhị thức:
Một tổngthể gồm 2 loại cá thể với sốlượng rất lớn, tỉ lệ loại A là p (chưa
biết). Lấy ngẫu nhiên 1 cá thể, có thể coi xác suất được các thể loại A là p. Lấy
ngẫu nhiên n cá thể, trong đó có m cá thể loại A.
Nếu n lớn (n > 100):
+ Lấy mẫu kích thước n, đếm tần số (m) xuất hiện cá thể loại A, tính tần suất
+ Dùng bảng tích phân hàm Laplace
để tính giá trị tới hạn
, tức là giá trị u sao cho:
+ Ướclượng m theo bất đẳng thức kép:
(3)
4. Tính kích thước mẫu khi ướclượng trung bình:
Theo (1), nửa chiều dài khoảng ước lượng: . Nếu muốn ướclượng
đạt độ chính xác ε thì phải lấy L ≤ ε. Từ đó:
5. Tính kích thước mẫu khi ước lượng xác suất p:
Theo (3), nửa chiều dài khoảng ướclượng . Từ đó:
. Hay: do
. một số thống kê ta phải dùng các thống kê để ước lượng
các tham số của tổng thể. Có 2 cách tiếp cận:
1. Ước lượng điểm: Giả sử tổng thể có tham số Θ,. khoảng ước lượng năng suất trung bình của giống ngô:
Hay:
3. Ước lượng xác suất p của phân phối nhị thức:
Một tổng thể gồm 2 loại cá thể với số lượng