CHƯƠNG 4 : THỐNG KÊ TOÁN
2. Ước lượng tham số
2.1. Ước lượng điểm cho kỳ vọng, phương sai và xác suất.
2.1.1. Ước lượng điểm: Giả sử tổng thể có tham số Θ, sau khi khảo sát mẫu ta
tính được các thống kê, dựa vào các thống kê để đưa ra 1 số T thay thế Θ gọi là ước lượng điểm của Θ.
- Không chệch: hiểu 1 cách đơn giản là ước lượng không chứa sai số hệ thống, tức là khơng thiên về phía đưa ra các giá trị bé hơn Θ hoặc khơng thiên về phía đưa ra các giá trị lớn hơn Θ.
- Hiệu quả: trong các ước lượng có cùng tính chất, chọn ước lượng có phương sai
nhỏ nhất.
- Vững: khi tăng dung lượng mẫu n lên vơ hạn thì ước lượng sẽ dần đến Θ (dần
đến theo xác suất).
- Chắc hay bền: khơng thay đổi nhiều khi trong mẫu có các số liệu quá nhỏ hay
quá lớn.
Nếu không thể chọn ước lượng tốt trên mọi phương diện thì, tùy theo mục đích, có thể chọn ước lượng thỏa mãn 1 số tiêu chuẩn trong rất nhiều tiêu chuẩn đưa ra. Ví dụ:
- Khi có phân phối chuẩn N(μ;σ2) thì ước lượng trên nhiều mặt là trung bình cộng
và phương sai mẫu σ2
- Khi có phân phối nhị thức B(n,p) thì ước lượng tốt của tham số p là tần suất
2.1.2. Ước lượng khoảng
Đây là cách tiếp cận có nhiều ứng dụng trong các ngành khoa học địi hỏi phải thường xun xử lí số liệu như sinh học, y học, hóa học, kinh tế… Theo cách tiếp cận này sau khi tính các thống kê của mẫu quan sát, ta đưa ra khoảng [a;b] chứa tham số Θ . Cận dưới a và cận trên b tính theo 1 quy tắc cụ thể dựa trên các thống kê và dựa trên mức độ tin cậy P.
Sau khi chọn mẫu, ta đưa ra khoảng tin cậy [a; b], nếu Θ ở trong [a; b] thì khoảng tin cậy đưa ra đúng, nếu Θ ở ngoài khoảng [a; b], thì khoảng tin cậy đưa ra sai. Như vậy mỗi khoảng tin cậy chỉ có thể đúng hoặc sai, xác suất đúng là P, xác suất sai a = 1 – P, hiểu đơn giản là nếu tính khoảng tin cậy theo quy tắc đã đưa ra thì trung bình trong 100 trường hợp, P.100 trường hợp có khoảng tin cậy đúng.
Khơng đi sâu vào lý thuyết, ta đưa ra quy tắc ước lượng tham số cho ba trường hợp:
- Ước lượng kỳ vọng μ của phân phối chuẩn khi biết phương sai σ2 Các bước cần làm để ước lượng μ:
+ Chọn mẫu kích thước n, tính trung bình cộng . Chọn mức tin cậy γ (α = 1 – γ gọi là mức sai cho phép hay mức ý nghĩa).
+ Dùng bảng tích phân hàm Laplace để tính giá trị tới
hạn , tức là giá trị u sao cho:
+ Ước lượng m theo bất đẳng thức kép:
Lưu ý: nếu hàm phân phối chuẩn là thì tính , tức là giá
trị u sao cho: . Giá trị này ở 1 số sách còn được cho bởi bảng phân vị
chuẩn
2.2. Ước lượng khoảng tin cậy cho tham số P của biến ngẫu nhiên phân phốitheo quy luật không – một theo quy luật không – một
TH1: Khi n đủ lớn (n>30): thay σ ở công thức (1) bằng độ lệch chuẩn hiệu chỉnh s. TH2: Khi n < 30
Các bước cần làm để ước lượng m:
+ Chọn mẫu kích thước n, tính trung bình cộng . Tính phương sai mẫu
+ Dùng bảng phân phối Student, tính giá trị tới hạn , tức là giá trị t ở cột
α, dòng n – 1
+ Ước lượng m theo bất đẳng thức kép:
Ví dụ: Để ước lượng năng suất một giống ngô, người ta theo dõi 25 mảnh ruộng.
Sau khi thu hoạch được (đơn vị tạ/ha). Giả thiết năng suất ngô
phân phối chuẩn. Mức tin cậy P = 0,95.
Ta có: .
Tra bảng phân phối Student ta được: t(24; 0,05) = 2,064 Vậy khoảng ước lượng năng suất trung bình của giống ngơ:
Hay:
2.3. Ước lượng kỳ vọng của biến ngẫu nhiên phân phối theo quy luật chuẩn
Một tổng thể gồm 2 loại cá thể với số lượng rất lớn, tỉ lệ loại A là p
(chưa biết). Lấy ngẫu nhiên 1 cá thể, có thể coi xác suất được các thể loại A là p. Lấy ngẫu nhiên n cá thể, trong đó có m cá thể loại A.
Nếu n lớn (n > 100):
+ Lấy mẫu kích thước n, đếm tần số (m) xuất hiện cá thể loại A, tính tần suất
+ Dùng bảng tích phân hàm Laplace để tính giá trị tới
hạn , tức là giá trị u sao cho:
+ Ước lượng m theo bất đẳng thức kép:
2.4. Ước lượng phương sai của biến ngẫu nhiên phân phối theo quy luật chuẩn.
Theo (1), nửa chiều dài khoảng ước lượng: . Nếu muốn ước lượng đạt
độ chính xác ε thì phải lấy L ≤ ε. Từ đó: