2
3.2.4. ƯỚC LƯỢNG CỦA TRUNG BÌNH VÀ PHƯƠNG SAI
3.2.4. ƯỚC LƯỢNG CỦA TRUNG BÌNH VÀ PHƯƠNG SAI.ƯỚC LƯỢNG CỦA TRUNG BÌNH VÀ PHƯƠNG SAI.
Ta chọn ngẫu nhiên n cá thể trong một dân số gồm N cá thể. Ta quan tâm đến đặc trưng định lượng Y của dân số với trung bình và phương sai V(Y). Trong mẫu đó, đặc trưng Y có
trung bình và phương sai đo được lần lượt là và . (3.8) Lưu ý là các giá trị và σ2 thay đổi tùy theo mẫu thử, do đó chúng là các biến ngẫu nhiên với trung bình và phương sai riêng khác nhau.
Ước lượng trung bình của Y:
Thông thường trung bình của Y, tức là được ước lượng bởi: . (3.9)còn được gọi là trung bình tích lũy (hay trung bình cộng). Ta chứng minh được đây là ước lượng đúng(unbiased), nghĩa là
Ước lượng phương sai của Y:
σ2 là một ước lượng của V(Y), nhưng là ước lượng không đúng, ta chứng minh được kì vọng của σ2 luôn nhỏ hơn V(Y), tức ước lượng là thiếu.
Các ước lượng đúng của V(Y) là:
(3.10) trong trường hợp lấy mẫu có hoàn lại
Đồ Án Tốt Nghiệp Trang 36
(3.11) trong trường hợp lấy mẫu không hoàn lại.
Trong trường hợp mẫu lớn, phép tính có hoàn lại và phép tính không hoàn lại là như nhau,
vì xấp xỉ bằng 1. Vì vậy trong trường hợp tổng quát ước lượng đúng của V(Y)
là: (3.12) được gọi là phương sai tích lũy của Y. Xem thêm chứng minh trong bài Phương sai
Tính hiệu quả và tính hội tụ
Mức độ dao động của quanh kì vọng của nó phụ thuộc vào phương sai của nó, ký hiệu bởi . Phương sai này được tính theo V(Y).
(3.13)trong trường hợp lấy mẫu có hoàn lại
(3.14) trong trường hợp lấy mẫu không hoàn lại.
Ta nhận thấy với N rất lớn hai giá trị trên gần như bằng nhau. Phần sau đây ta chỉ xét trường hợp lấy mẫu có hoàn lại, với giả thuyết N là rất lớn.
Rõ ràng n càng lớn, càng nhỏ. Do đó, mẫu càng lớn, ước lượng càng hiệu quả. Bất đẳng thức Bienaymé-Tchebychev chỉ ra rằng, với mọi số thực dương ,
(3.15)nên nên
(3.16)
Vì hội tụ về 0 khi n tiến về vô cực, nên ta cũng có điều tương tự với . (3.17) Ước lượng là hội tụ.
Phân chia dân số thành các lớp đồng nhất để làm mẫu điều tra có thể làm giảm đáng kể giá trị phương sai của ước lượng, do đó ước lượng sẽ càng hiệu quả.
Lấy mẫu một cách ngẫu nhiên với xác suất không đồng đều, dẫn đến điều tra nhiều lần hoặc co cụm, sẽ làm thay đổi các công thức được tính trên.
Cuối cùng, việc dùng thêm các thông tin phụ hợp lý cho phép chỉnh sửa các ước lượng để có được các kết quả gần với giá trị thật cần ước lượng hơn.
Khả năng ước lượng kì vọng và phương sai cho phép ước lượng các tham số của một phân phối xác suất (phân phối bình thường, phân phối Poisson vv...).Trong xác suất, ta thường xác định một phân phối xác suất lý thuyết dựa vào các thực nghiệm thống kê. Trong trường hợp biến ngẫu nhiên rời rạc hữu hạn, ta dùng ước lượng cho mỗi xác suất pk, tần suất fk tính từ mẫu thử. Các giá
trị của fk là các biến ngẫu nhiên, dĩ nhiên các ước lượng này không thể bằng chính xác các giá
trị pk. Để làm rõ sự sai khác giữa chúng có đáng kể hay không, ta thực hiện các kiểm định giả
thuyết thống kê, trong đó phổ biến nhất là kiểm định χ² (Chi bình phương).