V. KỲ VỌNG VÀ PHƯƠNG SA
THỐNG KÊ MÔ TẢ
Ị KHÔNG GIAN MẪU
ðể nghiên cứu tính chất nào ñó của các vật thể của một tập hợp lớn, người ta thường lấy một số vật thể ñể nghiên cứu, rồi từ ñó rút ra kết luận cho tất cả vật thể trong tập hợp.
+ Ví dụ. ðể xác ñịnh tuổi thọ của một loại bóng ñèn, người ta không thể thử nghiệm
tất cả bóng ñèn, mà chỉ thử nghiệm một số bóng rồi suy ra tuổi thọ chung (tất nhiên với ñộ tin cậy nào ñó).
• ðịnh nghĩa. Tập hợp tất cả vật thể ban ñầu gọi là tập tổng thể. Mẫu là tập con các vật thể lấy ra từ tập tổng thể. Số phần tử của mẫu gọi là cỡ mẫu.
Bằng phương pháp nào ñó có thể lấy ra nhiều mẫu khác nhau cùng cỡ mẫụ Tập hợp tất cả các mẫu cùng cỡ mẫu của một tập tổng thể gọi là không gian mẫu ,
và mỗi mẫu ñược coi là một ñiểm của không gian mẫụ
Muốn cho từ mẫu lấy ñược có thể suy ra chính xác tính chất của tập tổng thể thì mẫu phải tiêu biểụ Mẫu ñược coi là tiêu biểu nếu người ta lấy mấu một cách ngẫu nhiên, tức là mọi phần tử của tập tổng thể có thể rơi vào mẫu với xác suất như nhau (có thể chọn hú hoạ hoặc sinh số ngẫu nhiên bằng máy tính).
Mẫu có hai tính chất: lặp hoặc không lặp và có thứ tự hoặc không có thứ tự. Gọi N là số tất cả vật thể, n là cỡ mẫụ Mẫu có lặp có thứ tự là một chỉnh hợp lặp chập n từ N phần tử và số mẫu là Nn Mẫu không lặp có thứ tự là một chỉnh hợp không lặp chập n từ N phần tử và số mẫu n là ĂN, n) = N(N−1) … (N−n+1) Mẫu có lặp không thứ tự là một tổ hợp lặp chập n từ N phần tử và số mẫu là C(N+n−1, n)
Mẫu không lặp không thứ tự là một tổ hợp chập n từ N phần tử và số mẫu là C(N, n)
Nếu N lớn và n nhỏ thì tỉ lệ số mẫu lặp và không lặp xấp xỉ 1, như vậy việc lấy mẫu lặp và không lặp cũng cho kết quả gần như nhaụ
Bây giờ giả sử tính chất của vật thể cần nghiên cứu là ñại lượng ngẫu nhiên X. Khi ñó mỗi mẫu cỡ n sẽ cho kết quả là bộ (X1, X2, …, Xn). Ta nói là ñã lấy mẫu
(X1, X2, …, Xn) từ ñại lượng ngẫu nhiên X.
Mẫu (X1, X2, …, Xn) ñược phân lớp theo một trong hai cách sau:
(i) Phân lớp ñơn:
{(xi, ni) | 1 ≤ i ≤ k }
với x1 < x2 < … < xk và ni là tần số xuất hiện xi , i=1,…,k, ∑ni = n
(ii) Phân lớp ghép:
{([ai, ai+1), ni) | 1 ≤ i ≤ k }
với a1 < a2 < … < ak và ni là số xi rơi vào khoảng [ai; ai+1), i=1,…,k, ∑ni = n.