Từ khái niệm về điều tra chọn mẫu cho thấy có hai tổng thể là tổng thể chung và tổng thể mẫu.
Tổng thể chung là tổng thể bao gồm toàn bộ các đơn vị thuộc đối tƣợng điều tra. Số đơn vị của tổng thể chung thƣờng đƣợc ký hiệu là N và đƣợc biểu thị bằng dãy số lƣợng biến.
X1, X2 , X3 ……….. Xn , …..XN
Tổng thể mẫu là tổng thể bao gồm một số đơn vị nhất định đƣợc chọn ra từ tổng thể chung để điều tra thực tế. Số đơn vị của tổng thể mẫu thƣờng đƣợc ký hiệu là n. Tổng thể mẫu gồm n đơn vị tổng thể thƣờng đƣợc biểu diễn dƣới dạng bản phân phối.
55 Có hai cách chọn ngẫu nhiên số lƣợng n đơn vị của tổng thể mẫu:
Thứ nhất, chọn mẫu nhiều lần (chọn hoàn lại)
Chọn mẫu nhiều lần là khi mỗi đơn vị đƣợc chọn ra để đăng ký rồi lại trả về tổng thể chung. Nhƣ vậy số đơn vị tổng thể chung không thay đổi trong suốt quá trình lấy mẫu. Xác suất đƣợc chọn của mỗi đơn vị tổng thể là bằng nhau.
Gọi K là số khả năng thiết lập đƣợc tổng thể mẫu thì số khả năng đó trong chọn nhiều lần đƣợc xác định theo công thức sau:
n
N
K
Thứ hai, chọn mẫu 1 lần (chọn không hoàn lại)
Chọn mẫu một lần là khi mỗi đơn vị đã đƣợc chọn để đăng ký rồi sẽ đƣợc xếp riêng ra không trả lại về tổng thể chung nữa, do đó không có khả năng chọn lại, xác suất đƣợc chọn của mỗi đơn vị không bằng nhau.
Khi đó số khả năng thiết lập tổng thể mẫu đƣợc xác định theo công thức:
)! ( ! ! n N n N C K nN
Nhƣ vậy với cả hai cách chọn mẫu ngẫu nhiên thì số lƣợng mẫu có thể hình thành là rất lớn. Mẫu đƣợc chọn ra để điều tra chỉ là một trong số rất lớn số lƣợng mẫu có thể đƣợc hình thành.
Nếu ký hiệu:
- ̅ - là bình quân, tỉ lệ, phƣơng sai của tổng thể chung.
- ̅ - là bình quân, tỉ lệ, phƣơng sai của tổng thể mẫu thứ i (i=1,2,3,…Q) và thực chất đó là biến ngẫu nhiên và ngƣời ta đã chứng minh đƣợc rằng: Nếu n 30 thì ̅
đƣợc xem nhƣ phân phối chuẩn với: - Kỳ vọng các bình quân mẫu:
̅ ̅
- Phƣơng sai các bình quân mẫu:
̅ à
̅ ô à
- Kỳ vọng các tỉ lệ mẫu:
56 - Phƣơng sai các tỉ lệ mẫu:
à
ô à
Nếu n < 30 thì ̅ đƣợc xem phân phối theo quy luật Student