- Các nhóm phụ được chọn lựa theo các tiêu chí liên quan đến các biến số nghiên
c. Chọn mẫu mở rộng (Snowball)
5.1 Các khái niện căn bản liên quan đến chọn mẫu và xác định cỡ mẫu
Giá trị trung bình () của mẫu rút ra từ một dân số cho trước là một giá trị ước lượng
điểm và là thông số tốt nhất dùng để ước lượng giá trị trung bình chưa biết của dân số, µ.
Sai số chuẩn. Chúng ta không thể coi trung bình mẫu là trung bình dân số. Tuy nhiên, chúng ta có thểước lượng khoảng tin cậy mà trung bình dân số µ rơi vào. Ta có thể áp dụng công thức tính sai số chuẩn (standard error of the mean) - σhay làse.
n
X σ
σ =
với
σ = sai số chuẩn của giá trị trung bình hay là độ lệch chuẩn của tất cả giá trị trung bình s có thể có.
σ = độ lệch chuẩn của dân số
n = cỡ mẫu
Độ lệch chuẩn của mẫu được sử dụng như là ước lượng không chệch cho độ lệch chuẩn của dân số. n s x= σ với s = độ lệch chuẩn của mẫu n Giả sử ta có: n1 = 10, 1 = 3,0 và s1 = 1,15 n s x= σ = 10 15 . 1 = 0,36
Ước lượng giá trị trung bình của dân số.
Giá trị trung bình của dân số, µ, có thểđược ước lượng theo công thức sau: µ = ± σ
Bởi vì chúng ta không điều tra tổng thể nên ta chưa biết giá trị µ và σ. Tuy nhiên, ta có thể áp dụng công thức µ = ± σ. Theo ví dụ trên, µ = ± σ. = 3,0 ± 0,36
Tuy nhiên, vì sai số chuẩn có tính chất như các thông số thống kê khác, ta chỉ có thể có mức tin cậy 68% về giá trị ước lượng này. Điều này có nghĩa là một sai số chuẩn chỉ
chứa đựng ± 1Z hay là 68% diện tích dưới đường phân phối chuẩn.
Ta sẽ sử dụng chỉ số thống kê khoảng tin cậy (confidence interval). Để tăng độ tin cậy lên 95%, ta phải nhân sai số chuẩn với ± 1,96 (Z), khi 1,96 (Z) bao phủ 95% diện tích dưới đường phân phối chuẩn. Tương tự như vậy, để nâng độ tin cậy lên 99%, ta phải nhân sai số chuẩn với ± 3,0 (Z), khi 3,0 (Z) bao phủ 99% diện tích dưới đường phân phối chuẩn.
Do đó, khoảng tin cậy của giá trị trung bình dân số, µ sẽ là:
Ở mức tin cậy 68%: 2,64 – 3,36 (µ = 3,0 ± 0,36)
Ở mức tin cậy 95%: 2,29 – 3,71 (µ = 3,0 ± 0,71)
Ở mức tin cậy 99%: 1,92 – 4,08 (µ = 3,0 ± 1,08)