- Các nhóm phụ được chọn lựa theo các tiêu chí liên quan đến các biến số nghiên
c. Chọn mẫu mở rộng (Snowball)
5.2 Xác định cỡ mẫu theo trung bình
Trước khi tính cỡ mẫu mong muốn, chúng ta hãy coi lại các thông tin cần thiết: 1. Mức chính xác mong muốn và làm thế nào để lượng hóa nó:
a. Mức tin cậy (confidence level) mà ta muốn đạt được. b. Độ lớn của khoảng tin cậy (size of the interval estimate). 2. Độ biến thiên kỳ vọng của dân số.
3. Có cần thiết điều chỉnh dân số hữu hạn hay không.
Mức chính xác
Ta phải xác định rõ mức chính xác mong muốn. Thường thì mức chính xác 95% được áp dụng rộng rãi, tuy nhiên chúng ta vẫn có thể tăng hay giảm mức chính xác mong muốn tùy theo từng nghiên cứu cụ thể.
Tương tự như vậy, ta cũng cần xác định độ lớn của khoảng tin cậy nhằm tiên đoán các chỉ số của dân số dựa trên dữ liệu rút ra từ mẫu.
Độ biến thiên của dân số
Yếu tố kế tiếp ảnh hưởng đến cỡ mẫu với mức tin cậy cho trước là độ biến thiên của dân số. Độ biến thiên càng nhỏ thì cỡ mẫu ta cần cũng càng nhỏ. Ngược lại, độ biến thiên càng lớn thì cỡ mẫu sẽ phải càng lớn.
Tuy nhiên, không phải lúc nào ta cũng có các chỉ số thể hiện độ biến thiên của dân số
(ví dụ phương sai, độ lệch chuẩn). Tuy nhiên, ta có thể biết được độ biến thiên của dân số nhờ vào:
- Sử dụng kết quả tính độ biến thiên từ các nghiên cứu trước đây trên cùng chủ đề.
- Tính phương sai dựa trên kết quả khảo sát thử nghiệm trên một mẫu rút ra từ
dân số.
- Nguyên tắc: giả sử các quan sát tuân theo quy luật phân phối chuẩn, thì độ lêch chuẩn bằng khoảng 1/6 khoảng dao động của dữ liệu (tối thiểu - tối đa) với độ
tin cậy 99.73%. Tính cỡ mẫu Cỡ mẫu được tính từ công thức: n s x = σ x s n σ = 2 2 x s n σ =
Ví dụ: tính cỡ mẫu cho nghiên cứu thu nhập của sinh viên (đơn vị tính: triệu
đồng/tháng)
- Chọn mức độ chính xác mong muốn:
• Mức tin cậy (confidence level): 95% (Z=1,96)
• Độ lớn của khoảng tin cậy ± 0,25 (tr.đồng/tháng) = Z*se, suy ra se = 0,25/Z
- Xác định độ biến thiên kỳ vọng trong dân số (expected dispersion in the population): dựa trên các kết quả nghiên cứu gần đây về thu nhập của sinh viên, ta có giá trị độ lệch chuẩn tham khảo = 0,7 (tr.đồng/tháng)
- Phỏng định sai số chuẩn: se = 0,25/Z = 0,25/1,96 = 0,127 - Xác định cỡ mẫu n = s2/σx2 = 0,72/0,1272 = 30,38 = 30
Nếu ta muốn nâng mức độ chính xác mong muốn từ 95% lên 99%, thì Z thay đổi từ
1,96 đến 3,0. Áp dụng vào công thức tính ta có: - Phỏng định sai số chuẩn: se = 0,25/3,0 = 0.083 - Cỡ mẫu n = 0,72/0,0832 = 71,02 = 71
Như vậy, khi tăng mức tin cậy từ 95% lên 99%, trong trường hợp này, chúng ta phải tăng cỡ mẫu lên 2,4 lần.
Nếu ta muốn giảm độ lớn của khoảng tin cậy xuống còn 0,1 triệu đồng/tháng thay vì 0,25 triệu đồng/tháng, và vẫn giữ mức tin cậy 95%. Áp dụng vào công thức tính, ta có:
- Phỏng định sai số chuẩn: se = 0,1/1,96 = 0.051 - Cỡ mẫu n = 0,72/0,0512 = 188,38 = 188
Như vậy, khi giảm độ lớn của khoảng tin cậy xuống 2,5 lần, cỡ mẫu phải tăng 6,3 lần trong trường hợp này.