Ta có thể tăng độ chính xác (giảm độ rộng của khoảng tin cậy) bằng cách đơn giản là tăng kích thƣớc mẫu, tuy nhiên độ chính xác chỉ tăng lên theo tỉ lệ với căn bậc hai của kích thƣớc mẫu. Nói cách khác, chi phí lấy mẫu tăng lên với tốc độ nhanh gấp nhiều lần so với tốc độ tăng của độ chính xác.
Ta có thể dùng công thức tính toán kích thƣớc mẫu nhƣ sau: Ta có: N S S X X ; N S Z S Z E X X . . ( . 2 )2 E S Z N X Trong đó: N : kích thƣớc mẫu. X
S : độ lệch chuẩn của trị trung bình của mẫu. SX : độ lệch chuẩn của mẫu.
E : sai số cho phép, khoảng tin cậy.
Z : giá trị của phân phối chuẩn đƣợc xác định theo hệ số tin cậy. Kích thƣớc mẫu là hàm số phụ thuộc vào mức độ chấp nhận rủi ro (biểu thị bằng giá trị Z), độ biến thiên của đám đông (ƣớc lƣợng bằng độ lệch chuẩn) và khoảng tin cậy (sai số cho phép).
Trên thực tế, việc tính toán kích thƣớc mẫu phức tạp hơn nhiều so với công thức. Trƣớc hết, ta thƣờng không biết độ lệch chuẩn khi chƣa thực sự bắt tay vào
lấy mẫu. Nhƣng lại cần biết độ lệch chuẩn đó để quyết định kích thƣớc mẫu trƣớc khi tiến hành khảo sát. Thông thƣờng, giá trị độ lệch chuẩn đƣợc sử dụng trong công thức trên chỉ là một con số phỏng đoán, đôi khi sử dụng từ các nghiên cứu trƣớc đó, hoặc từ nghiên cứu thí điểm, hay từ việc phỏng vấn thử nghiệm bảng câu hỏi. Hoặc có khi ta bắt đầu bằng một kích thƣớc mẫu thử nghiệm, sau khi thu đƣợc một số dữ liệu, ta tính độ lệch chuẩn của mẫu ấy, thế giá trị này vào công thức tính ra kích thƣớc mẫu.
Nhìn chung, còn khá nhiều vƣớng mắc trong công thức tính kích thƣớc mẫu, cho nên ngƣời ta ít sử dụng chúng nếu nhƣ mục tiêu dự án không đòi hỏi quá cao về độ chính xác cho các thông số dự đoán.
Quy luật phỏng đoán cho thấy bằng kinh nghiệm rằng cần ít nhất 30 phần tử trong một mẫu để giá trị thống kê có ý nghĩa.
Theo Hoelter (1983), số lƣợng mẫu tới hạn là 200 mẫu.
Theo Bollen (1989), số lƣợng mẫu tối thiểu phải là 5 mẫu cho một tham số cần ƣớc lƣợng (tỷ lệ 5:1).
Thông thƣờng, ta có thể xác đinh kích thƣớc mẫu theo kiểu định tính. Độ lớn của mẫu tối đa là 1000, hoặc đơn giản hơn lấy 10% của đám đông, kích thƣớc tối thiểu của mẫu là 30, và tùy thuộc vào độ biến thiên của đám đông mà điều chỉnh cho phù hợp. Trong khoảng kích thƣớc tối đa và tối thiểu đó, quyết định thƣờng đƣợc suy xét dựa vào ngân quỹ và thời gian.