Xác định cỡ (kích thước) mẫu

Một phần của tài liệu Bài giảng Các phương pháp nghiên cứu định lượng trong kinh tế (Trang 27 - 30)

Xác định kích thước mẫu là một trong các nội dung quan trọng của mỗi cuộc điều tra thống kê. Căn cứ vào độ chính xác cần thiết của các ước lượng và căn cứ vào mức độ sai lầm có thể chấp nhận được trong các kiểm định giả thuyết đối với các tham số. Thông thường có 2 cách tiếp cận xác định kích thước mẫu.

Trên cơ sở kích thước mẫu (n), người ta sẽ xác định các cá thể mẫu tùy theo điều kiện cụ thể của mỗi cuộc điều tra. Xác định kích thước mẫu trên cơ sở chọn mẫu ngẫu nhiên đơn giản. Căn cứ để lựa chọn kích thước mẫu dựa vào độ chính xác của các ước

lượng tham số, hệ số tương quan và căn cứ vào các sai lầm chấp nhận được khi tiến hành các kiểm định. Bài giảng đưa ra một số phương pháp xác định kích thước mẫu như sau:

a) Xác định kích thước mẫu từ các ước lượng khoảng tin cậy cho các tham số gồm: sử dụng độ dài khoảng tin cậy khi ước lượng trung bình, sử dụng tỷ lệ phương sai

1. Sử dụng độ dài khoảng tin cậy khi ước lượng trung bình

Xuất phát từ việc ước lượng trung bình của biến ngẫu nhiên X phân phối chuẩn ta có:

X − U σ < E(X) < X + U σ Độ dài khoảng tin cậy theo ước lượng này được xác định:

I = 2U σ = 2U σ √n

Nếu chọn trước mức tin cậy có thể xác định kích thước mẫu khi biết I n ≥ 4 U αI

Trên thực tế với tổng thể hữu hạn và thông tin mẫu người ta có thể thay phương sai bằng phương sai mẫu của số liệu điều tra với S là độ lệch chuẩn của mẫu điều tra. Tức là:

n ≥ N

1 + N ∗ /

2. Sử dụng tỷ lệ phương sai

Phương sai tổng thể là chưa biết trong trường hợp này chúng ta có thể ước lượng giá trị cỡ mẫu qua phương sai mẫu theo công thức sau:

n = 1 + t(N − 1)N

trong đó: = là tỷ lệ phương sai trung bình mẫu với phương sai tổng thể và tỷ lệ t do người nghiên cứu tự chọn. Công thức này thích hợp khi chúng ta quan tâm đến các ước lượng điểm, đặc biệt là ước lượng điểm của trung bình tổng thể.

Ví dụ: Một khu vực dân cư có 2.500 hộ, cần quan sát tối đa bao nhiêu hộ để độ sai lệch của thu nhập trung bình khẩu nhận được không lớn hơn 1% độ sai lệch của thu nhập trung bình khẩu chung?

Ví dụ: Để ước lượng tỷ lệ thanh niên trong số 10.000 thanh niên ở độ tuổi từ 18 đến 25 có hút thuốc lá hay không tại một khu dân cư. Có thể chọn mẫu kích thước bao nhiêu để sai số khi ước lượng không lớn hơn 2%?

b) Xác định kích thước mẫu từ kiểm định giả thuyết đối với hệ số tương quan tuyến tính của hai biến X và Y

Gọi R là hệ số tương quan tuyến tính mẫu của hai biến X và Y người ta chứng minh được biến = √ − 3 với n đủ lớn là biến ngẫu nhiên phân phối chuẩn N(0,1). Do mục tiêu của ước lượng hệ số tương quan bao gồm cả việc khẳng định chiều biến thiên của X và Y (thuận hay nghịch) nên việc tính toán kích thước mẫu thường được dựa trên cơ sở các sai lầm khi kiểm định giả thuyết “Có tương quan tuyến tính dương (hoặc âm)”.

c) Xác định kích thước mẫu trên cơ sở so sánh trung bình

Việc so sánh hai trung bình có thể xảy ra trên hai mẫu hay hai bộ phận của 1 mẫu. Giả sử có hai biến ngẫu nhiên X1, X2 độc lập cùng phân phối chuẩn với phương sai bằng nhau (ϭ2).

Thủ tục so sánh hai trung bình µ1, µ2 có thể thông qua kiểm định giả thuyết H0: µ1 = µ2 với giả thuyết đối H1: µ1 = µ2 + ε (với ε > 0).

Gọi n1, n2 là các kích thước mẫu tương ứng và đặt n = n1 + n2; r = n1/n2. Xét trường hợp hai phương sai bằng nhau, với mức sai lầm loại 1, α cho trước, để kết luận H1 đúng với sai lầm loại 2 không lớn hơn β người ta cần xác định n sao cho:

< − − =

Tức là

− −

+ < Sau khi biến đổi biểu thức này ta nhận được:

= + ≥ (1 + ) +

Có thể thấy rằng công thwucs này áp dụng được cho trường hợp ε < 0

Nếu chọn tỷ lệ so sánh theo số lần độ lệch chuẩn ta đặt = thì công thức trên có thể viết thành:

≥ (1 + ) +

Một phần của tài liệu Bài giảng Các phương pháp nghiên cứu định lượng trong kinh tế (Trang 27 - 30)