Bài giảng Chương 5 - Chọn mẫu (SAMPLING) - Phương pháp nghiên cứu khoa học
Trang 1CHỌN MẪU
Trang 4VÌ SAO PHẢI
CHỌN MẪU ???
Tiết kiệm chi phí Tiết kiệm thời gian
Nghiên cứu
trên mẫu nhiều lúc
chính xác hơn
Rất cần thiết trong những khảo sát dẫn đến sự phá hoại hoặc thay đổi thuộc tính của đối tượng.
Trang 6 Đơn vị lấy mẫu (sampling unit): một hay
một nhóm các phần tử để từ đó thực hiện việc lấy mẫu trong mỗi giai đoạn của quá trình chọn mẫu.
Khung mẫu (sampling frame): Danh
sách các đơn vị lấy mẫu có sẵn để phục
vụ cho việc lấy mẫu.
Trang 10• Biết trước xác suất xuất hiện của các phần tử vào trong mẫu
• Quá trình chọn mẫu tuân theo quy luật toán, không thể tự ý thay đổi
• Các thông số của mẫu có thể dùng để ước lượng/ kiểm nghiệm các thông số của tổng thể
Chọn mẫu xác suất
Trang 11Chọn mẫu phi xác suất
• Nhà NC chọn các phần tử vào mẫu không theo quy luật ngẫu nhiên
• Không biết xác suất xuất hiện của các phần tử Chọn mẫu tùy thuộc vào nhà nghiên cứu.
• Không thể dùng các thông số của mẫu để ước lượng/kiểm nghiệm các thông số của tổng thể.
Trang 13Về độ chính xác của hai phương pháp chọn mẫu:
“There is no guarantee that the results obtained with
a probability sample will be more accurate than those obtained with a non-probability sample What the former allows the researcher to do is to measure the amount of sampling error likely to occur in the sample This provides a measure of the accuracy of the sample result With non-probability sampling no
such error measure exists” (Kinnear & Taylor,
p.207)
Trang 16Chọn mẫu xác suất
• Ngẫu nhiên đơn giản
(simple random)
• Các phần tử được chọn vào mẫu có xác suất là như nhau và biết trước
• Dùng bảng ngẫu nhiên
để chọn phần tử cho mẫu
• Ưu điểm: Đơn giản
nếu có 1 khung mẫu đầy đủ
• Nhược điểm: Khó khả
thi khi tổng thể lớn
Trang 17Chọn mẫu xác suất
• Hệ thống
(systematic)
• Chọn ngẫu nhiên một
điểm xuất phát (starting
point), dựa vào bước
nhảy (sampling interval)
để xác định các phần tử tiếp theo từ khung mẫu
• Đây là phương pháp
sử dụng phổ biến hơn phương pháp ngẫu nhiên đơn giản
Trang 18Chọn mẫu xác suất
• Hệ thống
(systematic)
•Ưu điểm: không cần
khung mẫu hoàn chỉnh
• Nhược điểm: Mẫu sẽ
bị lệch khi khung mẫu xếp theo chu kỳ và tần
số bằng với bước nhảy
Trang 19Chọn mẫu xác suất
• Phân tầng
(stratified random)
• Tổng thể được chia ra nhiều tầng theo nguyên
tắc: “cùng tầng đồng
nhất, khác tầng dị biệt”
• Để chọn phần tử trong mỗi tầng: có thể dùng phương pháp hệ thống
• Số phần tử trong mỗi tầng được xác định theo tỷ
lệ hoặc không theo tỷ lệ với kích thước tổng thể
Trang 21Chọn mẫu xác suất
• Theo nhóm
(cluster)
• Tổng thể được chia làm nhiều nhóm (mỗi nhóm mang tính đại diện cho tổng thể) và
tuân theo nguyên tắc: “cùng
nhóm dị biệt, khác nhóm đồng nhất”.
• Các nhóm sẽ được chọn một cách ngẫu nhiên để tạo thành mẫu.
Trang 22Chọn mẫu xác suất
• Theo nhóm
(cluster)
• Có thể phân nhóm nhiều bước: tiếp tục chọn nhóm con trong nhóm và các phần
tử trong nhóm con, v.v
(multi–stage cluster sampling)
• Chọn mẫu theo khu vực (area sampling): một dạng của chọn mẫu theo nhóm, với các nhóm được chia theo khu vực địa lý.
Ví dụ:
Trang 28Bước 1
Bước 5 Bước 4 Bước 6
Bước 3 Bước 2
Trang 29Trường hợp tính theo biến liên tục (4 bước)
Bước 1: Xác định sai số e cho phép: phụ thuộc
vào độ nhạy của kết quả quyết định đối với biến ước lượng đang khảo sát (Thường 1/10-2/10 của đơn vị đo nhỏ nhất)
Bước 2: Xác định độ tin cậy muốn có (thường
chọn 95% Z=1.96)
Trang 30 Bước 3: Ước tính độ lệch chuẩn của mẫu (s)
Trang 31 Bước 4: Sử dụng công thức tính mẫu:
Nếu n>10% tổng thể thì tính lại theo công thức:
2
2 2
e N
S Z
N n
Trang 32Ví dụ:
Bài toán cỡ mẫu trong khảo sát bình quân mỗi tháng người dân Tp.HCM chi tiêu bao nhiêu tiền cho thực phẩm.
Bài toán cỡ mẫu trong khảo sát sự thỏa mãn
của khách hàng với thang đo 1-7
Trang 33Trường hợp tính theo tỷ lệ của mẫu
Z và e: Xác định tương tự như trên
Cỡ mẫu được tính theo công thức:
eø
e
Z q
p n
2
*
*
Trang 34p e
N
Z q
p
N n
Trang 35Ví dụ:
Bài toán cỡ mẫu trong khảo sát xem bao nhiêu
% số hộ Tp.HCM có internet.
Trang 36Cỡ mẫu trong chọn mẫu phi xác suất
Quyết định chọn mẫu phi xác suất thường được
thực hiện một cách chủ quan.
Yếu tố then chốt cho việc lựa chọn là thời gian
và tài chính.
Trang 37Những lưu ý khi xác định cỡ mẫu
Khảo sát một và nhiều yếu tố/biến
Tỷ lệ hồi đáp.
Phương pháp phân tích dữ liệu.
Sai lệch liên quan đến việc chọn mẫu gồm sai
lệch do chọn mẫu (do tính đại diện của mẫu) và
sai lệch không do chọn mẫu (xảy ra trong quá trình phỏng vấn, hiệu chỉnh, nhập data, ).