LÝ DO CHỌN MẪU Số lượng tổng thể là lớn, việc điều tra đối với tổng thể là không thể do hạn chế về thời gian và kinh phí Tiết kiệm về chi phí Thời gian thu thập dữ liệu nhanh hơn
Trang 1 Các khái niệm
Lý do chọn mẫu
Các phương pháp chọn mẫu
BÀI 6 CHỌN MẪU NGHIÊN CỨU
BÀI 6 CHỌN MẪU NGHIÊN CỨU
Trang 2CÁC KHÁI NIỆM
Đơn vị (phần tử) NC (Population element)
Là đối tượng chứa đựng những thông tin về vấn đề
mà người NC quan tâm
Có thể là những cá nhân, hộ gia đình, tổ chức
Tổng thể nghiên cứu (population)
Là tập hợp các đơn vị (phần tử) mà người NC cần tiếp cận để thu thập thông tin
Xác định mức độ hài lòng của sinh viên tiến sĩ BK thì tổng thể NC sẽ là toàn bộ sinh viên đã và đang học
TS tại trường ĐHBK
Trang 3nhằm phục vụ cho mục đích nghiên cứu
Khung lấy mẫu (sampling frame)
Là cơ sở dữ liệu mà người NC chọn ra mẫu cho NC của mình
VD: Danh bạ điện thoại; danh sách sinh viên; danh sách được công bố trên trang web
Trang 5LÝ DO CHỌN MẪU
Số lượng tổng thể là lớn, việc điều tra đối với tổng thể
là không thể do hạn chế về thời gian và kinh phí
Tiết kiệm về chi phí
Thời gian thu thập dữ liệu nhanh hơn
Trong một số trường hợp phải chọn mẫu vì các phần
tử được chọn sẽ bị phá hủy (chất lượng viên gạch – không thể chọn tổng mẫu được)
Phần tử của tổng thể là đồng nhất hoặc có thể hình thành các nhóm có đặc điểm tương tự
Trong nhiều trường hợp thì NC với mẫu là tốt hơn (giá trị đo đạc tốt hơn – internal validity; kiểm soát tốt hơn: phỏng vấn, giám sát, qui trình, ghi chép;)
Trang 6KÍCH CỠ MẪU
Phụ thuộc vào số lượng tổng thể
Phụ thuộc vào sự khác biệt của các phần tử trong đám đông (phương sai)
Kinh phí, tính chính xác của kết quả…
Theo qui luật ngón tay cái (kinh nghiệm)
Cần ít nhất 30 phần tử trong mẫu để giá trị thống kê
có ý nghĩa
Nếu muốn quan sát sự khác biệt của các nhóm thì mỗi nhóm cần ít nhất 30 phần tử
Trang 7CÁC PHƯƠNG PHÁP CHỌN MẪU
Phương pháp chọn mẫu xác suất/ ngẫu nhiên (probability sampling)
Phương pháp chọn mẫu phi xác suất
(non-probability)
Trang 8CHỌN MẪU NGẪU NHIÊN
Mẫu được chọn theo một qui trình mà cho phép các phần tử của tổng thể có cùng cơ hội/xác suất tham gia vào mẫu
Mỗi phần tử được chọn một cách khách quan, không phụ thuộc vào người nghiên cứu
Yêu cầu: phải có trước danh sách tổng thể
Mẫu có tính đại diện cao
Có thể khó thực hiện, chi phí có thể cao
Trang 9CHỌN MẪU PHI XÁC SUẤT
Không cho phép các phần tử của tổng thể có
cùng cơ hội tham gia vào mẫu
Có sự can thiệp của người nghiên cứu
Xác suất tham gia vào mẫu của một phần tử của tổng thể là không biết trước
Về tính đại diện của mẫu: có thể đại diện rất tốt cho tổng thể, có thể hoàn toàn không đại diện
Nhưng không phải là tồi mà ngược lại được sử dụng khá phổ biến trong NC
Trang 10CÁC PHƯƠNG PHÁP CHỌN MẪU NGẪU NHIÊN
CÁC PHƯƠNG PHÁP CHỌN MẪU NGẪU NHIÊN
Chọn mẫu ngẫu nhiên đơn giản (simple
random sampling)
Chọn mẫu hệ thống (systematic sampling)
Chọn mẫu phần tầng (stratified sampling)
Chọn mẫu theo cụm/khối (cluster sampling)
và chọn mẫu nhiều giai đoạn
Trang 11CHỌN MẪU NGẪU NHIÊN ĐƠN GIẢN
Là PP chọn mẫu trong đó mỗi phần tử của tổng thể được chọn với sự ngẫu nhiên như nhau hau nói cách khác là cơ hội được chọn vào mẫu là bằng nhau
Phải có danh sách các phần tử của tổng thể cần NC;
có thể là khung lấy mẫu; được sắp xếp theo một trật
tự nào đó (abc, địa chỉ, )
Gán số thứ tự từ 1 đến hết cho các phần tử của tổng mẫu
Chọn mẫu bằng nhiều cách như: bốc thăm (nếu ít), quay số, lấy hàm ngẫu nhiên từ máy tính (nếu nhiều)
Trang 12CHỌN MẪU NGẪU NHIÊN HỆ THỐNG
Chuẩn bị danh sách chọn mẫu, xếp thứ tự theo một qui ước nào đó; đánh số thứ tự cho các đơn vị trong danh sách Có tổng đơn vị trong danh sách là N
Xác định cỡ mẫu muốn lấy (n)
Chia N thành k nhóm theo công thứ (k=N/n); k được gọi là khoảng cách chọn mẫu
Trong k đơn vị đầu tiên, ta chọn ngẫu nhiên ra 1 đơn
vị (bốc thăm hay quay số ); đây sẽ là đơn vị mẫu đầu tiên
Các đơn vị mẫu tiếp theo được lấy cách đơn vị này một khoảng là k; 2k; 3k
Trang 13CHỌN MẪU NGẪU NHIÊN PHÂN TẦNG
Sử dụng khi các phần tử khác nhau và có thể được chia thành các nhóm gọi là tầng hay lớp (strata)
Các phần tử của các tầng này sẽ được chọn ngẫu nhiên đơn giản hay hệ thống
Trang 14CHỌN MẪU NGẪU NHIÊN PHÂN TẦNG
Điểm lưu ý đối với chọn mẫu phân tầng:
Phân tầng theo đặc điểm gì?
Đặc điểm phải liên quan đến nội dung NC
Phân bổ số lượng mẫu vào các tầng như thế
Trang 15VD - CHỌN MẪU NGẪU NHIÊN PHÂN TẦNG
VD - CHỌN MẪU NGẪU NHIÊN PHÂN TẦNG
Tại một trường ĐH có 20.000 sinh viên ở 5 hệ đào tạo
và cấp đào tạo khác nhau Bộ phận kiểm định chất
lượng tiến hành cuộc khảo sát về đánh giá về chất
lượng và mức độ hài lòng của sinh viên Số lượng
mẫu dự định lấy là 1.000 (5% của tổng thể)
Chọn mẫu phân tầng
Phân bổ mẫu cho từng tầng theo tỉ lệ tổng thể
Phân bổ mẫu đều và kết quả chung sẽ tính theo
trọng số
Trang 16PHÂN TẦNG THEO TỈ LỆ TỔNG THỂ
Hệ/cấp đào tạo Số lượng sv % sinh viên Số lượng sv chọn
vào mẫu của từng
tầng
Cử nhân chuyển đổi
Trang 17PHÂN BỔ MẪU ĐỀU CHO CÁC TẦNG
Hệ/cấp đào tạo Số lượng
sv % sinh viên chọn vào mẫu Số lượng sv
của từng tầng
Trọng số
Trang 18CHỌN MẪU THEO KHỐI CỤM
Tổng thể được chia thành nhiều khối (cluster)
Mỗi khối được xem như một tổng thể con (quận,
phường, khu phố, tổ )
Lấy ngẫu nhiên đơn giản m khối và khảo sát hết các phần tử lấy trong các khối mẫu đã được chọn
Ưu điểm là không cần danh sách các phần tử
VD: quận 3 có 14 phường, chọn được 2 phường mẫu
và sau đó khảo sát hết các hộ trong 2 phường này
Nhược điểm:
Cỡ mẫu khảo sát thực tế có thể quá lớn và chi phí cao
Các phần tử trong cùng một khối có khuynh hướng khá
giống nhau nên không nhất thiết phải khảo sát hết
Trang 19CHỌN MẪU NHIỀU GIAI ĐOẠN
Chọn mẫu 2 giai đoạn
Tổng thể được chia thành nhiều khối (cluster) (đơn vị
mẫu bậc 1)
Trong mỗi khối chỉ khảo sát một số đơn vị mà thôi (đơn vị mẫu bậc 2)
Tương tự như vậy có thể chia thành 3 giai đoạn
VD: Tổng thể NC là quận 3; trong quận 3 có 14
phường chia ra 700 tổ dân phố
Đơn vị mẫu bậc 1 có thể là phường hay tổ dân phố
Trong mỗi phương hay tổ chọn các đơn vị mẫu bậc 2 là
hộ gia đình Danh sách khó lấy – lấy mẫu trên thực địa (5 nhà lấy 1)
Trang 20CÁC PHƯƠNG PHÁP CHỌN MẪU PHI NGẪU NHIÊN
CÁC PHƯƠNG PHÁP CHỌN MẪU PHI NGẪU NHIÊN
Chọn mẫu thuận tiện (convenience
sampling)
Chọn mẫu định mức (quota sampling)
Chọn mẫu phán đoán (judgement sampling)
Chọn mẫu theo mạng quan hệ (snowball
sampling)
Trang 21CHỌN MẪU PHI NGẪU NHIÊN
THUẬN TIỆN
CHỌN MẪU PHI NGẪU NHIÊN
THUẬN TIỆN
Có thể lấy mẫu thuận tiện bằng cách đến những nơi
mà người NC nghĩ có nhiều khả năng gặp được đối tượng NC
Những người không tới địa điểm đó trong khoảng thời gian đó sẽ không có cơ hội tham gia vào mẫu
Không có nghĩa là chọn tùy tiện
Một qui trình rõ ràng, cụ thể là quan trọng để loại trừ sai số
Phỏng vấn chặn đón là phương pháp phỏng vấn hay
được dùng với lấy mẫu thuận tiện
Qui trình cụ thể: các điểm chặn đón, thời gian, thủ tục
lựa chọn đối tượng tại điểm chặn đón
Là phương pháp lấy mẫu phi xác suất, nhưng có thể cho kết quả đáng tin cậy nếu như có phương pháp lựa chọn phù hợp với mục tiêu nghiên cứu
Trang 22CHỌN MẪU ĐỊNH MỨC
Là phương pháp lấy mẫu thuận tiện, có
kèm theo chỉ tiêu số lượng theo một số tiêu thức nào đó: giới tính, độ tuổi, sản phẩm sử dụng…
Là phiên bản phi xác suất của phương
pháp lấy mẫu ngẫu nhiên theo lớp.
Trang 23CHỌN MẪU PHÁN ĐOÁN
các đối tượng để mời tham gia vào mẫu
sẽ phụ thuộc nhiều vào kiến thức và
kinh nghiệm của cả người nghiên cứu
và cả của người thu thập dữ liệu