Bài giảng kỹ thuật chọn mẫu

49 597 1
Bài giảng kỹ thuật chọn mẫu

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

KỸ THUẬT CHỌN MẪU ??? GS TS LÊ HOÀNG NINH ThS LÊ NỮ THANH UYÊN MỤC TIÊU HỌC TẬP Phân biệt phương pháp lấy mẫu phổ biến Trình bày ưu khuyết điểm phương pháp Liệt kê sai lệch biện pháp khắc phục sai lệch chọn lựa chọn mẫu SƠ ĐỒ NGHIÊN CỨU Chọn dân số Chọn mẫu Thu thập kiện Phân tích kiện CÁC KHÁI NIỆM Khái niệm chọn mẫu (sample sampling) Là trình chọn số lượng nhỏ đơn vị nghiên cứu từ quần thể (dân số) nghiên cứu xác định Câu hỏi: Mẫu NC rút nhóm người nào? Cần người mẫu NC? Những người chọn nào? CÁC KHÁI NIỆM Kỹ thuật chọn mẫu cách rút chọn đối tượng/đơn vị nghiên cứu dân số vào mẫu Nguyên tắc thống kê đòi hỏi mẫu có giá trị mẫu có kích thước đủ lớn (đủ cỡ mẫu) mẫu đại diện cho dân số Tính đại diện: Trực giác (Huyện Ninh Hải đại điện cho khí hậu “gió phan, nắng rang” tỉnh Ninh Thuận (Phan Rang – Tháp Chàm) Chọn mẫu xác suất (tốt nhất) CÁC KHÁI NIỆM Dân số (population): tập hợp đối tượng có chung đặc điểm mà muốn áp dụng kết nghiên cứu Mẫu (sample): tập hợp đối tượng khảo sát có hệ thống nhằm ước lượng đặc trưng dân số đích Dân số mục tiêu Mẫu Dân số chọn mẫu Dân số, mẫu nghiên cứu suy diễn thống kê Kỹ thuật chọn mẫu Quần thể Tham số Suy diễn Mẫu Thống kê CÁC KHÁI NIỆM (tt) Các thành phần: • Đơn vị nghiên cứu (study unit): đơn vị bản, nhỏ cung cấp giá trị biến số • Khung mẫu (sampling frame): tập hợp đơn vị nghiên cứu hợp lệ dân số Nghiên cứu tỷ lệ cao huyết áp người dân 40 tuổi năm 2013 tỉnh Bình Dương Nghiên cứu tỷ lệ hộ gia đình sử dụng nước máy tỉnh Tây Ninh, năm 2013 Tất đối tượng quan tâm Giá Trị Bên Trong Mẫu Mẫu Đối tượng với số đặc tính cụ thể ? Giá Trị Bên Ngoài (Khả khái quát hóa) Chọn lọc Đo lường ?? Kết kiểm soát sai số CÁC PHƯƠNG PHÁP CHỌN MẪU PHỔ BIẾN Có chủ đích (purposes) Không xác suất Thuận tiện (convenience) Phân bổ quota (Quota) Quả bóng tuyết (Snowball) Mẫu ngẫu nhiên đơn (simple random sampling) Mẫu ngẫu nhiên hệ thống (systematic random sampling) Xác suất Mẫu ngẫu nhiên phân tầng (stratified random sampling) Mẫu cụm (cluster sampling) PPS Lấy mẫu nhiều bậc (Multistage sampling) 10 Có thể phối hợp nhiều phương pháp Sai lệch chọn mẫu - Sai lệch (BIAS): sai lầm hệ thống (Systemic Error) - Sai lệch có khuynh hướng tạo giá trị cao hay thấp giá trị thật (có thể tăng giảm ước lượng kết quả) - Có loại sai lệch: sai lệch chọn lựa sai lệch thông tin - Sai lệch chọn lựa: nghiêm trọng (lỗi người nghiên cứu  khó khắc phục) phụ thuộc: dân số, kỹ thuật, tiêu chí chọn mẫu 35 Sai lệch chọn lựa - Khi xác suất chọn mẫu không giống đối tượng - Chọn đối tượng NC bị ảnh hưởng yếu tố phơi nhiễm (Bệnh chứng) hay bệnh (Đoàn hệ hồi cứu)  Xác suất chọn không  NC Bệnh chứng: người NC biết trước MLQ: hút thuốc – K phổi  tăng ước lượng MLQ  NC đoàn hệ hồi cứu: vào thời điểm chọn mẫu phơi nhiễm – bệnh xảy 36 MẤT MẪU Đối tượng từ chối tham gia NC Lớn  sai lệch Mất mẫu trình theo dõi Ví dụ: khảo sát tỷ lệ SDD trẻ em < tuổi thực hành nuôi bà mẹ: bà mẹ vắng nhà nhiều lần? 37 TIÊU CHÍ CHỌN MẪU Mẫu NC < dân số  tính đại diện  tiêu chí chọn mẫu:  Tiêu chí đưa vào: thể đặc tính (who, where, when) mà vào đối tượng chọn vào NC  Tiêu chí loại ra: thuộc tính không phù hợp đưa vào mẫu Lưu ý: TC loại phần phụ TC đưa vào 38 Sai lệch chọn lựa chọn mẫu Các sai lệch khác:  Nghiên cứu người tình nguyện  Lấy mẫu bệnh nhân đăng kí  Sai lệch mùa (SXH) … Đạo đức:  Trung thực báo cáo khoa học lấy mẫu không đại diện 39 Biện pháp khắc phục sai lệch chọn mẫu Lọai sai số Biện pháp hạn chế sai số Sai số lựa chọn •Chọn khung mẫu phù hợp, cỡ mẫu cho tầng nhóm NC •Tập huấn kỹ thuật chọn mẫu cho GSV •Áp dụng chọn ngẫu nhiên liệt kê sẵn danh sách, tiêu chuẩn chọn vào nhóm NC… Sai số không đáp ứng, bỏ 40 •Thông tin/thuyết phục sử dụng người có uy tín, có hình thức động viên; •Danh sách thay chọn cách với danh sách thức •Theo dõi BN, thường xuyên thăm viếng kiểm tra tuân thủ điều trị, tìm nguyên nhân bỏ cuộc, động viên tham gia Kết luận  Việc chọn lựa kỹ thuật lấy mẫu phụ thuộc vào nhiều yếu tố bao gồm: mục tiêu nghiên cứu, thiết kế nghiên cứu nguồn lực sẵn có  Chi phí lợi ích phương pháp cần cân nhắc kỹ lưỡng  Trên thực tế, nhà điều tra thường phối hợp hay nhiều chiến lược với 41 BÀI TẬP KHẢO SÁT HỘ GIA ĐÌNH Bộ câu hỏi BCH vấn hộ gia đình WHO BCH vấn cá nhân tình hình sức khỏe WHO BCH Healthy Days 42 Chỉ tiêu/ học Đối tượng hỏi Ghi viên Khoảng 100 hộ Chủ hộ hay thành Ủy quyền trả lời gia đình viên hộ từ thay: 18 tuổi trở lên n = 1.5 x 384 = Hỏi tất thành Cha mẹ: trả lời thay 576  600 người viên từ trẻ đến già trẻ em 15 tuổi Người chăm sóc trực tiếp: trả lời Khoảng 100 hộ Những người từ thay người GĐ (mỗi HGĐ 18 tuổi trở lên tình trạng sức khỏe không cho trung bình khoảng HGĐ phép trả lời: câm, người ≥ 18 tuổi điếc, bệnh nặng… 200 người) CÁCH CHỌN MẪU PPS/1 học viên HUYỆN PHÚ GIÁO – BÌNH DƯƠNG 43 CÁCH CHỌN MẪU PPS Bước Tính khoảng cách mẫu (Sampling Interval (SI)) = Tổng dân số tích lũy/tổng số cụm khảo sát  SI = 82.956/30 = 2765,2 ~ 2765 Bước Chọn số ngẫu nhiên (Random Start (RS)): tsample 2765 + -+ | No | ID | | + | | | 1000 | + -+ Ví dụ: chọn RS = 1000 44 CÁCH CHỌN MẪU PPS Bước Các dãy số chọn: Cụm RS = 1000 (tổ 4, ấp 1, Xã Tân Long) Cụm RS + SI = 1000 + 2765 (tổ 4, ấp 3, Xã TL) Cụm RS + 2SI = 1000 + x 2765 = 6530 Cụm RS + 3SI = 1000 + x 2765 = 9295 Cụm RS + 4SI = 1000 + x 2765 = 12060 Tương tự chọn 30 cụm 45 Các dãy số cụm lại Cụm 14825 Cụm 17590 Cụm 20355 Cụm 23120 Cụm 10 25885 Cụm 11 28650 Cụm 12 31415 Cụm 13 34180 Cụm 14 36945 Cụm 15 39710 Cụm 16 42475 Cụm 17 45240 46 Cụm 18 48005 Cụm 19 50770 Cụm 20 53535 Cụm 21 56300 Cụm 22 59065 Cụm 23 61830 Cụm 24 64595 Cụm 25 67360 Cụm 26 70125 Cụm 27 72890 Cụm 28 75655 Cụm 29 78420 Cụm 30 81185 CÁCH CHỌN MẪU PPS Cụm RS = 1000 (tổ 4, ấp 1, Xã Tân Long) Cụm RS + SI = 1000 + 2765 = 3765 (tổ 4, ấp 3, Xã TL) 1000 47 3765 BÀI TẬP KHẢO SÁT HỘ GIA ĐÌNH Số người cụm = 576/30 = 19.2 ~ 20 người BCH hộ gia đình WHO: PV chủ hộ (hay người đại diện ≥18 tuổi) BCH cá nhân WHO: PV hết, từ già  trẻ HGĐ  Đối với trẻ em < 15 tuổi: ủy quyền cha mẹ trả lời  Đối với người có vấn đề SK không trả lời PV: Ủy quyền người chăm sóc trực tiếp trả lời  Người từ 15 tuổi trở lên: PV trực tiếp Đến lần không gặp (loại khỏi KS) BCH healthy days: PV thành viên hộ ≥ 18 tuổi 48 TÀI LIỆU THAM KHẢO  DESIGNING AND CONDUCTING HEALTH SURVEYS (A Comprehensive Guide) - Lu Ann Aday , Llewellyn J Cornelius (Foreword by Steven B Cohen) Published by Jossey-Bass A Wiley Imprint, 3rd edition, 2006 49 [...]... khung mẫu chính xác  kém khả thi  Mẫu được chọn có thể phân tán  khó thu thập  Có cơ hội bỏ sót vài nhóm trong dân số (cơ hội) 20 MẪU NGẪU NHIÊN HỆ THỐNG (Systematic Sampling)  Lấy mẫu hệ thống là phương pháp lấy mẫu chọn ngẫu nhiên một nhóm gồm nhiều đơn vị lấy mẫu cách nhau một khoảng cách mẫu Gồm các bước  Tính khoảng cách mẫu k = N/n N: dân số chọn mẫu (trong khung mẫu) n: cỡ mẫu  Chọn ngẫu... lý, mẫu phân tầng dễ hơn ngẫu nhiên đơn KHUYẾT ĐIỂM:  Cần thiết lập khung mẫu chi tiết của từng tầng 29 CHỌN MẪU CỤM CHỌN MẪU CỤM(Cluster sampling): phương pháp chọn ngẫu nhiên nhiều cụm (được gọi là đơn vị lấy mẫu bậc 1 – PSU: primary sampling units) Nếu qua 2 giai đoạn: cụm lấy mẫu bậc 2 (SSU: secondary sampling units) Lấy mẫu qua nhiều giai đoạn Dân số nghiên cứu 30 Mẫu cụm bậc 1 Mẫu cụm bậc 2 CHỌN... 2 CHỌN MẪU CỤM (PPS) - Một kỹ thuật chọn mẫu cụm thường dùng là chọn cụm xác suất tỉ lệ theo cỡ (PPS: probability proportionate to size) - Cụm nào có dân số lớn sẽ có nhiều cơ hội hơn để được chọn - Số đơn vị liệt kê chọn ra trong từng cụm là bằng nhau 31 32 ƯU – KHUYẾT ĐIỂM: chọn mẫu cụm ƯU ĐIỂM:  Chỉ cần khung mẫu chi tiết cho bước kế chót  tiết kiệm thời gian, công sức  Trong cộng đồng, mẫu cụm... 2 loại sai lệch: sai lệch chọn lựa và sai lệch thông tin - Sai lệch chọn lựa: nghiêm trọng nhất (lỗi người nghiên cứu  khó khắc phục) phụ thuộc: dân số, kỹ thuật, và tiêu chí chọn mẫu 35 Sai lệch chọn lựa - Khi xác suất chọn mẫu là không giống nhau trên từng đối tượng - Chọn đối tượng NC bị ảnh hưởng bởi yếu tố phơi nhiễm (Bệnh chứng) hay bệnh (Đoàn hệ hồi cứu)  Xác suất chọn không đều  NC Bệnh chứng:... một cỡ mẫu, những số thống kê tính được từ mẫu cụm kém chính xác so với những số tương ứng từ mẫu ngẫu nhiên đơn  Khắc phục: cỡ mẫu lớn hơn -> n*design effect 33 CHỌN MẪU NHIỀU BẬC (Multistage sampling) Là sự kết hợp nhiều phương pháp lấy mẫu Ví dụ: Khảo sát TCMR trong học sinh 1 tỉnh, gồm các bước: - B1: chọn m huyện trong tổng M huyện của tỉnh - B2: chọn n xã trong tổng N xã của 1 huyện - B3: chọn. .. biến 1 Mẫu ngẫu nhiên đơn (simple random sampling) 2 Mẫu ngẫu nhiên hệ thống (systematic random sampling) 3 Mẫu ngẫu nhiên phân tầng (stratified random sampling) 4 Mẫu cụm (cluster sampling) 5 Lấy mẫu nhiều bậc (Multistage sampling) Có thể phối hợp nhiều phương pháp trên 15 MẪU NGẪU NHIÊN ĐƠN (SRS) NGẪU NHIÊN ĐƠN (simple random sampling): phương pháp lấy mẫu mà mọi đơn vị lấy mẫu đều được chọn vào mẫu. .. n: cỡ mẫu  Chọn ngẫu nhiên một số r, 1  r  k  Chọn một nhóm gồm các đơn vị lấy mẫu r, r+k, r+2k,… 21 VÍ DỤ: NGẪU NHIÊN HỆ THỐNG  Chọn 5 đối tượng từ một dân số 15 đối tượng - Tính khoảng cách mẫu: k = 15/5 = 3 - Chọn ngẫu nhiên một số r: 1  r  3 - Ví dụ r = 2 - Những đối tượng được chọn vào mẫu nghiên cứu sẽ lần lượt có số thứ tự trong khung mẫu: 2, 2+3 = 5, 2 + 2(3) = 8, 2+3(3) = 11, 2 + 4(3)... có thể chọn những người gần nhà hay thuận lợi cho việc điều tra để dễ nhanh chóng hoàn thành công việc 13 QUẢ BÓNG TUYẾT (SNOWBALL)  Là phương pháp chọn một nhóm người trả lời thứ nhất được chọn theo phương pháp chọn mẫu ngẫu nhiên, nhưng những người trả lời sau là do nhóm thứ nhất giới thiệu VD: Nghiên cứu khảo sát KAP về HIV/AIDS của gái mại dâm đường phố tại TP HCM, năm 2012 14 Các pp chọn mẫu xác... 1 huyện - B3: chọn p trường học trong tổng P trường học 1 xã - B4: chọn q lớp học trong số Q lớp của 1 trường học - B5: Khảo sát tất cả học sinh trong lớp đã chọn Đơn vị nghiên cứu: học sinh Đơn vị liệt kê: lớp học Đơn vị chọn mẫu bậc 1,2,3 lần lượt: huyện, xã, trường học Khung mẫu: tất cả học sinh trong tỉnh 34 Sai lệch trong chọn mẫu - Sai lệch (BIAS): sai lầm hệ thống (Systemic Error) - Sai lệch...CHỌN MẪU CÓ CHỦ ĐÍCH  Là phương pháp phổ biến nhất trong nghiên cứu định tính  Chọn tập hợp những người tham gia dựa theo những tiêu chí có tính đại diện liên quan tới 1 câu hỏi nghiên cứu  Cỡ mẫu có thể ấn định hoặc không ấn đinh trước khi thu thập thông tin vì cỡ mẫu phụ thuộc vào: • Nguồn cung cấp thông tin • Hạn định về thời gian • Mục tiêu nghiên cứu 11 CHỌN MẪU THUẬN TIỆN Là ... lấy mẫu không đại diện 39 Biện pháp khắc phục sai lệch chọn mẫu Lọai sai số Biện pháp hạn chế sai số Sai số lựa chọn Chọn khung mẫu phù hợp, cỡ mẫu cho tầng nhóm NC •Tập huấn kỹ thuật chọn mẫu. .. secondary sampling units) Lấy mẫu qua nhiều giai đoạn Dân số nghiên cứu 30 Mẫu cụm bậc Mẫu cụm bậc CHỌN MẪU CỤM (PPS) - Một kỹ thuật chọn mẫu cụm thường dùng chọn cụm xác suất tỉ lệ theo cỡ... nào? CÁC KHÁI NIỆM Kỹ thuật chọn mẫu cách rút chọn đối tượng/đơn vị nghiên cứu dân số vào mẫu Nguyên tắc thống kê đòi hỏi mẫu có giá trị mẫu có kích thước đủ lớn (đủ cỡ mẫu) mẫu đại diện cho dân

Ngày đăng: 29/02/2016, 11:14

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan