Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 22 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
22
Dung lượng
799,07 KB
Nội dung
3/01/2016 CHỌN MẪU Khái niệm • Nếu tất cá thể quần thể giống quần thể (homogenous) đặc tính cá thể đặc tính quần thể • Khi cá thể quần thể khác quần thể hỗn tạp/ không (heterogeneous) đặc tính cá thể khơng đại diện cho quần thể • Mơ tả quần thể quan sát tất cá thể chọn số lƣợng cá thể “khả năng”, đại diện “tốt” cho tất cá thể quần thể để quan sát 3/01/2016 • Quần thể khơng đồng xác suất mẫu khó mơ tả quần thể cao số lƣợng cá thể chọn vào mẫu lớn để mô tả tốt quần thể 3/01/2016 Khái niệm • Dân số mục tiêu: tập hợp đối tƣợng muốn áp dụng kết nghiên cứu • Khung mẫu: danh sách đơn vị chọn mẫu • Dân số nghiên cứu (mẫu): tập hợp đối tƣợng đƣợc khảo sát có hệ thống nhằm ƣớc lƣợng đặc trƣng dân số mục tiêu 3/01/2016 Chọn mẫu ngẫu nhiên đơn Mỗi lần chọn, đối tƣợng đƣợc chọn trƣớc có hội đƣợc chọn Chọn mẫu ngẫu nhiên đơn Tất đối tƣợng đƣợc đánh số, sau chọn ngẫu nhiên • Bốc thăm • Bảng số ngẫu nhiên/c.trình phần mềm vi tính • Ƣu điểm: • Đơn giản • Cơ sở xác suất • Giới hạn: • Cần khung mẫu xác • Mẫu phân tán-> thu thập khó khăn • Bỏ sót 3/01/2016 Chọn mẫu ngẫu nhiên hệ thống Khoảng cách mẫu định cá nhân đƣợc chọn Chọn mẫu ngẫu nhiên hệ thống • N đối tƣợng đƣợc đánh số thứ tự Để chọn n đối tƣợng, khung mẫu đƣợc chia thành k nhóm, với k=N/n Chọn ngẫu nhiên số < k i Các số i+k, i+2k, … • Ƣu điểm: ◦ Có thể thay mẫu ngẫu nhiên đơn khơng có khung mẫu xác Ƣớc lƣợng N ◦ Mẫu ngẫu nhiên hệ thống đại diện > ngẫu nhiên đơn • Giới hạn: ◦ Tính chu kỳ-> sai lệch 3/01/2016 Chọn mẫu ngẫu nhiên phân tầng DS đƣợc thành nhiều DS nhỏ (tầng) Biến số sử dụng để phân tầng ảnh huởng kết NC Sự phân bố BS phải giống nhau/tầng & DS Dân số N=1.000 Phân tầng theo tuổi Nhóm NV 40t 300 500 200 Mẫu n = 200 = 40 + 100 + 60 3/01/2016 Chọn mẫu ngẫu nhiên phân tầng • Ƣu điểm: • Chính xác > mẫu ngẫu nhiên đơn • h/a tầng • dễ ngẫu nhiên đơn • Giới hạn: • Khung mẫu chi tiết Chọn mẫu cụm DS đƣợc chia thành nhiều cụm tách biệt, cụm cần đồng bậc: 1) chọn cụm từ khung mẫu 2) chọn đơn vị liệt kê từ cụm chọn PPS (probability proportionate to size) 3/01/2016 Thí dụ: Trong nghiên cứu tỉ lệ trẻ suy dinh dƣỡng trẻ khả thi, kinh tế • Giới hạn: • Tính xác< mẫu ngẫu nhiên đơn-> mẫu lớn 3/01/2016 Chọn mẫu khơng xác suất Tìm vấn đề VD: AIDS USA năm 1981; SARS Hà Nội năm 2003 Sử dụng khơng có khung mẫu VD: ngƣời sử dụng dịch vụ internet) Khi đối tƣợng khó tiếp cận Khi tiêu chuẩn nhận vào/loại khắt khe Chọn mẫu thuận tiện Chọn mẫu có chủ ý • Những ngƣời tình nguyện • Chọn lựa đối tƣợng kỹ dựa tiêu chuẩn ngƣời nghiên cứu • Thƣờng sử dụng để kiểm tra thuốc (tiêu chí đƣa vào/loại kỹ;c.trình nâng cao sức khoẻ để kiểm tra trƣớc phổ biến rộng rãi 3/01/2016 Mẫu Snowball (bóng tuyết) Ngƣời cung cấp/giới thiệu thêm ngƣời khác Thuận lợi cho đối tƣợng khó tiếp cận nhƣ ngƣời sử dụng ma túy, ngƣời nhập cƣ, trẻ đƣờng phố… • Ƣu điểm • Khơng cần nhiều thơng tin quần thể • Tính giá trị cao, xác định đƣợc sai số thống kê • Dễ dàng phân tích liệu • Khuyết điểm • Tốn • Cần có danh sách cá thể quần thể • Khơng cần chun mơn nghiên cứu viên • Nguy sai số ngẫu nhiên 10 3/01/2016 TÍNH CỠ MẪU CƠ BẢN 22 Tại cần tính cỡ mẫu? • Muốn ƣớc lƣợng vấn đề sức khỏe đƣợc xác cần đo lƣờng tồn dân số khơng khả thi • Cần có số lƣợng đủ lớn để vừa đảm bảo tính khả thi, vừa đảm bảo tính đắn • Từ ƣớc lƣợng NC suy diễn ƣớc lƣợng tồn dân số • Cỡ mẫu có ảnh hƣởng lớn đến • Độ xác ƣớc lƣợng thống kê • Tính khả thi nguồn lực nghiên cứu • Khả đại diện cho dân số nghiên cứu 11 3/01/2016 23 Thí dụ giả thuyết thống kê • Chiều cao trung bình nam = chiều cao trung bình nữ • Tỉ lệ bị nhồi máu tim nhóm tăng cholesterol = tỉ lệ nhồi máu tim nhóm có cholesterol thấp • Thuốc A có hiệu điều trị thuốc B • Nguy tƣơng đối =1 24 Sai lầm loại • Khả bác bỏ giả thuyết Ho Ho • Khả hồi nghi thật • Khả kết luận yếu tố có liên quan, có khác biệt (bác bỏ Ho) thực khơng có liên quan, khơng có khác biệt • Tƣơng tự dƣơng tính giả (False Positive # False Alarm) – Khả thể tình trạng tình trạng khơng có – Khả cho ngƣời bệnh (qua kết dƣơng tính), nhƣng ngƣời thật khơng bệnh • Mức ý nghĩa kiểm định (alpha) 12 3/01/2016 25 Sai lầm loại • Khả chấp nhận giả thuyết Ho Ho sai • Khả chấp nhận sai • Khả kết luận yếu tố khơng có liên quan, khơng có khác biệt (chấp nhận Ho) thực có liên quan, có khác biệt • Tƣơng tự âm tính giả (False Negative) • Khả khơng thể tình trạng tình trạng có • Khả cho ngƣời khơng bệnh (qua kết âm tính), nhƣng ngƣời thật bị bệnh • Beta Sức mạnh thống kê 1- beta 26 Sai lầm loại & loại Ho Ho sai Bác bỏ Ho Sai lầm loại Kết (p < 0,05) Dƣơng tính giả Dƣơng tính thật Power Chấp nhận Ho Kết Sai lầm loại (p>0,05) Âm tính thật Âm tính giả Khơng bệnh Bệnh Sai lầm loại Kết Dƣơng tính giả Dƣơng tính thật Test dƣơng tính Power Test âm tính Kết Sai lầm loại Âm tính thật Âm tính giả 13 3/01/2016 27 Sai lầm loại & loại Ho Ho sai Bác bỏ Ho Sai lầm loại Kết (p < 0,05) Dƣơng tính giả Dƣơng tính thật Power Chấp nhận Ho (p>0,05) Kết Âm tính thật Âm tính giả Trong dân số Trong Nghiên cứu Sai lầm loại Kết luận có LQ Khơng có LQ Có LQ Sai lầm loại Power - Sai lầm loại (p < 0,05) Kết luận khơng có LQ (p>0,05) 28 Sai lầm loại & loại • Trong NC, thƣờng chọn alpha = 0,05 (hoặc 0,01) beta = 0,20 (hoặc 0,10) power = 0,80 0,90 • Alpha = 0,05 có nghĩa gì? • Có xác suất 5% kết luận từ kiểm định: có ý nghĩa thống kê (có khác biệt) khơng (vì thực tế khơng có khác biệt) • Beta = 0,20 có nghĩa gì? • Có xác suất 20% kết luận từ kiểm định: khơng có ý nghĩa thống kê (khơng có khác biệt) khơng (vì thực tế có khác biệt) 14 3/01/2016 29 Các cách tính cỡ mẫu • Ƣớc lƣợng kết dựa vào • Tỉ lệ • Trung bình • Nguy tƣơng đối, tỉ số nguy • Tỉ số chênh • Kiểm định giả thuyết nhằm • So sánh tỉ lệ • So sánh trung bình • Dựa vào phƣơng pháp phân tích số liệu • Phân tích hồi quy đa biến • Phân tích nhân tố • Phân tích chẩn đốn 30 Cỡ mẫu để ƣớc lƣợng tỉ lệ z12 / p(1 p) n d2 • n: cỡ mẫu tối thiểu cho NC • : sai lầm loại • z1 / 2: trị số từ phân phối chuẩn • p: tỉ lệ ƣớc lƣợng kết dân số • d: sai số ƣớc lƣợng 15 3/01/2016 Cỡ mẫu để ƣớc lƣợng tỉ lệ z12 / p(1 p) n d2 • n: cỡ mẫu tối thiểu cho NC • : thƣờng 0,05 • z1 / 2: alpha = 0,05 Z = 1,96 • p: nghiên cứu trƣớc, nghiên cứu thử (pilot), liệu thứ cấp, phán đốn nhà nghiên cứu • d: p từ 0,3 đến 0,7 : d 10% p từ 0,1 đến 0,7 đến 0,9 : d 5% p 0,9 : d (1-p)/2 32 Cỡ mẫu để ƣớc lƣợng tỉ lệ • Ví dụ: nghiên cứu muốn xác định tỉ lệ tuân thủ điều trị lao Quận X • TH1: biết tỉ lệ từ NC trƣớc, đối tƣợng tƣơng đồng 78% z12 / p(1 p) n d2 : sai lầm loại 0.05 z1 / 2: trị số từ phân phối chuẩn 1.96 p: tỉ lệ ƣớc lƣợng kết dân số 0.78 d: sai số ƣớc lƣợng 0.05 n = 263.69 cần 264 đối tƣợng cho NC 16 3/01/2016 33 Cỡ mẫu để ƣớc lƣợng tỉ lệ • Ví dụ: nghiên cứu muốn xác định tỉ lệ tuân thủ điều trị lao Quận • TH2: khơng biết tỉ lệ từ nghiên cứu trƣớc z12 / p(1 p) n d2 : sai lầm loại 0.05 z1 / 2: trị số từ phân phối chuẩn 1.96 p: tỉ lệ ƣớc lƣợng kết dân số 0.50 d: sai số ƣớc lƣợng 0.01 n = 384.16 cần 385 đối tƣợng cho nghiên cứu 34 Cỡ mẫu để ƣớc lƣợng trung bình • n: cỡ mẫu tối thiểu cho nghiên cứu • : sai lầm loại • z1 / : trị số từ phân phối chuẩn • : độ lệch chuẩn ƣớc lƣợng dân số • d: sai số ƣớc lƣợng 17 3/01/2016 35 Cỡ mẫu để ƣớc lƣợng trung bình • VD: NC nhằm ƣớc lƣợng trọng lƣợng sơ sinh trung bình bệnh viện với biên độ sai số chấp nhận 20gram Biết độ lệch chuẩn trọng lƣợng sơ sinh 350gram • : sai lầm loại 0.05 • z1 / : trị số từ phân phối chuẩn 1.96 • : độ lệch chuẩn ƣớc lƣợng dân số 350 • d: sai số ƣớc lƣợng 20 n = 1176.4 cần 1177 đối tƣợng cho NC 36 Cỡ mẫu để đo lƣờng nguy tƣơng đối • p1: Tỉ lệ mắc bệnh nhóm khơng phơi nhiễm • RR: nguy mắc bệnh • r: tỉ số cỡ mẫu hai nhóm (khơng phơi nhiễm / phơi nhiễm) 18 3/01/2016 37 Cỡ mẫu để đo lƣờng nguy tƣơng đối • VD: NC đồn hệ nhằm xác định mối liên quan hút thuốc nguy ung thƣ phổi Nhà NC cho nguy tƣơng đối vào khoảng RR = 2,5 Biết rằng, ngƣời khơng hút thuốc tỉ lệ bị ung thƣ phổi 8% Cỡ mẫu cần thiết là: • Alpha = 0.05 • Beta = 0.20 (power = 0.80) • p1 = 0.08 • RR = 2.5 • r=1 n = 147 đối tƣợng nhóm Cần tổng cộng 294 đối tƣợng cho NC 38 Cỡ mẫu để so sánh tỉ lệ • p1, p2: tỉ lệ nhóm cần so sánh • r: tỉ số cỡ mẫu nhóm (nhóm / nhóm 1) 19 3/01/2016 39 Cỡ mẫu để so sánh tỉ lệ • VD: NC nhằm so sánh hiệu điều trị phƣơng pháp (PP2) so với phƣơng pháp điều trị cổ điển (PP1) • Tỉ lệ biến chứng hai phƣơng pháp đƣợc dùng để tính cỡ mẫu • Tỉ lệ biến chứng PP1 20% Nhà NC tin tỉ lệ biến chứng PP2 10% • p1 = 0.20; p2 = 0.10; alpha = 0.05; beta = 0.20; ratio (r) = • Mỗi nhóm cần 220 đối tƣợng Cần tổng cộng 440 đối tƣợng cho NC 40 Cỡ mẫu để so sánh trung bình • Khi có thơng tin nhóm • Khi khơng có thơng tin nhóm 20 3/01/2016 41 Cỡ mẫu để so sánh trung bình • VD: NC nhằm so sánh tình trạng hơ hấp (VO2max) hai nhóm đƣợc can thiệp hai chế độ an khác • Chế độ ăn giàu dinh dƣỡng (Atole) có trung bình VO2max;= 2.62; độ lệch chuẩn 0.54 • Chế độ ăn khơng giàu dinh dƣỡng (Fresco) có trung bình 2.34 độ lệch chuẩn 0.40 • Alpha = 0.05; beta = 0.20 • m1 = 2.62; sd1 = 0.54 • m2 = 2.34; sd2 = 0.40 Cần 46 đối tƣợng nhóm Cần tổng cộng 92 đối tƣợng NC 42 Cỡ mẫu để so sánh trung bình • Với NC nhƣng khơng thể tìm đƣợc trung bình độ lệch chuẩn nhóm dựa vào d • d = 0.2 ~ Small • d = 0.5 ~ Medium • d = 0.8 ~ Large 21 3/01/2016 43 Tỉ lệ mẫu • Tình huống: NC tính đƣợc cỡ mẫu 400 Với ƣớc đốn 10% mẫu Số đối tƣợng cần thiết cho NC bao nhiêu? • Tỉ lệ mẫu / tỉ lệ tham gia nghiên cứu • Vd: N = 400, tỉ lệ mẫu báo cáo nghiên cứu trƣớc 10% N cần thiết cho nghiên cứu 400 : (1 - 0.10) = 444.4 cần 445 đối tƣợng 22