1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Bg thuc tap cong dong 1 phan 2 9117

46 1 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 46
Dung lượng 1,33 MB

Nội dung

CHỌN MẪU VÀ TÍNH CỠ MẪU MỤC TIÊU: Sau học xong này, sinh viên Tính cỡ mẫu cho nghiên cứu cắtngang Tính cỡ mẫu cho nghiên cứubệnh-chứng Phân biệt cách chọn mẫu định phương pháp chọn mẫu thích hợp cho thiết kế nghiên cứu khácnhau I NGHIÊN CỨU CẮTNGANG 1.1 Tính cỡ mẫu: Nghiên cứu cắt ngang thướng sử dụng để ước lượng số trung bình (biến số liên tục) hay tỉ lệ (biến số rời) cho nghiên cứu cắtngang Công thức tính cỡ mẫu nhằm ước lượng: - Một số trungbình: : độ lệch chuẩn d: sai số biên ước lượng - Một tỷ lệ: p: tỉ lệ ước tính vấn đề cần khảo sát d: sai số biên ước lượng Ví dụ 1: Cần phải có cỡ mẫu để xác định tỉ lệ đàn ông Việt nam hút thuốc lá, biết kết từ nghiên cứu trước cho thấy tỉ lệ 20% mong muốn kết tìm thấy có giá trị nằm khoảng 5% giá trị thật p = 0,2, 1-p = 0,8,  = 0,05=> n = 1,962 x 0,2 x 0,8/ 0,052 = = 245,8 = 246 người (*)Lưu ý: Đây cỡ mẫu tính cho nghiên cứu KHÔNG sử dụng phương pháp chọn mẫu cụm Nếu chọn mẫu cụm => phải tính “hệ số thiết kế” (designeffect) Đây cỡ mẫu cần có để phân tích Nếu tỉ lệ tham gia NC thấp, ví dụ 75% cỡ mẫu cần có phải tăng lên = 246/0,75 =328 Nếu khơng có thơng tin giá trị p, giá trị 0,5 sử dụng để có cỡ mẫu 55 TT Cộng Đồng lớn Ví dụ 2: Cần phải có cỡ mẫu để ước tính trung bình đường kính động mạch chủ bụng người Việt nam, biết kết từ nghiên cứu trước cho thấy độ lệch chuẩn mong muốn kết tìm thấy có giá trị nằm khoảng 5% giá trị thật (tức sai số khoảng 0,75)  = 5,  = 0,75 => n = 1,96 x 5/ (0,75)2 = 170,7 = 171 người Nếu tỉ lệ tham gia NC 80% cỡ mẫu cần có phải tăng lên = 16/0,8 = 214 người * Cách xác định “hệ số thiết kế” (design effect) Xácđịnh nghiên cứu pilot Nghiên cứu có từ trước có cách chọn mẫu Tính bằngcơngthức: Design effect = + (m-1) * Trong đó: m: độ lớn trung bình 1cụm : hệ số tương quan (intra-class correlationcoefficient) Có thể số âm nhỏ (khi cấu trúc cụm khác nhau) =1 (khi cấu trúc cụm nhất) 1.2 Chọn mẫu: Chọn dân số nghiên cứu: Cần xác định dân số đích dân số nghiên cứu (dân số lấy mẫu) thích hợp để tránh sai lệch chọn mẫu (selectionbias) Ví dụ: Thực nghiên cứu cắt ngang với dân số nghiên cứu bệnh nhân bệnh viện khơng phản ánh xác tỉ suất mắc bệnh (tỉ suất mắc thật cao hay thấphơn) 1.2.1 Phương pháp chọnmẫu: Do kết luận rút từ mẫu khảo sát dùng để suy luận cho dân số (mà từ mẫu lấy ra) nên mẫu chọn cần phải đảm bảo tính đại diện, cần phải thực theo kỹ thuật thích hợp để tránh sai lệch xảyra Có phương pháp chọn mẫu: chọn mẫu có xác suất (Probability sampling method) chọn mẫu khơng có xác suất (non-probability sampling method) Cách tốt để bảo đảm mẫu cho suy diễn xác đáng tin cậy dùng mẫu chọn phương pháp có xác suất Một mẫu (được chọn phương pháp) có xác suất mẫu rút từ dân số theo cách mà tất thành phần dân số có xác suất (đã biết trước) chọn vào mẫu ✓ ✓ ✓ ✓ ✓ 1.2.2 Các phương pháp lấy mẫu có xác suất: Chọn mẫu ngẫu nhiên đơn (simple randomsampling) Chọn mẫu ngẫu nhiên hệ thống (systematic randomsampling) Chọn mẫu phân tầng (stratifiedsampling) Chọn mẫu cụm (clustersampling) Chọn mẫu nhiều giai đoạn (multi-stagesampling) Chọn mẫu ngẫu nhiên đơn (Simple random sampling -SRS): Là phương pháp chọn mẫu mà đơn vị lấy mẫu chọn vào mẫu nghiên cứu với xác suất độc lập với việc chọn đơn vị lấy mẫukhác Các bước cần thiết để chọn mẫu ngẫu nhiên đơn giản: B1.Lập danh sách chọn mẫu (khung chọn mẫu - sampling frame), đối tượng dân số đánh số thứ tự B2.Rút thăm số nguyên ngẫu nhiên cho đủ cỡ mẫu cách: + Dùng bảng số ngẫu nhiên sau xác định vị trí khởi đầu cách ngẫu nhiên bảng + Dùng phím bấm số ngẫu nhiên máy tính cầmtay 57 TT Cộng Đồng + Dùng chương trình vi tính cho số lượng số ngẫu nhiên cầnthiết Ưu điểm phương pháp chọn mẫu ngẫu nhiên đơngiản:thực đơngiản Khuyếtđiểm + Có thể khơng có danh sách đơn vị lấymẫu + Có thể tốn nhiều mẫu nghiên cứu bị trảirộng + Có thể hiệu số dân số nhấtđịnh Chọn mẫu ngẫu nhiên hệ thống (Systematic randon sampling): Là phương pháp chọn ngẫu nhiên nhóm gồm nhiều đơn vị lấy mẫu cách khoảng cách mẫu (k) Các bước cần thiết để chọn mẫu ngẫu nhiên hệ thống: + Tính khoảng cách mẫu k = N/n + Chọn ngẫu nhiên số i (số đầu tiên),  i  k + Chọn nhóm gồm đơn vị lấy mẫu i, i+k, i+2k, v.v Chọn mẫu phân tầng (Stratifiedsampling): Là phương pháp chọn mẫu với nhều cá thể đại diện chọn từ tầng (strata) riêng biệt dân số Sử dụng khi: + Các tầng có khác biến số quantâm + Bản thân khác biệt mục tiêu nghiêncứu Yếu tố phân tầng thường tuổi, phái tính, độ nặng bệnh, tình trạng hút thuốc - không hút thuốc v.v… Việc chọn mẫu phân tầng thường theo tỉ lệ tương xứng (proportional stratified sampling) đơi khơng tương xứng (disproportional stratified sampling) Ưu điểm phương pháp chọn mẫutầng: mẫu đại diện hơn, xáchơn Khuyếtđiểm + Trên thực tế đơi khơng tìm tính chất để phântầng + Về mặt kinh tế, gây tốn tương đương với cch chọn mẫu ngẫu nhiênđơn Chọn mẫu cụm (Cluster sampling): Là phương pháp chọn mẫu mà nhiều đợn vị lấy mẫu (listing units) phối hợp sử dụng, nói cách khác phương pháp chọn mẫu mà khung chọn mẫu bao gồm nhiều cụm, cụm gồm nhiều đối tượng địa phương (hay địa điểm) định Khác với tầng (bao gồm đơn vị lấy mẫu tính chất), cấu trúc cụm phải nên đa dạng tínhchất Sử dụng khi: + Khơng thể có danh sách tất đối tượng dânsố 59 TT Cộng Đồng + Muốn giảm chi phí tiếp cận đốitượng Một số đặc tính quan trọng chọn mẫu cụm: Tiến trình chọn mẫu theo bậc Ví dụ khu phố cụm hộ gia đình đơn vị lấy mẫu có bước để chọn hộ gia đình: bước đầu tiên: chọn khu phố, bước thứ 2: chọn hộ gia đình Hai bước gọi hai giai đoạn (stages) Vì cách chọn mẫu cụm có số giai đoạn (stages) thực Nếu thiết kế chọn mẫu thực nhiều giai đoạn đơn vị lấy mẫu giai đoạn đơn vị lấy mẫu nguyên phát (primary sampling units –PSUs) Cụm chọn nhiều kỹ thuật chọn mẫu khác Chẳng hạn ta chọn cụm cách chọn mẫu ngẫu nhiên đơn giản hay cách chọn mẫu hệthống + Nếu chọn cụm phương pháp chọn mẫu ngẫu nhiên đơn giản =>chọn mẫu cụm đơn giản + Nếu ta thực giai đoạn (Chọn số cụm từ cụm có sẵn, khảo sát hết tất cá thể cụm) => Cụm bậc đơngiản + Nếu cụm chọn giai đoạn phương pháp chọn mẫu ngẫu nhiên đơn giản giai đoạn ta lại chọn số đơn vị chọn mẫu từ cụm có sẵn => Cụm bậc đơn giản Trong trường hợp này, tỉ lệ đơn vị lấy mẫu chọn giai đoạn – từ cụm chọn giai đoạn – giống Phương pháp thực giả định cụm có số lượng đơn vị lấy mẫu bằngnhau + Nếu chọn cụm phương pháp ngẫu nhiên đơn giản => chọn mẫu với xác suất tỉ lệ với độ lớn cụm (sampling with probability proportional to size) Trong tiến trình chọn mẫu cụm, sử dụng nhiều khung chọn mẫu khácnhau Sau thực giai đoạn 1, khung chọn mẫu tập hợp lại từ cụm đượcchọn Ưu điểm phương pháp chọn mẫucụm: khả thi, kinh tế cần chuẩn bị danh sách chi tiết cụm đượcchọn Khuyếtđiểm: số ước lượng khơng xác chọn mẫu SRS, chọn mẫu tầng khảo sát cỡ mẫu => Để tăng độ xác -> tăng cỡmẫu Chọn mẫu nhiều giai đoạn (Multi-stagesampling): Chọn mẫu nhiều giai đoạn kết hợp nhiều phương pháp lấy mẫu Mỗi phương pháp chọn mẫu áp dụng giaiđoạn Trên thực tế phương pháp thường áp dụng nhất: chọn mẫu cụm nhiều giai đoạn Phương pháp chọn mẫu cụm giai đoạn đơn giản thực giả định cụm có số lượng đơn vị lấy mẫu Tuy nhiên thực tế, cụm khơng có độ lớn, người ta sử dụng chọn mẫu với xác suất tỉ lệ với độ lớn cụm (sampling with probability proportional to size) – phương pháp chọn mẫuPPS Chọn mẫu PPS (probability proportionate to size) – chọn mẫu có xác suất tỉ lệ với độ lớn cụm Giai đoạn 1: Chọn n cụm từ tổng số N cụm phương pháp chọn mẫu hệ thống: + Tính khoảng cách mẫu k = N/n + Chọn ngẫu nhiên số i (số đầu tiên),  i  k + Chọn nhóm gồm đơn vị lấy mẫu i, i+k, i+2k, v.v Trong chương trình tiêm chủng mở rộng TCYTTG, số cụm cần chọn 30, khoảng cách mẫu N/30 Giai đoạn 2: Trong n cụm chọn, chọn số đối tượng cần thiết (= cỡ mẫu/n cụm) phương pháp mẫu chọn ngẫu nhiên đơn giản hay chọn mẫu hệ thống Trong chương trình EPI TCYTTG, để chọn nhà cụm người ta chọn nhà cách ngẫu nhiên sau nhà - theo nguyên tắc nhà liền nhà II Nghiên Cứu Bệnh-Chứng 2.1 Tính cỡmẫu: Nghiên cứu bệnh – chứng Ước lượng tỷ số chênh n= Z12− / ln( −  )   1 +   p ( − p ) p ( − p ) 2   Với p2 = OR  p1 OR  p1 + (1 − p1 ) 61 TT Cộng Đồng Kiểm định tỷ số chênh: n= {Z1− / 2 p2 (1 − p2 ) + Z1− p1 (1 − p1 ) + p2 (1 − p2 )}2 ( p1 − p2 ) Nghiên cứu đoàn hệ Ước lượng nguy tương đối n= Z12− /2  (1 − p1 ) (1 − p2 )  +   ln(1 −  )2  p1 p2  Kiểm định nguy tương đối n= {Z1− /2 p* (1 − p* ) + Z1−  p1 (1 − p1 ) + p2 (1 − p2 )}2 ( p1 − p2 ) p*= (p1 + p2 )/2 2.2 Chọnmẫu: 2.2.1 Chọn cabệnh: Nguyêntắc: - Cần phải thiết lập tiêu chuẩn chẩn đoán rõràng - Ca bệnh chứng lấy từ dân số Các ca bệnh nên chọn từđâu? a Có thể lấy từ cộng đồng, dân sốchung Khó khăn: việc đăng ký (các trường hợp bệnh) cộng đồng thường không phổ biến, tốn kém, khơng liệt kê đầy đủ tất trường hợp bệnh b Có thể lấy từ bệnh viện hay phòngkhám Nhược điểm: chọn ca bệnh từ nguồn dễ gặp phải bias người đến bệnh viện thường người bị bệnh nặng, có nhiều bệnh khác kèm theo Các ca bệnh chọn nên ca bệnh chẩn đốn bệnh có (có ca bệnhcũ)? Thơng thường, người ta thích chọn ca bệnh từ ca (incident cases) dễ áp dụng tiêu chuẩn chẩn đoán cách nghiêm ngặt (về mặt lý thuyết) khơng bỏ sót ca bệnh diễn thời gian ngắn Tuy nhiên, bệnh thực cần phải sử dụng bệnh cũ lẫn bệnh để lấy đủ cỡ mẫu cần thiết Sử dụng prevalent cases dẫn đến việc đại diện mức (over-representative) ca bệnh có thời gian bệnh kéo dài người chết bệnh hay người hồi phục nhanh chóng có khả lựa chọn vào nhómbệnh 2.2.2 Chọn cachứng Nguồnchọn: * Có thể từ bệnh nhân bệnh viện Tiện lợi: + Dễ dàng lấy đủ số đối tượng nghiên cứu cầnthiết + Thuận tiện việc thực xétnghiệm + Sai lệch nhớ lại (Recall bias) giảm người vấn nhiềulần + Các ca chứng chọn từ nguồn thường sẵn sàng hợp tác bỏ giữachừng Đây cách tiết kiệm ngân sách lựa chọn nhóm chứng Nhượcđiểm: Những ca chứng chọn từ bệnh viện người bệnh nên thường có xu hướng có kèm theo bệnh khác tiếp xúc với nhiều yếu tố nguy khác Đó yếu tố gây nhiễu (confouding factors) diễn giải KQ Việc lựa chọn ca chứng từ bệnh viện phải dựa số tiêu chuẩn lọai trừ (exclusion criteria) Do làm thay đổi kết nghiên cứu loại ca chứng có số bệnh – mà bệnh lại có mối liên hệ với tình trạng tiếp xúc với yếu tố nguy mà khảosát * Chọn nhóm chứng từ dân sốchung Đây nhóm chứng lýtưởng Tỉ lệ tiếp xúc với yếu tố nguy nhóm chứng dùng để ước lượng tỉ lệ tiếp xúc với yếu tố nguy dân số chung, từ tính nguy tuyệtđối Tuy nhiên, chọn nhóm chứng từ dân số chung tốn thờigian * Chọn nhóm chứng từ bạn bè, gia đình, hàng xóm Tiệnlợi: Nhóm chứng chủ yếu người khoẻ mạnh => tránh hạn chế nêu nhóm chứng chọn từ bệnhviện Ca bệnh ca chứng có số đặc điểm giống yếu tố văn hoá, địa lý => điều chỉnh yếu tố gây nhiễunày Bất lợi: ca chứng bạn bè, gia đình, hàng xóm ca bệnh nên ca bệnh chứng có nhiều điểm chung, chí việc tiếp xúc với yếu tố nguy (VD: hút thuốc, uống rượu…) gần giống ca bệnh ca chứng => dễ đánh giá thấp (underestimate) ảnh hưởng thật việc tiếp xúc với yếu tố nguy nghiên cứu * Sử dụng nhiều nhómchứng Thơng thường, lý tưởng dùng nhóm chứng xuất phát từ dân số với ca bệnh Tuy nhiên, nghiên cứu bệnh chứng làm bệnh viện (hospital-based case 63 TT Cộng Đồng control study) nên dùng nhiều nhóm chứng * Số ca chứng cho cabệnh Nếu số ca bệnh hiếm, cần dùng nhiều ca chứng cho ca bệnh để tăng độ mạnh nghiên cứu Tỉ lệ ca bệnh/ca chứng đến 1/4 hay 1/5 khơng nên tăng lên tăng thêm độ mạnh test thống kê không tăng lên thêm Bắt cặp(matching) Kiểm soát yếu tố gây nhiễu (confounding factors) VD: dùng ca chứng anh chị em song sinh ca bệnh đảm bảo ca bệnh chứng chịu chung ảnh hưởng yếu tố gen, yếu tố môitrường Không cần thiết phải chuẩn bị danh sách ca chứng đủ tiêu chuẩn để sau chọn lại cách ngẫunhiên TÀI LIỆU THAM KHẢO Ancelle T Chapitre 16: Enquetes Épidémiogiques Statistique Épidemilogie Paris: Maloine, 2011 p.189-215 Fletcher R.W., Fletcher S.W Chapter 6: Looking backward ClinicalEpidemiology.Philadelphia: Lippincott Williams & Wilkins, 2005 p 91-104 Gordis L Chapter 10: Case-Control Studies and Other Study Designs Epidemiology Philadelphia: Saunders, Elservier Inc., 2009 p.147-199 Greenberg R.S., Daniels S.R., Flanders W.D., Eley J.W., Boring J.R Chapter 9: CaseControl Studies Medical epidemiology New Jersey, McGraw-Hill Medical Companies, Inc., 2005 p.147-161 Hennekens C.H., Buring J.E Chapter 6: Case-Control Studies Epidemiology in Medicine Boston, Little Brown Company, 1987 p.132-152 Last J.M., Spasoff R.A., Harris S.S., Thuriaux M A dictionary of epidemiology New York, Oxford University Press,2001 TT Cộng Đồng PHÂN TÍCH BIẾN ĐỊNH LƢỢNG 2.1 Mô tả giá trị cho khuynh hƣớng trung tâm độ phân tán Trước thực thống kê mô tả cho định lượng nào, tồn mẫu hay cho nhóm, ta phải kiểm tra xem liệu có tuân theo phân phối chuẩn (normal distribution) cho toàn mẫu cho nhóm hay khơng? - Nếu biến định lượng có phân phối chuẩn, mơ tả khuynh hướng tập trung giá trị trung bình (Mean) độ phân tán độ lệch chuẩn (Standard deviation) - Nếu biến định lượng có phân phối khơng chuẩn, mơ tả khuynh hướng tập trung giá trị trung vị (Median) độ phân tán giá trị nhỏ (min), lớn (max), khoảng (range), khoảng tứ vị (IQR) *** Có cách để kiểm tra biến định lượng: Cách 1: Vẽ hình chng phân phối cho biến định lượng cách vào Graph -> Legacy Dialogs -> Histogram hình sau: Kết quả: Nếu biểu đồ có dạng hình chng úp ngược đối xứng hai bên, kết sau, xem có phân phối chuẩn TT Cộng Đồng Cách 2: Có thể dùng kiểm định One-Sample Kolmogorov-Smirnov để kiểm định tính chuẩn số liệu Bằng cách vào Analyze -> Nonparametric Tests -> Legacy Dialogs -> 1-Sample K-S TT Cộng Đồng Kết sau: Nếu P (Asymp Sig.) > 0,05 Biến có phân phối chuẩn (Ví dụ biến khơng có phân phối chuẩn) Trong trường hợp khơng có phân phối chuẩn, biến xấp xỉ có phân phối chuẩn, ta mơ tả thực thống kê suy luận theo qui luật biến phân phối chuẩn Một biến xem xấp xỉ chuẩn thõa điều kiện sau: TT Cộng Đồng - Giá trị trung bình có nằm +10% so với trung vị - Giá trị trung bình +3SD xấp xỉ cực đại cực tiểu - Hệ số Skewness Kurtorsis nằm +3? - Biểu đồ Histogram có dạng hình chng 2.2 Biến định lƣợng có phân phối chuẩn: giá trị trung bình độ lệch chuẩn Giả định biến cnss phân bố chuẩn, bạn muốn sử dụng giá trị trung bình độ lệch chuẩn để mô tả phân bố biến Từ thực đơn dọc chọn Analyse/Descriptive Statistics/Frequencies Từ danh sách biến, chọn biến age (tuổi) chuyển vào hộp Variable(s) cách nhấp chuột vào dấu mũi tên Nhấp chuột lên Statistics, chọn Mean Std deviation TT Cộng Đồng 2.3 Trƣờng hợp biến định lƣợng khơng có phân phối chuẩn: Giá trị trung vịvà min/ max/ range/ khoảng tứ vị Giả định biến tuổi khơng phân bố chuẩn, bạn cần có giá trị trung vị số giá trị lượng giá độ phân tán để mô tả phân bố biến Nhấp chuột lên Statistics, chọn Median, Minimum, Maximum, Range Quartiles (tứ vị) Nhấp chuột lên Continue/OK để hoàn thành lệnh Phần kết thống kê SPSS đưa sau: TT Cộng Đồng 2.4 Phân tích thống kê mơ tả theo nhóm: Ví dụ mơ tả trọng lượng sơ sinh theo nhóm tuổi mẹ a) Mơ tả số *Tính tính giá trị trung bình độ lệch chuẩn phân nhóm Từ thực đơn chọn: Analyse/Reports/Case Summaries Từ danh sách biến, chọn biến cnss chuyển vào hộp biến, sau chọn nhomtuoi chuyển vào hộp Grouping Variable(s) cách nhấp chuột lên dấu mũi tên Bỏ đánh dấu Display Cases – bạn không muốn điều Nhấp chuột lên nút Statistics, bơi đen Mean Standard Deviation, sau chuyển chúng qua hộp Cell Statistics TT Cộng Đồng Nhấp chuột lên nút Continue, sau nút OK để hồn thành lệnh Kết SPSS có dạng hình 2.5 Tính giá trị trung vị phân nhóm Lặp lại bước đến trên, sau Nhấp chuột lên nút Statistics, bôi đen Median, Minimum, Maximum, Range, chuyển vào hộp Cell Statistics TT Cộng Đồng Nhấp chuột lên nút Continue, sau chọn OK để hồn thành lệnh Kết SPSS có dạng TT Cộng Đồng Khoa Y

Ngày đăng: 28/06/2023, 21:32

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w