Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 14 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
14
Dung lượng
630,63 KB
Nội dung
Bài 4 NGHIÊN CỨU CẮT NGANG TS. BS. Tăng Kim Hồng I. GIỚI THIỆU: 1.1 Đònh nghóa: Nghiên cứu cắt ngang (cross-sectional study, prevalence study) là loại nghiên cứu khảo sát mối liên quan giữa bệnh tật (hay vấn đề sức khỏe) và các đặc điểm khác như chúng hiện có trong một cộng đồng xác đònh, cùng tại một thời điểm/ thời khoảng xác đònh. 1.2 Công dụng của nghiên cứu cắt ngang: 1. Đánh giá “sức khoẻ” của cộng đồng qua việc xác đònh tỉ suất hiện mắc (prevalence) của 1 bệnh hay 1 vấn đề sức khoẻ => do đó được gọi là “prevalence study”. Ví dụ: Dùng nghiên cứu cắt ngang để khảo sát tỉ lệ trẻ suy dinh dưỡng < 5 tuổi trong dân số hay tỉ lệ phụ nữ trong độ tuổi sinh đẻ có áp dụng các biện pháp ngừa thai. 2. Xác đònh sự liên quan giữa bệnh và các yếu tố khảo sát. Từ đó, phán đoán xem các yếu tố khảo sát có phải là nguyên nhân của bệnh hay không. Ví dụ: Một nghiên cứu cắt ngang được thực hiện để khảo sát các “yếu tố nguy cơ” của bệnh lây truyền qua đường tình dục (STD) trong số các phụ nữ đến khám tại bệnh viên da liễu. Nhà nghiên cứu hỏi tất cả phụ nữ về tiền sử sử dụng thuốc ngừa thai đồng thời khám và làm phết tế bào âm đạo – cổ tử cung để xét nghiệm. Mục đích của nghiên cứu này là nhằm trả lời cho câu hỏi: có mối liên quan giữa việc sử dụng thuốc ngừa thai và viêm sinh dục do Chlamydia hay không. 3. Lượng giá một test mới hay ứng dụng mới của một test cũ Ví dụ: Một nghiên cứu cắt ngang đã được thực hiện để so sánh hai phương pháp phát hiện bệnh tắc tónh mạch chi dưới: một là dùng siêu âm Doppler và phương pháp kia là dựa vào khám nghiệm trên lâm sàng (sưng, căng phù chi dưới). Chẩn đoán xác đònh cho tình trạng tắc tónh mạch sâu được dựa vào X-Quang tónh mạch có cản quang hoặc (với một số ít bệnh nhân) là dựa vào kết quả phẫu thuật hay tử thiết. 4. Lượng giá khả năng tiên đoán của các đặc điểm lâm sàng Ví dụ: Mối tương quan giữa khám lâm sàng và nhiễm trùng huyết Độ chính xác của thủ thuật thăm khám trực tràng trong chẩn đoán K tiền liệt tuyến Điểm cắt tối ưu của BMI và CVVE để tiên đốn nguy cơ tim mạch ở trẻ em 5. Sàng lọc và phân loại trước đối tượng nghiên cứu cho các nghiên cứu đoàn hệ (giai đoạn đầu của nghiên cứu đoàn hệ) 18 II. CÁC VẤN ĐỀ TRONG THIẾT KẾ VÀ THỰC HIỆN NGHIÊN CỨU CẮT NGANG 2.1 Tính cỡ mẫu: Nghiên cứu cắt ngang thướng được sử dụng để ước lượng một số trung bình (biến số liên tục) hay một tỉ lệ (biến số rời) cho nghiên cứu cắt ngang Công thức tính cở mẫu nhằm ước lượng: - một số trung bình trong đó σ: độ lệch chuẩn d: sai số biên của ước lượng 2 2 2 n σ α − = 2 /1 d Z - một tỉ lệ: trong đó p: tỉ lệ ước tính của vấn đề cần khảo sát d: sai số biên của ước lượng 2 2 2 ) Zn = − α /1 1( d pp − VD1: Cần phải có cở mẫu là bao nhiêu để xác định tỉ lệ đàn ơng Việt nam hút thuốc lá, biết rằng kết quả từ một nghiên cứu trước đây cho thấy tỉ lệ này là 20% và chúng ta mong muốn kết quả tìm thấy có giá trị nằm trong khoảng 5% giá trị thật p = 0,2, 1-p = 0,8, Δ = 0,05 => n = 1,96 2 x 0,2 x 0,8/ 0,05 2 = = 245,8 = 246 người Lưu ý: - Đây là cở mẫu được tính cho nghiên cứu KHƠNG sử dụng phương pháp chọn mẫu cụm. Nếu chọn mẫu cụm => phải tính “hệ số thiết kế” (design effect) - Đây là cở mẫu cần có để phân tích. Nếu tỉ lệ tham gia NC thấp, ví dụ chỉ 75% thì cở mẫu cần có phải tăng lên = 246/0,75 = 328 - Nếu khơng có thơng tin gì về giá trị p, thì giá trị 0,5 có thể sử dụng để có cở mẫu lớn nhất VD2: Cần phải có cở mẫu là bao nhiêu để ước tính trung bình của trị số HATT của phụ nữ Việt nam, biết rằng kết quả từ một nghiên cứu trước đây cho thấy độ lệch chuẩn là 20 và chúng ta mong muốn kết quả tìm thấy có giá trị nằm trong khoảng 10% giá trị thật σ = 20, Δ = 0,1 => n = 1,962 x 20/ 0,12 = 15,4 = 16 người Nếu tỉ lệ tham gia NC chỉ 80% thì cở mẫu cần có phải tăng lên = 16/0,8 = 20 người * Cách xác định “hệ số thiết kế”(design effect) Xác định bằng nghiên cứu pilot Nghiên cứu có từ trước có cùng cách chọn mẫu Tính bằng cơng thức: Design effect = 1 + (m-1) * δ Trong đó: - m: độ lớn trung bình của 1 cụm - δ: hệ số tương quan (intra-class correlation coefficient) Có thể là 1 con số âm rất nhỏ (khi cấu trúc trong từng cụm rất khác nhau) hoặc =1 (khi cấu trúc trong từng cụm thuần nhất) 19 SỬ DỤNG PHẦN MỀM EPI-INFO 2002 ĐỂ TÍNH CỞ MẪU TRONG NGHIÊN CỨU CẮT NGANG (NHẰM ƯỚC LƯỢNG MỘT TỈ LỆ) Mở Epi-Info 2002, trên thanh menu chọn Utilities -> StatCal -> Nhấp chuột -> Hiện ra cửa sổ StatCal.exe -> Chọn Sample size & power -> Chọn Population Survey -> OK Khi cửa sổ StatCal được mở ra -> điền vào độ lớn của dân số mà từ đó mẫu được rút ra (có thể chọn độ lớn của dân số là 999999 nếu độ lớn của dân số là vô hạn) -> Nhập giá trị p -> Nhập giá trị lớn nhất (hay nhỏ nhất) có thể chấp nhận được (= p ± d) -> Bấm F4 để tính Có thể thay đổi các giá trị được nhập vào và tính lại (sử dụng phím F10). Sauk hi tính xong, nhấn F10 để thoát 20 2.2 Chọn mẫu: 2.2.1 Chọn dân số nghiên cứu: Cần xác đònh dân số đích và dân số nghiên cứu (dân số lấy mẫu) thích hợp để tránh sai lệch do chọn mẫu (selection bias). Ví dụ: Thực hiện nghiên cứu cắt ngang với dân số nghiên cứu là bệnh nhân trong bệnh viện sẽ không phản ánh chính xác được tỉ suất hiện mắc của bệnh (tỉ suất hiện mắc thật sự có thể cao hơn hay thấp hơn) 2.2.2 Phương pháp chọn mẫu: Do kết luận rút ra được từ mẫu khảo sát sẽ được dùng để suy luận cho dân số (mà từ đó mẫu được lấy ra) nên mẫu được chọn cần phải đảm bảo tính đại diện, và vì vậy cần phải được thực hiện theo các kỹ thuật thích hợp để tránh các sai lệch có thể xảy ra. Có 2 phương pháp chọn mẫu: chọn mẫu có xác suất (Probability sampling method) và chọn mẫu không có xác suất (non-probability sampling method). Cách tốt nhất để bảo đảm 1 mẫu sẽ cho ra các suy diễn chính xác và đáng tin cậy là dùng các mẫu được chọn bằng phương pháp có xác suất. Một mẫu (được chọn bằng phương pháp) có xác suất là 1 mẫu được rút ra từ dân số theo cách mà tất cả các thành phần của dân số đều có 1 xác suất (đã biết trước) được chọn vào mẫu. Các phương pháp lấy mẫu có xác suất: – Chọn mẫu ngẫu nhiên đơn (simple random sampling) – Chọn mẫu ngẫu nhiên hệ thống (systematic random sampling) – Chọn mẫu phân tầng (stratified sampling) – Chọn mẫu cụm (cluster sampling) 2.2.2.1 Chọn mẫu ngẫu nhiên đơn (Simple random sampling - SRS) Là phương pháp chọn mẫu mà mọi đơn vị lấy mẫu đều được chọn vào mẫu nghiên cứu với xác suất bằng nhau và độc lập với việc chọn đơn vị lấy mẫu khác Các bước cần thiết để chọn mẫu ngẫu nhiên đơn giản: + Lập danh sách chọn mẫu (khung chọn mẫu - sampling frame), trong đó các đối tượng trong dân số đã được đánh số thứ tự. + Rút thăm các số nguyên ngẫu nhiên cho đủ cở mẫu bằng cách - Dùng bảng số ngẫu nhiên sau khi đã xác đònh vò trí khởi đầu một cách ngẫu nhiên trên bảng. Hoặc - Dùng phím bấm số ngẫu nhiên trên các máy tính cầm tay Hoặc - Dùng chương trình vi tính cho ra số lượng số ngẫu nhiên cần thiết. 21 Random Number Table 13962 70992 65172 28053 02190 83634 66012 70305 66761 88344 43905 46941 72300 11641 43548 30455 07686 31840 03261 89139 00504 48658 38051 59408 16508 82979 92002 63606 41078 86326 61274 57238 47267 35303 29066 02140 60867 39847 50968 96719 43753 21159 16239 50595 62509 61207 86816 29902 23395 72640 83503 51662 21636 68192 84294 38754 84755 34053 94582 29215 36807 71420 35804 44862 23577 79551 42003 58684 09271 68396 19110 55680 18792 41487 16614 83053 00812 16749 45347 88199 82615 86984 93290 87971 60022 35415 20852 02909 99476 45568 05621 26584 36493 63013 68181 57702 49510 75304 38724 15712 06936 37293 55875 71213 83025 46063 74665 12178 10741 58362 84981 60458 16194 92403 80951 80068 47076 23310 74899 87929 66354 88441 96191 04794 14714 64749 43097 83976 83281 72038 49602 94109 36460 62353 00721 66980 82554 90270 12312 56299 78430 72391 96973 70437 97803 78683 04670 70667 58912 21883 33331 51803 15934 75807 46561 80188 78984 29317 27971 16440 62843 84445 56652 91797 45284 25842 96246 73504 21631 81223 19528 15445 77764 33446 41204 70067 33354 70680 66664 75486 16737 01887 50934 43306 75190 86997 56561 79018 34273 25196 99389 06685 45945 62000 76228 60645 87750 46329 46544 95665 • Ưu điểm của phương pháp chọn mẫu ngẫu nhiên đơn giản – Thực hiện đơn giản • Khuyết điểm – Có thể khơng có được danh sách các đơn vị lấy mẫu – Có thể tốn kém nhiều do mẫu nghiên cứu bị trải rộng – Có thể kém hiệu quả ở một số dân số nhất định 2.2 2.2. Chọn mẫu ngẫu nhiên hệ thống (Systematic randon sampling) Là phương pháp chọn ngẫu nhiên một nhóm gồm nhiều đơn vị lấy mẫu cách nhau một khoảng cách mẫu (k). Các bước cần thiết để chọn mẫu ngẫu nhiên hệ thống: + Tính khoảng cách mẫu k = N/n + Chọn ngẫu nhiên một số i (số đầu tiên), 1 ≤ i ≤ k + Chọn một nhóm gồm các đơn vị lấy mẫu i, i+k, i+2k, v.v 2.2.2.3 Chọn mẫu Phân Tầng (Stratified sampling) Là phương pháp chọn mẫu với nhều cá thể đại diện được chọn từ các tầng (strata) riêng biệt của dân số. Sử dụng khi: – Các tầng có khác nhau về biến số quan tâm – Bản thân sự khác biệt này là mục tiêu của nghiên cứu 22 Yếu tố phân tầng thường là tuổi, phái tính, độ nặng của bệnh, tình trạng hút thuốc - không hút thuốc v.v… Việc chọn mẫu phân tầng thường theo tỉ lệ tương xứng (proportional stratified sampling) nhưng đôi khi có thể không tương xứng (disproportional stratified sampling). • Ưu điểm của phương pháp chọn mẫu tầng – Mẫu đại diện hơn, chính xác hơn • Khuyết điểm – Trên thực tế đơi khi khơng tìm được tính chất để phân tầng – Về mặt kinh tế, cũng gây tốn kém tương đương với cách chọn mẫu ngẫu nhiên đơn 2.2.2.4 Chọn mẫu cụm (Cluster sampling) L à phương pháp chọn mẫu mà trong đó một hoặc nhiều đợn vị lấy mẫu (listing units) được phối hợp sử dụng, nói cách khác đây là phương pháp chọn mẫu mà khung chọn mẫu bao gồm nhiều cụm , mỗi cụm gồm nhiều đối tượng trong một địa phương (hay địa điểm) nhất định. Khác với tầng (bao gồm những đơn vị lấy mẫu thuần nhất về 1 tính chất), cấu trúc của 1 cụm càng phải nên đa dạng về tính chất. Sử dụng khi: – Khơng thể có danh sách tất cả các đối tượng trong dân số – Muốn giảm chi phí tiếp cận đối tượng 23 Một số đặc tính quan trọng của chọn mẫu cụm 1) Tiến trình chọn mẫu theo từng bậc (stepwise). Ví dụ nếu khu phố là cụm và hộ gia đình là đơn vị lấy mẫu thì sẽ có 2 bước để chọn hộ gia đình: bước đầu tiên: chọn khu phố, bước thứ 2: chọn hộ gia đình. Hai bước này được gọi là hai giai đoạn (stages). Vì vậy trong cách chọn mẫu cụm sẽ có một số giai đoạn (stages) được thực hiện. Nếu trong thiết kế chọn mẫu chúng ta thực hiện nhiều giai đoạn thì các đơn vị lấy mẫu ở giai đoạn đầu tiên là đơn vị lấy mẫu nguyên phát (primary sampling units – PSUs) 2) Cụm có thể được chọn bằng nhiều kỹ thuật chọn mẫu khác nhau . Chẳng hạn ta có thể chọn cụm bằng cách chọn mẫu ngẫu nhiên đơn giản hay bằng cách chọn mẫu hệ thống. + Nếu chọn cụm bằng phương pháp chọn mẫu ngẫu nhiên đơn giản => chọn mẫu cụm đơn giản - Nếu ta chỉ thực hiện 1 giai đoạn (Chọn ra một số cụm từ các cụm có sẵn, khảo sát hết tất cả các cá thể trong 1 cụm) => Cụm 1 bậc đơn giản - Nếu cụm được chọn ở giai đoạn 1 bằng phương pháp chọn mẫu ngẫu nhiên đơn giản và ở giai đoạn 2 ta lại chọn ra một số đơn vị chọn mẫu từ các cụm có sẵn => Cụm 2 bậc đơn giản. Trong trường hợp này, tỉ lệ của các đơn vị lấy mẫu được chọn ra ở giai đoạn 2 – từ các cụm đã được chọn ở giai đoạn 1 – là giống nhau. Phương pháp này được thực hiện trên giả định là các cụm có số lượng đơn vị lấy mẫu bằng nhau. + Nếu chọn cụm không phải bằng phương pháp ngẫu nhiên đơn giản => chọn mẫu với xác suất tỉ lệ với độ lớn của cụm (sampling with probability proportional to size) 3) Trong tiến trình chọn mẫu cụm, có thể sử dụng nhiều khung chọn mẫu khác nhau 4) Sau khi thực hiện giai đoạn 1, khung chọn mẫu mới được tập hợp lại từ các cụm được chọn • Ưu điểm của phương pháp chọn mẫu cụm - Khả thi, kinh tế hơn vì chỉ cần chuẩn bị danh sách chi tiết trong các cụm được chọn • Khuyết điểm - Các số ước lượng có thể không chính xác bằng chọn mẫu SRS, chọn mẫu tầng nếu khảo sát trên cùng cở mẫu => Để tăng độ chính xác -> tăng cở mẫu 2.2.2.5 Choïn maãu nhiều bậc (nhiều giai đoạn) (Multi-stage sampling) Chọn mẫu nhiều bậc (nhiều giai đoạn) là sự kết hợp nhiều phương pháp lấy mẫu. Mỗi một phương pháp chọn mẫu được áp dụng là 1 bậc (giai đoạn) Trên thực tế phương pháp thường được áp dụng nhất: chọn mẫu cụm nhiều bậc. Phương pháp chọn mẫu cụm 2 bậc đơn giản được thực hiện trên giả định là các cụm có số lượng đơn vị lấy mẫu bằng nhau. Tuy nhiên trên thực tế, các cụm hầu như không có cùng độ lớn , vì vậy người ta sử dụng chọn mẫu với xác suất tỉ lệ với độ lớn của cụm (sampling with probability proportional to size) – phương pháp chọn mẫu PPS Chọn mẫu PPS (probability proportionate to size) – chọn mẫu có xác suất tỉ lệ với độ lớn của cụm Bậc 1: Chọn ra n cụm từ tổng số N cụm bằng phương pháp chọn mẫu hệ thống: + Tính khoảng cách mẫu k = N/n + Chọn ngẫu nhiên một số i (số đầu tiên), 1 ≤ i ≤ k + Chọn một nhóm gồm các đơn vị lấy mẫu i, i+k, i+2k, v.v Trong chương trình tiêm chủng mở rộng của TCYTTG, số cụm cần chọn là 30, do đó khoảng cách mẫu là N/30 24 Bậc 2: Trong n cụm được đã chọn, chọn ra số đối tượng cần thiết (= cở mẫu / n cụm) bằng phương pháp mẫu chọn ngẫu nhiên đơn giản hay chọn mẫu hệ thống Trong chương trình EPI của TCYTTG, để chọn ra 7 nhà trong 1 cụm người ta chọn ra nhà đầu tiên một cách ngẫu nhiên rồi sau đi các nhà tiếp theo - theo ngun tắc nhà liền nhà 2.3 Thu thập số liệu: Thu thập đồng thời số liệu về tình trạng bệnh và tình trạng tiếp xúc bằng các kỹ thuật và phương pháp đo lường thích hợp. III. CÁC VẤN ĐỀ TRONG PHÂN TÍCH VÀ DIỄN GIẢI KẾT QUẢ CỦA NGHIÊN CỨU CẮT NGANG 3.1 Phân tích kết quả: Trong đa số trường hợp, nghiên cứu cắt ngang được sử dụng như một nghiên cứu mô tả. Do đó, số liệu được phân tích bằng thống kê mô tả và được trình bày dưới dạng các bảng, biểu. Tuy nhiên, trong một số trường hợp, nghiên cứu cắt ngang còn được dùng để phân tích mối liên quan giữa bệnh và việc tiếp xúc với một yếu tố nguy cơ nào đó. Trong trường hợp này, cần lập bảng chéo (cross tabulation) – phân nhóm nghiên cứu theo các yếu tố nguy cơ cần khảo sát, và so sánh tỉ suất hiện mắc (prevalence rates) trong từng nhóm. 25 Bệnh Có Không Tổng số Có a b a + b Tiếp xúc Không c d c + d Tổng số a + c b + d a + b + c + d Prevalence của bệnh trong nhóm tiếp xúc = a/(a+b) Prevalence của bệnh trong nhóm không tiếp xúc = c/(c+d) Có thể dùng phép kiểm thống kê (chi bình phương) để xác đònh mối liên hệ. Độ mạnh của sự phối hợp sẽ được tính bằng Prevalence Rate Ratio (PRR) * a/(a+b) Prevalence Rate Ratio (PRR) = c/(c+d) 3.2 Các sai số hệ thống (bias) thường gặp trong nghiên cứu cắt ngang a- Volunteer bias (sai lệch do mẫu được chọn từ những người tình nguyện): có thể xảy ra khi đối tượng tình nguyện tham gia vào nghiên cứu có những đặc điểm khác với những người không tình nguyện tham gia nghiên cứu VD: tuổi, giới, dân tộc, trình độ học vấn v.v… Hơn nữa, những người tình nguyện tham gia nghiên cứu thường là những người khoẻ mạnh. b- Survivor bias (sai lệch từ những trường hợp sống sót chọn lọc): Khi thực hiện nghiên cứu cắt ngang, chúng ta chỉ có thể thu thập thông tin từ những người còn sống. Nếu những người tiếp xúc với yếu tố nguy cơ đều đã chết trước khi nghiên cứu bắt đầu thì có thể chúng ta chỉ thu thập được thông tin từ những người không tiếp xúc với yếu tố nguy cơ và như vậy có thể sẽ cho kết luận sai lệch. c- Non-response/participation bias (sai lệch do nhiều người không đáp ứng/không tham gia vào nghiên cứu): Tỉ lệ người đáp ứng/tham gia vào nghiên cứu cần phải được xem xét kỹ lưỡng trong nghiên cứu cắt ngang. Kết luận sai lệch có thể xảy ra nếu những người không thể tham gia vào nghiên cứu có nhiều đặc điểm khác xa với những người có thể tham gia vào nghiên cứu. VD: trong nghiên cứu về thói quen uống rượu, những người thường xuyên uống rượu thường ít khi có mặt để trả lời câu hỏi phỏng vấn v.v… Nếu tỉ lệ đáp ứng <70% thì cần phải xem xét lại giá trò của nghiên cứu IV. CÁC ƯU ĐIỂM VÀ HẠN CHẾ CỦA NGHIÊN CỨU CẮT NGANG 4.1 Ưu điểm: - Cho kết quả nhanh, ít tốn kém, dễ thực hiện - Cung cấp thông tin về tỉ suất hiện mắc bệnh (hay vấn đề sức khoẻ nào đó) => cung cấp tốt thông tin cho việc đánh giá tình hình sức khoẻ, bệnh tật. - Là bước đầu tiên của nghiên cứu đoàn hệ - Có thể chứng minh mối liên hệ của bệnh và nhiều yếu tố nguy cơ * Prevalence Odds Ratio (POR) cũng có thể được sử dụng trong nghiên cứu cắt ngang để tính độ mạnh của sự phối hợp 26 4.2 Hạn chế: - Đôi khi không thể kết luận được mối liên hệ nhân quả từ các số liệu thu thập được trong nghiên cứu cắt ngang vì tình trạng tiếp xúc với yếu tố nguy cơ và bệnh được đánh giá cùng một lúc. Ví dụ: Trong 1 nghiên cứu cắt ngang cho thấy những người bò ung thư thì có mức β - caroten (tiền vitamin A) trong máu thấp hơn người bình thường cùng tuổi, cùng giới tính. Tuy nhiên, người ta không thể xác đònh được trong nghiên cứu này là do mức β - caroten trong máu thấp đưa đến ung thư hay là mức β -caroten trong máu thấp thực sự là kết quả của bệnh do những thay đổi trong chế độ ăn uống hay do những ảnh hưởng của K gây ra tình trạng suy nhược chung. - Do nghiên cứu cắt ngang chỉ thu thập thông tin về tình trạng bệnh và tiếp xúc với yếu tố nguy cơ tại một thời điểm/ thời khoảng nhất đònh nên có thể đưa đến những thông tin sai lệch. Ví dụ: Các bác só lâm sàng thường tin rằng huyết áp tâm trương ở người già không tăng do chỉ dựa trên những nghiên cứu cắt ngang trong đó thể hiện rằng số huyết áp tâm trương trung bình ở mọi lứa tuổi chỉ xấp xỉ 80mmHg. Tuy nhiên, trong một nghiên cứu đoàn hệ (nghiên cứu Framingham), người ta thấy rằng những bệnh nhân được theo dõi sau nhiều năm có huyết áp tâm trương tăng khi về già. - Khi nghiên cứu những bệnh hiếm, thực hiện nghiên cứu cắt ngang là không thực tế. TÀI LIỆU THAM KHẢO 1. David C., Ian G., Richard H. Epidemiology. Sidney, University of New South Wales Press Ltd., 1994: 53 – 63. 2. Friedman G.D. Primer of epidemiology. Singapore, McGraw-Hill Book Co., 1994: 96 – 109. 3. Hulley S.B., Cummings S.R. Designing clinical research. Baltimore, Williams & Wilkins, 1988: 75 – 78. 4. Jennifer L.K., Thompson W.D., Alfred S.E. Methods in observational epidemiology. New York, Oxford University Press, 1986: 187 – 191. 5. Last J.M., Abramson J.H., Friedman G.D., Porta M., Spasoff R.A., Thuriaux M. A dictionary of epidemiology. New York, Oxford University Press, 1995. 6. Lemeshow S. Hosmer D.W., Klar J., Lwanga S.K. Adequacy of sample size in health studies. England, John Wiley & Sons Ltd., 1990. 7. Levy P.S., Lemeshow S. Sampling for health professionals. California, Lifetime Learning Publications, 1980. 8. Stephen H.G. Interpreting the medical literature. Singapore, McGraw-Hill Book Co., 1993: 55 – 66. 27 [...]... svy Statistics -> Survey data analysis -> Tables -> One-way tables (hoặc Two-way tables) -> Cửa sổ svy: tabulate sẽ hiện ra -> nhập biến số cần xử lý vào 30 - Muốn tính design-effect (DEFT) từ số liệu của nghiên cứu có áp dụng phương pháp chọn mẫu cụm (để sử dụng cho việc tính cở mẫu của nghiên cứu sắp tới) sử dụng lệnh như sau: Statistics -> Survey data analysis -> DEFF, MEFF and other statistics -> ... -| Linearized | Proportion Std Err DEFT -+ -BMIc | _prop_1 | 8626 844 0091192 1.37239 Overweight | 1169325 00803 14 1.2 946 Obese | 0203831 002 545 6 93312 - Trong nghiên cứu cắt ngang, ta cũng có thể xác định mối liên quan giữa 2 biến số bằng phép kiểm chi bình phương hoặc Fisher exact test Statistics -> Summaries, tables and tests -> Tables -> Two-way tables... = 26 84 -| Mean Std Err [95% Conf Interval] -+ -BMI | 18.80199 0630 647 18.67833 18.92565 29 - Lệnh sử dụng để tính tỉ lệ: Statistics -> Survey data analysis -> Means, proportions, ratio, totals -> Proportions -> Cửa sổ svy: proportion sẽ hiện ra -> nhập biến số cần tính proportion vào (Ví dụ biến số BMIc) - Ngoài... [95% Conf Interval] -+ -BMI | 18.62681 1 246 661 18.371 84 18.88178 Kết quả n y cho chúng ta th y số liệu được phân tích trên 26 84 cá thể được chọn từ 2 tầng, 31 cụm và trung bình BMI là 18,6 (18 ,4, 18,9) Kết quả n y tương tự như kết quả ta phân tích không sử dụng lệnh “svy” nhưng khoảng tin c y khi sử dụng lệnh “svy” hẹp hơn mean BMI Mean estimation... “tầng”, biến nào là “cụm” trong bộ dữ liệu => Sử dụng lệnh “svyset” - Tìm lệnh để sử dụng trong STATA Statistics -> Survey data analysis -> Setup and utilities -> Declare survey design for dataset Ví dụ: Trong điều tra cắt ngang thực hiện năm 20 04 nhằm khảo sát tình trạng thừa cânbéo phì ở trẻ vị thành niên nội thành TPHCM, các nhà nghiên cứu đã chọn mẫu từ 2 “tầng” (nội thành “giàu” và nội thành “nghèo”)... estat sẽ hiện ra -> Chọn DEFF, MEFF for point estimates (effect) -> Chọn report DEFT Lưu ý: Trước khi sử dụng lệnh n y cần phải ch y lệnh tính trung bình hay tỉ lệ của 1 biến số nào đó, rồi mới dùng lệnh n y để ước tính design effect estat effects, deft -| Linearized | Mean Std Err DEFT -+ -BMI | 18.62681 1 246 661 2.01635 - estat effects,... (grade) 6-7 và một số lớp thuộc khối 8-9 (bậc 2) Với các lớp được chọn, khảo sát toàn bộ học sinh trong lớp Lệnh “svyset” được thực hiện như sau: svyset school [pw=pw], strata(strata) fpc(Nschool) || grade, fpc(Nclass) 28 Sau khi khai báo rồi thì từ đ y, muốn tính trung bình, hay tỉ lệ của vấn đề cần khảo sát lệnh sử dụng luôn luôn có “svy” - Lệnh sử dụng để tính trung bình BMI: Statistics -> Survey data... Statistics -> Survey data analysis -> Means, proportions, ratio, totals -> Means -> Cửa sổ svy: mean sẽ hiện ra -> nhập biến số cần tính mean vào (Ví dụ biến số BMI) svy linearized : mean BMI (running mean on estimation sample) Survey: Mean estimation Number of strata = Number of PSUs = 2 31 Number of obs Population size Design df = = = 26 84 2670.2 29 -| Linearized | Mean Std...BÀI TẬP SỬ DỤNG STATA TRONG NGHIÊN CỨU CẮT NGANG Tính với file số liệu 1) Sử dụng file “cc study“ Trong STATA, nếu nghiên cứu mà chúng ta đang phân tích là 1 survey trong đó có sử dụng nhiều phương pháp chọn mẫu (cụm, tầng, nhiều bậc…) thì khi phân tích chúng ta cần sử dụng lệnh “svy” – là lệnh dành riêng để phân tích survey Muốn sử dụng các lệnh “svy”, trước tiên cần “khai... quan giữa 2 biến số bằng phép kiểm chi bình phương hoặc Fisher exact test Statistics -> Summaries, tables and tests -> Tables -> Two-way tables with measures of association -> Cửa tabulate2 sẽ hiện ra -> nhập biến số cần xử lý vào -> Chọn phép kiểm cần sử dụng 31 . 71213 83025 46 063 746 65 12178 10 741 58362 849 81 6 045 8 161 94 9 240 3 80951 80068 47 076 23310 748 99 87929 663 54 8 844 1 96191 047 94 147 14 647 49 43 097 83976 83281 72038 49 602 941 09 3 646 0 62353 00721. 81223 19528 1 544 5 777 64 3 344 6 41 2 04 70067 333 54 70680 666 64 7 548 6 16737 01887 509 34 43306 75190 86997 56561 79018 342 73 25196 99389 06685 45 945 62000 76228 60 645 87750 46 329 46 544 95665 • Ưu. 825 54 90270 12312 56299 7 843 0 72391 96973 7 043 7 97803 78683 046 70 70667 58912 21883 33331 51803 159 34 75807 46 561 80188 789 84 29317 27971 1 644 0 62 843 844 45 56652 91797 45 2 84 25 842 96 246 73504