16 Ước tính cỡ mẫu (Sample size estimation) ppt

16 Ước tính cỡ mẫu (Sample size estimation) Một cơng trình nghiên cứu thường dựa vào mẫu (sample) Một câu hỏi quan trọng trước tiến hành nghiên cứu cần mẫu hay đối tượng cho nghiên cứu “Đối tượng” đơn vị nghiên cứu, số bệnh nhân, số tình nguyện viên, số mẫu ruộng, trồng, thiết bị, v.v… Ước tính số lượng đối tượng cần thiết cho cơng trình nghiên cứu đóng vai trị quan trọng, yếu tố định thành công hay thất bại nghiên cứu Nếu số lượng đối tượng không đủ kết luận rút từ cơng trình nghiên cứu khơng có độ xác cao, chí khơng thể kết luận Ngược lại, số lượng đối tượng nhiều số cần thiết tài nguyên, tiền bạc thời gian bị hao phí Do đó, vấn đề then chốt trước nghiên cứu phải ước tính cho số đối tượng vừa đủ cho mục tiêu nghiên cứu Số lượng đối tượng “vừa đủ” tùy thuộc vào ba yếu tố chính: • • • Sai sót mà nhà nghiên cứu chấp nhận, cụ thể sai sót loại I II; Độ dao động (variability) đo lường, mà cụ thể độ lệch chuẩn; Mức độ khác biệt hay ảnh hưởng mà nhà nghiên cứu muốn phát hiện; Không có số liệu ba yếu tố khơng thể ước tính cỡ mẫu Trong chương tơi bàn qua ba yếu tố 16.1 Khái niệm “power” Thống kê học phương pháp khoa học có mục đích phát hiện, hay tìm gộp chung lại cụm từ “chưa biết” (unknown) Cái chưa biết tượng không quan sát được, hay quan sát không đầy đủ “Cái chưa biết” ẩn số (như chiều cao trung bình người Việt Nam, hay trọng lượng phần tử), hiệu thuật điều trị, gen có chức làm cho có màu xanh, sở thích người, v.v… Chúng ta đo chiều cao, hay tiến hành xét nghiệm để biết hiệu thuốc, nghiên cứu tiến hành nhóm đối tượng, khơng phải toàn quần thể dân số Ở mức độ đơn giản nhất, chưa biết xuất hai hình thức: có, không Chẳng hạn thuật điều trị có hay khơng có hiệu chống gãy xương, khách hàng thích hay khơng thích 64 loại nước giải khát Bởi khơng biết tượng cách đầy đủ, phải đặt giả thiết Giả thiết đơn giản giả thiết đảo (hiện tượng khơng tồn tại, kí hiệu H-) giả thiết (hiện tượng tồn tại, kí hiệu H+) Chúng ta sử dụng phương pháp kiểm định thống kê (statistical test) kiểm định t, F, z, χ2, v.v… để đánh giá khả giả thiết Kết kiểm định thống kê đơn giản chia thành hai giá trị: có ý nghĩa thống kê (statistical significance), khơng có ý nghĩa thống kê (non-significance) Có ý nghĩa thống kê đây, đề cập Chương 7, thường dựa vào trị số P: Nếu P < 0.05, phát biểu kết có ý nghĩa thống kê; Nếu P > 0.05 nói kết khơng có ý nghĩa thống kê Cũng xem có ý nghĩa thống kê hay khơng có ý nghĩa thống kê có tín hiệu hay khơng có tín hiệu Hãy tạm đặt kí hiệu T+ kết có ý nghĩa thống kê, T- kết kiểm định khơng có ý nghĩa thống kê Hãy xem xét ví dụ cụ thể: để biết thuốc risedronate có hiệu hay khơng việc điều trị loãng xương, tiến hành nghiên cứu gồm nhóm bệnh nhân (một nhóm điều trị risedronate nhóm sử dụng giả dược placebo) Chúng ta theo dõi thu thập số liệu gãy xương, ước tính tỉ lệ gãy xương cho nhóm, so sánh hai tỉ lệ kiểm định thống kê Kết kiểm định thống kê có ý nghĩa thống kê (P0.05) Xin nhắc lại khơng biết risedronate thật có hiệu nghiệm chống gãy xương hay khơng; Chúng ta đặt giả thiết H Do đó, xem xét giả thiết kết kiểm định thống kê, có bốn tình huống: (a) Giả thuyết H (thuốc risedronate có hiệu nghiệm) kết kiểm định thống kê P0.05); (c) Giả thuyết H sai (thuốc risedronate khơng có hiệu nghiệm) kết kiểm định thống kê có ý nghĩa thống kê (P0.05) Ở đây, trường hợp (a) (d) khơng có vấn đề, kết kiểm định thống kê quán với thực tế tượng Nhưng trường hợp (b) (c), phạm sai lầm, kết kiểm định thống kê không phù hợp với giả thiết Trong ngôn ngữ thống kê học, có vài thuật ngữ: 65 • Xác suất tình (b) xảy gọi sai sót loại II (type II error), thường kí hiệu β • Xác suất tình (a) gọi Power Nói cách khác, power xác suất mà kết kiểm định thống cho kết p power.t.test(delta=1, sd=4.6, sig.level=.05, power=.80, 70 type='one.sample') One-sample t test power calculation n delta sd sig.level power alternative = = = = = = 168.0131 4.6 0.05 0.8 two.sided Kết tính tốn từ R 168, khác với cách tính thủ cơng đối tượng, cố nhiên R sử dụng nhiều số lẻ xác cách tính thủ cơng Với sai số 0.5 cm: # sai số 0.5 cm, độc lệch chuẩn 4.6, a=0.05, power=0.8 > power.t.test(delta=0.5, sd=4.6, sig.level=.05, power=.80, type='one.sample') One-sample t test power calculation n delta sd sig.level power alternative = = = = = = 666.2525 0.5 4.6 0.05 0.8 two.sided Ví dụ 2: Một loại thuốc điều trị có khả tăng độ alkaline phosphatase bệnh nhân loãng xương Độ lệch chuẩn alkaline phosphatase 15 U/l Một nghiên cứu tiến hành quần thể bệnh nhân Việt Nam, nhà nghiên cứu muốn biết bệnh nhân cần tuyển để chứng minh thuốc alkaline phosphatase từ 60 đến 65 U/l sau tháng điều trị, với sai số I α = 0.05 power = 0.8 Đây loại nghiên cứu “trước – sau” (before-after study); Có nghĩa trước sau điều trị Ở đây, có nhóm bệnh nhân, đo hai lần (trước dùng thuốc sau dùng thuốc) Chỉ tiêu lâm sàng để đánh giá hiệu nghiệm thuốc độ thay đổi alkaline phosphatase Trong trường hợp này, có trị số tăng trung bình U/l độ lệch chuẩn 15 U/l, hay nói theo ngơn ngữ R, delta=5, sd=15, sig.level=.05, power=.80, lệnh: > power.t.test(delta=3, sd=15, sig.level=.05, power=.80, type='one.sample') One-sample t test power calculation 71 n delta sd sig.level power alternative = = = = = = 198.1513 15 0.05 0.8 two.sided Như vậy, cần phải có 198 bệnh nhân để đạt mục tiêu 16.4.2 Ước tính cỡ mẫu cho so sánh hai số trung bình Trong thực tế, nhiều nghiên cứu nhằm so sánh hai nhóm với Cách ước tính cỡ mẫu cho nghiên cứu chủ yếu dựa vào công thức [2] trình bày phần 15.3.1 Ví dụ 3: Một nghiên cứu thiết kế để thử nghiệm thuốc alendronate việc điều trị loãng xương phụ nữ sau thời kì mãn kinh Có hai nhóm bệnh nhân tuyển: nhóm nhóm can thiệp (được điều trị alendronate), nhóm nhóm đối chứng (tức khơng điều trị) Tiêu chí để đánh giá hiệu thuốc mật độ xương (bone mineral density – BMD) Số liệu từ nghiên cứu dịch tễ học cho thấy giá trị trung bình BMD phụ nữ sau thời kì mãn kinh 0.80 g/cm2, với độ lệch chuẩn 0.12 g/cm2 Vấn đề đặt cần phải nghiên cứu đối tượng để “chứng minh” sau 12 tháng điều trị BMD nhóm tăng khoảng 5% so với nhóm 2? Trong ví dụ trên, tạm gọi trị số trung bình nhóm µ nhóm µ , có: µ = 0.8*1.05 = 0.84 g/cm2 (tức tăng 5% so với nhóm 1), đó, ∆ = 0.84 – 0.80 = 0.04 g/cm2 Độ lệch chuẩn σ=0.12 g/cm2 Với power = 0.90 α = 0.05, cỡ mẫu cần thiết là: n= 2C ( ∆ /σ ) = ×10.51 ( 0.04 / 0.12 ) = 189 Và lời giải từ R qua hàm power.t.test sau: > power.t.test(delta=0.04, sd=0.12, sig.level=0.05, power=0.90, type="two.sample") Two-sample t test power calculation n = 190.0991 72 delta sd sig.level power alternative = = = = = 0.04 0.12 0.05 0.9 two.sided NOTE: n is number in *each* group Chú ý hàm power.t.test, ngồi thơng số thơng thường delta (độ ảnh hưởng hay khác biệt theo giả thiết), sd (độ lệch chuẩn), sig.level xác suất sai sót loại I, power, phải cụ thể nghiên cứu gồm có hai nhóm với thông số type=”two.sample” Kết cho biết cần 190 bệnh nhân cho nhóm (hay 380 bệnh nhân cho cơng trình nghiên cứu) Trong trường hợp này, power = 0.90 α = 0.05 có nghĩa ? Trả lời: hai thơng số có nghĩa tiến hành thật nhiều nghiên cứu (ví dụ 1000) nghiên cứu với 380 bệnh nhân, có 90% (hay 900) nghiên cứu cho kết với trị số p < 0.05 16.4.3 Ước tính cỡ mẫu cho phân tích phương sai Phương pháp ước tính cỡ mẫu cho so sánh hai nhóm khai triển thêm để ước tính cỡ mẫu cho trường hợp so sánh hai nhóm Trong trường hợp có nhiều nhóm, đề cập Chương 11, phương pháp so sánh phân tích phương sai Theo phương pháp này, số trung bình bình phương phần dư (residual mean square, RMS) ước tính độ dao động đo lường nhóm, số quan trọng việc ước tính cỡ mẫu Chi tiết lí thuyết đằng sau cách ước tính cỡ mẫu cho phân tích phương sai phức tạp, không nằm phạm vi chương Nhưng ngun lí chủ yếu khơng khác so với lí thuyết so sánh hai nhóm Gọi số trung bình k nhóm µ1, µ2, µ3, , µk, tính tổng bình phương nhóm SS SS = k ∑ ( µi − µ ) , đó, µ = i =1 Cho λ = ∑µ /k i =1 i SS ( k − 1) RMS , vấn đề đặt tìm số lượng cỡ mẫu n cho zβ đáp ứng yêu cầu power = 0.80 hay 0.9, mà zβ = 73 k ( k − 1) ( + nλ ) F + k ( n − 1) ( + 2nλ ) ×    k ( n − 1)  ( k − 1) ( + nλ ) − ( 1| 2nλ )  − F ( k − 1) ( + nλ ) ( 2k ( n − 1) − 1)      Trong F kiểm định F (Xem J Fleiss, “The Design and Analysis of Clinical Experiments”, John Wiley & Sons, New York 1986, trang 373) Ví dụ Để so sánh độ loại nước uống nhóm đối tượng khác giới tính độ tuổi (tạm gọi nhóm A, B, C D), nhà nghiên cứu giả thiết độ nhóm A, B C D lần lược 4.5, 3.0, 5.6, 1.3 Qua xem xét nhiều nghiên cứu trước, nhà nghiên cứu biết RMS độ nhóm khoảng 8.7 Vấn đề đặt đối tượng cần nghiên cứu để phát khác biệt có ý nghĩa thống kê mức độ α = 0.05 power = 0.9 Hàm power.anova.test R ứng dụng để giải vấn đề Chúng ta cần đơn giản cung cấp số trung bình theo giả thiết số RMS sau: # trước hết cho số trung bình vào vector > groupmeans power.anova.test(groups = length(groupmeans), between.var=var(groupmeans), within.var=8.7, power=0.90, sig.level=0.05) Balanced calculation groups n between.var within.var sig.level power = = = = = = one-way analysis of variance power 12.81152 3.486667 8.7 0.05 0.9 NOTE: n is number in each group Kết cho thấy nhà nghiên cứu cần khoảng 13 đối tượng cho nhóm (tức 52 đối tượng cho tồn nghiên cứu) 16.4.4 Ước tính cỡ mẫu để ước tính tỉ lệ 74 Nhiều nghiên cứu mơ tả có mục đích đơn giản ước tính tỉ lệ Chẳng hạn như, giới y tế thường hay tìm hiểu tỉ lệ bệnh cộng đồng, hay giới thăm dò ý kiến thị trường thường tìm hiểu tỉ lệ dân số ưa thích sản phẩm Trong trường hợp này, khơng có đo lường mang tính liên tục, kết giá trị nhị phân có / khơng, thích / khơng thích, v.v… Và cách ước tính cỡ mẫu khác với ba ví dụ Năm 1991, thăm dò ý kiến Mĩ cho thấy 45% người hỏi sẵn sàng khuyến khích họ nên hiến thận cho bệnh nhân cần thiết Khoảng tin cậy 95% tỉ lệ 42% đến 48%, tức khoảng cách đến 6%! Kết tương đối thiếu xác, dù số lượng đối tượng tham gia lên đến 1000 người Để trả lời câu hỏi này, thử xem qua vài lí thuyết ước tính cỡ mẫu cho tỉ lệ ˆ Chúng ta biết qua Chương p ước tính từ n đối tượng, khoảng tin cậy 95% tỉ lệ p [trong dân số] là: ˆ ˆ ˆ p ± 1.96 × SE ( p ) , SE ( p ) = ˆ ˆ p (1− p) / n Bây giờ, lật ngược vấn đề: muốn ước tính p khoảng rộng ˆ × 1.96 × SE ( p ) khơng q số m Nói cách khác: ˆ ˆ 1.96 × p ( − p ) / n ≤ m Chúng ta muốn tìm số lượng đối tượng n để đạt yêu cầu Qua cách diễn đạt trên, thấy rằng:  1.96  ˆ ˆ n≥  p ( 1− p)  m  Do đó, số lượng cỡ mẫu tùy thuộc vào độ sai số m tỉ lệ p mà muốn ước tính Độ sai số thấp, số lượng cỡ mẫu cao Ví dụ 5: Chúng ta muốn ước tính tỉ lệ đàn ơng hút thuốc Việt Nam, cho ước số không cao hay thấp 2% so với tỉ lệ thật toàn dân số Một nghiên cứu trước cho thấy tỉ lệ hút thuốc đàn ơng người Việt lên đến 70% Câu hỏi đặt cần nghiên cứu đàn ông để đạt yêu cầu 75 ˆ Trong ví dụ này, có sai số m = 0.02, p = 0.70, số lượng cỡ mẫu cần thiết cho nghiên cứu là:  1.96  n≥  0.7 × 0.3  0.02  Nói cách khác, cần nghiên cứu 2017 Nếu muốn giảm sai số từ 2% xuống 1% (tức m = 0.01) số lượng đối tượng 8067! Chỉ cần thêm độ xác 1%, số lượng mẫu thêm 6000 người Do đó, vấn đề ước tính cỡ mẫu phải thận trọng, xem xét cân độ xác thơng tin cần thu thập chi phí R khơng có hàm cho ước tính cỡ mẫu cho tỉ lệ, với công thức trên, bạn đọc viết hàm để tính dễ dàng 16.4.5 Ước tính cỡ mẫu cho so sánh hai tỉ lệ Nhiều nghiên cứu mang tính suy luận thường có hai hay nhiều hai nhóm để so sánh Trong phần 15.4.2 làm quen với phương pháp ước tính cỡ mẫu để so sánh hai số trung bình kiểm định t Đó nghiên cứu mà tiêu chí biến số liên tục Nhưng có nghiên cứu biến số khơng liên tục mà mang tính nhị phân vừa bàn phần 15.4.3 Để so sánh hai tỉ lệ, phương pháp kiểm định thông dụng kiểm định nhị phân (binomial test) hay Khi bình phương (χ2 test) Trong phần này, bàn qua cách tính cỡ mẫu cho hai loại kiểm định thống kê Gọi hai tỉ lệ (Mà khơng biết muốn tìm hiểu) p1 p2 , gọi ∆ = p1 – p2 Giả thiết muốn kiểm định ∆ = Lí thuyết để ước tính cỡ mẫu cho kiểm định giả thiết phức tạp, tóm gọn cơng thức sau đây: n= ( zα / 2 p ( − p ) + zβ p1 ( − p1 ) + p2 ( − p2 ) ∆ ) 2 Trong đó, p = ( p1 + p2 )/2, zα / trị số z phân phối chuẩn cho xác suất α/ (Chẳng hạn α = 0.05, zα / = 1.96; Khi α = 0.01, zα / = 2.57), 76 zβ trị số z phân phối chuẩn cho xác suất β (chẳng hạn β = 0.10, zβ = 1.28; β = 0.20, zβ = 0.84) Ví dụ 6: Một thử nghiệm lâm sàng đối chứng ngẫu nhiên thiết kế để đánh giá hiệu loại thuốc chống gãy xương sống Hai nhóm bệnh nhân tuyển Nhóm điều trị thuốc, nhóm nhóm đối chứng (không điều trị) Các nhà nghiên cứu giả thiết tỉ lệ gãy xương nhóm khoảng 10%, thuốc làm giảm tỉ lệ xuống khoảng 6% Nếu nhà nghiên cứu muốn thử nghiệm giả thiết với sai sót I α = 0.01 power = 0.90, bệnh nhân cần phải tuyển mộ cho nghiên cứu? Ở đây, có ∆ = 0.10 – 0.06 =0.04, p =(0.10+0.06)/2=0.08 Với α = 0.01, zα / = 2.57 với power = 0.90, zβ = 1.28 Do đó, số lượng bệnh nhân cần thiết cho nhóm là: ( 2.57 n= × 0.08 × 0.92 + 1.28 0.1× 0.90 + 0.06 × 0.94 ( 0.04 ) ) = 1361 Như vậy, cơng trình nghiên cứu cần phải tuyển 2722 bệnh nhân để kiểm định giả thiết Hàm power.prop.test R ứng dụng để tính cỡ mẫu cho trường hợp Hàm power.prop.test cần thông tin power, sig.level, p1, p2 Trong ví dụ trên, viết: > power.prop.test(p1=0.10, p2=0.06, power=0.90, sig.level=0.01) Two-sample comparison of proportions power calculation n p1 p2 sig.level power alternative = = = = = = 1366.430 0.1 0.06 0.01 0.9 two.sided NOTE: n is number in *each* group Chú ý kết từ R có phần xác (1366 đối tượng cho nhóm) R dùng nhiều số lẽ cho tính tốn tính “thủ cơng” 77 Xin nhấn mạnh lần ước tính cỡ mẫu cho nghiên cứu bước quan trọng việc thiết kế nghiên cứu có ý nghĩa khoa học, định thành bại nghiên cứu Trước ước tính cỡ mẫu nhà nghiên cứu cần phải biết trước (hay có vài giả thiết cụ thể) vấn đề quan tâm Ước tính cỡ mẫu cần số thông số đề cập đến phần đầu chương, thơng số khơng có khơng thể ước tính Trong trường hợp nghiên cứu hoàn toàn mới, tức chưa làm trước đó, thơng số độ ảnh hưởng độ dao động đo lường khơng có, nhà nghiên cứu cần phải tiến hành số mô (simulation) hay nghiên cứu sơ khởi để có thơng số cần thiết Cách ước tính cỡ mẫu mô lĩnh vực nghiên cứu chuyên sâu, không nằm đề tài sách này, bạn đọc tìm hiểu thêm phương pháp sách giáo khoa thống kê học cấp cao 78 ... 0.10 (Power = 0.90) 8.53 10.51 16. 74 β = 0.05 (Power = 0.95) 10.79 13.00 19.84 16. 4 Ước tính cỡ mẫu 16. 4.1 Ước tính cỡ mẫu cho số trung bình Ví dụ 1: Chúng ta muốn ước tính chiều cao đàn ơng người... cứu cho kết với trị số p < 0.05 16. 4.3 Ước tính cỡ mẫu cho phân tích phương sai Phương pháp ước tính cỡ mẫu cho so sánh hai nhóm khai triển thêm để ước tính cỡ mẫu cho trường hợp so sánh hai nhóm... cho tính tốn tính “thủ cơng” 77 Xin nhấn mạnh lần ước tính cỡ mẫu cho nghiên cứu bước quan trọng việc thiết kế nghiên cứu có ý nghĩa khoa học, định thành bại nghiên cứu Trước ước tính cỡ mẫu

Định dạng
Số trang	15
Dung lượng	215,72 KB