Ước tính cỡ mẫu và phần mềm ước tính cỡ mẫu

7 93 0
Ước tính cỡ mẫu và phần mềm ước tính cỡ mẫu

Đang tải... (xem toàn văn)

Thông tin tài liệu

Các câu hỏi về cỡ mẫu là phổ biến trong nghiên cứu. Trong các giáo trình thống kê hiện nay chỉ đưa ra công thức tính cỡ mẫu cho trường hợp chọn mẫu ngẫu nghiên đơn giản. Việc tính toán cỡ mẫu đơn giản này dựa vào công thức cơ bản, không tính đến thiết kế nghiên cứu, các thuật toán thống kê sử dụng trong thiết kế. Việc tính toán đơn giản bằng máy tính thông thường thường không chính xác, chỉ có tính chất giải trình đủ cho đề mục chọn mẫu và tính cỡ mẫu trong đề cương báo cáo nghiên cứu. Bài viết này trình bày việc tính toán cỡ mẫu nâng cao dựa vào một số phần mềm tính toán cỡ mẫu tốt thông qua một nghiên cứu lâm sàng cụ thể.

Nghiên cứu – Trao đổi Ước tính cỡ mẫu… ƯỚC TÍNH CỠ MẪU VÀ PHẦN MỀM ƯỚC TÍNH CỠ MẪU TS Phạm Đăng Quyết* Tóm tắt: Các câu hỏi cỡ mẫu phổ biến nghiên cứu Trong giáo trình thống kê đưa cơng thức tính cỡ mẫu cho trường hợp chọn mẫu ngẫu nghiên đơn giản Việc tính tốn cỡ mẫu đơn giản dựa vào cơng thức bản, khơng tính đến thiết kế nghiên cứu, thuật toán thống kê sử dụng thiết kế Việc tính tốn đơn giản máy tính thơng thường thường khơng xác, có tính chất giải trình đủ cho đề mục chọn mẫu tính cỡ mẫu đề cương báo cáo nghiên cứu Bài viết trình bày việc tính tốn cỡ mẫu nâng cao dựa vào số phần mềm tính tốn cỡ mẫu tốt thơng qua nghiên cứu lâm sàng cụ thể Ước tính số lượng đối tượng (cỡ mẫu) cần thiết cho nghiên cứu đóng vai trò quan trọng, yếu tố định thành công hay thất bại nghiên cứu Nếu cỡ mẫu khơng đủ kết luận rút từ cơng trình nghiên cứu có độ xác khơng cao, chí khơng thể kết luận Ngược lại, cỡ mẫu nhiều cần thiết nguồn lực, tiền bạc thời gian bị hao phí Do đó, vấn đề then chốt trước nghiên cứu phải ước tính cho cỡ mẫu vừa đủ cho mục tiêu nghiên cứu Nếu nghiên cứu khơng có cỡ mẫu tối ưu, ý nghĩa kết thực tế (sự khác biệt thực sự) khơng phát Cỡ mẫu “vừa đủ” tùy thuộc vào loại hình nghiên cứu vào thơng số chính: (i) Phương pháp thiết kế nghiên cứu đo lường kết (outcome measure); (ii) Hệ số ảnh hưởng (effect size); (iii) Sai lầm mà nhà nghiên cứu chấp nhận, cụ thể sai lầm loại I sai lầm loại II Không biết (hay chưa định) thiết kế nghiên cứu khơng có số liệu thơng số khơng thể ước tính cỡ mẫu * Hội Thống kê Việt Nam 14 Thiết kế nghiên cứu tiêu chí đo lường kết 1.1 Thiết kế nghiên cứu Thơng tin thứ qui trình ước tính cỡ mẫu phương pháp thiết kế (còn gọi thể loại nghiên cứu), yếu tố có ảnh hưởng đến phương pháp phân tích thống kê ảnh hưởng đến phương pháp ước tính cỡ mẫu Có thể phân biệt thể loại nghiên cứu dựa vào hai tiêu chí: Thời gian đặc tính Theo thiết kế nghiên cứu, gồm: Nghiên cứu thời điểm; nghiên cứu đối chứng; nghiên cứu xi thời gian 1.2 Tiêu chí đo lường kết Sau xác định thể loại nghiên cứu, nhà nghiên cứu cần phải định chọn tiêu chí đo lường kết để vào ước tính cỡ mẫu Mặc dù có nhiều loại biến khác nhau, cho mục đích phân tích, hồn tồn đơn giản hóa chúng thành loại biến liên tục biến phân loại Biến liên tục bao gồm biến liên tục thực biến sử dụng thang đo khoảng Trong biến phân loại bao gồm biến nhị thức, biến định SỐ 05 – 2017 Nghiên cứu – Trao đổi Ước tính cỡ mẫu… danh biến thứ bậc Biến số sử dụng liên tục hay phân loại định cách tóm tắt số liệu (trung bình hay tỷ lệ), cách lựa chọn kiểm định thống kê Quyết định chọn tiêu chí đo lường kết định vừa mang tính thực tế, vừa mang tính khoa học Mặc khác, tiêu chí phải đáp ứng tiêu chuẩn khoa học độ tin cậy độ xác Do việc chọn tiêu chí đo lường kết nghiên cứu cần phải cân nhắc cẩn thận Quyết định chọn tiêu chí đo lường kết định quan trọng, có ảnh hưởng đến cỡ mẫu lớn Hệ số ảnh hưởng (effect size) Trong nghiên cứu so sánh can thiệp khác nhau, hệ số ảnh hưởng độ lớn khác biệt nhóm Hệ số ảnh hưởng tuyệt đối khác biệt trung bình, trung bình kết hai nhóm can thiệp khác Hệ số ảnh hưởng, nói cách đơn giản, số độ ảnh hưởng thuật can thiệp Vì phản ảnh mức độ khác biệt, hệ số ảnh hưởng cho phép tránh khỏi cách diễn dịch giới hạn ngơn ngữ nhị thức (như “có hay khơng có ảnh hưởng?”), tập trung vào cách diễn dịch mang tính khoa học (như “mức độ ảnh hưởng cao hay thấp cỡ nào?”) Công thức chung cho ước tính hệ số ảnh hưởng (viết tắt ES) là: ES  x1  x0 s0 [1] Trong đó: x1 : Số trung bình nhóm can thiệp; x0 : Số trung bình nhóm đối chứng; s0: Độ lệch chuẩn nhóm đối chứng SỐ 05 – 2017 Nên nhớ độ lệch chuẩn có đơn vị đo lường với độ ảnh hưởng trung bình, hệ số ảnh hưởng khơng có đơn vị Hệ số ảnh hưởng phát nghiên cứu định lượng Trong giá trị P thơng báo liệu ảnh hưởng tồn tại, giá trị P không tiết lộ mức độ ảnh hưởng Trong báo cáo nghiên cứu diễn giải, ý nghĩa thực chất (hệ số ảnh hưởng) ý nghĩa thống kê (giá trị P) kết cần báo cáo Sai lầm loại I, II khái niệm hiệu (power) Trong ngữ cảnh ước tính cỡ mẫu, tham số thường trung bình tỷ lệ biến kết quan tâm quan trọng Giả thiết không (Ho) trạng thái giả thiết giữ nguyên trạng, khơng có khác biệt, khơng có ảnh hưởng, không thay đổi Giả thiết đảo (Ha) thường gọi đối thiết giả thiết thay thế, thể khác biệt nhóm, ảnh hưởng thực sự, từ bỏ nguyên trạng Chúng ta sử dụng phương pháp kiểm định thống kê kiểm định t, F, z, χ2, v.v… để đánh giá khả giả thiết Kết kiểm định thống kê đơn giản chia thành hai giá trị: Có ý nghĩa thống kê (statistical significance), khơng có ý nghĩa thống kê (non-significance) Có ý nghĩa thống kê thường dựa vào trị số P Thông thường, P0,05 nói kết khơng có ý nghĩa thống kê Trong kiểm định giả thuyết, dựa kết điều tra mẫu để đưa kết luận hai giả thiết Kết luận hay sai nhà thống kê phân loại cách thức mà kết luận 15 Ước tính cỡ mẫu… Nghiên cứu – Trao đổi khơng Sai lầm kết luận tưởng tượng gọi sai lầm loại I loại II Nếu bác bỏ Ho thực tế Ho đúng, sai lầm loại I Nếu chấp nhận Ho thực tế Ho sai, sai lầm loại II Bảng 1: Các khả xảy kiểm định giả thuyết Quyết định nhà nghiên cứu Thực tế giả thuyết Chấp nhận Ho Bác bỏ Ho Ho Đúng Sai lầm loại I sai số  Ho sai Sai lầm loại II sai số β Đúng Hiệu = 1- β Hiệu (power) xác suất bác bỏ cách xác Ho Ví dụ, kết luận có khác biệt thực tế, thực có khác biệt Tính tốn cỡ mẫu thường gọi tính tốn hiệu Hiệu lớn cỡ mẫu lớn Phương pháp ước tính cỡ mẫu Như đề cập phần đầu, để ước tính cỡ mẫu cần thiết cho cơng trình nghiên cứu, ngồi thể loại nghiên cứu, cần phải có số liệu: Xác suất sai lầm loại I, hiệu năng, hệ số ảnh hưởng Cỡ mẫu hàm số ba thông số Gọi n cỡ mẫu cần thiết,  sai số loại I, β sai số loại II (hiệu 1-β), hệ số ảnh hưởng ES, cơng thức chung để ước tính cỡ mẫu là: n ( z /  z  ) ( ES ) Trong đó, z/2 zβ số (thật số độ lệch chuẩn) từ phân phối chuẩn (standardized normal distribution) cho xác suất sai số  β Bởi vì, công thức ES mẫu số, ES thấp số lượng cỡ mẫu tăng; ngược lại, ES cao số lượng cỡ mẫu giảm Trong thực tế, ước tính hệ số ảnh hưởng thường cần thiết trước bắt đầu nỗ 16 lực nghiên cứu, để tính tốn cỡ mẫu yêu cầu để tránh sai lầm loại II Nói cách khác, bạn phải xác định cỡ mẫu nghiên cứu đủ để đảm bảo (với mức độ cụ thể chắn) nghiên cứu có hiệu chấp nhận để ủng hộ Ho Đó là, khơng có khác biệt tìm thấy nhóm, phát thật Vì ảnh hưởng thế, hệ số ảnh hưởng phải giả định trước tính tốn Đây thơng số khơng phải lúc có sẵn, nhà nghiên cứu cần phải xem xét nghiên cứu trước hay độ ảnh hưởng có ý nghĩa thực tế để tính tốn cỡ mẫu Về xác suất sai số, thông thường nghiên cứu chấp nhận sai số loại I khoảng 1% hay 5% (tức  = 0,01 hay 0,05), xác suất sai số loại II khoảng β = 0,1 đến β = 0,2 (tức hiệu phải từ 0,8 đến 0,9) Mỗi trường hợp gắn liền với số z/2 zβ vừa đề cập Hai số viết gọn công thức C = (z/2+ zβ)2 C xác định phân phối chuẩn trình bày Bảng Chẳng hạn muốn =0,05 hiệu = 0,8, số C 7,85 SỐ 05 – 2017 Nghiên cứu – Trao đổi Ước tính cỡ mẫu… Bảng 2: Hằng số C liên quan đến sai số loại I II  β = 0,2 (Hiệu = 0,8) β = 0,1 (Hiệu = 0,9) β = 0,05 (Hiệu = 0,95) 0,1 6,15 8,53 10,79 0,05 7,85 10,51 13,00 0,01 13,33 16,74 19,84 Hiệu ứng thiết kế (Design effect - DEFF) Các cơng thức tính cỡ mẫu dựa phương pháp chọn mẫu ngẫu nhiên giản đơn (simple random) cho giai đoạn Với nghiên cứu dùng phương pháp chọn mẫu nhiều giai đoạn, để hiệu chỉnh cho khác biệt thiết kế lựa chọn chọn mẫu ngẫu nhiên giản đơn, DEFF sử dụng để tính cỡ mẫu DEFF tỷ lệ phương sai dùng cách chọn mẫu thiết kế lựa chọn với phương sai dùng phương pháp ngẫu nhiên giản đơn DEFF=3 có nghĩa phương sai mẫu lớn gấp lần phương sai mẫu dùng chọn mẫu ngẫu nhiên giản đơn DEFF tính dựa kết nghiên cứu tương tự làm quần thể đó, khơng có nghiên cứu tương tự DEFF ước tính Với chọn mẫu giai đoạn - thường sử dụng khảo sát hộ gia đình điều tra dịch tễ, DEFF=2 Như cỡ mẫu thực cần nghiên cứu cỡ mẫu tính cho chọn mẫu ngẫu nhiên đơn giản nhân với DEFF Trong nghiên cứu điều tra chọn mẫu giai đoạn cỡ mẫu thường nhân với (DEFF=2) Làm để giảm DEFF: Tăng số lượng cụm/chùm; giảm số cá thể chọn cụm; số lượng cá thể chọn cụm nhau; sử dụng phương pháp chọn mẫu ngẫu SỐ 05 – 2017 nhiên hệ thống để chọn đối tượng giai đoạn cuối chọn mẫu Các yếu tố cân nhắc trước tính cỡ mẫu: Xác định loại số liệu (ước tính hay so sánh tỷ lệ, tỷ suất, giá trị trung bình, độ lệch chuẩn); xác định sử dụng loại kiểm định thống kê; sử dụng kiểm định thống kê so sánh chiều hay hai chiều; xác định trị số cho hiệu mẫu (power), độ xác tuyệt đối, khác biệt; lựa chọn cơng thức tính cỡ mẫu; xác định DEFF; lựa chọn phương pháp tính cỡ mẫu - tính tay sử dụng phần mềm ước tính cỡ mẫu Các phần mềm ước tính cỡ mẫu Có nhiều gói phần mềm để thực tính tốn cỡ mẫu/ hiệu năng, ví dụ: OpenEpi, PS-Power and Sample Size Calculation; EpiCalc 2000; PASS-Power Analysis and Sample Size11 (commercial software); Stata (commercial software); Web-based calculator… PS có lẽ lựa chọn phần mềm tốt nhất, phần mềm sử dụng thiết kế nghiên cứu thông dụng nhất, tương đối dễ sử dụng quan trọng tải dễ dàng miễn phí Ngồi ra, người dùng khám phá sở thích cá nhân cho riêng 6.1 Phần mềm ước tính cỡ mẫu PS PS chương trình máy tính tương tác để thực tính tốn hiệu cỡ mẫu Chương trình PS sử dụng cho nghiên cứu với đo lường nhị thức, liên tục, câu trả lời sống Người dùng rõ giả thiết thay tỷ lệ trả lời khác nhau, trung bình, thời gian sống, nguy tương đối, tỷ lệ nguy Các thiết kế nghiên cứu độc lập hay cặp đơi (phù hợp) sử dụng Hiệu năng, cỡ mẫu, giả thiết thay phát quan hệ với Người dùng rõ hai ba đại 17 Nghiên cứu – Trao đổi lượng chương trình thu đại lượng thứ ba Mơ tả tính tốn, viết tiếng Anh, tạo chép vào tài liệu người dùng Hỗ trợ tương tác có sẵn Chương trình cung cấp phương pháp phù hợp cho kiểm định t cặp đôi độc lập, phân tích sống (Survival Analysis, phương pháp hay gặp nghiên cứu lâm sàng), nghiên cứu phù hợp không phù hợp kiện nhị thức, kiểm định Mantel-Haenszel, hồi quy tuyến tính Chương trình tạo đồ thị mối quan hệ hiệu năng, cỡ mẫu giả thiết thay phát Nó vẽ đồ thị hai đại lượng trì đại lượng thứ ba khơng đổi Các trục tuyến tính logarit sử dụng nhiều đường cong vẽ đồ thị Đồ thị chép dán vào tài liệu khác chương trình để chỉnh sửa thêm Hình 1: Giao diện Chương trình PS (1) Ước tính cỡ mẫu cho tiêu trung bình Ví dụ: Tính cỡ mẫu để ước tính chiều cao đàn ơng Việt với sai số  vòng cm Biết độ lệch chuẩn nghiên cứu trước 4,6 cm với khoảng tin cậy 95%, hay sai số =0,05 sai số =0,2 (hiệu mẫu=0,8) Để tính cỡ mẫu cần thiết ta làm sau: Từ công cụ hình chọn t18 Ước tính cỡ mẫu… test, hộp Output chọn Sample size, hộp Design chọn Paired, Input =0,05, power=0,8, σ=4,6, =1, nhấp chuột lên Calculate Màn hình hiển thị hộp Sample Size với kết 168 cm Nói cách khác, cần phải đo chiều cao 168 đối tượng để ước tính chiều cao đàn ơng Việt với sai số vòng cm Nếu sai số chấp nhận 0,5 cm (thay cm), số lượng đối tượng cần thiết 666 Qua ước tính này, dễ dàng thấy cỡ mẫu tùy thuộc lớn vào độ sai số mà chấp nhận Muốn có ước tính xác, cần nhiều đối tượng nghiên cứu (2) Ước tính cỡ mẫu cho so sánh hai nhóm độc lập Một nghiên cứu đề xuất mong muốn tìm hiểu ảnh hưởng loại thuốc tăng huyết áp (nhóm can thiệp) so với điều trị thơng thường (nhóm đối chứng) Các nghiên cứu trước cho thấy tối thiểu khác biệt lâm sàng quan trọng 15 mmHg độ lệch chuẩn gộp (σ) 20 mmHg Sử dụng phần mềm PS (hình bên) người ta ước tính 29 đối tượng cần thiết nhóm đối chứng nhóm can thiệp (mức  = 0,05, hiệu 80%) để phát khác biệt có ý nghĩa thống kê huyết áp trung bình hai nhóm (nếu tồn tại) Tăng khác biệt trung bình đến 20 mmHg yêu cầu 17 người tham gia nhóm, tức giảm đáng kể cỡ mẫu Giảm σ đến 10 mmHg yêu cầu có người tham gia nhóm SỐ 05 – 2017 Ước tính cỡ mẫu… Nghiên cứu – Trao đổi (3) Ước tính cỡ mẫu cho so sánh hai tỷ lệ (Chi-square test) Một can thiệp nâng cao sức khỏe để giảm hút thuốc giới thiệu đất nước với tỷ lệ hành hút thuốc cao Tỷ lệ hút thuốc báo cáo công bố gần 65% ước tính can thiệp làm giảm mức độ hút thuốc gần 30% Một cỡ mẫu 42 nhóm yêu cầu (P = 0,05, hiệu 80%) Tăng mức hiệu tới 90% đòi hỏi cỡ mẫu 56 cho nhóm (4) Ước tính cỡ mẫu cho hai nhóm cặp đơi (paired t-test) Có chứng cho thấy clofirate thay đổi giá trị trung bình mức cholesterol? Cholesterol đo trước sau nhận clofirate Từ nghiên cứu trước, khác biệt trung bình 40 mg/dl coi lâm sàng có ý nghĩa, với độ lệch chuẩn 50 Một cỡ mẫu 14 cần thiết (P = 0,05, hiệu 80%), P = 0,01 đòi hỏi 21 đối tượng, tức cỡ mẫu tăng lên (5) Tính tốn hiệu sau nghiên cứu Nghiên cứu cholesterol đề cập tiến hành, kết tỷ lệ trả lời/ bỏ không cao, có 12 bệnh nhân tuyển chọn Khác biệt trung bình 50 σ 60 mg/dl tìm thấy Hiệu nghiên cứu bao nhiêu? Thực phân tích hồi cứu cho hay hiệu 75%, có nghĩa nghiên cứu mức hiệu chấp nhận nhỏ 80% 6.2 Phần mềm ước tính cỡ mẫu chuyên nghiệp Phần mềm tính tốn cỡ mẫu chun nghiệp SAS, n-query Tuy nhiên phần mềm đắt (cỡ triệu USD cho SAS, 1050 USD cho n-query) Nghiên cứu viên nhập thiết kế nghiên cứu, thuật toán thống kê sử dụng liệu liên quan đến biến số vào phần mềm để tính cỡ mẫu Nghiên cứu viên phân tích độ nhạy mối liên quan hiệu cỡ mẫu Nghiên cứu viên phải có kiến thức chuyên sâu thiết kế nghiên cứu thuật toán thống kê để sử dụng phần mềm phiên giải kết Dưới hình ảnh bước sử dụng phần mềm n-query tính tốn cỡ mẫu: SỐ 05 – 2017 19 Ước tính cỡ mẫu… Nghiên cứu – Trao đổi Bước 4: Phân tích độ nhạy mối quan hệ Hiệu mẫu cỡ mẫu Bước 3: Xác định hiệu mẫu từ cỡ mẫu ngược lại Kết luận Như đề cập trên, cách tính cỡ mẫu cho ước lượng thô cỡ mẫu cần thiết dựa ước đốn giá trị thông số, định chủ quan hậu mà muốn phát công thức sử dụng công thức gần Do số tính giúp phân biệt cỡ mẫu 50 100 không phân biệt cỡ mẫu 50 53 Chúng ta phải cân đối điều mong muốn tính khả thi Ðơi dùng cơng thức tính cỡ mẫu để ngược lại hiệu nghiên cứu Thí dụ có kinh phí hạn chế để thực nghiên cứu nên có cỡ mẫu định Chúng ta tính ngược lại từ cỡ mẫu để biết hiệu nghiên cứu Nếu hóa hiệu nghiên cứu thấp (thí dụ 20%) tốt khơng nên tiến hành nghiên cứu nắm kết thất bại Nếu nghiên cứu có nhiều mục tiêu cỡ mẫu đủ cho mục tiêu khơng đủ cho 20 mục tiêu khác Ðể tính cỡ mẫu, tốt phải trọng vào biến số (hoặc biến số quan trọng nhất) Tính cỡ mẫu khơng khó, khó phải cung cấp giá trị giả định nghiên cứu: Sai lầm loại I, hiệu năng, lực nghiên cứu, khác biệt mà muốn phát Tài liệu tham khảo: Đại học Y tế công cộng (2004), Thống kê y tế II - Phân tích số liệu, Bộ môn Thống kê - Tin học, Hà Nội; Evie McCrum-Gardner,“Sample size and powercalculations made simple”, International Journal of Therapy and Rehabilitation, January 2010, Vol 17, No 1; Nguyễn Văn Tuấn, Phương pháp ước tính cỡ mẫu cho nghiên cứu y học, www.ykhoa.net/baigiang/lamsangthongke/lst k_uoctinhcomau.pdf; Nguyễn Trương Nam, Xác định cỡ mẫu nghiên cứu, Viện nghiên cứu Y xã hội học, thongke.info.vn/Download.aspx/ /1/ISMS_Ti nhtoan_CoMau.pdf SỐ 05 – 2017 ... hiệu mẫu (power), độ xác tuyệt đối, khác biệt; lựa chọn cơng thức tính cỡ mẫu; xác định DEFF; lựa chọn phương pháp tính cỡ mẫu - tính tay sử dụng phần mềm ước tính cỡ mẫu Các phần mềm ước tính cỡ. .. ảnh bước sử dụng phần mềm n-query tính tốn cỡ mẫu: SỐ 05 – 2017 19 Ước tính cỡ mẫu Nghiên cứu – Trao đổi Bước 4: Phân tích độ nhạy mối quan hệ Hiệu mẫu cỡ mẫu Bước 3: Xác định hiệu mẫu từ cỡ mẫu. .. khác biệt thực tế, thực có khác biệt Tính tốn cỡ mẫu thường gọi tính tốn hiệu Hiệu lớn cỡ mẫu lớn Phương pháp ước tính cỡ mẫu Như đề cập phần đầu, để ước tính cỡ mẫu cần thiết cho cơng trình nghiên

Ngày đăng: 13/01/2020, 10:58

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan