1. Trang chủ
  2. » Luận Văn - Báo Cáo

Phương pháp ước tính cỡ mẫu cho một nghiên cứu y học

29 13 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 29
Dung lượng 735 KB

Nội dung

Phương pháp ước tính cỡ mẫu cho nghiên cứu y học Nguyễn Văn Tuấn Viện nghiên cứu y khoa Garvan Sydney, Australia Một cơng trình nghiên cứu thường dựa vào mẫu (sample) Một câu hỏi quan trọng trước tiến hành nghiên cứu cần mẫu hay đối tượng cho nghiên cứu “Đối tượng” đơn vị nghiên cứu, số bệnh nhân hay số tình nguyện viên Ước tính số lượng đối tượng cần thiết cho cơng trình nghiên cứu đóng vai trị quan trọng, yếu tố định thành công hay thất bại nghiên cứu Nếu số lượng đối tượng khơng đủ kết luận rút từ cơng trình nghiên cứu khơng có độ xác cao, chí khơng thể kết luận Ngược lại, số lượng đối tượng nhiều số cần thiết tài nguyên, tiền bạc thời gian bị hao phí Do đó, vấn đề then chốt trước nghiên cứu phải ước tính cho số đối tượng vừa đủ cho mục tiêu nghiên cứu Số lượng đối tượng “vừa đủ” tùy thuộc vào loại hình nghiên cứu hai thơng số chính: • • • Phương pháp thiết kế nghiên cứu tiêu chí lâm sàng (outcome measure) Hệ số ảnh hưởng (effect size); Sai lầm mà nhà nghiên cứu chấp nhận, cụ thể sai lầm loại I II (power); Không biết [hay chưa định] thiết kế nghiên cứu khơng có số liệu hai thơng số khơng thể ước tính cỡ mẫu Kinh nghiệm người viết cho thấy nhiều người tiến hành nghiên cứu thường ý niệm số liệu này, đến tham vấn chuyên gia thống kê học, họ nhận câu trả lời: “không thể tính được”! Trong tơi bàn qua hai thơng số trình bày số ví dụ nghiên cứu lâm sàng cụ thể ước tính cỡ mẫu Thiết kế nghiên cứu tiêu chí lâm sàng 1.1 Thiết kế nghiên cứu Thông tin thứ qui trình ước tính cỡ mẫu thể loại nghiên cứu, yếu tố có ảnh hưởng đến phương pháp phân tích thống kê phương pháp ước tính cỡ mẫu Có thể phân biệt thể loại nghiên cứu dựa vào hai tiêu chí: thời gian đặc tính Về thời gian, nghiên cứu thu thập liệu thời điểm (present) gọi cross-sectional study (nghiên cứu tiêu biểu thời điểm); nghiên cứu có định hướng theo dõi tình trạng sức khỏe đối tượng thời gian, tức thu thập liệu đối tượng nhiều lần (hiện tương lai) gọi prospective (hay longitudinal) study (nghiên cứu theo thời gian); nghiên cứu tiến hành có định hướng tìm hiểu q khứ (past) gọi retrospective study Nghiên cứu thời điểm hay cross-sectional study (được dịch theo nghĩa đen “nghiên cứu cắt ngang”) Đây thiết kế mà nhà nghiên cứu chọn quần thể cách ngẫu nhiên tiêu biểu cho cộng đồng, thời điểm Nói cách khác, nhà nghiên cứu thu thập liệu lần đối tượng thời điểm (hiện tại) Mục đích nghiên cứu tìm hiểu tỉ lệ hành (prevalence) bệnh đó, hay tìm hiểu mối tương quan yếu tố nguy bệnh Nghiên cứu đối chứng hay case-control study Trong nghiên cứu này, mục đích tìm hiểu mối liên hệ (hay nhiều) yếu tố nguy (risk factors) bệnh cụ thể Để tiến hành nghiên cứu này, nhà nghiên cúu bắt đầu nhóm bệnh nhân nhóm đối tượng khơng bệnh (đối chứng), “đi ngược thời gian” tìm hiểu yếu tố nguy mà hai nhóm phơi nhiễm khứ Nghiên cứu xuôi thời gian (longitudinal studies hay prospective study) Ngược lại với nghiên cứu đối chứng (trường hợp nhà nghiên cứu biết mắc bệnh không mắc bệnh), với nghiên cứu theo thời gian nhà nghiên cứu bắt đầu nhóm khơng mắc bệnh, theo dõi thời gian sau để quan sát mắc bệnh hay khơng mắc bệnh thời gian Ngược lại với nghiên cứu đối chứng (trường hợp nhà nghiên cứu ngược khứ để tìm hiểu bị phơi nhiễm yếu tố nguy cơ), với nghiên cứu theo thời gian, nhà nghiên cứu biết từ lúc ban đầu bị phơi nhiễm hay không phơi nhiễm yếu tố nguy Mục đích nghiên cứu xi thời gian thường ước tính tỉ lệ phát sinh (incidence) bệnh thời gian (điều khác với mục đích nghiên cứu thời điểm ước tính tỉ lệ hành – tức prevalence – bệnh) Ngoài ra, nghiên cứu theo thời gian cịn cho phép nhà nghiên cứu tìm hiểu mối liên hệ hay nhiều yếu tố nguy nguy phát sinh bệnh tật Khác với nghiên cứu crosssection ghi nhận kiện thời điểm, nghiên cứu longitudinal phải theo dõi đối tượng thời gian nhiều năm tháng 1.2 Tiêu chí lâm sàng Sau xác định thể loại nghiên cứu, nhà nghiên cứu cần phải định chọn tiêu chí lâm sàng (primary outcome measure) để vào mà ước tính cỡ mẫu Quyết định chọn tiêu chí lâm sàng định vừa mang tính lâm sàng, vừa mang tính khoa học Bởi mục tiêu tối hậu nghiên cứu y khoa đem lại lợi ích cho bệnh nhân hay cộng đồng, tiêu chí chọn phải có ý nghĩa thực tế bệnh nhân Chẳng hạn việc thẩm định hiệu phương pháp truy tìm ung thư, tỉ lệ phát ung thư điều trị khơng phải tiêu chí có ý nghĩa thực tế, tỉ lệ tử vong thời gian sống sót sau truy tìm ung thư tiêu chí có ý nghĩa lâm sàng thực tế Mặc khác, tiêu chí phải đáp ứng tiêu chuẩn khoa học độ tin cậy độ xác Nếu nghiên cứu có mục tiêu tìm hiểu hiệu loại thuốc phòng chống bệnh xơ vữa động mạch, độ cholesterol máu khơng thể xem tiêu chí có ý nghĩa lâm sàng, dù đáp ứng u cầu khoa học tính Do đó, việc chọn tiêu chí lâm sàng cho nghiên cứu cần phải cân nhắc cẩn thận Quyết định chọn tiêu chí lâm sàng định quan trọng, có ảnh hưởng đến cỡ mẫu lớn Chẳng hạn nghiên cứu loãng xương, nhà nghiên cứu so sánh mật độ xương hay tỉ lệ gãy xương hai nhóm can thiệp để biết hiệu thuốc Nếu chọn mật độ xương làm tiêu chí lâm sàng số lượng cỡ mẫu số vài trăm bệnh nhân, chọn tỉ lệ gãy xương số cỡ mẫu lên đến vài chục ngàn đối tượng Khái niệm “hệ số ảnh hưởng” (effect size) Hệ số ảnh hưởng, nói cách đơn giản, số độ ảnh hưởng thuật can thiệp Vì phản ảnh mức độ khác biệt, hệ số ảnh hưởng cho phép tránh khỏi cách diễn dịch giới hạn ngôn ngữ nhị phân (như “có hay khơng có ảnh hưởng?”), tập trung vào cách diễn dịch mang tính khoa học (như “mức độ ảnh hưởng cao hay thấp cỡ nào?”) Ba trường hợp đơn giản sau minh họa cho khái niệm hệ số ảnh hưởng: Trường hợp 1: Trong nghiên cứu gồm 50 bệnh nhân cao huyết áp điều trị thuốc nhóm beta-blocker Trước điều trị, huyết áp tâm thu (SBP) trung bình cho nhóm 140 mmHg độ lệch chuẩn 22 mmHg Sau điều trị, huyết áp tâm thu giảm xuống 125 mmHg Trường hợp 2: Một nghiên cứu khác thẩm định hiệu thuốc chống lỗng xương nhóm bisphosphonate Nghiên cứu tiến hành 50 bệnh nhân Trước điều trị, mật độ xương cổ xương đùi (femoral neck bone mineral density, viết tắt BMD) trung bình 0.68 g/cm2 với độ lệch chuẩn 0.12 g/cm2 Sau tháng điều trị, 2 BMD trung bình cho nhóm tăng lên 0.72 g/cm với độ lệch chuẩn 0.13 g/cm Trường hợp 3: Một nghiên cứu bệnh – chứng (case-control study) nhằm thẩm định ảnh hưởng thói quen hút thuốc đến độ glucose máu Nhóm hút thuốc gồm 30 người có độ glucose trung bình 130 mg/dL với độ lệch chuẩn 35 mg/dL Nhóm khơng hút thuốc gồm 70 người có độ glucose trung bình 110 mg/dL với độ lệch chuẩn 50 mg/dL Trong trường hợp 1, ước tính mức độ ảnh hưởng cách lấy huyết áp sau điều trị trừ cho huyết áp trước điều trị: d = 125 – 140 = -15 mmHg Tương tự, ảnh hưởng thuốc bisphosphonate cho trường hợp d = 0.72 – 0.68 = 0.04 g/cm2 Và trường hợp 3, độ ảnh hưởng hút thuốc ước tính d3 = 130 – 110 = 20 mg/dL Khó khăn cách ước tính độ ảnh hưởng khơng thể so sánh trực tiếp độ ảnh hưởng, đơn vị đo lường khác Và, quan trọng nữa, độ dao động (phản ảnh độ lệch chuẩn) trường hợp khác Phương pháp so sánh trực tiếp ảnh hưởng lí tưởng hốn chuyển cho ba trường hợp có đơn vị đo lường Để đạt mục đích này, cách đơn giản lấy độ ảnh hưởng chia cho độ lệch chuẩn Tỉ số có tên tiếng Anh effect size (có cịn gọi standardized difference) mà tạm dịch hệ số ảnh hưởng Cơng thức chung cho ước tính hệ số ảnh hưởng (sẽ viết tắt ES) là: ES = x1 − x0 [1] s0 Trong đó: • x1 số trung bình nhóm can thiệp; • x0 số trung bình nhóm đối chứng; • s0 độ lệch chuẩn nhóm đối chứng Hệ số ảnh hưởng trường hợp là: • Trường hợp 1: ES1 = -15 / 22 = 0.68 • • Trường hợp 2: ES2 = 0.04 / 0.12= 0.33 Trường hợp 3: ES3 = 20 / 50 = 0.40 Nên nhớ độ lệch chuẩn có đơn vị đo lường với độ ảnh hưởng trung bình, hệ số ảnh hưởng khơng có đơn vị Nói cách khác, đơn vị đo lường độ ảnh hưởng độ lệch chuẩn Chẳng hạn trường hợp 1, thuốc beta-blocker có tác dụng giảm huyết áp tâm thu khoảng 0.68 độ lệch chuẩn, trường hợp 2, thuốc bisphosphonate tăng mật độ xương 0.33 độ lệch chuẩn Vì có đơn vị so sánh, nói [đơn giản] hệ số ảnh hưởng thuốc beta-blocker cao thuốc bisphosphonate Theo qui ước [khơng có sở khoa học mấy], hệ số ảnh hưởng 0.2 xem “thấp”, 0.5 “trung bình”, >0.8 “cao” [1] Một hệ số ảnh hưởng 0.2 tương đương với độ khác biệt chiều cao em bé 15 tuổi em bé 16 tuổi Một hệ số ảnh hưởng 0.5 tương đương với độ khác biệt chiều cao em bé 14 tuổi em bé 18 tuổi Một hệ số ảnh hưởng 0.8 tương đương với độ khác biệt số thông minh (IQ) sinh viên năm thứ tiến sĩ Sai lầm loại I, II khái niệm “power” 3.1 Sai lầm loại I II Thống kê học phương pháp khoa học có mục đích phát hiện, hay tìm gộp chung lại cụm từ “chưa biết” (unknown) Cái chưa biết tượng không quan sát được, hay quan sát khơng đầy đủ Cái chưa biết ẩn số (như chiều cao trung bình người Việt Nam, hay trọng lượng phần tử), hiệu thuật điều trị, tỉ lệ lưu hành (prevalence), tỉ lệ phát sinh (incidence) bệnh, v.v… Chúng ta đo chiều cao, hay tiến hành xét nghiệm để biết hiệu thuốc, nghiên cứu tiến hành nhóm đối tượng, khơng phải tồn quần thể dân số Vấn đề sử dụng kết nhóm đối tượng để suy luận cho quần thể lớn Mục đích ước tính cỡ mẫu tìm số lượng đối tượng cho suy luận đạt độ xác cao đầy đủ Ở mức độ đơn giản nhất, chưa biết xuất hai hình thức: có, khơng Chẳng hạn thuật điều trị có hay khơng có hiệu chống gãy xương Bởi khơng biết tượng cách đầy đủ, phải đặt giả thiết Giả thiết đơn giản giả thiết đảo (hiện tượng không tồn tại, kí hiệu Ho) giả thiết (hiện tượng tồn tại, kí hiệu Ha) Chúng ta sử dụng phương pháp kiểm định thống kê (statistical test) kiểm định t, F, z, χ , v.v… để đánh giá khả giả thiết Kết kiểm định thống kê đơn giản chia thành hai giá trị: có ý nghĩa thống kê (statistical significance), khơng có ý nghĩa thống kê (non-significance) Có ý nghĩa thống kê thường dựa vào trị số P: thông thường, P < 0.05, phát biểu kết có ý nghĩa thống kê; P > 0.05 nói kết khơng có ý nghĩa thống kê Cũng xem có ý nghĩa thống kê hay khơng có ý nghĩa thống kê có tín hiệu hay khơng có tín hiệu Hãy tạm đặt kí hiệu T+ kết có ý nghĩa thống kê, T- kết kiểm định khơng có ý nghĩa thống kê Hãy xem xét ví dụ cụ thể: để biết thuốc risedronate có hiệu hay khơng việc điều trị loãng xương, tiến hành nghiên cứu gồm nhóm bệnh nhân (một nhóm điều trị risedronate nhóm sử dụng giả dược placebo) Chúng ta theo dõi thu thập số liệu gãy xương, ước tính tỉ lệ gãy xương cho nhóm, so sánh hai tỉ lệ kiểm định thống kê Kết kiểm định thống kê có ý nghĩa thống kê (P0.05) Xin nhắc lại khơng biết risedronate thật có hiệu nghiệm chống gãy xương hay khơng; đặt giả thiết Do đó, xem xét giả thiết kết kiểm định thống kê, có bốn tình huống: (a) Giả thuyết Ha (thuốc risedronate có hiệu nghiệm) kết kiểm định thống kê P 50 + m [4] 4.4 Các nghiên cứu ước tính tỉ số nguy (odds ratio) Trong nghiên cứu đối chứng (case-control study), nhà nghiên cứu thường muốn tìm hiểu mối liên hệ yếu tố nguy (risk factor) bệnh cụ thể Mối liên hệ thường “đo lường” odds ratio (OR) mà tạm dịch “tỉ số nguy cơ” (chứ “tỉ số chênh” mà đồng nghiệp nước hay sử dụng) Chẳng hạn tỉ số nguy hút thuốc gãy xương 2, điều có nghĩa người hút thuốc có nguy bị gãy xương tăng khoảng lần so với người khơng hút thuốc Do đó, ước tính cỡ mẫu để thử nghiệm giả thiết mối liên hệ yếu tố nguy bệnh thường dựa vào tỉ số nguy Để ước tính cở mẫu cho nghiên cứu thế, nhà nghiên cứu cần phải có tay số liệu: • • • Tỉ lệ lưu hành (prevalence) yếu tố nguy quần thể (gọi tắt p); Tỉ số nguy mà nhà nghiên cứu muốn biết; Các sai số thống kê thể qua xác suất a power Với số liệu trên, công thức sau cung cấp cho nhà nghiên cứu ước tính số lượng đối tượng cần thiết cho nghiên cứu (N): 15 N= (1+ r )2 C r ( ln OR ) p (1− p) [10] Trong đó, r tỉ số cỡ mẫu hai nhóm (vì nghiên cứu đối chứng, khơng thiết hai nhóm phải có cỡ mẫu) Nếu r = (tức hai nhóm có số lượng cỡ mẫu), cơng thức đơn giản thành: N= 4C [11] ( ln OR) p (1− p) 4.5 Các nghiên cứu với biến phụ thuộc thời gian dẫn đến kiện (survival studies) Trong nhiều nghiên cứu khoa học, kể nghiên cứu lâm sàng, nhà nghiên cứu thường theo dõi đối tượng thời gian, có lên đến vài mươi năm Biến cố xảy thời gian có bệnh hay khơng có bệnh, sống hay chết, v.v… biến cố có ý nghĩa lâm sàng định, thời gian dẫn đến bệnh nhân mắc bệnh hay chết quan trọng cho việc đánh giá ảnh hưởng thuật điều trị hay yếu tố nguy Nhưng thời gian khác bệnh nhân Chẳng hạn thời điểm từ lúc điều trị ung thư đến thời điểm bệnh nhân chết khác bệnh nhân, tiêu chí lâm sàng thường thời gian sống sót bệnh nhân tính từ điều trị (hay từ chẩn đốn bệnh) Nghiên cứu tiêu biểu thường có nhóm bệnh nhân: nhóm đối chứng nhóm can thiệp Phương pháp tính cỡ mẫu cho nghiên cứu thể loại phức tạp, cách tính đơn giản ứng dụng Nếu thời gian theo dõi đối tượng định trước, tỉ lệ phát sinh hai nhóm thời gian p1 p2 , tỉ số nguy (hazards ratio) ước tính sau [5,6]: h= log e loge ( p ) ( p2 ) Và số cỡ mẫu cần thiết cho nhóm là: n= C(h + 1)2 [12] (2 − p1 − p2 )(h − 1)2 4.5 Các nghiên cứu chẩn đoán (diagnostic studies) 16 Nghiên cứu chẩn đoán thường xoay quanh hai số: độ nhạy (sensivity) đặc hiệu (specificity) trình bày Bảng Một phương pháp chẩn đoán xem đáng tin cậy sử dụng thực hành lâm sàng cần phải đạt độ nhạy đặc hiệu tối thiểu 0.75 (hay tốt 0.80) Việc phát bệnh qua chẩn đốn cịn tùy thuộc vào tỉ lệ lưu hành (prevalence) bệnh quần thể Do đó, phương pháp ước tính cỡ mẫu phải dựa vào số Một cách cụ thể, nhà nghiên cứu cần phải xác định số liệu sau đây: • Xác suất dương tính thật (hay độ nhạy – kí hiệu pse ) tối thiểu bao nhiêu? • Xác suất âm tính thật (hay độ đặc hiệu – kí hiệu psp ) tối thiểu bao nhiêu? • • Sai số hai xác suất dương tính thật âm tính thật (kí hiệu w)? Tỉ lệ lưu hành bệnh quần thể (kí hiệu pdis ) Với thơng số này, số lượng cỡ mẫu để ước tính độ nhạy ước tính cơng thức sau [7]: • Trước hết, ước tính TP+FN (tức số dương tính thật – true positive âm tính giả - false negative) TP+FN = Zα2 × pse × (1 − pse ) • Trong đó, Zα2 w2 số phân phối chuẩn Nếu α = 0.05, số Zα2 1.96 Sau đó, ước tính số lượng cỡ mẫu (tơi dùng kí hiệu nse để rõ số cỡ mẫu cho độ nhạy): [13] nse = TP+FN p dis Tương tự, số lượng cỡ mẫu để ước tính độ đặc hiệu ước tính qua hai bước sau: • Trước hết, ước tính FP+TN (tức số dương tính giả - false positive âm tính thật – true negative) FP +TN = Zα2 × psp × (1 − psp ) w2 • Sau đó, ước tính số lượng cỡ mẫu (tơi dùng kí hiệu nsp để rõ số cỡ mẫu cho độ nhạy): 17 nsp = FP +TN − pdis [14] Ví dụ Trong phần này, tơi nêu nhiều ví dụ ước tính cỡ mẫu để minh họa cho phần “lí thuyết” vừa trình bày phần Tơi tập trung ví dụ liên quan đến nghiên cứu lâm sàng để bạn đọc tạp chí dễ theo dõi 5.1 Ước tính cỡ mẫu cho số trung bình Ví dụ – Ước tính số trung bình: Chúng ta muốn ước tính chiều cao đàn ơng người Việt, chấp nhận sai số vòng cm (d = 1) với khoảng tin cậy 0.95 (tức α=0.05) power = 0.8 (hay β = 0.2) Các nghiên cứu trước cho biết độ lệch chuẩn chiều cao người Việt khoảng 4.6 cm Như vậy, hệ số ảnh hưởng là: ES = 1/4.6 = 0.217, số C = 7.85 Chúng ta áp dụng cơng thức [2] để ước tính cỡ mẫu cần thiết cho nghiên cứu: n= C = (ES )2 7.85 = 166 (0.217)2 Nói cách khác, cần phải đo chiều cao 166 đối tượng để ước tính chiều cao đàn ơng Việt với sai số vòng cm n= Nếu sai số chấp nhận 0.5 cm (thay cm), số lượng đối tượng cần thiết là: 7.85 = 664 Nếu độ sai số mà chấp nhận 0.1 cm số lượng đối (0.5/ 4.6)2 tượng nghiên cứu lên đến 16610 người! Qua ước tính này, dễ dàng thấy cỡ mẫu tùy thuộc lớn vào độ sai số mà chấp nhận Muốn có ước tính xác, cần nhiều đối tượng nghiên cứu Ví dụ – Ước tính cỡ mẫu cho nghiên cứu “trước – sau”: Một loại thuốc điều trị có khả tăng độ alkaline phosphatase bệnh nhân loãng xương Độ lệch chuẩn alkaline phosphatase 15 U/l Một nghiên cứu tiến hành quần thể bệnh nhân Việt Nam, nhà nghiên cứu muốn biết bệnh nhân cần tuyển để chứng minh thuốc alkaline phosphatase từ 60 đến 65 U/l sau tháng điều trị, với sai số α = 0.05 power = 0.8 18 Đây loại nghiên cứu “trước – sau” (before-after study); có nghĩa trước sau điều trị Ở đây, có nhóm bệnh nhân, đo hai lần (trước dùng thuốc sau dùng thuốc) Chỉ tiêu lâm sàng để đánh giá hiệu nghiệm thuốc độ thay đổi alkaline phosphatase Trong trường hợp này, ước tính hệ số ảnh hưởng sau: ES = 15 = 0.3333 Vì nghiên cứu trước – sau, cần thơng tin khác nữa: hệ số tương quan hai lần đo lường alkaline phosphatase Chúng ta khơng biết hệ số này, giả định dao động khoảng 0.6 đến 0.8 Với hệ số tương quan 0.6, sử dụng công thức [3], ước tính số cỡ mẫu sau: n = × C × (1 − r) = 2× 7.85× (1− 0.6) = 56 (ES )2 (0.3333)2 Nhưng hệ số tương quan 0.8, số cỡ mẫu trở thành: = 2× 7.85× (1− 0.8) = n 28 (0.3333)2 Nói cách khác, hệ số tương quan cao (tức độ tin cậy đo lường cao), số lượng cỡ mẫu thấp 5.2 Ước tính cỡ mẫu cho so sánh hai số trung bình (hai nhóm) Ví dụ – Nghiên cứu so sánh hai số trung bình: Một nghiên cứu thiết kế để thử nghiệm thuốc alendronate việc điều trị loãng xương phụ nữ sau thời kì mãn kinh Có hai nhóm bệnh nhân tuyền: nhóm nhóm can thiệp (được điều trị alendronate), nhóm nhóm đối chứng (tức khơng điều trị) Tiêu chí để đánh giá hiệu thuốc mật độ xương (bone mineral density – BMD) Số liệu từ nghiên cứu dịch tễ học cho thấy giá trị trung bình BMD phụ nữ sau thời kì mãn 2 kinh 0.80 g/cm , với độ lệch chuẩn 0.12 g/cm Vấn đề đặt cần phải nghiên cứu đối tượng để “chứng minh” sau 12 tháng điều trị BMD nhóm tăng khoảng 5% so với nhóm 2? Trong ví dụ trên, tạm gọi trị số trung bình nhóm μ2 nhóm μ1, có: μ2 = 0.8*1.05 = 0.84 g/cm (tức tăng 5% so với nhóm 1), đó, Δ = 0.84 19 – 0.80 = 0.04 g/cm2 Độ lệch chuẩn σ = 0.12 g/cm2 Như vậy, hệ số ảnh hưởng là: ES = 0.04 / 0.12 = 0.3333 Với power = 0.90 α = 0.05, số C = 10.51, số cỡ mẫu cần thiết là: n = 2C (ES )2 =2 ×10.51 = 189 (0.333)2 Kết cho biết cần 190 bệnh nhân cho nhóm (hay 380 bệnh nhân cho cơng trình nghiên cứu) Trong trường hợp này, power = 0.90 α = 0.05 có nghĩa ? Trả lời: hai thơng số có nghĩa tiến hành thật nhiều nghiên cứu (ví dụ 1000) nghiên cứu với 380 bệnh nhân, có 90% (hay 900) nghiên cứu cho kết với trị số p < 0.05 Vì thể loại nghiên cứu thơng dụng, có người vẽ biểu đồ (xem biểu đồ đây) để ước tính cỡ mẫu cho khơng thích tính tốn Biểu đồ địi hỏi người sử dụng phải biết hệ số ảnh hưởng (mà biểu đồ viết “standardised difference”) power 20 Biểu đồ Biểu đồ (nomogram) cho ước tính cỡ mẫu power cho nghiên cứu hai nhóm (Nguồn: British Medical Journal, 1980, 281, 1336–1338) Cách sử dụng: Lấy ví dụ 3, có standardised difference 0.33 (tức ES), power = 0.9 Đánh dấu 0.33 cột trái, 0.9 cột phải; kẻ nối hai điểm đánh dấu thước thẳng Điểm giao chéo đường kẻ thẳng cột số cỡ mẫu cần thiết cho α = 0.05 hay 0.01 Ví dụ – Ước tính cỡ mẫu để “chứng minh” hai thuật điều trị có hiệu tương đương nhau: Một nghiên cứu thiết kế để “chứng minh” hiệu thuốc A B tương đương Các nhà nghiên cứu chọn mật độ xương (BMD) làm tiêu chí lâm sàng Nghiên cứu gồm nhóm bệnh nhân lỗng xương phân chia ngẫu nhiên: nhóm điều trị A, nhóm điều trị B Các nghiên cứu trước cho thấy sau tháng điều trị, A tăng BMD khoảng 7%, B có tác dụng tăng BMD khoảng 4% Theo nghiên cứu đó, độ lệch chuẩn tăng BMD 10% Các nhà nghiên cứu định độ khác biệt BMD hai nhóm vịng 2 g/cm xem hai loại thuốc có hiệu Vấn đề đặt cần đối tượng cho nghiên cứu với α = 0.05 power = 0.8? Với số liệu trên, ước tính hệ số ảnh hưởng (xem phần 4.1.4) sau: H = μ1−μ2 − = − − = 0.1 Với α = 0.05 power = 0.8, số C = d σ 10 7.85 (Bảng 3) Số lượng cỡ mẫu cần thiết cho nhóm (theo cơng thức [5]) là: n = 2C × 7.85 = = 1570 H2 (0.1)2 Nói cách khác, cơng trình cần tuyển chọn 3140 đối tượng để đạt yêu cầu mục tiêu nghiên cứu 5.3 Ước tính cỡ mẫu cho nghiên cứu ước tính hệ số tương quan Ví dụ – Nghiên cứu tìm hiểu độ tương quan Mối tương quan lượng đường máu (fasting plasma glucose - FPG) tỉ trọng thể (body mass index – BMI) thường không quán sắc dân, sắc, không quán quần thể Một nghiên cứu thiết kế để ước tính hệ số tương quan BMI FPG Số liệu từ nghiên cứu trước cho thấy hệ số tương quan thường dao động từ 0.08 đến 0.30 Vấn đề đặt độ dao động đó, nghiên cứu cần đo lường đối tượng để có kết với độ tin cậy 99% (tức α = 0.01) power = 0.80? 21 Công thức [9] ứng dụng để ước tính cỡ mẫu cho nghiên cứu Giả dụ hệ số tương quan thật 0.15, với α = 0.01 power = 0.80, số C = 13.33 (Bảng 3) Số cỡ mẫu là: n=3 + =3+ C 0.25 log +r −r 11.33 + 0.15 0.25× log − 0.15 = 499 Nói cách khác, cơng trình cần phải tuyển khoảng 500 đối tượng để đạt yêu cầu mục tiêu nghiên cứu Bảng sau cho thấy số lượng cỡ mẫu dao động cao tùy thuộc vào hệ số tương quan Bảng Số cỡ mẫu cần thiết để ước tính hệ số tương quan với α = 0.01 hay 0.05 power = 0.80 Hệ số tương quan 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 Số cỡ mẫu cần thiết cho power = 0.80 α = 0.01 α = 0.05 4527 3138 1128 783 499 347 279 194 177 123 121 85 88 62 66 47 51 36 41 29 5.3 Ước tính cỡ mẫu để ước tính tỉ lệ Ví dụ – Nghiên cứu ước tính tỉ lệ lưu hành: Chúng ta muốn ước tính tỉ lệ đàn ơng hút thuốc Việt Nam cho ước số không cao hay thấp 2% so với tỉ lệ thật toàn dân số Một nghiên cứu trước cho thấy tỉ lệ hút thuốc đàn ông người Việt lên đến 70% Câu hỏi đặt cần nghiên cứu đàn ơng để đạt u cầu Trong ví dụ này, có sai số m = 0.02, pˆ = 0.70, số lượng cỡ mẫu cần thiết cho nghiên cứu (theo công thức [6]) là: 22 1.96 n≥ 0.7 × 0.3 Nói cách khác, cần nghiên cứu 2017 Nếu muốn giảm sai số từ 2% xuống 1% (tức m = 0.01) số lượng đối tượng 8067! Chỉ cần thêm độ xác 1%, số lượng mẫu thêm 6000 người Do đó, vấn đề ước tính cỡ mẫu phải thận trọng, xem xét cân độ xác thơng tin cần thu thập chi phí 5.4 Ước tính cỡ mẫu cho so sánh hai tỉ lệ Ví dụ – Nghiên cứu so sánh hai tỉ lệ phát sinh (incidence rate): Một thử nghiệm lâm sàng đối chứng ngẫu nhiên thiết kế để đánh giá hiệu loại thuốc chống gãy xương sống Hai nhóm bệnh nhân tuyển Nhóm điều trị thuốc, nhóm nhóm đối chứng (khơng điều trị) Các nhà nghiên cứu giả thiết tỉ lệ gãy xương nhóm khoảng 10%, thuốc làm giảm tỉ lệ xuống khoảng 6% Nếu nhà nghiên cứu muốn thử nghiệm giả thiết với sai sót I α = 0.01 power = 0.90, bệnh nhân cần phải tuyển mộ cho nghiên cứu? Ở đây, có Δ = 0.10 – 0.06 = 0.04, p = (0.10 + 0.06)/2 = 0.08 Với α = 0.01, zα / = 2.57 với power = 0.90, zβ = 1.28 Do đó, số lượng bệnh nhân cần thiết cho nhóm (theo cơng thức [7]) là: n= (2.57 2× 0.08× 0.92 +1.28 0.1× 0.90 + 0.06× 0.94 ) = 1361 (0.04)2 Như vậy, cơng trình nghiên cứu cần phải tuyển 2722 (1361 x 2) bệnh nhân để kiểm định giả thiết Ví dụ – Nghiên cứu “chứng minh” hai tỉ lệ tương đương: Quay lại với ví dụ nghiên cứu nhằm “chứng minh” hai loại thuốc A B có hiệu Nhưng lần này, tiêu chí lâm sàng để đánh giá hiệu thuốc tỉ lệ phát sinh gãy xương cột sống (incidence of vertebral fracture), thay đổi mật độ xương Số liệu từ nghiên cứu trước cho thấy tỉ lệ gãy xương bệnh nhân điều trị A khoảng 2% B 3% Đứng quan điểm lâm sàng, nhà nghiên cứu 23 cho hai tỉ lệ khác vịng 0.5% xem tương đương Vấn đề đặt cần đối tượng cho nghiên cứu để đạt α = 0.05 (tức độ tin cậy 0.95) power = 0.80? Với số liệu (p1 = 0.02, p2 = 0.03, d = 0.005 tức 0.5%) áp dụng công thức [8], ước tính số cỡ mẫu cần thiết cho nhóm sau: n = 2C p [ 1(( − p ) + p − p () )] = × 7.85 × ( [(0.02 × 0.98 + ) (0.03 × 0.97 ) )] = 15291 p1 − p2 − d 20.02 − 0.03 − 0.005 Do đó, cơng trình cần tuyển 30582 đối tượng để đạt yêu cầu nghiên cứu Như thấy cơng thức trên, yếu tố quan trọng cách tính cỡ mẫu cho nghiên cứu loại độ khác biệt d để xem hiệu hai loại thuốc tương đương Số cỡ mẫu dựa vào tiêu chuẩn khác biệt 0.5% để kết luận “tương đương” Nhưng tiêu chuẩn “dễ dãi” chút (như 1%) số lượng cỡ mẫu giảm xuống cho nhóm giảm xuống 7646 đối tượng – số lớn So sánh với kết ước tính từ ví dụ 4, thấy mục tiêu nghiên cứu, vấn đề chọn tiêu chí lâm sàng quan trọng có ảnh hưởng lớn đến số cỡ mẫu 5.5 Ước tính cỡ mẫu cho tỉ số nguy (odds ratio) Ví dụ – Nghiên cứu bệnh-chứng (case-control study): Nhà nghiên cứu muốn tìm hiểu mối liên hệ hút thuốc nguy gãy xương cột sống (vertebral fracture) Hai nhóm đối tượng chọn: Nhóm bệnh nhân gãy xương cột sống, nhóm đối tượng khơng gãy xương, có độ tuổi, giới với nhóm bệnh nhân Sau có hai nhóm đối tượng, nhà nghiên cứu vấn xem hai nhóm, có người hút thuốc Các nhà nghiên cứu giả thiết tỉ số nguy gãy xương người hút thuốc Nếu nhà nghiên cứu muốn thử nghiệm giả thiết với sai sót I α = 0.05 power = 0.80, đối tượng cần phải tuyển mộ cho nghiên cứu? Áp dụng công thức [11], có: n= 4C = × 7.85 = 349 (ln OR)2 p(1 − p) (ln 2)2 × 0.25 × 0.75 Cơng trình nghiên cứu cần phải tuyển 350 đối tượng (175 bệnh nhân 175 đối chứng) để kiểm định giả thiết 5.6 Ước tính cỡ mẫu cho nghiên cứu sống sót 24 Ví dụ 10 – Nghiên cứu so sánh thời gian sống sót: Như đề cập mục 4.5, nhiều nghiên cứu y khoa có mục đích so sánh thời gian sống sót (survival time) hai nhóm Cụm từ “sống sót” phải hiểu rộng hơn, khơng phản ảnh tử vong sống, mà bao gồm thời gian dẫn đến kiện lâm sàng (có thể ung thư, đột quị, gãy xương, đái tháo đường, v.v…) Chẳng hạn nghiên cứu tìm hiểu xem thuốc kéo dài thời gian sống bệnh nhân hay không, nhà nghiên cứu theo dõi nhóm bệnh nhân (nhóm điều trị nhóm nhóm đối chứng) vịng năm Theo y văn, tỉ lệ sống sót vịng năm nhóm đối chứng 25%, nhà nghiên cứu hi vọng thuốc kéo dài thời gian sống cao nhóm đối chứng khoảng 1.5 lần Để đạt ý nghĩa thống kê α = 0.05 power = 0.80, nghiên cứu cần bệnh nhân? Trong trường hợp này, biết p1 = 0.25 , h = 1.5, đó, suy từ cơng thức h = ln(0.25) = 1.5, theo đó: p2 = 0.397 Với α = 0.05 power = ln( p2 ) 0.80, số C = 7.85 Thay số vào cơng thức [12], có số cỡ mẫu cho nhóm là: n= C(h + 1)2 (2 − p1 − p2 )(h − 1)2 = 7.85(1.5 +1)2 =195 (2 − 0.25 − 0.397)(1.5 −1)2 Như vậy, cơng trình cần phải tuyển chọn 390 bệnh nhân để đạt yêu cầu mục đề 5.7 Ước tính cỡ mẫu cho nghiên cứu chẩn đốn Ví dụ 11 – Nghiên cứu chẩn đoán bệnh lao phổi: Hiện chẩn đốn bệnh lao phổi AFB âm tính (soi đờm trực tiếp phương pháp Ziehl-Neelsen âm tính) chưa có tiêu chuẩn thống nhất, chủ yếu dựa vào kết X quang phổi việc đáp ứng điều trị thử thuốc chống lao Ở Việt Nam kĩ thuật đại phát nhanh vi khuẩn lao tiến hành bệnh viện lớn, trung tâm thành phố, bệnh viện sở hay cấp tỉnh chưa có điều kiện áp dụng Do đó, nhà nghiên cứu phát triển phương pháp chẩn đoán dựa vào cận lâm sàng Các nhà nghiên cứu hi vọng phương pháp cận lâm sàng có độ nhậy khoảng 0.80 độ đặc hiệu khoảng 0.95, muốn thiết kế nghiên cứu cho hai số dao động 5% Biết tỉ lệ hành bệnh lao phổi cộng đồng khoảng 20% Câu hỏi đặt nghiên cứu cần đối tượng để đạt độ tin cậy thống kê 95% (tức α = 0.05) Với số liệu trên, ước tính TP+FN: 25 TP+FN = Zα2 × pse × (1 − pse ) = (1.96)2 × 0.80 × 0.20 = 246 w2 (0.05)2 Với tỉ lệ hành bệnh 20%, số lượng cỡ mẫu cần thiết để ước tính độ nhậy (theo công thức [13]) là: 246 / 0.20 = 1229 Mặt khác, số liệu trên, ước tính FP+TN: FP +TN = Zα2 × psp × (1 − psp ) = (1.96)2 × 0.95 × 0.05 = 73 w2 (0.05)2 Với tỉ lệ hành bệnh 20%, số lượng cỡ mẫu cần thiết để ước tính độ đặc hiệu (theo cơng thức [14]) là: 73 / (1 – 0.20) = 91 Trong trường hợp này, có hai ước tính khác Nếu dựa vào tiêu chí độ nhạy, nghiên cứu cần đến 1229 đối tượng, lấy tiêu chí đặc hiệu nghiên cứu cần 91 đối tượng Vấn đề lại phải xác định hai số nhạy đặc hiệu, số quan trọng để lấy làm tiêu chí cho nghiên cứu Đây định lâm sàng cần phải cân nhắc trước ước tính cỡ mẫu! Một số vấn đề ước tính cỡ mẫu Điều chỉnh cho tượng “bỏ cuộc” Các phương pháp ước tính cỡ mẫu trình bày dựa vào giả định quan trọng nghiên cứu tiến hành suông sẻ, tức đối tượng bỏ số liệu thu thập đầy đủ cho tất đối tượng Nhưng thực tế, biết khơng có nghiên cứu hoàn hảo Hiện tượng bỏ (withdrawal) phổ biến nghiên cứu lâm sàng Vì nhiều lí do, đối tượng khơng thể tham gia từ đầu đến cuối cơng trình nghiên cứu, phải “bỏ cuộc” Vì bỏ cuộc, số liệu đối tượng không đầy đủ Tùy theo thể loại tính can thiệp hay xâm phạm cơng trình nghiên cứu, tỉ lệ bỏ không đầy đủ số liệu dao động từ 10% đến 30% Vì thế, ước tính cỡ mẫu phải xem xét đến khả cách điều chỉnh cho tỉ lệ bỏ Nếu theo lí thuyết ước tính, nghiên cứu cần n đối tượng, tỉ lệ bỏ q số lượng đối tượng thực tế cần phải n/(1-q) Chẳng hạn ví dụ 8, số lượng bệnh nhân cần thiết cho nghiên cứu theo lí thuyết 30582 người, tỉ 26 lệ bỏ 20%, thực tế nhà nghiên cứu phải cần tuyển đến 30582/(1-0.20) = 34280 bệnh nhân Điều chỉnh cho trường hợp khơng cân đối hai nhóm Các cơng thức tính tốn cỡ mẫu tơi trình bày phần trước giả định nghiên cứu gồm hai nhóm hai nhóm phải có số lượng đối tượng Nhưng thực tế, nhiều nghiên cứu (nhất nghiên cứu bệnh chứng – case-control study) số lượng bệnh nhân khó mà số lượng đối chứng, bệnh thuộc vào dạng cộng đồng Vì thế, nhóm đối chứng cần phải có nhiều đối tượng nhóm bệnh Trong trường hợp cân đối hai nhóm, số lượng cỡ mẫu cần phải điều chỉnh Gọi tổng số cỡ mẫu lí thuyết (của hai nhóm cộng lại) N; gọi tổng số cỡ mẫu điều chỉnh N*, kì vọng tỉ số cỡ mẫu nhóm nhóm k, N* xác định công thức sau đây: N* = N (1 + k ) 4k Dễ thấy hai nhóm cân đối (có cỡ mẫu, hay k = 1) N = N* Quay lại ví dụ 10, số lượng cỡ mẫu cần thiết cho nhóm 195 (do N = 390) Nhưng kì vọng số cỡ mẫu nhóm phải nhóm khoảng 1.5 lần, tổng số lượng đối tượng cần phải tuyển chọn là: N = [390× (1+1.5) ] / (4×1.5) = 406, tức tăng khoảng 16 đối tượng so với ước tính lí thuyết Ước tính cỡ mẫu bước đầu nghiên cứu Trước kết thúc viết này, muốn nhân hội để nhấn mạnh lần nữa, ước tính cỡ mẫu cho nghiên cứu bước quan trọng việc thiết kế nghiên cứu cho có ý nghĩa khoa học, định thành bại nghiên cứu Trước ước tính cỡ mẫu nhà nghiên cứu cần phải biết trước (hay có vài giả thiết cụ thể) vấn đề quan tâm Ước tính cỡ mẫu cần số thông số đề cập đến phần đầu chương, thơng số khơng có khơng thể ước tính Trong trường hợp nghiên cứu hoàn toàn mới, tức chưa làm trước đó, thơng số độ ảnh hưởng độ dao động đo lường khơng có, nhà nghiên cứu cần phải tiến hành số mô (simulation) hay nghiên cứu sơ khởi để có thơng số cần thiết Cách ước tính cỡ mẫu mô lĩnh vực nghiên cứu chuyên sâu, không nằm đề tài sách này, bạn đọc tìm hiểu thêm phương pháp sách giáo khoa thống kê học cấp cao 27 Tài liệu tham khảo: Cohen J Statistical power analysis for the behavioral science NY: Academic Press, 1969 th Hair JF, Anderson RE, et al Multivariate data analysis, Ed New Jersey:PrenticeHall, 1998 Green SB How many subjects does it take to a regression analysis Multivariat Behav Res 1991; 26:499-510 Harris RJ A primer of multivariate analysis, 2nd Ed New York: Academic Press, 1985 Freeman LS Tables of the number of patients required in clinical trials using the logrank test Stat Med 1982; 1:121-129 Lee ET Statistical methods for survival analysis Page 320 New York: Wiley, 1992 Jones SJ, Carley S, Harrison M An introduction to power and sample size estimation Emerg Med J 2003; 20:453-458 Tài liệu đọc thêm: Các cơng thức trình bày viết tìm thấy sách giáo khoa dịch tễ học thống kê học Ba sách sau xem loại sách dẫn nhập: Machin JM Biostatistical Methods – The Assessment of Relative Risks New York: John Wiley & Sons, 2000 Kahn HA, Sempos CT Statistical Methods in Epidemiology New York: Oxford University Press, 1989 Phân tích số liệu tạo biểu đồ R - hướng dẫn thực hành (tác giả này) Nhà xuất Khoa học Kỹ thuật phát hành, Thành phố Hồ Chí Minh, 2006 Trong sách có hướng dẫn cách tính cỡ mẫu (và phân tích số liệu) máy tính qua ngơn ngữ thống kê R Ngồi ra, bạn đọc muốn tìm hiểu thêm phương pháp tính cỡ mẫu tìm đọc báo quan trọng sau đây: Florey CD Sample size for beginners BMJ 1993;306(6886):1181-4 28 Day SJ, Graham DF Sample size and power for comparing two or more treatment groups in clinical trials BMJ 1989;299(6700):663-5 Kieser M, Hauschke D Approximate sample sizes for testing hypotheses about the ratio and difference of two means J Biopharm Stat 1999;9(4):641-50 Miller DK, Homan SM Graphical aid for determining power of clinical trials involving two groups BMJ 1988;297(6649):672-6 Campbell MJ, Julious SA, Altman DG Estimating sample sizes for binary, ordered categorical, and continuous outcomes in two group comparisons BMJ 1995;311(7013):1145-8 Sahai H, Khurshid A Formulae and tables for the determination of sample sizes and power in clinical trials for testing differences in proportions for the two-sample design: a review Stat Med 1996;15(1):1-21 29

Ngày đăng: 23/02/2022, 18:30

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w