1. Trang chủ
  2. » Tất cả

080706_nguyenvantuan_tri_so_P_trong_nghien_cuu_khoa_hoc

22 4 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 22
Dung lượng 268,37 KB

Nội dung

LTS Trị số P nghiên cứu y khoa đem thảo luận tập san y học quốc tế, ý nghĩa đề tài cho khai thác để hiểu rõ Bài viết sau lần bàn ý nghĩa trị số P đứng quan điểm thống kê, mà qua nhìn chẩn đốn lâm sàng Có thể bạn thấy thú vị tương đương nghiên cứu y khoa chẩn đoán lâm sàng viết Bài viết đăng tập san Thơng tin Y học; đó, bạn đọc tham khảo tập san để biết thêm chi tiết Ý nghĩa trị số P nghiên cứu y học Nguyễn Văn Tuấn Trong cơng trình nghiên cứu đánh giá hiệu chống gãy xương thuốc zoledronate, nhà nghiên cứu điều trị 1065 bệnh nhân zoledronate 1062 bệnh nhân không điều trị zoledronate (placebo), kết trình bày qua đoạn văn quan trọng sau đây: “The rates of any new fracture were 8,6% in the zoledronic acid group and 13,9% in the placebo group, a 35% risk reduction with zoledronic acid (p = 0,001); the respective rates of new vertebral fracture were 1,7% and 3,8% (p = 0,02)” [1] Câu văn gắn liền với trị số p có nghĩa gì? Khi câu hỏi tương tự đem hỏi nhóm bác sĩ chuyên khoa có kinh nghiệm nghiên cứu y học, có đến 85% trả lời sai [2] Đại đa số người hỏi hiểu kết luận (về khác biệt) với trị số p = 0,05 có nghĩa khả mà kết luận sai 5%, hay khả mà kết luận 95% (lấy trừ cho 0,05) Nhiều người khác hiểu khác biệt với trị số P nhỏ mức độ ảnh hưởng có ý nghĩa độ tin cậy kết luận cao Nhưng tiếc hai cách hiểu sai Điều đáng ngạc nhiên giới làm nghiên cứu khoa học hiểu sai, mà nhà nghiên cứu có kiến thức thống kê dịch tễ học hiểu sai Thật ra, số nhà thống kê chuyên nghiệp hiểu sai ý nghĩa trị số P số sách giáo khoa giải thích sai, không rõ ràng! Trong viết ngắn này, tơi giải thích ý nghĩa thật trị số P, bàn qua khiếm khuyết nó, giới thiệu trường phái suy luận khoa học có ích cho nghiên cứu lâm sàng Trị số P triết lí phản nghiệm (falsificationism) Khi đọc báo khoa học tập san y học, thường hay gặp trị số P Một khác biệt với trị số p < 0,05 thường hiểu khác biệt có ý nghĩa thống kê (statistically significant); ngược lại, p > 0,05 thường hiểu khác biệt khơng có ý nghĩa thống kê, không đáng kể, hay ngẫu nhiên YKHOA.NET - Nghiên cứu khoa học – Nguyễn Văn Tuấn Tuy nhiên, cách hiểu P [là xác suất phi điều kiện] sai lầm Trị số P xác suất có điều kiện Ý nghĩa trị số P gắn liền với triết lí phản nghiệm (falsificationism) khoa học Do đó, trước bàn ý nghĩa trị số P, thiết tưởng cần phải hiểu qua triết lí phản nghiệm Một giả thuyết xem mang tính “khoa học” giả thuyết có khả “phản nghiệm” Theo Karl Popper [3], nhà triết học khoa học, đặc điểm để phân biệt lí thuyết khoa học thực thụ với ngụy khoa học (pseudoscience) thuyết khoa học ln có đặc tính “bị bác bỏ” hay “khả phản nghiệm” (falsified) thực nghiệm đơn giản Ơng gọi “khả phản nghiệm” (falsifiability) [4] Phép phản nghiệm phương cách tiến hành thực nghiệm để xác minh mà để phê phán lí thuyết khoa học, coi tảng cho khoa học thực thụ Chẳng hạn giả thuyết [đơn giản] “Tất quạ màu đen” bị bác bỏ quan sát quạ màu đỏ Hay, giả thuyết “vi khuẩn V cholerae gây bệnh dịch tả” bác bỏ có bệnh nhân dịch tả khơng nhiễm vi khuẩn V cholerae Đứng phương diện khoa học, có hai mơ hình thực tế để tiếp cận lí thuyết phản nghiệm: mơ hình kiểm định thống kê mơ hình kiểm định giả thuyết Rất nhiều sách giáo khoa thống kê khoa học viết ra, tiếc, nhiều tác giả không giải thích hay khơng phân biệt hai mơ hình Có tác giả chí cịn nhầm lẫn diễn dịch, ngun nhân dẫn đến tình trạng hiểu lầm ý nghĩa trị số P Trong phần này, tơi giải thích ngắn gọn cung cấp tài liệu tham khảo hai mơ hình để bạn đọc hiểu qua nghiên cứu thêm 1.1 Fisher mơ hình kiểm định ý nghĩa thống kê Triết lí phản nghiệm phổ biến trở thành mơ hình để giải thích tiến khoa học Chịu ảnh hưởng triết lí này, Ronald A Fisher (1890 – 1962), nhà di truyền học người Anh “cha đẻ” thống kê học đại, đề xuất phương pháp định lượng để phản nghiệm giả thuyết khoa học Ông gọi phương pháp “Test of Significance” [5-6] (tôi tạm dịch là: phương pháp kiểm định ý nghĩa thống kê) Fisher quan niệm thống kê phận quan trọng phương pháp suy luận theo phép qui nạp (inductive inference), tức phương pháp suy luận dựa vào quan sát từ mẫu (sample) khái quát cho quần thể (population) Phương pháp kiểm định ý nghĩa thống kê tiến hành theo bước sau: • Bước 1, phát biểu giả thuyết vô hiệu (null hypothesis) Giả thuyết vô hiệu giả thuyết ngược lại với giả thuyết mà nhà nghiên cứu muốn kiểm định Chẳng hạn giả thuyết điều trị thuốc zoledronate làm giảm nguy tử vong (nhóm điều trị zoledronate có tỉ lệ tử vong thấp nhóm giả dược), YKHOA.NET - Nghiên cứu khoa học – Nguyễn Văn Tuấn giả thuyết vơ hiệu phát biểu “tỉ lệ tử vong bệnh nhân điều trị zoledronate với nhóm giả dược Gọi giả thuyết vơ hiệu H0 • Bước 2, thu thập liệu liên quan đến giả thuyết Trong ví dụ trên, số liệu số trường hợp tử vong Gọi liệu D • Bước 3, ước tính xác suất quan sát liệu D giả thuyết H0 Nói cách khác viết theo ngơn ngữ tốn, bước ước tính P(D | H0) Đây trị số P (p-value) Fisher đề nghị báo cáo trị số P cách xác Tức khơng có cách viết p < 0,05 hay p > 0,01 mà phải p = 0,043 hay p = 0,002 Fisher đề nghị trị số p thấp 0,05 giả thuyết H0 (vơ hiệu) không phù hợp với số liệu quan sát Đối với Fisher, khơng có chuyện “bác bỏ giả thuyết” hay “chứng minh giả thuyết” mà có số liệu có phù hợp, có qn với giả thuyết hay khơng mà Quan điểm chịu ảnh hưởng “đậm” triết lí phản nghiệm Popper, theo triết lí này, chứng minh giả thuyết nào, mà bác bỏ (disprove) giả thuyết liệu quan sát Ví dụ Có thể minh họa cho bước ví dụ sau: có 10 bệnh nhân, bệnh nhân điều trị loại thuốc (A B) Sau theo dõi thời gian, có bệnh nhân mà hiệu thuốc A tốt thuốc B Kết có phù hợp với giả thuyết thuốc A tốt thuốc B? Để trả lời câu hỏi kiểm định giả thuyết trên, phát biểu giả thuyết vơ hiệu: hai loại thuốc có hiệu nhau, có bệnh nhân với kết A tốt B, bệnh nhân với kết B tốt A Gọi π xác suất mà kết thuốc A tốt thuốc B Giả thuyết vơ hiệu có nghĩa π = 0,5 Nếu giả thuyết vô hiệu (tức π = 0,5), tính tốn xác suất quan sát k bệnh nhân (k = 0, 1, 2, 3, …, 10) với kết A tốt B theo luật phân phối nhị phân sau: P(k | π = 0,5) = ( )(0,5) (1 − 0,5) 10 k k 10 − k Và kết trình bày bảng sau đây: Bảng Xác suất quan sát k bệnh nhân (trong số 10 bệnh nhân) với kết A>B giả thuyết vô hiệu (π = 0,5) k= Pr(k | π=0,5) YKHOA.NET - Nghiên cứu khoa học – Nguyễn Văn Tuấn 0,0009765625 0,009765625 0,04394531 0,1171875 0,2050781 0,2460938 0,2050781 0,1171875 0,04394531 0,009765625 10 0,0009765625 P(k ≥ 8) 0,054687 Cố nhiên, tổng số xác suất k = 0, 1, 2, …, 10 phải Theo kết trên, khơng có khác biệt hiệu hai thuốc, xác suất mà quan sát bệnh nhân với kết A>B khoảng 4,39% Diễn dịch tương tự, ước tính xác suất với bệnh nhân kết A>B 0,97%, xác suất tất 10 bệnh nhân với kết A>B 0,097% Xác suất mà tối thiểu bệnh nhân với kết A>B 0,055 hay 5,5% Viết theo kí hiệu tốn: P(k ≥ 8) = 0,0547 Đây trị số P Sử dụng tiêu chí 0,05, nói dù 80% (8 10) bệnh nhân với kết A>B, chưa có đầy đủ chứng để khẳng định kết quán với giả thuyết thuốc A tốt B 1.2 Neyman Pearson mơ hình Kiểm định giả thuyết Jerzy Neyman (1894 – 1981) nhà toán học xuất sắc gốc Ba Lan Egon Pearson (1895 – 1980) nhà thống kê học (con giáo sư Karl Pearson, cha đẻ lí thuyết Chi-square hệ số tương quan) lúc với Fisher, phát triển phương pháp khác với Fisher, mà hai ông gọi Test of Hypothesis (Kiểm định giả thuyết) [7] Neyman Pearson bác bỏ khái niệm suy luận theo qui nạp; hai ông nghĩ thống kê học phương pháp hay chế để hướng dẫn đến định lâu dài Nói cách khác, Neyman Pearson cho phương pháp Fisher vô nghĩa! Một cách đơn giản, mô hình kiểm định giả thuyết Neyman Pearson thực qua bước sau: YKHOA.NET - Nghiên cứu khoa học – Nguyễn Văn Tuấn • Bước 1, phát biểu giả thuyết (H1) giả thuyết vơ hiệu (H0) • Bước 2, định mức độ α β chấp nhận ước tính cỡ mẫu cần thuyết α xác suất bác bỏ giả thuyết H1 giả thuyết β xác suất bác bỏ H0 H0 • Bước 3, thu thập liệu liên quan đến giả thuyết • Bước 4, liệu nằm khoảng bác bỏ giả thuyết H0, chấp nhận giả thuyết H1; khơng chấp nhận giả thuyết H0 Chú ý “chấp nhận” giả thuyết khơng có nghĩa tin vào giả thuyết đó, mà có nghĩa hành động với điều kiện giả thuyết Ngun lí mơ hình Neyman Pearson dựa vào liệu để chọn giả thuyết cho lâu dài khơng q sai Chính mà ngày thường chọn α = 5% β = 10% đến 20% Fisher bác bỏ hồn tồn mơ hình Neyman Pearson [8] Ơng cho mơ hình … vơ duyên Fisher nhạo báng nhà toán học (ám Neyman Pearson) “chẳng hiểu thực nghiệm đề mơ hình q phi thực tế” Trong năm sau (thập niên 1930s) cộng đồng thống kê học chứng kiến tranh luận dai dẵng đơi nóng bỏng Fisher Neyman-Pearson tập san thống kê học Anh Fisher người thông minh tuyệt vời, nhà tư tưởng với suy nghĩ trừu tượng, lại người khó tính có hẹp hòi Sự hẹp hòi Fisher thể chỗ ông sử dụng chức quyền khoa bảng để gây khó khăn cho Neyman ơng chịu không nỗi phải di cư sang Mĩ sau trở thành giáo sư trường Đại học Berkeley Sau này, Neyman lịch sử ghi nhận nhà thống kê học xuất sắc có cơng to lớn cho khoa học đại, sánh vai “đại thụ” khoa học đại Nước Mĩ thật môi trường cho ông thi thố tài năng! 1.2 Một mơ hình hỗn hợp Trớ trêu thay, mươi năm sau, hai mơ hình Fisher Neyman-Pearson “hun đúc” thành mơ hình tổng hợp mà ứng dụng ngày nghiên cứu y học Mơ hình sử dụng kết kiểm định thống kê Fisher để đến định chấp nhận hay bác bỏ giả thuyết vô hiệu H0 hay giả thuyết H1 theo mơ hình Neyman Pearson Tiêu biểu cho mơ hình nghiên cứu lâm sàng đối chứng ngẫu nhiên (randomized controlled clinical trial hay RCT) Theo đó, nghiên cứu lâm sàng tiến hành theo bước sau: YKHOA.NET - Nghiên cứu khoa học – Nguyễn Văn Tuấn • Bước 1, định nghĩa giả thuyết vô hiệu giả thuyết Thí dụ nghiên cứu lâm sàng, gồm hai nhóm bệnh nhân: nhóm điều trị thuốc A, nhóm điều trị placebo, nhà nghiên cứu phát biểu giả thuyết vô hiệu độ hiệu nghiệm thuốc A tương đương với placebo • Bước 2, xác định xác suất α (còn gọi sai số loại I) β (còn gọi sai số loại II), ước tính cỡ mẫu dựa vào hai xác suất • Bước 3, thu thập liệu liên quan đến giả thuyết Gọi liệu D • Bước 4, sử dụng phương pháp kiểm định ý nghĩa thống kê Fisher ước tính xác suất P(D | H0) Gọi trị số P • Bước 5, P < 0,05, bác bỏ giả thuyết H0 Chú ý, bác bỏ H0 khơng có nghĩa chấp nhận giả thuyết H1 Ví dụ Có thể minh họa cho bước ví dụ nghiên cứu hiệu thuốc zoledronate việc phịng chống lỗng xương [1] Với giả thuyết thuốc có hiệu nghiệm giảm nguy gãy xương, nhà nghiên cứu so sánh tỉ lệ gãy xương hai nhóm bệnh nhân: nhóm điều trị zoledronate nhóm nhóm giả (nhận calcium vitamin D) Bắt đầu cách xác định α = 0,05 β = 0,80, nhà nghiên cứu ước tính số lượng bệnh nhân cần thiết Sau ba năm thu thập số liệu, kết tóm lược bảng số liệu sau đây: Bảng Nguy gãy xương bệnh nhân điều trị zoledronate placebo Chỉ số Zoledronate Placebo Số bệnh nhân 1065 1062 Số gãy xương 92 139 8,6% 13,9 Tỉ lệ gãy xương Trị số P 0,001 Bởi trị số P thấp mức α (0,05) mà nhà nghiên cứu đề từ lúc đầu (trước thu thập số liệu); cho nên, nhà nghiên cứu kết luận khác biệt tỉ lệ gãy xương hai nhóm (8,6% vs 13,9%) có ý nghĩa thống kê Tất nhiên, trị số P khơng có nghĩa nghiên cứu chứng minh thuốc zoledronate có hiệu giảm nguy gãy xương Nó có nghĩa thật thuốc zoledronate khơng có hiệu giảm nguy gãy xương xác suất mà nhà nghiên cứu quan sát số liệu (13,9% so với 8,6%) 0,001 YKHOA.NET - Nghiên cứu khoa học – Nguyễn Văn Tuấn Vấn đề trị số P Có lẽ nói khơng ngoa trị số P số phổ biến khoa học từ khoảng 100 năm qua [9] Hầu hết báo khoa học trình bày trị số P hàm ý nâng cao tính khoa học độ tin cậy báo Tuy nhiên, từ lúc “ra đời”, trị số P bị phê bình dội Có người cho việc ứng dụng trị số P suy luận khoa học bước lùi, thối hóa khoa học, nên đề nghị khơng sử dụng trị số nghiên cứu khoa học Nhưng dù chịu nhiều trích phê bình, ứng dụng phương pháp kiểm định giả thuyết trị số P ngày phổ biến, đơn giản chưa có phương pháp khác tốt hơn, hay hợp lí hơn, hay đơn giản Trong phần này, không điểm qua tất phê bình trị số P (vì làm cần sách), mà nêu số vấn đề cần lưu ý diễn dịch trị số P 2.1 Vấn đề logic Như qua minh họa trên, trị số P khơng cho biết giả thuyết, xác suất có điều kiện Trị số P cho biết xác suất liệu (data) giả thuyết Cái khiếm khuyết lớn trị số P thiếu tính logic Thật vậy, chịu khó xem xét lại ví dụ trên, khái qt tiến trình nghiên cứu y học (dựa vào trị số P) sau: • • • • Đề giả thuyết vơ hiệu (H0) Từ giả thuyết vơ hiệu, đề giả thuyết (H1) Tiến hành thu thập liệu (D) Phân tích kiện: tính tốn xác suất D xảy H0 thật Nói theo ngơn ngữ tốn xác suất, bước bước tính tốn trị số P hay P(D | H0) Vì thế, số P có nghĩa xác suất liệu D xảy (nhấn mạnh: “nếu”) giả thuyết vô hiệu H0 Như vậy, số P không trực tiếp cho ý niệm thật giả thuyết H1; gián tiếp cung cấp chứng để chấp nhận giả thuyết bác bỏ giả thuyết vơ hiệu Logic đằng sau trị số P hiểu qui trình chứng minh đảo ngược (proof by contradiction): • • • Mệnh đề 1: Nếu giả thuyết vơ hiệu đúng, kiện xảy ra; Mệnh đề 2: Sự kiện xảy ra; Mệnh đề (kết luận): Giả thuyết vô hiệu khơng thể Nếu cách lập luận khó hiểu, thử xem ví dụ cụ thể sau: YKHOA.NET - Nghiên cứu khoa học – Nguyễn Văn Tuấn • • • Nếu ơng Tuấn bị cao huyết áp, ơng khơng thể có triệu chứng rụng tóc (hai tượng sinh học khơng liên quan với nhau, theo kiến thức y khoa nay); Ơng Tuấn bị rụng tóc; Do đó, ông Tuấn bị cao huyết áp Trị số P, đó, gián tiếp phản ánh xác suất mệnh đề Và khiếm khuyết quan trọng trị số P, ước tính mức độ liệu, khơng nói cho biết mức độ giả thuyết Điều làm cho việc suy luận dựa vào trị số P xa rời với thực tế, xa rời với khoa học thực nghiệm Trong khoa học thực nghiệm, điều mà nhà nghiên cứu muốn biết với liệu mà họ có được, xác suất giả thuyết bao nhiêu, họ không muốn biết giả thuyết đảo thật xác suất liệu Nói cách khác dùng kí hiệu mơ tả trên, nhà nghiên cứu muốn biết P(H1 | D), không muốn biết P(D | H0) hay P(D | H1) 2.2 Ý nghĩa thống kê không tương đương với ý nghĩa lâm sàng Một sai lầm phổ biến giới y khoa xem khác biệt có “ý nghĩa thống kê” (statistical significance) tương đương với “ý nghĩa lâm sàng” (clinical significance) Có thể xem trị số P tính tốn từ tỉ số tín hiệu (signal, mức độ khác biệt hai nhóm) nhiễu (noise hay độ dao động mẫu) Gọi T kiểm định thống kê, S tín hiệu, E nhiễu, ý tưởng mơ tả sau: T= S E Khi số lượng cỡ mẫu tăng S bất biến T tăng, tức có hội đạt ý nghĩa thống kê Điều có nghĩa giảm E tối đa cách tăng số lượng cỡ mẫu, có nghĩa khác biệt nhỏ chẳng có ý nghĩa thực tế có ý nghĩa thống kê Ngược lại, khác biệt hay ảnh hưởng (effect) lớn, số lượng cỡ mẫu không đầy đủ khơng thể đạt chuẩn “có ý nghĩa thống kê” (tức p > 0,05) Bảng sau trình bày nghiên cứu (tưởng tượng) với số cỡ mẫu khác nhau, từ 20 đến 2.000.000 bệnh nhân Cột “Kết quả” trình bày số bệnh nhân điều trị dứt bệnh số ngoặc phần trăm Giả thuyết vô hiệu xác suất kết 0,5 (tức 50%) Tất nghiên cứu có trị số P = 0,041 Như thấy qua bảng này, nghiên cứu có tỉ lệ ảnh hưởng cao có ý nghĩa lâm sàng (75%), với 20 bệnh nhân, nhà nghiên cứu bác bỏ giả thuyết H0 Nhưng nghiên cứu 4, mức độ ảnh hưởng thấp (chỉ 50,07%, tức cao giả thuyết vơ hiệu 0,07%) có ý nghĩa thống kê số cỡ mẫu lớn ! YKHOA.NET - Nghiên cứu khoa học – Nguyễn Văn Tuấn Bảng Ảnh hưởng cỡ mẫu đến trị số P Nghiên cứu Số lượng đối tượng Kết điều trị thành công (%) Trị số P 20 15 (75%) 0,041 200 114 (57%) 0,041 2000 1.046 (52,5%) 0,041 2.000.000 1.001.445 (50,07%) 0,041 Trong thực tế, có nhiều nghiên cứu mà độ khác biệt hai nhóm nhỏ, có ý nghĩa thống kê [10-11] Điều đáng quan tâm kết có ý nghĩa thống kê nhà nghiên cứu diễn dịch với hàm ý có ý nghĩa lâm sàng Ngược lại, có nghiên cứu mà kết có ý nghĩa lâm sàng khơng đạt chuẩn p < 0,05, nên nhà nghiên cứu lại diễn dịch khơng có ý nghĩa lâm sàng! Chẳng hạn nghiên cứu hiệu bổ sung vitamin C E phụ nữ mang thai [12], nhà nghiên cứu kết luận “Supplementation with vitamin C and E during pregnancy does not reduce the risk of serious outcomes in their infants” (Bổ sung vitamin E E không làm giảm triệu chứng lâm sàng nghiêm trọng) Nhưng xét qua số liệu thực tế thấy trẻ em mà mẹ có bổ sung vitamin C E, tỉ lệ với triệu chứng lâm sàng giảm đến 21% (p = 0,06) Chỉ p = 0,06 mà nhà nghiên cứu có xu hướng diễn dịch sai kết quả, sai lầm nghiêm trọng! 2.2 Vấn đề kiểm định nhiều giả thuyết Như nói trên, nghiên cứu y học qui trình kiểm định giả thuyết Trong nghiên cứu, kiểm định giả thuyết nhất, mà nhiều giả thuyết lúc Chẳng hạn nghiên cứu mối liên hệ vitamin D nguy gãy cổ xương đùi, nhà nghiên cứu phân tích mối liên hệ vitamin D mật độ xương (bone mineral density), vitamin D nguy gãy xương theo giới tính, nhóm tuổi, hay phân tích theo đặc tính lâm sàng bệnh nhân, v.v… Mỗi phân tích xem kiểm định giả thuyết Ở đây, phải đối diện với vấn đề nhiều giả thuyết (multiple tests of hypothesis hay gọi multiple comparisons) Vấn đề sau: kiểm định giả chấp nhận sai sót 5% (giả dụ chấp nhận tiêu chuẩn p = 0,05 để tun bố có ý nghĩa hay khơng có ý nghĩa thống kê) Nói cách khác, thật khơng thuốc có hiệu sai, kết kiểm định thống kê cho kết có ý nghĩa thống kê, chấp nhận YKHOA.NET - Nghiên cứu khoa học – Nguyễn Văn Tuấn kiện xảy với tần số 5% Vấn đề đặt bối cảnh kiểm định nhiều giả thuyết sau: số n thử nghiệm, tuyên bố k thử nghiệm “có ý nghĩa thống kê” (tức p 100 gần xác định Ví dụ: Trong nạn dịch tiêu chảy vào cuối năm 2007 số tỉnh phía Bắc, số quan chức y tế cho mắm tôm nguyên nhân, nguồn gốc nạn dịch, họ nghi mắm tơm hàm chứa vi khuẩn gây bệnh tả (Vibrio cholerae) Viện vệ sinh dịch tễ trung ương xét nghiệm 75 mẫu mắm tôm chọn ngẫu nhiên từ Hà Nội, Nghệ An, Thanh Hóa Kết xét nghiệm tất âm tính (khơng có vi khuẩn tả) Chúng ta diễn giải chứng nào? Gọi π xác suất mắm tôm chứa vi khuẩn tả Chúng ta biết theo luật phân phối nhị phân (binomial distribution), xác suất nhiễm tả π, xét nghiệm n mẫu, xác suất có k mẫu bị nhiễm là: n n−k P ( k | π , n ) =   π k (1 − π ) k  Gọi H0 giả thuyết mắm tơm khơng hàm chứa vi khuẩn tả, đó, π = Với 75 mẫu mắm tôm xét nghiệm, có k = (khơng có kết dương tính) Do đó, xác suất k = giả thuyết H0 là:  75  75 − P ( D | H ) = P ( | 0, 75 ) =   00 (1 − ) =1 0 Nếu H1 giả thuyết mắm tơm có vi khuẩn tả, cho 20% mắm tơm nhiễm khuẩn, đó: π = 0,20 Xác suất liệu (k = 0) giả thuyết là: P(D | H 1) = P(0 | 0,2;75) = ( )(0,2) (1 − 0,2) 75 0, 75− = (5,39) −8 Do đó, Yếu tố Bayes, theo định nghĩa (3) là: YKHOA.NET - Nghiên cứu khoa học – Nguyễn Văn Tuấn 17 BF = P ( D | H 1) P ( D | H 0) = ( 5.39 ) −8 = 18.546.031 Nói cách khác, chứng (dữ liệu từ 75/75 âm tính) nghiêng giả thuyết mắm tơm khơng nhiễm vi khuẩn tả đến 18,5 triệu lần! Trên cách tính tương đơn giản để minh hoạ cho ý nghĩa Yếu tố Bayes Trong thực tế, nghiên cứu với phân tích phức tạp, cách tính Yếu tố Bayes phức tạp Tuy nhiên, ước tính giá trị tối thiểu Yếu tố Bayes ước tính cơng thức đơn giản, hàm số trị số p, mà Sellke đồng nghiệp [16-17] phát triển sau: BFmin > / (─e p ln(p) ) [4] Trong e = 2,71828 Chẳng hạn nghiên cứu với trịo số p = 0,05, Yếu tố Bayes tối thiểu là: / (-2,71828 x 0,05 x log(0,05)) = 2,45 Theo cách hiểu thông thường, p 0,95 để kết luận, qua cách tính này, có chứng (p =0,0009) để kết luận giả thuyết H1 có xác suất lên đến 98% Hãy lấy ví dụ khác: báo chí quan tâm nghiên cứu mà nhà nghiên cứu phát tỉ lệ bị ung thư vú phụ nữ dùng thuốc aspirin (giảm đau) cao phụ nữ không dùng aspirin khoảng 20% [6] Kết luận đơn dựa vào trị số p = 0,022, tức “có ý nghĩa” Các nhà nghiên cứu khơng giải thích tượng này, phát nằm ngồi dự đốn sinh học YKHOA.NET - Nghiên cứu khoa học – Nguyễn Văn Tuấn 18 họ Nói cách khác, xác suất giả thuyết H1 thấp, 0,01 (tức 1%) Và P(H1) = 0,01, giá trị tối thiểu BF 1/[-2,71828 x 0,022 x log(0.022)] = 4,38, xác suất tối đa P(H1 | S) 0,042 hay 4,2% Cho dù P(H1) = 0,1 nữa, xác suất tối đa P(H1 | S) 0,33 Vì xác suất P(H1 | S) thấp 0,95, phát biểu giả thuyết vế mối liên hệ aspirin ung thư vú chưa có chứng thuyết phục, hay chứng có khơng qn với giả thuyết Nói cách khác, nhà nghiên cứu đến kết luận sai phát họ phát dương tính giả! Vài nhận xét kết luận Trị số p số có ảnh hưởng lớn đến hoạt động khoa học Nhiều tập san nhà khoa học xem nghiên cứu khoa học với trị số p cao 0,05 “kết tiêu cực” (“negative result”) báo bị từ chối cho cơng bố Chính mà đại đa số nhà khoa học, số “P < 0,05” trở thành “giấy thông hành” để công bố kết nghiên cứu Nếu kết với P < 0,05, báo có may xuất tập san tác giả tiếng; kết P > 0,05, số phận báo cơng trình nghiên cứu có may vào lãng quên! Nhưng cần phải nhấn mạnh lần để hiểu ý nghĩa trị số P sau: Mục đích trị số p nhằm trả lời câu hỏi: giả thuyết vô hiệu H0 đúng, xác suất mà liệu quan sát bao nhiêu? Nói cách khác, phương pháp chứng minh đảo ngược Do đó, diễn dịch trị số P phải có điều kiện Trị số P không cung cấp cho định lượng nói đến giả thuyết Trong suốt kỉ qua khoa học thực nghiệm dựa vào trị số p trường phái thống kê [có khi] gọi frequentist (trường phái tần số) để suy luận đến kết luận khoa học Cách suy luận cách làm việc chuẩn khoa học Thế logic đằng sau trị số p có nhiều vấn đề, kể phản trực giác (counterintuitive) khó hiểu, có phi logic Theo trường phái tần số, xác suất định nghĩa qua “thử nghiệm” (experiments) mà lí thuyết thử nghiệm lặp lặp lại nhiều lần đến vô tận, điều kiện giống độc lập với Nói “độc lập” có nghĩa thử nghiệm thứ hai khơng có liên quan đến thử nghiệm thứ hay thử nghiệm sau Ví dụ đồng xu quăng lần, “thử nghiệm”, đồng xu quăng liên tục triệu lần có nghĩa triệu thử nghiệm, thử nghiệm độc lập với Theo cách hiểu này, xác suất có nghĩa số lần kiện xảy vô số thử nghiệm đó, tần số diễn đạt qua số tỉ lệ hay phần trăm Nói cách khác, xác suất tần số tương đối (relative frequency) YKHOA.NET - Nghiên cứu khoa học – Nguyễn Văn Tuấn 19 Nói cho cùng, xác suất cảm nhận cá nhân, mức độ tin tưởng cá nhân kiện hay tượng Nói cách khác, xác suất phản ánh kinh nghiệm cá nhân, hay khả cá nhân tích lũy phân tích thơng tin từ nguồn ngoại Do đó, câu phát biểu “xác suất aspirin gây ung thư vú 0.33” phản ánh mức độ tin tưởng người phát biểu mối liên hệ aspirin ung thư vú Vì cảm nhận cá nhân, số cảm nhận khác cá nhân: ông A, 0,33 mức độ tin tưởng cịn thấp; chị B, 0.33 cao Vì cảm nhận cá nhân, số xác suất số khách quan cách hiểu trường phái tần số Theo trường phái tần số, “xác suất nữ thông minh nam 0,98” diễn dịch nhiều cách khác nhau: có nghĩa 100 cặp nam nữ chọn cách ngẫu nhiên, có 98 cặp mà số IQ nữ cao nam; có nghĩa nghiên cứu lặp lại 100 lần, lần với đối tượng khác nhau, có 98 nghiên cứu cho thấy số trung bình IQ phái nữ cao phái nam Tất nhiên, thực tế – khơng muốn nói chẳng – chịu khó lặp lại nghiên cứu 100 lần hay 1000 lần; đó, cách diễn dịch trường phái tần số phi thực tế Trong suy luận khoa học, nói khơng ngoa có suy luận dựa vào Định lí Bayes logic Tuy trị số p = P(D | H0) trị số P(H1 | D) hay P(H1 | S)đều xác suất, trị số p theo trường phái tần số cho biết nhiều tính xác nghiệm tốn thống kê, mức độ giả thuyết nghiên cứu Đối với nhà nghiên cứu có P(H1 | S) có ý nghĩa, bệnh nhân có P(K | +ve) có ý nghĩa Muốn ước tính mức độ giả thuyết nghiên cứu, cần phải ứng dụng Định lí Bayes phương pháp liên quan đến Định lí Bayes Qua viết mang tính giới thiệu này, tác giả hi vọng thuyết phục bạn đọc, nhà nghiên cứu thực nghiệm, nên tìm hiểu tiếp cận phương pháp thống kê thuộc trường phái Bayes, thịnh hành lĩnh vực y sinh học, vật lí học, tin học Hi vọng bạn đọc có dịp đóng góp vào phát triển phương pháp Bayes tương lai làm cho suy luận khoa học hồn hảo logic Chú thích tài liệu tham khảo: [1] Lyles KW, et al Zoledronic acid and clinical fractures and mortality after hip fracture N Engl J Med 2007 Nov 1;357(18):1799-809 [2] Wulff HR, Andersen B, Brandenhoff P, Guttler F What doctors know about statistics? Statistics in Medicine 1987; 6:3-10 [3] Karl Popper (28/07/1902- 17/09/1994), người Áo, Ông coi triết gia khoa học hàng đầu kỉ XX Tác phẩm đầu tiên, Logik der Forschung (The Logic of Reseach), xuất năm 1934, coi tác phẩm kinh điển phép phản nghiệm, trường phái phổ biến chủ nghĩa thực chứng logic (logical positivism), tiếp cận đến khoa học gọi “chủ nghĩa phản nghiệm” (falsificationism), mà sở dựa phép phê phán xác minh Từ mà ơng thỉnh giảng Anh quốc, mà sau trở thành quê hương thứ hai YKHOA.NET - Nghiên cứu khoa học – Nguyễn Văn Tuấn 20 ông Từ lí thuyết phản nghiệm ơng mà sau người ta phân định khác biệt giũa khoa học với nguỵ khoa học Ông nhận nhiều giải thưởng vinh dự Hiệp hội Khoa học Chính trị Mĩ, Viện Hàn lâm Anh v.v Ơng Nữ hoàng Elisabeth II phong tước hiệp sĩ năm 1965, Huân chương Danh dự năm 1982 Ngoài tác phẩm tiếng nêu ông công hiến cho khoa học giới nhiều tác phẩm vô giá triết lí khoa học [4] Để biết triết lí phản nghiệm nghiên cứu lâm sàng, đọc Senn SJ Falsificationism and clinical trials Stat Med 1991 Nov;10(11):1679-92 [6] Fisher RA On the interpretation of χ2 from contingency tables, and the calculation of P Journal of the Royal Statistical Society 1922; 85(1):87-94 [6] Fisher RA Statistical Methods for research workers Oliver and Boyd, 1954 [7] Neyman J, Pearson E On the Problem of the Most Efficient Tests of Statistical Hypotheses Philosophical Transactions of the Royal Society of London Series A, Containing Papers of a Mathematical or Physical Character 1933; 231: 289-337 [8] Xem thêm chi tiết tranh luận liên quan đến kiểm định ý nghĩa thống kê kiểm định giả thuyết sách The Significance Test Controversy, DE Morrison RE Henkel biên tập, Nhà xuất Aldine, Chicago: 1970 [9] Gigerenzer G, Swijtink Z, Porter T, Daston L, Beatty J, Kruger L The Empire of Chace: How Probability Changed Science and Everyday Life Cambridge University Press, 1989 [10] Barnard GA Must clinical trials be large? The interpretation of P-values and the combination of test results Stat Med 1990;9(6):601-14 [11] Barnard GA On alleged gains in power from lower P-values Stat Med 1989;8(12):1469-77 [12] Rumbold AR, Crowther CA, Haslam RR, Dekker GA, Robinson JS; ACTS Study Group Vitamins C and E and the risks of preeclampsia and perinatal complications N Engl J Med 2006;354(17):1796-806 [13] Thomas Bayes (1702 – 1761) linh mục sống Anh vào kỉ 18 Ngồi cơng việc giảng giáo lí, ơng cịn nhà tốn học có hạng Năm 1763 (tức sau ơng qua đời), người đồng nghiệp ông công bố công thức xác suất mà ngày biết đến Định lí Bayes (Bayesian theorem) ơng viết lúc cịn sống q cẩn thận nên ơng khơng cho xuất Định lí có ảnh hưởng to lớn nghiên cứu khoa học chẩn đốn y khoa, định lí gây nhiều tranh cãi gay gắt khoa học suốt kỉ qua (mà đề cập đến dịp khác) Để giải thích định lí ngắn gọn, có lẽ cần phải điểm qua vài thật xác suất có điều kiện (conditional probability) Để tiện theo dõi lí giải, tơi dùng kí hiệu H giả thuyết D kiện đế cập phần đầu viết Như biết, hai tượng H D độc lập, xác suất có điều kiện phát biểu rằng: P(D ∩ H) = P(D|H) x P(H) YKHOA.NET - Nghiên cứu khoa học – Nguyễn Văn Tuấn [A1] 21 Nói cách khác, P(D|H)= P(D∩H) / P(H), với điều kiện dĩ nhiên P(H) Đến bạn đọc thấy P(D|H)chính sai sót loại I mà tơi đề cập Hay nói cụ thể P(D|H)chính P(S|H0) sau nghiên cứu kiện phân tích kiểm định thống kê Nhưng vấn đề muốn ước tính P(H|D) Một vài xếp công thức [A1] đến định lí Bayes: P(H|D) = P(D|H) x P(H) / P(D) [A2] Ý nghĩa định lí Bayes muốn ước tính xác suất giả thuyết H sau quan sát kiện D, phải biết xác suất kiện hay P(D), quan trọng hết xác suất giả thuyết, tức P(H) Muốn tìm hiểu thêm lí thuyết ứng dụng thống kê theo trường phái Bayes (Bayesian Statistics) tham khảo sách mang tính nhập mơn sau đây: (1) sách lí thuyết: Peter M Lee, Bayesian Statistics, 2nd Edition, London: Arnold, 1997; (2) sách ứng dụng: Donald A Berry, Statistics: A Bayesian Perspective, Belmont: Duxbury Press, 1996; (3) hay sách cho nhà vật lí học: Giulio D’Agistini, Bayesian Reasoning in Data Analysis, World Scientific, 2003 [14] Jeffreys H The Theory of Probability (3e), Oxford (1961); trang 432 [15] Goodman SN Toward evidence-based medical statistics 2: The Bayes factor Ann Intern Med 1999;130 (12): 1005-13 [16] Sellke T, Bayarri MJ, Berger JO Calibration of p-values for testing precise null hypothesis The American Statistician 2001 [17] Berger JO, Sellke T Testing a point null hypothesis: the irreconcilability of P-values and evidence Journal of the American Statistical Association 1987; 82:112-20 YKHOA.NET - Nghiên cứu khoa học – Nguyễn Văn Tuấn 22

Ngày đăng: 13/10/2016, 21:47

TÀI LIỆU CÙNG NGƯỜI DÙNG

  • Đang cập nhật ...