Kiểm định giả thuyết thống kê ý nghĩa trÞ sè p (p-value) Giả thiết khoa học phản nghiệm Một giả thiết xem mang tính “khoa học” giả thiết có khả “phản nghiệm” Theo Karl Popper, nhà triết học khoa học, đặc điểm để phân biệt lí thuyết khoa học thực thụ với ngụy khoa học thuyết khoa học ln có đặc tính “bị bác bỏ” (hay bị phản bác) thực nghiệm đơn giản Ơng gọi “khả phản nghiệm” Phép phản nghiệm phương cách tiến hành thực nghiệm để xác minh mà để phê phán lí thuyết khoa học, coi tảng cho khoa học thực thụ Chẳng hạn giả thiết “Tất quạ màu đen” bị bác bỏ ta tìm có quạ màu đỏ Có thể xem qui trình phản nghiệm cách học hỏi từ sai lầm! Trong khoa học học hỏi từ sai lầm Khoa học phát triển phần lớn học hỏi từ sai lầm mà giới khoa học không chối cãi Sai lầm điểm mạnh khoa học Có thể xác định nghiên cứu khoa học qui trình thử nghiệm giả thuyết, theo bước sau đây: Bước 1, nhà nghiên cứu cần phải định nghĩa giả thuyết để kiểm định (gọi giả thuyết “không”, ký hiệu H0), tức giả thuyết ngược lại với mà nhà nghiên cứu tin thật Thí dụ nghiên cứu lâm sàng, gồm hai nhóm bệnh nhân: nhóm điều trị thuốc A, nhóm điều trị giả dược, nhà nghiên cứu phát biểu giả thuyết Khơng hiệu nghiệm thuốc A tương đương với hiệu nghiệm giả dược (có nghĩa thuốc A khơng có tác dụng mong muốn) Bước 2, nhà nghiên cứu cần phải định nghĩa giả thuyết đối (ký hiệu H 1), tức giả thuyết mà nhà nghiên cứu nghĩ thật, điều cần “chứng minh” kiện Chẳng hạn ví dụ đây, nhà nghiên cứu phát biểu giả thuyết đối thuốc A có hiệu nghiệm cao giả dược Bước 3, sau thu thập đầy đủ kiện liên quan, nhà nghiên cứu dùng hay nhiều phương pháp thống kê để kiểm tra xem hai giả thuyết trên, giả thuyết xem Cách kiểm tra tiến hành để trả lời câu hỏi: giả thuyết Khơng đúng, xác suất mà kiện thu thập phù hợp với giả thuyết Không Giá trị xác suất thường đề cập báo cáo khoa học kí hiệu “P value” Trị số P số xác suất, tức viết tắt chữ “probability value” Chúng ta thường gặp phát biểu kèm theo số, chẳng hạn “Kết phân tích cho thấy tỉ lệ gãy xương nhóm bệnh nhân điều trị thuốc Alendronate 2%, thấp tỉ lệ nhóm bệnh nhân khơng chữa trị (5%), mức độ khác biệt có ý nghĩa thống kê (p = 0,01)” Bước 4, định chấp nhận hay loại bỏ giả thuyết Không, cách dựa vào giá trị xác suất bước thứ ba Chẳng hạn theo truyền thống lựa chọn nghiên cứu y học, giá trị xác suất nhỏ 5% nhà nghiên cứu sẵn sàng bác bỏ giả thuyết Không: hiệu nghiệm thuốc A khác với hiệu nghiệm giả dược Tuy nhiên, giá trị xác suất cao 5%, nhà nghiên cứu phát biểu chưa có chứng đầy đủ để bác bỏ giả thuyết Không, điều nghĩa giả thuyết Khơng đúng, thật Nói cách khác, thiếu chứng khơng có nghĩa khơng có chứng Bước 5, giả thuyết Khơng bị bác bỏ, nhà nghiên cứu thừa nhận giả thuyết đối Nhưng vấn đề khởi từ đây, có nhiều giả thuyết đối khác Chẳng hạn so sánh với giả thuyết đối ban đầu (A khác với Giả dược), nhà nghiên cứu đặt nhiều giả thuyết đối khác hiệu nghiệm thuốc A cao Giả dược 5%, 10% hay nói chung X% Nói tóm lại, nhà nghiên cứu bác bỏ giả thuyết Khơng, giả thuyết đối cơng nhận, nhà nghiên cứu xác định giả thuyết đối với thật Ý nghĩa trị số P qua mô Để hiểu ý nghĩa thực tế trị số P, xem ví dụ đơn giản sau: Một thí nghiệm tiến hành để tìm hiểu sở thích người tiêu thụ hai loại cà phê (hãy tạm gọi cà phê A B) Các nhà nghiên cứu cho 50 khách hàng uống thử hai loại cà phê điều kiện, hỏi họ thích loại cà phê Kết cho thấy 35 người thích cà phê A, 15 người thích cà phê B Vấn để đặt qua kết này, nhà nghiên cứu kết luận cà phê loại A ưa chuộng cà phê B, hay kết ngẫu nhiên mà ra? “Do ngẫu nhiên mà ra” có nghĩa theo luật nhị phân, khả mà kết xảy bao nhiêu? Do đó, lí thuyết xác suất nhị phân có phần ứng dụng trường hợp này, kết nghiên cứu có hai “giá trị” (hoặc thích A, thích B) Nói theo ngơn ngữ phản nghiệm, giả thiết đảo khơng có khác biệt sở thích, xác suất mà khách hàng ưa chuộng loại cà phê 0.5 Nếu giả thiết (tức p = 0,5, p xác suất thích cà phê A), nghiên cứu lặp lặp lại (chẳng hạn như) 1000 lần, lần 50 khách hàng, có lần với 35 khách hàng ưa chuộng cà phê A? Gọi số lần nghiên cứu mà 35 (hay nhiều hơn) số 50 thích cà phê A “biến cố” X, nói theo ngơn ngữ xác suất, muốn tìm P(X | p=0,50) =? Để trả lời câu hỏi này, ứng dụng hàm rbinom để mơ nói thực chất vấn đề phân phối nhị phân: > bin table(bin) Bin 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 1 11 16 24 47 60 83 94 107 132 114 98 65 44 44 26 14 12 Qua kết trên, thấy số 1000 “nghiên cứu” đó, có nghiên cứu mà số khách hàng thích cà phê A 35 người (với điều kiện khơng có khác biệt hai loại cà phê, hay nói p =0,5) Nói cách khác: P(X ≥ 35 | p=0,50) = 3/1000 = 0,003 Chúng ta thể tần số biểu đồ tần số sau: Tất nhiên làm mơ khác với số lần tái thí nghiệm 100.000 lần (thay 1000 lần) tính xác suất P(X ≥ 35 | p=0,50) bin bin table(bin) bin 11 12 17 13 40 14 83 15 197 16 462 17 946 18 159 19 271 20 409 21 589 22 793 23 973 24 108 22 25 111 91 26 107 99 27 949 28 792 29 590 30 418 31 268 32 156 33 893 34 455 35 223 36 98 37 31 38 39 40 Lần này, có nhiều khả (vì số lần mơ tăng lên) Chẳng hạn có nghiên cứu cho 11 khách hàng (tối thiểu) hay 40 khách hàng (tối đa) thích cà phê A Nhưng muốn biết số lần nghiên cứu mà 35 khách hàng trở lên thích cà phê A, kết cho biết, xác suất là: > (223+98+21+5+7+1)/100000 [1] 0.00355 Nói cách khác, xác suất P(X ≥ 35 | p=0,50) thấp (chỉ 0,3%), có chứng kết khơng yếu tố ngẫu nhiên gây nên; tức có khác biệt sở thích khách hàng hai loại cà phê Con số P = 0,0035 trị số P Theo qui ước khoa học, tất trị số P thấp 0,05 (tức thấp 5%) xem “có ý nghĩa thống kê” Cần phải nhấn mạnh lần để hiểu ý nghĩa trị số P sau: Mục đích phân tích nhằm trả lời câu hỏi: hai loại cà phê có xác suất ưa chuộng (p=0,5, giả thuyết Khơng), xác suất mà kết (35 số 50 khách hàng thích A) xảy bao nhiêu? Nói cách khác, phương pháp tìm trị số P Do đó, diễn dịch trị số P phải có điều kiện, điều kiện p=0,50 bạn đọc làm thí nghiệm thêm với p=0,6 hay p=0,7 để thấy kết khác Trong thực tế, trị số P có ảnh hưởng lớn đến số phận báo khoa học Nhiều tập san nhà khoa học xem nghiên cứu khoa học với trị số P cao 0.05 “kết tiêu cực” báo bị từ chối cho cơng bố Chính mà đại đa số nhà khoa học, số “P < 0,05” trở thành “giấy thông hành” để công bố kết nghiên cứu Nếu kết với P < 0,05, báo có may xuất tập san tác giả tiếng; kết P > 0,05, số phận báo cơng trình nghiên cứu có may vào lãng quên! Vấn đề logic trị số P Nhưng đứng phương diện lí trí khoa học nghiêm chỉnh, có nên đặt tầm quan trọng vào trị số P hay không? Theo tôi, câu trả lời khơng Trị số P có nhiều vấn đề, việc phụ thuộc vào khứ (cũng nay) bị nhiều người phê phán gay gắt Cái khiếm khuyết số trị số P thiếu tính logic Thật vậy, chịu khó xem xét lại ví dụ trên, khái quát tiến trình nghiên cứu y học (dựa vào trị số P) sau: • Đề giả thuyết đối (H1) • Từ giả thuyết chính, đề giả thuyết Khơng (H0) • Tiến hành thu thập kiện (D) • Phân tích kiện: tính tốn xác suất D xảy H0 thật Nói theo ngơn ngữ tốn xác suất, bước xác định P(D | H0) Vì thế, số P có nghĩa xác suất kiện D xảy (nhấn mạnh: “nếu”) giả thuyết Không H0 thật Như vậy, số P không trực tiếp cho ý niệm thật giả thuyết H 0; gián tiếp cung cấp chứng để chấp nhận giả thuyết bác bỏ giả thuyết Khơng Cái logic đằng sau trị số P hiểu tiến trình chứng minh đảo ngược: • Mệnh đề 1: Nếu giả thuyết Khơng thật, kiện khơng thể xảy ra; • Mệnh đề 2: Dữ kiện xảy ra; • Mệnh đề (kết luận): Giả thuyết Không thật Nếu bạn đọc cảm thấy khó hiểu cách lập luận trên, tơi xin lấy thêm ví dụ y khoa để minh họa cho tiến trình này: • Nếu ơng Tuấn bị cao huyết áp, ơng khơng thể có triệu chứng rụng tóc (hai tượng sinh học khơng liên quan với nhau, theo kiến thức y khoa nay); • Ơng Tuấn bị rụng tóc; • Do đó, ơng Tuấn khơng thể bị cao huyết áp Trị số P, đó, gián tiếp phản ánh xác suất mệnh đề Và khiếm khuyết quan trọng trị số P, số P ước tính mức độ kiện, khơng nói cho biết mức độ giả thuyết Điều làm cho việc suy luận dựa vào trị số P xa rời với thực tế, xa rời với khoa học thực nghiệm Trong khoa học thực nghiệm, điều mà nhà nghiên cứu muốn biết với kiện mà họ có được, xác suất giả thuyết bao nhiêu, họ không muốn biết giả thuyết Không thật xác suất kiện Nói cách khác dùng kí hiệu mơ tả trên, nhà nghiên cứu muốn biết P(H+ | D), không muốn biết P(D | H+) hay P(D | H-) Vấn đề kiểm định nhiều giả thuyết Như nói trên, nghiên cứu y học qui trình thử nghiệm giả thuyết Trong nghiên cứu, thử nghiệm giả thuyết nhất, mà nhiều giả thuyết lược Chẳng hạn nghiên cứu mối liên hệ vitamin D nguy gãy xương đùi, nhà nghiên cứu phân tích mối liên hệ tương quan vitamin D mật độ xương, vitamin D nguy gãy xương theo giới tính, nhóm tuổi, hay phân tích theo đặc tính lâm sàng bệnh nhân, v.v… (Xem ví dụ đây) Mỗi phân tích xem thử nghiệm giả thuyết Ở đây, phải đối diện với vấn đề nhiều giả thuyết Bảng Phân tích hiệu vitamin D Calcium theo đặc tính bệnh nhân Nhóm điều trị calcium vitamin D Nhóm giả dược Độ tuổi 50-59 60-69 70-79 29 (0,06) 53 (0,09) 93 (0,44) 13 (0,03) 71 (0,13) 115 (0,54) 2,17 (1,13-4,18) 0,74 (0,52-1,06) 0,82 (0,62-1,08) Chỉ số BMI 30 69 (0,20) 63 (0,14) 43 (0,09) 66 (0,19) 74 (0,16) 59 (0,13) 1,05 (0,75-1,47) 0,87 (0,62-1,22) 0,73 (0,49-1,09) Hút thuốc Không hút thuốc Hiện hút thuốc 159 (0,14) 14 (0,14) 178 (0,15) 16 (0,17) 0,90 (0,71-1,11) 0,85 (0,41-1,74) Đặc tính bệnh nhân Tỉ số nguy (tương đối) khoảng tin cậy 95% Chú thích: số ngồi ngoặc số bệnh nhân bị gãy xương đùi thời gian theo dõi (7 năm) số ngoặc tỉ lệ gãy xương tính phần trăm năm Tỉ số nguy tương đối ước tính cách lấy tỉ lệ gãy xương nhóm can thiệp chia cho tỉ lệ nhóm giả dược; khoảng tin cậy 95% bao gồm mức độ khác biệt nhóm khơng có ý nghĩa thống kê; khoảng tin cậy 95% khơng bao gồm mức độ khác biệt nhóm xem có ý nghĩa thống kê (hay p 0,05 lại phát có ý nghĩa Vấn đề... p Trị số P, đó, gián ti p phản ánh xác suất mệnh đề Và khiếm khuyết quan trọng trị số P, số P ước tính mức độ kiện, khơng nói cho biết mức độ giả thuyết Điều làm cho việc suy luận dựa vào trị