P value, các ngộ nhận và bản chất vấn đề. Phân tích thống kê là một khâu quan trọng không thể thiếu được trong các công trình nghiên cứu khoa học, nhất là khoa học thực nghiệm. Một công trình nghiên cứu khoa học, cho dù có tốn kém và quan trọng cỡ nào, nếu không được phân tích đúng phương pháp sẽ không bao giờ có cơ hội được xuất hiện trong các tập san khoa học. Ngày nay, chỉ cần nhìn qua tất cả các tập san nghiên cứu khoa học trên thế giới, hầu như bất cứ bài báo y học nào cũng có phần “Statistical Analysis” (Phân tích thống kê), nơi mà tác giả phải mô tả cẩn thận phương pháp phân tích, tính toán như thế nào, và giải thích ngắn gọn tại sao sử dụng những phương pháp đó để hàm ý “bảo kê” hay tăng trọng lượng khoa học cho những phát biểu trong bài báo. Các tạp san y học có uy tín càng cao yêu cầu về phân tích thống kê càng nặng. Không có phần phân tích thống kê, bài báo không có ý nghĩa khoa học. Trong các bài báo khoa học, ngoài những dữ kiện bằng số, biểu đồ và hình ảnh, con số mà chúng ta thường hay gặp nhất là trị số P (mà tiếng Anh gọi là Pvalue). Trị số P là một con số xác suất, tức là viết tắt chữ “probability value”. Chúng ta thường gặp những phát biểu được kèm theo con số, chẳng hạn như “Kết quả phân tích cho thấy tỉ lệ gãy xương trong nhóm bệnh nhân được điều trị bằng thuốc Alendronate là 2%, thấp hơn tỉ lệ trong nhóm bệnh nhân không được chữa trị (5%), và mức độ khác biệt này có ý nghĩa thống kê (p = 0.01)”, hay một phát biểu như “Sau 3 tháng điều trị, mức độ giảm áp suất máu trong nhóm bệnh nhân là 10% (p < 0.05)”. Trong văn cảnh trên đây, đại đa số nhà khoa học hiểu rằng trị số P phản ánh xác suất sự hiệu nghiệm của thuốc Alendronate hay một thuật điều trị, họ hiểu rằng câu văn trên có nghĩa là “xác suất mà thuốc alendronate tốt hơn giả dược là 0.99” (lấy 1 trừ cho 0.01). Nhưng cách hiểu đó hoàn toàn sai Rất nhiều người, không chỉ người đọc mà ngay cả chính các tác giả của những bài báo khoa học, giáo sư đại học, không hiểu ý nghĩa của trị số P. Theo một nghiên cứu được công bố trên tập san danh tiếng Statistics in Medicine 1, tác giả cho biết 85% các tác giả khoa học và bác sĩ nghiên cứu không hiểu hay hiểu sai ý nghĩa của trị số P. Đọc đến đây có lẽ bạn đọc rất ngạc nhiên, bởi vì điều này có nghĩa là nhiều nhà nghiên cứu khoa học có khi không hiểu hay hiểu sai những gì chính họ viết ra có nghĩa gì Thế thì, câu hỏi cần đặt ra một cách nghiêm chỉnh: Ý nghĩa của trị số P là gì?
http://www.ykhoa.net Ý nghĩa trị số P (P-value) nghiên cứu khoa học Nguyễn Văn Tuấn Phân tích thống kê khâu quan trọng thiếu công trình nghiên cứu khoa học, khoa học thực nghiệm Một công trình nghiên cứu khoa học, cho dù có tốn quan trọng cỡ nào, không phân tích phương pháp hội xuất tập san khoa học Ngày nay, cần nhìn qua tất tập san nghiên cứu khoa học giới, báo y học có phần “Statistical Analysis” (Phân tích thống kê), nơi mà tác giả phải mô tả cẩn thận phương pháp phân tích, tính toán nào, giải thích ngắn gọn sử dụng phương pháp để hàm ý “bảo kê” hay tăng trọng lượng khoa học cho phát biểu báo Các tạp san y học có uy tín cao yêu cầu phân tích thống kê nặng Không có phần phân tích thống kê, báo ý nghĩa khoa học Trong báo khoa học, kiện số, biểu đồ hình ảnh, số mà thường hay gặp trị số P (mà tiếng Anh gọi P-value) Trị số P số xác suất, tức viết tắt chữ “probability value” Chúng ta thường gặp phát biểu kèm theo số, chẳng hạn “Kết phân tích cho thấy tỉ lệ gãy xương nhóm bệnh nhân điều trị thuốc Alendronate 2%, thấp tỉ lệ nhóm bệnh nhân không chữa trị (5%), mức độ khác biệt có ý nghĩa thống kê (p = 0.01)”, hay phát biểu “Sau tháng điều trị, mức độ giảm áp suất máu nhóm bệnh nhân 10% (p < 0.05)” Trong văn cảnh đây, đại đa số nhà khoa học hiểu trị số P phản ánh xác suất hiệu nghiệm thuốc Alendronate hay thuật điều trị, họ hiểu câu văn có nghĩa “xác suất mà thuốc alendronate tốt giả dược 0.99” (lấy trừ cho 0.01) Nhưng cách hiểu hoàn toàn sai! Rất nhiều người, không người đọc mà tác giả báo khoa học, giáo sư đại học, không hiểu ý nghĩa trị số P Theo nghiên cứu công bố tập san danh tiếng Statistics in Medicine [1], tác giả cho biết 85% tác giả khoa học bác sĩ nghiên cứu không hiểu hay hiểu sai ý nghĩa trị số P Đọc đến có lẽ bạn đọc ngạc nhiên, điều có nghĩa nhiều nhà nghiên cứu khoa học có không hiểu hay hiểu sai họ viết có nghĩa gì! Thế thì, câu hỏi cần đặt cách nghiêm chỉnh: Ý nghĩa trị số P gì? Để trả lời cho câu hỏi này, cần phài xem xét qua tiến trình công trình nghiên cứu khoa học thực nghiệm Một nghiên cứu khoa học, biết, phải bắt đầu giả thuyết Hãy lấy ví dụ nghiên cứu so sánh số thông minh (IQ) phái nam nữ Giả thuyết đề sinh viên nữ thông minh sinh viên nam Giả thuyết này, phát biểu theo ngôn ngữ thực nghiệm, số IQ nữ giới cao số IQ nam giới Nhưng tiện việc tính toán phân tích sau này, giả thuyết đảo (null hypothesis, hay gọi tắt Ho) phát biểu số IQ phái nữ với số IQ phái nam Để “chứng minh” giả thuyết trên, nhà nghiên cứu đo tất sinh viên nam nữ tất trường đại học nước tính toán xem số IQ phái có cao hay với số IQ phái nam Trong trường hợp này, nhà nghiên cứu không cần đến phân tích thống kê, không cần đến trị số P Nhưng việc làm không thực tế, mà không cần thiết, nhà nghiên cứu chọn số đối tượng, thu thập thông tin, dùng thuật toán thống kê để suy luận cho toàn quần thể sinh viên Giả dụ nhà nghiên cứu định chọn hai nhóm sinh viên đại học (100 sinh viên nam 100 sinh viên nữ) có độ tuổi có hoàn cảnh gia đình, họ chọn cách ngẫu nhiên từ nhiều trường đại học khác Bước nhà nghiên cứu sử dụng phương pháp đo lường khách quan để “đo” số IQ sinh viên nhóm 200 người Giả dụ sau đo xong kết tóm lược sau: Số lượng sinh viên (n) Chỉ số IQ trung bình (mean) Độ lệch chuẩn (standard deviation) Phái nam 100 130 20 Phái nữ 100 140 22 Đến đây, câu hỏi cụ thể đặt số liệu có đủ chứng để kết luận sinh viên nữ thông minh sinh viên nam? Nói cách khác, nhà nghiên cứu phải dựa vào kết thu thập nhóm đối tượng để suy luận cho quần thể sinh viên nước Câu hỏi hoàn toàn có lí nó, nên nhớ kiện nhóm người chọn ngẫu nhiên từ quần thể, chất ngẫu nhiên chọn đối tượng, nghiên cứu khác chọn 200 đối tượng kết khác đi, chí ngược lại với kết Vì thế, nhà nghiên cứu phải thận trọng việc suy luận từ nhóm đối tượng cho quần thể cho xác suất sai lầm tối thiểu Để trả lời câu hỏi trên, nhà nghiên cứu sử dụng phương pháp phân tích khách quan có tên t-test (mà tạm dịch nghiệm toán t) Mục đích nghiệm toán t nhằm trả lời câu hỏi: sinh viên nam nữ có số IQ giống (giả thuyết đảo), xác suất mà kết xảy bao nhiêu? Nói cách khác, phương pháp tìm trị số P Sau vài phép tính, câu trả lời P = 0.0009, tức 0.09% [2] Theo thông lệ, trị số P thấp 0.05 (hay 5%) nhà nghiên cứu có chứng để bác bỏ giả thuyết đảo Bác bỏ giả thuyết đảo có nghĩa gián tiếp chấp nhận giả thuyết chính, tức nữ sinh viên thật thông minh nam sinh viên Trong thực tế, trị số P có ảnh hưởng lớn đến số phận báo khoa học Nhiều tập san nhà khoa học xem nghiên cứu khoa học với trị số P cao 0.05 “kết tiêu cực” (“negative result”) báo bị từ chối cho công bố Chính mà đại đa số nhà khoa học, số “P < 0.05” trở thành “giấy thông hành” để công bố kết nghiên cứu Nếu kết với P < 0.05, báo có may xuất tập san tác giả tiếng; kết P > 0.05, số phận báo công trình nghiên cứu có may vào lãng quên! Nhưng đứng phương diện lí trí khoa học nghiêm chỉnh, có nên đặt tầm quan trọng vào trị số P hay không? Theo tôi, câu trả lời không Trị số P có nhiều vấn đề, việc phụ thuộc vào khứ (cũng nay) bị nhiều người phê phán gay gắt Cái khiếm khuyết số trị số P thiếu tính logic Thật vậy, chịu khó xem xét lại ví dụ trên, khái quát tiến trình nghiên cứu khoa học (dựa vào trị số P) sau: • • • • Đề giả thuyết (H) Từ giả thuyết chính, đề giả thuyết đảo (Ho) Tiến hành thu thập kiện (D) Phân tích kiện: tính toán xác suất D xảy Ho thật Nói theo ngôn ngữ toán xác suất, bước xác định P(D | Ho) Vì thế, số P có nghĩa xác suất kiện D xảy (nhấn mạnh: “nếu”) giả thuyết đảo Ho thật Như vậy, số P không trực tiếp cho ý niệm thật giả thuyết H; gián tiếp cung cấp chứng để chấp nhận giả thuyết bác bỏ giả thuyết đảo Cái logic đằng sau trị số P hiểu tiến trình chứng minh đảo ngược (proof by contradiction): • • • Mệnh đề 1: Nếu giả thuyết đảo thật, kiện xảy ra; Mệnh đề 2: Dữ kiện xảy ra; Mệnh đề (kết luận): Giả thuyết đảo thật Nếu bạn đọc cảm thấy khó hiểu cách lập luận trên, xin lấy thêm ví dụ y khoa để minh họa cho tiến trình này: • • • Nếu ông Tuấn bị cao huyết áp, ông có triệu chứng rụng tóc (hai tượng sinh học không liên quan với nhau, theo kiến thức y khoa nay); Ông Tuấn bị rụng tóc; Do đó, ông Tuấn bị cao huyết áp Trị số P, đó, gián tiếp phản ánh xác suất mệnh đề Và khiếm khuyết quan trọng trị số P, số P ước tính mức độ kiện, không nói cho biết mức độ giả thuyết Điều làm cho việc suy luận dựa vào trị số P xa rời với thực tế, xa rời với khoa học thực nghiệm Trong khoa học thực nghiệm, điều mà nhà nghiên cứu muốn biết với kiện mà họ có được, xác suất giả thuyết bao nhiêu, họ không muốn biết giả thuyết đảo thật xác suất kiện Nói cách khác dùng kí hiệu mô tả trên, nhà nghiên cứu muốn biết P(H | D), không muốn biết P(D | H) hay P(D | Ho) Trị số P, dù thông dụng nghiên cứu khoa học, phán xét cuối công trình nghiên cứu hay giả thuyết Chúng ta không nên phụ thuộc vào số Vấn đề quan trọng để ước tính mức độ giả thuyết có kiện thật tay, P(H | D) Trong kế tiếp, bàn phương pháp tính P(H | D) Chú thích: [1] Wulff HR, Andersen B, Brandenhoff P, Guttler F What doctors know about statistics? Statistics in Medicine 1987; 6:3-10 [2] Nghiệm toán t mô tả sau Trước hết, mức độ khác biệt trung bình hai nhóm nam nữ d = 140 – 130 = 10 điểm Phương sai (variance) d tổng phương sai nhóm nam nhóm nữ: var(d) = var(nam) + var(nữ) = 20^2 + 22^2 = 884 Do đó, độ lệch chuẩn (standard deviation) d là: SD(d) = 884 = 29,73 điểm Từ đó, nghiệm toán t là: t = 10 / (29.73/ 100 ) = 3,36 Trị số P t=3,36 0.0009 Các phép tính tiến hành trực tuyến website http://graphpad.com/quickcalcs/ttest1.cfm