XÁC SUẤT THỐNG KÊ Chuong 07 kiem dinh gia thiet va tri so p

9 2 0
XÁC SUẤT THỐNG KÊ Chuong 07   kiem dinh gia thiet va tri so p

Đang tải... (xem toàn văn)

Thông tin tài liệu

Microsoft Word Chuong 07 Kiem dinh gia thiet va tri so P doc 1 7 Kiểm định giả thiết thống kê và ý nghĩa của trị số P (P value) 7 1 Trị số P Trong nghiên cứu khoa học, ngoài những dữ kiện bằng số, biể[.]

7 Kiểm định giả thiết thống kê ý nghĩa trị số P (P-value) 7.1 Trị số P Trong nghiên cứu khoa học, kiện số, biểu đồ hình ảnh, số mà thường hay gặp trị số P (mà tiếng Anh gọi P-value) Trong chương sau đây, bạn đọc gặp trị số P nhiều lần, đại đa số suy luận phân tích thống kê, suy luận khoa học dựa vào trị số P Do đó, trước bàn đến phương pháp phân tích thống kê R, tơi thấy cần phải có đôi lời ý nghĩa trị số Trị số P số xác suất, tức viết tắt chữ “probability value” Chúng ta thường gặp phát biểu kèm theo số, chẳng hạn “Kết phân tích cho thấy tỉ lệ gãy xương nhóm bệnh nhân điều trị thuốc Alendronate 2%, thấp tỉ lệ nhóm bệnh nhân không chữa trị (5%), mức độ khác biệt có ý nghĩa thống kê (p = 0.01)”, hay phát biểu “Sau tháng điều trị, mức độ giảm áp suất máu nhóm bệnh nhân 10% (p < 0.05)” Trong văn cảnh đây, đại đa số nhà khoa học hiểu trị số P phản ánh xác suất hiệu nghiệm thuốc Alendronate hay thuật điều trị, họ hiểu câu văn có nghĩa “xác suất mà thuốc Alendronate tốt giả dược 0.99” (lấy trừ cho 0.01) Nhưng cách hiểu hồn tồn sai! Trong “Từ điển toán kinh tế thống kê, kinh tế lượng Anh – Việt” (Nhà xuất Khoa học Kĩ thuật, 2004), tác giả định nghĩa trị số P sau: “P – giá trị (hoặc giá trị xác suất) P giá trị mức ý nghĩa thống kê thấp mà giá trị quan sát thống kê kiểm định có ý nghĩa” (trang 690) Định nghĩa thật khó hiểu! Thật định nghĩa chung mà sách khoa Tây phương thường hay viết Lật sách giáo khoa tiếng Anh, thấy định nghĩa trị số P na ná giống “Trị số P xác suất mà mức độ khác biệt quan sát yếu tố ngẫu nhiên gây (P value is the probability that the observed difference arose by chance)” Thật định nghĩa chưa đầy đủ, không muốn nói … sai Chính mù mờ định nghĩa nhiều nhà khoa học hiểu sai ý nghĩa trị số P Thật vậy, nhiều người, không người đọc mà tác giả báo khoa học, không hiểu ý nghĩa trị số P Theo nghiên cứu công bố tập san danh tiếng Statistics in Medicine [1], tác giả cho biết 85% tác giả khoa học bác sĩ nghiên cứu không hiểu hay hiểu sai ý nghĩa trị số P Đọc đến có lẽ bạn đọc ngạc nhiên, điều có nghĩa nhiều nhà nghiên cứu khoa học có khơng hiểu hay hiểu sai họ viết có nghĩa gì! Thế thì, câu hỏi cần đặt cách nghiêm chỉnh: Ý nghĩa trị số P gì? Để trả lời cho câu hỏi này, cần phải xem xét qua khái niệm phản nghiệm tiến trình nghiên cứu khoa học 7.2 Giả thiết khoa học phản nghiệm Một giả thiết xem mang tính “khoa học” giả thiết có khả “phản nghiệm” TheoKarl Popper, nhà triết học khoa học, đặc điểm để phân biệt lí thuyết khoa học thực thụ với ngụy khoa học (pseudoscience) thuyết khoa học ln có đặc tính “ bị bác bỏ” (hay bị phản bác – falsified) thực nghiệm đơn giản Ông gọi “khả phản nghiệm” (falsifiability, có tài liệu ghi falsibility) Phép phản nghiệm phương cách tiến hành thực nghiệm để xác minh mà để phê phán lí thuyết khoa học, coi tảng cho khoa học thực thụ Chẳng hạn giả thiết “Tất quạ màu đen” bị bác bỏ ta tìm có quạ màu đỏ Có thể xem qui trình phản nghiệm cách học hỏi từ sai lầm! Thật vậy, khoa học học hỏi từ sai lầm Khoa học phát triển phần lớn học hỏi từ sai lầm mà giới khoa học không chối cãi Sai lầm điểm mạnh khoa học Có thể xác định nghiên cứu khoa học qui trình thử nghiệm giả thuyết, theo bước sau đây: Bước 1, nhà nghiên cứu cần phải định nghĩa giả thuyết đảo (null hypothesis), tức giả thuyết ngược lại với mà nhà nghiên cứu tin thật Thí dụ nghiên cứu lâm sàng, gồm hai nhóm bệnh nhân: nhóm điều trị thuốc A, nhóm điều trị placebo, nhà nghiên cứu phát biểu giả thuyết đảo hiệu nghiệm thuốc A tương đương với hiệu nghiệm placebo (có nghĩa thuốc A khơng có tác dụng mong muốn) Bước 2, nhà nghiên cứu cần phải định nghĩa giả thuyết phụ (alternative hypothesis), tức giả thuyết mà nhà nghiên cứu nghĩ thật, điều cần “chứng minh” kiện Chẳng hạn ví dụ đây, nhà nghiên cứu phát biểu giả thuyết phụ thuốc A có hiệu nghiệm cao placebo Bước 3, sau thu thập đầy đủ kiện liên quan, nhà nghiên cứu dùng hay nhiều phương pháp thống kê để kiểm tra xem hai giả thuyết trên, giả thuyết xem Cách kiểm tra tiến hành để trả lời câu hỏi: giả thuyết đảo đúng, xác suất mà kiện thu thập phù hợp với giả thuyết đảo Giá trị xác suất thường đề cập đến báo cáo khoa học kí hiệu “P value” Điều cần ý nhà nghiên cứu không thử nghiệm giả thuyết khác, mà thử nghiệm giả thuyết đảo mà Bước 4, định chấp nhận hay loại bỏ giả thuyết đảo, cách dựa vào giá trị xác suất bước thứ ba Chẳng hạn theo truyền thống lựa chọn nghiên cứu y học, giá trị xác suất nhỏ 5% nhà nghiên cứu sẵn sàng bác bỏ giả thuyết đảo: hiệu nghiệm thuốc A khác với hiệu nghiệm placebo Tuy nhiên, giá trị xác suất cao 5%, nhà nghiên cứu phát biểu chưa có chứng đầy đủ để bác bỏ giả thuyết đảo, điều khơng có nghĩa giả thuyết đảo đúng, thật Nói cách khác, thiếu chứng khơng có nghĩa khơng có chứng Bước 5, giả thuyết đảo bị bác bỏ, nhà nghiên cứu thừa nhận giả thuyết phụ Nhưng vấn đề khởi từ đây, có nhiều giả thuyết phụ khác Chẳng hạn so sánh với giả thuyết phụ ban đầu (A khác với Placebo), nhà nghiên cứu đặt nhiều giả thuyết phụ khác thuốc hiệu nghiệm thuốc A cao Placebo 5%, 10% hay nói chung X% Nói tóm lại, nhà nghiên cứu bác bỏ giả thuyết đảo, giả thuyết phụ công nhận, nhà nghiên cứu xác định giả thuyết phụ với thật 7.3 Ý nghĩa trị số P qua mô Để hiểu ý nghĩa thực tế trị số P, tơi nêu ví dụ đơn giản sau: Ví dụ Một thí nghiệm tiến hành để tìm hiểu sở thích người tiêu thụ hai loại cà phê (hãy tạm gọi cà phê A B) Các nhà nghiên cứu cho 50 khách hàng uống thử hai loại cà phê điều kiện, hỏi họ thích loại cà phê Kết cho thấy 35 người thích cà phê A, 15 người thích cà phê B Vấn để đặt qua kết này, nhà nghiên cứu kết luận cà phê loại A ưa chuộng cà phê B, hay kết ngẫu nhiên mà ra? “Do ngẫu nhiên mà ra” có nghĩa theo luật nhị phân, khả mà kết xảy bao nhiêu? Do đó, lí thuyết xác suất nhị phân có phần ứng dụng trường hợp này, kết nghiên cứu có hai “giá trị” (hoặc thích A, thích B) Nói theo ngơn ngữ phản nghiệm, giả thiết đảo khơng có khác biệt sở thích, xác suất mà khách hàng ưa chuộng loại cà phê 0.5 Nếu giả thiết (tức p = 0.5, p xác suất thích cà phê A), nghiên cứu lặp lặp lại (chẳng hạn như) 1000 lần, lần 50 khách hàng, có lần với 35 khách hàng ưa chuộng cà phê A? Gọi số lần nghiên cứu mà 35 (hay nhiều hơn) số 50 thích cà phê A “biến cố” X, nói theo ngơn ngữ xác suất, muốn tìm P(X | p=0.50) =? Để trả lời câu hỏi này, ứng dụng hàm rbinom để mơ nói thực chất vấn đề phân phối nhị phân: > bin table(bin) bin 14 15 34 35 16 17 11 18 16 19 24 20 47 21 60 22 83 23 24 25 26 94 107 132 114 27 98 28 65 29 44 30 44 31 26 32 14 33 12 Qua kết trên, thấy số 1000 “nghiên cứu” đó, có nghiên cứu mà số khách hàng thích cà phê A 35 người (với điều kiện khơng có khác biệt hai loại cà phê, hay nói p =0.5) Nói cách khác: P(X ≥ 35 | p=0.50) = 3/1000 = 0.003 Chúng ta thể tần số biểu đồ tần số sau: Frequency 50 100 150 200 250 Histogram of bin 15 20 25 30 35 bin Tất nhiên làm mơ khác với số lần tái thí nghiệm 100.000 lần (thay 1000 lần) tính xác suất P(X ≥ 35 | p=0.50) bin bin table(bin) bin 11 13 40 14 83 15 197 16 462 17 946 18 1592 19 2719 20 4098 21 5892 22 7937 23 9733 24 25 26 10822 11191 10799 27 9497 28 7925 29 5904 30 4185 31 2682 32 1562 33 893 34 455 35 223 36 98 37 31 12 17 38 39 40 Lần này, có nhiều khả (vì số lần mơ tăng lên) Chẳng hạn có nghiên cứu cho 11 khách hàng (tối thiểu) hay 40 khách hàng (tối đa) thích cà phê A Nhưng muốn biết số lần nghiên cứu mà 35 khách hàng trở lên thích cà phê A, kết cho biết, xác suất là: > (223+98+21+5+7+1)/100000 [1] 0.00355 Nói cách khác, xác suất P(X ≥ 35 | p=0.50) thấp (chỉ 0.3%), có chứng kết không yếu tố ngẫu nhiên gây nên; tức có khác biệt sở thích khách hàng hai loại cà phê Con số P = 0.0035 trị số P Theo qui ước khoa học, tất trị số P thấp 0.05 (tức thấp 5%) xem “significant”, tức “có ý nghĩa thống kê” Cần phải nhấn mạnh lần để hiểu ý nghĩa trị số P sau: Mục đích phân tích nhằm trả lời câu hỏi: hai loại cà phê có xác suất ưa chuộng (p = 0.5, giả thuyết đảo), xác suất mà kết (35 số 50 khách hàng thích A) xảy bao nhiêu? Nói cách khác, phương pháp tìm trị số P Do đó, diễn dịch trị số P phải có điều kiện, điều kiện p = 0.50 bạn đọc làm thí nghiệm thêm với p = 0.6 hay p = 0.7 để thấy kết khác Trong thực tế, trị số P có ảnh hưởng lớn đến số phận báo khoa học Nhiều tập san nhà khoa học xem nghiên cứu khoa học với trị số P cao 0.05 “kết tiêu cực” (“negative result”) báo bị từ chối cho cơng bố Chính mà đại đa số nhà khoa học, số “P < 0.05” trở thành “giấy thông hành” để công bố kết nghiên cứu Nếu kết với P < 0.05, báo có may xuất tập san tác giả tiếng; kết P > 0.05, số phận báo cơng trình nghiên cứu có may vào lãng quên! 7.4 Vấn đề logic trị số P Nhưng đứng phương diện lí trí khoa học nghiêm chỉnh, có nên đặt tầm quan trọng vào trị số P hay không? Theo tơi, câu trả lời khơng Trị số P có nhiều vấn đề, việc phụ thuộc vào khứ (cũng nay) bị nhiều người phê phán gay gắt Cái khiếm khuyết số trị số P thiếu tính logic Thật vậy, chịu khó xem xét lại ví dụ trên, khái qt tiến trình nghiên cứu y học (dựa vào trị số P) sau: • • • • Đề giả thuyết (H+) Từ giả thuyết chính, đề giả thuyết đảo (H-) Tiến hành thu thập kiện (D) Phân tích kiện: tính tốn xác suất D xảy H- thật Nói theo ngơn ngữ tốn xác suất, bước xác định P(D | H-) Vì thế, số P có nghĩa xác suất kiện D xảy (nhấn mạnh: “nếu”) giả thuyết đảo H- thật Như vậy, số P không trực tiếp cho ý niệm thật giả thuyết H; gián tiếp cung cấp chứng để chấp nhận giả thuyết bác bỏ giả thuyết đảo Cái logic đằng sau trị số P hiểu tiến trình chứng minh đảo ngược (proof by contradiction): • • • Mệnh đề 1: Nếu giả thuyết đảo thật, kiện khơng thể xảy ra; Mệnh đề 2: Dữ kiện xảy ra; Mệnh đề (kết luận): Giả thuyết đảo thật Nếu bạn đọc cảm thấy khó hiểu cách lập luận trên, tơi xin lấy thêm ví dụ y khoa để minh họa cho tiến trình này: • • • Nếu ơng Tuấn bị cao huyết áp, ơng khơng thể có triệu chứng rụng tóc (hai tượng sinh học khơng liên quan với nhau, theo kiến thức y khoa nay); Ông Tuấn bị rụng tóc; Do đó, ơng Tuấn khơng thể bị cao huyết áp Trị số P, đó, gián tiếp phản ánh xác suất mệnh đề Và khiếm khuyết quan trọng trị số P, số P ước tính mức độ kiện, khơng nói cho biết mức độ giả thuyết Điều làm cho việc suy luận dựa vào trị số P xa rời với thực tế, xa rời với khoa học thực nghiệm Trong khoa học thực nghiệm, điều mà nhà nghiên cứu muốn biết với kiện mà họ có được, xác suất giả thuyết bao nhiêu, họ khơng muốn biết giả thuyết đảo thật xác suất kiện Nói cách khác dùng kí hiệu mơ tả trên, nhà nghiên cứu muốn biết P(H+ | D), không muốn biết P(D | H+) hay P(D | H-) 7.5 Vấn đề kiểm định nhiều giả thuyết (multiple tests of hypothesis) Như nói trên, nghiên cứu y học qui trình thử nghiệm giả thuyết Trong nghiên cứu, thử nghiệm giả thuyết nhất, mà nhiều giả thuyết lược Chẳng hạn nghiên cứu mối liên hệ vitamin D nguy gãy xương đùi, nhà nghiên cứu phân tích mối liên hệ tương quan vitamin D mật độ xương (bone mineral density), vitamin D nguy gãy xương theo giới tính, nhóm tuổi, hay phân tích theo đặc tính lâm sàng bệnh nhân, v.v… (Xem ví dụ đây) Mỗi phân tích xem thử nghiệm giả thuyết Ở đây, phải đối diện với vấn đề nhiều giả thuyết (multiple tests of hypothesis hay gọi multiple comparisons) Bảng Phân tích hiệu vitamin D calcium theo đặc tính bệnh nhân Đặc tính bệnh nhân Nhóm điều trị calcium vitamin D Nhóm giả dược (placebo) Tỉ số nguy (relative risk) khoảng tin cậy 95% Độ tuổi 50-59 60-69 70-79 29 (0.06) 53 (0.09) 93 (0.44) 13 (0.03) 71 (0.13) 115 (0.54) 2,17 (1.13-4.18) 0.74 (0.52-1.06) 0.82 (0.62-1.08) Body mass index 30 69 (0.20) 63 (0.14) 43 (0.09) 66 (0.19) 74 (0.16) 59 (0.13) 1.05 (0.75-1.47) 0.87 (0.62-1.22) 0.73 (0.49-1.09) Hút thuốc Không hút thuốc Hiện hút thuốc 159 (0.14) 14 (0.14) 178 (0.15) 16 (0.17) 0.90 (0.71-1.11) 0.85 (0.41-1.74) Chú thích: số ngồi ngoặc số bệnh nhân bị gãy xương đùi thời gian theo dõi (7 năm) số ngoặc tỉ lệ gãy xương tính phần trăm năm Tỉ số nguy tương đối (hay relative risk – RR – giải thích chương sau) ước tính cách lấy tỉ lệ gãy xương nhóm can thiệp chia cho tỉ lệ nhóm giả dược; khoảng tin cậy 95% bao gồm mức độ khác biệt nhóm khơng có ý nghĩa thống kê; khoảng tin cậy 95% khơng bao gồm mức độ khác biệt nhóm xem có ý nghĩa thống kê (hay p

Ngày đăng: 15/04/2023, 12:51

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan