dùng phần mềm R vào kiểm định giả thiết và trị số p-value
1 7 Kim đnh gi thit thng kê và ý ngha ca tr s P (P-value) 7.1 Tr s P Trong nghiên cu khoa hc, ngoài nhng d kin bng s, biu đ và hình nh, con s mà chúng ta thng hay gp nht là tr s P (mà ting Anh gi là P-value). Trong các chng sau đây, bn đc s gp tr s P rt nhiu ln, và đi đa s các suy lun phân tích thng kê, suy lun khoa hc đu da vào tr s P. Do đó, trc khi bàn đn các phng pháp phân tích thng kê bng R, tôi thy cn phi có đôi li v ý ngha ca tr s này. Tr s P là mt con s xác sut, tc là vit tt ch “probability value”. Chúng ta thng gp nhng phát biu đc kèm theo con s, chng hn nh “Kt qu phân tích cho thy t l gãy xng trong nhóm bnh nhân đc điu tr bng thuc Alendronate là 2%, thp hn t l trong nhóm bnh nhân không đc cha tr (5%), và mc đ khác bit này có ý ngha thng kê (p = 0.01)”, hay mt phát biu nh “Sau 3 tháng điu tr, mc đ gim áp sut máu trong nhóm bnh nhân là 10% (p < 0.05)”. Trong vn cnh trên đây, đi đa s nhà khoa hc hiu rng tr s P phn ánh xác sut s hiu nghim ca thuc Alendronate hay mt thut điu tr, h hiu rng câu vn trên có ngha là “xác sut mà thuc Alendronate tt hn gi dc là 0.99” (ly 1 tr cho 0.01). Nhng cách hiu đó hoàn toàn sai! Trong “T đin toán kinh t thng kê, kinh t lng Anh – Vit” (Nhà xut bn Khoa hc và K thut, 2004), tác gi đnh ngha tr s P nh sau: “P – giá tr (hoc giá tr xác sut). P giá tr là mc ý ngha thng kê thp nht mà đó giá tr quan sát đc ca thng kê kim đnh có ý ngha” (trang 690). nh ngha này tht là khó hiu! Tht ra đó cng là đnh ngha chung mà các sách khoa Tây phng thng hay vit. Lt bt c sách giáo khoa nào bng ting Anh, chúng ta s thy mt đnh ngha v tr s P na ná ging nhau nh “Tr s P là xác sut mà mc đ khác bit quan sát do các yu t ngu nhiên gây ra (P value is the probability that the observed difference arose by chance)”. Tht ra đnh ngha này cha đy đ, nu không mun nói là … sai. Chính vì s mù m ca đnh ngha cho nên rt nhiu nhà khoa hc hiu sai ý ngha ca tr s P. Tht vy, rt nhiu ngi, không ch ngi đc mà ngay c chính các tác gi ca nhng bài báo khoa hc, không hiu ý ngha ca tr s P. Theo mt nghiên cu đc công b trên tp san danh ting Statistics in Medicine [1], tác gi cho bit 85% các tác gi khoa hc và bác s nghiên cu không hiu hay hiu sai ý ngha ca tr s P. c đn đây có l bn đc rt ngc nhiên, bi vì điu này có ngha là nhiu nhà nghiên cu khoa hc có khi không hiu hay hiu sai nhng gì chính h vit ra có ngha gì! Th thì, câu hi cn đt ra mt cách nghiêm chnh: Ý ngha ca tr s P là gì? tr li cho câu hi này, 2 chúng ta cn phi xem xét qua khái nim phn nghim và tin trình ca mt nghiên cu khoa hc. 7.2 Gi thit khoa hc và phn nghim Mt gi thit đc xem là mang tính “khoa hc” nu gi thit đó có kh nng “phn nghim”. TheoKarl Popper, nhà trit hc khoa hc, đc đim duy nht đ có th phân bit gia mt lí thuyt khoa hc thc th vi ngy khoa hc (pseudoscience) là thuyt khoa hc luôn có đc tính có th “ b bác b” (hay b phn bác – falsified) bng nhng thc nghim đn gin. Ông gi đó là “kh nng phn nghim” (falsifiability, có tài liu ghi là falsibility). Phép phn nghim là phng cách tin hành nhng thc nghim không phi đ xác minh mà đ phê phán các lí thuyt khoa hc, và có th coi đây nh là mt nn tng cho khoa hc thc th. Chng hn nh gi thit “Tt c các qu đu màu đen” có th b bác b nu ta tìm ra có mt con qu màu đ. Có th xem qui trình phn nghim là mt cách hc hi t sai lm! Tht vy, trong khoa hc chúng ta hc hi t sai lm. Khoa hc phát trin cng mt phn ln là do hc hi t sai lm mà gii khoa hc không ai chi cãi. Sai lm là đim mnh ca khoa hc. Có th xác đnh nghiên cu khoa hc nh là mt qui trình th nghim gi thuyt, theo các bc sau đây: Bc 1, nhà nghiên cu cn phi đnh ngha mt gi thuyt đo (null hypothesis), tc là mt gi thuyt ngc li vi nhng gì mà nhà nghiên cu tin là s tht. Thí d trong mt nghiên cu lâm sàng, gm hai nhóm bnh nhân: mt nhóm đc điu tr bng thuc A, và mt nhóm đc điu tr bng placebo, nhà nghiên cu có th phát biu mt gi thuyt đo rng s hiu nghim thuc A tng đng vi s hiu nghim ca placebo (có ngha là thuc A không có tác dng nh mong mun). Bc 2, nhà nghiên cu cn phi đnh ngha mt gi thuyt ph (alternative hypothesis), tc là mt gi thuyt mà nhà nghiên cu ngh là s tht, và điu cn đc “chng minh” bng d kin. Chng hn nh trong ví d trên đây, nhà nghiên cu có th phát biu gi thuyt ph rng thuc A có hiu nghim cao hn placebo. Bc 3, sau khi đã thu thp đy đ nhng d kin liên quan, nhà nghiên cu dùng mt hay nhiu phng pháp thng kê đ kim tra xem trong hai gi thuyt trên, gi thuyt nào đc xem là kh d. Cách kim tra này đc tin hành đ tr li câu hi: nu gi thuyt đo đúng, thì xác sut mà nhng d kin thu thp đc phù hp vi gi thuyt đo là bao nhiêu. Giá tr ca xác sut này thng đc đ cp đn trong các báo cáo khoa hc bng kí hiu “P value”. iu cn chú ý đây là nhà nghiên cu không th nghim gi thuyt khác, mà ch th nghim gi thuyt đo mà thôi. Bc 4, quyt đnh chp nhn hay loi b gi thuyt đo, bng cách da vào giá tr xác sut trong bc th ba. Chng hn nh theo truyn thng la chn trong mt nghiên cu y hc, nu giá tr xác sut nh hn 5% thì nhà nghiên cu sn sàng bác b gi thuyt đo: s hiu nghim ca thuc A khác vi s hiu nghim ca placebo. Tuy nhiên, nu giá tr xác sut cao hn 5%, thì nhà nghiên cu ch có th phát biu rng cha 3 có bng chng đy đ đ bác b gi thuyt đo, và điu này không có ngha rng gi thuyt đo là đúng, là s tht. Nói mt cách khác, thiu bng chng không có ngha là không có bng chng. Bc 5, nu gi thuyt đo b bác b, thì nhà nghiên cu mc nhiên tha nhn gi thuyt ph. Nhng vn đ khi đi t đây, bi vì có nhiu gi thuyt ph khác nhau. Chng hn nh so sánh vi gi thuyt ph ban đu (A khác vi Placebo), nhà nghiên cu có th đt ra nhiu gi thuyt ph khác nhau nh thuc s hiu nghim ca thuc A cao hn Placebo 5%, 10% hay nói chung X%. Nói tóm li, mt khi nhà nghiên cu bác b gi thuyt đo, thì gi thuyt ph đc mc nhiên công nhn, nhng nhà nghiên cu không th xác đnh gi thuyt ph nào là đúng vi s tht. 7.3 Ý ngha ca tr s P qua mô phng hiu ý ngha thc t ca tr s P, tôi s nêu mt ví d đn gin nh sau: Ví d 1. Mt thí nghim đc tin hành đ tìm hiu s thích ca ngi tiêu th đi vi hai loi cà phê (hãy tm gi là cà phê A và B). Các nhà nghiên cu cho 50 khách hàng ung th hai loi cà phê trong cùng mt điu kin, và hi h thích loi cà phê nào. Kt qu cho thy 35 ngi thích cà phê A, và 15 ngi thích cà phê B. Vn đ đt ra là qua kt qu này, các nhà nghiên cu có th kt lun rng cà phê loi A đc a chung hn cà phê B, hay kt qu trên ch là do ngu nhiên mà ra? “Do ngu nhiên mà ra” có ngha là theo lut nh phân, kh nng mà kt qu trên xy ra là bao nhiêu? Do đó, lí thuyt xác sut nh phân có phn ng dng trong trng hp này, bi vì kt qu ca nghiên cu ch có hai “giá tr” (hoc là thích A, hoc thích B). Nói theo ngôn ng ca phn nghim, gi thit đo là nu không có s khác bit v s thích, xác sut mà mt khách hàng a chung mt loi cà phê là 0.5. Nu gi thit này là đúng (tc p = 0.5, p đây là xác sut thích cà phê A), và nu nghiên cu trên đc lp đi lp li (chng hn nh) 1000 ln, và mi ln vn 50 khách hàng, thì có bao nhiêu ln vi 35 khách hàng a chung cà phê A? Gi s ln nghiên cu mà 35 (hay nhiu hn) trong s 50 thích cà phê A là “bin c” X, nói theo ngôn ng xác sut, chúng ta mun tìm P(X | p=0.50) =? tr li câu hi này, chúng ta có th ng dng hàm rbinom đ mô phng vì nh nói trên thc cht ca vn đ là mt phân phi nh phân: > bin <- rbinom(1000, 50, 0.5) Trong lnh trên, chúng ta yêu cu R mô phng 1000 ln nghiên cu, mi ln có 50 khách hàng, và theo gi thit đo, xác sut thích A là 0.50. bit kt qu ca mô phng đó, chúng ta s dng hàm table nh sau: > table(bin) 4 bin 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 1 1 2 11 16 24 47 60 83 94 107 132 114 98 65 44 44 26 14 12 34 35 2 3 Qua kt qu trên, chúng ta thy trong s 1000 “nghiên cu” đó, ch có 3 nghiên cu mà s khách hàng thích cà phê A là 35 ngi (vi điu kin không có khác bit gia hai loi cà phê, hay nói đúng hn là nu p =0.5). Nói cách khác: P(X ≥ 35 | p=0.50) = 3/1000 = 0.003 Chúng ta cng có th th hin tn s trên bng mt biu đ tn s nh sau: Histogram of bin bin Frequency 15 20 25 30 35 0 50 100 150 200 250 Tt nhiên chúng ta có th làm mt mô phng khác vi s ln tái thí nghim là 100.000 ln (thay vì 1000 ln) và tính xác sut P(X ≥ 35 | p=0.50). bin <- rbinom(100000, 50, 0.5) > bin <- rbinom(100000, 50, 0.5) > table(bin) bin 11 12 13 14 15 16 17 18 19 20 21 22 23 4 17 40 83 197 462 946 1592 2719 4098 5892 7937 9733 24 25 26 27 28 29 30 31 32 33 34 35 36 10822 11191 10799 9497 7925 5904 4185 2682 1562 893 455 223 98 37 38 39 40 31 5 7 1 Ln này, chúng ta có nhiu kh nng hn (vì s ln mô phng tng lên). Chng hn nh có th có nghiên cu cho ra 11 khách hàng (ti thiu) hay 40 khách hàng (ti đa) thích cà 5 phê A. Nhng chúng ta mun bit s ln nghiên cu mà 35 khách hàng tr lên thích cà phê A, và kt qu trên cho chúng ta bit, xác sut đó là: > (223+98+21+5+7+1)/100000 [1] 0.00355 Nói cách khác, xác sut P(X ≥ 35 | p=0.50) quá thp (ch 0.3%), chúng ta có bng chng đ cho rng kt qu trên có th không do các yu t ngu nhiên gây nên; tc có mt s khác bit v s thích ca khách hàng đi vi hai loi cà phê. Con s P = 0.0035 chính là tr s P. Theo mt qui c khoa hc, tt c các tr s P thp hn 0.05 (tc thp hn 5%) đc xem là “significant”, tc là “có ý ngha thng kê”. Cn phi nhn mnh mt ln na đ hiu ý ngha ca tr s P nh sau: Mc đích ca phân tích trên là nhm tr li câu hi: nu hai loi cà phê có xác sut a chung bng nhau (p = 0.5, gi thuyt đo), thì xác sut mà kt qu trên (35 trong s 50 khách hàng thích A) xy ra là bao nhiêu? Nói cách khác, đó chính là phng pháp đi tìm tr s P. Do đó, din dch tr s P phi có điu kin, và điu kin đây là p = 0.50. bn đc có th làm thí nghim thêm vi p = 0.6 hay p = 0.7 đ thy kt qu khác nhau ra sao. Trong thc t, tr s P có mt nh hng rt ln đn s phn ca mt bài báo khoa hc. Nhiu tp san và nhà khoa hc xem mt nghiên cu khoa hc vi tr s P cao hn 0.05 là mt “kt qu tiêu cc” (“negative result”) và bài báo có th b t chi cho công b. Chính vì th mà đi vi đi đa s nhà khoa hc, con s “P < 0.05” đã tr thành mt cái “giy thông hành” đ công b kt qu nghiên cu. Nu kt qu vi P < 0.05, bài báo có c may xut hin trên mt tp san nào đó và tác gi có th s ni ting; nu kt qu P > 0.05, s phn bài báo và công trình nghiên cu có c may đi vào lãng quên! 7.4 Vn đ logic ca tr s P Nhng đng trên phng din lí trí và khoa hc nghiêm chnh, chúng ta có nên đt tm quan trng vào tr s P nh th hay không? Theo tôi, câu tr li là không. Tr s P có nhiu vn đ, và vic ph thuc vào nó trong quá kh (cng nh hin nay) đã b rt nhiu ngi phê phán gay gt. Cái khim khuyt s 1 ca tr s P là nó thiu tính logic. Tht vy, nu chúng ta chu khó xem xét li ví d trên, chúng ta có th khái quát tin trình ca mt nghiên cu y hc (da vào tr s P) nh sau: • ra mt gi thuyt chính (H+) • T gi thuyt chính, đ ra mt gi thuyt đo (H-) • Tin hành thu thp d kin (D) • Phân tích d kin: tính toán xác sut D xy ra nu H- là s tht. Nói theo ngôn ng toán xác sut, bc này xác đnh P(D | H-). 6 Vì th, con s P có ngha là xác sut ca d kin D xy ra nu (nhn mnh: “nu”) gi thuyt đo H- là s tht. Nh vy, con s P không trc tip cho chúng ta mt ý nim gì v s tht ca gi thuyt chính H; nó ch gián tip cung cp bng chng đ chúng ta chp nhn gi thuyt chính và bác b gi thuyt đo. Cái logic đng sau ca tr s P có th đc hiu nh là mt tin trình chng minh đo ngc (proof by contradiction): • Mnh đ 1: Nu gi thuyt đo là s tht, thì d kin này không th xy ra; • Mnh đ 2: D kin xy ra; • Mnh đ 3 (kt lun): Gi thuyt đo không th là s tht. Nu bn đc cm thy khó hiu cách lp lun trên, tôi xin ly thêm mt ví d trong y khoa đ minh ha cho tin trình này: • Nu ông Tun b cao huyt áp, thì ông không th có triu chng rng tóc (hai hin tng sinh hc này không liên quan vi nhau, ít ra là theo kin thc y khoa hin nay); • Ông Tun b rng tóc; • Do đó, ông Tun không th b cao huyt áp. Tr s P, do đó, gián tip phn ánh xác sut ca mnh đ 3. Và đó cng chính là mt khim khuyt quan trng ca tr s P, bi vì con s P nó c tính mc đ kh d ca d kin, ch không nói cho chúng ta bit mc đ kh d ca mt gi thuyt. iu này làm cho vic suy lun da vào tr s P rt xa ri vi thc t, xa ri vi khoa hc thc nghim. Trong khoa hc thc nghim, điu mà nhà nghiên cu mun bit là vi d kin mà h có đc, xác sut ca gi thuyt chính là bao nhiêu, ch h không mun bit nu gi thuyt đo là s tht thì xác sut ca d kin là bao nhiêu. Nói cách khác và dùng kí hiu mô t trên, nhà nghiên cu mun bit P(H+ | D), ch không mun bit P(D | H+) hay P(D | H-). 7.5. Vn đ kim đnh nhiu gi thuyt (multiple tests of hypothesis) Nh đã nói trên, nghiên cu y hc là mt qui trình th nghim gi thuyt. Trong mt nghiên cu, ít khi nào chúng ta th nghim ch mt gi thuyt duy nht, mà rt nhiu gi thuyt mt lc. Chng hn nh trong mt nghiên cu v mi liên h gia vitamin D và nguy c gãy xng đùi, các nhà nghiên cu có th phân tích mi liên h tng quan gia vitamin D và mt đ xng (bone mineral density), gia vitamin D và nguy c gãy xng theo tng gii tính, tng nhóm tui, hay phân tích theo các đc tính lâm sàng ca bnh nhân, v.v… (Xem ví d di đây). Mi mt phân tích nh th có th xem là mt th nghim gi thuyt. đây, chúng ta phi đi din vi vn đ nhiu gi thuyt (multiple tests of hypothesis hay còn gi là multiple comparisons). Bng 2. Phân tích hiu qu ca vitamin D và calcium theo đc tính ca bnh nhân 7 c tính bnh nhân Nhóm đc điu tr bng calcium và vitamin D 1 Nhóm gi dc (placebo) 1 T s nguy c (relative risk) và khong tin cy 95% 2 tui 50-59 60-69 70-79 29 (0.06) 53 (0.09) 93 (0.44) 13 (0.03) 71 (0.13) 115 (0.54) 2,17 (1.13-4.18) 0.74 (0.52-1.06) 0.82 (0.62-1.08) Body mass index <25 25-30 > 30 69 (0.20) 63 (0.14) 43 (0.09) 66 (0.19) 74 (0.16) 59 (0.13) 1.05 (0.75-1.47) 0.87 (0.62-1.22) 0.73 (0.49-1.09) Hút thuc lá Không hút thuc Hin hút thuc 159 (0.14) 14 (0.14) 178 (0.15) 16 (0.17) 0.90 (0.71-1.11) 0.85 (0.41-1.74) Chú thích: 1 s ngoài ngoc là s bnh nhân b gãy xng đùi trong thi gian theo dõi (7 nm) và s trong ngoc là t l gãy xng tính bng phn trm mi nm. 2 T s nguy c tng đi (hay relative risk – RR – s gii thích trong mt chng sau) đc c tính bng cách ly t l gãy xng trong nhóm can thip chia cho t l trong nhóm gi dc; nu khong tin cy 95% bao gm 1 thì mc đ khác bit gia 2 nhóm không có ý ngha thng kê; nu khong tin cy 95% không bao gm 1 thì mc đ khác bit gia 2 nhóm đc xem là có ý ngha thng kê (hay p<0.05). Xin nhc li rng trong mi ln th nghim mt gi thuyt, chúng ta chp nhn mt sai sót 5% (gi d chúng ta chp nhn tiêu chun p = 0.05 đ tuyên b có ý ngha hay không có ý ngha thng kê). Vn đ đt ra là trong bi cnh th nghim nhiu gi thuyt là nh sau: nu trong s n th nghim, chúng ta tuyên b k th nghim “có ý ngha thng kê” (tc là p<0.05), thì xác sut có ít nht mt gi thuyt sai là bao nhiêu? tr li câu hi này tôi s bt đu bng mt ví d đn gin. Mi th nghim chúng ta chp nhn mt xác sut sai lm là 0.05. Nói cách khác, chúng ta có xác sut đúng là 0.95. Nu chúng ta th nghim 3 gi thuyt, xác sut mà chúng ta đúng c ba là [d nhiên]: 0.95 x 0.95 x 0.95 = 0.8574. Nh vy, xác xut có ít nht mt sai lm trong ba tuyên b “có ý ngha thng kê” là: 1 – 0.8574 = 0.1426 (tc khong 14%). Nói chung, nu chúng ta th nghim n gi thuyt, và mi ln th nghim chúng ta chp nhn mt xác sut sai lm là p, thì xác sut có ít nht 1 sai lm trong n ln th nghim đó là () n p−− 11. Khi n = 10 và p = 0.05 thì xác sut có ít nht mt sai lm lên đn: 40%. “Bài hc” rút ra t cách lí gii trên là nh sau: nu chúng ta đc mt bài báo khoa hc mà trong đó nhà nghiên cu tin hành nhiu th nghim khác nhau vi các kt qu tr s p < 0.05, chúng ta có lí do đ cho rng xác sut mà mt trong nhng cái-gi-là 8 “significant” (hay “có ý ngha thng kê”) đó rt cao. Chúng ta cn phi dè dt vi nhng kt qu phân tích nh th. i vi mt ngi làm nghiên cu, ý ngha ca vn đ th nghim nhiu gi thuyt là: không nên “câu cá”. Tôi xin nói thêm v khái nim “câu cá” trong khoa hc. Hãy tng tng, mt nhà nghiên cu mun tìm hiu hiu qu ca mt thut điu tr mi cho các bnh nhân đau khp. Sau khi xem xét các nghiên cu đã công b trong y vn, nhà nghiên cu quyt đnh tin hành mt nghiên cu trên 300 bnh nhân: phân na đc điu tr bng thut mi, phân na ch s dng gi dc. Sau thi gian theo dõi, thu thp d liu, nhà nghiên cu phân tích và phát hin s khác bit gia hai nhóm không có ý ngha thng kê. Nói cách khác, thut điu tr không có hiu qu. Nhà nghiên cu không chu “đu hàng”, nên tìm cách tìm cho đc mt kt qu có ý ngha thng kê. Ông chia bnh nhân thành nhiu nhóm theo đ tui (trên 50 hay di 50), theo gii tính (nam hay na), thành phn kinh t (có thu nhp cao hay thp), và thói quen (chi th thao hay không). Tính chung, ông có 16 nhóm khác nhau, và có th th nghim 16 ln. Ông “khám phá” thut điu tr có ý ngha thng kê trong nhóm ph n tui trên 50 và có thu nhp cao. Và, ông công b kt qu. ó là mt qui trình làm vic mà gii nghiên cu khoa hc gi là “fishing expedition” (mt chuyn đi câu cá). Tt nhiên, mt kt qu nh th không có giá tr khoa hc và không th tin đc. (Vi 16 th nghim khác nhau và vi p = 0.05, xác sut mà mt th nghim có kt qu “significant” lên đn 55%, do đó chúng ta chng ngc nhiên khi thy có mt “con cá” đc bt!) cho kt qu tr s P có ý ngha nguyên thy ca nó trong bi cnh th nghim nhiu gi thuyt, các nhà nghiên cu đ ngh s dng thut điu chnh Bonferroni (tên ca mt nhà thng kê hc ngi Ý tng đ ngh cách làm này). Theo đ ngh này, trc khi tin hành nghiên cu, nhà nghiên cu phi xác đnh rõ gi thuyt nào là chính, và gi thuyt nào là ph. Ngoài ra, nhà nghiên cu còn phi đ ra k hoch s th nghim bao nhiêu gi thuyt trc khi bt tay vào phân tích d liu. Chng hn nh nu nhà nghiên cu có k hoch th nghim 20 so sánh và mun gi cho tr s p 0.05, thì thay vì da vào 0.05 là tiêu chun đ tuyên b“significant”, nhà nghiên cu phi da vào tiêu chun 0.0025 (tc ly 0.05 chia cho 20) đ tuyên b “significant”. Nói cách khác, ch khi nào mt kt qu có tr s p thp hn 0.0025 (hay nói chung là p/n) thì nhà nghiên cu mi có “quyn” tuyên b kt qu đó có ý ngha thng kê. Tr s P, dù cc kì thông dng trong nghiên cu khoa hc, không phi là mt phán xét cui cùng ca mt công trình nghiên cu hay mt gi thuyt. Th nhng trong thc t, các nhà khoa hc đã quá l thuc vào tr s P đ suy lun trong nghiên cu và tuyên b nhng khám phá mà sau này đc chng minh là sai lm. Có th nói không ngoa rng chính vì s lm dng và ph thuc mt cách mù quáng vào tr s P mà khoa hc, nht là y sinh hc, đã tr nên nghèo nàn. Hàng ngày chúng ta đc hay nghe nhng phát hin khoa hc trái ngc nhau (nh lúc thì có nghiên cu cho thy cà phê có tác dng tt cho sc khe, lúc khác có nghiên cu cho bit cà phê có hi cho sc khe; hay lúc thì thuc gim đau aspirin có hiu nng làm gim nguy c ung th, nhng mi đây có nghiên cu cho thy aspirin có th làm tng nguy c b ung th vú, v.v…). Có khi công chúng không bit phát hin nào là thc và phát hin nào là “dng tính gi”. Theo phân 9 tích ca Berger và Sellke, khong 25% các phát hin vi “p < 0.05” là các phát hin dng tính gi [2]. Do đó, chúng ta không nên quá ph thuc vào tr s P. Không phi c nghiên cu nào vi p<0.05 là thành công và p>0.05 là tht bi. Có khi mt phát hin vi p>0.05 nhng li là mt phát hin có ý ngha. Vn đ quan trng là làm sao đ c tính mc đ kh d ca mt gi thuyt mt khi có d kin tht trong tay, tc là c tính P(H+ | D). c tính P(H+ | D), chúng ta phi áp dng nh lí Bayes, và cách tip cn đnh lí này không nm trong phm trù ca cun sách này. Bn đc mun tham kho thêm có th đc mt vài bài báo ca tôi hay các các bài báo ca James Berger mà tài liu tham kho di đây có th cung cp thêm. Tài liu tham kho: [1] Wulff et al., Statistics in Medicine 1987; 6:3-10. [2] Berger JO, Sellke T. Testing a point null hypothesis: the irreconcilability of P-values and evidence. Journal of the American Statistical Association 1987; 82:112-20. . thng kê, suy lun khoa hc đu da vào tr s P. Do đó, trc khi bàn đn các phng ph p phân tích thng kê bng R, tôi thy cn phi có đôi li v ý ngha. là phng ph p đi tìm tr s P. Do đó, din dch tr s P phi có điu kin, và điu kin đây là p = 0.50. bn đc có th làm thí nghim thêm vi p =