Chúng ta có thể nhận xét với cùng cỡ mẫu, nguy cơ sai lầm loại 2 càng tăng nếu Ha càng gần Ho.. Cần phải tăng cỡ mẫu để phân biệt được Ha và Ho (giảm nguy cơ sai lầm loại 2) khi Ha gần[r]
(1)NGUYÊN LÍ KIỂM ĐỊNH Mục tiêu:
Sau khi nghiên ch đ , h c viên có kh năng:ủ ề ọ ả
Trình bày đượ ực s liên h gi a ki m đ nh ý nghĩa và kho ng tin c y ệ ữ ể ị ả ậ Phân bi t đệ ược 2 lo i sai l m: sai l m lo i I và sai l m lo i IIạ ầ ầ ầ
1 Chọn lựa kiểm định phù hợp
Nh v y nguyên lí c a ki m đ nh ý nghĩa (hay ki m đ nh gi thuy t là nh nhau). Cácư ậ ủ ể ị ể ị ả ế ki m đ nh ch khác nhau vi c l a ch n th ng kê xu t phát t gi thuy t Hể ị ỉ ệ ự ọ ố ấ ả ế 0. Vi c l aệ ự
ch n này ph thu c vào bi n s c a v n đ quan tâm và thi t k c a nghiên c u.ọ ụ ộ ế ố ủ ấ ề ế ế ủ ứ B ng 10. Ch n l a ki m đ nh phù h pả ọ ự ể ị ợ
Lo i thi t k nghiên c uạ ế ế ứ
Thang đo c a bi n sủ ế ố
Hai nhóm u tr g mề ị
các cá nhân khác nhau
Ba (hay nhiêù) nhóm đi uề tr g m cácị cá nhân khác nhau
Trước và sau m tộ
đi u trề ị (ho c 2ặ u tr ) ề ị ở
trên cùng các đ iố
tượng
Nhi u đi uề ề tr trên cùngị
các đ iố tượng
Liên hệ gi a haiữ bi n sế ố
Ð nh lị ượng (m u rút tẫ ừ m t dân s có phânộ ố ph i bình thố ường và phương sai hai nhóm đ ng nh tồ ấ
ttest khơng
b t c pắ ặ phPhân tích ương sai ttest b tc pặ ắ phPhân tích ương sai đo lường
l p l iậ
H i quyồ n tínhế
và tương quan pearson Ð nh tính Danh đ nhị ị χ2 b ng 2 xả
n χ
2 b ng 3 xả n
test
McNemar Cochrance Q H s c a ệ ố ủ b ng n x mả (phi, OR,
RR) Ð nh tính Th tị ứ ự
(hay bi n đ nh lế ị ượng khơng bình thường)
Ki m đ nhể ị t ng s pổ ắ
h ngạ Mann Whitney
Kruskal
Wallis Ki m đ nh ể ị s p h ngắ
có d uấ Wilcoxon
Friedman h sệ ố tương quan
Spearman
2 Kiểm định ý nghĩa; Kiểm định giả thuyết
(2)tr v i gi dị ả ược và phát hi n r ng t vong trong nhóm đi u tr v i thu c m i ch b ngệ ằ ề ị ố ỉ ằ m t n a so v i nhóm đi u tr b ng placebo. Đây là m t k t qu h a h n nh ng có khiộ ề ị ằ ộ ế ả ứ ẹ ch là m t k t qu do c may? Chúng ta hãy xem xét câu h i này b ng cách tính giá trỉ ộ ế ả ỏ ằ ị p. Giá tr p chính là xác su t có ít nh t s khác bi t 2 l n v t l t vong n u nhị ấ ấ ự ệ ầ ề ỉ ệ ế ư thu c th c s khơng có tác đ ng gì lên t l s ng cịn.ố ự ự ộ ỉ ệ ố
Fisher th y r ng giá tr p là m t ch s đo lấ ằ ị ộ ỉ ố ường s c m nh c a ch ng c ch ng l i giứ ủ ứ ố ả thuy t Ho (trong thí d này, gi thuy t là thu c khơng tác đ ng gì lên t l s ng cịn).ế ụ ả ế ố ộ ỉ ệ ố Ông ta c vũ s d ng P < 0.05 (5% ý nghĩa) làm m c tiêu chu n đ k t lu n r ng cóổ ụ ứ ẩ ể ế ậ ằ b ng c ch ng l i gi thuy t đằ ố ả ế ược ki m đinh, m c dù khơng có m t quy t c tuy t đ iể ặ ộ ắ ệ ố “N u p n m gi a 0,1 và 0,9 ch c ch n khơng có lí do gì đ nghi ng gi thuy t đế ằ ữ ắ ắ ể ả ế ược ki m đinh. N u nó dể ế ưới 0,02 nó ch ra m t cách m nh m r ng gi thuy t không thỉ ộ ẽ ằ ả ế ể gi i thích đả ược cho s ki n th c t Chúng ta s không thự ệ ự ế ẽ ường xuyên b l c l i n uị ố ế chúng ta ch n m t ngọ ộ ưỡng quy ướ ởc 0,05”
(3)N uế A
⇒B
⇔ {P( B )
thấ
p ⇒
P(A)
thấ
p} { Ho
⇒
Tkê S }
⇔
{P( Tkê S ) <
ngư
ng
ỡ
⇒
bác
bỏ
Ho}
Khơng
thích cách lí gi i ch quan c a Fisher, Neyman và Pearson đ xu t cách ti p c n đả ủ ủ ề ấ ế ậ ược g i là “ki m đ nh gi thuy t” (hypothesis tests) và thay th cho quan đi m ch quan vọ ể ị ả ế ế ể ủ ề s c m nh c a giá tr p làm ch ng c ch ng l i gi thuy t không b ng cách ti p c nứ ủ ị ứ ố ả ế ằ ế ậ khách quan d a vào cây quy t đ nh. Neyman và Pearson cho r ng có hai lo i sai l m cóự ế ị ằ ầ th ph m ph i trong khi lí gi i k t qu c a th c nghi m. Cách ti p c n c a Fisherể ả ả ế ả ủ ự ệ ế ậ ủ t p trung vào sai l m lo i m t: xác su t bác b gi thuy t không n u gi thuy t khôngậ ầ ộ ấ ỏ ả ế ế ả ế th c ra là đúng. Neyman và Pearson cũng quan tâm đ n sai l m lo i II: xác su t ch pự ế ầ ấ ấ nh n gi thuy t không (và không ch u dùng đi u tr m i) trong khi gi thuy t th c sậ ả ế ị ề ị ả ế ự ự là sai. B ng cách s p đ t các nguy c sai l m lo i I và lo i II, s các sai l m m c ph iằ ắ ặ ầ ạ ố ầ ắ ả trong khi lí gi i k t qu s đả ế ả ẽ ược h n ch Đi u này không ph i là xa l v i ai đã t ngạ ế ề ả tính c m u cho các nghiên c u có ki m đ nh gi thuy t. ỡ ẫ ứ ể ị ả ế
(4)m i làm gi m nguy c t vong” mà ph i ch rõ nguy c t vong gi m bao nhiêu:ớ ả ả ỉ ả “thu c m i làm gi m nguy c t vong 60%” Nhà nghiên c u có quy n t do ch n quyố ả ứ ề ự ọ t c quy t đ nh b ng cách phát bi u c th đ i thuy t, nguy c sai l m lo i I, và nguyắ ế ị ằ ể ụ ể ố ế ầ c sai l m lo i II, nh ng đi u này ph i đơ ầ ề ả ược th c hi n trự ệ ước khi nghiên c u. Do đóứ trong cách ti p c n c a NeymanPearson chúng ta xây d ng m t nguyên t c ra quy tế ậ ủ ự ộ ắ ế đ nh đ giúp lí gi i k t qu nghiên c u t trị ể ả ế ả ước khi ti n hành nghiên c u và vi c phânế ứ ệ tích ch đ n gi n là bác b hay ch p nh n gi thuy t không và, ngỉ ả ỏ ấ ậ ả ế ượ ớc l i v i cách ti p c n ch quan c a Fisher, không c g ng lí gi i giá tr p trong t ng m t nghiênế ậ ủ ủ ố ắ ả ị ộ c u c th ứ ụ ể
Phát biển H 0 ; H a Tính số thống kê
(z; t; chi 2; F)
Xác suất sai lầm loại
Nhoû
Bác bỏ giả thuyết
Xác suất sai lầm loại
Không nhỏ
Nhỏ
Chấp nhận giả thuyeát
Thực nghiên cứu với cỡ mẫu
lớn
Không nhỏ
tra bảng tính p
Đi u đáng ti c các nhà nghiên c u l i khơng tìm hi u rõ ràng ý tề ế ứ ể ưởng và s d ngử ụ ph n thô s nh t c a cách ti p c n này cho r ng gi thuy t không s đầ ấ ủ ế ậ ằ ả ế ẽ ược bác bỏ n u p< 0,05 (v i nguy c sai l m lo i 1 là 5%). Đi u này d n đ n c m nh n sai l mế ầ ề ẫ ế ả ậ ầ là cách ti p c n c a NeymanPearson tế ậ ủ ương t nh cách ti p c n c a Fisher.ự ế ậ ủ
3 Sai lầm loại sai lầm loại hai
Sai l m lo i m t: bác b gi thuy t Ho trong khi gi thuy t Ho là đúng.ầ ộ ỏ ả ế ả ế Sai l m lo i hai: Không bác b gi thuy t Ho trong khi gi thuy t Ho sai.ầ ỏ ả ế ả ế
Trong nghiên c u th ng kê ngứ ố ười ta khơng bao gi có th ch c ch n. Do v y, khi nhàờ ể ắ ắ ậ nghiên c u đi đ n k t lu n bác b gi thuy t Ho, ngứ ế ế ậ ỏ ả ế ười nghiên c u có th b sai l mứ ể ị ầ (sai l m lo i m t v i m t xác su t nào đó). Khi nhà nghiên c u khơng bác b giầ ộ ộ ấ ứ ỏ ả thuy t Hế 0, nhà nghiên c u cũng có th b sai l m (sai l m lo i hai cũng v i m t xácứ ể ị ầ ầ ộ
(5)Hình Biểu đồ minh hoạ mối liên quan sai lầm loại 1, sai lầm loai 2, cỡ mẫu khoảng cách Ho - Ha Đường phân phối màu đậm bên trái thể giả thuyết Ho, đường màu nhạt bên phải thể giả thuyết Ha Vùng diện tích màu đậm xác suất sai lầm loại vùng diện tích màu nhạt thể xác suất sai lầm loại Chúng ta nhận xét với cỡ mẫu, nguy sai lầm loại tăng Ha gần Ho Cần phải tăng cỡ mẫu để phân biệt Ha Ho (giảm nguy sai lầm loại 2) Ha gần Ho
4 So sánh tiếp cận cổ điển (chủ nghĩa tần suất) Bayes suy luận thống kê
Gi s chúng ta mu n đánh giá m t lo i thu c m i có c i thi n t l s ng cịn m tả ố ộ ố ả ệ ỉ ệ ố ộ năm sau khi b nh i máu c tim b ng m t th nghi m lâm sàng có nhóm ch ngị ằ ộ ệ ứ placebo. Chúng ta s th c hi n đi u này b ng cách ẽ ự ệ ề ằ ướ ược l ng t s nguy c – nguy cỉ ố ơ t vong trong b nh nhân đử ệ ược đi u tr v i thu c m i chia cho nguy c t vong nhómề ị ố đ i ch ng. N u t s nguy c là 0,5, thu c m i gi m nguy c t vong 50%, n u t số ứ ế ỉ ố ố ả ế ỉ ố nguy c là 1 thì thu c m i khơng có tác d ng.ơ ố ụ
Th ng kê t n su t ch nghĩaố ầ ấ ủ
Cho r ng chân lí đã có s n. Chúng ta s d ng s li u đ suy lu n t giá tr c a tằ ẵ ụ ố ệ ể ậ ị ủ ỉ s nguy c dân s có th c (nh ng ch a bi t)ố ố ự ư ế
Kho ng tin c y 95% cho chúng ta kho ng giá tr h p lí c a t s nguy c dân s ;ả ậ ả ị ợ ủ ỉ ố ố Chúng ta th c hi n nghiên c u 100 l n thì 95% nh ng kho ng tin c y tính đự ệ ứ ầ ữ ả ậ ượ ẽc s ch a giá tr c a dân sứ ị ủ ố
(6)Th ng kê Bayesố
Người theo ch nghĩa Bayes có cách ti p c n ch quan. Chúng ta b t đ u v i quanủ ế ậ ủ ắ ầ m chúng ta v t s nguy c và th hi n nó theo phân ph i xác su t Chúng ta sể ề ỉ ố ể ệ ố ấ ẽ dùng s li u đ đi u ch nh ý ki n đó (chúng tá s rút ra phân ph i xác su t c a tố ệ ể ề ỉ ế ẽ ố ấ ủ ỉ s nguy c d a trên s li u và phân ph i có s n)ố ự ố ệ ố ẵ
Kho ng tin tả ưởng 95% (95% credible interval) là kho ng có 95% c may có ch a tả ứ ỉ s nguy c dân s ố ố
Phân ph i h u nghi m có th đố ậ ệ ể ược dùng đ rút ra các kh ng đ nh xác su t v t sể ẳ ị ấ ề ỉ ố nguy c – thí d , xác su t thu c làm tăng nguy c t vongơ ụ ấ ố
Có s tự ương t gi a th ng kê Bayes và vi c s d ng test trong ch n đốn b nh,ự ữ ố ệ ụ ẩ ệ trong đó power c a ki m đ nh tủ ể ị ương t nh đ nh y, giá tr p tự ộ ị ương t nh (1 đự ộ chuyên) và tương t nh t s đ kh dĩ dự ỉ ố ộ ả ương. Khi đó n u k t qu là bác b Ho,ế ế ả ỏ s chênh h u nghi m c a m nh đ b ng s chênh ti n nghi m x ố ậ ệ ủ ệ ề ằ ố ề ệ
N u chúng ta khơng có ý ki n ti n nghi m (chúng ta xem các kho ng giá tr đ u có khế ế ề ệ ả ị ề ả năng ngang nhau) thì k t qu c a các ti p c n c đi n tế ả ủ ế ậ ổ ể ương t nh cách ti p c n c aự ế ậ ủ Bayes
Kho ng tin c y 95% tả ậ ương t nh kho ng tin tự ả ưởng 95% (95% credible interval) Giá tr p (m t bên) tị ộ ương t nh xác su t h u nghi m c a m nh đ thu c làmự ấ ậ ệ ủ ệ ề ố
tăng nguy c t vong (gi s r ng chúng ta có đơ ả ằ ược k t qu là thu c có tác d ngế ả ố ụ b o v )ả ệ