[r]
(1)KI M Ð NH CHI BÌNH PHỂ Ị ƯƠNG Mục tiêu
Sau khi nghiên c u ch đ , h c viên có kh năng:ứ ủ ề ọ ả
Xây d ng đự ược b ng d trù n ả ự × m đ mơ t m i liên quan gi a hai bi n s đ nh tínhể ả ố ữ ế ố ị S d ng ki m đ nh ử ụ ể ị χ2
cho b ng d trù n ả ự × m v s liên quan gi a hai bi n s đ nhề ự ữ ế ố ị tính
Trình bày các gi đ nh v tính h p l cho ki m đ nh ả ị ề ợ ệ ể ị χ2 S d ng ki m đ nh ử ụ ể ị χ2
McNemar đ ki m đ nh s liên quan gi a hai bi n s đ nh tínhể ể ị ự ữ ế ố ị trong thi t k b t c p.ế ế ắ ặ
1 Giới thiệu
Trình bày s li u c a các bi n đ nh tính đố ệ ủ ế ị ược mơ t chả ương Th ng kê, bi n s vàố ế ố phân ph i Khi có hai bi n đ nh tính, s li u đố ế ị ố ệ ược s p x p b ng d trùắ ế ả ự (contigency table). Các ph m trù cho m t bi n s t o thành hàng và các ph m trù choạ ộ ế ố ạ bi n s khác t o thành c t. Cá nhân đế ố ộ ược đ a vào m t ơ thích h p c a b ng d trù tùyư ộ ợ ủ ả ự theo giá tr c a hai bi n s B ng d trù cũng đị ủ ế ố ả ự ược dùng cho các bi n s đ nh lế ố ị ượng r i r hay bi n s đ nh lờ ế ố ị ượng liên t c khi các giá tr đụ ị ược phân nhóm
Ki m đ nh chi bình phể ị ương (χ2 ) được dùng đ ki m đ nh xem có s liên h gi a cácể ể ị ự ệ ữ bi n s hàng và bi n s c t hay khơng hay nói cách khác, s phân ph i c a các cá nhânế ố ế ố ộ ự ố ủ trong các ph m trù c a m t bi n s có ph thu c vào s phân ph i trong các ph m trùạ ủ ộ ế ố ụ ộ ự ố c a bi n kia hay khơng. Khi b ng ch có hai hàng và hai c t đi u này có nghĩa là soủ ế ả ỉ ộ ề sánh phân ph i c a bi n s nh giá (đố ủ ế ố ị ược bi u th b ng t l ) hai nhóm hay cịn g iể ị ằ ỉ ệ ọ là so sánh hai t l ỉ ệ
2 Bảng x (so sánh hai tỉ lệ)
Chúng ta s d ng l i thí d đã nêu trong chử ụ ụ ương Nguyên t c ki m đ nh so sánh hai tắ ể ị ỉ l Trong m t th nghi m lâm sàng đ đi u tr ung th vú đã di căn, b nh nhânh đệ ộ ệ ể ề ị ệ ược phân nhóm ng u nhiên đ đẫ ể ược đi u tr v i LPam hay CMF (m t ph i h p g m 3ề ị ộ ố ợ lo i thu c). Ðáp ng kh i u đạ ố ứ ố ược đ nh nghĩa là s teo nh trên m t n a c a di n tíchị ự ỏ ộ ủ ệ kh i u trong th i gian t i thi u là 2 tu n. S li u nh sau:ố ố ể ầ ố ệ
B ng 11. Ðáp ng kh i u c a 184 b nh nhân ung th vú v i đi u tr b ng CMF và LPAMả ứ ố ủ ệ ư ớ ề ị ằ
Ði u trề ị CMF LPam T ng sổ ố
Ðáp ng c aứ ủ
kh i uố Có (52,7%)49 (19,8%)18 (36,4%)67
Không 44 73 117
T ng s b nhổ ố ệ
nhân 93 91 184
(2)Bước đ u tiên trong vi c lí gi i s li u b ng d trù là tính tốn t l hay ph n trămầ ệ ả ố ệ ả ự ỉ ệ ầ thích h p. Do đó t l đáp ng là 52,7% trong nhóm đi u tr CMF, 19,8% trong nhómợ ỉ ệ ứ ề ị placebo và 36,4% tồn b Sau đó chúng ta c n quy t đ nh nh v y có đ ch ng c độ ầ ế ị ậ ủ ứ ứ ể xem CMF có hi u qu h n LPam hay s khác bi t là ch là do tình c ệ ả ự ệ ỉ
Ði u này đề ược ti n hành b ng ki m đ nh chi bình phế ằ ể ị ương (chi square test) nh m soằ sánh s quan sát trong m t trong b n ph m trù trong b ng d trù v i v ng tr n uố ộ ố ả ự ọ ị ế khơng có s khác bi t v hi u qu gi a CMF và LPam. T ng s 67/184 b nh nhânự ệ ề ệ ả ữ ổ ố ệ đáp ng và n u CMF và LPam có hi u qu b ng nhau, t l đáp ng trong hai nhómứ ế ệ ả ằ ỉ ệ ứ cũng b ng giá tr trên và chúng ta s có 93 * 67/184 =33,9 ngằ ị ẽ ười trong nhóm CMF và 91 * 67/184 = 33,1 người trong nhóm LPam đáp ng v i đi u tr Tứ ề ị ương t nh v yư ậ s có 93 * 117/184 = 59,1 ngẽ ười và 91 * 117/184 = 57,9 người khơng đáp ng. Nh ngứ ữ v ng tr này đọ ị ươc trình bày trong b ng 13.1(b). Chúng cũng t o t ng s hàng và t ngả ổ ố ổ s c t tố ộ ương t nh tr s quan sát. Giá tr chi bình phự ị ố ị ương có được b ng cách tínhằ (quan sát v ng tr )ọ ị 2/v ng tr cho m i ô trong b ng d trù và c ng chúng l i.ọ ị ỗ ả ự ộ ạ
2 x bảng với tự độ , )
(
2 d f
E E O
Giá tr này đị ược g i là giá tr ọ ị χ2 c a Pearson. N u hi u s gi a s quan sát đủ ế ệ ố ữ ố ược và v ng tr càng l n, giá tr ọ ị ị χ2 càng l n và ít có th s khác bi t này là do tình c Ði mớ ể ự ệ ờ ể ph n trăm c a phân ph i ầ ủ ố χ2 được trình bày trong b ng A5. Giá tr này ph thu c vàoả ị ụ ộ đ t do và trong b ng 2 ộ ự ả × 2 đ t do b ng 1.ộ ự ằ
Trong thí d nàyụ
4 , 21 94 , 86 , 89 , 73 ,
9 , 57
) , 57 73 (
, 59
) , 59 44 (
, 33
) , 33 18 (
, 33
) , 33 49
( 2 2
2
21,4 l n h n 10,83, đi m 0,001 c a phân ph i ớ ể ủ ố χ2 m t đ t do. Do đó xác su t c a sộ ộ ự ấ ủ ự khác bi t quan sát đệ ược v t l đáp ng do tình c nh h n 0,001 (0,1%), n u khơngề ỉ ệ ứ ỏ ế có s khác bi t v hi u qu gi a CMF và LPam. Do đó có th k t lu n r ng CMF cóự ệ ề ệ ả ữ ể ế ậ ằ hi u qu t t h n.ệ ả ố
B ng 13.1 K t qu th nghi m CMF và LPam trên b nh nhân ung th vú.ả ế ả ử ệ ệ ư (a) S quan sátố
Ði u trề ị CMF LPam T ng sổ ố
Có 49
(52,7%) (19,8%)18 (36,4%)67
Không 44 73 117
T ng s b nhổ ố ệ
nhân 93 91 184
(a) V ng trọ ị
(3)Có 33,9 33,1 67
Không 59,1 57,9 117
T ng s b nhổ ố ệ
nhân 93 91 184
Công th c ứ χ2 c a MantelHaenzen ủ
Khi trường h p ch có m t b ng 2 x 2 giá tr c a ợ ỉ ộ ả ị ủ χMH2 s h i nh h n ẽ ỏ χ2 c a Pearsonủ tu theo c m u;ỳ ỡ ẫ
2
2
N N
MH
Công th c ứ χ2 c a Yates đ hi u ch nh tính liên t củ ể ệ ỉ ụ
Gi ng nh ki m đ nh bình thố ể ị ường, ki m đ nh chi bình phể ị ương đ i v i b ng 2 ố ả × 2 có th để ượ ả ếc c i ti n nh hi u ch nh tính liên t c, thờ ệ ỉ ụ ường được g i là hi u ch nh tính liênọ ệ ỉ t c c a Yates (Yates' continuity correction). Cơng th c nh sauụ ủ ứ
1 , |
(| 21
2 d f
E E O
cho giá tr ị χ2 nh h n, |O E| có nghĩa là giá tr tuy t đ i c a OE hay nói cách khác,ỏ ơ ị ệ ố ủ giá tr c a OE b qua d u c a nó.ị ủ ỏ ấ ủ
Trong thí d này giá tr c a ụ ị ủ χ2 là
0 , 20 68 , 61 , 44 , 29 ,
9 , 57
) , , 57 73 (
, 59
) , 44 , 59 (
, 33
) , 18 , 33 (
, 33
) , , 33 49
( 2 2
2
So sánh v i ki m đ nh bình thớ ể ị ường
Ki m đ nh bình thể ị ường đ so sánh hai t l và ki m đ nh chi bình phể ỉ ệ ể ị ương cho b ng dả ự trù 2 × 2 th c ch t là tự ấ ương đương v i nhau và ớ χ2 = z2. Ði u này đúng v i c khi cóề ớ ả hay khơng có hi u ch nh tính liên t c, v i đi u ki n là nó cùng hi u ch nh ho c khơngệ ỉ ụ ề ệ ệ ỉ ặ cùng hi u ch nh. T thí d trong B ng 11, zệ ỉ ụ ả 2 v i (khơng hi u ch nh tính liên t c) =ớ ệ ỉ ụ 4,632= 21,4 gi ng h t nh giá tr ố ệ ịχ2 = 21,4 đã được tính trên. Ki m đ nh bình thở ể ị ường có u đi m là d tính kho ng tin c y h n cho hi u s h n và vì v y thư ể ễ ả ậ ệ ố ậ ường đượ ửc s d ng đ so sánh hi u qu đi u tr c a th nghi m lâm sàng hay đ ụ ể ệ ả ề ị ủ ệ ể ướ ược l ng nguy c quy trách. Ki m đ nh ơ ể ị χ2 d áp d ng h n và có th ng d ng đ tính kho ng tin c yễ ụ ơ ể ứ ụ ể ả ậ c a nguy c tủ ương đ i (RR) nên thố ường được s d ng trong các nghiên c u d ch tử ụ ứ ị ễ quan sát. Ngồi ra ki m đ nh ể ị χ2 có th m r ng đ so sánh nhi u t l và dùng choể ộ ể ề ỉ ệ b ng d trù l n h n vàả ự
(4)Tính h p l (validity)ợ ệ
Nên ln ln s d ng hi u ch nh tính liên t c m c dù chúng có tác đ ng nhi u nh tử ụ ệ ỉ ụ ặ ộ ề ấ khi v ng tr nh Khi chúng r t nh ki m đ nh chi bình phọ ị ỏ ấ ỏ ể ị ương (và ki m đ nh bìnhể ị thường) khơng ph i là x p x t t, ngay c khi có hi u ch nh tính liên t c và khi đó nênả ấ ỉ ố ả ệ ỉ ụ dùng ki m đ nh chính xác (exact test) cho b ng 2 ể ị ả × 2. Cochran (1954) đ ngh s d ngề ị ụ ki m đ nh chính xác khi t ng s c a b ng nh h n 20 hay khi nó gi a 20 và 40 và sể ị ổ ố ủ ả ỏ ữ ố nh nh t trong b n giá tr v ng tr nh h n 5. Do đó ki m đ nh chi bình phỏ ấ ố ị ọ ị ỏ ể ị ương h p lợ ệ khi t ng s ph i l n h n 40 b t k các giá tr v ng tr hay khi t ng v ng tr gi a 20ổ ố ả ấ ể ị ọ ị ổ ọ ị ữ và 40 v i đi u ki n t t c các giá tr v ng tr ph i l n h n ho c b ng 5.ớ ề ệ ấ ả ị ọ ị ả ặ ằ
B ng 12. Kí hi u t ng quát cho b ng d trù 2 ả ệ ổ ả ự × 2
Ði u trề ị CMF LPam T ng sổ ố
Có a1 a0 m1
Khơng b1 b0 m0
T ng s b nhổ ố ệ
nhân n1 n0 N
Cơng th c tính nhanhứ
N u các s trong b ng d trù đế ố ả ự ược kí hi u b ng các kí t nh trong b ng 13.2 thì cơngệ ằ ự ả th c đ tính chi bình phứ ể ương nhanh h n cho b ng 2 ơ ả × 2 nh sau:ư
4 , 21 91
93 117 67
) 18 44 73 49 ( 184 )
(
0 1
2 0
m m n n
b a b a N
N u khơng có sai s làm trịn, k t qu có đế ố ế ả ượ ừc t cơng th c tính nhanh hồn tồn đ ngứ nh t v i cơng th c tính ấ ứ χ2 kinh đi n.ể
Cơng th c tính nhanh cho ứ χ2 c a Mantel Haenszel là:ủ 1
2 1
1
2 0
2 ( 1) ( ) ( 1) ( )
m m n n
m n N a N
m m n n
b a b a N
Cơng th c tính nhanh cho ứ χ2 c a Yates đ hi u ch nh tính liên t c là: ủ ể ệ ỉ ụ , 20
93 117 67
) 92 | 18 44 73 49 (| 184 )
2 / |
(|
0 1
2
0
m m n n
N b a b a N
K t qu này tế ả ương t nh nh giá tr đã tính trên, n u khơng xét đ n sai s làm trịn.ự ư ị ế ế ố 3 Bảng lớn
Ki m đ nh chi bình phể ị ương có th để ược áp d ng cho b ng l n h n, nói chung là b ngụ ả ả r x c, trong đó r kí hi u s hàng trong b ng và c là s c t.ệ ố ả ố ộ
) ( ) ( , )
(
2 d f r c
E E O
(5)s h p l n u có ít h n 20% s các giá tr v ng tr dẽ ợ ệ ế ố ị ọ ị ưới 5 và khơng có giá tr v ng trị ọ ị nào nh h n m t. Có th vỏ ộ ể ượt qua h n ch này b ng cách k t h p các hàng (hay cácạ ế ằ ế ợ c t) có giá tr v ng tr th p.ộ ị ọ ị ấ
Khơng có cơng th c tính nhanh cho b ng r x c (trứ ả ường h p đ c bi t 2 x c hay r x 2 sợ ặ ệ ẽ được xét ph n sau). Ph i tính v ng tr cho m i ơ. S d ng các lí lu n y nh trongở ầ ả ọ ị ỗ ụ ậ trường h p b ng 2 ợ ả × 2. Qui t c chung đ tính v ng tr là:ắ ể ọ ị
chung số Tổng
hàng Tổng cột Tổng
E
C n l u ý r ng ki m đ nh chi bình phầ ằ ể ị ương ch h p l n u đỉ ợ ệ ế ược áp d ng cho s th cụ ố ự t trong các ph m trù khác nhau. Khơng bao gi đế ược áp d ng nó cho b ng ch có t lụ ả ỉ ỉ ệ hay ph n trăm mà thơi.ầ
B ng 13. So sánh các ngu n nả ồ ước chính đượ ục s d ng b i gia đình trong 3 làng Tây phiở ở NGU N Ồ
NƯỚC LÀNG A LÀNG B LÀNG C T NG SỔ Ố Sông 20(40,0%) 32(53,3%) 18(45,0%) 70(46,7%) Ao hồ 18(36,0%) 20(33,3%) 12(30,0%) 70(33,3%) Su iố 12(24,0%) 8(13,3%) 10(25,0%) 30(20,0%) T ng sổ ố 50(100,0%) 60(100,0%) 40(100,0%) 150(100,0%)
B ng 14. So sánh các ngu n nả ồ ước chính đượ ục s d ng b i gia đình trong 3 làng Tây phi (v ng ở ở ọ
tr )ị NGU N Ồ
NƯỚC LÀNG A LÀNG B LÀNG C T NG Ổ
SỐ Sông 23,3 28,0 18,7 70 Ao hồ 16,7 20,0 13,3 50 Su iố 10,0 12,0 8,0 30 T ng sổ ố 50 60 40 150 Thí dụ
(6)70 × 50/150 = 23,3 70 × 60/150= 28,0 70 × 40/150 = 18,7
V ng tr có th đọ ị ể ược tính b ng cách áp d ng quy t c chung. Thí d v ng tr c a hằ ụ ắ ụ ọ ị ủ ộ dùng nướ ốc s ng trong làng B là:
0 , 28 150 60 70 chung số tổng (B) cột tổng (sông) hàng tổng
V ng tr c a toàn b b ng đọ ị ủ ộ ả ược trình bày trong B ng 14.ả
4 2 ) ( ) ( 53 , 8 10 12 12 10 10 12 13 12 12 20 20 20 16 16 18 18 18 18 28 28 32 23 23 20 ) ( 2 2 2 2 2 c r df , / ) , ( , / ) , ( , / ) , ( , / ) , ( , / ) , ( , / ) , ( , / ) , ( , / ) , ( , / ) , ( E E O
B i vì 3,53 nh h n 5,39 (đi m 25% c a ở ỏ ể ủ χ2 4 đ t do), có th k t lu n r ng khơng cóộ ự ể ế ậ ằ s khác bi t ý nghĩa gi a các làng v ph n trăm s h dùng các ngu n nự ệ ữ ề ầ ố ộ ước khá nhau (P>0,25)
4 Công thức ngắn gọn cho bảng x c
Ki m đ nh chi bình phể ị ương được áp d ng cho b ng 2 x c, đó là b ng ch có 2 hàngụ ả ả ỉ trình bày s khác bi t gi a c t l th hi n b i c c t trong b ng. Công th c cô đ ngự ệ ữ ỉ ệ ể ệ ộ ả ứ ọ h n trong trơ ường h p nàyợ
1 , ) ( ] / ) / (
[ 2
2
2 d f c
R N R N R n r N
B ng 15. T l hi n nhi m Schistosoma mansoni theo ngh nghi pả ỉ ệ ệ ễ ề ệ S. Manosi
Ng dânư
Nông dân
Ngh nghi pề ệ
Buôn bán th th côngợ ủ t ng sổ ố Dương tính 22(62,9%) 21 (48,8%) 17 (29,3%) 15 (51,7%) 75 (45,5%)
Âm tính 13 22 41 14 90
T ng sổ ố 35 43 58 29 165
Trong đó n th hi n t ng s cho c t và r là giá tr c a ơ trên trong c t đó. rể ệ ổ ố ộ ị ủ ộ 2/n được tính cho m i c t trong b ng và t ng c a chúng là ( ỗ ộ ả ổ ủ Σr2/n). N là t ng s toàn b và R là t ngổ ố ộ ổ s c hàng trên. (đ i v i b ng có 2 c t ch khơng ph i hai hàng, t 'c t' và 'hàng' số ả ố ả ộ ứ ả ộ ẽ đ i ch cho nhau trong ph n trình bày trên.)ổ ỗ ầ
Thí dụ
(7)3 05 , 11 90
75
09 34 83 36 1652
09 , 34 165 / 75 /
83 36 76 98 26 10 83 13
29 15 58 17 43 21 35 22
2 2
2
2
2
f d )
, , ( N
R
, , , , ,
/ / / / /n) (r
Ði u này có ý nghĩa m c 2,5%, g i ý r ng có th có s liên h gi a nguy c nhi mề ứ ợ ằ ể ự ệ ữ ễ b nh và ngh nghi p. Su t m c toàn b c a S. mansoni cao ngệ ề ệ ấ ắ ộ ủ ười ng dân, th p ư ấ ở người buôn bán so v i nông dân và th th công.ớ ợ ủ
5 Bài tập
Ð xem vi c ăn th t có liên quan hay đ c l p đ n viêm ru t ho i t hay không, m tể ệ ị ộ ậ ế ộ ộ nhà khoa h c đã ti n hành m t nghiên c u b nh ch ng thu đọ ế ộ ứ ệ ứ ượ ố ệc s li u nh sau:ư
Table 10. S liên h gi a ăn th t trong th i gian g n đ u và viêm ru t ho i t Papua Newự ệ ữ ị ờ ầ ầ ộ ạ ở
Guinea (OR=11,6) Ăn th t trong th iị
gian g n đâyầ Không ăn th t trongth i gian g n đâyờ ầị T ng sổ ố
Nhóm b nhệ 50 11 61
Nhóm ch ngứ 16 41 57
T ng sổ ố 66 52 118
Ta th y ngấ ười ăn th t có nguy c b viêm ru t ho i t tăng g p 11 l n so v i ngị ị ộ ấ ầ ười không ăn thit. Tuy nhiên đ đ m b o r ng s gia tăng nguy c này không ph i do saiể ả ả ằ ự ả s ng u nhiên ta ti n hành tính giá tr ố ẫ ế ịχ2 và tính m c ý nghĩa c a nó.ứ ủ
Bài gi i:ả
1. Gi thuy t Ho: ăn th t khơng có liên quan đ n viêm ru t ho i t hayả ế ị ế ộ
Nguy c viêm ru t ho i t nhóm ăn th t b ng nguy c viêm ru t ho iơ ộ ị ằ ộ ạ t nhóm khơng ăn th tử ị
2. Ch n ki m đ nh ọ ể ị χ2 v i 1 đ t do, giá tr t i h n là 3,84 v i m c ý nghĩa 5%ớ ộ ự ị ạ ớ ứ 3. Giá tr ịχ2 được tính nh sau:ư
Vì giá tr ị χ2 = 34,72 l n h n giá tr t i h n 3,84 tớ ơ ị ạ ương ng v i m c ý nghĩaứ ớ ứ 0,05 nên chúng ta có th bác b gi thuy t Ho. Tuy niên do đ lể ỏ ả ế ể ượng hoá s m nh c a s liên h , ngạ ủ ự ệ ười ta tính giá tr p (pvalue) . Tra b ng ị ả χ2, ta tìm được p tương ng v i giá tr 34,72 <0,001. Vì v y ta có th báo cáo: bác b giứ ị ậ ể ỏ ả thuy t Ho v i p<0,0001.ế
2. M t cu c đi u tra vi c s d ng mùng độ ộ ề ệ ụ ược ti n hành trong m t m u ng u nhiênế ộ ẫ ẫ g m các đ a tr dồ ứ ẻ ưới 7 tu i khu v c Tây Nguyên. Ði u tra ghi nh n dân t c c aổ ự ề ậ ộ ủ đ a tr và đ a tr thứ ẻ ứ ẻ ường ng mùng có t m permethrin, mùng khơng t m permethrinủ ẩ ẩ hay khơng ng mùng, v i k t qu nh sau:ủ ế ả