[r]
(1)SO SÁNH NHI U TRUNG BÌNH PHÂN TÍCH PHỀ ƯƠNG SAI M c tiêuụ
Sau khi nghiên c u ch đ h c viên có kh năng:ứ ủ ề ọ ả
Nh n th c đậ ứ ược ý nghĩa c a phủ ương pháp phân tích phương sai trong so sánh nhi uề s trung bình. ố
Xây d ng b ng phân tích phự ả ương sai t s li u đ nh lừ ố ệ ị ượng c a 3 hay nhi u h n cácủ ề nhóm
Trình bày được các khái ni m: phân tích phệ ương sai m t chi u, v i hai chi u, baộ ề ề chi u; quy ho ch có l p và khơng có l p, quy ho ch cân đ i và không cân đ i.ề ậ ặ ặ ố ố
So sánh được y u t tác đ ng ng u nhiên và y u t tác đ ng c đ nh.ế ố ộ ẫ ế ố ộ ố ị
1. Gi i thi uớ ệ
Thường có nh ng t p h p s li u ph c t p ch a h n hai nhóm và trong phân tíchữ ậ ợ ố ệ ứ ứ thường ph i so sánh nh ng trung bình c a các nhóm thành ph n. Thí d , ngả ữ ủ ầ ụ ười ta có th mu n phân tích các s đo hemoglobin để ố ố ược thu th p trên m t cu c đi u tra c ngậ ộ ộ ề ộ đ ng đ xem nó có khác nhau theo tu i và gi i tính hay khơng và xem có ph i là sồ ể ổ ả ự khác bi t gi a các nhóm tu i là nh nhau dù là nam hay n Tho t đ u, dệ ữ ổ ữ ầ ường nh cóư th làm đi u này b ng cách dùng m t lo t các ki m đ nh t, so sánh t ng 2 nhóm m t.ể ề ằ ộ ể ị ộ Ði u này không ch r c r i v m t th c ti n mà cịn vơ lí v m t lí thuy t, b i vì ti nề ỉ ắ ố ề ặ ự ễ ề ặ ế ế hành m t s l n các ki m đ nh ý nghĩa có th d n t i m t k t qu có ý nghĩa sai l c.ộ ố ể ị ể ẫ ộ ế ả Thí d có th trơng đ i 1 trong 20 (5%) các ki m đ nh đụ ể ợ ể ị ược ti n hành s có ý nghĩa ế ẽ ở m c 5% ngay c khi khơng có s khác bi t.ứ ả ự ệ
M t phộ ương pháp khác được g i là phân tích phọ ương sai (analysis of variance). Ý nghĩa c a tên này đủ ược trình bày sau. Phương pháp khá ph c t p. Vi c tính tốn m tứ ệ ấ nhi u th i gian và thề ường được ti n hành nh các gói ph n m m máy tính chu n. Vì líế ầ ề ẩ do này, chương này nh n m nh đ n các nguyên lí v i m c đích giúp ngấ ế ụ ườ ọi đ c có đủ ki n th c đ ch đ nh d ng phân tích c n thi t và lí gi i k t qu Dù v y trong chế ứ ể ỉ ị ầ ế ả ế ả ậ ương này cũng trình bày chi ti t c a vi c tính tốn trong trế ủ ệ ường h p đ n gi n nh t, đó làợ ả ấ phân tích phương sai m t chi u, b i vì nó s giúp ích cho vi c n m v ng căn b n c aộ ề ẽ ệ ắ ữ ả ủ phương pháp và quan h c a nó v i ki m đ nh t.ệ ủ ể ị
Phân tích phương sai m t chi u thích h p khi các nhóm so sánh độ ề ợ ược xác b ng b iằ m t y u t (factor), thí d nh so sánh trung bình gi a các giai c p khác nhau hay gi aộ ế ố ụ ữ ấ ữ các dân t c khác nhau. Phân tích phộ ương sai hai chi u đề ược mơ t và thích h p khiả ợ vi c chia nhóm d a trên 2 y u t , thí d nh tu i và gi i tính. Phệ ự ế ố ụ ổ ương pháp d dàngễ được m r ng đ so sánh các nhóm đở ộ ể ươc phân lo i chéo b ng nhi u hai y u t ằ ề ế ố
(2)nghiên c u này. Vi c đ a vào phân tích chúng có hai l i ích. Th nh t, ki m đ nh ýứ ệ ợ ứ ấ ể ị nghĩa s khác bi t gi a các nhóm ch ng t c tr nên m nh m (powerful) h n, nghĩa làự ệ ữ ủ ộ ẽ d khi n cho s khác bi t th c s tr thành có ý nghĩa. Th nhì, nó đ m b o s soễ ế ự ệ ự ự ứ ả ả ự sánh các nhóm ch ng t c khơng b sai l ch do c c u nhóm tu i và gi i tính.ủ ộ ị ệ ấ ổ
Cũng có th phân tích s li u để ố ệ ược phân thành nhi u y u t b ng cách dùng m t kĩề ế ố ằ ộ thu t tậ ương t nh ng t ng quát h n g i là h i quy b i (multiple regression). C haiự ổ ọ ộ ả phương pháp đ u cho k t qu gi ng h t nhau nh ng b i vì h i quy b i t ng quát h nề ế ả ố ệ ộ ổ nên nó c n tính tốn ph c t p h n. Vì th nó khơng hi u qu trong các trầ ứ ế ệ ả ường h pợ đ n gi n. Dù v y, s l a ch n ph thu c vào chơ ả ậ ự ự ọ ụ ộ ương trình máy tính có được và chúng có d s d ng hay khơng.ễ ụ
2. Phân tích phương sai m t chi uộ ề
Phân tích phương sai m t chi u (oneway analysis of variance) độ ề ược dùng đ so sánhể trung bình c a m t s nhóm, thí d nh ng n ng đ hemoglobin trung bình c a b nhủ ộ ố ụ ộ ủ ệ nhân c a các lo i b nh h ng c u li m khác nhau (b ng 8.1a). Phủ ệ ầ ề ả ương pháp phân tích được g i là m t chi u b i vì s li u đọ ộ ề ố ệ ược phân tích theo m t bi n s , trong trộ ế ố ường h p này là lo i b nh h ng c u li m. ợ ệ ầ ề
2.1. Kí hi u s d ng cho phân tích phệ ử ụ ương sai m t chi uộ ề
Gi s chúng ta mu n so sánh trung bình c a k nhóm. Hãy kí hi u s đ i tả ố ủ ệ ố ố ượng trong m i nhóm là Nỗ 1, N2, …, Nk. S đ i tố ố ượng trong nhóm j được kí hi u là Nệ j. T ng s đ iổ ố ố
tượng trong t t c các nhóm là Nấ ả 1+ N2+ …+ Nk = N. S li u đố ệ ược trình bày nh sauư
Nhóm Nhóm 1 Nhóm 2 Nhóm k
S li uố ệ X11
X21
XN11
X11
X21
XN22
X1k
X2k
XNkk
Số đ iố
tượng N1 N2 Nk
Trung bình 1 1 N X X N i i 2 2 N X X N i i k N i ik k N X X k
Phương sai ) ( 1 1 1 N X X s N i i ) ( 2 2 2 N X X s N i i ) ( 2 k N
i ik k
k N
X X s
k
Trong kí hi u này chúng ta s d ng 2 cệ ụ ướ ố ố ầc s S đ u xác đ nh đ i tị ố ượng trong nhóm và s th hai xác đ nh nhóm. Do đó Xố ứ ị 21 là giá tr c a đ i tị ủ ố ượng th 2 trong nhóm 1.ứ
(3)d ng kí hi uụ ệ X1, X2,…,Xk, làm trung bình c a các nhóm 1, 2, , k và ủ X là trung bình
chung
Bi n thiên tồn b c a s li u đế ộ ủ ố ệ ược th hi n b ng t ng bình phể ệ ằ ổ ương tồn b các độ ộ l ch c a quan sát so v i trung bình chung và đệ ủ ược g i t t là t ng bình phọ ắ ổ ương tồn bộ (total sum of square – total SS). Đ t do c a t ng bình phộ ự ủ ổ ương tồn b chúng là t ngộ ổ s các đ i tố ố ường 1
2.2 Phân tích thành ph n c a t ng bình phầ ủ ổ ương tồn bộ
Có th s d ng đ i s đ ch ng minh t ng bình phể ụ ố ể ứ ổ ương tồn b có th độ ể ược chia thành 2 ph n đ c l p v i nhau: t ng bình phầ ộ ậ ổ ương n i b nhóm (withingroup SS) vàộ ộ t ng bình phổ ương gi a các nhóm (betweengroup SS).ữ
k
j N
i
k
j j j j ij k j N i ij k j N i j k j N
i ij j k j N i ij j j j j j X X N X X X X X X X X X X
1 1
2 1 1 1 1 ) ( ) ( ) ( ) ( ) ( ) (
S h ng v trái là t ng bình phố ế ổ ương toàn b v ph i, s h ng đ u c a tiên làộ Ở ế ả ố ầ ủ t ng bình phổ ương n i b nhóm và s h ng th nhì là t ng bình phộ ộ ố ứ ổ ương gi a cácữ nhóm. Có th nh n xét để ậ ượ ổc t ng bình phương n i b nhóm có th độ ộ ể ược tính từ phương sai c a t ng nhómủ
) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( 2 1 2 2 2 1 1
2
k k k k k j N
i ij j
N
i ik k N i i N i i k j N
i ij j
N s N s N s X X X X X X X X X X j k j
2.3 Phân tích đ t doộ ự
Chúng ta đã bi t đ t do c a t ng bình phế ộ ự ủ ổ ương tồn b chúng là t ng s các đ iộ ổ ố ố tường 1 (N1). Đ t do này cũng độ ự ược chia thành 2 thành ph n đ c l p và c ng tính,ầ ộ ậ ộ đ t do c a s t ng bình phộ ự ủ ự ổ ương gi a các nhóm b ng s nhóm tr m t (k1) và đ tữ ằ ố ộ ộ ự do c a t ng bình phủ ổ ương n i b nhóm b ng (Nk).ộ ộ ằ
2.4 Trung bình bình phương
Khi chúng ta chia t ng bình phổ ương n i b nhóm cho đ t do n i b nhóm chúng taộ ộ ộ ự ộ ộ có trung bình bình phương n i b nhóm (within group mean squares MSộ ộ w). Khi chúng
ta chia t ng bình phổ ương gi a các nhóm cho đ t do gi a các nhóm chúng ta có trungữ ộ ự ữ bình bình phương gi a các nhóm (between group mean squares MSữ b). Khác v i t ngớ ổ
bình phương và đ t do, trung bình bình phộ ự ương khơng có tính ch t c ng tính. ấ ộ
Có th ch ng minh trung bình bình ph ong n i b nhóm (MSể ứ ộ ộ w) là ướ ược l ng khơng
ch ch c a phệ ủ ương sai dân s ố σ2. V i gi thuy t Ho : ớ ả ế µ
1 = µ1 =…= µk, trung bình bình
ph ong gi a các nhóm (MSư ữ b) là ướ ược l ng khơng ch ch c a phệ ủ ương sai dân s ố σ2. Vì
v y n u gi thuy t Ho đúng thì MSậ ế ả ế b cùng v i MSớ w có chung giá tr kì v ng và có phânị ọ
(4)b ng nhau, thì giá tr kì v ng c a MSằ ị ọ ủ b s l n h n kì v ng c a MSẽ ọ ủ w. Vì v y đ ki mậ ể ể
đ nh gi thuy t Ho ngị ả ế ười ta tính xem t s này có phân ph i F hay khơng.ỉ ố ố
2.5 Thí dụ
Phân tích phương sai m t chi u (oneway analysis of variance) độ ề ược dùng đ so sánhể trung bình c a m t s nhóm, thí d nh ng n ng đ hemoglobin trung bình c a b nhủ ộ ố ụ ộ ủ ệ nhân c a các lo i b nh h ng c u li m khác nhau (b ng 8.1a). Phủ ệ ầ ề ả ương pháp phân tích được g i là m t chi u b i vì s li u đọ ộ ề ố ệ ược phân tích theo m t chi u, trong trộ ề ường h pợ này là lo i b nh h ng c u li m. ạ ệ ầ ề
Vi c tính tốn s li u h ng c u li m đệ ố ệ ầ ề ược trình bày B ng 7(b) và k t qu trình bàyở ả ế ả c a b ng phân tích phủ ả ương sai trong B ng 7(c).ở ả
C t th t trong b ng trình bày lộ ứ ả ượng bi n thiên cho m i đ t do và đế ỗ ộ ự ược g i làọ trung bình bình phương (mean square MS). Ki m đ nh ý nghĩa cho s khác bi t gi aể ị ự ệ ữ các nhóm d a trên trung bình bình phự ương gi a các nhóm (between groups) và trongữ n i b các nhóm (within groups). N u s khác bi t quan sát độ ộ ế ự ệ ược trong n ng đồ ộ hemoglobin c a các lo i b nh h ng c u li m khác nhau ch là tình c , s bi n thiênủ ệ ầ ề ỉ ự ế gi a các nhóm cũng tữ ương đương v i s bi n thiên gi a các đ i tớ ự ế ữ ố ượng trong cùng m tộ lo i b nh. Ngạ ệ ượ ếc l i n u chúng là do s khác bi t th c s thì s bi n thiên gi a cácự ệ ự ự ự ế ữ nhóm s l n h n. Trung bình bình phẽ ương được so sánh b ng ki m đ nh F, đơi khi cịnằ ể ị được g i là ki m đ nh t s phọ ể ị ỉ ố ương sai (varianceratio)
Trong đó N là t ng s các quan sát và k là s các nhóm.ổ ố ố
F ph i x p x b ng 1 n u khơng có s khác bi t th c s gi a các nhóm và l n h n 1ả ấ ỉ ằ ế ự ệ ự ự ữ n u có s khác bi t. Theo gi thuy t trung tính cho r ng s khác bi t ch là do tình c ,ế ự ệ ả ế ằ ự ệ ỉ t s này s tuân theo phân ph i F mà không gi ng v i các phân ph i khác, nó có m tỉ ố ẽ ố ố ố ộ c p đ t do: (k1) đ t do t s và (Nk) đ t do m u s Ði m ph n trăm c aặ ộ ự ộ ự ố ộ ự ẫ ố ể ầ ủ phân ph i F đố ượ ậc l p b ng theo các c p đ t do B ng A4. C t c a b ng ch đ tả ặ ộ ự ả ộ ủ ả ỉ ộ ự do c a t s và các kh i g m nhi u hàng ch đ t do c a m u s trong m i kh i nàyủ ố ố ề ỉ ộ ự ủ ẫ ố ỗ ố có nh ng hàng khác nhau cho m c ph n trăm khác nhau. Ði m ph n trăm là m t điữ ứ ầ ể ầ ộ b i vì ki m đ nh d a trên phân ph i F l n h n m t.ở ể ị ự ố ộ
Trong B ng 7(c), F=50,26/0,95=52,9 v i đ t do (2,38). B ng đi m ph n trăm cóả ộ ự ả ể ầ hàng cho 30 và 40 đ t do ch khơng có hàng cho 38 đ t do. Dù v y chúng ta có thộ ự ứ ộ ự ậ ể nói r ng đi m 0,1% c a F(2,38) gi a 8,77 và 8,25 (là đi m 0,1% c a F(2,30) vàằ ể ủ ữ ể ủ F(2,40)). Rõ ràng 52,9 l n h n c hai. Do đó n ng đ hemoglobin khác nhau m t cáchớ ả ộ ộ có ý nghĩa gi a các b nh nhân m c các lo i b nh h ng c u li m khác nhau (P<0,001).ữ ệ ắ ệ ầ ề N ng đ trung bình th p nh t là bênh nhân có Hb SS, trung bình đ i v i b nh nhân cóồ ộ ấ ấ ố ệ Hb S/ßthalassaemia và cao nh t đ i v i b nh nhân có Hb SC.ấ ố ệ
2.6 Gi đ nh:ả ị
(5)2.7 M i liên h v i ki m đ nh t hai m uố ệ ớ ể ị ẫ
Phân tích phương sai m t chi u là s m r ng c a ki m đ nh t hai m u. Khi ch có haiộ ề ự ộ ủ ể ị ẫ ỉ m u, nó cho k t qu y nh là ki m đ nh t. Giá tr F b ng bình phẫ ế ả ể ị ị ằ ương giá tr t tị ương ng và đi m ph n trăm c a phân ph i F v i (1,N2) đ t do cũng b ng bình ph ng
ứ ể ầ ủ ố ộ ự ằ ươ
(6)B ng 7. Phân tích phả ương sai m t chi u: s khác bi t trong n ng đ hemoglobin gi a các b nh ộ ề ự ệ ồ ộ ữ ệ
nhân b các lo i b nh h ng c u li m khác nhau. S li u t Anionwo et al. (1981) British Medical ị ạ ệ ồ ầ ề ố ệ ừ
Journal, 282, 2836 (a) S li uố ệ
Lo i b nhạ ệ h ng c uồ ầ li mề
HbSS HbS/beta
thalassemia HbSC
S li uố ệ 7,2; 7,7; 8,0; 8,1; 8,3; 8,4; 8,4; 8,5; 8,6; 8,7; 9,1; 9,1; 9,1; 9,8; 10,1; 10,3
8,1; 9,2; 10,0; 10,4; 10,6; 10,9; 11,1; 11,9; 12,0; 12,1
10,7; 11,3; 11,5; 11,6; 11,7; 11,8; 12,0; 12,1; 12,3; 12,6; 12,6; 13,3; 13,3; 13,8; 13,9 S đ iố ố
tượng Ni
16 10 15
Trung bình Xi
8,712 10,630 12,3
Đ l chộ ệ chu n (sẩ i)
0,844 1,284 0,942
(b) Tính tốn
_
N = Σ Ni = 16 + 10 + 15 = 41, s nhóm (k) = 3ố 10.4927
41 , 430
1
N X N X
k
j j j
92 , 99 ) (
1
2
k
j j j
b N X X
SS
d.f. = k1 = 2
SSw = =15 × 0,8442 + 9 × 1,2842 + 14 × 0,9422 = 37,95 d.f.= N - k = 41-3 = 38
SS = SSb + SSw=137,87
d.f.= N-1 = 40
(7)Ngu n bi n thiênồ ế SS d.f MS = F=
Gi a các nhómữ 99,92 49,96 50.03 , P<0,001
Trong các nhóm 37,95 38 0,996
T ng c ngổ ộ 137,87 40
3. Phân tích phương sai hai chi uề
Người ta dùng phân tích phương sai hai chi u (two way analysis of variance) khi sề ố li u đệ ược phân lo i theo hai chi u thí d nh theo tu i và gi i tính. S li u là quyạ ề ụ ổ ố ệ ho ch cân đ i (balanced design) n u s các quan sát trong các nhóm là b ng nhau vàạ ố ế ố ằ quy ho ch khơng cân đ i (unbalanced design) n u s các quan sát trong các nhómạ ố ế ố khơng b ng nhau. Qui ho ch cân đ i có hai lo i có l p (with replication) n u có nhi uằ ố ặ ế ề quan sát trong m i nhóm và khơng có l p (without replication) n u ch có m t quan sát.ỗ ặ ế ỉ ộ Ba lo i quy ho ch này s đạ ẽ ược trình bày riêng
4. Quy ho ch cân đ i có l pạ ố ặ
B ng 8.2 trình bày k t qu th c nghi m trên 3 ch ng chu t m i ch ng g m 5 chu tả ế ả ự ệ ủ ộ ỗ ủ ộ đ c và 5 chu t cái đự ộ ược đi u tr b ng hormone tăng trề ị ằ ưởng. M c đích là tìm xem cácụ ch ng chu t và gi i tính chu t có đáp ng v i đi u tr nh nhau hay khơng. S đo c aủ ộ ộ ứ ề ị ố ủ đáp ng là tăng tr ng sau 7 ngày.ứ ọ
Nh ng s li u này đữ ố ệ ược phân lo i theo hai chi u, b i ch ng t c và gi i tính. Quyạ ề ủ ộ ho ch là cân đ i có l p (balanced with replication) b i vì có 5 quan sát trong m i nhómạ ố ặ ỗ ch nggi i tính. Phân tích phủ ương sai 2 chi u chia t ng bình phề ổ ương thành 4 thành ph nầ
(i) T ng bình phổ ương do s khác bi t gi a các ch ng. Ði u này là tác đ ng chínhự ệ ữ ủ ề ộ (main effect) c a y u tó, ch ng. Ð t do c a nó là s các ch ng chu t tr m t vàủ ế ủ ộ ự ủ ố ủ ộ ộ b ng 2.ằ
(ii) T ng bình phổ ương do s khác bi t gi i tính, đó là tác đ ng chính c a gi i tính. Ðự ệ ộ ủ ộ t do c a nó b ng 1, b ng s các gi i tính tr m t.ự ủ ằ ằ ố ộ
(iii) T ng bình phổ ương do s tự ương tác (interaction) gi a ch ng và gi i tính. S tữ ủ ự ương tác có nghĩa là s khác bi t do ch ng khơng gi ng nhau trên c hai gi i hay ngự ệ ủ ố ả ượ ạc l i s khác bi t do gi i tính khơng gi ng nhau trên 3 ch ng chu t. Ð t do b ng tích sự ệ ố ủ ộ ộ ự ằ ố đ t do c a 2 tác đ ng chính b ng 2 x 1=1ộ ự ủ ộ ằ
(iv) t ng bình phổ ương ph n d là s khác bi t gi a các con chu t trong cùng nhómầ ự ệ ữ ộ ch nggi i tính. Ð t do b ng 24, tích s c a s ch ng (3) s gi i tính (2) và s quanủ ộ ự ằ ố ủ ố ủ ố ố sát trong m i nhóm tr m t (4).ỗ ộ