1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Bài giảng Thống kê y học - Bài 14: So sánh nhiều trung bình - Phân tích phương sai

7 12 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 7
Dung lượng 481,98 KB

Nội dung

[r]

(1)

SO SÁNH NHI U TRUNG BÌNH ­ PHÂN TÍCH PH ƯƠNG SAI M c tiêu

Sau khi nghiên c u ch  đ  h c viên có kh  năng:ứ ủ ề ọ ả

­ Nh n th c đậ ứ ược ý nghĩa c a phủ ương pháp phân tích phương sai trong so sánh nhi uề   s  trung bình. ố

­ Xây d ng b ng phân tích phự ả ương sai t  s  li u đ nh lừ ố ệ ị ượng c a 3 hay nhi u h n cácủ ề   nhóm

­ Trình bày được các khái ni m: phân tích phệ ương sai m t chi u, v i hai chi u, baộ ề ề   chi u; quy ho ch có l p và khơng có l p, quy ho ch cân đ i và không cân đ i.ề ậ ặ ặ ố ố

­ So sánh được y u t  tác đ ng ng u nhiên và y u t  tác đ ng c  đ nh.ế ố ộ ẫ ế ố ộ ố ị

1. Gi i thi u

Thường có nh ng t p h p s  li u ph c t p ch a h n hai nhóm và trong phân tíchữ ậ ợ ố ệ ứ ứ   thường ph i so sánh nh ng trung bình c a các nhóm thành ph n. Thí d , ngả ữ ủ ầ ụ ười ta có  th  mu n phân tích các s  đo hemoglobin để ố ố ược thu th p trên m t cu c đi u tra c ngậ ộ ộ ề ộ   đ ng đ  xem nó có khác nhau theo tu i và gi i tính hay khơng và xem có ph i là sồ ể ổ ả ự  khác bi t gi a các nhóm tu i là nh  nhau dù là nam hay n  Tho t đ u, dệ ữ ổ ữ ầ ường nh  cóư   th  làm đi u này b ng cách dùng m t lo t các ki m đ nh t, so sánh t ng 2 nhóm m t.ể ề ằ ộ ể ị ộ   Ði u này không ch  r c r i v  m t th c ti n mà cịn vơ lí v  m t lí thuy t, b i vì ti nề ỉ ắ ố ề ặ ự ễ ề ặ ế ế   hành m t s  l n các ki m đ nh ý nghĩa có th  d n t i m t k t qu  có ý nghĩa sai l c.ộ ố ể ị ể ẫ ộ ế ả   Thí d  có th  trơng đ i 1 trong 20 (5%) các ki m đ nh đụ ể ợ ể ị ược ti n hành s  có ý nghĩa ế ẽ ở  m c 5% ngay c  khi khơng có s  khác bi t.ứ ả ự ệ

M t phộ ương pháp khác được g i là phân tích phọ ương sai (analysis of variance). Ý  nghĩa c a tên này đủ ược trình bày sau. Phương pháp khá ph c t p. Vi c tính tốn m tứ ệ ấ  nhi u th i gian và thề ường được ti n hành nh  các gói ph n m m máy tính chu n. Vì líế ầ ề ẩ   do này, chương này nh n m nh đ n các nguyên lí v i m c đích giúp ngấ ế ụ ườ ọi đ c có đủ  ki n th c đ  ch  đ nh d ng phân tích c n thi t và lí gi i k t qu  Dù v y trong chế ứ ể ỉ ị ầ ế ả ế ả ậ ương  này cũng trình bày chi ti t c a vi c tính tốn trong trế ủ ệ ường h p đ n gi n nh t, đó làợ ả ấ   phân tích phương sai m t chi u, b i vì nó s  giúp ích cho vi c n m v ng căn b n c aộ ề ẽ ệ ắ ữ ả ủ   phương pháp và quan h  c a nó v i ki m đ nh t.ệ ủ ể ị

Phân tích phương sai m t chi u thích h p khi các nhóm so sánh độ ề ợ ược xác b ng b iằ   m t y u t  (factor), thí d  nh  so sánh trung bình gi a các giai c p khác nhau hay gi aộ ế ố ụ ữ ấ ữ   các dân t c khác nhau. Phân tích phộ ương sai hai chi u đề ược mơ t  và thích h p khiả ợ   vi c chia nhóm d a trên 2 y u t , thí d  nh  tu i và gi i tính. Phệ ự ế ố ụ ổ ương pháp d  dàngễ   được m  r ng đ  so sánh các nhóm đở ộ ể ươc phân lo i chéo b ng nhi u hai y u t ằ ề ế ố

(2)

nghiên c u này. Vi c đ a vào phân tích chúng có hai l i ích. Th  nh t, ki m đ nh ýứ ệ ợ ứ ấ ể ị   nghĩa s  khác bi t gi a các nhóm ch ng t c tr  nên m nh m  (powerful) h n, nghĩa làự ệ ữ ủ ộ ẽ   d  khi n cho s  khác bi t th c s  tr  thành có ý nghĩa. Th  nhì, nó đ m b o s  soễ ế ự ệ ự ự ứ ả ả ự   sánh các nhóm ch ng t c khơng b  sai l ch do c  c u nhóm tu i và gi i tính.ủ ộ ị ệ ấ ổ

Cũng có th  phân tích s  li u để ố ệ ược phân thành nhi u y u t  b ng cách dùng m t kĩề ế ố ằ ộ   thu t tậ ương t  nh ng t ng quát h n g i là h i quy b i (multiple regression). C  haiự ổ ọ ộ ả   phương pháp đ u cho k t qu  gi ng h t nhau nh ng b i vì h i quy b i t ng quát h nề ế ả ố ệ ộ ổ   nên nó c n tính tốn ph c t p h n. Vì th  nó khơng hi u qu  trong các trầ ứ ế ệ ả ường h pợ   đ n gi n. Dù v y, s  l a ch n ph  thu c vào chơ ả ậ ự ự ọ ụ ộ ương trình máy tính có được và chúng  có d  s  d ng hay khơng.ễ ụ

2. Phân tích phương sai m t chi u

Phân tích phương sai m t chi u (one­way analysis of variance) độ ề ược dùng đ  so sánhể   trung bình c a m t s  nhóm, thí d  nh ng n ng đ  hemoglobin trung bình c a b nhủ ộ ố ụ ộ ủ ệ   nhân c a các lo i b nh h ng c u li m khác nhau (b ng 8.1a). Phủ ệ ầ ề ả ương pháp phân tích  được g i là m t chi u b i vì s  li u đọ ộ ề ố ệ ược phân tích theo m t bi n s , trong trộ ế ố ường  h p này là lo i b nh h ng c u li m.  ợ ệ ầ ề

2.1. Kí hi u s  d ng cho phân tích ph ử ụ ương sai m t chi u

Gi  s  chúng ta mu n so sánh trung bình c a k nhóm. Hãy kí hi u s  đ i tả ố ủ ệ ố ố ượng trong  m i nhóm là Nỗ 1, N2, …, Nk. S  đ i tố ố ượng trong nhóm j được kí hi u là Nệ j. T ng s  đ iổ ố ố 

tượng trong t t c  các nhóm là  Nấ ả 1+ N2+ …+ Nk  = N. S  li u đố ệ ược trình bày nh  sauư

Nhóm Nhóm 1 Nhóm 2 Nhóm k

S  li uố ệ X11

X21

XN11

X11

X21

XN22

X1k

X2k

XNkk

Số   đ iố 

tượng N1 N2 Nk

Trung  bình 1 1 N X X N i i 2 2 N X X N i i k N i ik k N X X k

Phương  sai ) ( 1 1 1 N X X s N i i ) ( 2 2 2 N X X s N i i ) ( 2 k N

i ik k

k N

X X s

k

Trong kí hi u này chúng ta s  d ng 2 cệ ụ ướ ố ố ầc s  S  đ u xác đ nh đ i tị ố ượng trong nhóm  và s  th  hai xác đ nh nhóm. Do đó Xố ứ ị 21 là giá tr  c a đ i tị ủ ố ượng th  2 trong nhóm 1.ứ  

(3)

d ng kí hi uụ ệ X1,  X2,…,Xk,   làm trung bình c a các nhóm 1, 2, , k và ủ X là trung bình 

chung

Bi n thiên tồn b  c a s  li u đế ộ ủ ố ệ ược th  hi n b ng t ng bình phể ệ ằ ổ ương tồn b  các độ ộ  l ch c a quan sát so v i trung bình chung và đệ ủ ược g i t t là t ng bình phọ ắ ổ ương  tồn bộ  (total sum of square – total SS). Đ  t  do c a t ng bình phộ ự ủ ổ ương tồn b  chúng là t ngộ ổ   s  các đ i tố ố ường ­1

2.2 Phân tích thành ph n c a t ng bình ph ủ ổ ương tồn b

Có th  s  d ng đ i s  đ  ch ng minh t ng bình phể ụ ố ể ứ ổ ương tồn b  có th  độ ể ược chia  thành 2 ph n đ c l p v i nhau: t ng bình phầ ộ ậ ổ ương n i b  nhóm (within­group SS) vàộ ộ   t ng bình phổ ương gi a các nhóm (between­group SS).ữ

k

j N

i

k

j j j j ij k j N i ij k j N i j k j N

i ij j k j N i ij j j j j j X X N X X X X X X X X X X

1 1

2 1 1 1 1 ) ( ) ( ) ( ) ( ) ( ) (

S  h ng   v  trái là t ng bình phố ế ổ ương toàn b    v  ph i, s  h ng đ u c a tiên làộ Ở ế ả ố ầ ủ   t ng bình phổ ương n i b  nhóm và s  h ng th  nhì là t ng bình phộ ộ ố ứ ổ ương gi a cácữ   nhóm. Có th  nh n xét để ậ ượ ổc t ng bình phương n i b  nhóm   có th  độ ộ ể ược tính từ  phương sai c a t ng nhómủ

) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( 2 1 2 2 2 1 1

2

k k k k k j N

i ij j

N

i ik k N i i N i i k j N

i ij j

N s N s N s X X X X X X X X X X j k j

2.3 Phân tích đ  t  doộ ự

Chúng ta đã bi t đ  t  do c a t ng bình phế ộ ự ủ ổ ương tồn b  chúng là t ng s  các đ iộ ổ ố ố   tường ­1 (N­1). Đ  t  do này cũng độ ự ược chia thành 2 thành ph n đ c l p và c ng tính,ầ ộ ậ ộ   đ  t  do c a s  t ng bình phộ ự ủ ự ổ ương gi a các nhóm b ng s  nhóm tr  m t (k­1) và đ  tữ ằ ố ộ ộ ự  do c a t ng bình phủ ổ ương n i b  nhóm b ng (N­k).ộ ộ ằ

2.4 Trung bình bình phương

Khi chúng ta chia t ng bình phổ ương n i b  nhóm cho đ  t  do n i b  nhóm chúng taộ ộ ộ ự ộ ộ   có trung bình bình phương n i b  nhóm (within group mean squares ­MSộ ộ w). Khi chúng 

ta chia t ng bình phổ ương gi a các nhóm cho đ  t  do gi a các nhóm chúng ta có trungữ ộ ự ữ   bình bình phương gi a các nhóm (between group mean squares ­ MSữ b). Khác v i t ngớ ổ  

bình phương và đ  t  do, trung bình bình phộ ự ương khơng có tính ch t c ng tính. ấ ộ

Có th  ch ng minh trung bình bình ph ong n i b  nhóm (MSể ứ ộ ộ w) là ướ ược l ng khơng 

ch ch c a phệ ủ ương sai dân s  ố σ2. V i gi  thuy t Ho : ớ ả ế µ

1 = µ1 =…= µk,  trung bình bình 

ph ong gi a các nhóm (MSư ữ b) là ướ ược l ng khơng ch ch c a phệ ủ ương sai dân s  ố σ2. Vì 

v y n u gi  thuy t Ho đúng thì MSậ ế ả ế b cùng v i MSớ w  có chung giá tr  kì v ng và  có phânị ọ  

(4)

b ng nhau, thì giá tr  kì v ng c a MSằ ị ọ ủ b s  l n h n kì v ng c a MSẽ ọ ủ w. Vì v y đ  ki mậ ể ể  

đ nh gi  thuy t Ho ngị ả ế ười ta tính  xem t  s  này có phân ph i F hay khơng.ỉ ố ố

2.5 Thí dụ

Phân tích phương sai m t chi u (one­way analysis of variance) độ ề ược dùng đ  so sánhể   trung bình c a m t s  nhóm, thí d  nh ng n ng đ  hemoglobin trung bình c a b nhủ ộ ố ụ ộ ủ ệ   nhân c a các lo i b nh h ng c u li m khác nhau (b ng 8.1a). Phủ ệ ầ ề ả ương pháp phân tích  được g i là m t chi u b i vì s  li u đọ ộ ề ố ệ ược phân tích theo m t chi u, trong trộ ề ường h pợ   này là lo i b nh h ng c u li m. ạ ệ ầ ề

Vi c tính tốn s  li u h ng c u li m đệ ố ệ ầ ề ược trình bày   B ng 7(b) và k t qu  trình bàyở ả ế ả   c a b ng phân tích phủ ả ương sai   trong B ng 7(c).ở ả

C t th  t  trong b ng trình bày lộ ứ ả ượng bi n thiên cho m i đ  t  do và đế ỗ ộ ự ược g i làọ   trung bình bình phương (mean square ­ MS). Ki m đ nh ý nghĩa cho s  khác bi t gi aể ị ự ệ ữ   các nhóm d a trên trung bình bình phự ương gi a các nhóm (between groups) và trongữ   n i b  các nhóm (within groups). N u s  khác bi t quan sát độ ộ ế ự ệ ược trong n ng đồ ộ  hemoglobin c a các lo i b nh h ng c u li m khác nhau ch  là tình c , s  bi n thiênủ ệ ầ ề ỉ ự ế   gi a các nhóm cũng tữ ương đương v i s  bi n thiên gi a các đ i tớ ự ế ữ ố ượng trong cùng m tộ  lo i b nh. Ngạ ệ ượ ếc l i n u chúng là do s  khác bi t th c s  thì s  bi n thiên gi a cácự ệ ự ự ự ế ữ   nhóm s  l n h n. Trung bình bình phẽ ương được so sánh b ng ki m đ nh F, đơi khi cịnằ ể ị   được g i là ki m đ nh t  s  phọ ể ị ỉ ố ương sai (variance­ratio)

Trong đó N là t ng s  các quan sát và k là s  các nhóm.ổ ố ố

F ph i x p x  b ng 1 n u khơng có s  khác bi t th c s  gi a các nhóm và l n h n 1ả ấ ỉ ằ ế ự ệ ự ự ữ   n u có s  khác bi t. Theo gi  thuy t trung tính cho r ng s  khác bi t ch  là do tình c ,ế ự ệ ả ế ằ ự ệ ỉ   t  s  này s  tuân theo phân ph i F mà không gi ng v i các phân ph i khác, nó có m tỉ ố ẽ ố ố ố ộ   c p đ  t  do: (k­1) đ  t  do   t  s  và (N­k) đ  t  do   m u s  Ði m ph n trăm c aặ ộ ự ộ ự ố ộ ự ẫ ố ể ầ ủ   phân ph i F đố ượ ậc l p b ng theo các c p đ  t  do   B ng A4. C t c a b ng ch  đ  tả ặ ộ ự ả ộ ủ ả ỉ ộ ự  do c a t  s  và các kh i g m nhi u hàng ch  đ  t  do c a m u s  trong m i kh i nàyủ ố ố ề ỉ ộ ự ủ ẫ ố ỗ ố   có nh ng hàng khác nhau cho m c ph n trăm khác nhau. Ði m ph n trăm là m t điữ ứ ầ ể ầ ộ   b i vì ki m đ nh d a trên phân ph i F l n h n m t.ở ể ị ự ố ộ

Trong B ng 7(c), F=50,26/0,95=52,9 v i đ  t  do (2,38). B ng đi m ph n trăm cóả ộ ự ả ể ầ   hàng cho 30 và 40 đ  t  do ch  khơng có hàng cho 38 đ  t  do. Dù v y chúng ta có thộ ự ứ ộ ự ậ ể  nói r ng đi m 0,1% c a F(2,38)   gi a 8,77 và 8,25 (là đi m 0,1% c a F(2,30) vàằ ể ủ ữ ể ủ   F(2,40)). Rõ ràng 52,9 l n h n c  hai. Do đó n ng đ  hemoglobin khác nhau m t cáchớ ả ộ ộ   có ý nghĩa gi a các b nh nhân m c các lo i b nh h ng c u li m khác nhau (P<0,001).ữ ệ ắ ệ ầ ề   N ng đ  trung bình th p nh t là bênh nhân có Hb SS, trung bình đ i v i b nh nhân cóồ ộ ấ ấ ố ệ   Hb S/ß­thalassaemia và cao nh t đ i v i b nh nhân có Hb SC.ấ ố ệ

2.6 Gi  đ nh:ả ị

(5)

2.7 M i liên h  v i ki m đ nh t hai m u ệ ớ

Phân tích phương sai m t chi u là s  m  r ng c a ki m đ nh t hai m u. Khi ch  có haiộ ề ự ộ ủ ể ị ẫ ỉ   m u, nó cho k t qu  y nh  là ki m đ nh t. Giá tr  F b ng bình phẫ ế ả ể ị ị ằ ương giá tr  t tị ương  ng và đi m ph n trăm c a phân ph i F v i (1,N­2) đ  t  do cũng b ng bình ph ng

ứ ể ầ ủ ố ộ ự ằ ươ  

(6)

B ng 7. Phân tích ph ương sai m t chi u: s  khác bi t trong n ng đ  hemoglobin gi a các b nh 

nhân b  các lo i b nh h ng c u li m khác nhau. S  li u t  Anionwo et al. (1981) British Medical  ạ ệ ố ệ ừ

Journal, 282, 283­6 (a) S  li uố ệ

Lo i   b nhạ ệ   h ng   c uồ ầ   li mề

HbSS HbS/beta­

thalassemia HbSC

S  li uố ệ 7,2;   7,7;   8,0;   8,1;  8,3;   8,4;   8,4;   8,5;  8,6;   8,7;   9,1;   9,1;  9,1;   9,8;   10,1; 10,3

  8,1;     9,2;   10,0;  10,4;   10,6;   10,9;  11,1;   11,9;   12,0;  12,1

10,7;   11,3;   11,5;  11,6;   11,7;   11,8;  12,0;   12,1;   12,3;  12,6;   12,6;   13,3;  13,3;   13,8;   13,9 S  đ iố ố 

tượng Ni

16 10 15

Trung bình Xi

8,712 10,630 12,3

Đ  l chộ ệ   chu n (sẩ i)

0,844 1,284 0,942

(b) Tính tốn

_

N = Σ Ni = 16 + 10 + 15 = 41, s  nhóm (k) = 3ố 10.4927

41 , 430

1

N X N X

k

j j j

92 , 99 ) (

1

2

k

j j j

b N X X

SS

d.f. = k­1 = 2

SSw = =15 × 0,8442 + 9 × 1,2842 + 14 × 0,9422 = 37,95 d.f.= N - k = 41-3 = 38

SS = SSb + SSw=137,87

d.f.= N-1 = 40

(7)

Ngu n bi n thiênồ ế SS d.f MS =   F=  

Gi a các nhómữ 99,92 49,96 50.03 , P<0,001

Trong các nhóm 37,95 38 0,996

T ng c ngổ ộ 137,87 40

3. Phân tích phương sai hai chi u

Người ta dùng phân tích phương sai hai chi u (two way analysis of variance) khi sề ố  li u đệ ược phân lo i theo hai chi u thí d  nh  theo tu i và gi i tính. S  li u là quyạ ề ụ ổ ố ệ   ho ch cân đ i (balanced design) n u s  các quan sát trong các nhóm là b ng nhau vàạ ố ế ố ằ   quy ho ch khơng cân đ i (unbalanced design) n u s  các quan sát trong các nhómạ ố ế ố   khơng b ng nhau. Qui ho ch cân đ i có hai lo i có l p (with replication) n u có nhi uằ ố ặ ế ề   quan sát trong m i nhóm và khơng có l p (without replication) n u ch  có m t quan sát.ỗ ặ ế ỉ ộ   Ba lo i quy ho ch này s  đạ ẽ ược trình bày riêng

4. Quy ho ch cân đ i có l p

B ng 8.2 trình bày k t qu  th c nghi m trên 3 ch ng chu t m i ch ng g m 5 chu tả ế ả ự ệ ủ ộ ỗ ủ ộ   đ c và 5 chu t cái đự ộ ược đi u tr  b ng hormone tăng trề ị ằ ưởng. M c đích là tìm xem cácụ   ch ng chu t và gi i tính chu t có đáp  ng v i đi u tr  nh  nhau hay khơng. S  đo c aủ ộ ộ ứ ề ị ố ủ   đáp  ng là tăng tr ng sau 7 ngày.ứ ọ

Nh ng s  li u này đữ ố ệ ược phân lo i theo hai chi u, b i ch ng t c và gi i tính. Quyạ ề ủ ộ   ho ch là cân đ i có l p (balanced with replication) b i vì có 5 quan sát trong m i nhómạ ố ặ ỗ   ch ng­gi i tính. Phân tích phủ ương sai 2 chi u chia t ng bình phề ổ ương thành 4 thành  ph nầ

(i) T ng bình phổ ương do s  khác bi t gi a các ch ng. Ði u này là tác đ ng chínhự ệ ữ ủ ề ộ   (main effect) c a y u tó, ch ng. Ð  t  do c a nó là s  các ch ng chu t tr  m t vàủ ế ủ ộ ự ủ ố ủ ộ ộ   b ng 2.ằ

(ii) T ng bình phổ ương do s  khác bi t gi i tính, đó là tác đ ng chính c a gi i tính. Ðự ệ ộ ủ ộ  t  do c a nó b ng 1, b ng s  các gi i tính tr  m t.ự ủ ằ ằ ố ộ

(iii) T ng bình phổ ương do s  tự ương tác (interaction) gi a ch ng và gi i tính. S  tữ ủ ự ương  tác có nghĩa là s  khác bi t do ch ng khơng gi ng nhau trên c  hai gi i hay ngự ệ ủ ố ả ượ ạc l i  s  khác bi t do gi i tính khơng gi ng nhau trên 3 ch ng chu t. Ð  t  do b ng tích sự ệ ố ủ ộ ộ ự ằ ố  đ  t  do c a 2 tác đ ng chính b ng 2 x 1=1ộ ự ủ ộ ằ

(iv) t ng bình phổ ương ph n d  là s  khác bi t gi a các con chu t trong cùng nhómầ ự ệ ữ ộ   ch ng­gi i tính. Ð  t  do b ng 24, tích s  c a s  ch ng (3) s  gi i tính (2) và s  quanủ ộ ự ằ ố ủ ố ủ ố ố   sát trong m i nhóm tr  m t (4).ỗ ộ

Ngày đăng: 09/03/2021, 06:18

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w