[r]
(1)SO SÁNH HAI TRUNG BÌNH KI M Ð NH T KHƠNG B T C PỂ Ị Ắ Ặ Mục tiêu
Sau khi nghiên c u ch đ , h c viên có kh năngứ ủ ề ọ ả
1. Tính kho ng tin c y c a hi u s hai trung bình ả ậ ủ ệ ố
2. Ki m đ nh gi thuy t hai trung bình là b ng nhau theo phép ki m t và phép ki m zể ị ả ế ằ ể ể
3. Trình bày được các gi đ nh c a 2 phép ki m t và phép ki m z.ả ị ủ ể ể
1 Giới thiệu
Trong ph n trầ ước chúng ta đã nghiên c u phứ ương pháp suy lu n th ng kê v trungậ ố ề bình c a m t bi n s đ nh lủ ộ ế ố ị ượng trong m t dân s , d a trên s li u t m t m u ng uộ ố ự ố ệ ộ ẫ ẫ nhiên ho c trung bình c a hi u s trặ ủ ệ ố ước sau c a m t bi n s c a cùng dân s Trênủ ộ ế ố ủ ố th c t , chúng ta thự ế ường ph i th c hi n vi c so sánh trung bình c a hai dân s sả ự ệ ệ ủ ố ử d ng m u khơng b t c p. Ðó là hai m u chúng ta ch n t hai dân s khác nhau vàụ ẫ ắ ặ ẫ ọ ố khơng có s liên h gì gi a các quan sát, ch ng h n quan sát th nh t c a m u m tự ệ ữ ẳ ứ ấ ủ ẫ ộ khơng có liên h gì v i quan sát th nh t c a m u hai.ệ ứ ấ ủ ẫ
Trong ph n này chúng ta s nghiên c u hai phầ ẽ ứ ương pháp 1. Tính kho ng tin c y c a hi u s hai trung bình vàả ậ ủ ệ ố
2. Ki m đ nh gi thuy t hai trung bình là b ng nhauể ị ả ế ằ
ng d ng cho hai m u không b t c p
ứ ụ ẫ ắ ặ
2 Kí hiệu
Chúng ta kí hi u trung bình và đ l ch chu n c a bi n s x trong dân s th nh t làệ ộ ệ ẩ ủ ế ố ố ứ ấ
µ1 và σ1 và trong dân s th hai là ố ứ µ2 và σ2. Hi n nhiên là v i hai dân s xác đ nh, cácể ố ị trung bình µ1, µ2 và các đ l ch chu n dân s ộ ệ ẩ ốσ1 và σ2 là không đ i.ổ
N u chúng ta nghiên c u n1 đ i tế ứ ố ượng được ch n ng u nhiên trong dân s 1 và n2 đ iọ ẫ ố ố tượng được ch n ng u nhiên trong dân s 2, chúng ta s tính đọ ẫ ố ẽ ược trung bình x1 và độ
l ch chu n sệ ẩ 1 c a m u 1 và trung bình ủ ẫ x2 và đ l ch chu n sộ ệ ẩ 2 c a m u 2.ủ ẫ
Dân s 1ố M u 1ẫ Dân s 2ố M u 2ẫ
Trung bình µ1 x1 µ2 x2
Ð l ch chu nộ ệ ẩ σ1 s1 σ2 s2
3 Thí dụ
(2)14 đ n 18 tu i (đây là các đ i tế ổ ố ượng được b sung dinh dổ ưỡng trong lúc mang thai và ít nh t trong 3 năm đ u cu c đ i). K t qu nh sauấ ầ ộ ế ả
Nhóm can
thi pệ n Trung bình m uVOẫ2max (L/phút)Ð l ch chu nộ ệ ẩ
Atole 44 2,62 0,54
Fresco 42 2,24 0,54
T s li u này chúng ta có th k t lu n gì v t c đ tiêu th oxy c c đ i hai nhómừ ố ệ ể ế ậ ề ố ộ ụ ự can thi p dinh dệ ưỡng
4 Phân phối mẫu hiệu số hai trung bình
Gi s chúng ta có m t dân s P1 g m nhi u đ i tả ộ ố ề ố ượng được b sung dinh dổ ưỡng v iớ Atole và m t dân s P2 g m nhi u đ i tộ ố ề ố ượng được b sung dinh dổ ưỡng v i Fresco.ớ Gi s chúng ta ti n hành nhi u l n vi c rút ra c m u g m 44 nam thanh niên t dânả ế ề ầ ệ ỡ ẫ s P1 và 42 nam thanh niên t dân s P2 và chúng ta tính hi u s trung bình (ố ố ệ ố x1 x2).
Phân ph i c a các hi u s trung bình (ố ủ ệ ố x1 x2) có các đ c tính sau thay đ i tu theoặ ổ ỳ
gi đ nh c a chúng ta:ả ị ủ
a. Phương sai c a 2 dân s b ng nhauủ ố ằ
1. Giá tr ịx1 x2 s thay đ i t m u này sang m u khác (ẽ ổ ẫ ẫ x1, s1,x2, s2 cũng thay đ i tổ ừ
m u này sang m u khác)ẫ ẫ
2. Giá tr ị x1 x2 s phân ph i đ i x ng chung quanh giá tr (ẽ ố ố ứ ị µ1 µ2) là hi u s trungệ ố
bình th c c a dân s P1 và P2:ự ủ ố
3. Các giá tr g n (ị ầ µ1 µ2) s ph bi n h n các giá tr xa v i (ẽ ổ ế ị µ1 µ2) 4. Sai s chu n c a (ố ẩ ủ x1 x2) s đẽ ược tính theo cơng th c:ứ
) 1 (
2 n n SE
Vi t theo ngơn ng tốn h c hình th cế ữ ọ ứ
X1~N(µ1,σ2) và X2~N(µ2,σ2) => (X1 X2)~(µ1 µ2 , ) b. Phương sai c a 2 dân s khác nhauủ ố
1. Giá tr ịx1 x2 s thay đ i t m u này sang m u khác (ẽ ổ ẫ ẫ x1, s1,x2, s2 cũng thay đ i tổ ừ
m u này sang m u khác)ẫ ẫ
2. Giá tr ị x1 x2 s phân ph i đ i x ng chung quanh giá tr (ẽ ố ố ứ ị µ1 µ2) là hi u s trungệ ố
bình th c c a dân s P1 và P2:ự ủ ố
(3)) (
2 2
2
n n SE
Vi t theo ngơn ng tốn h c hình th cế ữ ọ ứ
X1~N(µ1,σ12) và X2~N(µ2,σ22) => (X1 X2)~(µ1 µ2 , )
Cơng th c này có th ch ng minh s d ng đ nh lí: phứ ể ứ ụ ị ương sai c a t ng (hay hi u) c aủ ổ ệ ủ 2 bi n s đ c l p s b ng t ng c a hai phế ố ộ ậ ẽ ằ ổ ủ ương sai c a 2 bi n s đó.ủ ế ố
Phương sai c a (ủ x1 x2) = Phương sai c a (ủ x1 ) + Phương sai c a (ủ x2)
=
6 Kiểm định giả thuyết để so sánh hai trung bình
Chúng ta có th mu n ki m đ nh gi thuy t là hai trung bình dân s , ể ố ể ị ả ế ố µ1 và µ2, b ngằ nhau hay nói khác đi (µ1 µ2)=0. N u gi thuy t Ho đúng thì hi u s trung bình m u sế ả ế ệ ố ẫ ẽ có phân ph i bình thố ường, t p trung t i giá tr 0 và có sai s chu n thay đ i tu theoậ ị ố ẩ ổ ỳ gi đ nhả ị
a. Phương sai c a 2 dân s b ng nhauủ ố ằ
) 1 (
2 n n SE
Khi đó, Giá tr Z c a hi u s trung bình m u s :ị ủ ệ ố ẫ ẽ
) 1 (
) (
) (
2
2
1
n n
x x SE
x x Z
Tuy nhiên trên th c ti n do chúng ta không th xác đ nh ự ễ ể ị σ m t cách chính xác, chúng taộ
ph i s d ng ả ụ ( 1) ( 1)
) ( ) (
2
2 2 1
n n
s n s n s
đ thay th cho ể ế σ. Khi đó chúng ta s có giáẽ tr t ị
) 1 (
) (
) (
2
2
1
n n s
x x SE
x x t
v i nớ 1+n22 đ t doộ ự (1)
b . Phương sai c a 2 dân s khác nhau ủ ố
) (
2 2
2
n n SE
Khi đó, Giá tr Z c a hi u s trung bình m u s :ị ủ ệ ố ẫ ẽ
) (
) (
) (
2 2
2
2
1
n n
x x SE
(4)Cũng tương t nh l p lu n trên, trên th c ti n do chúng ta không bi t đự ậ ậ ự ễ ế ược chính xác σ1 σ2, nên chúng ta ph i s d ng sả ụ 1 thay th cho ế σ1 và s2 thay th cho ế σ2 và
chúng ta có giá tr t:ị
) (
) (
) (
2 2
2
1
n s n s
x x SE
x x t
(2)
v i ớ ( 1) ( 1)
2 2
4
2
4
2
2 2
n n
s n
n s
n s n s f
d
(3)
Vi c cơng th c tính đ t do khi s d ng gi đ nh 2 phệ ứ ộ ự ụ ả ị ương sai khác nhau tương đ iố khó nh nên đ t do c a phân ph i t khi phớ ộ ự ủ ố ương sai không b ng nhau thằ ường ch tínhỉ tốn các ph n m m th ng. Khi phân tích th ng kê v i máy tính c m tay, ngầ ề ố ố ầ ười ta thường gi đ nh n u c m u c a 2 nhóm đ u trên 20 thì đ t do c a t s trên 30 (xemả ị ế ỡ ẫ ủ ề ộ ự ủ ẽ b ng 1). Khi đó có th khơng c n tra b ng t mà ch c n tra b ng phân ph i chu n. Doả ể ầ ả ỉ ầ ả ố ẩ đó, đơi khi cơng th c ki m đ nh t cho 2 trung bình khi phứ ể ị ương sai khơng b ng nhau v iằ ớ c m u l n ỡ ẫ cịn được g i là cơng th c ki m đ nh zọ ứ ể ị
Bảng Độ tự t phương sai không tương ứng với phương sai nhóm cỡ mẫu nhóm khác nhau
Đ l ch chu n nhóm 1: sộ ệ ẩ 1 1 2
C m u nhóm 1: nỡ ẫ 10 20 20 10 20 20
Đ l ch chu n nhóm 2: sộ ệ ẩ 1 1 1
C m u nhóm 2: nỡ ẫ 10 10 20 10 10 20
Đ t doộ ự 18 18 38 13 28 28
Tóm l i, chúng ta có 2 cơng th c đ ki m đ nh 2 trung bình: cơng th c (1) và cơngạ ứ ể ể ị ứ th c (2). C hai công th c này đ u ch s d ng đứ ả ứ ề ỉ ụ ược khi bi n s c n so sánh có phânế ố ầ ph i bình thố ường. Tuy nhiên cơng th c (1) s d ng khi có th gi đ nh là 2 phứ ụ ể ả ị ương sai b ng nhau và công th c (2) ch đ n gi n đ s d ng khi c m u c a 2 nhóm đ u l n.ằ ứ ỉ ả ể ụ ỡ ẫ ủ ề Trong trường h p n u 2 phợ ế ương sai không b ng nhau, chúng ta s d ng công th c (2)ằ ụ ứ và tính tốn c th đ t do theo cơng th c (3).ụ ể ộ ự ứ
7 Thí dụ tính tốn kiểm định so sánh trung bình
1. Trong thí d so sánh t c đ s d ng oxy c c đ i hai nhóm thanh niên, gi thuy tụ ố ộ ụ ự ả ế Ho được đ a ra làư
Ho: trung bình t c đ s d ng oxy c c đ i nhóm Atole b ng trung bình t c đ số ộ ụ ự ằ ố ộ ử d ng oxy c c đ i nhóm Frescoụ ự
(5)B i vì c hai gi đ nh (a) phở ả ả ị ương sai b ng nhau và (b) c m u 2 nhóm đ u l n đ uằ ỡ ẫ ề ề đúng, chúng ta có th ch n s d ng m t trong 2 phể ọ ụ ộ ương pháp ki m đ nh trên:ể ị
2a. Ki m đ nh s d ng gi đ nh phể ị ử ụ ả ị ương sai b ng nhauằ
3a. Tính giá tr th ng kêị ố
54 , ) 42 ( ) 44 ( 54 , 41 54 , 43 ) ( ) ( ) ( )
( 2
2 2 2 1 n n s n s n s
v i 84 đ t doớ ộ ự
4a. Vì đ t do khá l n nên chúngộ ự ta có th tra b ng phân ph iể ả ố chu n z thay cho b ng t. Ta có ẩ ả
P(|Z|≥3,26)=0,0012
N u chúng ta khơng th tính tr c ti p p, tra b ng chúng ta có th bi t r ng p <0,01 vàế ể ự ế ả ể ế ằ p>0,001
5a. Khi đó chúng ta có th bác b Ho v i p=0,0011, hay nói khác đi s li u cho phépể ỏ ố ệ k t lu n can thi p dinh dế ậ ệ ưỡng b ng Atole tu i nhà tr làm tăng t c đ s d ng oxyằ ổ ẻ ố ộ ụ t i đa tu i trố ổ ưởng thành (p=0,0011)
2b. Ki m đ nh s d ng gi đ nh phể ị ử ụ ả ị ương sai khơng b ng nhauằ
3b. Tính giá tr th ng kêị ố
26 , 1165 , 38 , ) 01357 , ) 24 , 62 , ( ) ( ) ( ) ( 2 2 2 n n x x SE x x t
b i vì c m u c a 2 nhóm đ u l n chúng ta có th cho r ng đ t do c a tở ỡ ẫ ủ ề ể ằ ộ ự ủ cũng khá l n và có th tra b ng phân ph i chu n z thay cho b ng t. N u mu n ch tớ ể ả ố ẩ ả ế ố ặ ch chúng ta có th s d ng cong th c đã trình bày trên đ tính đ t do c a phânẽ ể ụ ứ ể ộ ự ủ ph i t b ng 83,8.ố ằ
4b. Tính giá tr p:ị
P(|Z|≥3,26)=0,0012 5b. K t lu n:ế ậ
Chúng ta có th bác b Ho v i p=0,0011, hay nói khác đi s li u cho phép k t lu n canể ỏ ố ệ ế ậ thi p dinh dệ ưỡng b ng Atole tu i nhà tr làm tăng t c đ s d ng oxy t i đa tu iằ ổ ẻ ố ộ ụ ố ổ trưởng thành (p=0,0012)
7 Ðiều kiện sử dụng test Z
Test Z nh trình bày trên địi h i 2 gi đ nh:ư ỏ ả ị
1. Phân ph i m u c a trung bình m u và phân ph i m u c a hi u s trung bình m uố ẫ ủ ẫ ố ẫ ủ ệ ố ẫ có phân ph i x p x bình thố ấ ỉ ường
(6)2. Ð l ch chu n th c s (đ l ch chu n dân s ) ộ ệ ẩ ự ự ộ ệ ẩ ố σ1 và σ2 có th để ượ ướ ược c l ng m tộ cách chính xác b ng đ l ch chu n m u sằ ộ ệ ẩ ẫ 1 và s2
Chính xác ra, gi đ nh th nh t ch đúng n u giá tr c a s li u trong dân s có phânả ị ứ ấ ỉ ế ị ủ ố ệ ố ph i bình thố ường. Tuy nhiên theo đ nh lí gi i h n trung tâm, v i c m u l n thì phânị ớ ỡ ẫ ph i c a trung bình m u s ti m c n phân ph i bình thố ủ ẫ ẽ ệ ậ ố ường ngay c khi giá tr c a sả ị ủ ố li u trong dân s khơng có phân ph i bình thệ ố ố ường
V gi đ nh th hai, sề ả ị ứ 1 và s2. cũng ướ ược l ng khá chính xác σ1 và σ2 n u c m u l n.ế ỡ ẫ
Vì v y, phậ ương pháp z nói chung đáng tin c y khi c m u đ l n (c m u c a m iậ ỡ ẫ ủ ỡ ẫ ủ ỗ nhóm t 20 tr lên) và hình d ng c a t ch c đ khơng q khơng bình thừ ủ ổ ứ ường. Ngồi ra n u phân tích trên t ch c đ chúng ta th y phân ph i b l ch dế ổ ứ ấ ố ị ệ ương, chúng ta c nầ ph i dùng bi n đ i log đ phân ph i tr l i g n gi ng phân ph i bình thả ế ổ ể ố ầ ố ố ường
8 Phương pháp với mẫu nhỏ
N u m t trong haim u nh , c hai gi đ nh nêu trên s b vi ph m và khi đó s d ngế ộ ẫ ỏ ả ả ị ẽ ị ụ x p x bình thấ ỉ ường là khơng đáng tin c y.ậ
Tuy nhiên n u chúng ta phân tích t ch c đ cho th y các giá tr là tế ổ ứ ấ ị ương đ i đ i x ngố ố ứ và khơng q khác bi t v i phân ph i bình thệ ố ường, chúng ta có th s d ng phể ụ ương pháp bi n c i t phép ki m đ nh z nêu trên. Ðó là s d ng phân ph i t và trong đóế ả ể ị ụ ố ch p nh n sai s thêm vào khi s d ng đ l ch chu n m u s1 và s2 thay vì đ l chấ ậ ố ụ ộ ệ ẩ ẫ ộ ệ chu n th c ẩ ự σ1 và σ2. Tuy nhiên phương pháp này đòi h i thêm m t gi đ nh là hai đỏ ộ ả ị ộ l ch chu n th c ệ ẩ ự σ1 và σ2 là b ng nhau và b ng v i giá tr chung ằ ằ ị σ. Vì v y phậ ương pháp này địi h i hai đ l ch chu n không quá khác nhau (t s c a chúng không l nỏ ộ ệ ẩ ỉ ố ủ h n 2).ơ
Công th c c a ki m đ nh t cũng tứ ủ ể ị ương t nh ki m đ nh z nh ng ch khác công th cự ể ị ỉ ứ c a sai s chu n:ủ ố ẩ
) ( ) (
) ( ) (
) 1 (
2
2 2 1
2
n n
s n s n
n n s SE
s với
Trong công th c trên s là ứ ướ ược l ng c a đ l ch chu n chung ủ ộ ệ ẩ σ và được g i là đọ ộ l ch chu n g p (pooled standard deviation) và trung bình c a hai đ l ch chu n s1 vàệ ẩ ộ ủ ộ ệ ẩ s2 v i h s là m u s trong cơng th c tính đ l ch chu n.ớ ệ ố ẫ ố ứ ộ ệ ẩ
Ð ki m đ nh ý nghĩa th ng kê ngể ể ị ố ười ta tính giá tr tị
) ( ) (
) ( ) (
) 1 (
) (
) (
2
2 2 1
2
2
1
n n
s n s n
n n s
x x SE
x x t
s với
(7)r i tính P(|t|>to) b ng cách s d ng các ph n m m máy tính hay tra b ng phân ph iồ ằ ụ ầ ề ả ố student v i (n1+n22) đ t do. Trong trớ ộ ự ường h p này ngợ ười ta g i đây là test t khôngọ b t c p.ắ ặ
Ð tính kho ng tin c y c a hi u s (ể ả ậ ủ ệ ố µ1 µ2) b ng th ng kê t ta s d ng cơng th c:ằ ố ụ ứ
) 1 ( )
(
2
1 x t s n n x
giá tr t đây cũng đị ược tra t b ng phân ph i student.ừ ả ố
9 So sánh kiểm định z kiểm định t
Ki m đ nh z và ki m đ nh t hoàn toàn tể ị ể ị ương đương trong th ng kê các bi n s đ nhố ế ố ị lượng. Nh v y chúng ta có th s d ng th ng kê z hay t trong ư ậ ể ụ ố ướ ược l ng kho ng tinả c y c a trung bình, c a hi u s 2 trung bình, ki m đ nh ý nghĩa trong so sánh 2 trungậ ủ ủ ệ ố ể ị bình thi t k có b t c p và khơng b t c p. Chúng ch khác nhau v đi u ki n ápở ế ế ắ ặ ắ ặ ỉ ề ề ệ d ng. Ði u ki n áp d ng c a th ng kê z là c m u đ l n (đ trung bình m u cóụ ề ệ ụ ủ ố ỡ ẫ ủ ể ẫ phân ph i bình thố ường và đ l ch chu n m u g n b ng đ l ch chu n dân s ). Ði uộ ệ ẩ ẫ ầ ằ ộ ệ ẩ ố ề ki n áp d ng th ng kê t là phân ph i c a các giá tr ph i x p x bình thệ ụ ố ố ủ ị ả ấ ỉ ường (trong trường h p so sánh 2 m u nó c n thêm đi u ki n là hai đ l ch chu n c a 2 m uợ ẫ ầ ề ệ ộ ệ ẩ ủ ẫ không quá khác nhau)
Khi chúng ta không th áp d ng th ng kê z hay th ng kê t, thí d nh khi c m u nhể ụ ố ố ụ ỡ ẫ ỏ và phân ph i khơng bình thố ường ho c hai phặ ương sai khơng đ ng nh t ta c n ph i sồ ấ ầ ả ử d ng các phép ki m phi tham s ụ ể ố
5 Khoảng tin cậy hiệu số hai trung bình
S d ng l p lu n chúng ta đã trình bày cho vi c tính các kho ng tin c y c a trungử ụ ậ ậ ệ ả ậ ủ bình và t l đ n, chúng ta s có các cơng th c kho ng tin c y 95% c a hi u s (ỉ ệ ẽ ứ ả ậ ủ ệ ố µ1
µ2) tu theo các gi đ nh:ỳ ả ị
a. Gi đ nh phả ị ương sai 2 nhóm b ng nhauằ
Ð tính kho ng tin c y c a hi u s (ể ả ậ ủ ệ ố µ1 µ2) b ng th ng kê t ta s d ng cơng th c:ằ ố ụ ứ
) 1 ( )
(
2
1 x t s n n
x c
v i tớ c là giá tr t i h n c a phân ph i t nị ủ ố 1+n2 2 đ t doộ ự
v i ớ ( 1) ( 1)
) ( ) (
2
2 2 1
n n
s n s n s
b. Gi đ nh phả ị ương sai 2 nhóm khơng b ng nhauằ
Kho ng tin c y c a hi u s (ả ậ ủ ệ ố µ1 µ2) khi phương sai c a 2 nhóm khơng b ng nhauủ ằ được tính theo cơng th c:ứ
) (
) (
2 2 2
1 n
s n s t
x
x c