36 3.4.4. Kiểm ñịnh 2 mẫu bằng phép thử t (phương sai không bằng nhau) Khi g ặ p ph ả i tr ườ ng h ợ p 2 m ẫ u mà ph ươ ng sai không b ằ ng nhau (t ỷ s ố c ủ a ñộ l ệ ch chu ẩ n l ớ n h ơ n 1,5), ta không th ể dùng ph ươ ng sai ướ c tính chung cho phép th ử nh ư ñ ã trình bày ở ph ầ n 3.3. M ộ t s ố ph ầ n m ề m th ố ng kê s ẽ giúp chúng ta gi ả i quy ế t nh ữ ng bài toán khi ph ươ ng sai không ñồ ng nh ấ t, trong ñ ó có ph ầ n m ề m Minitab 12.0. N ế u b ạ n mu ố n th ự c hi ệ n phép th ử b ằ ng cách tính tay, hãy s ử d ụ ng các công th ứ c sau ñ ây ñể th ự c hi ệ n. Các k ỹ thu ậ t tính tay s ẽ không ñượ c ñề c ậ p chi ti ế t trong khoá h ọ c này. • Tính t thực nghiệm 2 2 2 1 2 1 2 1 n s n s yy t + − = −− v ớ i b ậ c t ự do 11 2 2 2 2 2 1 2 1 2 1 2 2 2 2 1 2 1 − + − + = n n s n n s n s n s df Các b ướ c khác ñượ c ti ế n hành t ươ ng t ự nh ư ph ầ n 3.3. Ví dụ: M ộ t thí nghi ệ m sinh lý h ọ c ñộ ng v ậ t nh ằ m nghiên c ứ u kh ả n ă ng h ấ p th ụ c ủ a ñộ ng v ậ t l ưỡ ng c ư . Ph ầ n tr ă m t ă ng tr ọ ng c ơ th ể sau khi ngâm mình trong n ướ c sau hai gi ờ ñượ c ghi l ạ i sau ñố i v ớ i hai lo ạ i ñộ ng v ậ t ( ế ch và cóc) Câu h ỏ i ñặ t ra là: Cóc hay ế ch h ấ p th ụ n ướ c nhi ề u h ơ n? Số liệu: Cóc 2,31 25,23 28,37 14,16 28,39 27,94 17,68 Ế ch 0,85 2,90 2,47 17,72 3,82 2,86 13,71 7,38 Chúng tôi ch ỉ áp d ụ ng ph ầ n m ề m Minitab 12.0 ñể gi ả i quy ế t ví d ụ này MTB > desc c1; Stat > Basic Statistics > Display Descriptive Statistics… SUBC> by c2. Descriptive Statistics: Coc, Ech Variable N Mean Median TrMean StDev SE Mean Coc 7 20.58 25.23 20.58 9.84 3.72 Ech 8 6.46 3.36 6.46 6.10 2.16 Variable Minimum Maximum Q1 Q3 Coc 2.31 28.39 14.16 28.37 Ech 0.85 17.72 2.57 12.13 37 Boxplot Ech MTB > Boxplot 'Coc' 'Ech'; Graph > Boxplot… EchCoc 30 20 10 0 Coc ðộ l ệ ch chu ẩ n c ủ a hai nhóm r ấ t khác nhau ( Ế ch: 6,10 so v ớ i Cóc: 9,84), nh ư v ậ y phép th ử t s ử d ụ ng ph ươ ng sai chung không th ể áp d ụ ng ñượ c. Bi ể u ñồ h ộ p c ũ ng ch ứ ng t ỏ s ự bi ế n ñộ ng c ũ ng không b ằ ng nhau vì v ậ y ta s ẽ s ử d ụ ng phép th ử t c ủ a Satterthwaite. Two-Sample T-Test and CI: Coc, Ech Stat > Basic Statistics > 2-sample t… Two-sample T for Coc vs Ech N Mean StDev SE Mean Coc 7 20.58 9.84 3.7 Ech 8 6.46 6.10 2.2 Difference = mu Coc - mu Ech Estimate for difference: 14.12 95% CI for difference: (4.40, 23.84) T-Test of difference = 0 (vs not =): T-Value = 3.28 P-Value = 0.009 DF = 9 Ta th ấ y r ằ ng, cóc h ấ p th ụ nhi ề u n ướ c h ơ n ế ch (P = 0,009). ðộ t ự do trong phép th ử này (9) nh ỏ h ơ n trong phép th ử t chung (n 1 + n 2 – 2 = 13) 38 3.5. So sánh cặp ñôi bằng phép thử t 3.5.1. Giới thiệu So sánh c ặ p ñ ôi b ằ ng phép th ử t ñượ c s ử khi 2 ñạ i di ệ n m ẫ u ñượ c rút t ừ qu ầ n th ể có liên h ệ v ớ i nhau ho ặ c nh ữ ng quan sát theo t ừ ng c ặ p. Ví d ụ theo dõi 10 con chó, m ỗ i con nh ậ n ñượ c 2 cách x ử lý khác nhau. 3.5.2. Các ñiều kiện ñể tiến hành phép thử Các ñ i ề u ki ệ n c ầ n thi ế t ñố i v ớ i phép so sánh c ặ p ñ ôi là: • ðộ ng v ậ t thí nghi ệ m ñượ c ch ọ n m ộ t cách ng ẫ u nhiên • M ỗ i ñộ ng v ậ t v ừ a là ñố i ch ứ ng v ừ a là thí nghi ệ m ñượ c ch ọ n ng ẫ u nhiên t ừ qu ầ n th ể . • C ặ p t ự nhiên - m ỗ i c ặ p ñượ c ch ọ n ng ẫ u nhiên t ừ qu ầ n th ể có nh ữ ng ñặ c ñ i ể m t ươ ng t ự nhau, ví d ụ nh ư sinh ñ ôi cùng ch ứ ng, cùng gi ớ i tính, sinh cùng l ứ a • C ặ p t ươ ng ñồ ng - ðộ ng v ậ t ñượ c ch ọ n ng ẫ u nhiên t ừ qu ầ n th ể , sau ñ ó ñượ c phân thành t ừ ng c ặ p t ươ ng t ự nhau d ự a trên các tính tr ạ ng khác nhau; ví d ụ có cùng ñộ tu ổ i, tr ọ ng l ượ ng c ơ th ể , th ể tr ạ ng, cùng b ố • ðộ ng v ậ t ñượ c phân v ề các lô hoàn toàn ng ẫ u nhiên • Tr ườ ng h ơ p ñộ ng v ậ t thí nghi ệ m v ừ a là ñố i ch ứ ng; m ỗ i ñộ ng v ậ t ñượ c áp d ụ ng m ộ t trong hai công th ứ c thí nghi ệ m hoàn toàn ng ẫ u nhiên, công th ứ c còn l ạ i s ẽ ñượ c áp d ụ ng sau ñ ó. • ðố i v ớ i các tr ườ ng h ợ p c ặ p t ự nhiên hay t ươ ng ñồ ng, m ỗ i ñộ ng v ậ t thí nghi ệ m trong t ừ ng c ặ p ñượ c áp d ụ ng công th ứ c thí nghi ệ m hoàn toàn ng ẫ u nhiên. • S ự chênh l ệ ch c ủ a t ừ ng c ặ p quan sát ph ả i có phân b ố chu ẩ n ho ặ c g ầ n chu ẩ n. Tr ườ ng h ợ p s ố li ệ u nêu ở ph ầ n trên không có phân chu ẩ n, chúng ta có th ể ti ế n hành bi ế n ñổ i s ố li ệ u ñể áp d ụ ng phép th ử t c ặ p ñ ôi. N ế u bi ế n ñổ i s ố li ệ u c ũ ng không mang l ạ i cho ta k ế t qu ả mong ñợ i, thì có th ể áp d ụ ng th ố ng kê phi tham s ố ñể so sánh (s ẽ không ñề c ậ p ñế n trong khoá h ọ c này) 3.5.3. Các bước giả quyết • Giả thiết H 0 : Trung bình c ủ a s ự chênh l ệ ch c ủ a t ừ ng c ặ p trong qu ầ n th ể µ d = 0 H 1 : Trung bình c ủ a s ự chênh l ệ ch c ủ a t ừ ng c ặ p trong qu ầ n th ể µ d ≠ 0 • Kiểm tra phân bố chuẩn của số liệu (phần chênh lệch giữa từng cặp) Ki ể m tra phân b ố c ủ a s ố li ệ u b ằ ng cách quan sát bi ể u ñồ t ầ n su ấ t c ủ a chúng v ớ i s ự tr ợ giúp c ủ a ph ầ n m ề m Minitab 12.0. Có th ể tham kh ả o thêm ở ph ầ n 3.3 và 3.4. • Kiểm tra sự ñồng nhất của phương sai 39 Ư u ñ i ể m c ủ a phép th ử c ặ p ñ ôi là không ph ả i ki ể m tra s ự ñồ ng nh ấ t c ủ a ph ươ ng sai; b ở i vì ở ñ ây chúng ta ch ỉ ki ể m ñị nh ch ỉ m ộ t m ẫ u ñ ó chính là s ự chênh c ủ a t ừ ng c ặ p mà thôi. • Tính giá tr ị t th ự c nghi ệ m ns d dSE d t d −− == )( v ớ i 1 − = ndf - n là dung lượng mẫu - d giá trị trung bình chênh lệch của cặp - )(dSE sai số tiêu chuẩn ước tính của sự chênh lệch - d s là sai ñộ lệch chuẩn ước tính của sự chênh lệch • Xác ñịnh giá trị P Xác ñị nh giá tr ị P b ằ ng cách so sánh giá tr ị t th ự c nghi ệ m v ớ i phân b ố t v ớ b ậ c t ự do là n - 1 trong b ả ng t ở ph ầ n ph ụ l ụ c ho ặ c v ớ i s ự tr ợ giúp c ủ a ph ầ n m ề m th ố ng kê Minitab. • Rút ra kết luận Tu ỳ thu ộ c vào giá tr ị P thu ñượ c, ta có th ể ñư a ra k ế t lu ậ n v ề gi ả thi ế t: N ế u P ≥ 0,05 gi ả thi ế t H 0 ñượ c ch ấ p nh ậ n N ế u P < 0,05 bác b ỏ gi ả thi ế t H 0 t ứ c là ch ấ p nh ậ n H 1 • Khoảng tin cậy của giá trị trung bình sự chênh lệch Kho ả ng tin c ậ y 95% c ủ a giá tr ị trung bình ñượ c xác ñị nh theo công th ứ c sau: )()( 025,0 1 025,0 1 nstddSEtd dnn −− ±=± trong ñ ó )025.0( 2 21 −+nn t là 2,5% giá tr ị phía trên c ủ a phân b ố t v ớ i b ậ c t ự do n − 1. 3.5.4. Ví dụ Có 15 tr ạ i cùng tham gia th ử nghi ệ m kh ẩ u ph ầ n ă n c ủ a l ợ n, trong ñ ó kh ẩ u ph ầ n ă n bình th ườ ng (kh ẩ u ph ầ n A) ñượ c so sánh v ớ i kh ẩ u ph ầ n có b ổ sung ñồ ng (kh ẩ u ph ầ n B). M ỗ i tr ạ i ch ọ n ra 2 khu nuôi l ợ n t ươ ng t ự nhau m ộ t cách t ố i ñ a v ề các ch ỉ tiêu và phân chia theo kh ẩ u ph ầ n m ộ t cách ng ẫ u nhiên; m ộ t khu cho ă n v ớ i m ộ t trong hai kh ẩ u ph ầ n khu kia cho ă n v ớ i kh ẩ u ph ầ n còn l ạ i . T ă ng tr ọ ng trung bình (kg/ngày) c ủ a m ộ t con l ợ n ñố i v ớ i m ỗ i khu ñượ c ghi l ạ i nh ư sau: Tr ạ i Kh ẩ u ph ầ n Tr ạ i Kh ẩ u ph ầ n Tr ạ i Kh ẩ u ph ầ n A B A B A B 1 0,42 0,53 6 0,50 0,52 11 0,50 0,51 2 0,53 0,47 7 0,44 0,44 12 0,54 0,54 3 0,48 0,56 8 0,45 0,46 13 0,46 0,50 4 0,50 0,59 9 0,30 0,43 14 0,48 0,50 5 0,42 0,47 10 0,52 0,57 15 0,53 0,59 Câu h ỏ i ñặ t ra là: Khi b ổ sung thêm ñồ ng có làm cho t ă ng tr ọ ng cao h ơ n không? 40 Lời giải T ừ m ỗ i tr ạ i 2 quan sát ñượ c ch ọ n ra, m ộ t giá tr ị trung bình ñượ c ch ọ n ra t ừ m ỗ i khu. Nh ư v ậ y thí nghi ệ m và s ố li ệ u thu ñượ c ñượ c b ố trí d ướ i d ạ ng c ặ p ñ ôi. N ế u c ả th ả y có 30 tr ạ i ñượ c s ử d ụ ng ñể nghiên c ứ u và ch ọ n ng ẫ u nhiên 15 tr ạ i cho kh ẩ u A và 15 tr ạ i còn l ạ i cho kh ẩ u ph ầ n B; nh ư v ậ y các m ẫ u hoàn toàn ñộ c l ậ p v ớ i nhau. Trong ph ầ n này ph ầ n tính tay s ẽ không ñề c ậ p t ớ i. Tuy nhiên các b ạ n c ũ ng có th ể t ự tính toán theo các b ướ c ñ ã nêu và hãy so sánh k ế t qu ả ñạ t ñượ c v ớ i ph ầ n m ề m Minitab. 3.5.5. Áp dụng Minitab Gi ả thi ế t H 0 : µ 1 = µ 2 v ớ i H 1 : µ 1 ≠ µ 2 S ắ p x ế p s ố li ệ u vào WorkSheets c ủ a Minitab nh ư sau Data Display Manip > Display data Row A B 1 0.42 0.53 2 0.53 0.47 3 0.48 0.56 4 0.50 0.59 5 0.42 0.47 6 0.50 0.52 7 0.44 0.44 8 0.45 0.46 9 0.30 0.43 10 0.52 0.57 11 0.50 0.51 12 0.54 0.54 13 0.46 0.50 14 0.48 0.50 15 0.53 0.59 Tính các tham s ố th ố ng kê mô t ả Descriptive Statistics: A, B Stat > Basic Statistics > Display Discriptive Statistics Variable N Mean Median TrMean StDev SE Mean A 15 0.4713 0.4800 0.4792 0.0614 0.0159 B 15 0.5120 0.5100 0.5123 0.0517 0.0134 Variable Minimum Maximum Q1 Q3 A 0.3000 0.5400 0.4400 0.5200 B 0.4300 0.5900 0.4700 0.5600 Ti ế n hành phép th ử t c ặ p ñ ôi Paired T-Test and CI: A, B Stat > Basic Statistics > Paired t… Paired T for A - B N Mean StDev SE Mean A 15 0.4713 0.0614 0.0159 B 15 0.5120 0.0517 0.0134 Difference 15 -0.0407 0.0489 0.0126 95% CI for mean difference: (-0.0678, -0.0136) T-Test of mean difference = 0 (vs not = 0): T-Value = -3.22 P-Value = 0.006 V ớ i P = 0,006, ta có th ể k ế t lu ậ n r ằ ng kh ẩ u ph ầ n có b ổ sung ñồ ng ñ ã làm t ă ng tr ọ ng trung bình c ủ a l ợ n t ă ng lên. 41 3.6. Bài kiểm tra số 2 A) Trong m ộ t thí nghi ệ m, 100 con c ừ u ñượ c nuôi theo m ộ t ch ế ñộ riêng. M ụ c ñ ích c ủ a thí nghi ệ m là xác ñị nh xem ch ế ñộ nuôi d ưỡ ng này có làm t ă ng kh ố i l ượ ng 1 n ă m tu ổ i c ủ a c ừ u hay không. 100 con c ừ u này ñượ c l ấ y m ẫ u t ừ qu ầ n th ể có kh ố i l ượ ng trung bình 1 n ă m tu ổ i là 30 kg và ñộ l ệ ch chu ẩ n là 5 kg. Ch ế ñộ nuôi này mang l ạ i giá tr ị trung bình là 32 kg. (gi ả s ử kh ố i l ượ ng c ủ a 100 c ừ u nói trên có phân ph ố i chu ẩ n và ñộ l ệ ch chu ẩ n ñồ ng nh ấ t v ớ i ñộ l ệ ch chu ẩ n c ủ a qu ầ n th ể ) 1. (1 ñ i ể m) Anh (ch ị ) hãy tóm t ắ t các tham s ố c ủ a ñề ra b ằ ng các ký hi ệ u thích h ợ p cùng v ớ i các ñơ n v ị ñ o t ươ ng ứ ng 2. (4 ñ i ể m) Nêu gi ả thi ế t c ủ a phép th ử và cho bi ế t k ế t lu ậ n v ề gi ả thi ế t (không c ầ n nêu t ừ ng b ướ c ti ế n hành phép th ử ). B) ðể so sánh kh ố i l ượ ng s ơ sinh gi ữ a 2 gi ố ng l ợ n Landrace và Yorksire nuôi t ạ i tr ạ i M ỹ V ă n; ti ế n hành cân kh ố i l ượ ng s ơ sinh c ủ a 10 l ợ n Landrace và 18 con c ủ a Yorkshire ngay sau khi sinh. Kh ố i l ượ ng s ơ sinh trung bình c ủ a 10 l ợ n Landrace là 1,21 kg và ñộ l ệ ch chu ẩ n là 0,15 kg; ñố i v ớ i 18 l ợ n gi ố ng Yorkshire có các giá tr ị t ươ ng ứ ng là 1,30 kg và 0,11 kg. 1. 1. (2 ñ i ể m) Anh (ch ị ) hãy tóm t ắ t các tham s ố c ủ a ñề ra b ằ ng các ký hi ệ u thích h ợ p cùng v ớ i các ñơ n v ị ñ o t ươ ng ứ ng và cho bi ế t có th ể dùng phép th ử nào ñể so sánh, vì sao? 2. (3 ñ i ể m) Nêu gi ả thi ế t c ủ a phép th ử và cho bi ế t k ế t lu ậ n v ề gi ả thi ế t trên ở m ứ c P = 0,05 (không c ầ n nêu t ừ ng b ướ c ti ế n hành phép th ử ); bi ế t r ằ ng giá tr ị t c ủ a phép th ử t = 1,82. 42 3.7. So sánh nhiều mẫu bằng phân tích phương sai 3.7.1. Giới thiệu Trong ph ầ n 4 chúng ta ñ ã xem xét ki ể m ñị nh 2 m ẫ u d ự a trên phân b ố t. Trong các ví d ụ ta ñ ã so sánh 2 giá tr ị trung bình c ủ a 2 lô thí nghi ệ m và các phép th ử này ch ỉ phát huy tác d ụ ng khi tho ả mãn hàng lo ạ t các ñ i ề u ki ệ n. Trong ch ươ ng này chúng ta s ẽ xem xét m ộ t phép th ử khác d ự a trên phân b ố F ñể so sánh các ph ươ ng sai v ớ i nhau. Phép th ử này ñượ c s ử d ụ ng ñể so sánh hai hay nhi ề u giá tr ị trung bình v ớ i nhau; các tình hu ố ng r ấ t hay b ắ t g ặ p trong ch ă n nuôi và thú y. 3.7.2. Phân bố F 3.7.3. Cơ sở lý thuyết M ở r ộ ng bài toán ki ể m ñị nh hai m ẫ u, khi chúng ta c ầ n so sánh s ự ñồ ng nh ấ t c ủ a nhi ề u giá tr ị trung bình th ự c nghi ệ m. Ví d ụ , chúng ta mu ố n so sánh ả nh h ưở ng c ủ a 4 kh ẩ u ph ầ n ă n khác nhau ñố i v ớ i t ă ng tr ọ ng c ủ a gà (và so sánh m ứ c t ă ng tr ọ ng c ủ a chúng). Chúng ta có th ể s ử d ụ ng hàng lo ạ t các phép th ử b ằ ng ph ươ ng pháp th ử t ñố i v ớ i 2 m ẫ u ñể so sánh t ừ ng c ặ p các nghi ệ m th ứ c. Chúng ta có c ả th ả y 6 c ặ p ñể so sánh: 1 v ớ i 2; 1 v ớ i 3; 1 v ớ i 4; 2 v ớ i 3; 2 v ớ i 4; 3 v ớ i 4; Vấn ñề ñặt ra : M ỗ i m ộ t phép th ử có xác su ấ t 5% sai s ố v ớ i k ế t qu ả có ý ngh ĩ a. V ớ i sáu l ầ n th ử , s ẽ có xác su ấ t 1 - (1 - 0,05) 6 = 0,2654 sai s ố t ừ k ế t qu ả có ý ngh ĩ a. Vì v ậ y chúng ta c ầ n ph ả i có m ộ t ph ươ ng pháp khác ñể so sánh s ự ñồ ng nh ấ t c ủ a t ấ t c ả các giá tr ị trung bình c ủ a nghi ệ m th ứ c. N ế u quan sát các giá tr ị thu ñượ c ta th ấ y, trong cùng m ộ t công th ứ c c ũ ng có s ự sai gi ữ a các cá th ể (ví d ụ s ự khác nhau gi ữ a các cá th ể trong t ừ ng kh ẩ u ph ầ n) còn g ọ i là sai số ngẫu nhiên và s ự sai khác gi ữ a các công th ứ c v ớ i nhau g ọ i là ả nh h ưở ng c ủ a nghiệm thức ; ta có th ể mô hình hoá nh ư sau: Tổng toàn bộ biến ñộng = Biến ñộng nghiệm thức + Biến ñộng do sai số ngẫu nhiên Chúng ta s ẽ ti ế n hành tính các giá tr ị này nh ư th ế nào? 3.7.4. Các ñiều kiện ñể tiến hành phép thử 1. S ố li ệ u ph ả i có phân b ố chu ẩ n y ij ~ N(µ i ,σ 2 ), ho ặ c ε ij ~ N(0,σ 2 ), 2. Ph ươ ng sai (qu ầ n th ể ) c ủ a các qu ầ n th ể ñồ ng nh ấ t σ 1 = σ 2 = = σ t . 3. Các m ẫ u ñộ c l ậ p v ớ i nhau và ñượ c ch ọ n ng ẫ u nhiên t ừ m ộ t qu ầ n th ể có phân b ố chu ẩ n . Coc 7 20.58 25.23 20.58 9.84 3.72 Ech 8 6. 46 3. 36 6. 46 6 .10 2 . 16 Variable Minimum Maximum Q1 Q3 Coc 2. 31 28.39 14 . 16 28.37 Ech 0.85 17 .72 2.57 12 .13 37 Boxplot Ech MTB. tính tay s ẽ không ñượ c ñề c ậ p chi ti ế t trong khoá h ọ c n y. • Tính t thực nghiệm 2 2 2 1 2 1 2 1 n s n s yy t + − = −− v ớ i b ậ c t ự do 11 2 2 2 2 2 1 2 1 2 1 2 2 2 2 1 2 1 − + − + = n n s n n s n s n s df. N Mean StDev SE Mean A 15 0.4 713 0.0 61 4 0. 015 9 B 15 0. 512 0 0.0 517 0. 013 4 Difference 15 -0.0407 0.0489 0. 012 6 95% CI for mean difference: (-0. 067 8, -0. 013 6) T-Test of mean difference