43 3.7.5. Các bước tiến hành phân tích B ướ c 1 Nêu lên gi ả thi ế t nghiên c ứ u H 0 : Trung bình c ủ a các qu ầ n th ể b ằ ng nhau µ 1 = µ 2 = … = µ t H 1 : Trung bình c ủ a các qu ầ n th ể không b ằ ng nhau B ướ c 2 Ki ể m tra phân b ố chu ẩ n c ủ a s ố li ệ u b ằ ng cách quan sát bi ể u ñồ t ầ n su ấ t c ủ a chúng v ớ i s ự tr ợ giúp c ủ a ph ầ n m ề m Minitab 12.0 ho ặ c tham kh ả o ở các m ụ c trên. B ướ c3 Ki ể m tra s ự ñồ ng nh ấ t c ủ a ph ươ ng sai )( 22 2 2 1 t σ==σ=σ K . S ự ñồ ng nh ấ t c ủ a ph ươ ng sai ñượ c ki ể m tra b ằ ng phép th ử Levene; phép th ử này có trong h ầ u h ế t các ph ầ n m ề m th ố ng kê không lo ạ i tr ừ Minitab 12.0. Phép th ử cho phép so sánh 2 hay nhi ề u ph ươ ng sai và cho ta bi ế t ngay k ế t qu ả . Tuy nhiên ta c ũ ng có th ể dùng phép th ử kinh ñ i ể n nh ư sau ñể xác ñị nh s ự ñồ ng nh ấ t c ủ a ph ươ ng sai: N ế u t ỷ s ố ñộ lệch chuẩn lớn nhất/ñộ lệch chuẩn nhỏ nhất < 2 thì c ũ ng ch ứ ng t ỏ r ằ ng các ph ươ ng sai ñồ ng nh ấ t B ướ c 4 S ắ p x ế p s ố li ệ u theo t ừ ng nghi ệ m th ứ c và tính t ổ ng c ộ ng theo nghi ệ m th ứ c (T)và t ổ ng s ố toàn b ộ các giá tr ị quan sát c ủ a thí nghi ệ m (G) B ướ c 5 Xây d ự ng c ấ u trúc c ủ a b ả ng phân tích ph ươ ng sai Giá tr ị P lý thuy ế t Ngu ồ n bi ế n ñộ ng B ậ c t ự do (df) T ổ ng bình ph ươ ng (SS) Trung bình bình ph ươ ng (MS) Giá tr ị F quan sát 5% 1% Nghi ệ m th ứ c Sai s ố ng ẫ u nhiên T ổ ng bi ế n ñộ ng B ướ c 6 Xác ñị nh b ậ c t ự do (df) c ủ a nghi ệ m th ứ c, sai s ố ng ẫ u nhiên và t ổ ng bi ế n ñộ ng • df c ủ a t ổ ng bi ế n ñộ ng = n -1 • df c ủ a nghi ệ m th ứ c = t -1 • df sai s ố ng ẫ u nhiên = df t ổ ng bi ế n ñộ ng - df nghi ệ m th ứ c = (n-1) - (t-1) = n - t B ướ c 7 Xác ñị nh giá tr ị hi ệ u ch ỉ nh (CF) và các t ổ ng bình ph ươ ng (SS) t ừ các giá tr ị t ổ ng c ộ ng theo nghi ệ m th ứ c (T) và t ổ ng c ộ ng toàn b ộ các giá tr ị quan sát c ủ a thí nghi ệ m (G) 44 • CF = n G 2 • SS toàn b ộ quan sát = CFx n i i − ∑ =1 2 • SS nghi ệ m th ứ c = CF r T t i i i − ∑ =1 2 B ướ c 8 Tính các giá tr ị trung bình bình ph ươ ng (MS) • MS nghi ệ m th ứ c = SS nghi ệ m th ứ c / (t-1) • MS sai s ố ng ẫ u nhiên = SS sai s ố ng ẫ u nhiên / (n-t) B ướ c 9 Tính giá tr ị F quan sát ñể ki ể m ñị nh m ứ c ý ngh ĩ a c ủ a nghi ệ m th ứ c • F = MS nghi ệ m th ứ c / MS sai s ố ng ẫ u nhiên B ướ c 10 Xác ñị nh giá tr ị F lý thuy ế t trong b ả ng v ớ i df nghi ệ m th ứ c = (t - 1) và df sai s ố ng ẫ u nhiên = (n - t) ở m ứ c ý ngh ĩ a 5% và 1% B ướ c 11 ð i ề n toàn b ộ các giá tr ị c ầ n thi ế t ñ ã tính toàn vào b ả ng ñ ã thành l ậ p ở b ướ c 2 B ướ c 12 So sánh giá tr ị F th ự c nghi ệ m v ớ i giá tr ị F lý thuy ế t ñ ã nêu ở b ướ c 7 và ñư a ra các k ế t lu ậ n v ề s ự sai khác có ý ngh ĩ a gi ữ a các nghi ệ m th ứ c theo các quy t ắ c sau ñ ây: • N ế u giá tr ị F quan sát l ớ n h ơ n giá tr ị F lý thuy ế t ở m ứ c ý ngh ĩ a 1% ta k ế t lu ậ n có sự sai khác rõ rệt giữa các nghiệm thức. • N ế u giá tr ị F quan sát l ớ n h ơ n giá tr ị F lý thuy ế t ở m ứ c ý ngh ĩ a 5% nh ư bé h ơ n ho ặ c b ằ ng giá tr ị F lý thuy ế t ở m ứ c ý ngh ĩ a 1% ta k ế t lu ậ n có sự sai khác giữa các nghiệm thức. • N ế u giá tr ị F quan sát bé h ơ n ho ặ c b ằ ng giá tr ị F lý thuy ế t ở m ứ c ý ngh ĩ a 5% ta k ế t lu ậ n không có sự sai khác giữa các nghiệm thức. K ế t qu ả tính toán các ngu ồ n bi ế n ñộ ng ñượ c trình bày trong b ả ng ANOVA Giá tr ị P lý thuy ế t Ngu ồ n bi ế n ñộ ng B ậ c t ự do (df) T ổ ng bình ph ươ ng (SS) Trung bình bình ph ươ ng (MS) Giá tr ị F quan sát 5% 1% Nghi ệ m th ứ c t -1 SS nghiệm thức MS nghiệm thức F quan sát F 5% F 1% Sai s ố ng ẫ u nhiên n-t SS sai số MS sai số T ổ ng bi ế n ñộ ng n-1 SS tổng số 45 Trung bình bình ph ươ ng c ủ a ph ầ n sai s ố (MS sai số ) là giá tr ị ướ c tính c ủ a σ 2 , ph ươ ng sai c ủ a sai s ố ng ẫ u nhiên (nh ư ta ñ ã bi ế t ε ij ~ N(0,σ 2 )). Trung bình bình ph ươ ng c ủ a nghi ệ m th ứ c ( MS nghiệm thức ) c ũ ng là ướ c tính c ủ a σ 2 n ế u H 0 ñ úng, ng ượ c l ạ i nó s ẽ l ớ n h ơ n σ 2 . Nói cách khác n ế u H 0 ñ úng thì giá tr ị F quan sát (t ỷ s ố ph ươ ng sai) s ẽ có giá tr ị g ầ n b ằ ng 1. Giá tr ị F càng l ớ n ch ứ ng t ỏ gi ả thi ế t H 0 sai. • •• • Khoảng tin cậy Minitab không th ự c hi ệ n ñượ c phép th ử t ñể so sánh. Tuy nhiên chúng ta hoàn toàn có th ể xây d ự ng kho ả ng tin c ậ y 95% ñố i v ớ i sai khác gi ữ a t ừ ng c ặ p giá tr ị trung bình. Kho ả ng tin c ậ y 95% s ự sai khác gi ữ a các giá tr ị trung bình ñượ c xác ñị nh t ươ ng t ự nh ư ñố i v ớ i phép so sánh 2 m ẫ u b ằ ng phép th ử t. Tuy nhiên ph ươ ng sai ướ c tính chung c ủ a phép th ử này chính là trung bình bình ph ươ ng c ủ a sai s ố ng ẫ u nhiên (MS sai số ) trong b ả ng phân tích ph ươ ng sai và b ậ c t ự do chính b ằ ng b ậ c t ự do c ủ a sai s ố ng ẫ u nhiên; ho ặ c c ụ th ể h ơ n theo công th ứ c sau: S ự sai khác bé nh ấ t gi ữ a 2 nhóm b ấ t k ỳ (gi ả s ử nhóm th ứ nh ấ t và th ứ 2) có ý ngh ĩ a th ố ng kê, giá tr ị t ñượ c tính nh ư sau: + − = 21 so sai 21 1 n 1 MS n yy t Trong ñ ó: 21 , yy là giá tr ị trung bình c ủ a nhóm 1 v à 2 n 1 , n 2 là dung l ượ ng m ẫ u c ủ a nhóm 1 v à 2 N ế u giá tr ị t > 025.0 _ saisodf t ( ñượ c g ọ i là t lý thuy ế t) thì s ự sai khác ñ ó có ý ngh ĩ a t ứ c là trung bình c ủ a qu ầ n th ể 1 khác v ớ i trung bình c ủ a qu ầ n th ể 2. Ta c ũ ng có th ể s ử d ụ ng s ự sai khác bé nh ấ t có ý ngh ĩ a ở m ứ c 5% (LSD) ñượ c tính nh ư sau ñể xác ñị nh ñượ c s ự sai khác c ủ a các giá tr ị trung bình +××= 21 so sai (0.025) so df_sai 11 MS)05,0( nn tLSD trong ñó 025.0 _ saisodf t là 2,5% giá trị phía trên của phân bố t với bậc tự do của sai số ngẫu nhiên. Nếu khoảng tin cậy này không chứa số 0 thì có sự sai khác có ý nghĩa giữa 2 nhóm ở mức 5%. 46 3.7.6. Ví dụ Một thí nghiệm ñược tiến hành ñể so sánh mức ñộ tăng trọng của gà ở 4 khẩu phần ăn khác nhau. 20 con gà ñồng ñều nhau ñược phân một cách ngẫu nhiên về một trong 4 khẩu phần ăn. Như vậy ta có 4 nhóm ñộng vật thí nghiệm, mỗi nhóm gồm 5 gà; kết quả thí nghiệm ñược ghi lại ở bảng sau (ñơn vị tăng trọng tính theo g): Khẩu phần 1 Khẩu phần 2 Khẩu phần 3 Khẩu phần 4 99 61 42 169 88 112 97 137 76 30 81 169 38 89 95 85 94 63 92 154 Lời giải: Các tham số thống kê mô tả ñược trình bày ở bảng sau: Khẩu phần 1 2 3 4 Tổng Trung bình mẫu 0,79 1 = y 0,71 2 = y 4,81 3 = y 8,142 4 = y 55,93 = • y ðộ lệch chuẩn mẫu s 1 = 24,5 s 2 = 31,0 s 3 = 22,9 s 4 = 34,9 s y = 39,52 Dung lượng mẫu n 1 = 5 n 2 = 5 n 3 = 5 n 4 = 5 n = 20 Tiến hành từng bước như ñã nêu ở mục 5.3 ñể rút ra kết luận Bước 1 H 0 : µ 1 = µ 2 = µ 3 = µ 4 H 1 : µ 1 ≠ µ 2 ≠ µ 3 ≠ µ 4 Bước 2 Kiểm tra phân bố chuẩn của số liệu bằng cách quan sát biểu ñồ tần suất của chúng với sự trợ giúp của phần mềm Minitab 12.0. Bước3 Kiểm tra sự ñồng nhất của phương sai )( 2 4 2 3 2 2 2 1 σσσσ === . 52,1 9,22 9,34 3 4 == s s < 2 chứng tỏ rằng các phương sai ñồng nhất hoặc dùng phần mềm Minitab ñể kiểm tra 47 Bước 4 Sắp xếp số liệu theo từng nghiệm thức và tính tổng cộng theo nghiệm thức (T)và tổng số toàn bộ các giá trị quan sát của thí nghiệm (G) Khẩu phần 1 Khẩu phần 2 Khẩu phần 3 Khẩu phần 4 99 61 42 169 88 112 97 137 76 30 81 169 38 89 95 85 94 63 92 154 T 395 355 407 714 G 395 + 355 + 407 + 714 =1881 Bước 5 Xây dựng cấu trúc của bảng phân tích phương sai Giá trị P lý thuyết Nguồn biến ñộng Bậc tự do (df) Tổng bình phương (SS) Trung bình bình phương (MS) Giá trị F quan sát 5% 1% Khẩu phần Sai số ngẫu nhiên Tổng biến ñộng Bước 6 Xác ñịnh bậc tự do (df) của nghiệm thức, sai số ngẫu nhiên và tổng biến ñộng • df của tổng biến ñộng = n -1 = 20 -1 = 19 • df của nghiệm thức = t -1 = 4 -1 = 3 • df sai số ngẫu nhiên = df tổng biến ñộng - df nghiệm thức = (n-1) - (t-1) = n - t = 19 -3 = 20 -4 = 16 Bước 7 Xác ñịnh giá trị hiệu chỉnh (CF) và các tổng bình phương (SS) từ các giá trị tổng cộng theo nghiệm thức (T) và tổng cộng toàn bộ các giá trị quan sát của thí nghiệm (G) • CF = 176908,05 20 1881 22 == n G • SS toàn bộ quan sát = CFx n i i − ∑ =1 2 = • = (99 2 + 88 2 + 76 2 + 38 2 + 94 2 + 61 2 + + 154 2 ) - 176908,05 = 29.679 • SS nghiệm thức = CF r T t i i i − ∑ =1 2 = = 467.1605,176908 5 718 5 410 5 357 5 396 2222 =− +++ • SS sai s ố = SS toàn b ộ quan sát - SS nghi ệ m th ứ c = 29.679 – 14.467 = 13.212 48 B ướ c 8 Tính các giá tr ị trung bình bình ph ươ ng (MS) • MS nghi ệ m th ứ c = SS nghi ệ m th ứ c / ( t -1) = 489.5 1 4 467.16 = − • MS sai s ố ng ẫ u nhiên = SS sai s ố ng ẫ u nhiên / ( n-t ) = 826 4 20 212.13 = − B ướ c 9 Tính giá tr ị F quan sát ñể ki ể m ñị nh m ứ c ý ngh ĩ a c ủ a nghi ệ m th ứ c • F = MS nghi ệ m th ứ c / MS sai s ố ng ẫ u nhiên = 65,6 826 489.5 = B ướ c 10 Tra b ả ng ở ph ầ n ph ụ l ụ c ta có F lý thuy ế t trong b ả ng v ớ i df nghi ệ m th ứ c = 3 và df sai s ố ng ẫ u nhiên = 16 ta có: ở m ứ c ý ngh ĩ a 5% và 1% thì các giá tr ị t ươ ng ứ ng là F = 3,10 và F = 4,94 B ướ c 11 Giá tr ị P lý thuy ế t Ngu ồ n bi ế n ñộ ng B ậ c t ự do ( df ) T ổ ng bình ph ươ ng ( SS ) Trung bình bình ph ươ ng ( MS ) Giá tr ị F quan sát 5% 1% Kh ẩ u ph ầ n 3 16,467 5,489 6,65 3,10 4,94 Sai s ố ng ẫ u nhiên 16 13,212 826 T ổ ng bi ế n ñộ ng 19 29,679 B ướ c 12 Ta có th ể k ế t lu ậ n r ằ ng, có s ự sai khác gi ữ a t ă ng tr ọ ng c ủ a các kh ẩ u ph ầ n ă n khác nhau ( P <0,05) và ở kh ẩ u ph ầ n 4 cho ta giá tr ị t ă ng tr ọ ng l ớ n nh ấ t. Áp dụng Minitab Hi ể n th ị s ố li ệ u và các tham s ố th ố ng kê mô t ả MTB > Print 'KP1'-'KP4'. Manip > Display Data… Data Display Row KP1 KP2 KP3 KP4 1 99 61 42 169 2 88 112 97 137 3 76 30 81 169 4 38 89 95 85 5 94 63 92 154 MTB > Describe 'KP1'-'KP4'. Stat > Basic Statistics > Display Descriptive Statistics Descriptive Statistics: KP1, KP2, KP3, KP4 Variable N Mean Median TrMean StDev SE Mean KP1 5 79.0 88.0 79.0 24.5 10.9 KP2 5 71.0 63.0 71.0 31.0 13.9 KP3 5 81.4 92.0 81.4 22.9 10.2 KP4 5 142.8 154.0 142.8 34.9 15.6 Variable Minimum Maximum Q1 Q3 KP1 38.0 99.0 57.0 96.5 KP2 30.0 112.0 45.5 100.5 KP3 42.0 97.0 61.5 96.0 KP4 85.0 169.0 111.0 169.0 49 ðể ti ế n hành các b ướ c phân tích ph ươ ng sai ta ph ả i s ắ p x ế p lai s ố li ệ u thành 2 c ộ t; m ộ t c ộ t th ể hi ệ n m ứ c t ă ng tr ọ ng, m ộ t c ộ t th ể hi ệ n kh ẩ u ph ầ n ă n t ươ ng ứ ng theo các b ướ c sau ñ ây: MTB > Name c5 = 'P' c6 = 'KP' Manip > Stack/Unstack > Stack Columns… MTB > Stack 'KP1'-'KP4' 'P'; SUBC> Subscripts 'KP'; SUBC> UseNames. MTB > Và ti ế n hành phân tích ph ươ ng sai One-way ANOVA: P versus KP Stat > ANOVA > One-way (Unstacked)… Analysis of Variance for P Source DF SS MS F P KP 3 16467 5489 6.65 0.004 Error 16 13212 826 Total 19 29679 Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev + + + KP1 5 79.00 24.47 ( * ) KP2 5 71.00 31.02 ( * ) KP3 5 81.40 22.88 ( * ) KP4 5 142.80 34.90 ( * ) + + + Pooled StDev = 28.74 70 105 140 MTB > V ớ i P = 0,004, gi ả thi ế t H 0 b ị bác b ỏ hay nói cách khác hoàn toàn có th ể lo ạ i b ỏ gi ả thi ế t r ằ ng t ă ng tr ọ ng trung bình gi ữ a các kh ẩ u ph ầ n ă n là b ằ ng nhau. 3.7.7. So sánh giữa các nghiệm thức theo từng cặp So sánh t ă ng tr ọ ng c ủ a chu ộ t ở 4 kh ẩ u ph ầ n ă n khác nhau (kh ẩ u ph ầ n 1, 2, 3 và 4). S ố chu ộ t tham gia vào thí nghi ệ m vào t ừ ng kh ẩ u ph ầ n là 7, 8, 6 và 8. S ố li ệ u thu ñượ c trình bày ở b ả ng sau (% t ă ng tr ọ ng so v ớ i kh ố i l ượ ng c ơ th ể ): 1 2 3 4 3,42 3,17 3,34 3,64 3,96 3,63 3,72 3,93 3,87 3,38 3,81 3,77 4,19 3,47 3,66 4,18 3,58 3,39 3,55 4,21 3,76 3,41 3,51 3,88 3,84 3,55 3,96 3,44 3,91 Bài giải: (Dùng ph ầ n m ề m Minitab ñể gi ả i quy ế t). Nh ậ p s ố li ệ u vào Minitab , tính các tham s ố th ố ng kê mô t ả ta thu ñượ c k ế t qu ả sau: Variable N Mean Median TrMean StDev SE Mean 1 7 3.8029 3.8400 3.8029 0.2512 0.0949 2 8 3.4300 3.4250 3.4300 0.1353 0.0478 3 6 3.5983 3.6050 3.5983 0.1675 0.0684 4 8 3.9350 3.9200 3.9350 0.1906 0.0674 Variable Minimum Maximum Q1 Q3 1 3.4200 4.1900 3.5800 3.9600 2 3.1700 3.6300 3.3825 3.5300 3 3.3400 3.8100 3.4675 3.7425 4 3.6400 4.2100 3.7975 4.1250 . phần 4 99 61 42 16 9 88 11 2 97 13 7 76 30 81 169 38 89 95 85 94 63 92 15 4 T 395 355 4 07 71 4 G 395 + 355 + 4 07 + 71 4 =18 81 Bước 5 X y dựng cấu trúc của bảng phân tích phương sai Giá. 81. 4 92.0 81. 4 22.9 10 .2 KP4 5 14 2.8 15 4.0 14 2.8 34.9 15 .6 Variable Minimum Maximum Q1 Q3 KP1 38.0 99.0 57. 0 96.5 KP2 30.0 11 2.0 45.5 10 0.5 KP3 42.0 97. 0 61. 5 96.0 KP4 85.0 16 9.0 11 1.0. 42 16 9 88 11 2 97 13 7 76 30 81 169 38 89 95 85 94 63 92 15 4 Lời giải: Các tham số thống kê mô tả ñược trình b y ở bảng sau: Khẩu phần 1 2 3 4 Tổng Trung bình mẫu 0 ,79 1 = y 0, 71 2 = y