Báocáokhoa học Sosánh các trungbìnhsauphântíchphươngsai Tạp chí KHKT Nông nghiệp, Tập 2,số 3/2004 Sosánhcáctrungbìnhsauphântích phơng sai Comparison of treatment means after analysis of variance Nguyễn Đình Hiền 1 Summary The paper introduces methods for comparison of treatment means following analysis of variance (ANOVA). If the null hypothesis in the analysis of variance is rejected, the next step is to compare the treatment means (post hoc comparisons). Different tests such as LSD, Scheffé, Tukey, Bonferroni, S-N-K and Duncan are presented with recommendations, especially concerning the cases of equal numbers and non-equal numbers of replicates. Keywords: Analysis of variance, means, replicates, null hypothesis, comparison đặt vấn đề 1 Phântích phơng sai một nhân tố với a mức: A 1 , A 2 , . . . , A a đợc bảng: Nguồn biến động Bậc tự do Tổng bình phơng Bình phơng trungbình Giá trị F thực hiện Giá trị tới hạn F Nhân tố a-1 dfA SSA MsA = SSA/dfA F tn = msA/msE F(,dfA,dfE) Saisố n-a dfE SSE msE Toàn bộ n-1 SSTO Trong phântích phơng sai một nhân tố msE đợc ký hiệu là se 2 , se đợc gọi là saisố thí nghiệm, dfE là bậc tự do của sai số. Nếu F tn F (, dfA,dfE) thì chấp nhận giả thiết H 0 : Cáctrungbình của các mức bằng nhau. Nếu ngợc lại thì bác bỏ H 0 , tức là chấp nhận H 1 : Cáctrungbình của các mức không bằng nhau. Phântích phơng sai hai hay ba nhân tố thì có nhiều giả thiết ứng với cáctrungbình khác nhau (trung bình của nhân tố 1, trungbình của nhân tố 2, trungbình của tơng tác, . . .). Sau khi phântích phơng sai và kết luận Cáctrungbình của các mức khác nhau thì vấn đề đặt ra là cần sosánhcáctrungbình để biết cụ thể cáctrungbình nào bằng nhau, cáctrungbình nào khác nhau. Để kiểm định giả thiết về sự bằng nhau của một loại trungbình phải tính tỷ số F tn . Bình phơng trungbình dùng làm mẫu số trong F tn chính là bình phơng của saisố dùng trong việc ớc lợng và sosánhcáctrungbình tơng ứng, còn bậc tự do tơng ứng của mẫu số đợc gọi là bậc tự do của sai số. Chúng ta sẽ gọi saisố là se còn bậc tự do là dfE. 1 Khoa S phạm kỹ thuật, Trờng ĐHNNI 227 Sosánhcáctrungbìnhsauphântích phơng saiSaisố của trungbình là: r s s e y = r seyys 2 )( 21 = Saisố của hiệu hai trungbình Dới đây là một số cách sosánhcáctrungbìnhsau khi phântích phơng sai. 1. Sosánh hai trungbìnhSo giá trị tuyệt đối của hiệu hai trungbình m i và m j với ngỡng LSD (sai khác có ý nghĩa nhỏ nhất - Least significant difference) )(),2/( ij rr msEdfEtLSD +ì= 11 i j trong đó là mức ý nghĩa của kiểm định (tức xác suất đa ra kết luận sai lầm: hai trungbình khác nhau khi hai trungbình thực sự không khác nhau), dfE là bậc tự do của sai số, msE = s 2 e , s e là saisố thí nghiệm, r i và r j là các lần lặp của mức A i và A j Nếu | x i - x j | LSD ij kết luận hai trungbình m i và m j bằng nhau Nếu | x i - x j | > LSD ij kết luận hai trungbình m i và m j khác nhau. Khi số lần lặp bằng nhau (đều bằng r) LSD bằng r msEdfEtLSD 2 ),2/( ìì= 2. Sosánh nhiều trungbình (multiple comparaison) khi số lần lặp bằng nhau Nếu có a trungbình thì tất cả có a(a-1)/ 2 cặp trungbình cần so sánh. Có nhiều phơng pháp, thờng gọi là kiểm định (test), để sosánh và đợc chia thành các nhóm sau: a. Một ngỡng sosánh cho tất cả các cặp Tất cả các cặp trungbình đều đợc sosánh theo cùng một cách: lấy giá trị tuyệt đối của hiệu hai trungbình rồi so với một ngỡng. Nếu bé hơn ngỡng thì coi nh hai trungbình bằng nhau, ngợc lại thì coi nh khác nhau. a1- Kiểm định LSD Nếu ớc lợng giá trị trungbình thì nửa chiều dài khoảng ớc lợng bằng: (1) yst r se dfEtL ì=ì= ),2/( 228 Nguyễn Đình Hiền Nếu sosánh hai trungbình thì dùng ngỡng kiểm định: )( 2 ),2/( ji yyst r msEdfEtLSD ì=ìì= (2) Gọi hệ số t(/2, dfE) ở hai công thức (1) và (2) là hệ số nhân t Phơng pháp LSD là phơng pháp kinh điển đợc dùng từ lâu và quen thuộc với ngời dùng. Các nghiên cứu sau này chứng tỏ nếu dùng kiểm định LSD để sosánh tất cả các cặp trungbình thì xác suất có kết luận sai: hai trungbình khác nhau khi hai trungbình thực sự không khác nhau sẽ không còn là mà lớn hơn nhiều lần. Thí dụ khi so hai trungbình với = 0,05 nếu có 4 mức, tức là 6 cặp trungbình thì xác suất có kết luận sai có thể lớn hơn 0,2. Nh vậy chỉ nên dùng LSD khi sosánh một cặp (hoặc một vài cặp ) trungbình nào đó mà chúng ta có ý đồ sosánh khi thiết kế thí nghiệm chứ không nên dùng để sosánh tất cả các cặp trungbìnhsau khi xử lý dữ liệu. a2- Kiểm định Scheffé Kiểm định Scheffé cũng dùng (1) và (2), nhng thay cho hệ số nhân t là hệ số nhân s ),,( dfEdfAFdfAs ì= trong đó dfA là bậc tự do ứng với bình phơng trungbình nằm ở tử số của F tn , dfE là bậc tự do của sai số, F(,dfA,dfE) là giá trị tới hạn trong phân phối Fisher- Snedecor. Phơng pháp Scheffé dùng để sosánh mọi cặp trungbình và còn mở rộng để kiểm định mọi tơng phản (contrast). Kiểm định Scheffé đợc gọi là bảo thủ vì ngỡng sosánh quá lớn. a3- Kiểm định HSD của Tukey (còn gọi là kiểm định Tukey - Cramer) Kiểm định HSD (Honestly significant difference) dựa trên việc nghiên cứu cách sosánh theo phơng pháp LSD giữa trungbình nhỏ nhất và trungbình lớn nhất để đa ra hệ số nhân w thay cho hệ số t trong (1) và (2) 2 ),,( dfEaq w = q(,p,dfE) đợc cho trong các bảng số thống kê với tên gọi bảng cácphân vị trong phân phối của phạm vi kiểu Student (hay Student hoá). (Selected percentiles of Studentized range distributions hayUpper percentage points of the Studentized range), trong đó: là mức ý nghĩa của kiểm định p là tham số của phân phối (ở đây lấy p = a) dfE là bậc tự do của sai số. Ngỡng tính theo HSD lớn hơn ngỡng tính theo LSD và nhỏ hơn ngỡng tính theo Scheffé. a4- Kiểm định Bonferroni 229 Sosánhcáctrungbìnhsauphântích phơng sai Khi có k cặp trungbình cần sosánh thì dựa trên nhận xét về khuyết điểm của kiểm định LSD Bonferroni thay hệ số nhân t trong (1) và (2) bằng hệ số nhân t t = t( /2, dfE) t = t(,dfE) với = /2k Thí dụ có 5 trungbình cần so sánh, tất cả có k = 5 x 4 / 2 = 10 cặp trung bình. Giả sử = 0,05 và bậc tự do dfE = 65 = 0,05 = 0,05/ 20 = 0,0025 hay 0,25% t= t(0,025,65) = 1,997 t = t(0,0025,65) = 2,906 Sau đây là thí dụ về sosánh 5 trungbình với số lần lặp r = 14; = 0,05; dfE = 65 m 1 = 4,050; m 2 = 4,429; m3 = 4,900; m 4 = 5,343; m 5 = 5,921; se = 1,633 Ngỡng: LSD 1,997 x 1,633 x = 1,997 x 0,6172 = 1,233 2 14 Tukey Cramer 735,1 14 2 633,1 2 1 975,3 =ììì Bonfferroni 794,1633,1906,2 =ìì 14 2 Scheffé 957,1 14 2 633,1513,24 ì =ìì b. Nhiều ngỡng sosánh cho các cặp. Nếu sắp xếp cáctrungbình từ nhỏ đến to thì có các kiểm định với nhiều ngỡng so sánh, còn gọi là kiểm định đa phạm vi (multiple range test). Hai trungbình kề nhau dùng ngỡng sosánh với tham số p = 2, hai trungbình cách nhau một (tức là ở giữa có một trung bình) dùng ngỡng với p =3, cách nhau hai thì p = 4 . . . b1- Kiểm định Student - Newman - Keuls (Gọi tắt là kiểm định S-N-K) Các ngỡng sosánh W(p) = q (,p,dfE) sy =q(,p,dfE)x trong đó q (, p,dfE) là trị lấy trong bảng cácphân vị trong phân phối của phạm vi kiểu Student (hay Student hoá) đã giới thiệu ở mục a3 (Kiểm định Tukey Cramer) là mức ý nghĩa, p là tham số, dfE là bậc tự do của sai số, sy là saisố của một trung bình. Thí dụ với dfE = 24; se 2 = 11,79 ; r = 5 ta có sy = r se 2 536,1 5 79,11 = Các giá trị W(p) để sosánh 6 trungbình 230 Nguyễn Đình Hiền p 2 3 4 5 6 q(0,025,p,24) 2,92 3,53 3,90 4,17 4,37 W(p) 4.5 5,4 6,0 6,4 6,7 áp dụng vào 6 trungbình xếp từ nhỏ đến to ta có kết quả sau: 13,3 14,6 18,7 19,9 24,0 28,8 b2- Kiểm định Duncan Kiểm định Duncan dùng công thức tơng tự kiểm định S-N-K nhng chọn mức ý nghĩa tuỳ theo a - số công thức cần sosánh = 1 - (1 - ) a-1 (thí dụ a = 3 = 0,05 = 0,0975; a = 4 = 0,14 ) Duncan lập ra bảng số tơng tự bảng cácphân vị trong phân phối của phạm vi kiểu Student, từ đó tìm đợc ngỡng sosánh r se 2 R(p) = q(,p,dfE) sy = q(,p,dfE)x p 2 3 4 5 6 q(,p,24) 2,92 3,07 3,15 3,22 3,28 R(p) 4,5 4,7 4,9 5,0 5,1 áp dụng vào thí dụ trên cho kết quả tơng tự kiểm định S-N-K 3. Sosánh nhiều trungbình (multiple comparaison) khi số lần lặp không bằng nhau Khi ớc lợng đối với trungbình m i theo LSD phải thay sy trong công thức (1) đối với nửa khoảng tin cậy L bằng sy i để có công thức (1) (1) Đối với các ớc lợng theo Scheffé, Tukey Cramer, Bonferroni cũng làm tơng tự. Khi sosánh hai công thức có trungbình m i và m j với số lần lặp khác nhau thì phải thay 2/ r trong công thức tính s(y i - y j ) bằng (1/ r i + 1/ r j ) để có (2) i i yst r se dfEtL ì=ì= ),2/( (2) )() 11 (),2/( ji j i yyst rr msEdfEtLSD ì=+ìì= Đối với các kiểm định của Scheffé, Tukey Cramer, Bonferroni làm tơng tự. 231 Sosánhcáctrungbìnhsauphântích phơng sai Đối với các kiểm định S-N-K và Duncan thì thay sy = bằng se 2 ) 11 ( 2 ji rr se + r Một số kiểm định khác Kiểm định Dunnet Khi sosánhcáctrungbình nếu có đối chứng thì nên dùng kiểm định Dunnett (có thể kiểm định một phía và hai phía). Đối với kiểm định Dunnett thì dùng bảng số riêng để tính hệ số nhân t D thay cho hệ số t trong công thức (2) của LSD. Nếu số lần lặp không bằng nhau thì thay 2/ r bằng (1/ r i + 1/ r j ). Ngoài các kiểm định một ngỡng chung hoặc nhiều ngỡng đã nêu trong các chơng trình máy tính còn một số kiểm định khác nh kiểm định Tukey b, Waller-Duncan, Hochberg GT2, Gabriel, Sidak, kiểm định F của REGW (Ryan-Einot-Gabriel-Welsch), kiểm đinh phạm vi của REGW. Một số kiểm định có cách tiếp cận rất mới và không theo các lập luận quen thuộc trong thống kê kinh điển với các tính toán khá phức tạp. Kiểm định khi các phơng sai của các mức không bằng nhau Một trong những giả thiết cơ bản của phântích phơng sai là cácsaisốphân phối chuẩn với phơng sai bằng nhau 2 . Khi phântích phơng sai phải kiểm định giả thiết các phơng sai của các mức của nhân tố bằng nhau (dùng kiểm định Bartlett hay Levene). Các kiểm định nêu ở cácphần trên đều đòi hỏi các phơng sai của các mức bằng nhau. Trong các chơng trình máy tính có các kiểm định không đòi hỏi các phơng sai của các mức bằng nhau nh kiểm định T2 của Tamhane, Dunnett T3 và Dunnett C, Games Howel. Trong lúc chờ đợi các nghiên cứu mới để đánh giá kỹ hơn các kiểm định thì theo lời khuyên trong một số tài liệu nếu sosánh một số ít cặp trungbình đã có ý đồ sosánh từ trớc có thể dùng kiểm định LSD, nếu sosánh với đối chứng thì dùng Dunnett, nếu sosánh tất cả các cặp trungbình thì dùng Tukey HSD. Nếu sắp xếp cáctrungbình theo thứ tự từ nhỏ đến lớn sau đó phân chia thành một số nhóm đồng nhất thì dùng kiểm định S-N-K hoặc Duncan, tuy nhiên cần chú ý là tuy hai kiểm định này đợc ngời sử dụng hoan nghênh vì đơn giản và sát thực tế nhng lại không đợc các nhà nghiên cứu lý thuyết thống kê công nhận vì không chặt chẽ trong chứng minh. 232 . Báo cáo khoa học So sánh các trung bình sau phân tích phương sai Tạp chí KHKT Nông nghiệp, Tập 2,số 3/2004 So sánh các trung bình sau phân tích phơng sai Comparison of. r seyys 2 )( 21 = Sai số của hiệu hai trung bình Dới đây là một số cách so sánh các trung bình sau khi phân tích phơng sai. 1. So sánh hai trung bình So giá trị tuyệt đối của hiệu hai trung bình m i . thiết ứng với các trung bình khác nhau (trung bình của nhân tố 1, trung bình của nhân tố 2, trung bình của tơng tác, . . .). Sau khi phân tích phơng sai và kết luận Các trung bình của các mức khác