Báo cáokhoa học Mô hìnhcốđịnh,ngẫunhiênvàhỗnhợptrongphântíchphươngsai Tạp chí KHKT Nông nghiệp, Tập 1, số 4/2003 318 Môhìnhcốđịnh,ngẫunhiênvàhỗnhợptrongphântích phơng sai Use of fixed, random and mixed models in analysis of variance Nguyễn Đình Hiền 1 Summary In experimental designs there are three models for analysis of variance: fixed, random and mixed models. The present paper described in detail model with one and two factors. The model, the hypothesis and the testing of hypothesis of frequently used designs such as one factor completely randomised design, two factors crossed design, hierarchical design and split plot design were presented . Keywords: Analysis of variance, fixed, random, mixed models. Trong các giáo trình phơng pháp thí nghiệm và toán sinh học trớc đây khi phântích phơng sai các nhân tố thờng đợc coi là cố định. Việc phântíchvà kết luận đợc trình bày theo các mẫu định sẵn đ quen thuộc với cán bộ giảng dạy và sinh viên trong trờng. Trong những năm gần đây, do đòi hỏi của thực tế và cũng do những tiến bộ của việc nghiên cứu vàphântích các thiết kế thí nghiệm, các nhân tố có thể cố định hay ngẫunhiênvàmôhìnhphântích phơng saiđợc sắp thành 3 loại: Cố định (Fixed - nếu tất cả các nhân tố đều cố định), ngẫunhiên (Random - nếu tất cả các nhân tố đều ngẫu nhiên) vàhỗn hợp (Mixed - nếu có một số nhân tố cốđịnh, một số ngẫu nhiên). Việc quyết định xem nhân tố cố định hay ngẫunhiên phải làm trớc khi bố trí thí nghiệm và căn cứ vào bản chất của nhân tố cũng nh ảnh hởng của kết luận khi ứng dụng trong thực tế. Bài này nhằm giới thiệu cách nhìn đầy đủ hơn về phântích phơng sai. Bài sau sẽ giới thiệu các cách so sánh các trung bình sau khi phântích phơng sai nh cách so sánh theo LSD, Duncan, Student-Newman-Keuls, Tukey, Dunnet, Scheffé . . . Sau đây là một số môhình thờng dùng trong phântích phơng sai. 1. Phântích phơng sai một nhân tố 1 Môhình một nhân tố có a mức, mỗi mức lặp lại r i lần x i j = à + a i + e i j (i = 1, a; j = 1, r i ) à là trung bình chung a i là tác động của mức A i e i j là sai số ngẫunhiên gỉa thiết độc lập, phân phối chuẩn N(0, 2 e ) Nếu nhân tố A cố định thì môhình gọi là môhìnhcốđịnh, các a i là hằng số thoả mn điều kiện 1 Bộ môn Tin học, Khoa S phạm kỹ thuật = = a i i a 1 0 môhìnhcốđịnh,ngẫunhiênvàhỗn hợp 319 Nếu nhân tố A ngẫunhiên thì môhình gọi là môhìnhngẫu nhiên, các a i là các giá trị của biến ngẫunhiênphân phối chuẩn N(0, 2 a ) Phơng pháp phântích Cả hai môhình đều chung cách phântích mà nội dung gồm: a- Tách tổng bình phơng toàn bộ SSTO thành hai phần: tổng bình phơng do nhân tố SSAvà tổng bình phơng do sai số SSE b- Tách bậc tự do của tổng bình phơng toàn bộ dfTO thành hai phần: bậc tự do dfA của tổng bình phơng SSAvà bậc tự do dfE của tổng bình phơng SSE c- Chia tổng bình phơng cho bậc tự do đợc bình phơng trung bình msA, msE d- Tóm tắt toàn bộ cách phântích vào trong bảng: n = r i Bảng phântích phơng sai (ANOVA) Nguồn biến động Bậc tự do Tổng bình phơng Bình phơng trung bình F tn Kỳ vọng Nhân tố a - 1 dfA SSA msA = SSA/dfA msA msE Sai số n - a dfE SSE msE = SSE/dfE 2 e Toàn bộ n - 1 SSTO Cách kiểm định giả thiết Tuỳ theo môhìnhcó thể tính các kỳ vọng của msA và msE. Từ đó có cách tính tỷ số F tn và cách kiểm định giả thiết đối với nhân tố A. Môhìnhcố định Giả thiết H 0 : các a i bằng không, đối thiết: có a i khác không. Kỳ vọng của msE bằng 2 e , còn kỳ vọng của msA bằng 2 e + A Trong đó A = nếu mọi r i đều bằng r thì A = Nếu giả thiết H 0 đúng thì tỷ số F tn = msA/msE phân phối Fisơ Snêđêco với a-1 và n-a bậc tự do và ta có quy tắc kiểm định: Tìm giá trị tới hạn F( ,a-1,n-a). Nếu F tn F(,a-1,n-a) thì chấp nhận H 0, nếu ngợc lại thì chấp nhận H 1 . Môhìnhngẫunhiên Giả thiết H 0 : 2 A bằng không, đối thiết: 2 A khác không. Kỳ vọng của msE bằng 2 e , còn kỳ vọng của msA bằng 2 e + r 2 A với r = nếu mọi r i đều bằng r thì r = r )1( 1 2 = a ar a i ii Na rN k i i )1( 1 22 = 1 1 2 = a ar a i i Nguyễn Đình Hiền 320 Nếu giả thiết H 0 đúng thì tỷ số F tn = msA/msE phân phối Fisơ Snêđêco với a-1 và n-a bậc tự do và ta có quy tắc kiểm định: Tìm giá trị tới hạn F (,a-1,n-a). Nếu F tn F (,a-1,n-a) thì chấp nhận H 0, nếu ngợc lại thì chấp nhận H 1 2 e đợc ớc lợng bằng msE Nếu msA > msE thì 2 A đợc ớc lợng bằng (msA - msE) / r 2- Phântích phơng sai hai nhân tố chéo nhau (crossed) Môhình hai nhân tố chéo nhau (hay trực giao) Nhân tố A có a mức, nhân tố B có b mức, mỗi công thức (a i ,b j ) lặp lại r lần x i j k = à + a i + b j + ab i j + e i j k (i = 1, a; j = 1, b; k = 1, r) à là trung bình chung a i là tác động của mức A i của nhân tố A b j là tác động của mức B j của nhân tố B (ab) i j là tơng tác giữa 2 mức A i và B j của hai nhân tố A,B e i j k là sai số ngẫunhiên gỉa thiết độc lập, phân phối chuẩn N(0, 2 e ). Nếu các mức A i và B j cố định thì môhình gọi là môhìnhcốđịnh, các a i và b j là hằng số thoả mn điều kiện Nếu cả 2 mức A i và B j ngẫunhiên thì môhình gọi là môhìnhngẫu nhiên, các a i là các giá trị của biến ngẫunhiênphân phối chuẩn N(0, 2 a ), các b j là các giá trị của biến ngẫunhiênphân phối chuẩn N(0, 2 b ) còn (ab) i j là các giá trị của biến ngẫunhiênphân phối chuẩn N(0, 2 ab ) Nếu một trong 2 nhân tố cốđịnh, nhân tố kia ngẫunhiên thì cómôhìnhhỗn hợp. Phơng pháp phântích Cả ba môhình đều chung cách phântích mà nội dung gồm: a-Tách tổng bình phơng toàn bộ SSTO thành bốn phần: tổng bình phơng do nhân tố A (SSA), tổng bình phơng do nhân tố B (SSB), tổng bình phơng do tơng tác SS(AB) và tổng bình phơng do sai số SSE b-Tách bậc tự do của tổng bình phơng toàn bộ dfTO thành bốn phần: bậc tự do dfA của tổng bình phơng SSA, bậc tự do dfB của tổng bình phơng SSB, bậc tự do dfAB của tổng bình phơng SSAB và bậc tự do dfE của tổng bình phơng SSE c- Chia tổng bình phơng cho bậc tự do đợc bình phơng trung bình msA, msB, msAB và msE d-Tóm tắt toàn bộ cách phântích vào trong bảng : = = a i i a 1 0 0 1 = = b i j b 0 1 = = a i ij ab 0 1 = = b j ij ab môhìnhcốđịnh,ngẫunhiênvàhỗn hợp 321 Bảng phântích phơng sai Nguồn biến động Bậc tự do Tổng bình phơng Bình phơng trung bình F tn Kỳ vọng Nhân tố A dfA = a-1 SSA msA F tnA Nhân tố B dfB = b-1 SSB msB F tnB Tơng tác DfAB = (a-1)(b-1) SSAB msAB F tnAB Sai số dfE = ab(r-1) SSE msE -2 e Toàn bộ abr -1 SSTO Cách kiểm định giả thiết Tuỳ theo môhìnhcó thể tính các kỳ vọng của msA, msB, msAB và msE. Từ đó có cách tính tỷ số F tn và cách kiểm định các giả thiết đối với nhân tố A, nhân tố B và tơng tác AB. Môhìnhcố định Giả thiết H 0A : Các a i bằng không, đối thiết H 1A : có a i khác không Giả thiết H 0B : Các b j bằng không, đối thiết H 1B : có b j khác không Giả thiết H 0AB : Các ab i j bằng không, đối thiết H 1AB : có ab i j khác không Kỳ vọng Kiểm định giả thiết E(msA) = 2 e +(bra 2 i )/(a-1) F tnA = msA/msE so với F(,dfA,dfE) E(msB) = 2 e +(arb 2 j )/(b-1) F tnB = msB/msE so với F(,dfB,dfE) E(msAB)= 2 e + (rab 2 i j ) / (a-1)(b-1) F tnAB = msAB/msE so với F(,dfAB,dfE) E(msE) = 2 e Môhìnhngẫunhiên Giả thiết H 0A : 2 A bằng không, đối thiết H 1A : 2 A khác không Giả thiết H 0B : 2 B bằng không, đối thiết H 1B : 2 B khác không Giả thiết H 0Ab : 2 AB bằng không, đối thiết H 1AB : 2 AB khác không Kỳ vọng Kiểm định giả thiết E(msA) = 2 e + r 2 AB + br 2 A F tnA = msA/msAB so với F(,dfA,dfAB) E(msB) = 2 e + r 2 AB + ar 2 B F tnB = msB/msAB so với F(,dfB,dfAB) E(msAB)= 2 e + r 2 AB F tnAB = msAB/msE so với F(,dfAB,dfE) E(msE) = 2 e Có thể ớc lợng các phơng sai nh sau: 2 e ớc lợng bằng msE 2 AB ớc lợng bằng (msAB - msE)/ r 2 B ớc lợng bằng (msB - msAB) / ar 2 A ớc lợng bằng (msA - msAB)/ br Môhìnhhỗn hợp Giả sử nhân tố A cốđịnh, nhân tố B ngẫunhiên (kéo theo AB ngẫu nhiên) Giả thiết H 0A : Các a i bằng không, đối thiết H 1A : có a i khác không Nguyễn Đình Hiền 322 Giả thiết H 0B : 2 B bằng không, đối thiết H 1B : 2 B khác không Giả thiết H 0Ab : 2 AB bằng không, đối thiết H 1AB : 2 AB khác không Kỳ vọng Kiểm định giả thiết E(msA) = 2 e + r 2 AB + (bra 2 i )/(a-1) F tnA =msA/msAB so với F(,dfA,dfAB) E(msB) = 2 e + ar 2 B F tnB =msB/msE so với F(,dfB,dfE) E(msAB)= 2 e + r 2 AB F tnAB =msAB/msE so với F(,dfAB,dfE) E(msE) = 2 e 3- Phântích phơng sai hai nhân tố phân cấp (Hierachical) Môhình hai nhân tố phân cấp (hay còn gọi là chia ổ nested) Nhân tố A là cấp trên có a mức, nhân tố B là cấp dới có b mức, mỗi công thức (a i ,b j ) lặp lại r lần x i j k = à + a i + b j(i) + e i j k (i = 1, a; j = 1, b; k = 1, r) à là trung bình chung a i là tác động của mức A i của nhân tố A b j(i) là tác động của mức B j (dới mức i của nhân tố A) của nhân tố B e i j k là sai số ngẫunhiên giả thiết độc lập, phân phối chuẩn N(0, 2 e ). Nếu các mức A i và B j ngẫunhiên thì môhình gọi là môhìnhngẫu nhiên, nếu A cố định B ngẫunhiên thì cómôhìnhhỗn hợp. = = a i i a 1 0 Trong môhìnhngẫunhiên nhân tố A ngẫu nhiên, các a i là các giá trị của biến chuẩn N (0, 2 A ). Nhân tố B ngẫu nhiên, các b j trong cùng một mức i của nhân tố A là các giá trị của biến chuẩn N(0, 2 B ). Trong môhìnhhỗn hợp nhân tố A cốđịnh, các a i thoả mn điều kiện Nhân tố B ngẫu nhiên, các b j trong cùng một mức i của nhân tố A là các giá trị của biến chuẩn N(0, 2 B ). Phơng pháp phântích Cả hai môhình đều chung cách phântích mà nội dung gồm: a-Tách tổng bình phơng toàn bộ SSTO thành ba phần: tổng bình phơng do nhân tố A SSA, tổng bình phơng do nhân tố B trong A SSB(A) và tổng bình phơng do sai số SSE. b-Tách bậc tự do của tổng bình phơng toàn bộ dfTO thành ba phần: bậc tự do dfA của tổng bình phơng SSA, bậc tự do dfB(A) của tổng bình phơng SSB(A) và bậc tự do dfE của tổng bình phơng SSE c- Chia tổng bình phơng cho bậc tự do đợc bình phơng trung bình msA, msB và msE Tóm tắt toàn bộ cách phântích vào trong bảng: môhìnhcốđịnh,ngẫunhiênvàhỗn hợp 323 Nguồn Bậc tự do Tổng bình phơng Bình phơng trung bình F tn Kỳ vọng Nhân tố A dfA = a-1 SSA msA F tnA Nhân tố B dfB(A) = a(b-1) a(b - 1) SSB(A) msB(A) F tnB Sai số dfE = ab(r-1) SSE msE Toàn bộ dfTO = abr-1 SSTO 2 e Cách kiểm định giả thiết Môhìnhngẫunhiên Giả thiết H 0A : 2 A bằng không, đối thiết H 1A : 2 A khác không Giả thiết H 0B : 2 B bằng không, đối thiết H 1B : 2 B khác không Kỳ vọng Kiểm định giả thiết E (msA) = 2 e + r 2 B + br 2 A F tnA = msA/ msB (A) so với F(,dfA,dfB(A)) E (msB(A)) = 2 e + r 2 B F tnB = msB (A)/ msE so với F( ,dfB(A),dfE) E (msE) = 2 e Ước lợng các phơng sai: 2 e đợc ớc lợng bằng smE 2 B đợc ớc lợng bằng (msB (A)- msE) / r 2 A đợc ớc lợng bằng (msA - msB (A)) / br Môhìnhhỗn hợp Giả thiết H 0A : các a i bằng không, đối thiết H 1A : có a i khác không Giả thiết H 0B : 2 B bằng không, đối thiết H 1B : 2 B khác không Kỳ vọng Kiểm định giả thiết E(msA) = 2 e + r 2 B + A F tnA = msA/ msB(A) so với F(,dfA,dfB(A)) E(msB) = 2 e + r 2 B F tnB = msB(A)/ msE so với F(,dfB(A),dfE) E(msE) = 2 e với Có thể ớc lợng các phơng sai: 2 e đợc ớc lợng bằng msE 2 B đợc ớc lợng bằng (msB - msE) / r 4- Phântích phơng sai hai nhân tố chia ô (Split plot) Môhình hai nhân tố chia ô Trong bố trí thí nghiệm chia ô lớn, ô nhỏ (Split plot) nhân tố A bố trí trên ô lớn, nhân tố B bố trí trên ô nhỏ, mối lần lặp là một khối (Block) x i j k = à + c k + a i + cd ik + bj+ ab i j + e i j k (i = 1, a; j = 1, b; k = 1, r) à là trung bình chung 1 1 2 = = a abr a i i A Nguyễn Đình Hiền 324 c k là tác động của khối k a i là tác động của mức A i của nhân tố A cd ik là tơng tác giữa khối và nhân tố A b j là tác động của mức B j của nhân tố B ab i j là tác động của tơng tác AB e i j k là sai số ngẫunhiên gỉa thiết độc lập, phân phối chuẩn N(0, 2 e ). Khối thờng đợc coi là nhân tố ngẫu nhiên: Các c k phân phối chuẩn N(0, 2 K ) còn A và B thì có thể cố định hoặc ngẫu nhiên, nếu A cố định thì thoả mn điều kiện a i = 0 (B cố định thì b j = 0) còn nếu A ngẫunhiên thì các giá trị a i phân phối chuẩn n(0, 2 A ) (B ngẫunhiên thì b j phân phối chuẩn n(0, 2 B )). Thờng lấy tơng tác A x K làm sai số ô lớn và bỏ qua tơng tác BK. Tuỳ giả thiết hai nhân tố cố định hay ngẫunhiên hay hỗn hợp mà có cách kiểm định khác nhau. Phơng pháp phântích Các môhình đều chung cách phântích mà nội dung gồm: a-Tách tổng bình phơng toàn bộ SSTO thành sáu phần: tổng bình phơng do khối SSK, tổng bình phơng do nhân tố A (SSA), tổng bình phơng do nhân tố B (SSB), tổng bình phơng do tơng tác AK (SSAK), tổng bình phơng do tơng tác AB (SSAB), và tổng bình phơng do sai số SSE. b-Tách bậc tự do của tổng bình phơng toàn bộ dfTO thành sáu phần: bậc tự do dfK của tổng bình phơng SSK, bậc tự do dfA của tổng bình phơng SSA, bậc tự do dfAK của tổng bình phơng SSAK, bậc tự do dfB của tổng bình phơng SSB, bậc tự do dfAB của tổng bình phơng SSAB và bậc tự do dfE của tổng bình phơng SSE c- Chia tổng bình phơng cho bậc tự do đợc bình phơng trung bình msK, msA, msAK, msB, msAB và msE d- Tóm tắt kết quả vào bảng phântích phơng sai Bảng phântích phơng sai Nguồn biến động Bậc tự do Tổng bình phơng Bình phơng trung bình F tn Kỳ vọng Khối dfK = r-1 SSK msK Nhân tố A dfA = a-1 SSA msA F tnA Tơng tác AK Sai số ô lớn dfAK=(a-1)(r-1) SSAK msAK Nhân tố B dfB = b-1 SSB msB F tnB Tơng tác AB dfAB= (a-1)(b-1) SSAB msAB tnAB Sai số ô nhỏ dfE = a(b-1)(r-1) SSE msE -2 e Toàn bộ abr -1 SSTO môhìnhcốđịnh,ngẫunhiênvàhỗn hợp 325 Cách kiểm định giả thiết Môhìnhcố định Giả thiết H 0A : Các a i bằng không, đối thiết H 1A : có a i khác không Giả thiết H 0B : Các b j bằng không, đối thiết H 1B : có b j khác không Giả thiết H 0Ab : Các ab i j bằng không, đối thiết H 1AB : có ab i j khác không Kỳ vọng Kiểm định giả thiết Ô lớn E(msK)= 2 e + ab 2 K E(msA) = 2 e + b 2 AK + (bra 2 i )/(a-1) F tnA = msA/msAK so với F(,dfA,dfAK) E(msAK) = 2 e + b 2 AK Ô nhỏ E(msB) = 2 e +(arb 2 j )/(b-1) F tnB = msB/msE so với F(,dfB,dfE) E(msAB)= 2 e +(rab 2 i j )/ (a-1)(b-1) F tnAB = msAB/msE so với F(,dfAB,dfE) E(msE) = 2 e Môhìnhngẫu nhiên: nhân tố A và nhân tố B ngẫunhiên Giả thiết H 0A : 2 A bằng không, đối thiết H 1A : 2 A khác không Giả thiết H 0B : 2 B bằng không, đối thiết H 1B : 2 B khác không Giả thiết H 0AB : 2 AB bằng không, đối thiết H 1AB : 2 AB khác không Kỳ vọng Kiểm định giả thiết ô lớn E(msK)= 2 e +b 2 AK + ab 2 K E(msA) = 2 e + b 2 AK + r 2 AB + br 2 A Không có kiểm định chính xác (Có thể dùng kiểm định gần đúng) E(msAK) = 2 e + b 2 AK ô nhỏ E(msB) = 2 e + r 2 AB + ar 2 B F tnB =msB/msAB so với F(,dfB,dfAB) E(msAB)= 2 e +r 2 AB F tnAB =msAB/msE so với F(,dfAB,dfE) E(msE)= 2 e Môhìnhhỗn hợp: nhân tố A cốđịnh, nhân tố B ngẫunhiên Giả thiết H 0A : mọi a i bằng không, đối thiết H 1A : có a i khác không Giả thiết H 0B : 2 B bằng không, đối thiết H 1B : 2 B khác không Giả thiết H 0AB : 2 AB bằng không, đối thiết H 1AB : 2 AB khác không Nguyễn Đình Hiền 326 Kỳ vọng Kiểm định giả thiết ô lớn E(msK)= 2 e + ab 2 K E(msA) = 2 e + b 2 AK + r 2 AB + (bra 2 i ) / (a-1) Không có kiểm định chính xác (Có thể dùng kiểm định gần đúng) E(msAK) = 2 e + b 2 AK ô nhỏ E(msB) = 2 e + ar 2 B F tnB = msB/msE so với F(,dfB,dfE) E(msAB)= 2 e +r 2 AB F tnAB = msAB/msE so với F(,dfAB,dfE) E(msE)= 2 e Môhìnhhỗn hợp: nhân tố A ngẫu nhiên, nhân tố B cố định Giả thiết H 0A : 2 A bằng không, đối thiết H 1A : 2 A khác không Giả thiết H 0B : các b j bằng không, đối thiết H 1B : có b j khác không Giả thiết H 0AB : 2 AB bằng không, đối thiết H 1AB : 2 AB khác không Kỳ vọng Kiểm định giả thiết ô lớn E(msK)= 2 e + b 2 AK + ab 2 K E(msA) = 2 e + b 2 AK + br 2 A F tnA = msA/ msAK so với F(,dfA,dfAK) E(msAK) = 2 e + b 2 AK ô nhỏ E(msB) = 2 e + r 2 AB +(arb 2 j )/(b-1) F tnB = msB/msAB so với F(,dfB,dfAB) E(msAB) = 2 e +r 2 AB F tnAB = msAB/msE so với F(,dfAB,dfE) E(msE) = 2 e Các môhình một nhân tố khối ngẫunhiên đầy đủ (RCBD) hay ô vuông La tinh chủ yếu dùng với nhân tố cố định và cách phântích không khác gì cách trình bày trong các giáo trình về phơng pháp thí nghiệm và toán sinh học hiện đang dùng. Đối với môhình 3 nhân tố thì việc phântích phức tạp hơnvàcó thể tập trung vào môhình 3 nhân tố chéo nhau (cross), phân cấp (hierarchical) hay chia ô lớn, ô vừa, ô nhỏ (split split plot). Môhìnhcố định hay ngẫunhiên không phức tạp nhng môhìnhhỗn hợp thì phức tạp hơn nhiều. Trong các bộ chơng trình chuyên về thống kê nh Minitab, SPSS, Statistica, Irristat Ver 4.0 đối với mỗi nhân tố phải khai báo rõ cố đinh hay ngẫu nhiên, chéo nhau hay phân cấp để chơng trình xử lý và đa ra kết luận. Một số trờng hợp không có kiểm định F chính xác phải dùng các kiểm định F trong đó mẫu số là tổ hợp một số các bình phơng trung bình. . Báo cáo khoa học Mô hình cố định, ngẫu nhiên và hỗn hợptrong phân tích phương sai Tạp chí KHKT Nông nghiệp, Tập 1, số 4/2003 318 Mô hình cố định, ngẫu nhiên và hỗn hợptrong phân tích. = = a i i a 1 0 mô hình cố định, ngẫu nhiên và hỗn hợp 319 Nếu nhân tố A ngẫu nhiên thì mô hình gọi là mô hình ngẫu nhiên, các a i là các giá trị của biến ngẫu nhiên phân phối chuẩn N(0, 2 a ). là sai số ngẫu nhiên giả thiết độc lập, phân phối chuẩn N(0, 2 e ). Nếu các mức A i và B j ngẫu nhiên thì mô hình gọi là mô hình ngẫu nhiên, nếu A cố định B ngẫu nhiên thì có mô hình hỗn