1 .Các khái niệm cơ bản
1. Mẫu hoàn toàn ngẫu nhiên
1.1. Mục đích thí nghiệm
Để so sánh, đánh giá, khảo sát các chỉ tiêu, số liệu ứng dụng trong chăn nuôi, thú y
Ưu điểm: Đơn giản, dễ phân tích số liệu. Có thể tổ chức thí nghiệm với số nghiệm thức tùy ý và số lần lặp lại có thể giống hoặc khác nhau giữa các nghiệm thức
Nhược điểm: Khơng có hiệu lực nhiều nếu phương sai sai số ngẫu nhiên xãy ra rất lớn giữa các đơn vị thí nghiệm trong cùng một nghiệm thức.
1.2. Yếu tố thí nghiệm
32
Các nghiệm thức được bố trí hồn toàn ngẫu nhiên trên một nền chung.
1.3. Đơn vị thí nghiệm
Tất cả các đơn vị thí nghiệm của các nghiệm thức được thu thập trong điều kiện hoàn cảnh gần như là rất giống nhau.
1.4. Chỉ tiêu quan sát
Có thể tổ chức thí nghiệm với số nghiệm thức tùy ý và số lần lặp lại có thể giống hoặc khác nhau giữa các nghiệm thức
1.5. Mẫu thí nghiệm
Yếu tố thí nghiệm? Mức độ? t= số nghiệm thức
r = số lần lặp lại của mỗi nghiệm thức N= tổng số đơn vị thí nghiệm = t x r
1.6. Phân tích
Đây là kiểu bố trí thí nghiệm đơn giản nhất, trong đó tất cả các đơn vị thí nghiệm được bố trí vào các nghiệm thức. Đây chính là cách ngẫu nhiên hố vừa được đề cập. Kiểu bố trí này được dùng khi các đơn vị thí nghiệm khơng có những sai khác mang tính hệ thống. Chẳng hạn tất cả các động vật thí nghiệm có cùng độ tuổi, tất cả các nơng trại đều có kỹ thuật canh tác giốngnhau…
Thí dụ: CRD cho thí nghiệm 1 có nhân tố
– Các mức nhân tố A, B,C
– 15 lơ (plot) đất khơng có sự khácbiệt
– Bố trí 5 lơ vào mỗi nghiệmthức
1 A 2 B 3 B 4 C 5 A 6 B 7 B 8 C 9 C 10 C 11 A 12 C 13 A 14 B 15 A Quy trình phân tích một CRD
Nếu dữ liệu có phân bố chuẩn, phương sai đồng nhất:
– thí nghiệm 1 nhân tố,2mức: 2-samplet-test
33 Những hạn chế của CRD
CRD đòi hỏi tất cả các đơn vị thí nghiệm phải tương tự nhau trước khi được bố trí vào nghiệm thức. Thơng thường trong các thí nghiệm ngồi thực địa sẽ khơng có đủ các đơn vị thí nghiệm bảo đảm cho điều này. Do đó nếu có sự biến động giữa các đơn vị thí nghiệm và chúng ta bỏ qua nó thì sẽ dẫn đến hai kếtquả:
1) Mất độ chínhxác
2) Kết luận sai: giả sử một CRD được dùng trong một thí nghiệm ngồi ruộng với 3 nghiệm thức A, B, C và một phần của các lơ thí nghiệm có độ ẩm cao hơn do chúng nằm gần một nhánhsông.
Trong sơ đồ trên ta thấy các lơ chứa nghiệm thức A có độ ẩm cao hơn. Do đó khó phân biệt được kết quả thí nghiệm chịu sự chi phối của nghiệm thức A hay do độ ẩm. Thí nghiệm này khơng thích hợp với kiểu bố trí ngẫu nhiên hồn tồn. Nghiệm thức I II II Ti x̅𝑖 A 5.5 5.5 5.8 16.8 5.6 B 5.7 5.6 5.5 16.8 5.6 C 5.6 5.5 5.4 16.5 5.5 D 5.4 5.5 5.6 16.5 5.5 E 4.5 4.7 4.3 13.5 4.5 Tổng cộng 5.34 5.36 5.32 G2= 80.1 5.34
Bước 1: gọi r = khối = số lần lặp lại = 3
t: nghiệm thức = 5 df: độ tự do
34 df tổng cộng = dfTC = r*t – 1 = 14 df lặp lại = dfLL = r – 1= 3-1 = 2 df nghiệm thức = dfNT = t– 1= 5-1 = 4 df sai số = dfSS = (r-1)* (t– 1) = 8 Bước 2: CF = G 2 r∗ t = 80.1 2 3∗5 = 427.73 Tổng bình phương tổng cộng: TBPTC = ∑ ∑ 𝑥𝑖𝑗2 - CF = (5.5)2 + (5.5)2 + (5.8)2 + (5.7)2 + .. (4.3)2 - CF = 430.61-427.73= 2.91 Tổng bình phương nghiệm thức: TBPNT = ∑ ∑ 𝑇𝑖 2 𝑟 - CF = (16.8) 2 + (16.8)2 +⋯+ (13.5)2 3 - CF =2.68 Tổng bình phương lặp lại: TBPLL = ∑ ∑ 𝑟𝑖 2 𝑡 - CF = (5.34) 2 + (5.36)2 +(5.32)2 5 - CF = - 410.62 Tổng bình phương sai số: TBPSS = TBPTC – TBPLL - TBPNT = 2.91- (- 410.62)-2.68 = 410.85 Bước 3:
Trung bình bình phương lặp lại: TBBPLL = TBPLL
r−1 = - 410.62 / 2 = - 205.31 Trung bình bình phương nghiệm thức: TBBPNT = TBPNT
t−1 = 2.68/4 = 0.67 Trung bình bình phương sai số: TBBPSS = TBPSS
(t−1)∗(r−1) = 410.85/8 = 51.36 Fc : FNT = 𝐓𝐁𝐁𝐏𝐍𝐓 𝐓𝐁𝐁𝐏𝐒𝐒 = 0.01 FLL = 𝐓𝐁𝐁𝐏𝐋𝐋 𝐓𝐁𝐁𝐏𝐒𝐒 = -3.99 F bảng: F 5% Nghiệm thức: df1 = dfNT , df2 = dfSS Khối: df1 = dfkhối , df2 = dfSS F 1% Nghiệm thức: df1 = dfNT , df2 = dfSS Khối: df1 = dfkhối , df2 = dfSS Kết luận:
35
FcNT > F1%: bác bỏ H0, chấp nhận H1 ở α = 1% ( sự khác biệt của các nghiệm thức rất có ý nghĩa ở α = 1%)
FcNT< F1%: chấp nhận H0, khơng có sự sai khác giữa các nghiệm thức ở α = 1%) FcNT > F5%: bác bỏ H0, chấp nhận H1 ở α = 1% ( sự khác biệt của các nghiệm thức rất có ý nghĩa ở α = 5%)
FcNT< F5%: chấp nhận H0, khơng có sự sai khác giữa các nghiệm thức ở α = 5%) Bảng Anova Nguồn biến động Độ tự do TBP TBBP Fc F 5% F 1% Lặp lại (khối) r-1 = 2 - 410.62 - 205.31 -3.99 2 Nghiệm thức t-1 = 4 2.68 0.67 0.01 4 Sai số (t-1)*(r-1) = 8 410.85 51.36 8 Tổng cộng r*t-1 = 14 2.91 14 Bài tập:
1/ Bảng Anova chưa đầy đủ: Nguồn biến động Độ tự do TBP TBBP Fc F 5% F 1% Nghiệm thức 7 = t-1 ? 215.75 ? ? ? Sai số 8 = ? ? ? ? ? Tổng cộng 15 1786.33
a/ Hãy bổ sung đầy đủ bảng Anova trên.
b/ Hãy xác định thí nghiệm có bao nhiêu nghiệm thức và lặp lại bao nhiêu lần? Bài tập 2:
Nhà khoa học phân tích hàm lượng Calci trong 3 loại hải sản được số liệu như sau:
36 Giống hải sản Hàm lượng Tổng Trung bình A 0.35 0.40 0.58 0.50 0.47 2.30 0.46 B 0.65 0.70 0.90 0.84 0.79 3.88 0.78 C 0.60 0.80 0.75 0.73 0.66 3.54 0.71 Tông 9.72 0.65
Anh/chị hãy dùng phương pháp phân tích phương sai (Anova) để so sánh hàm lượng Calci trên 3 loại hải sản này. Dựa vào bảng Anova còn thiếu dưới đây.
Nguồn biến động Độ tự do TBP TBBP Fc Giống 2 215.75 Sai số 8 Tổng cộng 15 1786.33 Cho biết F (2,12.5%) = 3.88 F(2,12.1%) = 6.93
Mẫu hoàn toàn ngẫu nhiên Cách bố trí
Chọn n đơn vị thí nghiệm, bắt thăm n1 đơn vị để bố trí mức A1, bắt thăm
n2 đơn vị để bố trí mức A2....., bắt thăm nk-1 , đơn vị để bố trí mức A a-1, na đơn
vị cịn lại bố trí mức Aa . Như vậy là bắt thăm tồn bộ các đơn vị thí nghiệm để bố trí một cách hồn tồn ngẫu nhiên các mức của nhân tố. Cách bố trí ngẫu nhiên được trình bày chi tiết ở trên.
Ví dụ: yếu tố thí nghiệm A có 4 nghiệm thức A1, A2, A3, A4 với các 5 đơn vị thí nghiệm trong một nghiệm thức. Như vậy tồn bộ số đơn vị thí nghiệm là 20 và giả sử số động vật này được đánh số từ 1 đến 20. Sau khi bố trí một cách ngẫu nhiên ta có thể được mơ hình thiết kế thí nghiệm như sau:
37
Khi kết thúc thí nghiệm, số liệu có thể ghi lại để dễ dàng và thuận tiện cho việc tính tốn như sau:
Dưới dạng tổng quát với a nghiệm thức số lần lặp lại r nghiệm thức ta có
Phân tích số liệu
Với các thí nghiệm được bố trí đơn giản với 2 nghiệm thức. Tiến hành so kết quả của 2 nghiệm thức bằng phép thử T. Nếu thí nghiệm bao gồm nhiều nghiệm thức, thì phân tích phương sai (ANOVA) là phù hợp nhất.
Mơ hình phân tích
38 Trong đó trung bình chung
ai: chênh lệch do ảnh hưởng của mức i
ei j : sai số ngẫu nhiên , các ei j độc lập , phân phối chuẩn N
(0,2)
Cách phân tích
Cách phân tích số liệu được trình bày chi tiết ở trên. Lưu ý rằng, trong mơ hình thí nghiệm hồn tồn ngẫu nhiên có 2 nguồn biến động. (1) biến động giữa các nghiệm thức SSA và (2) biến động do sai số ngẫu nhiên (SSE); toàn bộ biến động của thí nghiệm (SSTO) bằng tổng số các biến động thành phần (SSA và SSE) hợp thành. Các nguồn biến động này có thể được tính như sau:
Tổng bình phương tồn bộ biến động
Tổng bình phương do nhân tố
Tổng bình phương do sai số
Các bậc tự do dfTO = n -1; dfA = a-1; dfE = n - a Các trung bình MSA = SSA / dfA; MSE = SSE / dfE FTN = MSA / MSE; giá trị tới hạn F(,dfA,dfE)
Kết luận
Nếu FTN F(,dfA,dfE) thì chấp nhận H0, ngược lại thì bác bỏ H0 Bảng phân tích phương sai
39
Ví dụ: Một thí nghiệm tiến hành để so sánh mức độ tăng trọng của gà ở 4
khẩu phần ăn khác nhau. Chọn 20 con gà đồng đều nhau và phân một cách ngẫu nhiên vào một trong 4 khẩu phần. Như vậy ta có 4 nhóm động vật thí nghiệm, mỗi nhóm gồm 5 gà ; kết quả thí nghiệm được ghi lại ở bảng sau ( đơn vị tăng trọng tính theo g):
Đây là ví dụ về thí nghiệm được bố trí theo mơ hình một nhân tố hồn tồn ngẫu nhiên . Yếu tố thí nghiệm là khẩu phần với 4 nghiệm thức ( Khẩu phần 1, 2, 3 và 4).
Ta có bảng phân tích phương sai
Kết luận: Bác bỏ H0 , như vậy tăng trọng của gà ở 4 khẩu phần ăn không phải như nhau. Sự sai khác nhỏ nhất có ý nghĩa (Least Significant Difference - LSD) đối với 2 mức Ai và Aj có số lần lặp lại ni và nj tính theo cơng thức:
40 sánh các trung bình có thể dùng
so các trung bình
(A1) so với (A2) |79 - 71| = 8 < 38,54 Sai khác khơng có ý nghĩa (A1) so với (A3) |79 - 81,4| = 2,4 < 38,544 Sai khác khơng có ý nghĩa (A1) so với (A4) |79 - 142,8| = 63,8 > 38,54 Sai khác có ý nghĩa
(A2) so với (A3) |71 - 81,4| = 10,4 < 38,54 Sai khác khơng có ý nghĩa (A2) so với (A4) |71 - 142,8| = 71,8 > 38,54 Sai khác có ý nghĩa
(A3) so với (A4) |81,4 - 142,8| = 61,4 > 38,54 Sai khác có ý nghĩa
Ta có thể xây dựng một bảng có các chữ cái a,b,c ...để thể hiện sự sai khác giữa các nghiệm thức theo các bước sau :
1/ sắp xếp các giá trị trung bình theo thứ tự giảm dần như sau:
2/ dựa vào kết quả so sánh để tạo các đường gạch chung cho các khẩu phần có giá trị trung bình bằng nhau, cụ thể như sau:
mỗi một đường thẳng tương ứng với một chữ cái a, b, c
41
Từ bảng trên, ta có thể đặt các chữ cái bên cạnh các số trung bình và sắp xếp khẩu phần theo thứ tự tăng dần như ban đầu ta có như sau:
Việc so sánh hai trung bình LSD thường chỉ dùng để so sánh một số cặp trung bình mà trước khi thí nghiệm chúng ta đã có ý đồ so sánh. Nếu so sánh tất cả các cặp trung bình, hay cịn gọi là kiểm định sự bằng nhau của tất cả các cặp trung bình thì mức ý nghĩa khơng cịn là α mà nhỏ đi nhiều, do đó các nhà nghiên cứu thống kê đã đề xuất nhiều cách kiểm định khác để đảm bảo mức ý nghĩa α như Duncan , kiểm định đa phạm vi,... Trong các chương trình máy tính chun về thống kê cịn có nhiều cách so sánh khác.
Ví dụ: muốn so sánh theo Duncan (các lần lặp lại bằng nhau và gọi là r) phải sắp các trung bình từ nhỏ đến lớn.khi so sánh hiệu số các trung bình thì, tùy theo các trung bình ở kề nhau hay cách nhau một trung bình, cách nhau hai trung bình,...mà dùng các ngưỡng so sánh khác nhau. Việc so sánh tiến hành như sau:
1/ Tính sai số của trung bình
2/ Lấy gia trị rp trong bảng Duncan ứng với bậc tự do dfE nhân với sxi để có khoảng Rp
3/ So sánh hiệu xj - xi với Rp
Nếu hai trung bình liền nhau thì lấy p = 2, cách nhau một thì p=3, cách nhau hai thì p=4,...
Nếu hiệu bé hơn hay bằng Rp thì sai khác khơng có ý nghĩa, ngượ lại thì sai khác có ý nghĩa.
42
(A1) - (A2) = 79,0- 71,0 = 8 < R2 = 38,56 Sai khác khơng có ý nghĩa (A3) - (A2)= 81,4 - 71,0 = 10,4 < R3 = 40,49 Sai khác khơng có ý nghĩa (A4) - (A2) = 142,8 - 71 = 71,8 > R4 = 41,52 Sai khác có ý nghĩa
(A3) - (A1) = 81,4 - 79,0 = 2,4 < R2 = 38,56 Sai khác khơng có ý nghĩa (A4) - (A1)= 142,8 - 79 = 63,8 > R3 = 40,49 Sai khác có ý nghĩa
(A4) -(A3) =142,8- 81,4= 61,4 > R2 = 38,56 Sai khác có ý nghĩa Trong ví dụ này kết luận không khác với so sánh theo LSD.