[r]
(1)Phần
Ước lượng kiểm ñịnh giả thiết với phần mềm SAS 3.1. Giả thiết ñối thiết
Khi khảo sát một tổng thể (hoặc nhiều tổng thể) xem xét một (hoặc nhiều) biến ngẫu nhiên có thểđưa một giả thiết đó liên quan đến phân phối của biến ngẫu nhiên hoặc nếu biết phân phối rồi đưa giả thiết về tham số của tổng thể ðể có thểđưa một kết luận thống kê đó đối với giả thiết phải chọn mẫu ngẫu nhiên, tính tham số mẫu, chọn mức ý nghĩa α sau đó đưa kết luận
Bài tốn kiểm định tham sốΘ của phân phối có dạng H0 : Θ = Θo với Θo một sốđã cho đó Kết luận thống kê có dạng: “chấp nhận H0” hay “bác bỏ H0” Nhưng nếu đặt vấn đề như
vậy cách giải quyết hết sức khó, nếu khơng chấp nhận H0: Θ = Θo điều đó có nghĩa
là có thể chấp nhận một vơ số Θ khác Θo, đó thường đưa tốn dưới dạng cụ
thể hơn nữa: cho giả thiết H0 đối thiết H1, kết luận hoặc chấp nhận H0 hoặc bác bỏ
H0, trường hợp này, khơng hồn tồn tương đương, nhưng coi như chấp nhận ñối
thiết H1
Nếu chấp nhận H0 lúc giả thiết đúng H1 mắc sai lầm loại II xác suất mắc sai
lầm ñược gọi rủi ro loại hai ββββ Ngược lại nếu bác bỏ H0 lúc giả thiết đúng
là H0 mắc sai lầm loại I xác suất mắc sai lầm đó gọi rủi ro loại một α
Quyết ñịnh
Giả thiết Bác bỏ H0 Chấp nhận H0
H0 ñúng Sai lầm loại I (αααα) Quyết ñịnh ñúng
H0 sai Quyết ñịnh ñúng Sai lầm loại II (ββββ)
Như vậy tốn kiểm định giả thiết ln ln có hai loại rủi ro, loại I loại II, tuỳ
vấn đề mà nhấn mạnh loại rủi ro Thơng thường người ta hay tập trung ý vào sai lầm loại I kiểm ñịnh phải khống chế cho rủi ro loại I không vượt một mức α gọi
mức ý nghĩa
Trước hết xem xét cụ thể toán kiểm ñịnh giả thiết H0: Θ = Θo, ñối thiết H1: Θ = Θ1 với Θ1
là một giá trị khác Θo ðây tốn kiểm định giả thiết ñơn Quy tắc kiểm ñịnh căn cứ vào
hai giá trị cụ thểΘ1 và Θo, vào mức ý nghĩa α căn cứ vào cả sai lầm loại hai Việc
về lý thuyết thống kê khơng gặp khó khăn
(2)H1 : Θ ≠ Θo gọi ñối thiết hai phía
H1 : Θ > Θo gọi ñối thiết phải
H1 : Θ < Θo gọi ñối thiết trái
Hai ñối thiết sau gọi đối thiết một phía Việc chọn ñối thiết tuỳ thuộc vấn ñề khảo sát cụ thể
Nếu P ≥α, chấp nhận giả thiết H0
Nếu P < α, Bác bỏ giả thiết H0 chấp nhận ñối thiết H1 3.2. Kiểm ñịnh phân phối chuẩn
ðối với tất cả phép thửñối với biến ñịnh lượng, ñều giả thiết rằng số liệu thu thập ñược (số liệu thơ) đều tn theo phân phối chuẩn Nếu số liệu khơng tn theo phân phối chuẩn các phép thử dưới đây sẽ khơng có hiệu lực Trong trường hợp cần biến ñổi số liệu về
phân phối chuẩn hoặc sử dụng kiểm ñịnh phi tham số Giả thiết của phép thử:
H0: Số liệu có phân bố chuẩn H1: Số liệu khơng có phân bố chuẩn
Ví dụ 2: Tăng trọng trung bình (gram/ngày) của 36 lợn ni vỗ béo giống Landrace ñược rút ngẫu nhiên từ một trại chăn ni Số liệu thu được như sau:
577 596 594 612 600 584 618 627 588 601 606 559 615 607 608 591 565 586 621 623 598 602 581 631 570 595 603 605 616 574 578 600 596 619 636 589 Cán bộ kỹ thuật trại cho rằng tăng trọng trung bình của tồn ñàn lợn trại 607 gram/ngày Theo anh chị kết luận đó đúng hay sai, sao?
SAS CODE DATA SAS2;
INPUT KL;
CARDS; 577 596 594 589 ;
PROC UNIVARIATE NORMAL PLOT;
VAR KL;
RUN;
Kết quả từ SAS
The UNIVARIATE Procedure Variable: KL Moments
(3)Basic Statistical Measures Location Variability
Mean 599.1944 Std Deviation 18.65601 Median 600.0000 Variance 348.04683 Mode 596.0000 Range 77.00000 Interquartile Range 26.50000
NOTE: The mode displayed is the smallest of modes with a count of Tests for Location: Mu0=0
Test -Statistic- -p Value - Student's t t 192.7082 Pr > |t| <.0001 Sign M 18 Pr >= |M| <.0001 Signed Rank S 333 Pr >= |S| <.0001 Tests for Normality
Test Statistic - -p Value - Shapiro-Wilk W 0.99129 Pr < W 0.9918 Kolmogorov-Smirnov D 0.057007 Pr > D >0.1500 Cramer-von Mises W-Sq 0.01366 Pr > W-Sq >0.2500 Anderson-Darling A-Sq 0.094344 Pr > A-Sq >0.2500 Quantiles (Definition 5)
(4)BAI THONG KE MO TA 09:32 Saturday, June 24, 2000 28 HO VA TEN
The UNIVARIATE Procedure Variable: KL Quantiles (Definition 5) Quantile Estimate 1% 559.0 0% Min 559.0 Extreme Observations
Lowest Highest - Value Obs Value Obs
559 12 621 19
565 17 623 20
570 25 627
574 30 631 24
577 636 35
Stem Leaf # Boxplot 63 |
63 |
62 |
62 13 |
61 5689 |
61 + -+
60 5678 | |
60 00123 * -*
59 5668 | + |
59 14 | |
58 689 + -+
58 14 |
57 78 |
57 04 |
56 |
56 |
55 | + + + +
(5)BAI THONG KE MO TA 09:32 Saturday, June 24, 2000 29 HO VA TEN
The UNIVARIATE Procedure Variable: KL
Normal Probability Plot
637.5+ +* | *++ | +*+ | *+* | ****+ | *++ | *** | ***+ 597.5+ ***+ | **+ | *** | +** | +** | *+* | +*+ | +++ 557.5+ ++*
+ + + + + + + + + + +
-2 -1 +1 +2
Giá trị P-Value = 0,9918 lớn hơn 0,05 (α), như vậy H0ñược chấp nhận Kết luận số liệu tuân
theo phân phối chuẩn
3.3. Kiểm định một giá trị trung bình bằng phép thử T
Trong thực tế ta khơng có thơng tin về độ lệch chuẩn của quần thể (σ), phép thử T ñược sử
dụng ñể kiểm định giá trị trung bình độ lệch chuẩn của mẫu (s) ñược sử dụng thay thếñộ
lệch chuẩn quần thể Giả thiết của phép thử số liệu tuân theo phân bố chuẩn
SAS CODE DATA SAS2;
INPUT KL;
(6)Kết quả từ SAS
The TTEST Procedure Statistics
Lower CL Upper CL Lower CL Upper CL
Variable N Mean Mean Mean Std Dev Std Dev Std Dev Std Err KL 36 592.88 599.19 605.51 15.132 18.656 24.336 3.1093 T-Tests
Variable DF t Value Pr > |t|
KL 35 -2.51 0.0168
Với xác suất của phép thử P = 0,0168 < 0,05 (α), bác bỏ H0 chấp nhận ñối thiết H1 Kết
luận: Tăng trọng của lợn Landrace ở trại nêu không bằng 607 gram/ ngày (P < 0,05) Khoảng tin cậy 95% 592,88 – 605,51 gram/ ngày
3.4. Kiểm định giá trị trung bình
Khi tiến hành thí nghiệm để so sánh sự khác giữa cơng thức thí nghiệm, có trường hợp chọn mẫu có thể xảy ra: 1) Chọn mẫu ñộc lập 2) chọn mẫu theo cặp (xem 2.4, tr.23, Giáo trình Thiết kế thí nghiệm 2007) Tuỳ thuộc vào cách chọn mẫu bố trí thí nghiệm mà ta có thể sử dụng phép thử T hay T cặp đơi cho phù hợp
3.4.1. Phép thử T cặp đơi
ðối với thí nghiệm chọn mẫu theo cặp, điều kiện nhất của toán kiểm tra phân bố chuẩn của phần chênh lệch (d) số liệu giữa cơng thức thí nghiệm
Với kiểm định phía ta có giả thiết H0: µd = đối thiết H1: µd≠ (µd trung bình của sự
chênh lệch giữa trung bình µ1 µ2)
Ví dụ 3: Tăng trọng (pound) của 10 cặp bê sinh đơi giống hệt dưới hai chếđộ chăm sóc khác (A B) Bê từng cặp ñược bắt thăm ngẫu nhiên về một hai cách chăm sóc
Hãy kiểm định giả thiết H0: Tăng trọng trung bình ở hai cách chăm sóc như nhau, đối thiết H1:
Tăng trọng trung bình khác ở hai cách chăm sóc với mức ý nghĩa α = 0,05 Số liệu thu
ñược như sau:
Cặp sinh đơi 1 2 3 4 5 6 7 8 9 10
Tăng trọng ở cách A 43 39 39 42 46 43 38 44 51 43 Tăng trọng ở cách B 37 35 34 41 39 37 35 40 48 36
(7)Thay kiểm định hai mẫu bằng phép thử T cặp đơi, tốn sẽ tiến hành kiểm định phần chênh lệch giữa cặp (D) với giá trị
ðể tạo biến mới cơ sở dữ liệu của SAS ta có thể sử dụng câu lệnh logic Ví dụ ta tao cột hiệu số của từng cặp theo lệnh D = A – B
SAS CODE
OPTIONS PAGESIZE = 60 LINESIZE = 80;
DATA SAS3;
INPUT A B; D = A -B;
CARDS; 43 37
39 35 39 34 42 41 46 39 43 37 38 35 44 40 51 48 43 36 ;
TITLE 'BAI SO SANH CAP DOI';
title2 'HO VA TEN';
PROC TTEST H0 = 0 ALPHA=.05;
VAR D;
RUN;
Kết quả từ SAS:
BAI SO SANH CAP DOI HO VA TEN 20:38 Friday, June 23, 2000 The TTEST Procedure
Statistics
Lower CL Upper CL Lower CL Upper CL Variable N Mean Mean Mean Std Dev Std Dev Std Dev D 10 3.2014 4.6 5.9986 1.3448 1.9551 3.5692 Statistics
Variable Std Err Minimum Maximum D 0.6182 T-Tests
(8)3.4.2. Kiểm ñịnh sựñồng nhất của phương sai
ðối với kiểm ñịnh giá trị trung bình, ngồi giả thiết số liệu tn theo phân phối chuẩn cong một vấn ñề thứ đặt Hai phương sai có đồng nhất hay khơng?
ðối với kiểm định hai phía ta có giả thiết H0: Hai phương sai đồng nhất (σ²1 = σ²2) H1: Hai
phương sai khơng đồng nhất (σ²1≠σ²2) Khi chấp nhận giả thiết H0, phương sai chung (σ)sẽ ñược sử dụng ñể tiến hành kiểm ñịnh phép thử T; ngược lại (bác bỏ H0) phép thử T gần xác sẽđược thực hiện
Ví dụ 3: ðể so sánh khối lượng của giống bò, tiến hành chọn ngẫu nhiên cân 12 ñối với giống thứ nhất 15 ñối với giống thứ Khối lượng (kg) thu ñược như sau:
Giống bò thứ nhất 187,6 180,3 198,6 190,7 196,3 203,8 190,2 201,0 194,7 221,1 186,7 203,1
Giống bò thứ hai 148,1 146,2 152,8 135,3 151,2 146,3 163,5 146,6 162,4 140,2 159,4 181,8 165,1 165,0 141,6 Theo anh (chị), khối lượng của giống bị có sự sai khác khơng?
3.4.3. Phép thử T
Sử dụng phép thử T để kiểm định giá trị trung bình khơng biết độ lệch chuẩn của quần thể (σσσσ) Minitab sẽ tính khoảng tin cậy (CI 95%) sự chênh lệch giữa giá trị trung bình quần thể thực hiện phép kiểm ñịnh ðối với kiểm ñịnh phía ta có giả thiết: H0: µ1 = µ2 với đối
thiết H1: µ1≠ µ2; đó µ1 và µ2 giá trị trung bình của quần thể thứ nhất thứ SAS CODE
DATA SAS3;
INPUT P GIONG;
CARDS; 187.6 180.3
141.6 ;
TITLE 'SO SANH GIA TRI TRUNG BINH MAU DOC LAP';
TITLE2 'HO VA TEN';
PROC TTEST;
CLASS GIONG;
VAR P;
RUN;
SO SANH GIA TRI TRUNG BINH MAU DOC LAP HO VA TEN 16:48 Sunday, June 25, 2000 The TTEST Procedure
Statistics
(9)Statistics
Variable GIONG Std Err Minimum Maximum P 3.0646 180.3 221.1 P 3.1762 135.3 181.8 P Diff (1-2) 4.4888
T-Tests
Variable Method Variances DF t Value Pr > |t| P Pooled Equal 25 9.46 <.0001 P Satterthwaite Unequal 24.8 9.62 <.0001 Equality of Variances
Variable Method Num DF Den DF F Value Pr > F P Folded F 14 11 1.34 0.6312
(10)3.5. Phân tích phương sai
Phân tích phương sai (Analysis of Variance - ANOVA) cơng cụ hữu ích để so sánh nhiều giá trị trung bình ðiều kiện của tốn phân tích phương sai 1) số liệu tuân theo phân bố
chuẩn 2) phương sai đồng nhất Trong khn khổ giáo trình chúng tơi chỉđề cập đến việc kiểm tra điều kiện của tốn đối với mơ hình thiết kế thí nghiệm đơn giản (Thí nghiệm một yếu tố hoàn toàn ngẫu nhiên)
Với kiểm định phía ta có giả thiết H0: µ1 = µ2 = = µa đối thiết H1: µ1≠ µ2≠ ≠µa (µ
trung bình của quần thểở cơng thức thí nghiệm thứ 1, 2, a)
3.5.1. Thí nghiệm một yếu tố hồn tồn ngẫu nhiên
Xét trường hợp đơn giản nhất đối với tốn phân tích phương sai Chỉ có một yếu tố nhất thí nghiệm, yếu tố phi thí nghiệm cịn lại được coi có tác động như đến
đối tượng thí nghiệm
Ví dụ 4: Theo dõi tăng trọng của cá (kg) trong thí nghiệm với công thức nuôi (A, B, C, D E) Hãy cho biết tăng trọng của cá ở cơng thức ni Nếu có sự khác nhau, tiến hành so sánh sự sai khác của từng cặp giá trị trung bình có thể bằng chữ
A B C D E
0,95 0,43 0,70 1,00 0,90 0,85 0,45 0,90 0,95 1,00 0,85 0,40 0,75 0,90 0,95 0,90 0,42 0,70 0,90 0,95
Mơ hình phân tích yi j = µ + ai + εi j
yij = quan sát thứ j ở cơng thức i, µ = trung bình chung,
ai = ảnh hưởng của công thức i
εij = sai số ngẫu nhiên; εij ñộc lập, phân phối chuẩn N∼(0,σ2) SAS CODE
DATA SAS4;
INPUT KL KP $;
CARDS; 0.95 A 0.85 A 0.85 A 0.90 A 0.43 B
1.00 E 0.95 E 0.95 E ;
TITLE 'PHAN TICH PHUONG SAI YEU TO';
TITLE2 'HO VA TEN';
PROC ANOVA;
CLASS KP;
MODEL KL = KP;
(11)The ANOVA Procedure Dependent Variable: KL
Sum of
Source DF Squares Mean Square F Value Pr > F Model 0.76325000 0.19081250 60.99 <.0001 Error 15 0.04692500 0.00312833
Corrected Total 19 0.81017500
R-Square Coeff Var Root MSE KL Mean 0.942080 7.057603 0.055932 0.792500
Source DF Anova SS Mean Square F Value Pr > F KP 0.76325000 0.19081250 60.99 <.0001 Xác suất p-value = 0,000 < 0,05 (α) vậy H0 bị bác bỏ H1ñược chấp nhận Kết luận rằng Tăng trọng trung bình của cá ở cơng thức thức ăn có sự sai khác (P < 0,001)
So sánh cặp bác bỏ giả thiết H0 chấp nhận giả thiết H1 PROC ANOVA;
CLASS KP;
MODEL KL = KP;
MEANS KP / DUNCAN;
RUN;
Kết quả từ SAS
The ANOVA Procedure
Duncan's Multiple Range Test for KL
NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate Alpha 0.05
Error Degrees of Freedom 15 Error Mean Square 0.003128
Number of Means Critical Range .08430 08837 09090 09262 Means with the same letter are not significantly different Duncan Grouping Mean N KP
A 0.95000 E A
A 0.93750 D A
A 0.88750 A B 0.76250 C C 0.42500 B
Sự sai khác có ý nghĩa (P < 0,05) giữa nghiệm thức của từng cặp Khơng có sự sai khác
(12)3.5.2. Thí nghiệm một yếu tố khối ngẫu nhiên ñầy ñủ
Xem xét một thí nghiệm mà đối tượng thí nghiệm chịu tác động đồng thời của một yếu tố
chính (yếu tố thí nghịêm) yếu tố phụ (khối)
Ví dụ 5: Nghiên cứu số lượng tế bào lymphô ở chuột (×1000 tế bào mm-3 máu) được sử dụng 4 loại thuốc khác (A, B, C D; thuốc D placebo) qua lứa; số liệu thu được trình bày ở bảng dưới Cho biết ảnh hưởng của thuốc đến tế bào lymphơ?
Lứa Lứa Lứa Lứa Lứa
Thuốc A 7,1 6,1 6,9 5,6 6,4
Thuốc B 6,7 5,1 5,9 5,1 5,8
Thuốc C 7,1 5,8 6,2 5,0 6,2
Thuốc D 6,7 5,4 5,7 5,2 5,3
Mơ hình phân tích
yi j = µ + αi + βj + εi j i = 1,…,a; j = 1,…,b
yij = quan sát thứ i của nhân tốở khối thứ j, µ trung bình chung
αi = ảnh hưởng của mức i của nhân tố, βj = ảnh hưởng của khối j ,
εij sai số ngẫu nhiên; εij ñộc lập, phân phối chuẩn N(0,σ2) SAS CODE
DATA SAS5;
INPUT TEBAO THUOC $ LUA;
CARDS; 7.1 A 6.7 B 7.1 C 6.7 D
6.2 C 5.3 D ;
TITLE 'KHOI NGAU NHIEN DAY DU';
TITLE2 'HO VA TEN';
PROC ANOVA;
CLASS THUOC LUA;
MODEL TEBAO = THUOC LUA;
MEANS THUOC / DUNCAN;
RUN;
Kết quả từ SAS
KHOI NGAU NHIEN DAY DU 10:29 Monday, June 26, 2000 HO VA TEN
(13)The ANOVA Procedure Dependent Variable: TEBAO
Sum of
Source DF Squares Mean Square F Value Pr > F Model 8.24850000 1.17835714 22.20 <.0001 Error 12 0.63700000 0.05308333
Corrected Total 19 8.88550000
R-Square Coeff Var Root MSE TEBAO Mean 0.928310 3.862501 0.230398 5.965000
Source DF Anova SS Mean Square F Value Pr > F THUOC 1.84550000 0.61516667 11.59 0.0007 LUA 6.40300000 1.60075000 30.16 <.0001 KHOI NGAU NHIEN DAY DU 10:29 Monday, June 26, 2000 HO VA TEN
The ANOVA Procedure
Duncan's Multiple Range Test for TEBAO
NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate
Alpha 0.05 Error Degrees of Freedom 12 Error Mean Square 0.053083
Number of Means Critical Range .3175 3323 3413 Means with the same letter are not significantly different Duncan Grouping Mean N THUOC
A 6.4200 A B 6.0600 C C 5.7200 B C
(14)Ví dụ 6: Một thí nghiệm được tiến hành ñể xác
ñịnh ảnh hưởng của cơng thức thức ăn (A1, A2 A3) đến tăng trọng trung bình ngày (gram / ngày) của bê ñực Bê ñực ñược cân chia thành khối dựa theo khối lượng bắt ñầu thí nghiệm Trong mỗi khối có động vật thí nghiệm ñược chọn ñược phân ngẫu nhiên về với nghiệm thức Số liệu thu thập sau khi kết thúc thí nghiệm như sau:
Khối
I II III IV
A1 826 806 864 834 795 810 850 845 A2 827
800 871 881 729 709 860 840 A3 753
773 801 821 736 740 820 835 Nếu một cơng thức - một khối có nhiều quan sát ngồi việc đánh giá mức độ ảnh hưởng của từng yếu tố riêng biệt ta cịn có thể xác định mối tương tác theo mơ hình phân tích sau:
yi jk = µ + αi + βj + α×βij + εi j yi jk quan sát thứ k của khối thứ j nghiệm thức thứ i, µ trung bình chung,
αi chênh lệch ảnh hưởng của mức i của nhân tố, βj chênh lệch ảnh hưởng của khối j,
α×βij chênh lệch tương tác giữa nghiệm thức khối,
εijk sai số ngẫu nhiên; εijk ñộc lập, phân phối chuẩn N(0,σ2), SAS CODE
DATA SAS6;
INPUT KL CT $ KHOI $;
CARDS; 826 A1 I 806 A1 I
820 A3 IV 835 A3 IV ;
TITLE 'KHOI NGAU NHIEN DAY DU TUONG TAC';
TITLE2 'HO VA TEN';
PROC ANOVA;
CLASS CT KHOI;
MODEL KL = CT KHOI CT*KHOI;
MEANS CT / DUNCAN;
RUN;
Kết quả từ SAS
(15)KHOI NGAU NHIEN DAY DU TUONG TAC 11 HO VA TEN 10:29 Monday, June 26, 2000 The ANOVA Procedure
Dependent Variable: KL
Sum of
Source DF Squares Mean Square F Value Pr > F Model 11 49929.83333 4539.07576 25.81 <.0001 Error 12 2110.00000 175.83333
Corrected Total 23 52039.83333
R-Square Coeff Var Root MSE KL Mean 0.959454 1.638244 13.26022 809.4167
Source DF Anova SS Mean Square F Value Pr > F CT 8025.58333 4012.79167 22.82 <.0001 KHOI 33816.83333 11272.27778 64.11 <.0001 CT*KHOI 8087.41667 1347.90278 7.67 0.0015 KHOI NGAU NHIEN DAY DU TUONG TAC 12 HO VA TEN 10:29 Monday, June 26, 2000 The ANOVA Procedure
Duncan's Multiple Range Test for KL
NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate
Alpha 0.05 Error Degrees of Freedom 12 Error Mean Square 175.8333 Number of Means Critical Range 14.45 15.12
Means with the same letter are not significantly different Duncan Grouping Mean N CT
A 828.750 A1 A
(16)3.5.3. Thí nghiệm kiểu Ơ vng latinh
ðối với mơ hình thí nghiệm Ơ vng latinh, ngồi yếu tố thí nghiệm ta cịn yếu tố khác (yếu tố hàng cột) tác ñộng lên đối tượng thí nghiệm
Ví dụ 7A: Một thí nghiệm được tiến hành nhằm xác định ảnh hưởng của loại thức ăn bổ sung khác (A, B, C D) ñến lượng cỏ khơ mà bê ni vỗ béo thu nhận được (kg/ngày) Thí nghiệm được thiết kế theo mơ hình ô vuông la tinh với ñộng vật giai ñoạn, mỗi giai
ñoạn 20 ngày Trong mỗi giai ñoạn 10 ngày ñầu
ñược coi giai đoạn thích nghi, 10 ngày tiếp theo giai đoạn thí nghiệm để thu thập số liệu Số liệu thu ñược khối lượng cỏ khơ trung bình bê thu nhận được ở 10 ngày thí nghiệm Hãy rút ra kết luận từ thí nghiệm nêu
Bê Giai
ñoạn 1 2 3 4 1 10,0
(B) 9,0 (D) 11,1 (C) 10,8 (A)
2 10,2 (C) 11,3 (A) 9,5 (D) 11,4 (B)
3 8,5 (D) 11,2 (B) 12,8 (A) 11 (C)
4 11,1 (A) 11,4 (C) 11,7 (B) 9,9 (D)
Mơ hình phân tích
yi j k = µ + hi + cj + ak + ei j k
yi j k = quan sát ở hàng thứ i, cột thứ j ở nghiệm thức k
µ = trung bình chung,
hi = chênh lệch ảnh hưởng của hàng i,
cj = chênh lệch ảnh hưởng của cột j,
ak = chênh lệch ảnh hưởng của mức k của nhân tố,
ei j k = sai số ngẫu nhiên; giả sử ei j k ñộc lập, phân phối chuẩn N(0,σ²) SAS CODE
DATA SAS7;
INPUT GD BE TA $ KLCO;
CARDS;
1 B 10.0 2 C 10.2 3 D 8.5 4 A 11.1 1 D 9.0 2 A 11.3 3 B 11.2 4 C 11.4 1 C 11.1 2 D 9.5 3 A 12.8 4 B 11.7 1 A 10.8 2 B 11.4 3 C 11.0 4 D 9.9 ;
PROC ANOVA;
CLASS GD BE TA;
MODEL KLCO = GD BE TA;
MEANS TA / DUNCAN;
(17)Kết quả từ SAS
The ANOVA Procedure Class Level Information Class Levels Values GD 4 BE 4 TA A B C D Number of observations 16 The ANOVA Procedure Dependent Variable: KLCO
Sum of
Source DF Squares Mean Square F Value Pr > F Model 17.09562500 1.89951389 13.12 0.0027 Error 0.86875000 0.14479167
Corrected Total 15 17.96437500
R-Square Coeff Var Root MSE KLCO Mean 0.951640 3.562458 0.380515 10.68125
Source DF Anova SS Mean Square F Value Pr > F GD 1.48187500 0.49395833 3.41 0.0938 BE 3.59187500 1.19729167 8.27 0.0149 TA 12.02187500 4.00729167 27.68 0.0007 The ANOVA Procedure
Duncan's Multiple Range Test for KLCO
NOTE:This test controls the Type I comparisonwise error rate, not the experimentwise error rate Alpha 0.05
Error Degrees of Freedom Error Mean Square 0.144792
Number of Means Critical Range .6584 6823 6942 Means with the same letter are not significantly different Duncan Grouping Mean N TA
A 11.5000 A A
A 11.0750 B A
A 10.9250 C B 9.2250 D
(18)Nếu thí nghiệm được tiến hành nhiều vng latinh khác việc phân tích số liệu sẽ
bao gồm ảnh hưởng ảnh hưởng của yếu tố một vng (hàng, cột, yếu tố thí nghiệm) và ảnh hưởng của
Ví dụ 7B: Giả sử, một thí nghiệm được thiết kế tương tự như ở ví dụ M-1.9a, nhưng có có vng la tinh được thiết kế đồng thời mỗi đều có
động vật thí nghiệm cơng thức thí nghiệm khác Số liệu ở ô vuông la tinh thứ nhất như ví dụ 7A, vuông la tinh thứ như bảng bên Hãy tiến hành phân tích để đưa kết luận đưa nhận xét về mơ hình thiết kế ví dụ 7A 7B
Bê Giai
ñoạn 1 2 3 4
1 10,9 (C) 11,2 (A) 9,4 (D) 11,2 (B)
2 10,5 (B) 9,6 (D) 11,4 (C) 10,9 (A)
3 11,1 (A) 11,4 (C) 11,7 (B) 9,8 (D)
4 8,8 (D) 12,9 (B) 11,4 (A) 11,2 (C)
Mơ hình phân tích
yi j km = µ + om + h(o)im + c(o)jm + ak + ei j km
yi j km = quan sát ở hàng thứ i, cột thứ j ở nghiệm thức k
µ = trung bình chung,
h(o)im = chênh lệch ảnh hưởng của hàng i,
c(o)jm = chênh lệch ảnh hưởng của cột j,
ak = chênh lệch ảnh hưởng của mức k của nhân tố,
ei j k m = sai số ngẫu nhiên; giả sử ei j k ñộc lập, phân phối chuẩn N(0,σ²)
SAS CODE
DATA SAS7B;
INPUT OV GD BE TA $ KLCO;
CARDS;
OV GD BE TA KLCO 1 1 B 10.0 1 C 10.2 1 D 8.5 1 A 11.1 1 D 9.0
2 C 11.4 2 3 B 11.7 2 A 11.4 2 B 11.2 2 A 10.9 2 D 9.8 2 4 C 11.2 ;
TITLE 'HAI O VUONG LA TINH';
TITLE2 'HO VA TEN';
PROC ANOVA;
CLASS OV GD BE TA;
MODEL KLCO = OV GD(OV) BE(OV) TA;
MEANS TA / DUNCAN;
(19)Kết quả từ SAS
HAI O VUONG LA TINH 10:29 Monday, June 26, 2000 16 HO VA TEN
The ANOVA Procedure Class Level Information Class Levels Values OV 2 GD 4 BE 4 TA A B C D Number of observations 33
NOTE: Due to missing values, only 32 observations can be used in this analysis
HAI O VUONG LA TINH 10:29 Monday, June 26, 2000 17 HO VA TEN
The ANOVA Procedure Dependent Variable: KLCO
Sum of
Source DF Squares Mean Square F Value Pr > F Model 16 30.50250000 1.90640625 9.49 <.0001 Error 15 3.01468750 0.20097917
Corrected Total 31 33.51718750
R-Square Coeff Var Root MSE KLCO Mean 0.910055 4.166664 0.448307 10.75938
(20)HAI O VUONG LA TINH 10:29 Monday, June 26, 2000 18 HO VA TEN
The ANOVA Procedure
Duncan's Multiple Range Test for KLCO
NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate
Alpha 0.05 Error Degrees of Freedom 15 Error Mean Square 0.200979
Number of Means Critical Range .4778 5008 5152 Means with the same letter are not significantly different Duncan Grouping Mean N TA
A 11.3250 A A
A 11.3250 B A
A 11.0750 C B 9.3125 D
Kết quả phân tích cho thấy xác suất của phép thửđối với yếu tố thí nghiệm (TA) P = 0,0007, vì vậy giả thiết H0 bị bác bỏ kết luận Có ảnh hưởng của thức bổ sung đến lượng cỏ khơ mà bê thu nhận được (P < 0,05)
3.5.4. Thí nghiệm nhân tố chéo
Với mơ hình thí nghiệm nhân tố chéo nhau, ngồi nghiên cứu tác động của từng yếu tố thí nghiệm ta nghiên cứu mối tương tác giữa yếu tố
Ví dụ 8: Một nghiên cứu được tiến hành
ñể xác ñịnh ảnh hưởng của việc bổ sung loại vitamin (A B) vào thức ăn ñến tăng trọng (kg/ngày) của lợn Hai mức ñối với vitamin A (0 mg) mức ñối với vitamin B (0 mg) được sử dụng thí nghiệm Tổng số 20 lợn thí nghiệm
được phân về tổ hợp (cơng thức thí nghiệm) một cách ngẫu nhiên Số liệu thu
ñược kết thúc thí nghiệm được trình bày như sau:
A 0 mg 4 mg
(21)Mơ hình phân tích
yi j k = µ + αi + βj + (αβ)i j + ei j k
yi j k = quan sát thứ k ở mức i của nhân tố A mức j của nhân tố B µ = là trung bình chung
αi = ảnh hưởng mức i của nhân tố A, βj = ảnh hưởng mức j của nhân tố B,
(ab)i j = tương tác giữa mức i của nhân tố A mức j của nhân tố B
ei j k = sai số ngẫu nhiên, giả sử sai số ei j kñộc lập, phân phối chuẩn N(0,σ2) SAS CODE
DATA SAS8;
INPUT VITA VITB TT;
CARDS; 0 0.585 0 0.536 0 0.458 0 0.486 0 0.536 0 0.567 0 0.545 0 0.589 0 0.536 0 0.549 4 0.473 4 0.450 4 0.869 4 0.473 4 0.464 4 0.684 4 0.702 4 0.900 4 0.698 4 0.693 ;
TITLE 'HAI NHAN TO CHEO NHAU';
TITLE2 'HO VA TEN';
PROC ANOVA;
CLASS VITA VITB;
MODEL TT = VITA VITB VITA*VITB;
MEANS VITA VITB / DUNCAN;
RUN;
Kết quả từ SAS
HAI NHAN TO CHEO NHAU 10:29 Monday, June 26, 2000 24 HO VA TEN
(22)The ANOVA Procedure Dependent Variable: TT
Sum of
Source DF Squares Mean Square F Value Pr > F Model 0.14521095 0.04840365 4.39 0.0196 Error 16 0.17648360 0.01103023
Corrected Total 19 0.32169455
R-Square Coeff Var Root MSE TT Mean 0.451394 17.81139 0.105025 0.589650
Source DF Anova SS Mean Square F Value Pr > F VITA 0.05191805 0.05191805 4.71 0.0454 VITB 0.06418445 0.06418445 5.82 0.0282 VITA*VITB 0.02910845 0.02910845 2.64 0.1238 The ANOVA Procedure
Duncan's Multiple Range Test for TT
NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate Alpha 0.05
Error Degrees of Freedom 16 Error Mean Square 0.01103 Number of Means Critical Range .09957
Means with the same letter are not significantly different Duncan Grouping Mean N VITA
A 0.64060 10 B 0.53870 10 The ANOVA Procedure
Duncan's Multiple Range Test for TT
NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate Alpha 0.05
Error Degrees of Freedom 16 Error Mean Square 0.01103 Number of Means Critical Range .09957
Means with the same letter are not significantly different Duncan Grouping Mean N VITB
A 0.64630 10 B 0.53300 10
(23)3.5.5. Thí nghiệm hai nhân tố phân cấp
Với mơ hình phân cấp, nhân tố cấp (A) cốñịnh cấp dưới (B) ngẫu nhiên Như vậy B sẽ làm ổ (nested) A
Ví dụ 9: Mục đích của thí nghiệm xác ñịnh ảnh hưởng của lợn ñực giống lợn nái ñến khối lượng sơ sinh của thế hệ Mơ hình phân cấp yếu tốđược sử dụng Bốn lợn ñực giống ñược chọn ngẫu nhiên (a = 4), mỗi ñực phối với lợn nái (b = 3) mỗi nái sinh ñược 2 lợn (r = 2) Khối lượng (kg) sơ sinh của từng lợn thu ñược như sau:
Mơ hình phân tích
yijk = µ + ai + bj (i) + eijk
yijk = quan sát thứ k của mức j của yếu tố B mức i của yếu A; µ = trung bình chung;
ai = ảnh hưởng mức thứ i của nhân tố A;
bj (i) = ảnh hưởng mức j của yếu tố B mức i của yếu tố A;
ei jk = sai số ngẫu nhiên; giả sử ei jkñộc lập phân phối chuẩn N(0,σ2) SAS CODE
OPTIONS PAGESIZE = 60 LINESIZE = 80;
DATA SAS9;
INPUT D N KL;
CARDS; 1 1.2 1 1.2 1 1.1 2 1.2 2 1.1 2 1.2 3 1.2 3 1.3 3 1.2 4 10 1.3 4 11 1.4 4 12 1.3 1 1.2 1 1.3 1 1.2 2 1.2 2 1.2 2 1.1 3 1.2 3 1.3 3 1.2 4 10 1.3
ðực 1 2 3 4
Nái 1 2 3 4 5 6 7 8 9 10 11 12
(24)TITLE 'HAI NHAN PHAN CAP NESTED';
TITLE2 'HO VA TEN';
PROC SORT;
BY D N;
RUN;
PROC NESTED;
CLASS D N;
VAR KL;
RUN;
PROC MIXED DATA = SAS9;
CLASS D N;
MODEL KL = D;
RANDOM N(D) ;
RUN;
Sử dụng PROC NESTED nếu cả yếu tốñều ngẫu nhiên yếu tốñứng sau câu lệnh CLASS ñược mạc ñịnh Nested (làm tổ) yếu tốñứng trước Nếu mơ hình có cả
yếu tố ngẫu nhiên cốñịnh, PROC MIXED một giải pháp phù hợp Kết quả từ SAS:
The NESTED Procedure Coefficients of Expected Mean Squares
Source D N Error D N Error
Nested Random Effects Analysis of Variance for Variable KL Variance Sum of Error Source DF Squares F Value Pr > F Term Total 23 0.153333
D 0.093333 6.22 0.0174 N N 0.040000 3.00 0.0424 Error Error 12 0.020000
Nested Random Effects Analysis of Variance for Variable KL
(25)3.5.6. Thí nghiệm nhân tố phân lơ
Ví dụ 10A: Một thí nghiệm được tiến hành để nghiên cứu ảnh hưởng của bãi chăn thả A (1, 2,3 4) lượng khống bổ sung B (1 2) đến năng suất sữa Có tất cả 24 bị tham gia thí nghiệm Thí nghiệm được thiết kế theo mơ hình hai nhân tố kiểu chia với yếu tố A được bố
trí lớn yếu tố B ô nhỏ khối Năng suất sữa trung bình được ghi lại như sau (kg /ngày):
Khối Khối Khối
A4 A1 A2 A3 A2 A1 A4 A3 A1 A2 A4 A3
B2 30 B2 27 B1 26 B2 26 B1 32 B2 30 B1 34 B1 33 B2 34 B1 30 B2 36 B1 33 B1 29 B1 25 B2 28 B1 24 B2 37 B1 31 B2 37 B2 32 B1 31 B2 31 B1 38 B2 32
Mô hình phân tích
yijl = µ + ai + k l + (ak)il + bj + (ab)ij + eijl
Trong đó:
µ = trung bình chung
ai = ảnh hưởng của mức i của nhân tố A (trên ô lớn);
bj = ảnh hưởng của mức j của nhân tố B (trên ô nhỏ);
kl = ảnh hưởng của khối l;
(ak)il = tương tác giữa nhân tố A khối được dùng làm sai số lớn se2L
(ab)ij = tương tác của hai nhân tố A B
ei jk = sai số ngẫu nhiên
Lưu ý: Trong mơ hình khối coi như nhân tố ngẫu nhiên, không tương tác với B Hai nhân tố A B coi như nhân tố cốñịnh
SAS CODE: DATA ANCOVA;
INPUT KHOI A B SLS;
(26)3 2 31 3 36 3 38 3 33 3 32 ;
PROC MIXED;
CLASS KHOI A B;
MODEL SLS = A B A*B;
RANDOM KHOI KHOI*A;
LSMEANS A B/ PDIFF;
RUN;
PROC GLM;
CLASS KHOI A B;
MODEL SLS = KHOI A KHOI*A B A*B;
RANDOM KHOI KHOI*A;
LSMEANS A B / PDIFF;
RUN;
Kết quả từ SAS:
The Mixed Procedure Model Information Data Set WORK.SAS10 Dependent Variable SLS
Covariance Structure Variance Components Estimation Method REML
Residual Variance Method Profile Fixed Effects SE Method Model-Based Degrees of Freedom Method Containment Class Level Information Class Levels Values
KHOI 3 A 4 B 2 Dimensions
Covariance Parameters
Columns in X 15
Columns in Z 15
Subjects
Max Obs Per Subject 24
Observations Used 24
Observations Not Used
Total Observations 24 Iteration History
Iteration Evaluations -2 Res Log Like Criterion 98.59796343
(27)Covariance Parameter Estimates Cov Parm Estimate KHOI 12.7431 KHOI*A 1.0486 Residual 2.2500 The Mixed Procedure Fit Statistics
-2 Res Log Likelihood 78.8 AIC (smaller is better) 84.8 AICC (smaller is better) 86.8 BIC (smaller is better) 82.1 Type Tests of Fixed Effects Num Den
Effect DF DF F Value Pr > F A 5.46 0.0377 B 3.63 0.0932 A*B 0.86 0.4981 Least Squares Means
Standard
Effect A B Estimate Error DF t Value Pr > |t| A 29.6667 2.2298 13.30 <.0001 A 30.6667 2.2298 13.75 <.0001 A 30.0000 2.2298 13.45 <.0001 A 34.0000 2.2298 15.25 <.0001 B 30.5000 2.1266 14.34 <.0001 B 31.6667 2.1266 14.89 <.0001 Differences of Least Squares Means
Standard
Effect A B _A _B Estimate Error DF t Value Pr > |t| A -1.0000 1.2038 -0.83 0.4379 A -0.3333 1.2038 -0.28 0.7911 A -4.3333 1.2038 -3.60 0.0114 A 0.6667 1.2038 0.55 0.5997 A -3.3333 1.2038 -2.77 0.0325 A -4.0000 1.2038 -3.32 0.0159 B -1.1667 0.6124 -1.91 0.0932
(28)Ví dụ 10B: Xem xét ví dụ 10A, giả sử rằng thí nghiệm được thực hiện khơng có khối chỉ
có yếu tố A B được thiết kê 12 lớn Năng suất sữa trung bình được ghi lại như sau (kg /ngày):
1 2 3 4 5 6 7 8 9 10 11 12
A4 A1 A2 A3 A2 A1 A4 A3 A1 A2 A4 A3 B2 30 B2 27 B1 26 B2 26 B1 32 B2 30 B1 34 B1 33 B2 34 B1 30 B2 36 B1 33 B1 29 B1 25 B2 28 B1 24 B2 37 B1 31 B2 37 B2 32 B1 31 B2 31 B1 38 B2 32 Chọn OK để có kết quả yijkl = µ + ai + o(a)ik + bj + (ab)ij + eijkl ; Trong đó: µ = trung bình chung ai = ảnh hưởng của mức i của nhân tố A (trên ô lớn); bj = ảnh hưởng của mức j của nhân tố B (trên ô nhỏ); o(a)ik = sai số của ô lớn; (ab)ij = tương tác của hai nhân tố A B ei jkl = sai số ngẫu nhiên SAS CODE: The SAS System 09:09 Tuesday, June 27, 2000 49 The Mixed Procedure Model Information Data Set WORK.SAS10A Dependent Variable SLS Covariance Structure Variance Components Estimation Method REML Residual Variance Method Profile Fixed Effects SE Method Model-Based Degrees of Freedom Method Containment Class Level Information Class Levels Values O 12 10 11 12 A 4 B 2 Dimensions Covariance Parameters
Columns in X 15
Columns in Z 12
Subjects
Max Obs Per Subject 24
Observations Used 24
Observations Not Used
(29)Iteration History
Iteration Evaluations -2 Res Log Like Criterion 98.59796343
87.84738379 0.00000000 Convergence criteria met
Covariance Parameter Estimates Cov Parm Estimate O(A) 13.7917 Residual 2.2500
The SAS System 09:09 Tuesday, June 27, 2000 50 The Mixed Procedure
Fit Statistics
-2 Res Log Likelihood 87.8 AIC (smaller is better) 91.8 AICC (smaller is better) 92.8 BIC (smaller is better) 92.8 Type Tests of Fixed Effects Num Den
Effect DF DF F Value Pr > F A 0.80 0.5302 B 3.63 0.0932 A*B 0.86 0.4981
Trong ví dụ này, yếu tố (O) được coi ngẫu nhiên Ô nested yếu tố A Sai số lớn chính O(A) Chính vậy mà giá trị F của yếu tố A ñược tính 23,722/ 29,833 = 0,80 Ba giá trị xác suất quan tâm ñến bao gồm 0,5302; 0,0932 0,4981 tương ứng với yếu tố A, B tương tác A*B Với cách thiết kế thí nghiệm theo mơ hình thứ (10B) ta đã khơng tìm thấy
ảnh hưởng của bất kỳ một yếu tố (P > 0,05)
3.5.7. Phép ño lặp lại
(30)Khi tiến hành phép đo một đơn vị thí nghiệm, có thể tồn tại mối tương quan giữa lần ño một cá thể Ví dụ sản lượng sữa bò của một cá thể cao ở tháng thứ thì xu hướng ở tháng thứ cũng sẽ cao mặc dù đó cơng thức thí nghiệm
Ví dụ 11: Tiến hành đo pH cơ thăn 13 bò vàng, 14 bò LaiSind tại thời ñiểm 1, 12, 36, 48 giờ, ngày Số liệu thu ñược như sau:
STT THOIDIEM SOTAI GIONG pH STT THOIDIEM SOTAI GIONG pH
1 01H 1 BV 6.72 26 01H 32 LS 6.71
2 01H 2 BV 6.42 27 01H 33 LS 6.81
3 01H 3 BV 6.51 28 01H 34 LS 6.62
4 01H 4 BV 6.92 29 01H 38 LS 6.81
5 01H 5 BV 6.63 30 01H 39 LS 6.82
6 12H 1 BV 5.39 31 12H 32 LS 5.99
7 12H 2 BV 6.25 32 12H 33 LS 5.98
8 12H 3 BV 5.88 33 12H 34 LS 5.9
9 12H 4 BV 6.92 34 12H 38 LS 5.57
10 12H 5 BV 5.93 35 12H 39 LS 5.54
11 36H 1 BV 5.39 36 36H 32 LS 5.47
12 36H 2 BV 5.47 37 36H 33 LS 5.68
13 36H 3 BV 5.47 38 36H 34 LS 5.46
14 36H 4 BV 5.42 39 36H 38 LS 5.55
15 36H 5 BV 5.43 40 36H 39 LS 5.62
16 48H 1 BV 5.42 41 48H 32 LS 5.45
17 48H 2 BV 5.48 42 48H 33 LS 5.74
18 48H 3 BV 5.48 43 48H 34 LS 5.52
19 48H 4 BV 5.37 44 48H 38 LS 5.56
20 48H 5 BV 5.44 45 48H 39 LS 5.48
21 8D 1 BV 5.43 46 8D 32 LS 5.42
22 8D 2 BV 5.49 47 8D 33 LS 5.77
23 8D 3 BV 5.47 48 8D 34 LS 5.49
24 8D 4 BV 5.4 49 8D 38 LS 5.13
25 8D 5 BV 5.43 50 8D 39 LS 5.55
Xác ñịnh mức ñộảnh hưởng của yếu tốñến chỉ tiêu chất lượng thịt theo mơ hình thống kê sau: yijk = µ + αi+ δj(αi) + τk+ (α∗τ)ik + εijk
Trong đó, yijk: giá trị quan sát ở thời ñiểm bảo quản thứ k ñối với ñộng vật thứ j của giống i,
(31)αi : ảnh hưởng cốñịnh của giống thứ i,
δj(αi): ảnh hưởng ngẫu nhiên của ñộng vật thứ j ở giống thứ i,
τk : ảnh hưởng của thời ñiểm sau giết thịt thứ k,
(α∗τ)ik: tương tác của giống thứ i với thời ñiểm sau giết thịt thứ k,
εij : sai số ngẫu nhiên ở thời ñiểm bảo quản thứ k ñối với ñộng vật thứ j ở giống thứ i SAS CODE:
PROC GLM;
CLASS GIONG SOTAI THOIDIEM;
MODEL pH = GIONG SOTAI(GIONG) THOIDIEM GIONG*THOIDIEM /SS4;
RANDOM SOTAI(GIONG)/TEST;
LSMEANS THOIDIEM/ STDERR PDIFF ADJUST = TUKEY;
RUN;
Kết quả từ SAS:
The GLM Procedure Class Level Information Class Levels Values GIONG BV LS
SOTAI 10 32 33 34 38 39 THOIDIEM 01H 12H 36H 48H 8D Number of observations 50 The GLM Procedure Dependent Variable: pH
Sum of
Source DF Squares Mean Square F Value Pr > F Model 17 12.05487200 0.70911012 15.55 <.0001 Error 32 1.45972800 0.04561650
Corrected Total 49 13.51460000
R-Square Coeff Var Root MSE pH Mean 0.891989 3.672287 0.213580 5.816000
(32)The GLM Procedure Source Type IV Expected Mean Square
GIONG Var(Error) + Var(SOTAI(GIONG)) + Q(GIONG,GIONG*THOIDIEM) SOTAI(GIONG) Var(Error) + Var(SOTAI(GIONG))
THOIDIEM Var(Error) + Q(THOIDIEM,GIONG*THOIDIEM) GIONG*THOIDIEM Var(Error) + Q(GIONG*THOIDIEM)
The GLM Procedure
Tests of Hypotheses for Mixed Model Analysis of Variance Dependent Variable: pH
Source DF Type IV SS Mean Square F Value Pr > F * GIONG 0.004608 0.004608 0.07 0.7957 Error 0.514152 0.064269
Error: MS(SOTAI(GIONG))
* This test assumes one or more other fixed effects are zero
Source DF Type IV SS Mean Square F Value Pr > F SOTAI(GIONG) 0.514152 0.064269 1.41 0.2306 * THOIDIEM 11.245700 2.811425 61.63 <.0001 GIONG*THOIDIEM 0.290412 0.072603 1.59 0.2005 Error: MS(Error) 32 1.459728 0.045616
* This test assumes one or more other fixed effects are zero Least Squares Means
Adjustment for Multiple Comparisons: Tukey
Standard LSMEAN THOIDIEM pH LSMEAN Error Pr > |t| Number
01H 6.69700000 0.06753999 <.0001
12H 5.93500000 0.06753999 <.0001
36H 5.49600000 0.06753999 <.0001
48H 5.49400000 0.06753999 <.0001
8D 5.45800000 0.06753999 <.0001
(33)3.5.8. Phân tích hiệp phương sai
Trong phân tích hiệp phương sai (ANCOVA), biến phụ thuộc được giải thích bằng biến độc lập thứ hạng biến ñộc lập liên tục Hiệp phương sai ñược sử dụng ñể hiệu chỉnh sự biến
động bằng có thể biến độc lập liên tục tạo nên
Ví dụ: Tiến hành ni vỗ béo lợn ở công thức thức ăn (A, B C) 90 ngày Khối lượng (kg) của từng động vật thí nghiệm tại thời điểm bắt đầu kết thúc ni vỗ béo được trình bày ở bảng sau:
KP A A A A A B B B B B C C C C C
P0 35 40 36 35 34 39 34 41 43 39 40 32 33 39 42 P1 122 130 124 123 121 128 120 129 132 127 129 116 117 129 132 TT 967 1000 978 978 967 989 956 978 989 978 989 933 933 1000 1000 Ta có thể phân tích số liệu như mơ hình thiết kế thí nghiệm một yếu tố hồn tồn ngẫu nhiên như ñã nêu ở mục 3.5.1 với biến phụ thuộc tăng trọng một biến ñộc lập (yếu tố thí nghiệm) cơng thức thức ăn
SAS CODE: DATA ANCOVA;
INPUT KP $ P0 P1 TT;
CARDS;
A 35 122 967 A 40 130 1000 A 36 124 978 A 35 123 978 A 34 121 967 B 39 128 989 B 34 120 956 B 41 129 978 B 43 132 989 B 39 127 978 C 40 129 989 C 32 116 933 C 33 117 933 C 39 129 1000 C 42 132 1000
;
PROC GLM;
(34)Kết quả từ SAS:
The GLM Procedure Class Level Information Class Levels Values KP A B C Number of observations 15 The GLM Procedure Dependent Variable: TT
Sum of
Source DF Squares Mean Square F Value Pr > F Model 163.333333 81.666667 0.15 0.8586 Error 12 6346.000000 528.833333
Corrected Total 14 6509.333333
R-Square Coeff Var Root MSE TT Mean 0.025092 2.356991 22.99638 975.6667
Source DF Type I SS Mean Square F Value Pr > F KP 163.3333333 81.6666667 0.15 0.8586 Source DF Type III SS Mean Square F Value Pr > F KP 163.3333333 81.6666667 0.15 0.8586 Nếu phân tích số liệu theo mơ hình ta có thểđã bỏ qua một thơng tin quan trọng đó là, những cá thể có khối lượng ban đầu lớn hơn cho tăng trọng trung bình sẽ cao hơn ðể khắc phục hạn chế ta sẽ sử dụng phép phân tích hiệp phương sai
Mơ hình phân tích
yi j = µ + αi + βxi j + ei j
yi j = quan sát thứ j ở công thức i µ = là trung bình chung
αi = ảnh hưởng ở mức i của yếu tố cốđịnh thí nghiệm, βxi j = ảnh hưởng của biến ñộc lập liên tục,
ei j = sai số ngẫu nhiên, giả sử sai số ei j kñộc lập, phân phối chuẩn N(0,σ2) SAS CODE:
PROC GLM;
CLASS KP;
MODEL TT = P0 KP;
(35)Kết quả từ SAS:
The GLM Procedure Class Level Information Class Levels Values KP A B C Number of observations 15
The GLM Procedure Dependent Variable: TT
Sum of
Source DF Squares Mean Square F Value Pr > F Model 5409.734432 1803.244811 18.04 0.0001 Error 11 1099.598901 99.963536
Corrected Total 14 6509.333333
R-Square Coeff Var Root MSE TT Mean 0.831073 1.024753 9.998177 975.6667
Source DF Type I SS Mean Square F Value Pr > F P0 4543.542961 4543.542961 45.45 <.0001 KP 866.191472 433.095736 4.33 0.0410 Source DF Type III SS Mean Square F Value Pr > F P0 5246.401099 5246.401099 52.48 <.0001 KP 866.191472 433.095736 4.33 0.0410 Việc áp dụng ANCOVA đã cho ta kết quả hồn tồn khác với phân tích ANOVA một yếu tố
hồn tồn ngẫu nhiên
Trong bảng phân tích phương sai ta thấy, khối lượng ban ñầu ảnh hưởng một cách rõ rệt
(36)3.5.9. Bảng tương liên
Khi so sánh tỷ lệ hoặc nghiên cứu mối liên hệ giữa yếu tố ñối với biến định tính ta ln đặt giả thiết H0: Khơng có sự sai khác có ý nghĩa thống kê giữa tỷ lệ hoặc Khơng có
mối liên hệ giữa yếu tố (tuỳ theo mục tiêu của tốn đặt ra)
Ví dụ 11: Một thí nghiệm được tiến hành nhằm đánh giá sự liên hệ giữa tỷ lệ viêm nội mạc tử cung giống Trong tổng số
700 bò sữa nghiên cứu thuần tập (cohort studies), có 500 giống Holstein Friesian 200 giống Jersey Kết quả
nghiên cứu thu ñược như sau:
Giống Viêm nội mạc tử cung Tổng số
Có Khơng
Holstein 100 400 500
Jersey 10 190 200
Tổng số 110 590 700
SAS CODE: DATA SAS11;
INPUT GIONG $ BENH $ SOLUONG;
CARDS; H C 100 H K 400 J C 10 J K 190 ;
PROC FREQ;
WEIGHT SOLUONG;
TABLE GIONG*BENH / CHISQ;
RUN;
Kết quả từ SAS:
The FREQ Procedure Table of GIONG by BENH GIONG BENH
Frequency‚ Percent ‚ Row Pct ‚
(37)Statistics for Table of GIONG by BENH
Statistic DF Value Prob ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ Chi-Square 24.2681 <.0001 Likelihood Ratio Chi-Square 29.0537 <.0001 Continuity Adj Chi-Square 23.1488 <.0001 Mantel-Haenszel Chi-Square 24.2334 <.0001 Phi Coefficient 0.1862
Contingency Coefficient 0.1830 Cramer's V 0.1862 Fisher's Exact Test
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ Cell (1,1) Frequency (F) 100 Left-sided Pr <= F 1.0000 Right-sided Pr >= F 8.496E-08 Table Probability (P) 6.784E-08 Two-sided Pr <= P 1.371E-07 Sample Size = 700
Trong phần kết quảđối với từng ta có giá trị Ví dụđối với thứ nhất lần lượt là: 1) Tần suất quan sát (400), 2) Phần trăm theo hàng (80%) 3) tần suất ước tính (421,4)
Giá trị Chi-Square χ² = 24,268, bậc tự DF = xác suất P < 0,0001 Với xác suất giả
thiết H0 bị bác bỏ kết luận Có mối liên hệ giữa bệnh viêm nội mạc tử giống bò (P<
0,001)
Lưu ý: ðối với trường hợp mẫu bé (Ei < 5), có thể thay thế phép thử c² bằng phép thử Fisher Exact Test:
PROC FREQ;
WEIGHT SOLUONG;
TABLE GIONG*BENH / EXACT;