CHƯƠNG 3. PHÂN TÍCH PHƯƠNG SAI
3.2. Phân tích phương sai hai nhân tố
3.2.2. Phân tích phương sai hai nhân tố có lặp
Tương tự như bài toán phân tích phương sai 2 nhân tố không lặp, chỉ khác mỗi mức (A Bi; j) đều có sự lặp lại r lần thí nghiệm và ta cần khảo sát thêm sự tương tác giữa 2 nhân tốA và B.
Gọi Xijk là biến ngẫu nhiên đo lường hiệu quả của việc tác động của mức Ai
và Bj lên cá thể.
Ta có mô hình toán học cho phân tích phương sai hai nhân tố có lặp như sau:
Mô hình phân tích phương sai hai nhân tố có lặp:
1, 2,.., ; 1, 2,..., ;1 .
ijk i j ij ijk
X i m j n k r
Trong đó ijk là các biến ngẫu nhiên độc lập, có cùng phân phối chuẩn
(0; 2) N .
1. Bài toán kiểm định giả thuyết 1:
{
2. Bài toán kiểm định giả thuyết 2:
{
3. Bài toán kiểm định giả thuyết 3:
{
Giả sử {Xijk:1 k r} là mẫu kích thước r của biến ngẫu nhiên Xij (được gọi là mẫu (i,j)). Ta đưa ra một số kí hiệu sau:
* *
1 1 1
, ; ,
r n m
ij ijk j ij i ij
k i j
T X T T T T
2
* *
1 1 1 1 1
, .
n j m i m n r ijk
j i i j k
T T T Q X
- Trung bình mẫu (i,j):
1
.
r ij
ij ijk
k
X X T r
- Trung bình của mứcAi:
1 1 *
* n r ijk .
j k i
i
X T
X rn rn
- Trung bình của mức Bj:
1 1 *
* m r ijk .
i k j i
X T
X rm rm
- Ước lượng giá trị Xij từ mô hình:
ˆijk ij.
X X
- Phần dư:
,1 ;1 ;1 .
ijk ijk ij
e X X i m j n k r
- Trung bình chung:
1 1 1
.
m n r ijk
i j k
X T
X rmn rmn
- Tổng bình phương chung:
2
T . SST Q
rmn
- Tổng bình phương cho nhân tố A:
2
2 2
* 0 *
1 1
( ) 1 .
n j j m i
j i
SSA n X X T T
rn rmn
- Tổng bình phương cho nhân tố B:
2
2 2
* *
1 1
( ) 1 .
m j n j
i j
SSB rm X X T T
rm rmn
- Tổng bình phương do sai số:
2 2
1 1 1 1 1
( ) 1 .
r m n ijk ij m n ij
k i j i j
SSE X X Q T
r
- Tổng bình phương do tương tác:
2
* *
1 1 1
( ) .
m n r
ij j k
i j k
SSI X X X X SST SSA SSB SSE
- Trung bình bình phương nhân tố A:
1.
MSA SSA
m 1
m được gọi là bậc tự do của A. - Trung bình bình phương nhân tố B:
1.
MSB SSB
n 1
n được gọi là bậc tự do của B. - Trung bình bình phương sai số:
.
MSE SSE
rmn mn rmn mn được gọi là bậc tự do của sai số.
- Trung bình bình phương của tương tác:
( 1)( 1).
MSI SSI
m n
(m1)(n1) được gọi là bậc tự do của tương tác.
- Tỉ số F cho nhân tố A:
.
A
F MSA MSE
- Tỉ số F cho nhân tố B:
.
A
F MSB MSE
- Tỉ số F cho tương tác A và B:
.
AB
F MSI MSE
Các kết quả nói trên được trình bày trong bảng sau đây gọi là bảng ANOVA 2 nhân tố:
Nguồn Bậc tự do SS MS Tỉ số F
Nhân tố A m – 1 SSA MSA
Nhân tố B n – 1 SSB MSB
Tương tác (m – 1)( n – 1) SSI MSI Sai số rmn – mn SSE MSE
Tổng rmn – 1 SST
1. Bài toán kiểm định giả thuyết 1:
{ Miền bác bỏ H0A là W [fm1,rmn mn ( ); ).
1,
p-giá trị P F( m rmn mn FA).
2. Bài toán kiểm định giả thuyết 2:
{ Miền bác bỏ H0B là W [fn1,rmn mn ( ); ).
1,
p-giá trị P F( n rmn mn FB).
3. Bài toán kiểm định giả thuyết 3:
{
Miền bác bỏ H0AB là W [f(m1)(n1),rmn mn ( ); ).
( 1)( 1), p-giá trị P F( m n rmn mn FAB).
Trong đó, Fx y, là phân bố F, fx y, ( ) là giá trị tới hạn mức của phân bố F. Ví dụ 3.3. Hàm lượng saponin (mg) của cùng một loại dược liệu được thu hái trong 2 mùa (khô và mưa: trong mỗi mùa lấy mẫu 3 lần (đầu mùa, giữa mùa, cuối mùa) và từ 3 miền (Nam, Trung, Bắc), thu được kết quả sau:
Mùa Thời điểm Miền
Nam Trung Bắc Khô
Đầu mùa 2,4 2,1 3,2 Giữa mùa 2,4 2,2 3,2 Cuối mùa 2,5 2,2 3,4 Mưa Đầu mùa 2,5 2,2 3,4 Giữa mùa 2,5 2,3 3,5 Cuối mùa 2,6 2,3 3,5
Với mức ý nghĩa 0, 05 hãy cho biết hàm lượng saponin có khác nhau theo mùa hay miền không? Nếu có thì 2 yếu tố mùa và miền có sự tương tác với nhau hay không?
Giải.Ta có bảng các giá trị của Tij:
= 7,3 = 6,5 = 9,8 = 23,6
= 7,6 = 6,8 = 9,8 = 10,4
= 14,9 = 13,3 = 20,2 T = 48,4 Q = 134,64
Suy ra bảng ANOVA hai nhân tố
Nguồn Bậc tự do SS MS F
Nhân tố mùa 1 0,08 0,08 = 16
Nhân tố miền 2 4,3478 2,1739 = 434,78
Tương tác 2 0,01 0,05 = 1
Sai số 12 0,06 0,05
Tổng 17 155699,6
Miền bác bỏ H0A là W [4.7472;). Miền bác bỏ H0B là W [3.8853;). Miền bác bỏ H0AB là W[3.8853;).
Vì vậy, có thể kết luận: Hàm lượng saponin trong dược liệu khác nhau theo mùa, theo miền và không có sự tương tác giữa mùa và miền trên hàm lượng saponin.
Giải bằng Minitab
Nhập mẫu số liệu vào cột C1, nhân tố miền vào cột C2 và nhân tố mùa vào cột C3
Stat ANOVA General Linear Model Fit General Linear Model Responses : nhập cột data
Factors : nhập cột mùa và miền Vào Option
Confidence level: nhập 95 Result : chọn Analysic variance Kết thúc chọn OK
Kết quả thu được
Analysis of Variance
Source DF Adj SS Adj MS F-Value P-Value Miền 2 4.34778 2.17389 434.78 0.000 Mùa 1 0.08000 0.08000 16.00 0.001 Error 14 0.07000 0.00500 Lack-of-Fit 2 0.01000 0.00500 1.00 0.397 Pure Error 12 0.06000 0.00500
Total 17 4.49778
Từ bảng kết quả, có thể thấy Hàm lượng saponin trong dược liệu khác nhau theo mùa, theo miền và không có sự tương tác giữa mùa và miền trên hàm lượng saponin.