Chương 8. PHÂN TÍCH PHƯƠNG SAI
8.2. Phân tích phương sai hai nhân tố
8.2.2. Phân tích phương sai hai nhân tố có lặp
Tương tự như bài toán phân tích phương sai 2 nhân tố không lặp, chỉ khác mỗi mức (Ai;Bj) đều có sự lặp lại r lần thí nghiệm và ta cần khảo sát thêm sự tương tác giữa 2 nhân tố A và B.
Gọi Xijk là biến ngẫu nhiên đo lường hiệu quả của việc tác động của mức Ai và Bj lên cá thể. Ta có mô hình toán học cho phân tích phương sai hai nhân tố có lặp như sau.
Mô hình phân tích phương sai hai nhân tố có lặp:
Xijk =à+αi+βj+γij +ijk i= 1,2, .., m;j = 1,2, ..., n; 1≤k≤r.
Trong đóijk là các biến ngẫu nhiên độc lập, có cùng phân phối chuẩn N(0;σ2). 1. Bài toán kiểm định giả thuyết 1
H0A :α1=α2 =...=αk = 0
(Các mức A1, ..., Am có hiệu quả trung bình như nhau) với đối thuyết
H1A :α21+α22+...+α2k 6= 0
(Có ít nhất 2 mức Ai và Aj có hiệu quả khác nhau)
2. Bài toán kiểm định giả thuyết 2
H0B :β1 =β2=...=βk = 0
(Các mức B1, ..., Bn có hiệu quả như nhau) với đối thuyết
H1B :β12+β22+...+βk2 6= 0
(Có ít nhất 2 mức Bi và Bj có hiệu quả khác nhau) 3. Bài toán kiểm định giả thuyết 3
H0AB :γij = 0 với mọi i, j
(không có sự tương tác giữa hai nhân tố A và B) với đối thuyết
H1AB : có ít nhất một γij 6= 0
( có sự tương tác giữa hai nhân tố A và B)
Giả sử {Xijk : 1 ≤ k ≤ r} là mẫu kích thước r của biến ngẫu nhiên Xij (được gọi là mẫu (i,j)). Ta đưa ra một số kí hiệu sau:
Tij =
r
X
k=1
Xijk; T∗j =
n
X
i=1
Tij; Ti∗ =
m
X
j=1
Tij;
T =
n
X
j=1
T∗j =
m
X
i=1
Ti∗; Q=
m
X
i=1 n
X
j=1 r
X
k=1
Xijk2 . -Trung bình mẫu (i, j):
Xij =
r
X
k=1
Xijk = Tij r . -Trung bình của mức Ai:
Xi∗ = Pn
j=1
Pr
k=1Xijk
rn = Ti∗
rn. -Trung bình của mức Bj:
Xi∗ = Pm
i=1
Pr
k=1Xijk
rm = T∗j
rm.
- Ước lượng giá trị Xij từ mô hình:
Xˆijk =Xij - Ước lượng sai số
ˆ
eijk =Xijk−Xij,1≤i≤m; 1≤j ≤n; 1≤k ≤r.
-Trung bình chung
X = Pm
i=1
Pn j=1
Pr
k=1Xijk
rmn = T
rmn. - Tổng bình phương chung:
SST =Q− T2 rmn. - Tổng bình phương cho nhân tố A:
SSA=
n
X
j=1
nj∗(Xj0−X)2 = 1 rn
m
X
i=1
Ti∗2 − T2 rmn. - Tổng bình phương cho nhân tố B:
SSB =
m
X
i=1
rm(X∗j −X)2 = 1 rm
n
X
j=1
T∗j2 − T2 rmn. - Tổng bình phương do sai số:
SSE =
r
X
k=1 m
X
i=1 n
X
j=1
(Xijk −Xij)2 =Q− 1 r
m
X
i=1 n
X
j=1
Tij2. - Tổng bình phương do tương tác:
SSI =
m
X
i=1 n
X
j=1 r
X
k=1
(Xij −Xj∗−X∗k+X)2=SST −SSA−SSB−SSE.
- Trung bình bình phương nhân tố A
M SA= SSA m−1, m−1 được gọi là bậc tự do của A.
- Trung bình bình phương nhân tố B
M SB = SSB n−1, n−1 được gọi là bậc tự do của B.
- Trung bình bình phương sai số
M SE= SSE rmn−mn,
rmn−mn được gọi là bậc tự do của sai số.
- Trung bình bình phương của tương tác
M SI = SSI (m−1)(n−1), (m−1)(n−1)được gọi là bậc tự do của tương tác.
- Tỉ số F cho nhân tố A
FA = M SA M SE. - Tỉ số F cho nhân tố B
FA = M SB M SE. - Tỉ số F cho tương tác A và B
FAB = M SI M SE.
Các kết quả nói trên được trình bày trong bảng sau đây gọi là bảng ANOVA 2 nhân tố
Nguồn Bậc tự do SS MS Tỉ số F
Nhân tố A m−1 SSA M SA FA
Nhân tố B n−1 SSB M SB FB
Tương tác (m−1)(n−1) SSI MSI FAB
Sai số rmn−mn SSE MSE
Tổng rmn−1 SST
Ta có quy tắc kiểm định như sau
(i)H0A : Các mức A1, A2, ..., Am có hiệu quả như nhau
H1A : Có ít nhất hai mức trong A1, A2, ..., Am có hiệu quả khác nhau p-giá trị=P(Fm−1,rmn−mn> FA)
Miền bác bỏH0 là W = [fm−1;rmn−mn;α; +∞).
(ii)H0B : Các mức B1, B2, ..., Bn có hiệu quả như nhau
H1B : Có ít nhất hai mức trong B1, B2, ..., Bn có hiệu quả khác nhau Miền bác bỏH0 là W = [fn−1;rmn−mn;α; +∞).
P-giá trị=P(Fn−1,rmn−mn > FB) (iii)H0AB : Có sự tương tác giữa A và B H1AB : Không có sự tương tác giữa A và B p-giá trị=P(F(m−1)(n−1),rmn−mn > FAB).
Miền bác bỏH0 là W = [f(m−1)(n−1);rmn−mn;α; +∞).
Trong đó, Fx,y là phân phối Fisher, fx;y;α là phân vị mức α của phân phối Fisher.
Ví dụ 8.4. Hàm lượng saponin (mg) của cùng một loại dược liệu được thu hái trong 2 mùa (khô và mưa: trong mỗi mùa lấy mẫu 3 lần (đầu mùa, giữa mùa, cuối mùa) và từ 3 miền (Nam, Trung, Bắc) thu được kết quả sau:
Mùa Thời điểm Miền
Nam Trung Bắc
Đầu mùa 2.4 2.1 3.2
Khô Giữa mùa 2.4 2.2 3.2
Cuối mùa 2.5 2.2 3.4
Đầu mùa 2.5 2.2 3.4
Mưa Giữa mùa 2.5 2.3 3.5
Cuối mùa 2.6 2.3 3.5
Với mức ý nghĩaα = 0.05hãy cho biết hàm lượng saponin có khác nhau theo mùa hay miền không? Nếu có thì 2 yếu tố mùa và miền có sự tương tác với nhau hay không?
Giải.
Ta có bảng các giá trị của Tij:
Mùa
Miền Nam Trung Bắc Ti∗
Khô 7,3 6,5 9,8 23,6
Mưa 7,6 6,8 9,8 10,4
T∗j 14,9 13,3 20,2 T = 48,4 Q= 134,64.
Suy ra bảng ANOVA 2 nhân tố sau:
Nguồn Bậc tự do SS MS F
Nhân tố Mùa 1 0,08 0,08 FA = 16
Nhân tố Miền 2 4,3478 2,1739 FB = 434,78
Tương tác 2 0,01 0,005 FAB = 1
Sai số 12 0,06 0,005
Tổng 17 155699,6
Miền bác bỏ H0A là W = [4.7472; +∞), miền bác bỏ H0B là W = [3.8853; +∞), miền bác bỏ H0AB là W = [3.8853; +∞). Vì vậy có thể kết luận: hàm lượng saponin trong dược liệu khác nhau theo mùa, theo miền và không có sự tương tác giữa mùa và miền trên hàm lượng saponin.
Kiểm tra giả thiết của mô hình.
Để kiểm gia giả thiết của môn hình: sai số ngẫu nhiên có phân bố chuẩn N(0;σ2) ta vẽ biểu đồ xác suất chuẩn của phần dư. Ta có số liệu của phần dư như sau:
-0,033 -0,067 -0,067 -0,033 0,033 -0,067 0,067 0,033 0,133 -0,033 -0,067 -0,067 -0,033 0,033 0,033
Biểu đồ xác suất chuẩn (xem Hình 8.3) của phần dư nằm xấp xỉ trên đường thẳng đi qua gốc tọa độ nên giả thiết sai số ngẫu nhiên có phân bố chuẩn N(0;σ2) xem như được thỏa mãn.
Hình 8.3