Chương 8. PHÂN TÍCH PHƯƠNG SAI
8.2. Phân tích phương sai hai nhân tố
8.2.1. Phân tích phương sai hai nhân tố không lặp lại
Trên thực tế một biến lượng chịu tác động không chỉ 1 nhân tố mà có thể 2 hoặc nhiều nhân tố. Chẳng hạn năng suất cây trồng chịu ảnh hưởng của nhân tố giống và nhân tố đất.
Giả sử chúng ta quan tâm tới 2 nhân tố A và B. Nhân tố A được xem xét ở các mứcA1, A2, ..., Am và nhân tố B được xem xét ở các mứcB1, B2, ..., Bn.
Đặt Xij là biến ngẫu nhiên đo lường hiệu quả của việc tác động của nhân tố A ở mức i và nhân tố B ở mức i lên cá thể, Xij là một kết quả thu được từ biến ngẫu nhiên Xij khi thực hiện thí nghiệm.
Ta có mô hình toán học cho phân tích phương sai hai nhân tố không lặp như sau.
Mô hình phân tích phương sai hai nhân tố không lặp:
Xij =à+αi+βj+ij i= 1,2, .., m;j = 1,2, ..., n.
Trong đóij là các biến ngẫu nhiên độc lập, có cùng phân phối chuẩn N(0;σ2). 1. Bài toán kiểm định giả thuyết 1
H0A : α1 =α2=...=αk = 0
(Các mức A1, ..., Am có hiệu quả như nhau) H1A :α21+α22+...+α2k 6= 0
(Có ít nhất 2 mức Ai và Aj có hiệu quả khác nhau) 2. Bài toán kiểm định giả thuyết 2
H0B : β1 =β2 =...=βk = 0
(Các mức B1, ...Bn có hiệu quả như nhau) H1B : β12+β22+...+βk26= 0
(có ít nhất hai mức Bi vàBj có hiệu quả khác nhau)
Từ giả thiết của mô hình ta có Xij là các biến ngẫu nhiên có phân phối chuẩn với E(Xij) = àij =à+αi+βj và V(Xij) =σ2.
Giả sử {Xij; 1 ≤ i ≤ m,1 ≤ j ≤ n} là mẫu ngẫu nhiên thu được khi thực hiện thí nghiệm. Khi đó ta lập được bảng sau:
A
B B1 B2 ... Bn Ti∗ =
n
P
j=1
Xij
A1 X11 X12 ... X1n T1∗
A2 X21 X22 ... X2n T2∗
... ... ... ... ... ...
Am Xm1 Xm2 ... Xmn Tm∗
T∗j =
m
P
i=1
Xij T∗1 T∗2 ... T∗n T =
m
P
i=1 n
P
j=1
Xij
m
P
i=1
Xij2
m
P
i=1
Xi12
m
P
i=1
Xi22 ...
m
P
i=1
Xin2 Q=
m
P
i=1 n
P
j=1
Xij2
- Trung bình mẫu
X = 1 mn
m
X
i=1 n
X
i=1
Xij
- Trung bình mức Ai
Xi∗= 1 n
X
j=1
Xij.
- Trung bình mức Bj
X∗j = 1 m
X
i=1
Xij. - Ước lượng giá trị Xij từ mô hình:
Xˆij =Xi∗+X∗j −X.
- Các sai số:
eij =Xij −xi∗−X∗j+X.
- Tổng bình phương chung:
SST =
m
X
i=1 n
X
j=1
(Xij −X)2=Q− T2 mn. - Tổng bình phương cho nhân tố A:
SSA= Pm
i=1Ti∗2 n − T2
mn. - Tổng bình phương cho nhân tố A:
SSB = Pn
j=1T∗j2 m − T2
mn. - Tổng bình phương do sai số:
SSE=SST −SSA−SSB - Trung bình bình phương nhân tố A
M SA= SSA m−1, m−1 được gọi là bậc tự do của A.
- Trung bình bình phương nhân tố B
M SB = SSB n−1, n−1 được gọi là bậc tự do của B.
- Trung bình bình phương sai số
M SE = SSE
(m−1)(n−1), (m−1)(n−1)được gọi là bậc tự do của sai số.
- Tỉ số F cho nhân tố A
FA = M SA M SE - Tỉ số F cho nhân tố B
FA = M SB M SE.
Các kết quả nói trên được trình bày trong bảng sau đây gọi là bảng ANOVA 2 nhân tố
Nguồn Bậc tự do SS MS Tỉ số F
Nhân tố A m−1 SSA M SA FA
Nhân tố B n−1 SSB M SB FB
Sai số (m−1)(n−1) SSE MSE
Tổng mn−1 SST
Ta có quy tắc kiểm định như sau
(i) H0A : Các mức A1, A2, ..., Am có hiệu quả như nhau H1A : Có ít nhất 2 mức Ai và Aj có hiệu quả khác nhau P-giá trị=P(Fm−1,(m−1)(n−1) ≥FA)
Miền bác bỏ H0A là W = [fm−1,(m−1)(n−1)(α); +∞). (ii) H0B : Các mức B1, B2, ..., Bn có hiệu quả như nhau H1B : Có ít nhất 2 mức Bi và Bj có hiệu quả khác nhau Miền bác bỏ H0B là W = [fn−1,(m−1)(n−1)(α); +∞). P-giá trị=P(Fn−1,(m−1)(n−1) ≥FB).
Trong đó, Fx,y là phân phối Fisher, fx,y(α) là giá trị tới hạn mức α của phân phối Fisher.
Ví dụ 8.3. Chiết suất chất X từ 1 loại dược liệu bằng 3 phương pháp và 5 loại dung môi, ta có kết quả:
Dung môi
PP chiết xuất
B1 B2 B3
A1 120 60 60
A2 120 70 50
A3 130 60 50
A4 150 70 60
A5 110 75 54
Với mức ý nghĩa α = 0,05 hãy xét tác dụng của phương pháp chiết suất và dung môi đến kết quả chiết suất chất X.
Giải.
Các giả thuyết thống kê:
H0A: Tác dụng của 5 dung môi bằng nhau H1A: Có ít nhất 2 dung môi có tác dụng khác nhau H0B: Tác dụng của 3 phương pháp chiết suất bằng nhau H1B: Có ít nhất 2 phương pháp chiết suất có tác dụng khác nhau.
Dung môi
PP chiết xuất
B1 B2 B3 Ti∗
A1 120 60 60 240
A2 120 70 50 240
A3 130 60 50 240
A4 150 70 60 280
A5 110 75 54 239
T∗j 630 335 274 T=1239
P
iXij2 80300 22625 15116 Q= 118041 Ta có bảng ANOVA sau
Nguồn Bậc tự do SS MS F
Nhân tố A 4 432,2667 108,0667 FA = 1,1249 Nhân tố B 2 14498,8 7249,4 FB = 75,4622
Sai số 8 768,5333 96,0667
Tổng 14 15699,6
Với mức ý nghĩa α= 0.05 , miền bác bỏ H0A là W = [3,838; +∞), miền bác bỏ H0B là W = [4,459; +∞). Vì vậy có thể kết luận: Dung môi không ảnh hưởng đến kết quả chiết suất và Phương pháp ảnh hưởng đến kết quả chiết suất.
Kiểm tra giả thiết của mô hình.
Để kiểm gia giả thiết của môn hình: sai số ngẫu nhiên có phân bố chuẩn N(0;σ2) ta vẽ biểu đồ xác suất chuẩn của phần dư. Ta có số liệu của phần dư như sau:
-3,4 -4,4 7,8
-3,4 5,6 -2,2
6,6 -4,4 -2,2
13,27 -7,73 -5,53 -13,07 10,93 2,13
Biểu đồ xác suất chuẩn (xem Hình 8.2) của phần dư nằm xấp xỉ trên đường thẳng đi qua gốc tọa độ nên giả thiết sai số ngẫu nhiên có phân bố chuẩn N(0;σ2) xem như được thỏa mãn.
Hình 8.2