Phân tích phương sai hai nhân tố có lặp

Một phần của tài liệu Giáo trình xác suất thống kê (Trang 152 - 158)

Chương 8. PHÂN TÍCH PHƯƠNG SAI

8.2. Phân tích phương sai hai nhân tố

8.2.2. Phân tích phương sai hai nhân tố có lặp

Tương tự như bài toán phân tích phương sai 2 nhân tố không lặp, chỉ khác mỗi mức (Ai;Bj) đều có sự lặp lại r lần thí nghiệm và ta cần khảo sát thêm sự tương tác giữa 2 nhân tố A và B.

Gọi Xijk là biến ngẫu nhiên đo lường hiệu quả của việc tác động của mức Ai và Bj lên cá thể. Ta có mô hình toán học cho phân tích phương sai hai nhân tố có lặp như sau.

Mô hình phân tích phương sai hai nhân tố có lặp:

Xijk =à+αi+βj+γij +ijk i= 1,2, .., m;j = 1,2, ..., n; 1≤k≤r.

Trong đóijk là các biến ngẫu nhiên độc lập, có cùng phân phối chuẩn N(0;σ2). 1. Bài toán kiểm định giả thuyết 1

H0A :α1=α2 =...=αk = 0

(Các mức A1, ..., Am có hiệu quả trung bình như nhau) với đối thuyết

H1A :α21+α22+...+α2k 6= 0

(Có ít nhất 2 mức Ai và Aj có hiệu quả khác nhau)

2. Bài toán kiểm định giả thuyết 2

H0B :β1 =β2=...=βk = 0

(Các mức B1, ..., Bn có hiệu quả như nhau) với đối thuyết

H1B :β12+β22+...+βk2 6= 0

(Có ít nhất 2 mức Bi và Bj có hiệu quả khác nhau) 3. Bài toán kiểm định giả thuyết 3

H0AB :γij = 0 với mọi i, j

(không có sự tương tác giữa hai nhân tố A và B) với đối thuyết

H1AB : có ít nhất một γij 6= 0

( có sự tương tác giữa hai nhân tố A và B)

Giả sử {Xijk : 1 ≤ k ≤ r} là mẫu kích thước r của biến ngẫu nhiên Xij (được gọi là mẫu (i,j)). Ta đưa ra một số kí hiệu sau:

Tij =

r

X

k=1

Xijk; T∗j =

n

X

i=1

Tij; Ti∗ =

m

X

j=1

Tij;

T =

n

X

j=1

T∗j =

m

X

i=1

Ti∗; Q=

m

X

i=1 n

X

j=1 r

X

k=1

Xijk2 . -Trung bình mẫu (i, j):

Xij =

r

X

k=1

Xijk = Tij r . -Trung bình của mức Ai:

Xi∗ = Pn

j=1

Pr

k=1Xijk

rn = Ti∗

rn. -Trung bình của mức Bj:

Xi∗ = Pm

i=1

Pr

k=1Xijk

rm = T∗j

rm.

- Ước lượng giá trị Xij từ mô hình:

Xˆijk =Xij - Ước lượng sai số

ˆ

eijk =Xijk−Xij,1≤i≤m; 1≤j ≤n; 1≤k ≤r.

-Trung bình chung

X = Pm

i=1

Pn j=1

Pr

k=1Xijk

rmn = T

rmn. - Tổng bình phương chung:

SST =Q− T2 rmn. - Tổng bình phương cho nhân tố A:

SSA=

n

X

j=1

nj∗(Xj0−X)2 = 1 rn

m

X

i=1

Ti∗2 − T2 rmn. - Tổng bình phương cho nhân tố B:

SSB =

m

X

i=1

rm(X∗j −X)2 = 1 rm

n

X

j=1

T∗j2 − T2 rmn. - Tổng bình phương do sai số:

SSE =

r

X

k=1 m

X

i=1 n

X

j=1

(Xijk −Xij)2 =Q− 1 r

m

X

i=1 n

X

j=1

Tij2. - Tổng bình phương do tương tác:

SSI =

m

X

i=1 n

X

j=1 r

X

k=1

(Xij −Xj∗−X∗k+X)2=SST −SSA−SSB−SSE.

- Trung bình bình phương nhân tố A

M SA= SSA m−1, m−1 được gọi là bậc tự do của A.

- Trung bình bình phương nhân tố B

M SB = SSB n−1, n−1 được gọi là bậc tự do của B.

- Trung bình bình phương sai số

M SE= SSE rmn−mn,

rmn−mn được gọi là bậc tự do của sai số.

- Trung bình bình phương của tương tác

M SI = SSI (m−1)(n−1), (m−1)(n−1)được gọi là bậc tự do của tương tác.

- Tỉ số F cho nhân tố A

FA = M SA M SE. - Tỉ số F cho nhân tố B

FA = M SB M SE. - Tỉ số F cho tương tác A và B

FAB = M SI M SE.

Các kết quả nói trên được trình bày trong bảng sau đây gọi là bảng ANOVA 2 nhân tố

Nguồn Bậc tự do SS MS Tỉ số F

Nhân tố A m−1 SSA M SA FA

Nhân tố B n−1 SSB M SB FB

Tương tác (m−1)(n−1) SSI MSI FAB

Sai số rmn−mn SSE MSE

Tổng rmn−1 SST

Ta có quy tắc kiểm định như sau

(i)H0A : Các mức A1, A2, ..., Am có hiệu quả như nhau

H1A : Có ít nhất hai mức trong A1, A2, ..., Am có hiệu quả khác nhau p-giá trị=P(Fm−1,rmn−mn> FA)

Miền bác bỏH0 là W = [fm−1;rmn−mn;α; +∞).

(ii)H0B : Các mức B1, B2, ..., Bn có hiệu quả như nhau

H1B : Có ít nhất hai mức trong B1, B2, ..., Bn có hiệu quả khác nhau Miền bác bỏH0 là W = [fn−1;rmn−mn;α; +∞).

P-giá trị=P(Fn−1,rmn−mn > FB) (iii)H0AB : Có sự tương tác giữa A và B H1AB : Không có sự tương tác giữa A và B p-giá trị=P(F(m−1)(n−1),rmn−mn > FAB).

Miền bác bỏH0 là W = [f(m−1)(n−1);rmn−mn;α; +∞).

Trong đó, Fx,y là phân phối Fisher, fx;y;α là phân vị mức α của phân phối Fisher.

Ví dụ 8.4. Hàm lượng saponin (mg) của cùng một loại dược liệu được thu hái trong 2 mùa (khô và mưa: trong mỗi mùa lấy mẫu 3 lần (đầu mùa, giữa mùa, cuối mùa) và từ 3 miền (Nam, Trung, Bắc) thu được kết quả sau:

Mùa Thời điểm Miền

Nam Trung Bắc

Đầu mùa 2.4 2.1 3.2

Khô Giữa mùa 2.4 2.2 3.2

Cuối mùa 2.5 2.2 3.4

Đầu mùa 2.5 2.2 3.4

Mưa Giữa mùa 2.5 2.3 3.5

Cuối mùa 2.6 2.3 3.5

Với mức ý nghĩaα = 0.05hãy cho biết hàm lượng saponin có khác nhau theo mùa hay miền không? Nếu có thì 2 yếu tố mùa và miền có sự tương tác với nhau hay không?

Giải.

Ta có bảng các giá trị của Tij:

Mùa

Miền Nam Trung Bắc Ti∗

Khô 7,3 6,5 9,8 23,6

Mưa 7,6 6,8 9,8 10,4

T∗j 14,9 13,3 20,2 T = 48,4 Q= 134,64.

Suy ra bảng ANOVA 2 nhân tố sau:

Nguồn Bậc tự do SS MS F

Nhân tố Mùa 1 0,08 0,08 FA = 16

Nhân tố Miền 2 4,3478 2,1739 FB = 434,78

Tương tác 2 0,01 0,005 FAB = 1

Sai số 12 0,06 0,005

Tổng 17 155699,6

Miền bác bỏ H0A là W = [4.7472; +∞), miền bác bỏ H0B là W = [3.8853; +∞), miền bác bỏ H0AB là W = [3.8853; +∞). Vì vậy có thể kết luận: hàm lượng saponin trong dược liệu khác nhau theo mùa, theo miền và không có sự tương tác giữa mùa và miền trên hàm lượng saponin.

Kiểm tra giả thiết của mô hình.

Để kiểm gia giả thiết của môn hình: sai số ngẫu nhiên có phân bố chuẩn N(0;σ2) ta vẽ biểu đồ xác suất chuẩn của phần dư. Ta có số liệu của phần dư như sau:

-0,033 -0,067 -0,067 -0,033 0,033 -0,067 0,067 0,033 0,133 -0,033 -0,067 -0,067 -0,033 0,033 0,033

Biểu đồ xác suất chuẩn (xem Hình 8.3) của phần dư nằm xấp xỉ trên đường thẳng đi qua gốc tọa độ nên giả thiết sai số ngẫu nhiên có phân bố chuẩn N(0;σ2) xem như được thỏa mãn.

Hình 8.3

Một phần của tài liệu Giáo trình xác suất thống kê (Trang 152 - 158)

Tải bản đầy đủ (PDF)

(179 trang)