PHĐN TÍCH PHƯƠNG SAI HAI CHIỀU (Two Way Analysis of Variance)

Một phần của tài liệu Tài liệu Đề cương môn xác suất Thống kê pdf (Trang 70 - 80)

Phđn tích phương sai hai chiều lă xĩt đến hai yếu tố (hai nguyín nhđn) ảnh hưởng đến hiện tượng nghiín cứu. Ví dụ như trong phđn tích phương sai một chiều cho ta biết kết quả chi phí bân hăng trung bình/sản phẩm ở ba cửa hăng lă khâc nhau mă ở đđy ta chưa nghiín cứu đến trình độ tiếp cận của người bân hăng đến khâch hăng hoặc kỹ năng đặc biệt của từng nhđn viín khi bân hăng.... Phđn tích phương sai hai chiều sẽ cĩ ý nghĩa trong trường hợp năy.

1. Trường hợp cĩ một quan sât mẫu trong một ơ: (One observation per cell)

Giả sử xij lă một quan sât thấy được ở cột thứ i vă hăng thứ j trong một mẫu, như vậy nếu cĩ k cột vă h hăng thì ta kí hiệu tổng số quan sât lă n = k.h

Dạng tổng quât của quan sât mẫu trín k cột vă h hăng như sau:

Ðể phât triển một kiểm định giả thuyết cho rằng trung bình của câc tổng thể thì bằng nhau cho k cột . Ta thực hiện theo câc bước sau:

Bước 1: Tính trung bình của riíng từng cột (từng tổng thể): group

(i=1, 2,..., k)

Bước 2: Tính trung bình riíng cho từng hăng: block

(j = 1, 2,..., h)

Bước 3: Tính trung bình chung của toăn mẫu quan sât :

Bước 4 : Tính

1. Tổng bình phương chung: SST = SSG + SSB + SSE

2. Tổng bình phương giữa câc cột: between-groups

3. Tổng bình phương giữa câc hăng: between-blocks

4. Tổng bình phương sai số: error

Bước 5: Tính câc trung bình bình phương: 1. Trung bình bình phương giữa câc cột:ĉ 2. Trung bình bình phương giữa câc hăng:ĉ 3. Trung bình bình phương sai số: ĉ

Bước 6 : Tính giâ trị kiểm định từ hai tỉ số F tương ứng cho hai cặp giả thuyết H0: ĉ vă ĉ

Bước 7 : Cĩ 2 trường hợp trong quyết định bâc bỏ giả thuyết H0 của ANOVA hai chiều một quan sât trong một ơ:

1. Ðối với F1, ở mức ý nghĩa (, giả thuyết H0 cho rằng trung bình của tổng thể theo chỉ tiíu cột thì bằng nhau (nếu F1 trong bảng kết quả lă chỉ tiíu theo cột) cĩ thể bị bâc bỏ khi:

F1 > F k -1,(k-1)(h-1), α

2. Ðối với F2, ở mức ý nghĩa (, giả thuyết H0 cho rằng trung bình của tổng thể theo chỉ tiíu hăng thì bằng nhau (nếu F1 trong bảng kết quả lă chỉ tiíu theo hăng) cĩ thể bị bâc bỏ khi:

F2 > F h -1,(k-1)(h-1), α

Chú ý: F k -1,(k-1)(h-1), ( hay F h -1,(k-1)(h-1), ( lă giâ trị trong bảng phđn phối F (phđn phối

Fisher ở sau sâch) cĩ dạng F v1, v2, ( .

Bảng kết quả phđn tích phương sai hai chiều được xử lý từ phần mềm Excel. hoặc SPSS, Kết quả được in ra cĩ dạng tổng quât như sau:

Ví dụ: Trở lại ví dụ về chi phí bân hăng trung bình/sản phẩm nhưng cĩ một số nội dung thay đổi. Trước tiín, người bân hăng được xếp theo 6 nhĩm tuổi:

Nhĩm 1: ( 25 tuổi 2: 26 - 35 3: 36 - 45 4: 46 - 55 5: 56 - 65 6: > 65

Chi phí bân hăng trung bình/sản phẩm được thực hiện bởi câc nhđn viín cĩ tuổi khâc nhau ở 3 của hăng được thu thập trong bảng sau:

Ðặt giả thuyết H0:

1. Chi phí bân hăng trung bình/sản phẩm ở câc cửa hăng khâc nhau đều bằng nhau (giả thuyết H0 theo chỉ tiíu cột).

2. Chi phí bân hăng trung bình/sản phẩm được thực hiện bởi câc nhđn viín cĩ độ tuổi khâc nhau thì bằng nhau (giả thuyết H0 theo chỉ tiíu hăng).

Bước 1 : Tính chi phí bân hăng trung bình/sản phẩm của 3 cửa hăng: • Cửa hăng A:ĉ =Ġ = 24,7

• Cửa hăng B: Ġ2 = Ġ = 23,9 • Cửa hăng C: Ġ3 =Ġ = 25,2

Bước 2 : Tính chi phí bân hăng trung bình /sản phẩm cho từng loại tuổi nhđn viín: Nhĩm 1: Ġ=Ġ = 25 Nhĩm 2: Ġ2 =Ġ = 24,Ķ Nhĩm 3: Ġ3 =Ġ = 25,4 Nhĩm 4: Ġ4 =Ġ = 24 Nhĩm 5: Ġ5 =Ġ = 23,9 Nhĩm 6: Ġ6 =Ġ = 24,7

Bước 3 : Tính chi phí bân hăng trung bình/sản phẩm chung của 18 mẫu quan sât. Ta cĩ: n = k x h = 3 x 6 = 18

Vă Ġ =Ġ = 24,6 Bước 4 :Tính câc tổng bình phương:

SST = (25,1-24,6)2 + (24,7-24,6) 2 + ... + (25,4-24,6) 2 = 11,88 SSG = 6 [(24,7-24,6) 2 + (23,9-24,6) 2 + (25,2-24,6) 2] = 5,16 SSB = 3[ (25-24,6) 2 + ...+ (24,7-24,6) 2 ] = 4,98

SSE = SST - SSG - SSB = 11,88 - 5,16 - 4,98 = 1,74 Bước 5 : Tính trung bình bình phương:

Bước 6 : Tính câc tỉ số F vă kết luận

• Tương ứng với giả thuyết H0 thứ nhất (trang 173) ta cĩ:

Nếu kiểm định ở mức ý nghĩa ( =1%, tra bảng phđn phối F thì giâ trị

Fk -1,(k-1)(h-1),( = F2,10,1% = 7,56. Vậy F1 > F2,10,1% ta bâc bỏ giả thuyết H0, nghĩa lă chi phí bân hăng trung bình/sản phẩm ở ba cửa hăng khâc nhau thì khâc nhau.

• Tương ứng với giả thuyết H0 thứ hai (trang 173) ta cĩ:

Tra bảng ta cĩ: F5,10,1% = 5,64. Bởi vì F2 > F5,10,1% ta cĩ thể bâc bỏ giả thuyết H0 ở mức ý nghĩa 1%, nghĩa lă chi phí bân hăng trung bình/sản phẩm được thực hiện bởi câc nhđn viín cĩ độ tuổi khâc nhau thì khâc nhau. Sau đđy lă bảng kết quả ANOVA của ví dụ trín.

Bảng 5.8: Bảng kết quả ANOVA hai chiều

2. Trường hợp cĩ hơn một quan sât trong một ơ: (More than one obserration per cell)

Phât triển thím từ trường hợp một quan sât trong một ơ. Ðể tăng tính chính xâc khi suy rộng một vấn đề năo đĩ của mẫu cho một tổng thể, ta tăng mẫu quan sât (n) trong điều kiện cho phĩp. Gọi (l) lă số quan sât trong một ơ, ta cĩ dạng tổng quât của (l) quan sât trong một ơ như sau:

Cĩ ba giả thuyết H0 trong trường hợp phđn tích phương sai hai chiều nhiều quan sât trong một ơ tương ứng với ba tỉ số F (F1,F2 vă F3).

• Hai giả thuyết H0 tương ứng với tỉ số F1 vă F2 giống như trong trường hợp phđn tích phương sai hai chiều một quan sât trong một ơ (trang 173). Nghĩa lă, trung bình chỉ tiíu nghiín cứu của

chỉ tiíu theo cột vă theo hăng thì bằng nhau.

• Giả thuyết H0 tương ứng với tỉ số F3: khơng cĩ sự ảnh hưởng qua lại giữa câc chỉ tiíu theo cột vă hăng đến chỉ tiíu nghiín cứu.

Cũng từ ví dụ chi phí bân hăng (chỉ tiíu nghiín cứu), thay vi thu thập một quan sât trong một ơ, ta tiến hănh thu thập ba quan sât trong một ơ nhằm để tăng khả năng chính xâc của việc suy rộng cho tổng thể. Bảng sau đđy thể hiện dữ liệu thu thập ba quan sât trong một ơ:

Nhĩm tuổi Cửa hăng

nhđn viín A B C 1 25,0 25,4 25,2 24,0 24,4 23,9 25,9 25,8 25,4 2 24,8 24,8 24,5 23,5 23,8 23,8 25,2 25,2 25,4 3 26,1 26,3 26,2 24,6 24,9 24,9 25,7 25,9 25,5 4 24,1 24,4 24,4 23,9 24,0 23,8 24,0 23,6 23,5 5 24,0 23,6 24,1 24,4 24,4 24,1 25,1 25,2 25,3

Ðặt câc giả thuyết H0:

1. Giả thuyết H0 trong trường hợp F1: Chi phí bân hăng trung bình/sản phẩm ở câc cửa hăng khâc nhau đều bằng nhau.

2. Giả thuyết H0 trong trường hợp F2: Chi phí bân hăng trung bình/sản phẩm được thực hiện bởi câc nhđn viín cĩ độ tuổi khâc nhau thì bằng nhau.

3. Giả thuyết H0 trong trường hợp F3: khơng cĩ tương tâc giữa độ tuổi khâc nhau của nhđn viín bân hăng bân ở ba cửa hăng khâc nhau.

Bước 2 : Tính trung bình theo hăng (block means):

Bước 3: Tính trung bình trong một ơ (cell means)

Tương tự ta cũng tính được:

Bước 4 : Tính trung bình chung (overall mean):

Ðể đơn giản ta cĩ thể tính trung bình chung theo cơng thức như dưới đđy với điều kiện số quan sât trong mỗi nhĩm đềubằng nhau.

Ġ Ľ (Tổng câc trung bình theo nhĩm chia cho số nhĩm) Theo ví dụ ta cĩ:

Bước 5 : Tính câc tổng bình phương (SS) vă câc trung bình bình phương (MS):

Chú ý: ở đđy xuất hiện thím một chỉ tiíu SSI (sums of squares for interaction) lă tổng bình phương của sự tâc động qua lại giữa chỉ tiíu cột vă hăng.

Bước 6: Tỉ số F

1. F1 =Ġ được so sânh với Fk-1 ,k h (l-1),( hay cịn được kí hiệu Fv1,v2, ( trong bảng phđn phối F. Quyết định bâc bỏ giả thuyết H0 tương ứng với F1 khi: F1 > Fk-1 ,k h (l-1),(

2. F2 =Ġ được so sânh với Fh-1 ,k h (l-1),( trong bảng phđn phối F. Ta cĩ thể bâc bỏ giả thuyết H0 tương ứng với F2 khi: F2 > Fh-1 ,k h (l-1),α

3. F3 =Ġ được so sânh với F (k-1)(h-1), k h (l-1),( .Quyết định bâc bỏ giả thuyết H0 tương ứng với F3 khi: F3 > F (k-1)(h-1), k h (l-1),(

Sau đđy lă bảng kết quả ANOVA tổng quât:

Bảng 5.10: Bảng kết quả ANOVA hai chiều tổng quât

Nguồn biến động Tổng bình phương Ðộ tự do Trung bình bình phương Tỉ số F Giữa câc nhĩm SSG (k-1) MSG F1

Giữa cêc hăng SSB (h-1) MSB F2

Giữa câc nhĩm vă hăng SSI (k-1)(h-1) MSI F3

Sai số SSE k.h(l-1) MSE

Tổng cộng SST khl -1

Vă bảng kết quả ANOVA trong ví dụ trín lă:

Nguồn biến động Tổng bình

phương Ðộ tự do Trung bình bình phương

Tỉ số F Câc cửa hăng (A,B vă C) 7,1565 2 3,5783 92,46 Lọai tuổi nhđn viín 13,1517 4 3,2879 84,96

Interaction 6,6045 8 0,8256 21,33

Error 1,1600 30 0,0387

Total 28,0727 44

Nhận xĩt:

Ta cĩ k = 3 h = 5 l = 3 vă ( = 1%

1. F1 = 96,42 vă khi tra bảng phđn phối F, ta cĩ Fk-1 ,k h (l-1),( = F2,30,1% = 5,39.

Vì: F1 = 96,42 > F2,30,1% = 5,39 nín giả thuyết H0 bị bâc bỏ ở mức ý nghĩa 1%. Nghĩa lă chi phí bân hăng trung bình / sản phẩm ở câc cửa hăng khâc nhau thì khâc nhau.

2. F2 = 84,96 vă khi tra bảng phđn phối F, ta cĩ Fh-1 ,k h (l-1),( = F4,30,1% = 4,02.

Vì: F2 = 84,96 > F4,30,1% = 4,02 nín giả thuyết H0 bị bâc bỏ ở mức ý nghĩa 1%. Nghĩa lă chi phí bân hăng trung bình / sản phẩm được thực hiện bởi câc nhđn viín cĩ độ tuổi khâc nhau thì khâc nhau.

3. F3 = 21,33 vă khi tra bảng phđn phối F, ta cĩ F (k-1)(h-1), k h (l-1),( = F8,30,1% = 3,17.

Vì: F3 = 21,33 > F8,30,1% = 3,17 nín giả thuyết H0 bị bâc bỏ ở mức ý nghĩa 1%. Nghĩa lă cĩ liín hệ vă ảnh hưởng qua lại giữa độ tuổi khâc nhau của nhđn viín bân hăng bân ở ba cửa hăng khâc nhau đến chi phí bân hăng trung bình/sản phẩm.

Chú ý: Khi thực hiện ANOVA trín mây vi tính, trong bảng kết quả cho ta thím một cột mang tín F

Critical, cột năy sẽ lă kết quả tra bảng dùng để so sânh với cột F ratio để quyết định bâc bỏ hay chấp nhận giả thuyết H0.

Một phần của tài liệu Tài liệu Đề cương môn xác suất Thống kê pdf (Trang 70 - 80)

Tải bản đầy đủ (DOC)

(180 trang)
w