Phân tích phương sai đa biến hai chiều (two way - MANOVA) thường được coi là phần mở rộng của ANOVA hai chiều (Two way - ANOVA) cho các tình hướng có hai hoặc nhiều biến phụ thuộc. Mục đích chính của MANOVA hai chiều là để hiểu liệu có sự tương tác giữa hai biến độc lập trên hai hoặc nhiều biến phụ thuộc hay không.
Trang 1 Phân tích phương sai đa biến 2 nhân tố
(Two way – MANOVA)
Khái niệm Two way – MANOVA
Phân tích phương sai đa biến hai chiều (two way - MANOVA) thường được coi là phần mở rộng của ANOVA hai chiều (Two way - ANOVA) cho các tình hướng có hai hoặc nhiều biến phụ thuộc Mục đích chính của MANOVA hai chiều là để hiểu liệu có sự tương tác giữa hai biến độc lập trên hai hoặc nhiều biến phụ thuộc hay không
Ví dụ 1: Một nhà nghiên cứu muốn kiểm tra xem yếu tố khu vực sống (thành thị, nông
thôn, vùng sâu vùng xa) và giới tính ( nam và nữ ) có ảnh hưởng đến diểm thi tốt nghiệp phổ thông của các môn Toán, Ngữ Văn và Tiếng Anh hay không? Câu hỏi nghiên cứu chỉ
ra rằng phân tích này có nhiều biến độc lập ( kết quả thi cuối kì và giới tính) và ảnh hưởng của nó đến nhiều biến phụ thuộc ( điểm thi tốt nghiệp Toán, Ngữ Văn, Tiếng Anh)
Ví dụ 2: Chúng ta có thể sử dụng MANOVA hai chiều để hiểu liệu có sự khác biệt trong
việc nhớ lại các dữ kiện ngắn hạn và dài hạn của sinh viên dựa trên ba thời lượng khác nhau của bài giảng ( tức là: hai biến phụ thuộc là “ sự nhớ lại trí nhớ ngắn hạn” và nhớ lại trí nhớ dài hạn”, trong khi hai biến đôc lập là “ thời lượng bài giảng”, có ba nhóm độc lập:
“60 phút”, “90 phút” và “120 phút”), và “loại bài giảng” gồm “dữ kiện định lượng ( số học)” và “ dữ liệu định tính (văn bản)”
Như vậy, MANOVA hai chiều thường có một mục đích chính là để hiểu xem liệu hiệu ứng của một biến độc lập lên các biến phụ thuộc (gọi chung) có phụ thuộc vào giá trị của biến độc lập kia hay không Đây được gọi là “hiệu ứng tương tác” (interaction effect) Tuy nhiên, nếu không có hiệu ứng tương tác nào ( thường được đánh giá là hiệu ứng tương tác
có ý nghĩa thống kê hay không), thay vào đó bạn sẽ quan tâm đến “tác động chính” (main effects) của từng biến độc lập Điều này hơi giống với việc đánh giá hiệu ứng của một biến độc lập lên các biến phụ thuộc một cách tổng thể khi “bỏ qua” giá trị của biến độc lập kia Mặt khác, nếu tìm thấy một tương tác có ý nghĩa thống kê, bạn cần xem xét một phương pháp theo dõi kết quả (tức là những phân tích tiếp theo mà bạn có thể muốn chạy)
Phạm vi áp dụng:
Kiểm định Manova được khuyến khích khi nghiên cứu sự khác biệt của 2 hoặc nhiều biến độc lập với nhau
Kiểm định Manova không nên sử dụng khi không có sự liên quan hoặc tương quan cao giữa các biến phụ thuộc
Trang 2 Bài toán
Phân tích phương sai đa biến hai nhân tố là phân tích ảnh hưởng của hai nhân tố nguyên ảnh hưởng đến nhiều kết quả
Tương tự như phân tích ANOVA hai nhân tố, ta giả sử biến đáp ứng 𝑋𝑖𝑗 chịu ảnh hưởng bởi hai nhân tố A và C Nhân tố A được xem xét ở các mức A1, A2, ,An và nhân tố C được xem xét ở các mức C1, C2,…, Cn
Nhân tố C
Nhân tố A
Mô hình phân tích MANOVA hai nhân tố có dạng:
𝑋𝑖𝑗𝑘 = 𝜇 +𝛼𝑖+ 𝛽𝑗 + 𝛾𝑖𝑗 + 𝜀𝑖𝑗𝑘, Trong đó:
𝑋𝑖𝑗𝑘 = (
𝑋𝑖𝑗𝑘1
𝑋𝑖𝑗𝑘2
⋯
𝑋𝑖𝑗𝑘
) (𝑖 = 1, 𝑚̅̅̅̅̅̅; 𝑗 = 1, 𝑛̅̅̅̅̅; 𝑘 = 1, 𝑙̅̅̅̅): Véc tơ ngẫu nhiên có phân phối chuẩn p chiều, độc lập và có cùng ma trân hiệp phương sai ∑
𝜇 = (
𝜇1
𝜇2
⋯
𝜇3
): Véc tơ trung bình của tất cả các véc tơ 𝑋𝑖𝑗,
𝛼𝑖 = (
𝛼𝑖1
𝛼𝑖2
⋯
𝛼𝑖𝑝
): Mức tác động thứ i của nhân tố A,
𝛽𝑗 = (
𝛽𝑗1
𝛽𝑗2
⋯
𝛽𝑗𝑝
): Mức tác động thứ j của nhân tố C,
Trang 3𝛾𝑖𝑗 = (
𝛾𝑖𝑗1
𝛾𝑖𝑗2
⋯
𝛾𝑖𝑗𝑝
): Mức tác động thứ i của nhân tố A, mức tác động thứ j của nhân tố C,
𝜀𝑖𝑗𝑘: Véc tơ sai số ngẫu nhiên
Chúng ta cần kiểm tra các giả thiết:
𝐻0𝐴(
𝛼11
𝛼12
⋯
𝛼1𝑝
) = (
𝛼21
𝛼22
⋯
𝛼2𝑝 ) = ⋯ = (
𝛼𝑚1
𝛼𝑚2
⋯
𝛼𝑚𝑝 ) = (
0 0
⋯ 0 ) ; 𝐻1𝐴: (𝛼𝑖𝑝) ≠ 0
𝐻0𝐶(
𝛽11
𝛽12
⋯
𝛽1𝑝
) = (
𝛽21
𝛽22
⋯
𝛽2𝑝 ) = ⋯ = (
𝛽𝑚1
𝛽𝑚2
⋯
𝛽𝑚𝑝 ) = (
0 0
⋯ 0 ) ; 𝐻1𝐶: (𝛽𝑖𝑝) ≠ 0
𝐻0𝐴𝐶 = (
𝛾𝑖𝑗1
𝛾𝑖𝑗2
⋯
𝛾𝑖𝑗𝑝
) = (
0 0
⋯ 0 ) ; 𝐻1𝐴𝐶: (𝛾𝑖𝐽𝑝) ≠ 0
Sử dụng SPSS
Ví dụ:
Một nghiên cứu về hai nhân tố giới tính (1 = nam, 2 = nữ) và độ tuổi (1 = young, 2
= middle, 3 = old ) ảnh hưởng đến sự gây hấn của trẻ vị thành niên Người nghiên cứu thực
hiện 3 phần câu hỏi cho 24 người vị thành niên, các câu hỏi được cho điểm gồm 3 phần
của sự gây hấn: (1) gây hấn với bạn bè, (2) gây hấn với cha mẹ, (3) gây hấn với người lạ
Dữ liệu được cho trong bản sau:
Tuổi
Nam 13, 7, 7
11, 4, 4
9, 5, 10
15, 3, 4
14, 12, 8
10, 15, 11
12, 11, 8
10, 9, 9
10, 8, 11
9, 8, 12
13, 11, 13
7, 9, 16
Nữ 8, 7, 8
6, 3, 7
5, 6, 8
5, 5, 7
15, 3, 10
12, 12, 9
13, 11, 9
18, 10, 7
11, 11, 10
10, 4, 12
12, 9, 12
9, 8, 14
Trang 4Bằng cách sử dụng phương pháp MANOVA 2 nhân tố hãy kiểm tra xem có sự khác biệt giữa 2 nhóm giới tính và 3 nhóm tuổi tới sự gây hấn hay không với mức ý nghĩa 5%
Giải :
Nhập dữ liệu và save với tên “2 way MANOVA “ với các biến được mã hóa như trong đề
bài trên
Đặt giả thiết:
𝐻0𝐴 : Trung bình 2 nhóm giới tính bằng nhau về sự gây hấn của trẻ
𝐻0𝐶 : Trung bình 3 nhóm tuổi bằng nhau về sự gây hấn của trẻ
𝐻0𝐴𝐶: Không có sự tương tác giữa 2 nhóm giới tính và tuổi đến sự gây hấn của trẻ
Trang 5Dùng lệnh Analyza > General Linear Model > GLM Multivariate > đưa 2 biến Gtinh, Tuoi vào ô Fixed Factor, đưa 3 biến còn lại vào ô Dependent Variables như hình dưới
đây:
Trong Options ta chọn hình như sau:
Trang 6 Kết quả:
Box's Test of Equality of Covariance
Matrices a
Box's
Between-Subjects Factors
Value Label N
tuoi
2.00 middle 8
Trang 7Bảng thứ nhất cho giá trị mẫu của từng nhóm Bảng thứ hai cho phép kiểm tra giả
thuyết ma trận hiệp phương sai được quan sát của các biến phụ thuộc bằng nhau giữa các
nhóm Ta thấy Sig = 0.164 > 0.05 nên chấp nhận giả thuyết
Multivariate Tests a
df
Error df Sig Partial Eta
Squared
Intercept
Pillai's Trace 994 870.896b 3.000 16.000 000 994 Wilks' Lambda 006 870.896b 3.000 16.000 000 994 Hotelling's
Trace 163.293 870.896
Roy's Largest
Gtinh
Pillai's Trace 100 595b 3.000 16.000 627 100 Wilks' Lambda 900 595b 3.000 16.000 627 100 Hotelling's
Roy's Largest
Tuoi
Pillai's Trace 1.311 10.793 6.000 34.000 000 656 Wilks' Lambda 093 12.141b 6.000 32.000 000 695 Hotelling's
Roy's Largest
Gtinh *
Tuoi
Pillai's Trace 616 2.520 6.000 34.000 040 308 Wilks' Lambda 407 3.022b 6.000 32.000 019 362 Hotelling's
Roy's Largest
Biến gtinh cho ta Wilks’ Λ = 0.9, F(3.16) = 0.595, Sig = 0.627 > 0.05, vì vậy có thể
nói rằng có sự khác biệt giữa 2 nhóm giới tính lần lượt theo các biến banbe, chame, nguoila
Biến tuoi cho ta Wilks’ Λ = 0.093, F(6.32) = 12.141, Sig = 0.000 < 0.05, vì vậy có
thể nói rằng không có sự khác biệt giữa 3 nhóm tuổi lần lượt theo các biến banbe, chame,
nguoila
Trang 8Biến gtinh*tuoi cho ta Wilks’ Λ = 0.407, F(6.32) = 3.022, Sig = 0.019 < 0.05, vì vậy có thể nói rằng không có sự tương tác giữa 2 nhân tố giới tính và tuổi lên sự gây hấn của trẻ
Levene's Test of Equality of Error Variances a
Bảng này cho kết quả kiểm định Levence về sự bằng nhau của sai số phương sai của các biến phụ thuộc bằng nhau giữa các nhóm Ta thấy cả ba biến đều có giá trị Sig > 0.05 sai
số phương sai là bằng nhau theo các nhóm
Trang 9Dựa vào bảng này, trong biến gtinh ta cả 3 biến banbe chame và nguoila đều có giá trị Sig > 0.05 nên không có sự khác nhau trong biến này Ngược lại có sự khác nhau trong biến tuoi Cuối cùng, với biến gtinh*tuoi ta thấy có sự khác nhau ở biến banbe và không khác nhau trong 2 biến chame và nguoila
Tests of Between-Subjects Effects
Source Dependent
Variable
Type III Sum of Squares
Partial Eta Squared
Corrected
Model
Intercept
Nguoila 2128.167 1 2128.167 654.821 000 973 Gtinh
Tuoi
Gtinh *
Tuoi
Error
Total
Nguoila 2322.000 24 Corrected
Total
Trang 10Bảng trên cho thấy sự khác biệt giữa các cặp Trong biến banbe có sự khác nhau giữa các cặp young – middle; middle – old Trong biến chame có sự khác nhau giữa các cặp young – middle; young – old Trong biến nguoila có sự khác nhau giữa cả 3 cặp
Pairwise Comparisons
Dependent
Variable (I) tuoi
(J) tuoi
Mean Difference (I-J)
Std
Error Sig.
b
95% Confidence Interval for Differenceb
Lower Bound
Upper Bound
banbe
young middle -4.000
middle young 4.000
old young 1.125 1.066 .305 -1.114 3.364
middle -2.875* 1.066 015 -5.114 -.636
chame
young middle -5.375
old -3.500* 1.282 014 -6.192 -.808 middle young 5.375
old young 3.500
middle -1.875 1.282 161 -4.567 817
nguoila
young middle -2.000
old -5.625* 901 000 -7.519 -3.731 middle young 2.000
old -3.625* 901 001 -5.519 -1.731 old young 5.625
middle 3.625* 901 001 1.731 5.519