2. Các chức năng cơ bản của SPSS
2.4. So sánh trung bình
So sánh trung bình là một công để phân tích số liệu có liên quan đến so sánh điểm trước và sau hoặc so sánh điểm giữa các nhóm học sinh. SPSS cũng cung cấp những công cụ so sánh trung trong Menu Analyze → Compare Means. Trong công cụ này chúng ta cũng xét các VD dựa trên cơ sở dữ liệu lớp thực nghiệm và lớp đối chiếu đã nêu ở trên. Các chức năng thường được sử dụng là:
* Means: Tính giá trị trung bình của một biến định lượng theo một biến định tính.
Để tính giá trị trung bình của một biến định lượng theo một biến định tính chúng ta sử dụng chức năng Means của SPSS. Chọn lệnh Means trong Menu Analyze →
Compare Means.
VD: Tính điểm trung bình của biến định lượng Diemthi theo biến định tính Lop. Chọn lệnh Means →chuyển biến định lượng vào ô Dependent List và biến định tính vào ô Independent List → OK. Lưu ý có thể chọn Options để tính thêm các tham số cần tính toán.
Hình 13. Tính giá trị trung bình theo biến định tính Kết quả:
Lop Mean N Std. Deviation
Lopthucnghiem 7,393 46 ,9938
Lopdoichieu 6,407 43 ,8664
Total 6,917 89 1,0532
Bảng 4. Kết quả tính giá trị trung bình theo biến định tính
* Paired-Sample T Test: So sánh cặp.
Sử dụng khi so sánh giá trị trung bình của hai nhóm tổng thể riêng biệt nhưng có sự tương quan theo cặp giữa các phần tử của hai nhóm, thường được sử dụng để khảo sát sự thay đổi của một nhóm đối tượng sau một thời gian, hoặc sau khi có biến cố gì xảy ra. VD: So sánh sự thay đổi của điểm số các nhóm học sinh trước và sau khi áp dụng phương pháp dạy học mới.
Điều kiện áp dụng là kích cỡ mẫu giữa hai nhóm đối tượng phải bằng nhau và giá trị của hai mẫu phải có phân bố chuẩn hoặc kích cỡ mẫu lớn để xem như xấp xỉ phân bố chuẩn.
Kiểm định Paired-Sample T Test bắt đầu tính toán sự chênh lệch của từng cặp rồi tính toán sự chênh lệch trung bình của hai mẫu. Kết quả nhận được bằng 0 tức là hai mẫu không có sự khác biệt và khác 0 là hai mẫu có sự sai khác so với nhau.
Các bước khi thực hiện phân tích Paired-Samples T-Test bao gồm:
+ Bước 1: Đặt giả thuyết Ho: “Không có sự khác nhau về trị hai trung bình tổng thể”, tức là khác biệt giữa hai trung bình là bằng 0.
+ Bước 2: Thực hiện kiểm định Paired-Samples T-Test.
+ Bước 3: So sánh giá trị sig của kiểm định t được xác định ở bước 2 với 0.05 (mức ý nghĩa 5% = 0.05 | độ tin cậy 95%). Nếu sig > 0.05 thì ta chấp nhận giả thuyết Ho nghĩa là trung bình hai tổng thể là bằng nhau, không có sự khác biệt. Nếu sig < 0.05 thì ta bác bỏ giả thuyết Ho nghĩa là có khác biệt trung bình hai tổng thể.
VD: Thực hiện so sánh cặp giữa điểm của các học sinh ở hai lớp thực nghiệm và lớp đối chiếu. Mỗi lớp lấy 43 học sinh và xem như lớp thực nghiệm chính là lớp đối chiếu sau khi áp dụng phương pháp dạy học mới.
Với giả thuyết như vậy, chúng ta được bảng số liệu mới như sau:
Hình 14. Bảng số liệu so sánh cặp
Thực hiện kiểm định: chọn Paired-Sample T Test → đưa hai biến muốn kiểm định trị trung bình vào khung Paired Variables → Chọn Options và nhập độ tin cậy (sử dụng độ tin cậy 95% tương đương mức ý nghĩa là 5%)→ OK.
Hình 15. Kiểm định Paired-Samples T-Test
Kết quả:
Paired Samples Statistics
Mean N Std. Deviation Std. Error Mean
Pair 1
Lopdoichieu 6,407 43 ,8664 ,1321
Lopthucnghiem 7,551 43 ,8096 ,1235
Paired Samples Correlations
N Correl
ation
Sig.
Pair 1 Lopdoichieu &
Lopthucnghiem 43 -,029 ,855
Paired Samples Test
Paired Differences t df Sig. (2-tailed)
Mean Std. Deviation Std. Error Mean 95% Confidence Interval of the Difference Lower Upper Pai r 1 Lopdoichieu - Lopthucnghiem -1,1442 1,2026 ,1834 -1,5143 -,7741 -6,239 42 ,000
Bảng 5. Kết quả kiểm định Paired-Samples T-Test
Đánh giá kết quả:
+ Đầu tiên cần quan tâm bảng Paired Samples Test: giá trị Sig = 0,000 < 0,05 tức là chúng ta bác bỏ giả thiết Ho tức là có sự khác biệt giữa điểm của hai lớp.
+ Tiếp theo đánh giá bảng Paired Samples Statistics: dễ thấy điểm trung bình của lớp thực nghiệm là 7,551 cao hơn so với 6,407 của lớp đối chiếu.
+ Cuối cùng bảng Paired Samples Correlations: cho biết mối tương quan của dữ liệu giữa hai nhóm khảo sát. Giá trị sig = 0,855 > 0,05 cho thấy dữ liệu của hai nhóm này có sự tương quan rất gần với nhau.
* One-Sample T Test: Kiểm định trung bình tổng thể.
Sử dụng để so sánh trung bình của tổng thể với một giá trị nào đó. VD: So sánh điểm của lớp thực nghiệm với điểm 7.
Quy trình kiểm định:
+ Bước 1: Đặt ra giả thuyết Ho là điểm trung bình của lớp thực nghiệm là 7 điểm.
+ Bước 2: Thực hiện kiểm định One-Sample T Test.
+ Bước 3: So sánh giá trị sig của kiểm định t được xác định ở bước 2 với 0.05 (mức ý nghĩa 5% = 0.05 | độ tin cậy 95%) Nếu sig > 0.05 thì ta chấp nhận giả thuyết Ho nghĩa là điểm trung bình tổng thể bằng 7. Nếu sig < 0.05 thì ta bác bỏ giả thuyết Ho nghĩa là điểm trung bình tổng thể khác 7, từ đó dựa vào cột Mean Difference có giá trị dương hay âm để kết luận điểm trung bình lớp hơn hay nhỏ hơn 7.
Thực hiện kiểm định: Chọn lệnh One-Sample T Test →đưa các biến cần kiểm định vào khung Test Variable → nhập giá trị muốn so sánh vào ô Test Value → OK.
Kết quả:
One-Sample Statistics
N Mean Std. Deviation Std. Error Mean
Lopthucnghiem 43 7,551 ,8096 ,1235
Lopdoichieu 43 6,407 ,8664 ,1321
One-Sample Test
Test Value = 7
t df Sig. (2-tailed) Mean Difference 95% Confidence Interval of the Difference
Lower Upper
Lopthucnghiem 4,464 42 ,000 ,5512 ,302 ,800
Lopdoichieu -4,488 42 ,000 -,5930 -,860 -,326
Bảng 6. Kết quả kiểm định One-Sample T Test
Đánh giá kết quả:
+ Không có điểm trung bình lớp nào là 7, bác bỏ Ho do giá trị sig ở cả hai biến đều là 0,000 < 0,05.
+ Đánh giá cột Mean Difference: điểm trung bình lớp thực nghiệm có hiệu số dương và lớp hơn 7. Ngược lại điểm trung bình lớp đối chiếu có hiệu số âm và nhỏ hơn 7.
Lưu ý ở đây One-Sample T Test đưa ra giá trị sig để chấp nhận hay bác bỏ giả thuyết Ho không chỉ dựa vào điểm trung bình mà còn dựa vào các yếu tố về kích thước mẫu, độ lệch chuẩn, khoảng biến thiên, độ tin cậy,… Do đó, khi muốn so sánh trung bình của biến với một giá trị nào đó, chúng ta cần tiến hành kiểm định One- Sample T Test chứ không thể kết luận dựa vào giá trị trung bình của biến đó được.
* Independent-Sample T Test: So sánh trung bình giữa hai nhóm.
Independent-Sample T Test chỉ dùng để kiểm định sự khác biệt trung bình trong trường hợp chỉ có hai biến định tính. VD: lớp thực nghiệm, lớp đối chiếu; nam, nữ; cô giáo A dạy, cô giáo B dạy;… Trong trường hợp ta có từ ba biến định tính trở lên thì ta phải sử dụng kiểm định ANOVA nếu không sẽ rất mất thời gian khi đi so sánh từng cặp biến định tính với nhau.
Independent-Sample T Test dùng để kiểm định sự khác biệt trung bình của biến định lượng với các giá trị khác nhau của biến định tính. VD: Có sự khác nhau về điểm số giữa lớp chuyên và lớp không chuyên hay không? Có sự khác nhau về mức độ chi tiêu giữa sinh viên thành phố với sinh viên các tỉnh hay không?
VD: Thực hiện kiểm định trên cơ sở dữ liệu lớp thực nghiệm và lớp đối chiếu với hai biến định tính là Lop gồm “lopthucnghiem” và “lopdoichieu” cùng biến định lượng là Diemthi với độ tin cậy 95%.
Hình 17. So sánh trung bình giữa hai nhóm
Chọn Independent-Sample T Test → đưa biến định lượng vào ô Test Variable
và đưa biến định tính và ô Grouping Variable → chọn Define Groups… để phân nhóm giá trị (với giá trị của lopthucnghiem là 1 và giá trị của lopdoichieu là 2 đã mã hóa ban đầu) → Continue → OK.
Kết quả:
Group Statistics
Lop N Mean Std. Deviation Std. Error Mean
Diemthi
Lopthucnghiem 46 7,393 ,9938 ,1465
Lopdoichieu 43 6,407 ,8664 ,1321
Independent Samples Test
Levene's Test for Equality of Variances
t-test for Equality of Means
F Sig. t df Sig. (2- tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference Lower Upper Diem thi Equal variances assumed ,422 ,518 4,977 87 ,000 ,9865 ,1982 ,5925 1,3805 Equal variances not assumed 5,000 86,591 ,000 ,9865 ,1973 ,5943 1,3787
Bảng 7. Kết quả so sánh trung bình giữa hai nhóm Đánh giá kết quả:
Đầu tiên quan sát kết quả Sig của cột Levene's Test nếu nhỏ hơn 0,05, nghỉa là phương sai giữa hai lớp khác nhau nhiều. Tiếp tục quan sát giá trị Sig. (2-tailed) ở cột
t-test (hàng đầu tiên Equal variances assumed):
+ sig T-test < 0,05 : kết luận có sự khác biệt về điểm số của hai lớp.
+ sig T-test 0,05 : kết luận không có sự khác biệt về điểm số của hai lớp. Nếu giá trị Sig Levene's Test lớn hơn hoặc bằng 0,05 thì phương sai giữa hai lớp không có sự khác nhau nhiều. Tiếp tục quan sát giá trị Sig. (2-tailed) ở cột t-test (hàng thứ 2 Equal variances not assumed):
+ sig T-test < 0,05 : kết luận có sự khác biệt về điểm số của hai lớp.
* One-Way ANOVA: Phân tích phương sai một chiều (kiểm định ANOVA) dùng khi có nhiều nhóm cần so sánh.
Kiểm định One-Way ANOVA cũng dùng để kiểm định trung bình giống như kiểm định Independent-Sample T Test ở trên. Tuy nhiên với One-Way ANOVA chúng ta có thể so sánh trung bình về một tiêu chí nào đó với hai hay nhiều đối tượng nghiên cứu chứ không bó buộc trong hai đối tượng như Independent-Sample T Test.
VD: Có sự khác nhau về trường học giữa các học sinh có số điểm thi tốt nghiệp khác nhau hay không, có sự khác nhau giữa giáo viên giảng dạy giữa các học sinh đạt mức điểm thi khác nhau hay không.
Ở chức năng này chúng ta sử dụng cơ sở dữ liệu về mức tiêu thụ xăng của các máy công nghiệp. Dữ liệu được lấy từ bài tập Phân tích dữ liệu nghiên cứu với SPSS
của Khoa Toán – Thống kê Đại học Đại học Kinh tế TP. Hồ Chí Minh (EUH)[1]. Số liệu cụ thể như sau:
Hình 19. Cơ sở dữ liệu mức tiêu thụ xăng
VD: Sử dụng cơ sở dữ liệu trên hãy so sánh mức tiêu thụ xăng giữa các máy động cơ có số cylinder khác nhau với độ tin cậy 95%.
Theo đó hai biến cần quan tâm là ttxang (mức tiêu thụ xăng) và may (số cylinder trong máy). Ở ví dụ này biến định lượng là mức tiêu thụ xăng, còn biến định tính là số cylinder gồm năm giá trị là 3, 4, 5, 6, 8. Vậy ở đây để kiểm định giá trị trung bình giữa năm yếu tố định tính này ta không thể sử dụng kiểm định Independent-Sample T Test được vì sẽ rất dài dòng phức tạp khi phải đi so sánh từng cặp giá trị định tính với nhau. Thay vào đó kiểm định One-Way ANOVA là phương án phù hợp hơn.
Thực hiện kiểm định:
Chọn lệnh One-Way ANOVA → đưa biến định lượng vào ô Dependent List →
đưa biến định tính vào ô Factor →Chọn Options và tích chọn hai mục Homogeneity of variance test và Welch → Continue → OK.
Kết quả:
Test of Homogeneity of Variances
muc tieu thu xang (km/lit)
Levene Statistic df1 df2 Sig.
3,828 4 45 ,009
ANOVA
muc tieu thu xang (km/lit)
Sum of Squares df Mean Square F Sig.
Between Groups 365,037 4 91,259 15,301 ,000
Within Groups 268,391 45 5,964
Total 633,429 49
Robust Tests of Equality of Means
muc tieu thu xang (km/lit)
Statistica df1 df2 Sig.
Welch 17,360 4 4,087 ,008
Bảng 8. Kết quả kiểm định One-Way ANOVA
Đánh giá kết quả:
Quy trình phân tích One-Way ANOVA được thực hiện như sau:
Hình 21. Đánh giá kết quả kiểm định One-Way ANOVA[25][18].
Khi phương sai của các nhóm giá trị không đồng nhất thì phải sử dụng kiểm định Welch để đánh giá kiểm định trung bình. Với kết quả VD trên Sig. Levene Statistic = 0.009 < 0.05 nghĩa là phương sai giữa các nhóm giá trị không đồng nhất nên sử dụng kết quả của kiểm định Welch. Quan sát Sig. Welch = 0.008 < 0.05, kết luận có sự khác biệt trung bình giữa các biến định lượng.