CHƯƠNG 3 .KẾT QUẢ NGHIÊN CỨU VÀ KẾT LUẬN
1. Giới tính học sinh và lỗi thiên lệch trong câu hỏi thi PISA
Số lượng học sinh nam và nữ của Việt Nam tham gia khảo sát PISA chu kỳ 2012 là khá cân bằng (53,4% học sinh nữ và 46,6% học sinh nam). Theo kết quả phân tích, học sinh nam đạt 516,639 điểm, học sinh nữ đạt 506,739 điểm.
Bảng 3.1. Điểm trung bình của học sinh nam và học sinh nữ
Giới tính Điểm TB Sai số chuẩn Số HS Số trường 1 Nữ 506,739 4,653463 2648 162 2 Nam 516,639 5,569245 2311 162
Chênh lệch điểm giữa học sinh nam và học sinh nữ là khoảng 9 điểm trên thang điểm 500.
Bảng 3.2. Tương quan điểm trung bình giữa học sinh nam và học sinh nữ
Giới tính Chênh lệch Sai số chuẩn 1 Nữ - Nam -9,900 2,960294
Theo phân tích của OECD (2012), với kết quả của năm 2012, chênh lệch điểm trung bình từ 5 điểm trở lên là mang ý nghĩa thống kê. Như vậy, khác biệt về điểm trung bình giữa học sinh nam và nữ có ý nghĩa thống kê. Hay nói cách khác, yếu tố giới tính có ảnh hưởng tới kết quả làm bài của học sinh.
Tuy nhiên, ảnh hưởng này có đủ lớn để gây nên lỗi thiên lệch trong câu hỏi thi hay không? Khi chạy kết quả phân tích độ khó của câu hỏi bằng phần mềm CONQUEST, ta được hệ số Separation Reliability = 0.988 cho thấy tính độc lập giữa các câu hỏi khá cao, điều này khẳng định các câu hỏi là hoàn toàn độc lập với nhau. Khi phân tích khoảng cách khác biệt về độ khó giữa học sinh nam và nữ, ta có kết quả sau:
Hình 3.1. Kết quả phân tích DIF theo yếu tố giới tính
Theo tiến sĩ Lê Lực, câu hỏi có nguy cơ bị thiên lệch nếu giá trị logit của các câu hỏi lớn hơn 0,25. Tổng số câu hỏi có giá trị logit trên 0,25 là 23/83 câu hỏi (chiếm 27,7%). Trong đó 13 câu hỏi có khả năng tạo lợi thế cho các học sinh nam và 10 câu hỏi có khả năng tạo lợi thế trả lời cho những học sinh nữ. Đặc biệt có những câu có sự chênh lệch rất lớn, ví dụ: các câu 3, 9, 15, 79.
Để rõ hơn, có thể xem đồ thị minh họa dưới đây giữa câu 2 và câu 3:
Nhìn vào hình trên, có thể thấy câu 2 với khoảng khác biệt xấp xỉ 0.18 giá trị logit, cho thấy năng lực của học sinh nam cao hơn không đáng kể so với năng lực của học sinh nữ. Câu 3 với khoảng khác biệt rất lớn, khoảng 0.6 giá trị logit, đủ điều kiện để đảm bảo câu hỏi sẽ phản ánh đúng năng lực học sinh mà khơng có sự tác động của một yếu tố nào khác ngoài năng lực. Câu này cho thấy học sinh nữ làm câu này dễ hơn học sinh nam, hay nói cách khác, câu 3 có yếu tố thiên lệch đối với học sinh nữ.
Hình 3.3. DIF ở câu hỏi 2, giữa nhóm học sinh nam và nhóm học sinh nữ
Với đường cong màu xanh dương thể hiện kết quả làm bài của các học sinh nữ và đường cong nhạt, màu xanh lá cây thể hiện kết quả làm bài của học sinh nam, hình 3.3 cho ta thấy chênh lệch giữa 2 nhóm học sinh này là khơng đáng kể.
Hình 3.4. DIF ở câu hỏi 3 giữa nhóm học sinh nam và nhóm học sinh nữ
Từ hình 3.4, có thể thấy có sự chênh lệch khá lớn giữa kết quả của học sinh nam và học sinh nữ. Ở hầu hết các giá trị năng lực, xác suất để học sinh nam trả lời đúng câu hỏi luôn thấp hơn xác suất để học sinh nữ trả lời đúng câu hỏi.
Tìm hiểu sâu hơn, để khẳng định có sự khác biệt giữa kết quả của học sinh nam và học sinh nữ, tác giả sử dụng kiểm định giả thuyết về trị trung bình của 2
tổng thể độc lập (Independent Samples T-test) với mức ý nghĩa 0,005 trong SPSS để đánh giá khác biệt về kết quả trung bình giữa hai giới. Kết quả như sau:
Bảng 3.3. Kiểm định giả thuyết trị trung bình của 2 tổng thể độc lập giữa
nhóm học sinh nam và nhóm học sinh nữ
Kiểm định Levene Kiểm định giả thuyết về sự bằng nhau giữa hai trung bình tổng thể
Giá trị F Mức ý nghĩa Giá trị T Khác biệt Mức ý nghĩa (2 chiều) Khác biệt GTTB Khác biệt sai số chuẩn 95% khoảng tin cậy của sự khác biệt Thấp hơn Cao hơn 3
Giả định hai phương sai bằng nhau
48,911 ,000 -5,251 1527 ,000 -,134 ,025 -,184 -,084
Không giả định hai phương
sai bằng nhau
-5,269 1459,251 ,000 -,134 ,025 -,183 -,084
4
Giả định hai phương sai bằng nhau
14,123 ,000 -3,139 1529 ,002 -,124 ,040 -,202 -,047
Không giả định hai phương
sai bằng nhau
-3,010 1152,450 ,003 -,124 ,041 -,205 -,043
9
Giả định hai phương sai bằng nhau
100,378 ,000 -5,214 1515 ,000 -,124 ,024 -,170 -,077
Không giả định hai phương
sai bằng nhau
-5,183 1445,481 ,000 -,124 ,024 -,170 -,077
15
Giả định hai phương sai bằng nhau
1,306 ,253 4,432 1529 ,000 ,113 ,026 ,063 ,164
Không giả định hai phương
sai bằng nhau
4,433 1443,654 ,000 ,113 ,026 ,063 ,164
51
Giả định hai phương sai bằng nhau
41,595 ,000 -3,221 1532 ,001 -,067 ,021 -,108 -,026
Không giả định hai phương
sai bằng nhau
-3,204 1471,951 ,001 -,067 ,021 -,109 -,026
54
Giả định hai phương sai bằng nhau
37,377 ,000 -3,007 1498 ,003 -,059 ,020 -,098 -,021
Không giả định hai phương
sai bằng nhau
-3,044 1494,933 ,002 -,059 ,019 -,097 -,021
57
Giả định hai phương sai bằng nhau
16,233 ,000 -2,934 1532 ,003 -,075 ,025 -,124 -,025
Không giả định hai phương
sai bằng nhau -2,935 1529,937 ,003 -,075 ,025 -,124 -,025
58
Giả định hai phương sai
bằng nhau 19,702 ,000 -3,812 1532 ,000 -,184 ,048 -,278 -,089
Không giả định hai phương
sai bằng nhau -3,808 1520,120 ,000 -,184 ,048 -,279 -,089
68
Giả định hai phương sai
bằng nhau 20,056 ,000 -4,425 1498 ,000 -,114 ,026 -,164 -,063
Không giả định hai phương
sai bằng nhau
-4,418 1441,284 ,000 -,114 ,026 -,164 -,063
79
Giả định hai phương sai bằng nhau
89,901 ,000 -4,759 1523 ,000 -,112 ,023 -,158 -,066
Không giả định hai phương
sai bằng nhau
Theo lý thuyết:
- Nếu giá trị Sig. trong kiểm định Levene (kiểm định F) < 0.05 thì phương sai của 2 tổng thể khác nhau, ta sử dụng kết quả kiểm định t ở dòng Equal variances not assumed;
- Nếu Sig. ≥ 0.05 thì phương sai của 2 tổng thể không khác nhau, ta sử dụng kết quả kiểm định t ở dòng Equal variances assumed;
- Nếu Sig. của kiểm định t ≤ α (mức ý nghĩa) thì có sự khác biệt có ý nghĩa về trung bình của 2 tổng thể;
- Nếu Sig. > α (mức ý nghĩa) thì khơng có sự khác biệt có ý nghĩa về trung bình của 2 tổng thể.
Như vậy, bảng 3.3 cho thấy có 10/23 câu hỏi có sự khác biệt có ý nghĩa trung bình giữa học sinh nam và học sinh nữ.
Những kết quả trên cho thấy yếu tố giới tính là 1 nguyên nhân có thể khiến câu hỏi bị lỗi thiên lệch.