Bộ dữ liệu phân tích

Một phần của tài liệu Nghiên Cứu Một Số Yếu Tố Gây Ra Lỗi Thiên Lệch (Bias) Trong Câu Hỏi Thi PISA 2012 - Lĩnh Vực Toán Học (Trang 54 - 57)

CHƯƠNG 2 .PHƯƠNG PHÁP LUẬN NGHIÊN CỨU

3. Bộ dữ liệu phân tích

Năm 2012 Việt Nam có 4.959 học sinh tham gia vào khảo sát chính thức PISA. Như đã giới thiệu, phương pháp chọn mẫu của PISA được thực hiện theo phương pháp phân tầng hai giai đoạn. Theo lựa chọn của OECD, Việt Nam được phân theo 3 biến phân tầng chính đó là Miền (Miền Bắc, Miền Trung, Miền Nam); Loại hình trường (Cơng lập, ngồi cơng lập); Vị trí (Thành thị, Nơng thơn, Miền núi và vùng xa). Trên cơ sở đó, để đảm bảo cho việc phân tích, tác giả đã sử dụng

bộ dữ liệu do OECD cung cấp về kết quả làm bài lĩnh vực Toán học của 4959 học sinh Việt Nam.

Bộ dữ liệu gồm các biến: 1. Mã trường: SCHOOLID; 2. Mã học sinh: StIDStd; 3. Mã quyển đề thi: BOOKID;

4. Giới tính học sinh: với giá trị 1= học sinh nữ và 2= học sinh nam; 5. Vùng miền: với giá trị 1 = miền Bắc, 2 = miền Trung, 3 = miền Nam; 6. Vị trí địa lý: với giá trị 1 = Thành thị, 2 = Nông thon, 3 = Miền núi và vùng xa;

7. Loại hình trường: với giá trị 1 = cơng lập và 2 = ngồi cơng lập;

8. Biến câu hỏi: Bao gồm 83 biến tương ứng với 83 item Toán học PM00GQ01, PM00KQ02, PM033Q01, PM034Q01T, PM155Q01, PM155Q02D,

PM155Q03D, PM155Q04T, PM192Q01T, PM273Q01T, PM305Q01, PM406Q01, PM406Q02, PM408Q01T, PM411Q01, PM411Q02, PM420Q01T, PM423Q01, PM442Q02, PM446Q01, PM446Q02, PM447Q01, PM462Q01D, PM464Q01T, PM474Q01, PM496Q01T, PM496Q02, PM559Q01, PM564Q01, PM564Q02, PM571Q01, PM603Q01T, PM800Q01, PM803Q01T, PM828Q02, PM828Q03, PM906Q01, PM906Q02, PM909Q01, PM909Q02, PM909Q03, PM915Q01, PM915Q02, PM934Q01, PM934Q02, PM936Q01, PM936Q02, PM939Q01, PM939Q02, PM942Q01, PM942Q02, PM942Q03, PM948Q01, PM948Q02, PM948Q03, PM949Q01T, PM949Q02T, PM949Q03, PM955Q01, PM955Q02, PM955Q03, PM957Q01, PM957Q02, PM957Q03, PM961Q02, PM961Q03, PM961Q05, PM967Q01, PM967Q03T, PM982Q01, PM982Q02, PM982Q03T, PM982Q04, PM985Q01, PM985Q02, PM985Q03, PM991Q01, PM991Q02D, PM992Q01, PM992Q02, PM992Q03, PM998Q02, PM998Q04T. Trong phân tích, các item này được đánh theo số thứ tự tương ứng từ 1 đến 83. Câu trả lời của học sinh cho mỗi item đã được mã hóa về các giá trị: 9 = khơng trả lời, 0 = trả lời sai, 1, 2 = trả lời đúng.

Đề tài đặt giả thuyết về 4 yếu tố có thể lỗi thiên lệch trong câu hỏi thi PISA: - Vùng miền;

- Vị trí địa lý; - Loại hình trường; - Giới tính.

Để trả lời cho các giả thuyết trên, với từng cặp so sánh, phần mềm CONQUEST sẽ tính tốn các giá trị cơ bản bao gồm:

(1) Phân tích chênh lệch điểm trung bình giữa các nhóm đối tượng;

(2) Tính tốn giá trị DIF. Khi giá trị DIF đủ lớn (lớn hơn 0,25 logit, theo Luc T. Le, 2009) sẽ cho biết câu hỏi câu hỏi có tiềm ẩn nguy cơ thiên lệch.

(Independent Samples T-test) để kiểm tra sự khác biệt mang ý nghĩa thống kê về kết quả giữa các nhóm đối tượng nhằm khẳng định cho nguy cơ thiên lệch của câu hỏi.

Tiểu kết chương: Chương II giới thiệu về chỉ số DIF và lý thuyết đánh giá

chỉ số DIF, cũng như giới thiệu tóm tắt về chương trình PISA, bộ cơng cụ khảo sát, quy trình xây dựng bộ cơng cụ, năng lực đánh giá và quy trình chọn mẫu. Đặc biệt, chương II cung cấp cho người đọc bộ dữ liệu cũng như các lý thuyết cơ bản nhất để đánh giá các câu hỏi có nguy cơ bị thiên lệch của PISA. Chương III sẽ đưa ra các kết quả phân tích về chỉ số DIF theo các nhóm yếu tố: giới tính, vị trí địa lý, vùng miền và loại hình trường. Nhằm xác định yếu tố nào có tác động gây nên lỗi thiên lệch cho câu hỏi thi PISA tại Việt Nam.

Một phần của tài liệu Nghiên Cứu Một Số Yếu Tố Gây Ra Lỗi Thiên Lệch (Bias) Trong Câu Hỏi Thi PISA 2012 - Lĩnh Vực Toán Học (Trang 54 - 57)

Tải bản đầy đủ (PDF)

(127 trang)