Sử dụng phần mềm winsteps để phân tích câu hỏi bài thi tự luận

6 2 0
Sử dụng phần mềm winsteps để phân tích câu hỏi bài thi tự luận

Đang tải... (xem toàn văn)

Thông tin tài liệu

VJE Tạp chí Giáo dục, Số 488 (Kì 2 10/2020), tr 12 17 ISSN 2354 0753 12 SỬ DỤNG PHẦN MỀM WINSTEPS ĐỂ PHÂN TÍCH CÂU HỎI BÀI THI TỰ LUẬN Nguyễn Thị Ngọc Xuân1,+, Nguyễn Thành Chiến2 1Trường Đại học Trà[.]

VJE Tạp chí Giáo dục, Số 488 (Kì - 10/2020), tr 12-17 ISSN: 2354-0753 SỬ DỤNG PHẦN MỀM WINSTEPS ĐỂ PHÂN TÍCH CÂU HỎI BÀI THI TỰ LUẬN Trường Đại học Trà Vinh; 2Trường Đại học Quy Nhơn +Tác giả liên hệ ● Email: ngocxuan@tv.edu.vn Nguyễn Thị Ngọc Xuân1,+, Nguyễn Thành Chiến2 Article History Received: 25/8/2020 Accepted: 07/9/2020 Published: 20/10/2020 ABSTRACT The essay format plays an important role in evaluating a student's learning outcomes However, there are not many research projects using Winsteps software to analyze and evaluate the quality of essay test in order to detect errors, thereby promptly correct and supplement to improve the quality of exam questions This article presents the analysis results of the essay exam for the “object-oriented programming” module at Binh Dinh College with Winsteps software built on the basis of theoretical model of IRT (Item Response Theory) The analysis results with this software give us the specific, accurate, fast and intuitive numbers about exam characteristics, exam questions and competitor's competencies as well as the relationship between the factors This is in the form of text and graph This is one of the important bases for designing evaluation tool to have the basis to correct or eliminate unsatisfactory questions Keywords Winsteps software, analysis, tests, essay Mở đầu Hiện nay, chất lượng giáo dục trở thành mối quan tâm chung toàn xã hội, đặc biệt chất lượng giáo dục đại học bối cảnh đổi giáo dục theo hướng tiếp cận lực người học Một yêu cầu cấp thiết nhằm nâng cao chất lượng giáo dục đại học việc đổi phương pháp giảng dạy, có đổi phương pháp kiểm tra, đánh giá kết học tập cách toàn diện lực người học Có thể nói, việc kiểm tra, đánh giá hoạt động khơng thể thiếu q trình dạy học Thơng qua kiểm tra, đánh giá trình độ nhận thức, kĩ năng, kĩ xảo người học phát sai sót, lỗ hổng kiến thức…, từ giúp người dạy người học tự điều chỉnh hoạt động dạy học đạt chất lượng tốt Bên cạnh hình thức thi trắc nghiệm sở giáo dục áp dụng đạt số lợi ích định hình thức thi tự luận giữ vai trò quan trọng đánh giá kết học tập học sinh Tuy nhiên, nước ta chưa có nhiều cơng trình nghiên cứu sử dụng mềm Winsteps để phân tích đánh giá chất lượng đề thi tự luận (essay test) phần mềm chuyên dụng nhằm phát sai sót, từ kịp thời chỉnh sửa bổ sung nâng cao chất lượng đề thi Bài viết dựa mô hình lí thuyết hồi đáp IRT (Item Response Theory) sử dụng phần mềm Winsteps để phân tích câu hỏi thi tự luận học phần “lập trình hướng đối tượng” Trường Cao đẳng Bình Định Kết nghiên cứu 2.1 Lí thuyết hồi đáp Từ sau thập niên 70 kỉ XX đến nay, lí thuyết phân tích câu hỏi đại đời dựa mơ hình tốn học, địi hỏi nhiều tính tốn, nhờ tiến cơng nghệ tính tốn máy tính điện tử thập niên qua nên phát triển nhanh chóng đạt thành tựu quan trọng Cốt lõi lí thuyết khảo thí đại “Lí thuyết đáp ứng câu hỏi” (Item Response Theory - IRT) (Lâm Quang Thiệp, 2012) IRT dựa hai giả thuyết: (1) Sự đáp ứng thí sinh câu hỏi tiên đốn lực tiềm ẩn thí sinh; (2) Quan hệ đáp ứng câu hỏi thí sinh lực tiềm ẩn làm sở cho đáp ứng mơ tả hàm “Đặc trưng câu hỏi” đồng biến Để xây dựng mơ hình tốn diễn tả mối quan hệ phải xuất phát từ tiền đề Nhà toán học George Rasch (người Đan Mạch) xây dựng mơ hình hàm đặc trưng câu hỏi đơn giản đến sử dụng nhiều công nghệ đo lường giáo dục (Lâm Quang Thiệp, 2008) Thuyết đáp ứng câu hỏi Rasch mơ hình hóa mối quan hệ mức độ, khả người làm câu hỏi đáp ứng người với câu hỏi Mỗi câu hỏi mô tả thơng số (độ khó) kí hiệu  người làm câu hỏi mô tả thơng số (khả năng) kí hiệu  Mỗi người cố gắng trả lời câu hỏi, thơng số độ khó khả tác động lẫn xác suất đáp ứng người làm câu hỏi (Phạm Xuân Thanh, 2013) Dạng tốn học mơ hình là: 12 VJE Tạp chí Giáo dục, Số 488 (Kì - 10/2020), tr 12-17 P()  ISSN: 2354-0753 exp(   )  exp(   ) Trong đó, P() xác suất để thí sinh n có lực  trả lời ĐÚNG câu hỏi có độ khó  Xác suất trả lời câu hỏi biểu thị hàm số liên quan đến lực thí sinh  (thể hàm số logarit tự nhiên) Xác suất hàm P() - đường cong đặc trưng câu hỏi (Item Characteristic Curves - ICC) Hiện nay, với phát triển mạnh mẽ cơng nghệ thơng tin, ta dễ dàng tính lực  độ khó  phần mềm chuyên dụng Quest, Conquest, Winsteps… 2.2 Xử lí phần mềm Winsteps Winsteps phần mềm xử lí liệu chuyên dụng xây dựng môi trường hệ điều hành Windows, hỗ trợ nhiều ứng dụng mơ hình Rasch đặc biệt lĩnh vực đo lường đánh giá giáo dục, khảo sát thái độ (attitude surveys) phân tích thang đánh giá (rating scale analysis) (John, 2020) Winsteps xây dựng từ kết nghiên cứu “Rating Scale Analysis” (Phân tích thang đánh giá) tác giả Benjamin D Wright, Geofferey N Masters Trường Đại học Chicago năm 1982 Hiện nay, có nhiều nhà khoa học khắp giới sử dụng phần mềm Winsteps công cụ việc xử lí liệu nhiều lĩnh vực khác nhau: Tâm lí học đường (William, 2017), Y học lâm sàng (Velozo et al., 2009)… Winsteps đánh giá phần mềm sử dụng rộng rãi giao diện thân thiện người dùng tác giả phần mềm cung cấp hướng dẫn chi tiết, trợ giúp cho người sử dụng (William, 2016) Q trình xử lí liệu phần mềm Winsteps thực sau: sau thi xong, liệu thi 150 sinh viên nhập vào phần mềm SPSS xử lí số liệu thơ (mỗi dịng tương ứng với kết thí sinh, cột tương ứng với ý đề thi tự luận, đề thi gồm có câu chia thành 23 ý nhỏ) Tiếp theo đó, sử dụng phần mềm Winsteps phân tích chất lượng câu hỏi cho ta kết như: mức độ phù hợp câu hỏi với mơ hình Rasch, lực thí sinh so với độ khó câu hỏi, độ tin cậy đề thi; tham số đặc trưng cho câu hỏi như: độ khó, độ phân biệt, hệ số tương quan câu hỏi thi với toàn bài, độ tin cậy, sai số Dựa kết phân tích này, câu hỏi không đạt chất lượng (không phù hợp với mơ hình, tham số khơng đạt u cầu) rà soát điều chỉnh loại bỏ để góp phần nâng cao chất lượng câu hỏi 2.3 Phân tích câu hỏi 2.3.1 Phân tích mức độ phù hợp với mơ hình Khi liệu phù hợp với mơ hình Rasch trị số kì vọng bình phương trung bình (mean square) xấp xỉ độ lệch chuẩn (SD) xấp xỉ Qua kết thu được, ta có MNSQ INFIT=1.03, SD INFIT=0.27, MNSQ OUTFIT=1.01, SD OUTFIT=0.63 chứng tỏ kết tính tốn phù hợp với mơ hình Rasch 2.3.2 Độ tin cậy đề thi Kết tính tốn phần mềm Winsteps cho thấy độ tin cậy Cronbach Alpha (KR-20) đề thi 0.85 mối tương quan lực điểm thơ 0.96 Qua chứng tỏ đề thi có độ tin cậy cao kết đo phản ánh lực thật thí sinh PERSON RAW SCORE-TO-MEASURE CORRELATION = 96 CRONBACH ALPHA (KR-20) PERSON RAW SCORE “TEST” RELIABILITY = 85 2.3.3 Mức độ phù hợp câu hỏi với Trong q trình xử lí, Winsteps cịn tạo biểu đồ xử lí Item Fit, câu hỏi biểu thị dấu * Những câu hỏi nằm hai đường chấm thẳng đứng có giá trị trung bình bình phương độ phù hợp INFIT MNSQ nằm khoảng (0.77; 1.30) phù hợp với mơ hình Rasch Nếu câu hỏi khơng phù hợp loại bỏ Bảng Minh hoạ phù hợp số câu hỏi đề thi ITEM FIT GRAPH: MISFIT ORDER -| ENTRY | MEASURE | INFIT MEAN-SQUARE | OUTFIT MEAN-SQUARE | | | NUMBER| + |0 0.7 1.3 2|0 0.7 1.3 2| ITEM G | | -+ -+ -+ -+ | | 11| * | : : * |A : : *| Cau2a1 | | 12| *| : :* |B : : *| Cau2a2 | | 19| * | : :* |C : : * | Cau2b7 | | 1| * | : * : |D : :* | Cau1a1 | | 2| * | : * : |E : :* | Cau1a2 | | 3| * | : * : |F : :* | Cau1a3 | 13 VJE Tạp chí Giáo dục, Số 488 (Kì - 10/2020), tr 12-17 ISSN: 2354-0753 | 16| * | : *: |G : * : | Cau2b4 | | 15| * | : *: |H : * : | Cau2b3 | | 10| * | : * : |I : * : | Cau1b6 | | 4| * | : * : |J : * : | Cau1a4 | | 20| * | : * : |K * : | Cau3a | | 18| * | : * : |k : * : | Cau2b6 | | 5| * | : * : |j *: : | Cau1b1 | | 13| * | :* : |i * : | Cau2b1 | | 8| * | :* : |h * : : | Cau1b4 | | 7|* | :* : |g* : : | Cau1b3 | | 9| * | * : |f * : : | Cau1b5 | | 14| * | * : |e * : | Cau2b2 | | 23| *| * : |d * : : | Cau3d | | 17| * | * : |c * : : | Cau2b5 | | 22| * | * : |b * : : | Cau3c | | 21| * | * : |a * : : | Cau3b | Trong bảng trên, ta thấy có câu (gồm câu 11, 12, 19) biến ngoại lai, có số (INFIT MNSQ) nằm ngồi vùng cho phép, cần loại bỏ Còn câu khác đạt yêu cầu nằm khoảng chấp nhận mơ hình 2.3.4 Phân tích độ khó câu hỏi thi lực thí sinh Sơ đồ phân bố độ khó câu hỏi thi lực thí sinh cho thấy mức độ phù hợp đề thi thí sinh dự thi Theo kết phân tích ta có độ khó trung bình câu hỏi nhỏ nhiều so với lực trung bình thí sinh 1.85 chứng tỏ đề thi dễ so với nhóm thí sinh tham gia đánh giá Với đồ thị phân bố lực học sinh độ khó câu hỏi thi tạo từ phần mềm Winsteps cho ta thấy kết luận rõ ràng Bảng Phân bổ lực thí sinh độ khó câu hỏi thi (thang logistic) MEASURE PERSON - MAP - ITEM | XXXXXX + |T NĂNG LỰC CAO T| RẤT KHÓ | X | | XXXX | + Cau2a2 XXXX | XXX S| XXXX | Cau3d XXX | Kĩ xây dựng phương thức có thuật XXXXX | tốn phức tạp X | Cau3c XXX + Cau2b4 XXXX |S XX | Cau3b XXXXXXX M| XXX | Cau2b2 Cau2b3 Cau2b7 | XXXXX | Cau2b6 XXX + Cau3a XX | XX | XXX | Kĩ xây dựng phương thức X S| Cau2b5 xây dựng lớp (hướng đối tượng) XX | Cau2b1 | X +M 14 VJE Tạp chí Giáo dục, Số 488 (Kì - 10/2020), tr 12-17 ISSN: 2354-0753 | Cau1b6 | Cau2a1 XXX | X T| | | -1 + | Cau1b5 Kĩ khởi tạo lớp, đối tượng | Cau1b4 | XX | | |S -2 + | Cau1a4 | Cau1a1 Cau1a2 Cau1a3 Cau1b1 | -3 + | | Cau1b3 RẤT DỄ NĂNG LỰC THẤP | | | |T -4 + | Mỗi dấu x đại diện cho sinh viên =========================================================================== Bảng cho thấy, đề thi dễ với lực nhóm thí sinh tham gia thi này, cần bổ sung số câu khó để đánh giá thí sinh có lực cao ngưỡng lực 3, đề thi câu hỏi đánh giá mức Với kết phân tích câu hỏi trên, thấy câu hỏi đề thi phân thành nhóm chính: nhóm gồm câu hỏi dễ với ngưỡng thresholds -1 đánh giá kĩ khởi tạo lớp, đối tượng lập trình hướng đối tượng; nhóm gồm câu hỏi mức trung bình với ngưỡng thresholds từ -1 đến đánh giá kĩ xây dựng phương thức xây dựng lớp; nhóm gồm câu hỏi mức lực từ với ngưỡng thresholds từ trở lên đánh giá kĩ xây dựng phương thức có thuật tốn phức tạp Ngồi ra, hình dáng đường cong đặc trưng điểm cực đại đường cong thơng tin đề thi hình cho thấy đề thi dễ đánh giá xác lực thí sinh mức trung bình, Hình Đường cong đặc trưng đặc trưng thơng tin thi 15 VJE Tạp chí Giáo dục, Số 488 (Kì - 10/2020), tr 12-17 ISSN: 2354-0753 Đánh giá câu hỏi thi qua số số (bảng 3): Bảng Thông tin đặc trưng câu hỏi -|ENTRY DATA SCORE | DATA | AVERAGE S.E OUTF PTMEA| | |NUMBER CODE VALUE | COUNT % | ABILITY MEAN MNSQ CORR.| ITEM | | + + + -| | 18 0 | 21 28 | 50 22 -.61 |Cau2b6 | | 1 | 11 | 1.90 39 2.2 01 | | | 2 | 46 61 | 2.46 17 55 | | Qua kết thu từ số liệu phân tích bảng 3, cịn thu số thông tin quan trọng câu hỏi thi mức cho điểm (Score value), tỉ lệ trả lời (Data Count), lực trung bình trả lời câu hỏi (Average Ability), số SE MEAN, OUTF MNSQ, mối tương quan ý câu hỏi với điểm toàn Dựa vào số ta dự đốn hợp lí chất lượng câu hỏi tương ứng mức điểm Ví dụ: câu 2b6 cần xem xét lại mức có mối tương quan thấp số OUTFIT MNSQ vượt vùng (0,77:1.3) Đánh giá câu hỏi qua đồ thị (hình 2): Hình Biểu diễn mối tương quan xác suất trả lời câu hỏi ý 2b4 độ khó câu hỏi Biểu đồ hình cho thấy, câu 2b4 (số thứ tự 16) câu hỏi khó với mức điểm trả lời, thí sinh mức lực -1 làm tối đa mức 2, thí sinh có từ đến làm mức thí sinh có lực từ trở lên có xu hướng trả lời điểm tối đa câu hỏi Tuy nhiên, câu hỏi lại đánh giá tốt nhóm thí sinh có lực trung bình thể qua điểm cực đại đồ thị hình Hình Đường cong đặc trưng thơng tin câu hỏi 2b4 16 VJE Tạp chí Giáo dục, Số 488 (Kì - 10/2020), tr 12-17 ISSN: 2354-0753 2.4 Phân tích lực thí sinh Theo số liệu phân tích lực thí sinh nằm khoảng -1.55 đến 4.95 có thí sinh có mức lực cao ngang Năng lực trung bình nhóm thí sinh 1.85 với độ lệch chuẩn 1.39 chia thành nhóm tương ứng với mức lực phân tích Đề thi có thí sinh với outfit MNSQ vượt 1.3 46 thí sinh (chiếm 61%) với outfit MNSQ thấp 0.77, đề thi có nhiều thí sinh trả lời câu hỏi mà độ khó cao so với lực thật họ Bảng Thống kê thí sinh có câu trả lời khơng mong đợi MOST MISFITTING RESPONSE STRINGS PERSON OUTMNSQ |ITEM | 1111211112121 |753214891037085491632 high 40 43 9.90 A| 0000 .2 34 37 3.96 B| 0 12 12 3.95 C| 61 64 1.03 D| 0.0.2 Ngồi ra, phần mềm Winsteps phát câu trả lời không mong đợi (câu trả lời mong muốn người thiết kế câu hỏi) từ phía thí sinh biểu diễn cách rõ ràng Như kết bảng cho thấy, thí sinh có số thứ tự (STT) 40 có đến câu trả lời khơng mong đợi, thí sinh STT 34 có câu trả lời khơng mong đợi, thí sinh STT 34 12 có câu trả lời sai với nội dung câu hỏi Kết luận Như vậy, nhờ có hỗ trợ phần mềm chuyên dụng WINSTEPS, phân tích đề thi cách nhanh chóng, tiện lợi có góc nhìn tồn diện kết đánh sau: chất lượng đề thi tương đối tốt, đề thi dễ so với nhóm thí sinh tham gia kiểm tra, đánh giá Độ tin cậy đề thi mức cao; nhiên, cần xem xét số câu đánh giá không so với lực thí sinh gây câu trả lời khơng mong đợi Bằng cách thức phân tích kết số liệu kết hợp với việc sử dụng biểu đồ trực quan xem phương pháp đại khơng giúp ta phân tích, chọn lọc câu hỏi đạt yêu cầu đưa vào ngân hàng đề thi mà hỗ trợ cho giảng viên chẩn đốn thăm dị ngun nhân sai sót câu hỏi chất lượng từ có biện pháp điều chỉnh, bổ sung cho phù hợp cho đợt kiểm tra Tài liệu tham khảo David Andrich (1998) Rasch models for measurement - SAGE Publication, USA Dương Thiệu Tống (2005) Trắc nghiệm đo lường thành học tập (phương pháp thực hành) NXB Khoa học xã hội Griffin, P (1998) An Introduction to the Rasch Model (Draft) Melbourne: Assessment Research Center Melbourne University, Vic Griffin, P (2000) Program Development and Evaluation Assessment Research Centre, the University of Melbourne John M.Linacre (2020) A User’s Guide to Winteps Ministep Rasch Model Computer Programs Chicago Lâm Quang Thiệp (2008) Trắc nghiệm Ứng dụng NXB Khoa học Kĩ thuật Lâm Quang Thiệp (2012) Đo lường đánh giá hoạt động học tập nhà trường NXB Đại học Sư phạm Nguyễn Thị Ngọc Xuân (2014) Sử dụng phần mềm Quest/ConQuest phân tích câu hỏi trắc nghiệp khách quan Tạp chí Khoa học, Trường Đại học Trà Vinh, số tháng 9, tr 24-27 Phạm Xuân Thanh (2013) Bài giảng mơn Mơ hình Rasch Phân tích liệu phần mềm QUEST Hà Nội Velozo CA, Ying Wang, Leigh Lehman, Jia-Hwa Wang (2009) Utilizing Rasch measurement models to develop a computer adaptive self-report of walking, climbing, and running Disability and Rehabilitation DOI: https://doi.org/10.1080/09638280701617317 William J Boone (2016) Rasch Analysis for Instrument Development: Why, When, and How? CBE: Life Sciences Education DOI: https://doi.org/10.1187/cbe.16-04-0148 William J Boone, Amity Noltemeyer (2017) Rasch analysis: A primer for school psychology researchers and practitioners Cogent Education DOI: https://doi.org/10.1080/2331186X.2017.1416898 17 ... phần mềm SPSS xử lí số liệu thơ (mỗi dịng tương ứng với kết thí sinh, cột tương ứng với ý đề thi tự luận, đề thi gồm có câu chia thành 23 ý nhỏ) Tiếp theo đó, sử dụng phần mềm Winsteps phân tích. .. đề thi dễ với lực nhóm thí sinh tham gia thi này, cần bổ sung số câu khó để đánh giá thí sinh có lực cao ngưỡng lực 3, đề thi cịn câu hỏi đánh giá mức Với kết phân tích câu hỏi trên, thấy câu hỏi. .. đề thi dễ so với nhóm thí sinh tham gia đánh giá Với đồ thị phân bố lực học sinh độ khó câu hỏi thi tạo từ phần mềm Winsteps cho ta thấy kết luận rõ ràng Bảng Phân bổ lực thí sinh độ khó câu hỏi

Ngày đăng: 28/02/2023, 20:38

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan