truyền thống
Để đo thành tích học tập tƣơng đối của HS cần phải xác định sự khác biệt tƣơng đối về điểm của các bài trắc nghiệm sao cho có thể nhận thấy và so sánh đƣợc sự khác biệt thực sự này. Ngƣời ta mong muốn là phổ các điểm của HS phải trải càng rộng càng tốt. Với một dải biến đổi lớn về điểm số có thể khẳng định đƣợc rằng sự khác biệt thực sự là có thật. Vì thế vấn đề đặt ra là khi xây dựng bài trắc nghiệm làm thế nào để đạt đƣợc mục đích làm cho các điểm số phân tán ra. Một sự phân tán hoặc sự trải rộng điểm số phù hợp sẽ đạt đƣợc khi các câu hỏi có độ khó thích hợp và khả năng phân biệt cao. Các đặc điểm này của câu hỏi có thể xác định đƣợc thông qua việc phân tích câu hỏi [7],[31], [38], [45].
2.2.1.1. Độ khó của câu trắc nghiệm MCQ (FV hay p)
Theo lí thuyết trắc nghiệm truyền thống, độ khó đƣợc xác định dựa vào việc thử nghiệm câu hỏi trắc nghiệm trên các đối tƣợng phù hợp.
Độ khó của câu hỏi đƣợc tính bằng số HS trả lời đúng câu hỏi trên tổng số HS tham gia trả lời. Câu hỏi càng dễ, số ngƣời trả lời đúng càng nhiều. Công thức tính độ khó đƣợc biểu thị dƣới dạng bách phân: [7],[38], [45]
FV (p) =
Số học sinh trả lời đúng
x 100 % (2.1)
Tổng số học sinh
Khi soạn thảo xong một câu hoặc một đề trắc nghiệm, ngƣời soạn chỉ có thể ƣớc lƣợng độ khó của nó bằng cảm tính. Độ lớn của các đại lƣợng đó chỉ có thể tính đƣợc cụ thể bằng phƣơng pháp thống kê sau lần trắc nghiệm thử, dựa vào kết quả thu đƣợc từ các câu trả lời của thí sinh.
Việc sử dụng trị số FV (p) để đo độ khó là rất có ý nghĩa. Nó dùng cách đếm số ngƣời làm đúng câu hỏi để thay thế xác định độ khó theo các đặc tính nội tại của câu hỏi trắc nghiệm. Ngoài ra cách xác định này cũng cho ta một đại lƣợng chung phản ánh độ khó - dễ của các đề trắc nghiệm thuộc các lĩnh vực khoa học khác nhau. Các câu trắc nghiệm của một đề trắc nghiệm thƣờng phải có độ khó khác nhau.
Theo công thức tính độ khó nhƣ trên, rõ ràng FV (p) càng bé thì câu hỏi càng khó và ngƣợc lại. Vậy FV (p) có giá trị nhƣ thế nào thì câu hỏi có thể đƣợc xem là có độ khó trung bình? Muốn trả lời đƣợc câu hỏi này cần phải lƣu ý đến xác suất làm đúng câu hỏi bằng “đoán mò”. Giả sử, một câu trắc nghiệm có 5 phƣơng án chọn thì xác suất làm đúng câu trắc nghiệm do sự lựa chọn hú hoạ của một HS không biết gì là 20%. Khi đó, độ khó trung bình của câu trắc nghiệm 5 phƣơng án chọn phải nằm giữa 20% và 100%, tức là 60%. Nhƣ vậy, độ khó trung bình của một câu trắc nghiệm có n phƣơng án chọn là là (100% + 1/n) / 2. Khi chọn lựa các câu trắc nghiệm theo độ khó ngƣời ta thƣờng phải loại các câu quá khó (không ai làm đúng) hoặc quá dễ (ai cũng làm đúng). Một đề trắc nghiệm tốt là khi có nhiều câu hỏi ở độ khó trung bình [45].
Một cách đơn giản hơn, thang phân loại độ khó đƣợc quy ƣớc nhƣ sau:
- Câu dễ có FV từ 75 → 100%
- Câu khó trung bình có FV từ 30 → 75%
- Câu khó có FV từ 0 → 30%
Trong một bài trắc nghiệm, khi các điều kiện là nhƣ nhau, nếu nhiều câu trắc nghiệm có độ khó trung bình thì các điểm số sẽ có xu hƣớng phân tán cao, điều này có nghĩa là nhiều điểm số sẽ nằm ở giữa điểm mà bằng cách đoán mò ngẫu nhiên có thể đạt đƣợc điểm số cao nhất có thể có đƣợc. Còn nếu phần lớn câu hỏi là quá dễ hoặc quá khó thì các điểm số sẽ có xu hƣớng rất cao hay rất thấp và sẽ không rải đều ra, tức là độ phân tán thấp [7].
2.2.1.2. Độ phân biệt của câu trắc nghiệm MCQ (DI - Discrimination)
Mục đích sử dụng chỉ số độ phân biệt của câu hỏi là tìm đƣợc một số đo giá trị biểu hiện mối quan hệ giữa câu hỏi với một tiêu chí nào đó, có thể là điểm của bài thi, các mức đánh giá của GV…Đối với một bài trắc nghiệm để đo thành tích, mục tiêu đặt ra là các HS có điểm tổng số cao sẽ có thành tích cao và các HS có thành tích thấp sẽ có tổng số điểm thấp. Trong trƣờng hợp này, sự thành công của một câu hỏi trong việc phân biệt giữa hai nhóm HS đƣợc thể hiện bằng cách so sánh số HS có số điểm cao trả lời đúng câu hỏi với số HS có điểm số thấp cũng trả lời đúng câu hỏi đó [7],[38],[45].
Độ phân biệt tức là khả năng phân biệt đƣợc năng lực HS khá, giỏi với năng lực HS yếu, kém [38], [45]. Độ phân biệt có thể xác định dựa trên sự phân tích câu hỏi, trong đó các câu đƣợc sử dụng là câu trả lời của các HS thuộc hai nhóm: 27% của nhóm HS khá, giỏi và 27% của nhóm HS yếu, kém. (Việc phân loại căn cứ vào điểm tổng số của bài trắc nghiệm).
Công thức để tính độ phân biệt:
DI = Điểm của nhóm HS khá, giỏi ( 27%) - điểm của nhóm HS yếu kém (27%) (2.2)
Tổng số HS tham gia trắc nghiệm (27%)
Thang phân loại độ phân biệt đƣợc quy ƣớc nhƣ sau:
- Tỷ lệ HS nhóm học lực khá, giỏi và nhóm HS học lực kém trả lời đúng nhƣ nhau thì độ phân biệt là: Không ( 0 ).
- Tỷ lệ HS nhóm học lực khá, giỏi trả lời đúng nhiều hơn nhóm kém thì độ phân biệt là: Dƣơng
Độ phân biệt dƣơng có thể nằm trong khoảng 0 → 1
- Tỷ lệ HS nhóm học lực khá, giỏi trả lời không đúng nhiều hơn nhóm HS học lực kém thì độ phân biệt là: Âm
Nếu chỉ số DI ≥ 0,2 là đạt yêu cầu sử dụng với mục đích đánh giá thành quả học tập.
Những câu hỏi có DI bằng 0 hoặc Âm thì đều không đạt yêu cầu sử dụng. Với độ phân biệt dƣơng thấp (DI từ 0 → 0,2), việc sử dụng cần có sự điều chỉnh.
Một câu hỏi đƣợc xem là có độ phân biệt hoàn hảo nếu nói chung những HS đạt điểm cao của bài trắc nghiệm sẽ trả lời đúng, những HS đạt điểm thấp sẽ trả lời sai. Nhìn chung, việc sử dụng những câu hỏi có độ phân biệt dƣơng sẽ có xu hƣớng trải rộng dải điểm số của bài trắc nghiệm, còn khi dùng các câu hỏi không có độ phân biệt hoặc có độ phân biệt âm sẽ có xu hƣớng co hẹp dải điểm số [7],[38].
2.2.1.3. Mối quan hệ giữa độ khó và độ phân biệt
Hai đặc trƣng độ khó và độ phân biệt có mối quan hệ qua lại với nhau. Nếu xét một câu hỏi mà mọi HS đều làm đúng (độ khó là 100%) thì nó dẫn tới điều là câu hỏi này nhất thiết không thể phân biệt thành quả đạt đƣợc của nhóm HS khá, giỏi và nhóm HS dƣới trung bình. Tƣơng tự nhƣ vậy, một câu hỏi mà tất cả HS đều trả lời sai (độ khó của câu hỏi là 0%) thì độ phân biệt là bằng không. Khả năng phân biệt của câu hỏi sẽ tăng lên khi đi từ hai phía của thang độ khó cho đến khi đạt đƣợc một giá trị cực đại theo giả thiết là độ khó của câu hỏi bằng 100% [38].