Chia tổng số học sinh của lớp thành 3 nhóm: nhóm giỏi gồm 27% học sinh có điểm cao nhất, nhóm điểm thấp gồm 27% số học sinh có điểm thấp nhất, nhóm trung bình là nhóm còn lại
Khi nói đến độ khó, hiển nhiên phải xem câu trắc nghiệm khó đối với đối tượng nào. Nhờ việc thử nghiệm trên các đối tượng thí sinh phù hợp, người ta có thể đo độ khó bằng tỷ số phần trăm thí sinh làm đúng câu trắc nghiệm đó trên tổng số thí sinh dự thi.
Độ khó (K) =
T Đ
x100
Trong đó:
+ Đ là tổng số học sinh trả lời đúng trong cả hai nhóm.
+ T là tổng số học sinh trong hai nhóm.
+ Độ khó K có giá trị từ 0% (quá khó vì không học sinh nào làm được) đến 100% (quá dễ vì tất cả học sinh đều làm được).
Giá trị K càng lớn thì câu hỏi càng dễ:
+ 0% ≤ K ≤ 10% câu hỏi rất khó.
+ 10% ≤ K ≤ 30% là câu hỏi rất khó.
+ 30% ≤ K ≤ 70% là câu hỏi trung bình.
+ 70% ≤ K ≤ 90% là câu hỏi dễ.
+ 90% ≤ K ≤ 100% là câu hỏi rất dễ.
Như vậy:
+ Nếu K ≤ 10% hoặc K ≥ 90%: không nên dùng.
+ Nếu 10% ≤ K ≤ 30% hoặc 70% ≤ K ≤ 90%: dùng cẩn thận tùy theo đối tượng kiểm tra.
+ Nếu 30% ≤ K ≤ 70%: dùng tốt.
4.2. Độ phân biệt
Khi ra một câu hoặc một bài trắc nghiệm cho một nhóm thí sinh nào đó, người ta thường muốn phân biệt trong nhóm ấy những người có năng lực khác nhau: giỏi, trung bình, kém… khả năng của câu trắc nghiệm thực hiện được sự phân biệt ấy được gọi là độ phân biệt. Muốn cho câu trắc nghiệm có độ phân biệt thì phản ứng của nhóm thí sinh giỏi
và nhóm thí sinh kém đối với câu hỏi đó hiển nhiên là phải khác nhau. Ngừơi ta thống kê các phản ứng khác nhau đó để tính độ phân biệt.
Công thức tính độ phân biệt P là: P = T Đ ĐC T 5 , 0 Trong đó:
+ ĐC là số học sinh trong nhóm điểm cao trả lời đúng câu hỏi.
+ ĐT là số học sinh trong nhóm điểm thấp trả lời đúng câu hỏi.
+ T là tổng số học sinh trong hai nhóm.
Độ phân biệt có giá trị từ -1,00 (độ phân biệt ngược) đến 1,00 (phân biệt rất hoàn hảo). Giá trị P = 0 ứng với trường hợp câu hỏi không thể phân biệt được học sinh giỏi và học sinh kém.
+ Nếu P ≥ 0,3: dùng tốt
+ Nếu 0,22 ≤ P ≤ 0,3: sử dụng cẩn thận tùy theo đối tượng có thể chỉnh sữa câu này.
+ Nếu P ≤ 0,22: không nên sử dụng, có thể loại bỏ.
4.3. Tiêu chuẩn để chọn câu hỏi hay
+ Độ khó K: 30% ≤ K ≤ 70%
+ Độ phân biệt: P ≥ 0,3
Trong hai bài trắc nghiệm tương tự nhau, bài trắc nghiệm nào có chỉ số phân biệt trung bình cao hơn thì có độ tin cậy cao hơn.
Các quan điểm về độ khó và độ phân biệt của câu hỏi trắc nghiệm khách quan không thống nhất giữa các tài liệu, tuy nhiên sự sai khác là không đáng kể.
Cách tính độ khó, độ phân biệt như sau: Giả sử có 100 người trả lời bài TNKQ:
- Sắp xếp các bảng trả lời bài TNKQ theo thứ tự từ cao đến thấp
- Phân chia thành hai nhóm nhóm, nhóm điểm cao và nhóm điểm thấp. Trong mỗi nhóm lấy ra 27% học sinh có điểm cao nhất và thấp nhất.
- Ghi tần số các câu trả lời vào bảng thống kê.
Một câu nhiễu được xem là tốt nếu nó hấp dẫn được nhiều học sinh ở nhóm điểm thấp nhiều hơn ở nhóm điểm cao. Phân tích câu nhiễu dựa vào hai nguyên tắc:
Mỗi câu trả lời đúng phải có tương quan thuận với tiêu chí đã định tức là số học sinh trả đúng ở nhóm điểm cao phải nhiều hơn số học sinh trả lời đúng hơn trong nhóm điểm thấp.
Mỗi câu trả lời đúng phải có tương quan nghịch với tiêu chí đã định tức là số học sinh trả sai ở nhóm điểm cao phải ít hơn số học sinh trả lời đúng hơn trong nhóm điểm thấp.