- Có thể sử dụng công nghệ hiện đại vào chấm thi đồng loạt.
1.4.2.4. tin cậy của Bài trắc nghiệm
Độ tin cậy thờng đợc định nghĩa: Nh là mức độ chính xác của phép đo, tức là bài TN tốt phải đo đợc cái cần đo ở mức độ chắc chắn và chính xác
nhất có thể đợc.
Theo Quentin Stodola và Kalmer Stordahl thì: "Về mặt lý thuyết, độ tin cậy có thể đợc xem nh là một số đo về sự sai khác giữa điểm số quan sát và điểm số thực" [25, tr. 153].
Điểm số quan sát đợc là điểm số mà trên thực tế học sinh có đợc, còn điểm số thực là điểm số lý thuyết mà học sinh đó phải có nếu không mắc những sai số trong đo lờng (sai số từ bên trong: từ bản thân bài TN, động lực của học sinh, và sai số từ bên ngoài: điều kiện tiến hành TN, việc quản lý và tổ chức thi TN )…
Theo tác giả Dơng Thiệu Tống thì: "Một bài trắc nghiệm đợc xem là đáng tin cậy khi nó cho ra những kết quả có tính vững chắc, ổn định. Điều này có nghĩa là, nếu làm bài trắc nghiệm ấy nhiều lần mỗi học sinh vẫn sẽ giữ đợc thứ hạng tơng đối của mình trong trong nhóm" [39, tr. 43].
Trong giáo dục, việc lặp đi lặp lại các phép đo trên cùng một bài TN đối với một học sinh cụ thể là khó thực hiện.
Một cách tiếp cận đợc lựa chọn là phải xem xét sự tơng quan giữa các điểm số đạt đợc bởi một số lớn học sinh với các điểm số của họ thu đợc từ bài TN "song song" hoặc "tơng đơng". Từ đó tác giả Patrick Grifin cho rằng: "Hệ số độ tin cậy đối với một bộ điểm số của một nhóm thí sinh là hệ số tơng quan giữa bộ điểm số đó với một bộ điểm số khác của một bài trắc nghiệm tơng đ- ơng thu đợc một cách độc lập từ các thành viên của cùng một nhóm thí sinh đó" [26, tr. 71].
Trong thực nghiệm, để ớc tính độ tin cậy của một bài TN ngời ta thờng sử dụng các công thức sau:
*) Công thức Kuder – Richardson (KR20):
− − = ∑ 2 S q . p 1 1 k k R Trong đó: k - Là số lợng câu TN
p - Là tỷ lệ những câu trả lời đúng đối với một câu hỏi riêng biệt q - Là tỷ lệ những câu trả lời sai đối với một câu hỏi riêng biệt S - Là độ sai lệch chuẩn của điểm số bài TN
*) Công thức KR21.
Khi mức độ khó của các câu hỏi bằng nhau ngời ta dùng công thức − − − = 2 2 S k M M 1 1 k k R Trong đó: k - Là số lợng câu TN
M - Là điểm trung bình của bài TN
S - Là độ sai lệch chuẩn của điểm số bài TN *) Công thức Spearman – Brown
Nếu chiều dài của bài TN tăng lên k lần sẽ làm tăng độ tin cậy ban đầu lên thành Rk theo công thức:
Rk 1 (kkR1)R
−+ + =
- Bài TN càng thuần nhất thì độ tin cậy càng cao. Một bài TN đợc coi là thuần nhất nếu phần lớn các câu hỏi trong bài có độ khó trung bình.
- Nên chú ý rằng khi cố gắng làm tăng thêm tính thuần nhất rất dễ dẫn đến nguy cơ thu hẹp nội dung đánh giá, khi đó sẽ làm giảm độ giá trị của bài TN.
- Độ tin cậy của bài TN có mục đích khác nhau sẽ là khác nhau. Chẳng hạn, bài TN về thành quả tối thiểu hay thành quả tối đa có độ tin cậy khác với bài TN phân loại hay chẩn đoán.
*) Mối liên hệ giữa độ giá trị và độ tin cậy.
Ta hiểu độ giá trị thông thờng phản ánh mức độ mà một bài TN đo đợc cái mà nó định đo, còn độ tin cậy phản ánh sự chính xác của phép đo.
Mặc dù vậy hai đại lợng này luôn có liên quan với nhau:
- Độ giá trị đòi hỏi có độ tin cậy: Để có giá trị một bài TN phải là tơng đối tin cậy.
- Độ tin cậy không đảm bảo cho độ giá trị, có thể có một bài TN có độ tin cậy hoàn hảo nhng lại có độ giá trị rất thấp.
Nh vậy, sự ớc lợng các đại lợng về độ giá trị và độ tin cậy thờng đợc nêu ra nh là các hệ số tơng quan. Ta phải xem xét không chỉ các phơng pháp đã làm để thu đợc các giá trị này mà cả thành phần cấu tạo của tập hợp mẫu các học sinh đã đợc TN, cũng nh các đặc điểm thống kê của bài TN.
Khi ĐG độ giá trị thì sự phân tích về nội dung thờng quan trọng hơn là các con số thống kê. Khi ĐG độ tin cậy thì nên xem xét đến sai số chuẩn của phép đo. Cần phải tiến tới sự phù hợp về độ tin cậy và độ giá trị trong việc ĐG và tuyển chọn các bài TN.