ĐẠI HỌC QUỐC GIA HÀ NỘI VIỆN ĐẢM BẢO CHẤT LƯỢNG GIÁO DỤC TIỂU LUẬN XÂY DỰNG VÀ PHÂN TÍCH ĐỀ KIỂM TRA NỘI DUNG ĐỘ TIN CẬY TRONG ĐÁNH GIÁ THEO NHÓM CHUẨN Học Viên: Đặng Trần Cường Chuyê
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI VIỆN ĐẢM BẢO CHẤT LƯỢNG GIÁO DỤC
TIỂU LUẬN
XÂY DỰNG VÀ PHÂN TÍCH ĐỀ KIỂM TRA NỘI DUNG ĐỘ TIN CẬY TRONG ĐÁNH GIÁ THEO NHÓM CHUẨN
Học Viên: Đặng Trần Cường
Chuyên ngành: Đo lường & Đánh giá
trong giáo dục
Khóa: 2013-2015
HÀ NỘI, THÁNG 8 NĂM 2014
Trang 21 Câu hỏi nhiều lựa chọn
1.1 Mục tiêu đo lường/kiểm tra
- Loại hình kết quả học tập: kiến thức
- Nội dung kiểm tra: nội hàm thuật ngữ, khái niệm
1.2 Mô tả chung
Câu hỏi có nội dung thuộc chương 8 của giáo trình Nội dung các câu hỏi tập trung vào kiểm tra sinh viên nhớ và hiểu các thuật ngữ, khái niệm của bài học Sinh viên khoanh tròn 1 đáp án đúng trong số 4 phương án trả lời
1.3 Câu hỏi mẫu
* Các chỉ dẫn:Đọc câu hỏi sau đây và khoanh vào một đáp án đúng duy nhất/hoặc hợp lý nhất
1 Trong kiểm tra đánh giá theo nhóm chuẩn , phương pháp test-retest dùng để.
A Đánh giá sự nhất quán
B Đánh giá độ sai khác
C Đánh giá độ lệch chuẩn
D Đánh giá độ tin cậy ổn định
1.4 Các thuộc tính kích thích
Câu dẫn: Là một câu hỏi về nội dung bài học xoay quanh kiến thức về khái niệm, các thuật ngữ liên quan liên quan đến các phương pháp kiểm tra đánh giá
Trang 3Có thể sử dụng thuật ngữ tiếng Anh trong trường hợp chưa có cách dịch thống nhất về thuật ngữ đó.
Nội dung câu hỏi dẫn có thể trích từ trong giáo trình chính hoặc từ các tài liệu chính thống khác, song phải đảm bảo kiến thức phù hợp.
1.5 Các thuộc tính của câu trả lời
Thí sinh sẽ trả lời bằng cách chọn một đáp án đúng hoặc hợp lý nhất Các phương án trả lời còn lại là các phương án nhiễu là
những phương án có nội dung tương tự hoặc trái ngược hoặc
không liên quan đến nội dung câu hỏi, được đưa vào để loại trừ khả năng đoán mò câu trả lời của sinh viên
ĐỀ KIỂM TRA GIỮA KỲ (10 /110 Câu) Môn: Cơ sở khoa học và thiết kế các loại hình kiểm tra đánh giá
Thời gian làm bài: 110 phút Họ và tên:
Lớp:
Chú ý: - Thí sinh không được phép sử dụng tài liệu
- Đề thi gồm có 110 câu
- Khuyên tròn vào 1 đáp án đúng nhất
Trang 41 Trong kiểm tra đánh giá theo nhóm chuẩn , phương pháp test-retest dùng để.
A Đánh giá sự nhất quán
B Đánh giá độ sai khác
C Đánh giá độ lệch chuẩn
D Đánh giá độ tin cậy ổn định
2 Trong các giá trị sau đây về độ tin cậy của 1 bài kiểm tra đánh giá theo nhóm chuẩn, giá trị nào trong các giá trị sau đây cho thấy bài kiểm tra này đáng tin cậy hơn :
A -1
B -0.8
C 0.50
D 0.8
3 Nếu như sai số của bài kiểm tra là “0” thì độ tin cậy của bài kiểm tra sẽ là :
A 0
B 1
C -1
D 0.5
4 Sử dụng phương pháp phân đôi để đánh giá độ tin cậy , hệ số tin cậy cho một nửa bài kiểm tra đã được tính toán , để đánh giá độ tin cậy cho cả bài, người ta dùng :
A Công thức Kuder – Richardson -20
B Công thức Kuder – Richardson -21
Trang 5C Công thức Spearman - Brown
D Hệ số Cronbach alpha
5 Độ tin cậy của bài kiểm tra theo nhóm chuẩn sẽ tăng nếu:
A Các câu hỏi khó hơn
B Các câu hỏi không giống nhau
C Có ít câu hỏi hơn
D Có nhiều câu hỏi hơn
6 Sai số chuẩn càng nhỏ có nghĩa là:
A Độ khó của câu hỏi lớn
B Độ phân biệt câu hỏi thấp
C Bài kiểm tra ngắn
D Độ tin cậy của bài kiểm tra cao
7 Giá trị lớn nhất của sai số chuẩn là
A 1
B 0.50
C 0.25
D 0.95
8 Hệ số của độ tin cậy nằm trong khoảng
A từ 0 đến 1
B từ -1 đến 1
C bất kì số dương nào
Trang 6D từ -1 đến 0
9 Một bài kiểm tra theo nhóm chuẩn gồm 40 câu có độ tin cậy
là 0.70 Nếu nó gồm 80 câu thì độ tin cậy sẽ là
A 0.88
B 0.92
C 0.50
D 0.82
10 Sai số chuẩn của phép đo tăng thì độ tin cậy của bài kiểm tra theo nhóm chuẩn sẽ
A tăng
B giảm
C không thay đổi
D Cùng tang hoặc giảm
ĐÁP ÁN
1 D
2 D
3 B
4 C
5 D
Trang 76 D
7 B
8 A
9 D
10 B
Trang 8KẾT QUẢ KIỂM THỬ
Kết quả kiểm thử trên 12 học viên khóa đo lường 10 câu hỏi TNKQ cho thấy :
Độ tin cậy : bài thi có độ tin cậy thấp ( 0.47 )
N 12
Mean 5.25
Standard Deviation 2.42
Variance 5.84
Skewness -0.39
Kurtosis 0.15
Standard error of mean 0.70
Bảng phân bố năng lực thí sinh và độ khó câu hỏi :
MAP OF LATENT DISTRIBUTIONS AND THRESHOLDS
================================================================================
Generalised-Item Thresholds
Trang 9|
8 |
|
|
7 |
|
|
|
6 |
X| |
XXX| 5 |
X| X| 4 X| X| |
|
3 XXXX| |7
|
2 X| XXX| XXXX| X|8 1 XXX| XXXX|9 XXX| XXXX|2 4 0 XXXXXX| XXXXXXXXX| XXXX| -1 XXXXXX|1 XXXXXXXXXX| XXXXXX| XXXX| -2 X| |
XXX|5 6 -3 |
|
|3
|
-4 |
Trang 10|
|
|
-5 X| |
X| -6 |
|
|
|
-7 |
|
XXX| -8 |
|
Each 'X' represents 0.0 cases The labels for thresholds show the levels of item, and category, respectivelyPhân tích câu hỏi thi : ================================================================================= ConQuest: Generalised Item Response Modelling Software Thu Sep 04 10:13 2014 GENERALISED ITEM ANALYSIS ================================================================================= Item 1
-item:1 (1)
Cases for this item 11 Discrimination 0.71 Item Threshold(s): -1.23 Weighted MNSQ 0.75 Item Delta(s): -1.23
Label Score Count % of tot Pt Bis t (p) PV1Avg:1 PV1 SD:1
1 0.00 2 18.18 -0.27 -0.85(BIG_) -0.90 0.79
2 0 0.00 NA NA (.000) NA NA
3 0 0.00 NA NA (.000) NA NA
4 1.00 8 72.73 0.71 3.01(.015) 0.70 1.65
9 0.00 1 9.09 -0.73 -3.22(.011) -4.37 0.00
==============================================================================
Item 2
Trang 11-item:2 (2) Cases for this item 11 Discrimination 0.49
Item Threshold(s): 0.01 Weighted MNSQ 1.63
Item Delta(s): 0.01
Label Score Count % of tot Pt Bis t (p) PV1Avg:1 PV1 SD:1
1 0 0.00 NA NA (.000) NA NA
2 0 0.00 NA NA (.000) NA NA
3 0.00 4 36.36 -0.07 -0.22(BIG_) -0.41 0.85
4 1.00 6 54.55 0.49 1.70(BIG_) 0.91 1.87
9 0.00 1 9.09 -0.73 -3.22(.011) -4.37 0.00
============================================================================== Item 3
-item:3 (3) Cases for this item 11 Discrimination 0.73
Item Threshold(s): -3.41 Weighted MNSQ 0.67
Item Delta(s): -3.41
Label Score Count % of tot Pt Bis t (p) PV1Avg:1 PV1 SD:1
1 0 0.00 NA NA (.000) NA NA
2 1.00 10 90.91 0.73 3.22(.011) 0.38 1.63
3 0 0.00 NA NA (.000) NA NA
4 0 0.00 NA NA (.000) NA NA
9 0.00 1 9.09 -0.73 -3.22(.011) -4.37 0.00
==============================================================================
Item 4
-item:4 (4) Cases for this item 12 Discrimination 0.66
Item Threshold(s): 0.61 Weighted MNSQ 0.86
Item Delta(s): 0.61
Label Score Count % of tot Pt Bis t (p) PV1Avg:1 PV1 SD:1
1 0 0.00 NA NA (.000) NA NA
Trang 122 0.00 4 33.33 -0.38 -1.31(BIG_) -1.13 0.52
3 1.00 5 41.67 0.66 2.79(.019) 1.45 1.59
4 0.00 2 16.67 0.06 0.19(BIG_) -0.16 0.82
9 0.00 1 8.33 -0.61 -2.42(.036) -4.37 0.00
============================================================================== Item 5
-item:5 (5) Cases for this item 12 Discrimination 0.79
Item Threshold(s): -2.55 Weighted MNSQ 0.65
Item Delta(s): -2.56
Label Score Count % of tot Pt Bis t (p) PV1Avg:1 PV1 SD:1
1 0 0.00 NA NA (.000) NA NA
2 0 0.00 NA NA (.000) NA NA
3 0 0.00 NA NA (.000) NA NA
4 1.00 10 83.33 0.79 4.04(.002) 0.38 1.63
9 0.00 2 16.67 -0.79 -4.04(.002) -2.91 2.07
============================================================================== Item 6
-item:6 (6) Cases for this item 12 Discrimination 0.79
Item Threshold(s): -2.55 Weighted MNSQ 0.65
Item Delta(s): -2.56
Label Score Count % of tot Pt Bis t (p) PV1Avg:1 PV1 SD:1
1 0 0.00 NA NA (.000) NA NA
2 0.00 1 8.33 -0.45 -1.61(BIG_) -1.45 0.00
3 0 0.00 NA NA (.000) NA NA
4 1.00 10 83.33 0.79 4.04(.002) 0.38 1.63
9 0.00 1 8.33 -0.61 -2.42(.036) -4.37 0.00
============================================================================== Item 7
-item:7 (7) Cases for this item 12 Discrimination 0.54
Item Threshold(s): 2.59 Weighted MNSQ 1.04
Item Delta(s): 2.59
Label Score Count % of tot Pt Bis t (p) PV1Avg:1 PV1 SD:1
1 0.00 7 58.33 0.28 0.93(BIG_) 0.26 1.54
Trang 132 1.00 2 16.67 0.54 2.04(.068) 1.74 1.57
3 0.00 1 8.33 -0.45 -1.61(BIG_) -1.45 0.00
4 0.00 1 8.33 -0.18 -0.56(BIG_) -1.45 0.00
9 0.00 1 8.33 -0.61 -2.42(.036) -4.37 0.00
============================================================================== Item 8
-item:8 (8) Cases for this item 12 Discrimination 0.67
Item Threshold(s): 1.18 Weighted MNSQ 0.68
Item Delta(s): 1.18
Label Score Count % of tot Pt Bis t (p) PV1Avg:1 PV1 SD:1
1 1.00 4 33.33 0.67 2.84(.018) 1.85 1.49
2 0.00 4 33.33 0.03 0.11(BIG_) -0.62 0.95
3 0.00 2 16.67 -0.10 -0.32(BIG_) -0.54 0.29
4 0.00 1 8.33 -0.45 -1.61(BIG_) -1.45 0.00
9 0.00 1 8.33 -0.61 -2.42(.036) -4.37 0.00
============================================================================== Item 9
-item:9 (9) Cases for this item 12 Discrimination 0.38
Item Threshold(s): 0.61 Weighted MNSQ 1.70
Item Delta(s): 0.61
Label Score Count % of tot Pt Bis t (p) PV1Avg:1 PV1 SD:1
1 0.00 3 25.00 0.15 0.47(BIG_) 0.27 0.55
2 0.00 1 8.33 -0.18 -0.56(BIG_) -1.45 0.00
3 0.00 1 8.33 -0.07 -0.21(BIG_) -0.74 0.00
4 1.00 5 41.67 0.38 1.32(BIG_) 1.01 2.07
9 0.00 2 16.67 -0.50 -1.83(.097) -2.82 2.20
============================================================================== Item 10
-item:10 (10) Cases for this item 12 Discrimination 0.59
Item Threshold(s): -0.47 Weighted MNSQ 1.36
Item Delta(s): -0.47
Label Score Count % of tot Pt Bis t (p) PV1Avg:1 PV1 SD:1
1 0.00 4 33.33 -0.26 -0.84(BIG_) -0.66 1.00
Trang 142 1.00 7 58.33 0.59 2.29(.045) 0.72 1.78
3 0 0.00 NA NA (.000) NA NA
4 0 0.00 NA NA (.000) NA NA
9 0.00 1 8.33 -0.61 -2.42(.036) -4.37 0.00
==============================================================================
Khuyến nghị liên quan đến câu hỏi thi :
Câu hỏi tốt để giữ lại : Câu 7 , Câu 8 , Câu 9
Câu hỏi cần thay đổi các phương án lựa chọn hoặc phải bỏ câu hỏi
đi trong trường hợp không thể tìm ra phương án lựa chọn bổ xung hợp lý
Câu 3, 5, 6 : Quá dễ, tỷ lệ làm đúng quá cao Cần phải loại bỏ khỏi bài thi.
Câu 1 : Cần tìm phương án nhiễu B, C thay thế do không có người chọn, cho thấy phương án nhiễu không hiệu quả
Câu 2 : Thay thế phương án nhiễu A, B thay thế do không có
người chọn
Câu 7 khá là khó Có thể đánh giá được học sinh giỏi và khá.
Câu 8 : Câu hỏi rất tốt Đề nghị giữ lại trong bài thi
Câu 9 : câu hỏi tốt
Câu 10 : Thay thế phương án nhiễu C và D