Hai đại lợng quan trọng thờng đợc dựa vào để đánh giá một bài TN là độ tin cậy và độ giá trị.
Ngời ta thờng sử dụng hệ số tơng quan để diễn tả các đại lợng trên. Bài TN này chúng ta thu đợc r = 0,96 chứng tỏ rằng bài kiểm tra này có độ tin cậy khá tốt. Ngoài ra chúng ta còn phải kể đến các thành phần cấu tạo của các mẫu đợc chọn khi tính toán thống kê nh mẫu TS hoặc bài TN.
Đối với bài TN này ta sẽ xét từng thành phần. Trớc hết là nội dung bài TN, qua chơng trình QUEST ta có kết quả sau:
Trung bình (mean): 0,00 Độ lệch chuẩn (SD): 1,35 Độ tin cậy : 0,96
Nh vậy độ khó trung bình của bài TN này là 0,00 với độ lệch chuẩn là 1,35. Các số thống kê hoà hợp là:
Infit mean square: 0,99 Outfit mean square: 1,00 SD : 0,08 SD : 0,14 Infit t : 0,03 Outfit t : 0,08 Tiếp theo ta xét đến các số liệu của mẫu:
Mean -0,33 SD 0,55 Các thông số hoà hợp với mô hình Rasch:
Infit mean square : 1,01 Outfit mean square : 1,00 SD : 0,25 SD : 0,40 Infit t : -0,01 Outfit t : 0,01
Trị số kì vọng của các bình phơng trung bình (mean square) xấp xỉ bằng 1 và trị số kì vọng của t xấp xỉ bằng 0 (trích theo 3, tr 133). Các số thông kê hoà hợp trên đây cho thấy rằng các điều kiện ấy đã đợc thoả mãn.
Từ đồ thị “Item Fit Map” (xem mục lục) cho ta thấy rằng tất cả 29 câu trắc nghiệm trong bài đều hoà hợp với mô hình Rasch. Nhng theo đồ thị “Case Fit Map” (xem mục lục) thì không phải tất cả các thí sinh tham dự đều hoà hợp với mô hình Rasch. Nói chung các thông số về mẫu và câu trắc nghiệm đều hoà hợp với mô hình Rasch.
Đối với TS 01 ta có: Năng lực (ability) : 1,21 Fit : 1,62 Điểm thô (Score) :73,08
Nh vậy thí sinh này có năng lực rất cao nhng có những câu không vợt quá khả năng mà vẫn sai nh câu4, 15, 17, 19, 24, 27, 28. Nguyên nhân có thể do khi học bài không kỹ, không chú ý khi cô giáo giảng bài nên không tiếp thu đợc đầy đủ thông tin hoặc nhìn bài bạn. TS này không phù hợp với mô hình Rasch.
Đối với TS 74 ta có: Năng lực (ability) : -0,33 Fit : 0,87 Điểm thô (Score) :44,44
Đây là một TS hoà hợp với mô hình Rasch. Các câu 19, 20 là những câu dói năng lực nhng vẫn không làm đợc là có thể vì câu hỏi cha rõ ràng, phơng án trả lời cha thoả mãn với ý của TS hoặc nhìn bài bạn.
Nhìn vào bảng phân bố giữa năng lc- câu hỏi (Item estimates) ta thấy mức năng lực của TS cha đợc cao (r = 0.27), và sự phân bố câu hỏi là tốt (bài TN có tính ổn định cao r =0.96). Độ ổn định về mức năng lực của học sinh cha đợc cao vì TS ở lớp này có học lực không đồng đều giữa các lớp (lớp 11H2 học lực rất kém so với 11E1, 11G1), HS còn bỡ ngỡ với hình thức kiểm tra này.
Trên đây là một số phân tích về câu, mẫu và TS của bài TNKQ đối với HS khối 11(E1, G1, H2) tại trờng PTTH Hai Bà Trng Hà Nội. Qua kiểm tra và phân tích kết quả tôi xin đa ra một số ý kiến riêng của bản thân nh sau:
1) TNKQ thực sự là một phơng pháp khoa học và có hiệu quả thiết thực trong việc đo lờng thành quả của HS. Nó cho ta con số khá chính xác về năng lực của HS, về độ khó và độ phân cách của câu TN, về độ tin cậy của bài TN… Từ đó ta có thể định cỡ câu TN và mẫu TS để đánh giá thành quả học tập.
2) Với TNKQ ta hoàn toàn có thể kiểm tra đợc toàn bộ nội dung môn học, hạn chế đợc may rủi, đỡ tốn công chấm bài và hoàn toàn khách quan trong thi cử…
3) Phơng pháp này rất tốn thời gian để soạn đề nhng nếu có sự hiểu biết sâu sắc về lĩnh vực này (đặc biệt là các phần mềm để úng dụng) thì sẽ khắc phục đ ợc
điểm yếu này. Mỗi phơng pháp TN đều có u nhợc điểm riêng của nó, không có một phơng pháp nào đợc coi là hoàn hảo mà chỉ có cách phối hợp hiệu quả các phơng pháp để tạo nên hình thức đánh giá hoàn hảo. Hiện nay hầu hết các thầy cô ở phổ thông đều cho rằng TNKQ có rất nhiều nhợc điểm và không thích dùng nó để đánh gía HS. Để phổ biến rộng rãi phơng pháp TNKQ thì phải có nhiều tài liệu và hình thức giảng dạy để GV thấy đợc những u nhợc điểm của phơng pháp này mà ứng dụng linh hoạt vào công việc dạy học của mình.
Tài liệu tham khảo
1. Ph.d. Nguyễn Phụng Hoàng (chủ biên), 1996, Phơng pháp trắc nghiệm trong kiểm tra và đánh giá thành quả học tập, Nhà xuất bản GD.
2. TSKHGD. dơng thiệu tống, 1995, Trắc nghiệm và đo lờng thành quả học tập, Bộ giáo dục và đào tạo trờng ĐH tổng hợp TPHCM.
3. TSKHGD. Dơng thiệu tống, 1998, Trắc nghiệm tiêu chí,Nhà xuất bản GD.
4. Bộ giáo dục và đào tạo , 1994, Những cơ sở của kĩ thuật Trắc Nghiệm, Hà Nội.
5. GS.TSKH. Lâm quang thiệp, 2003, Đo lờng và đánh giá trong giáo dục, Hà Nội.
Mục lục
Mở ĐầU...3
Chơng 1: CƠ Sở Lí LUậN...7
1.1 LịCHSệNHữNGPHéP đOLấNGVΜTRắCNGHIệM...7 1.1.1 Trên thế giới...7 1.1.2. ở nớc ta...8 1.2. CáCKHáINIệM...9 1.2.1. Trắc nghiệm là gì?...9 1.2.2. Trắc nghiệm khách quan là gì?...13
1.2.3. Các tiêu chuẩn để đánh giá các câu TN và bài thi TNKQ...25
1.2.4. Lý thuyết ứng đáp câu hỏi và mô hình Rasch...41
Chơng 2: Lập dàn bài trắc nghiệm...48
2.1. MễC đíCHCẹABΜI TN...48
2.2. PHâNTíCHNẫIDUNGMôNHÄC...48
2.3.THIếTLậPDΜNBΜI TN...49
2.4 QUá TRìNHTHÙCHIệN...50
CHƯƠNG 3: PHÂN Tích kết quả...51
3.1. PHâNTíCHBΜITN...51
3.1.1. Phân tích câu TN ...51
3.1.2. Phân tích bài TN...54