khó và độ phân biệt của câu hỏi trắc nghiệm MCQ- 123docz.net

+ Độ khó của câu hỏi.(Kí hiệu là FV hay p: p value)

Để đánh giá chất lượng của từng câu hỏi hay một đề thi TNKQ, người ra đề cần tiến hành phân tích câu hỏi để xác định độ khó và độ phân biệt của từng câu hỏi. Theo lý thuyết trắc nghiệm cổ điển, độ khó (k) của một câu hỏi

TNKQ được đo bằng tỉ số giữa số thí sinh trả lời đúng câu hỏi và số thí sinh

tham gia trả lời câu hỏi đó.

Độ khó (k) có thể tính được bằng phương pháp thống kê sau khi cho người học trắc nghiệm thử đề TNKQ. Cách xác định này cho biết được số người làm đúng câu hỏi, có thể thay thế cách xác định độ khó theo đặc tính nội tại của câu hỏi TNKQ.

Một câu hỏi TNKQ có 4 phương án lựa chọn, xác suất trả lời đúng câu hỏi của thí sinh không biết gì là 25%, độ khó trung bình của câu hỏi là (100% + 25%)/2 = 62,5%. Những câu hỏi khó sẽ có k < 62,5% , những câu hỏi dễ có k > 62,5 % [22] ;[48].

Vậy theo lí thuyết trắc nghiệm, người ta xác định độ khó dựa vào việc thử nghiệm câu hỏi trắc nghiệm trên các đối tượng phù hợp. Công thức tính độ khó được biểu thị dưới dạng bách phân [36] ;[44] ;[47]:

Số học sinh trả lời đúng

FV (p) = --- X 100% (1) Tổng số học sinh

Khi soạn thảo xong một câu hoặc một đề trắc nghiệm, người soạn chỉ có thể ước lượng độ khó của nó bằng cảm tính. Độ lớn của các đại lượng đó chỉ có thể tính được cụ thể bằng phương pháp thống kê sau lần trắc nghiệm thử, dựa vào kết quả thu được từ các câu trả lời của thí sinh. Việc sử dụng trị số FV (p) để đo độ khó là rất có ý nghĩa. Nó dùng cách đếm số người làm đúng câu hỏi để thay thế xác định độ khó theo các đặc tính nội tại của câu hỏi trắc nghiệm. Ngoài ra cách xác định này cũng cho ta một đại lượng chung phản ánh độ khó - dễ của các đề trắc nghiệm thuộc các lĩnh vực khoa học khác nhau. Các câu hỏi của một đề trắc nghiệm thường phải có độ khó khác nhau. Theo công thức tính độ khó như trên, rõ ràng FV (p) càng bé thì câu hỏi càng khó và ngược lại. Vậy FV (p) có giá trị như thế nào thì câu hỏi có thể được xem là có độ khó trung bình? Muốn trả lời được câu hỏi này cần phải lưu ý đến xác suất làm đúng câu hỏi bằng “đoán mò”. Giả sử một câu hỏi trắc nghiệm có 4 phương án chọn thì xác suất làm đúng câu hỏi do sự lựa chọn hú hoạ của một HS không biết gì là 25%. Vậy độ khó trung bình của câu trắc nghiệm 4 phương án chọn phải nằm giữa 25% và 100%, tức 62,5%. Như vậy, độ khó trung bình của một câu trắc nghiệm có n phương án chọn là (100% + 1/n)/ 2. Khi chọn lựa các câu trắc nghiệm theo độ khó người ta thường phải loại các câu quá khó (không ai làm đúng) hoặc quá dễ (ai cũng làm đúng). Một đề trắc nghiệm tốt thường là khi có nhiều câu hỏi ở độ khó trung bình[44].

Đơn giản hơn, thang phân loại độ khó được quy ước như sau: - Câu dễ có từ 75 → 100% HS trả lời đúng.

- Câu khó trung bình có từ 30 → 75% HS trả lời đúng. - Câu khó có từ 0 → 30% HS trả lời đúng.

Trong một bài trắc nghiệm, khi các điều kiện là như nhau, nếu nhiều câu hỏi của bài trắc nghiệm là ở mức độ khó trung bình thì các điểm số sẽ có xu hướng phân tán, điều này có nghĩa là nhiều điểm số sẽ nằm ở giữa điểm mà bằng cách đoán mò ngẫu nhiên có thể đạt được điểm số cao nhất có thể có được. Còn nếu phần lớn câu hỏi là quá dễ hoặc quá khó thì các điểm số sẽ có xu hướng rất cao hay rất thấp và sẽ không rải đều ra, tức là độ phân tán thấp.

+ Độ phân biệt của câu hỏi (Kí hiệu là DI- Discrimination)

Độ phân biệt của câu hỏi TNKQ là khả năng phân biệt của câu hỏi về năng lực khác nhau của thí sinh: giỏi, trung bình, yếu... Hay là phân biệt được phản ứng của người giỏi và người kém khi trả lời câu hỏi TNKQ.

Một câu hỏi TNKQ có độ phân biệt cao (dương) khi được toàn thể thí sinh trong nhóm giỏi (có điểm thi cao) đều làm đúng và không có thí sinh trong nhóm yếu (có điểm thi thấp) trả lời đúng và ngược lại.

Độ phân biệt của một đề TNKQ liên quan đến độ khó của nó, nếu một đề TNKQ dễ đến mức mọi thí sinh đều làm đúng hay khó đến mức không thí sinh nào làm đúng thì độ phân biệt của đề thấp, vì mọi thí sinh đều có phản ứng như nhau đối với đề TNKQ đó. Do đó, một đề TNKQ có độ phân biệt tốt khi độ khó ở mức trung bình và các câu hỏi có độ phân biệt dương[5], [7].

Tóm lại độ phân biệt tức là khả năng phân biệt được năng lực HS khá, giỏi với năng lực HS kém[36]. Độ phân biệt có thể xác định dựa trên sự phân tích câu hỏi, trong đó các câu được sử dụng là câu trả lời của các HS thuộc hai nhóm: 27% của nhóm HS học lực khá, giỏi và 27% của nhóm HS học lực kém. (Việc phân loại thành hai nhóm như trên là căn cứ vào điểm tổng số của bài trắc nghiệm). Công thức để tính độ phân biệt như sau[47]:

DI= --- (2) Tổng số HS (27%)

Thang phân loại độ phân biệt được quy ước như sau:

- Tỷ lệ HS nhóm học lực khá, giỏi và nhóm HS học lực kém trả lời đúng như nhau thì độ phân biệt là: Không ( 0 ).

- Tỷ lệ HS nhóm học lực khá, giỏi trả lời đúng nhiều hơn nhóm kém thì độ phân biệt là: Dương

Độ phân biệt dương có thể nằm trong khoảng 0 → 1

- Tỷ lệ HS nhóm học lực khá, giỏi trả lời không đúng nhiều hơn nhóm HS học lực kém thì độ phân biệt là: Âm

Nếu chỉ số DI ≥ 0,2 là đạt yêu cầu sử dụng với mục đích đánh giá thành quả học tập.

Những câu hỏi có DI bằng 0 hoặc Âm thì đều không đạt yêu cầu sử dụng. Với độ phân biệt dương thấp (DI từ 0 → 0,2), việc sử dụng cần có sự điều chỉnh.

Một câu hỏi có độ phân biệt hoàn hảo nếu những HS đạt điểm cao của bài trắc nghiệm trả lời đúng, những HS đạt điểm thấp trả lời sai. Những câu hỏi có độ phân biệt dương sẽ có xu hướng trải rộng dải điểm số của bài trắc nghiệm, còn khi dùng các câu hỏi không có đ ộ phân biệt hoặc có độ phân biệt âm sẽ có xu hướng co hẹp dải điểm số[7];[36].

Độ khó và độ phân biệt có mối quan hệ qua lại với nhau. Nếu xét một câu hỏi mà mọi HS đều làm đúng 100% (câu dễ) điều đó có nghĩa là câu hỏi này không thể phân biệt được thành quả đạt được của nhóm HS khá, giỏi và nhóm HS dưới trung bình. Tương tự như vậy, một câu hỏi mà tất cả HS đều trả lời sai (câu khó) thì độ phân biệt là bằng

không. Khả năng phân biệt của câu hỏi sẽ tăng lên khi đi từ hai phía của thang độ khó cho đến khi đạt được một giá trị cực đại theo giả thiết là độ khó của câu hỏi bằng 50%. Tuy nhiên, nếu độ khó đạt tới 50% thì khó có thể đạt được độ phân biệt cực đại[36].

2.7. Phƣơng pháp kiểm định độ khó của câu trắc nghiệm MCQ

Để phù hợp với thực tế chúng tôi, vận dụng công thức (1) và (2) xây dựng công thức tính độ khó độ phân biệt của câu hỏi MCQ theo công thức:

Áp dụng công thức, thang phân loại độ khó được quy ước: - Câu dễ có FV từ 0→29%

- Câu trung bình có FV từ 30 →69% - Câu khó có FV từ 70→ 100%

Câu hỏi có độ khó dao động khoảng 30 → 70% là thích hợp. Trong phần thực nghiệm chúng tôi chọn mỗi bài trắc nghiệm là 30 câu hỏi, tương ứng với 10 yêu cầu kiểm định để ở 3 mức độ (ghi nhớ, hiểu biết và vận dụng).

2.8. Phƣơng pháp kiểm định độ phân biệt của câu trắc nghiệm MCQ

Xuất phát từ thực tế, phương pháp kiểm định độ phân biệt của câu hỏi MCQ đã thống kê được kết quả như sau: Nhóm khá giỏi có điểm 7,0 trở lên, nhóm trung bình có điểm từ 5,0 đến 6,5, nhóm yếu kém dưới 5 điểm.

Độ phân biệt tính như sau [47]:

DI=(Tỉ lệ % nhóm K-G trả lời đúng) – (Tỷ lệ% nhóm Y- Kém trả lời đúng) (2,

) + Nếu tỉ lệ HS hai nhóm trả lời đúng như nhau thì độ phân biệt bằng

Không (DI = 0%).

Số HS trả lời đúng Số HS làm bài

X 100% (1,)

+ Nếu tỉ lệ HS nhóm khá - giỏi trả lời đúng nhiều hơn nhóm yếu – kém thì độ phân biệt là Dương ( 0%< DI< 100%).

+ Nếu tỉ lệ HS nhóm khá - giỏi trả lời đúng nhiều ít nhóm yếu – kém thì độ phân biệt là Âm.

Những câu hỏi kiểm định có Dl = 0 hoặc Âm đều không đạt yêu cầu sử dụng nên có sự điều chỉnh.

Ví dụ kiểm định câu 1 (phụ lục 02) gồm 3 mức độ kiến thức 1.1 (kiến thức ghi nhớ), 1.2 (kiến thức hiểu biết), 1.3 (kiến thức vận dụng).

Câu 1.1. tARN vận chuyển axit amin mêtiônin ở sinh vật Eukaryota bổ sung với côdon là AUG anticôdon tương ứng là:

A. AUG. B. AXU. C.UAX . D. XAU

Câu 1.2. tARN vận chuyển axit amin mêtiônin ở sinh vật Eukaryotabổ sung với côdon mở đầu là 5,AUG3, anticôdon tương ứng là:

A. 5,AUG3, . B. 5,XAU 3, . C.5, UAX 3,. D. 3,XAU5,

Câu 1.3. tARN vận chuyển axit amin mêtiônin ở sinh vật Eukaryota bổ sung với côdon mở đầu là 5,

AUG3, anticôdon tương ứng là: A. 3,TAX5, . B.5, UAX 3,. C. 5,XAU 3, D. 3,XAU5,

(Phương án màu nhạt in mờ là đáp án chọn)

Bằng phần mềm Microsoft Excel, lệnh

=COUNTIF($D$3;$D$72,1) (HS trả lời đúng). =DCOUNT(A2:C72;3;F2:F3) (HS khá giỏi) Điểm ≥7 =DCOUNT(A2:C72;3;H2:I3) (HS trung bình) 5≤ Điểm < 7 =DCOUNT(A2:C72;3;K2:K3) (HS yếu kém) Điểm < 5 Thống kê được kết quả như sau:

Câu 1.1 có 62/70 HS trả lời đúng, HS khá giỏi 41, HS trung bình 16 và HS yếu kém 13. Trong đó có 39/ 41 HS khá giỏi trả lời đúng, 11/13 HS yếu

kém trả lời đúng. Theo công thức (1,

) và (2,) thì FV là 11,43% và DI là 10,52%.

Câu 1.2 có 53/70 HS trả lời đúng HS khá giỏi 36, HS trung bình 26 và HS yếu kém 8. Trong đó có 31/36 HS khá giỏi trả lời đúng, 3/8 HS yếu kém trả lời đúng. Theo công thức (1,

) và (2,) thì FV là 24,29% và DI là 48,6% Câu 1.3 có 48/70 HS trả lời đúng HS khá giỏi 35, HS trung bình 27 và HS yếu kém 8. Trong đó có 27/35 HS khá giỏi trả lời đúng, 2/8 HS yếu kém trả lời đúng. Theo công thức (1,

) và (2,) thì FV là 31,43% và DI là 52,14%

Bảng kiểm định độ khó độ phân biệt câu trắc nghiệm 1.1, 1.2,1.3

Câu 1.1 Đáp án chọn A B C* D Tổng Nhóm cao 39 41 Nhóm trung bình 12 16 Nhóm thấp 11 13 Độ khó 11,43% Độ phân biệt 10,52% Câu 1.2 Đáp án chọn A B* C D Tổng Nhóm cao 31 36 Nhóm trung bình 19 26 Nhóm thấp 3 8 Độ khó 24,29% Độ phân biệt 48,6% Câu 1.3 Đáp án chọn A B C* D Tổng Nhóm cao 27 35 Nhóm trung bình 19 27 Nhóm thấp 2 8 Độ khó 31,43% Độ phân biệt 52,14%

Chương 3

THỰC NGHIỆM SƢ PHẠM 3.1. Mục đích thực nghiệm

Sau khi đã có những kết quả nghiên cứu về mặt lí thuyết, tiến hành giai đoạn thực nghiệm sư phạm. Việc thực nghiệm sư phạm nhằm mục đích đưa các câu hỏi trắc nghiệm MCQ đã viết và soạn thành đề kiểm tra đưa vào thực nghiệm KT- ĐG kết quả học tập của HS. Dựa trên các thông số thu được, kiểm định các câu hỏi MCQ đã viết. Kết quả của thực nghiệm sư phạm là cơ sở để đánh giá tính khả thi và tính hiệu quả của quy trình mà chúng tôi đề xuất.

3.2. Nội dung thực nghiệm

- Quy trình kiểm định độ khó độ phân biệt của câu nhiễu trong TNKQ (MCQ) phần di truyền học (sinh học 12).

3.2.1 Quy trình chung

*Điều tra thực trạng của việc sử dụng câu hỏi trắc nghiệm MCQ trong kiểm tra đánh giá kết quả học tập ở trường trung học phổ thông

Mục tiêu điều tra thực trạng việc sử dụng câu hỏi trắc nghiệm MCQ trong kiểm tra đánh giá kết quả học tập ở trường trung học phổ thông để tìm hiểu về tình hình sử dụng hình thức kiểm tra bằng TNKQ cũng như hiểu biết của các GV phổ thông về các đặc trưng của câu hỏi TNKQ, tôi đã tiến hành điều tra ở một số trường THPT trên địa bàn tỉnh Thái Nguyên, đó là các trường: THPT Chuyên Thái Nguyên; THPT Lương Phú ; THPT Chu Văn An. Hình thức điều tra là sử dụng phiếu thăm dò. Đối tượng điều tra là các GV đang trực tiếp giảng dạy, trong đó bao gồm cả các GV dạy môn Sinh học. Các GV này đều có trình độ Đại học và có từ 3 năm công tác trở lên. Phiếu thăm dò được thiết kế dựa trên cơ sở tham khảo các tài liệu hướng dẫn về kĩ thuật TNKQ và thực tế giảng dạy. Thông số điều tra như sau:

Về mức độ sử dụng hình thức kiểm tra TNKQ trong kiểm tra - đánh giá:

Mức độ Số lượng Tỉ lệ (%)

Không sử dụng 0 0

Thỉnh thoảng 7 17,5

Thường xuyên 33 82,25

Loại TNKQ được sử dụng nhiều nhất:

Loại câu TNKQ Số lượng Tỉ lệ (%)

Đúng - sai 3 7,5

Ghép đôi 1 2,5

Điền khuyết 2 5

Nhiều lựa chọn (MCQ) 33 82,5

Về khả năng tự viết câu TNKQ trong kiểm tra - đánh giá:

Khả năng Số lượng Tỉ lệ (%)

Không 29 72,5

Thỉnh thoảng 8 20

Thường xuyên 3 7,5

Khó khăn chủ yếu mà GV gặp phải khi sử dụng câu hỏi MCQ trong kiểm tra - đánh giá:

Khó khăn chủ yếu Số lượng Tỉ lệ (%)

Xác định mục tiêu kiểm tra 2 6,6

Xây dựng bảng trọng số 7 23,4

Xây dựng câu hỏi 9 30

Kiểm định chất lượng câu hỏi 12 40

Như vậy, kết quả thăm dò cho thấy có 82,25% GV thường xuyên sử dụng hình thức kiểm tra TNKQ trong đó dạng câu hỏi được dùng phổ biến nhất là MCQ (70%) vì những lí do như: có thể kiểm tra kiến thức trên một diện rộng mà lại tốn ít thời gian, tính khách quan khi chấm bài, thời gian chấm bài nhanh hơn, khả năng đoán mò của HS thấp hơn. Điều này cũng có nghĩa là đa số GV đã thấy được vai trò của hình thức kiểm tra TNKQ trong đánh giá kết quả học tập cũng như những ưu điểm của câu hỏi dạng

MCQ. Đối với câu hỏi: Thầy (Cô) có thường xuyên tự viết câu hỏi TNKQ

dùng trong kiểm tra không? thì 72,5% ý kiến cho biết họ không tự viết câu hỏi mà chủ yếu là sưu tầm, chọn lọc từ các tài liệu tham khảo rồi soạn thành đề trắc nghiệm theo mục đích kiểm tra. Về nguyên nhân của thực tế này chủ yếu là do họ chưa có nhiều tài liệu hướng dẫn và cũng không được rèn luyện kĩ năng viết câu hỏi TNKQ một cách cụ thể và có hệ thống khi còn học trong trường Sư phạm. Để tìm hiểu nhận thức của GV về các

chỉ số của câu hỏi TNKQ, chúng tôi đưa ra câu hỏi: Xin thầy (cô) cho biết

quan niệm của mình về độ khó, độ phân biệt của câu hỏi TNKQ. Kết quả 73% GV được hỏi cho biết họ không rõ lắm về khái niệm này, 22% cho rằng đó là một giá trị cho biết mức độ của câu hỏi là dễ hay khó; có thể phân biệt được HS khá giỏi với HS yếu kém, số còn lại không có ý kiến gì. Còn đối với khái niệm về độ phân biệt của câu hỏi TNKQ thì hầu hết

các GV đều chỉ nắm được một cách mơ hồ, đó là câu hỏi có khả năng phân hoá được HS.

Từ những kết quả thăm dò như trên chúng tôi thấy thực tế việc sử dụng TNKQ (mà chủ yếu là MCQ) trong KT-ĐG kết quả học tập ngày càng phổ biến trong các trường THPT. Tuy nhiên, việc sử dụng còn cảm

Khó và độ phân biệt của câu hỏi trắc nghiệm MCQ

Các nguyên tắc đánh giá