Tuyển tập BáocáoHội nghị Sinh viên Nghiên cứu Khoa học lần thứ 8 Đại học Đà Nẵng năm 2012
XÂY DỰNGHỆTHỐNGCÂUHỎITRẮCNGHIỆMKHÁCHQUAN
CHƯƠNG ĐỘNGHỌCCHẤTĐIỂMVỚISỰHỖTRỢ
CỦA PHẦNMỀMVITESTA
BUILDING THE SYSTEM OF MULTIPLE CHOICE QUESTIONS FOR THE
CHAPTER OF KINETICS OF PARTICLE WITH THE SUPPORT
OF THE VITESTA SOFTWARE
SVTH: Đặng Thị Hương
Lớp 08SVL, Khoa Vật lý, Trường Đại họcSư phạm, Đại học Đà Nẵng.
GVHD: PGS.TS Nguyễn Bảo Hoàng Thanh
Khoa Vật lý, Trường Đại họcSư phạm, Đại học Đà Nẵng.
TÓM TẮT
Trong bài báo này, tác giả xin được trình bày kết quả việc phân tích đánh giá câu
hỏi trắcnghiệmkháchquan chương Độnghọcchấtđiểm Vật lý 10 Nâng cao theo lý thuyết IRT
(Item Response Theory) vớisựhỗtrợcủaphầnmềm Vitesta. Phầnmềm này không chỉ cho chúng
ta những con số cụ thể, chính xác, nhanh chóng mà còn giúp cho người sửdụng có thể hình dung
trực quan về câuhỏitrắc nghiệm, đề trắc nghiệm, năng lực củahọc sinh và quanhệ giữa các yếu
tố đó dưới dạng văn bản và đồ thị.
Từ khoá: Vitesta, Độnghọcchất điểm, lý thuyết Ứng đáp câu hỏi.
ABSTRACT
This paper presents the results of the analysis and evaluation of multiple choice questions
for the chapter of kinetics of particle in the Grade 10 Advanced Physics book based on Item
Response Theory with the support of the Vitesta software. This software does not only give us
the specific, accurate and fast numbers but also helps users visualize the multiple choice
questions, multiple choice tests, the capacity of the candidates and the relationship of
these factors indicated in texts and graphs.
Key words: Vitesta, Kinetics of particle, Item Response Theory.
1. Đặt vấn đề
Trắcnghiệm là một phương pháp của khoa học về đo lường trong giáo dục. Vì vậy
những năm gần đây, trắcnghiệmkháchquan (TNKQ) được đưa vào trong các kỳ thi tốt
nghiệp phổ thông và tuyển sinh đại học nên sựquan tâm của các trường học Đại họcSư
phạm, các cơ sở quản lý giáo dục và đội ngũ giáo viên về phương pháp giảng dạy này ngày
một tăng lên. Một ưu điểm nổi bật của phương pháp trắcnghiệm là việc sửdụng các phần
mềm để xử lý số liệu củacâuhỏitrắcnghiệm (CHTN), đề trắcnghiệm (ĐTN) đã mang lại
hiệu quả cao. Do đó việc vận dụngphầnmềmVitesta để phân tích, đánh giá CHTN, ĐTN
là cần thiết.
2. Lý thuyết Ứng đáp câuhỏi
Để có thể tạo ra được ngân hàng câuhỏi (NHCH) đảm bảochất lượng đúngvới
mục tiêu dạy học và đánh giá đúng năng lực củahọc sinh theo chuẩn kiến thức, kỹ năng thì
phải nắm vững được qui trình viết CH, phân tích đánh giá từng CHTN cũng như ĐTN.
Tuyển tập BáocáoHội nghị Sinh viên Nghiên cứu Khoa học lần thứ 8 Đại học Đà Nẵng năm 2012
Quá trình phân tích CHTN và ĐTN có thể nói là rất quan trọng vì nó quyết định cho việc
chọn hay không chọn để đưa vào NHCH nên lý thuyết trắcnghiệm (TN) ra đời, đã và đang
từng bước hoàn thiện. Từ đầu thế kỷ XX, lý thuyết TN cổ điển ra đời nhưng chưa hoàn
thiện nên đến những năm của thập niên 70 thì lý thuyết trắcnghiệm IRT (Item Response
Theory) ra đời. IRT được xâydựng dựa trên việc nghiên cứu mọi cặp tương tác nguyên tố
“học sinh – câu hỏi” (HS-CH). Mỗi HS đứng trước một CH sẽ ứng đáp như thế nào, điều
đó phụ thuộc vào năng lực tiềm ẩn của HS và các đặc trưng của CH. Hành vi ứng đáp này
được mô tả bằng một hàm đặc trưng CH cho biết xác suất trả lời đúng CH P(
) tùy theo
tương quan giữa năng lực HS
và các tham số đặc trưng cho CH. Hiện nay có 3 mô hình
toán học phổ biến nhất trong IRT: mô hình 1 tham số (mô hình Rasch) chỉ xét đến độ khó b
của CH, mô hình 2 tham số có xét đến độ phân biệt a của CH, và mô hình 3 tham số xét
thêm mức độ đoán mò c của HS khi trả lời CH. Dạng toán cụ thể của mô hình 3 tham số:
exp ( )
( ) (1 )
1 exp ( )
ab
P c c
ab
. So với lý thuyết TN cổ điển, lý thuyết IRT ưu việt hơn
nhiều. Trong lý thuyết TN cổ điển độ khó, độ phân biệt của các CH tính được phụ thuộc
vào mẫu HS được chọn để thử nghiệm và năng lực xác định được của HS phụ thuộc vào
ĐTN cụ thể mà HS làm. Với IRT, các tham số đặc trưng của CH (liên quan đến độ khó, độ
phân biệt, mức độ đoán mò) không phụ thuộc mẫu thử để định cỡ CH và năng lực đo được
của HS không phụ thuộc vào một ĐTN cụ thể, tức là phải như nhau cho dù đo bằng bất kỳ
ĐTN nào được lấy từ NHCH đã được cùng định cỡ. Theo IRT, mỗi CH có các thuộc tính
đặc trưng cho nó và mỗi HS ở một trình độ nào đó có một năng lực tiềm ẩn xác định, các
thuộc tính và đặc trưng này không phụ thuộc vào phép đo.
3. Xử lý số liệu bằng phầnmềmVítesta
Sau khi soạn thảo CH theo đúng quy trình gồm 4 giai đoạn theo 10 bước và tiến
hành cho HS kiểm tra, các phiếu trả lời sẽ được đưa vào máy quét hoặc nhập từng bài TN
vào máy tính. Vitesta sẽ tiến hành xử lý và sau đây là những chức năng chính của nó:
Định cỡ đề trắcnghiệm theo các mô hình IRT với 1, 2 và 3 tham số từ đó cung cấp tường
minh các đường cong đặc trưng, hàm thông tin của từng CHTN và ĐTN; thực hiện phép
biến đổi thông qua đường cong điểm thực của ĐTN nhằm thu được điểm số của từng HS
theo một thang điểm mong muốn nào đó (trên 10, trên 20, trên 100 v v…); độ khó, độ
phân biệt của CHTN theo lý thuyết cổ điển; cung cấp thông tin về tương quan giữa ĐTN
và mẫu HS, sơ đồ bài làm của từng HS; biến đổi điểm thô thành điểm thực theo thang điểm
tuỳ chọn
Để minh họa về tính năng củaphầnmềm VITESTA, sau đây chúng tôi sửdùng
chúng để phân tích kết quả bài làm chươngĐộnghọcchấtđiểm Vật lý 10 Nâng cao sau
khi tiến hành thực nghiệmSư phạm trên 8 lớp ở 4 trường THPT với 375 HS ở thành phố
Đà Nẵng và dùngphầnmềmVITESTAphân tích theo mô hình 3 tham số, ta thu được kết
quả qua một số minh họa như sau:
BÁO CÁO VỀ ĐỀ THI
ĐÁP ÁN: 2221411122134313442134234434332242311314
TỔNG SỐ HỌC SINH: 375
Tuyển tập BáocáoHội nghị Sinh viên Nghiên cứu Khoa học lần thứ 8 Đại học Đà Nẵng năm 2012
TỔNG SỐ CÂU HỎI: 40
ĐỊNH CỠ ĐỀ THI
SAI SỐ THAM SỐ CHO PHÉP 0,001
SỐ VÕNG LẶP ƯỚC LƯỢNG MỖI THAM SỐ: 50
MÔ HÌNH: 3 THAM SỐ
ĐỘ TIN CẬY PHÂN TÍCH NĂNG LỰC (PERSON SEPARATION
RELIABILITY): 0,9994528
GIÁ TRỊ TRUNG BÌNH MỨC NĂNG LỰC: 0
GIÁ TRỊ TRUNG BÌNH ĐỘ KHÓ: 0,378
Bảng 1: Các chỉ số thống kê của từng câuhỏi
=========================================================================
Câu số: 13
Bỏ qua: 0
Độ phân biệt (cổ điển): 0,15164
Độ khó (cổ điển): 0,53333
Độ phân biệt IRT(a): 0,12863
Độ khó IRT(b): -0,18016
Độ phỏng đoán IRT(c): 0,04786
Các phương án: A B C D*
Số TS chọn: 119 26 30 200
Tỉ lệ TS chọn PA (%) 31,73 6,93 8,00 53,33
Tương quanđiểm nhị phân:-0,07781 -0,02414 -0,12275 0,15164
Giá trị t: -1,50739 -0,46630 -2,38873 2,96283
Giá trị p: 0,06628 0,32064 0,00870 0,00162
=========================================================================
Câu số: 38
Bỏ qua: 0
Độ phân biệt (cổ điển): 0,26768
Độ khó (cổ điển): 0,41067
Độ phân biệt IRT(a): 0,32812
Độ khó IRT(b): 0,70554
Độ phỏng đoán IRT(c): 0,00361
Các phương án: A B C* D
Số TS chọn: 67 100 154 54
Tỉ lệ TS chọn PA (%) 17,87 26,67 41,07 14,40
Tương quanđiểmnhịphân: -0,04281 -0,10294 0,26768 -0,19871
Giá trị p: 0,20423 0,02318 0,00000 0,00005
========================================================================
Từ các số liệu ở bảng trên chúng ta có thể chọn các CHTN theo độ khó, độ phân
biệt, độ đoán mò, cũng như các phương án nhiễu để lưu vào ngân hàng câu hỏi(NHCH),
như ở câu 13 cho thấy: độ khó 0,53, độ phân biệt kém, độ khó IRT -0.18, mức độ đoán mò
Tuyển tập BáocáoHội nghị Sinh viên Nghiên cứu Khoa học lần thứ 8 Đại học Đà Nẵng năm 2012
hơi cao gần 0.048 chúng tỏ số học sinh may rủi nhiều trong phương án đúng này mặc dù có
đến 53% số HS chọn. Nhiễu A tốt hơn nhiễu B vì lôi cuốn được nhiều HS chọn, độ phân
biệt bé hơn và giá trị p nhỏ hơn nhiều (p<0.05 là tốt). Nhiễu C tuy ít HS chọn nhưng khá
hay nhưng tất cả không đạt vì độ phân biệt quá thấp. Tóm lại câu này chưa tốt, để đưa vào
NHCH phải điều chỉnh sửa lại. Câu 38 ta thấy: độ khó 0.41, độ phân biệt tốt, độ khó theo
IRT 0.7 vượt mức năng lực trung bình 0, độ đoán mò thấp 0.00361, các phương án nhiễu
có độ phân biệt âm và lôi cuốn nhiều HS tham gia, tốt nhất là nhiễu D vì độ phân biệt và
giá trị p khá tốt. Vì vậy câu này tốt.
Hình 1: Ma trận đường cong đặc trưng và hàm thông tin của từng câuhỏi (câu 1 đến 14)
Từ ma trận đường cong đặc trưng CH giúp ta nhanh chóng phát hiện ra những câu
có vấn đề, có thể nhìn thấy ngay các câu 3, 4, 11, 13 có độ dốc nhỏ, tức là tham số a bé
thậm chí có độ khó âm cụ thể như ở câu 13 có độ phân biệt: 0,12863, độ khó: -0,18016.
Những câu này phải xem xét lại trước khi đưa vào ĐTN chính thức. Tương tự ma trận
đường cong hàm thông tin cho ta phép đo chính xác của CH nằm trong khoảng nào, có thể
thấy được rằng, ở câu 3, 11, 13 không cung cấp được thông tin của từng CH nhiều vì vậy
những câu này kém chất lượng cần phải chỉnh sửa lại. Ví dụ trong HTT câu 1 cho biết: câu
này dễ so với năng lực trung bình vì phép đo chính xác nằm dưới mức trung bình, độ
phỏng đoán hơicao và độ phân biệt khá tốt. Như vậy, từ ma trận này ta có thể thiết kế một
ĐTN ở các mức độ khó, dễ hay bất cứ một mức độ nào tuỳ theo mục đích sửdụngcủa đề
thi, kiểm tra.
Hình 2: Đường cong đặc trưng của ĐTN
Đường cong này là tổng hợp tất cả đường cong đặc trưng của từng CH, nó biểu
diễn quanhệ hàm số giữa điểm thực và thang năng lực của HS và có dạng một hàm đồng
biến. Tiệm cận phải khi
có giá trị bằng tổng số CH N, tiệm cận trái khi
có giá trị bằng tổng giá trị các tham số đoán mò.
Hình 3: Đồ thị phân bố điểm
Đồ thị phân bố điểm vẽ lại các điểm dữ
Tuyển tập BáocáoHội nghị Sinh viên Nghiên cứu Khoa học lần thứ 8 Đại học Đà Nẵng năm 2012
liệu từ thực tế trên cơ sở các HS và CH đã được đánh giá. Mỗi điểm màu xanh là một hoặc
nhóm các HS có cũng điểm thô và cùng mức năng lực thu được từ quá trình ước lượng.
Bảng 2: Bảng giá trị ước lượng năng lực học sinh.
¦ STT¦ SBD ¦Năng lực ¦ Sai số chuẩn¦ Đúng/Tổng ¦Điểm quy đổi|
+ + + + + + |
¦ 1¦ 0000004204¦ 0,06114 ¦ 0,33228 ¦ 19/40 ¦ 506,11|
¦ 2¦ 0000004206¦ -1,00712 ¦ 0,35840 ¦ 13/40 ¦ 399,29|
¦ 3¦ 0000004205¦ 0,70245 ¦ 0,33404 ¦ 22/40 ¦ 570,24|
¦ 4¦ 0000004201¦ 0,75495 ¦ 0,33478 ¦ 23/40 ¦ 575,50|
¦ 5¦ 0000004202¦ 1,11315 ¦ 0,34222 ¦ 26/40 ¦ 611,31|
¦ 6¦ 0000004207¦ -1,18283 ¦ 0,36597 ¦ 12/40 ¦ 381,72|
¦ 7¦ 0000004208¦ -1,46916 ¦ 0,38011 ¦ 10/40 ¦ 353,08|
¦ 8¦ 0000004209¦ 0,12916 ¦ 0,33183 ¦ 19/40 ¦ 512,92|
¦ 9¦ 0000004210¦ 0,73595 ¦ 0,33450 ¦ 22/40 ¦ 573,60|
¦ 10 ¦ 0000004211 ¦ 2,02687 ¦ 0,38062 ¦ 29/40 ¦ 702,69|
Dựa vào bảng này ta có thể biết HS đang ở trường nào, lớp nào, năng lực củahọ là
bao nhiêu cùng với số câu mà họ trả lời đúng. Nhưng quan trọng hơn hết trong bảng này là
điểm quy đổi. Từ Bảng 3 có thể rút ra một nhận xét: có những HS đạt điểm thô như nhau
(tức số CH trả lời đúng bằng nhau) nhưng lại có điểm quy đổi khác nhau. Lý do là vì mỗi
CH mà các HS đó làm được sẽ cung cấp cùng 1 điểm thô nhưng chúng lại có độ khó khác
nhau. Điều nhận xét trên cho thấy rõ điểm thô không đánh giá đúng năng lực của HS. Ví
dụ: HS có SBD 04 và 09 trả lời đúng 19/40 nhưng HS 09 có điểm số cao hơn vì năng lực
lớn hơn nghĩa là số câuhỏi đã làm được trong 19 câu này khó hơn 19 câu kia. Với lý
thuyết cổ điển thì số điểm bằng nhau.
Hình 4: Đồ thị phân bố độ khó và năng lực học sinh.
Đồ thị này cho phép bước đầu đánh giá về mức độ phù hợp của đề thi so với năng
lực HS. Năng lực HS và độ khó CH được đặt trên cùng thang đo. Chỉ số trên mỗi cột màu
xanh là số thứ tự câuhỏi trong đề thi, chỉ số trên mỗi cột màu đỏ là số lượng HS, vị trí của
mỗi cột màu xanh trên trục hoành là độ khó CH, vị trí của mỗi cột màu đỏ trên trục hoành
là năng lực HS. Như vậy đồ thị trên ta thấy rằng đề này có độ khó vượt khỏi năng lực của
HS mà cụ thể là: Nếu mức năng lực trung bình là 0 thì độ khó trung bình là 0,378 tức đề
này hơi khó so với năng lực của HS.
Hinh 4: Hàm thông tin đề thi-Đường cong sai số chuẩn. Mô hình 3 tham số.
Tuyển tập BáocáoHội nghị Sinh viên Nghiên cứu Khoa học lần thứ 8 Đại học Đà Nẵng năm 2012
Đường màu đỏ: Đường cong hàm thông tin đề thi. Đường đen nhạt: Đường cong
sai số chuẩn. Đường cong hàm thông tin trên cho thấy đề này có khả năng đo chính xác
nhất ở trong khoảng năng lực cao hơn mức trung bình.
Hình 5: Sơ đồ bài làm của từng HS (thứ 1)
Sơ đồ bài làm cho phép HS suy nghĩ và đối chiếu những câuhỏi làm được và
không làm được, cả những câu khó và dễ, những suy đoán về nguyên nhân thành công hay
thất bại của họ. Giáo viên cũng có thể dùng sơ đồ này để theo dõi HS, biết được năng lực
và những phần kiến thức HS chưa nắm được trong quá trình nhận thức môn học. Nữa mặt
phẳng bên trái chỉ các CH mà HS làm đúng, nữa mặt phẳng bên phải chỉ các CH mà HS
làm sai, vị trí của mỗi CH xác định độ khó của CH, tăng dần từ dưới lên theo trục thẳng
đứng. Với bài làm của HS STT 01 có 9 câu dễ, 10 câu khó làm được điều này cần kiểm tra
lại, 8 câu dễ và 13 câu khó không làm được điều này phù hợp. Sơ đồ này giúp chúng ta
thấy được rằng ĐTN có số CH khó nhiều hơn CH dễ và giúp mỗi HS có thể xem lại kết
quả, khả năng học tập của mình theo các chủ đề kiến thức ứng với từng CH. Ứng với 10/19
CH trả lời đúng thực sự là do HS có được kiến thức đó hay quay cóp, đoán mò và một CH
đặt ra cho HS này là nguyên nhân nào mà 10 câu khó làm đúng trong khi 8 câu dễ không
làm được. Nếu là HS ở trong lớp học mà GV đó dạy thì có thể điều tra, nắm được ngay
tình hình học tập của HS để từ đó có kế hoạch hỗtrợ và điều chỉnh kịp thời không chỉ một
em trên mà với tất cả HS mà GV đó giảng dạy.
4. Kết luận
Với ví dụ minh hoạ trên có thể kết luận rằng: VITESTA cho phép ước lượng kết
quả đạt độ chính xác tương đương nhưng thực hiện nhanh chóng, dễ sửdụng và cung cấp
tiện ích hơn nhiều so với 1 số phầnmềm hiện nay và dựa trên việc phân tích đánh giá đó
lựa chọn các câu CH có độ khó, độ phân biệt và giá trị nội dung đạt yêu cầu để lưu vào
Tuyển tập BáocáoHội nghị Sinh viên Nghiên cứu Khoa học lần thứ 8 Đại học Đà Nẵng năm 2012
NHCH. Như vậy, trong 40 câu có một số câu cần phải chỉnh sửa lại như câu 3, 11, 13, 18
còn lại 9 câu ở mức độ nhận biết, 8 câu ở mức độ thông hiểu và 19 câu ở mức độ vận dụng
lưu vào ngân hàng CH.
Chúng tôi nghĩ cần phải sớm phổ biến kỹ thuật xây dựngcâuhỏitrắcnghiệm theo
hướng này. Nếu ngân hàng câuhỏi đủ lớn, được soạn thảo và phân tích cẩn thận bao trùm
toàn bộ chương trình, các bài kiểm tra luôn thay đổi nội dung sẽ tác dụng tốt đến quá trình
tự học, làm giảm sự may rủi, học tủ, học lệch, hạn chế được nạn quay cóp buộc HS phải
học từ đầu. Từ đó, nó không chỉ giúp cho HS thay đổi phương pháp học một cách tích cực,
sáng tạo mà còn giúp giáo viên và nhà quản lý giáo dục có một phương pháp dạy và quản
lý hiệu quả hơn.
TÀI LIỆU THAM KHẢO
[1] Lâm Quang Thiệp (2011), Đo lường trong giáo dục, lý thuyết và ứng dụng, Nhà xuất
bản Đại học quốc gia Hà Nội.
[2] Lâm Quang Thiệp, Lâm Ngọc Minh, Lê Mạnh Tấn, Vũ Đình Bổng (2007), “Phần
mềm Vitesta và việc phân tích số liệu trắc nghiệm”, Tạp chí giáo dục, số 176,
11/2007.
[3] Nguyễn Bảo Hoàng Thanh (2011), Kiểm tra đánh giá trong giáo dục, Nhà xuất bản
Đà Nẵng.
[4] Nguyễn Bảo Hoàng Thanh (2008), “Sử dụngphầnmềm Quest để phân tích câu hỏi
trắc nghiệmkhách quan”, Tạp chí khoa học và công nghệ Đại học Đà Nẵng số
2(25)2008.
. tập Báo cáo Hội nghị Sinh viên Nghiên cứu Khoa học lần thứ 8 Đại học Đà Nẵng năm 2012
XÂY DỰNG HỆ THỐNG CÂU HỎI TRẮC NGHIỆM KHÁCH QUAN
CHƯƠNG ĐỘNG HỌC. khách quan chương Động học chất điểm Vật lý 10 Nâng cao theo lý thuyết IRT
(Item Response Theory) với sự hỗ trợ của phần mềm Vitesta. Phần mềm này không