Vi vậy việc xây dung, thiết kế và chuẩn hóa các câu hỏi trắc nghiệm dé bổ sung vào ngân hàng đẻ thi phục vụ trong việc đánh giá năng lực học sinh là một van đề cần thiết và mang tính thự
Trang 1NGUYÉN THỊ THANH HÀ
XÂY DỰNG VÀ CHUÁN HOÁ
BỘ CÂU HÓI TRÁC NGHIỆM KHÁCH QUAN
NỘI DUNG SINH LÍ HO HAP, TUẦN HOÀN
Ở DONG VAT, SINH HỌC 11
KHOÁ LUẬN TÓT NGHIỆP ĐẠI HỌC
NGANH SU PHAM SINH HỌC
THÀNH PHO HO CHÍ MINH - 2024
Trang 2NGUYÉN THỊ THANH HÀ
XÂY DỰNG VÀ CHUÁN HOÁ
BỘ CÂU HOI TRAC NGHIEM KHÁCH QUAN
NOI DUNG SINH LI HO HAP, TUAN HOAN
Ở DONG VAT, SINH HỌC 11
KHOA LUAN TOT NGHIEP DAI HOC
NGÀNH SƯ PHAM SINH HOC
NGƯỜI HƯỚNG DAN KHOA HOC
ThS Truong Van Tri
THÀNH PHO HO CHÍ MINH - 2024
Trang 3LỜI CÁM ON
Lời cảm ơn dau tiên em xin gửi đến TS Trương Văn Trí, giảng viên Khoa Sinh
học, Trường Đại học Sư phạm Thành phố Hỗ Chí Minh, người đã tận tình hướng
dân, diu dắt chúng em trong suốt quá trình thực hiện đề tài Nhờ sự nhiệt tình, tâmhuyết và những lời khuyên bổ ích của thay, chúng em đã hoàn thành được đề tài một
cách trọn vẹn nhất.
Đồng thời, chúng em cũng xin gửi lời cảm ơn đến Ban Giám hiệu và quý Thay
Cô của Trường THPT Tran Phú - Quận Tân Phú; Trường THPT Bình Phú - Quận 6;
Trường THPT Gia Định — Quan Bình Thạnh; Trường THPT Tam Phú — Thủ Đúc; Trường THPT Hoàng Hoa Thám — Quận Bình Thạnh đã tạo mọi điều kiện thuận lợi
nhất để cho chúng em có điều kiện tiến hành thực nghiệm sư phạm
Cuối cùng, chúng em xin gửi lời cảm ơn đến gia đình, bạn bè và những người
thân yêu đã luôn tin tong, động viên và tạo điều kiện tốt nhất cho chứng em học tap
và nghiên cứu Nhờ sự ting hộ tinh than cia mọi người, chúng em đã có thể vượt qua mọi khó khăn và hoàn thành tốt dé tài.
Thành phô Hồ Chí Minh, ngày 30 tháng 4 năm 2024
SINH VIÊN
Nguyễn Thị Thanh Hà
Trang 41 Lí do chọn để tai oo cceccceccsscsseeseesessesseesessvssvesesscsseesteetsnceneeesssstseseseessnceneeeseeees 1
Di IMA GS INEM CU aiatisstiniiiriiiiiiiitiii3i14111051114510611851384315553885858513953885558515835853556 2
3 Đối tượng và khách thé nghiên O ccsccssesssecssscsssesssesssseessstecsseecseesssecssnces 2
4 Giả thuyết khoa học - - c1 21211111 SH SH ng 3
Ds NASM vụ nghiên CỮN:¡:‹cocco‹cicc0 sisc02010310061025616466146050666566562856655630859688645852856838 3
G PhạnviingBiEB CWA ;:.:.:.::::::s::icciitiiic2t121001111111231113352355234173533555083536335933573536330933E 3
;IPhươne¡bh6DInphiểf:eỨiicsossccisiiisiiiiiiittiiti1410021414311451085118311853852916283585558 4
7.1 Phương pháp nghiên cứu lý ¡00/20 eccceccecceesceessesseescesssesssessscesseesnesnnven 4
l1 in ố 4
7.3 Phương pháp đo lường đánh giá kết quả - - 22-5522 5zz2vszecszee 4
§ Những đĩng gĩp mới của khố luận - - ceeeeeeeeeeeceneeceseceeceeeeeeaeeneeeees 5
Chương 1 CƠ SỞ LÍ LUẬN VÀ THUC TIEN - 2-5552 ccszssz 6
I1 TổnE:đũanniichiETiiEỦNitosscosoaooaoosnbiiniiitiioiiiaiiidgtisitnaig28111310082818148253850685610536Ỷ 6
1.1.1 Tơng quan nghiên cứu ngồi nước -2-22222z222z222z22zxcrxrcrxrcree 6
1.1.2 Tổng quan nghiên cứu trong nước :s:25s 222 2222122512252 222 ce6 7 [2./GGiSỜIHIHHẬN:.ciciccccscpciiiionitsiii111231041116311631863036538556853386355563556435833569536355355 4888 7
1.2.1 Năng lực và phẩm chất 2: s2SsE2292252222221222111117 11112 xzcxer 7
Trang 51.2.2 Do lường, kiêm tra, đánh giá kết quả học tập và đánh giá năng lực §
1.2.3 Khái niệm và vai trò đặc tả đề kiểm tra đánh giá 5-55-5555: 101.2.4 Các loại câu hỏi trắc nghiệm khách quan -. - 2-2-2: 10
1.2.5 Lý thuyết đánh giá cô điển — Classical Test Theory (CTT) 11
1.2.6 Lý thuyết ứng dap câu hỏi — Item Response Theory (IRT) l6
1.2.7 Lý do sử dung lý thuyết ứng đáp câu hỏi (IRT) -5- 23 USB: Sen sỡ thực tẾR¡snaannaannnndniiinnitidiniti200018100001000830380118101888888088108603880803838 24
1.3.1 Mục tiêu, nội dung, phương pháp - se S<seeeieeereerree 24
1.3.2 Kết quả khảo sát ¿- 22-2222 2212 2221112231072111211122122177111221112 1122 ee 24
BB KGINERG 6606 60000021000020200623006006- 34
Chương 2 QUY TRÌNH XÂY DỰNG VÀ CHUÁN HOÁ BỘ CÂU HỎI
TRAC NGHIEM ĐÁNH GIÁ NANG LỰC HỌC SINH - 5- 35
2.1 Bước I: Xây dựng cau trúc dé thi và các đặc trưng đẻ thi -¿ 37
2.1.1 Mục đích của đề kiểm tra 2 2222222++22CzecEEEecEErerrrrrerrrrece 37
2.1.2 Hệ mục tiêu day học tiêu chí đánh giá uc iseisiieree 38
8!II/5:IBlnEimaiffinitöIHNI:sssusccoici66::002202120221063031203610032109200123102210821742102211822312 38
2.1.4 Bản đặc tả đề thí -52-221222122212221221122111211122112 12212217212 e 39
DD (Bianco ?:iChuẩnibicầuRôiÌiflÔcsneannnidisanoannainnnninnniindaianuastiannasasd 4l
2.2.1 Một số nguyên tắc khi viết câu hỏi trắc nghiệm khách quan 41
2.2.2 Kỹ thuật viết câu hỏi trắc nghiệm khách quan - 5-5525 525552 4l
2.3 Bước 3: Đánh giá câu hỏi thi - 22222 222222222222222223112222222221122222 2e 43
2.4 Bước 4: Phân tích các thông s6 của từng cau hỏi thi và hiệu chỉnh câu hỏi 44
2.4.1 Phương pháp ước tính các tham số của từng câu hỏi theo mô hình IRT
SPU U116511161151351831153155331605352858658505188581845955438855381337618533331385318355388438858548853384358548055585 44
Trang 62.4.2 Phuong pháp ước tinh nang lực thí sinh theo mô hình IRT 3PL 49
2.4.3 Phương pháp ước tính ham thông tin (information funcion) câu hỏi va đề
BH 006201 010610000000100n000n00020000000000010200000092007 54
P.Ne hg 0 lnẽ 57
2.5.1 Cau trúc nội dung chủ dé “Hô hap va trao đôi khí ở động vật" 57
2.5.2 Cấu trúc nội dung chủ dé “Van chuyên các chất trong cơ thẻ động
Chương 3 KET QUA - 52-52222292 2v22223E2LxSE21E2Lxctreerrked 64
3.1 Cấu trúc dé thi và các đặc trưng của đề thì -2-7se22szeccxeccxzeccxcc- 64
BilliliBănfiaaitrinidEILoeeeansnaannnrenanieeeeeinosrcoerttzaitesitrestrttattesaneasinei 64 3.2: Bản đặc là AB RA nc snsccnsccosscassccsssccescossscassccosssensscsssecsssccasscaiscossnccssceasel 67 3.2 Kết quả câu hỏi thô 5-52 2222222232 212221122117217217210711122117222122 112 c1xe5 78
3.3 Kết qua đường cong đặc tinh từng câu hỏi và ham thông tin của câu hỏi 93
3.3.1 Kết quả Để Ó01 22222222222 22112212221221127110711272172217221222 222112112 945/52: Eta DE 002 (PHUIÑIETaanoaoniinenanindiioiinidiigtiiototiiatnaan 1403.4 Kết quả đường cong đặc tinh dé thi và hàm thông tin của dé thi 140
3.4.1 Kết quả đường cong đặc tính dé 001 và hàm thông tin của dé 001 140
3.4.2 Kết quả đường cong đặc tinh dé 002 và hàm thông tin của dé 002 142
Trang 7Lý thuyết ứng đáp câu hỏi
Trung học phô thông
Yêu cầu cần đạt
Trang 8DANH MUC CAC BANG
Trang
Bảng 1.1 Mối quan hệ giữa độ phân biệt và độ tin cậy (1962) 13
Bang 1.2 Mối quan hệ giữa độ khó và độ phân biệt 55 13
Bang 1.3 Tiêu chuân đánh giá độ phân biệt 5-5555 5555 52512226 14Bang 1.4 Quan hệ giữa độ tin cậy, độ giá trị với sé lượng các câu hoi 16
Bảng 1.5 Day phân loại các cap độ khó khác nhau
và các cấp độ phân biệt 22-22 s2 s2 4C 4E E73223417322721712221221112 122 17 Bảng 2.1 Mẫu ma trận 22-222 2222121222212 111 2112172172211 21121 2 xe 30
Băng 2:2 IMiu:fỆG EỄcnonbnnnnuiiidtsiiuitiii4041800030.081343106308311804013310030 40
Bảng 2.3: Địa điểm thời gian và số lượng học sinh thực hiện khảo sát 44
Bảng 2.4: Xử lí số liên trên MBX ssscssscssssssssaisassisssssssvssaivennvvasssssssossscsasess 44Bảng 2.5 Phân loại yêu cầu cần đạt
nội dung chủ đề “Hô hap và trao đổi khí ở động vật” - :5225 58
Bảng 2.6 Phân loại yêu cầu cần đạt 2-2 22©2szEEzcEEzcvxzcvxzczxecv
nội dung chủ đẻ “Van chuyên các chất trong cơ thẻ động vật" 6]
Bane 51.IBãneraaitrfintiilHiiaassiasnnateioaiiiiiioitaniouiauianiainnannaai 65
01 SEN: hi 0 N 66
Bảng: Kết quả sau chuẩn hoá bộ câu hỏi - 52-55552252 ccccccrrsree 189
Trang 9DANH MỤC CÁC HÌNH
Trang Hình 1.1 Đường cong đặc tinh câu hỏi trong mô hình Rasch,
với I tham số độ khó [3 = ( - 2-2254 22221233 E21221211711221211 2112172121171 212 ecree 17
Hình 1.2 Ba đường cong đặc tính câu hỏi có cùng độ phần biệt
ñlữnE:cố độ KhôIkBác Thấũ:.::::-::::::::::::::::c::ic::cc::22022220220112112311123116211651123115336825 1833 19 Hình 1.3 Ba đường cong đặc tính câu hỏi có cùng độ khó
nhưng: có độ phân Biệt Khác Wha: :.c:5::3sscaiscsesssssscseses secazscasecasecsasesssscassessssasseassesaeses 19 Hình 1.4 Đường cong đặc tính của đề thi có 10 câu hỏi trắc nghiệm 21
Hình 1.5 Biêu đô thé hiện ti lệ công cụ đánh giá được sử dung phô biến
ĐH 25
Hình 1.6 Biêu đồ thê hiện ti lệ các phương pháp tính điểm
được giáo viên sử dụng khí dùng bài thi trắc nghiệm khách quan 4 lựa chọn.
mm 1 1 25
Hình 1.7 Biéu đồ khảo sát ý kiến giáo viên về mức độ hiệu quả của
phương pháp tính điểm dựa trên tông số câu hỏi trả lời đúng .:-::55- 26Hình 1.8 Biêu đỗ thê hiện ti lệ giáo viên xây dựng bản đặc tả
khi thiết kế bài thi trắc nghiệm 2-52 2222222222 22x22 rrrrrrrrrree 26
Hình 1.9 Biểu đỗ thé hiện tỉ lệ giáo viên quan tâm đến
các thông số câu hỏi: độ khó, độ phân biệt, độ tin cậy, 27
Hình 1.10 Biểu đồ thê hiện tỉ lệ giáo viên được dao tạo, bồi đưỡng hoặc tập huắn về GET sc nscctcssszescczssczcesczcacscssvsusstassscasscasesssssavssscssatacszcocsavcstecucecsdssesssczscasessscesaneesteesiines 27
Hình 1.11, Biểu đồ thé hiện tỉ lệ giáo viên thực hiện các nội dung công việc khi thiết
Be Epa ER a BANA GOOD con 28
Hình 1.12 Biểu đồ khảo sát ý kiến giáo viên về mức độ cân thiết của việc thay thé
phương pháp đánh giá truyền thống - ¿22c 1 210 2202210221222122112112 21122112 x2 29
Hình 1.13 Biểu đồ khảo sát ý kiến giáo viên về mức độ cần thiết của việc
ước tính xác suất giả đoán 0c nh ch 01121120 001011 11 g2 xe 30
Trang 10Hình 1.14 Biéu đồ thé hiện mức độ tiếp cận IRT của giáo viên 31Hình 1.15 Biéu đồ khảo sát nhu cầu tim biểu vẻ quy trình ky thuật để thiết kế mộtbài thi trắc nghiệm chuẩn hoá theo hướng đo lường năng lực học sinh 32
Hình 1.16 Biểu đỏ tỉ lệ giáo viên xây dựng ngân hàng câu hỏi trắc nghiệm .32
Hình 1.17 Biểu đồ khảo sát ý kiến giáo viên về sự cần thiết của việc chuân hoá dé
kiểm tra câu hỏi trắc nghiệm -2222-2222ecccsccrseerrrserrrsrrrsrerrcr- 33 Hình 1.18 Biểu đồ khảo sát ý kiến giáo viên về tính hiệu quả của việc
xây dựng, chuẩn hóa bộ câu hỏi trắc nghiệm khách quan theo IRT 33
Hình 1.19 Biểu đỗ khảo sát giáo viên về độ cần thiết của việc chia sẻ, giao lưu các
câu hỏi được Chuan hoá .- - St 2 22211 1152112111112 21111 1101111 111122111022 33 Hình 2.1 Ty lệ phản hồi đúng được quan sát theo các nhóm năng lực 45 Hìih/2:2.M6IHISHIIRT BBA OO, gaaniniannninbooiinbiioindiioiiititdiisitoinanusandl 46 Hình 2.3 Đô thi hàm thông tin câu hỏi theo thang năng lực - 55
Hình 2.4 Đồ thị ham thông tin đề thi theo thang năng ke c.cccccsesseesseeseeeseeeseeens 56
Trang 11MO DAU
1 Li do chon đề tài
Hiện nay, trong giai đoạn chuyên tiếp từ chương trình giáo duc 2006 sang
chương trình giáo dục 2018, khó tránh khỏi các trở ngại trong việc triên khai
chương trình mới vì sự khác biệt trong mục tiêu dạy học Đặc biệt trong việc đánh
giá học sinh, sự khác biệt giữa "cũ" và “moi” lại cảng rõ ràng hơn.
Với chương trình giáo dục 2006, định hướng nội dung, dạy học theo mức độ
cân đạt về kiến thức, kĩ năng vậy nên đánh giá học sinh bằng phương pháp đánh giá
kiến thức, kĩ năng Đánh giá kiến thức, kĩ năng là đánh giá xem xét việc đạt kiến
thức kĩ năng của HS theo mục tiêu của chương trình giảo dục, gắn với nội dung được
học trong nhà trường và kết quả đánh giá phụ thuộc vào số lượng câu hỏi, nhiệm vụ
hay bải tập đã hoàn thành về đơn vị kiến thức, kĩ năng (Theo mô đun 3)
Chương trình 2018 có nhiều điểm khác biệt so với 2006, quan điểm giáo dục
của chương trình 2018 là theo định hướng phát triển năng lực và phẩm chat Các năng
lực phâm chất này đều được cụ thê hóa bằng yêu cầu cần đạt ở từng môn học, cấp
học Vì mục tiêu day học thay đỗi từ yêu cầu về kiến thức, kĩ năng sang hình thành
và phát triên năng lực ở học sinh nên phương pháp đánh giá cũng phải thay đôi sang
phương pháp đánh gia nang lực Đánh giá năng lực là đánh giá kha năng vận dụng
kiến thức, kĩ năng đã được học vảo giải quyết van dé trong hoc tập hoặc trong thựctiễn cuộc sóng của HS và kết quả đánh giá người học phụ thuộc vào độ khó của nhiệm
vụ và bai tập đã hoan thành theo các mức độ khác nhau Thang đo trong đánh giá
năng lực được xác định theo các mức độ phát triển năng lực của người học, chứ không
phải có đạt hay không một nội dung đã được học (Theo mô đun 3).
Công cụ phô biến trong kiêm tra,đánh giá là đề kiểm tra và câu hỏi trắc nghiệm
khách quan (TNKQ) nhiều lựa chọn Câu hỏi trắc nghiệm khách quan nhiều lựa chọn
có những ưu điểm như: Có thé đánh giá đa dạng nhiều mục tiêu đạy học trên một bài
kiêm tra, độ tin cậy cao vì yếu tố đoán mò được giảm xuống, tính khách quan khi cham, Với những ưu điểm này mà câu hỏi TNKQ được sử dụng nhiều trong các bài kiêm tra thường xuyên hay trong các kì thi lớn như kì thi tốt nghiệp THPT: kì thi
Trang 12đánh giá năng lực của Đại học Quốc Gia Tuy nhiên, hiện nay hau hết giáo viên đều
sử dụng số điểm quy đổi từ tang số câu trả lời đúng của học sinh để đánh giá hay
phân loại học sinh Trong khi đề đánh giá năng lực học sinh cần xét đến độ khó của từng câu hỏi mà học sinh đã trả lời đúng Đây là điểm chưa phù hợp trong việc sử
dụng câu hỏi TNKQ trong công tác kiêm tra đánh giá
Việc đánh giá có vai trò quan trọng, không chỉ đề đánh giá năng lực ở học sinh
mà còn đề đánh giá tinh ưu việt của các mô hình day học Vậy nên câu hỏi không chi
phải bám theo mục tiêu dạy học mà còn được chuân hoá Tuy nhiên, hiện nay với
kiểm tra đánh giá kết quả học tập của học sinh ở quy mô nhỏ (kiểm tra nhóm, lớp, ).việc điều chỉnh các thông số kĩ thuật câu hỏi van thực hiện dựa trên kinh nghiệm củangười day Điều này có thé dẫn đến việc đánh giá các mục tiêu dạy học theo chương
trinh 2018 được thực hiện chưa day du.
Vi vậy việc xây dung, thiết kế và chuẩn hóa các câu hỏi trắc nghiệm dé bổ sung vào ngân hàng đẻ thi phục vụ trong việc đánh giá năng lực học sinh là một van đề cần thiết và mang tính thực tiễn Nhận thấy tính cấp thiết trong vấn đẻ này, tôi muốn thực
hiện đề tài '*Xây dựng và chuẩn hoá bộ câu hoi trắc nghiệm khách quan nội dung sinh
lí hô hap, tuần hoàn ở động vật, Sinh học 11” Với hi vọng việc xây dựng và chuẩn
hoá bộ câu hỏi sớm được day mạnh trong công tác giáo dục và xây dựng ngân hang
câu hỏi chuẩn hoá phục vụ cho công tác đánh giá.
2 Mục tiêu nghiên cứu
Xây dựng và chuẩn hoá được bộ câu hỏi trắc nghiệm khách quan nhằm tô chứcdạy học và đánh giá kết quả học tập nội dung Sinh lí hô hấp, tuần hoàn ở động vật
Sinh học 11.
3 Đối tượng và khách thể nghiên cứu
Đôi tượng nghiên cứu: Cơ sở lý luận của việc kiểm tra đánh giá kết quả học tập
của học sinh ở nhà trưởng phô thông, phương pháp soạn thảo, phân tích hệ thông
câu hỏi thi theo lý thuyết đánh giá hiện đại.
Khách thê nghiên cứu: Các yêu cầu cần đạt nằm trong mạch nội dung Sinh học
cơ thê - Sinh lí hô hap, tuần hoàn ở động vật Sinh học 11 và nang lực học sinh 11.
Trang 134 Giả thuyết khoa học
Dựa trên mục đích của ki thi, nguyên tắc viết câu hỏi thi, ta có ma trận chỉ tiết
của đề thi từ đó xây dựng đề thi Thử nghiệm và xác định tham s6 đặc trưng của câu
hỏi thi từ đó đánh giá chất lượng câu hỏi thi, tiền đến chuân hóa đề thi.
5 Nhiệm vụ nghiên cứu
1 Dựa trên khảo sát được thực hiện thông qua Google Forms, nghiên cứu nhu cau sử đụng ngân hàng câu hoi trắc nghiệm chuẩn hoá trong giảng dạy và đánh giá năng lực học sinh của giáo viên THPT.
2 Nghiên cứu cơ sở lí luận, thông tin về các nghiên cứu trong và ngoài nước
liên quan đến đánh giá năng lực; đánh giá kết quả học tập: chương trình giáo dục phô
thông môn Sinh học lớp 11 nội dung sinh lí hô hap, tuần hoàn.
3 Xây dựng chu trình *Xây dựng và chuan hoá bộ câu hỏi trắc nghiệm khách
đưa ra kết luận và có phương án điều chỉnh, sửa đôi.
6 Điều chỉnh va dé xuất phương pháp chuẩn hoá bộ câu hỏi
6 Phạm vi nghiên cứu
Tiền hành một đẻ tài nghiên cứu về kiểm tra đánh giá nội dung sinh lí hô hap,
tuần hoàn ở động vật, Sinh học 11, dựa vào các tài liệu liên quan đến kiểm tra đánhgiá, chương trình giáo dục phô thông 2018
Thực hiện khảo sát với khoảng 30 giáo viên bộ môn Sinh học tại các trường
THPT trong khu vực TP Hồ Chí Minh.
Thực hiện đánh giá kết quả học tập trên 200 đến 300 học sinh với bộ câu hỏi
trắc nghiệm xây dựng dựa trên quan điểm đánh giá năng lực.
Trang 147 Phương pháp nghiên cứu
7.1 Phương pháp nghiên cứu lý thuyết
a Mục đích:
Thu thập, phân tích, tong hợp thông tin tư liệu từ nhiều nguồn, lĩnh vực khác
nhau về đánh giá kết quả học tập của học sinh theo quan điểm đánh giá năng lực nội
dung sinh lí hô hấp, tuần hoàn sinh học I1.
b Nội dung:
Nghiên cứu thông tin về các nghiên cứu trong và ngoài nước liên quan đến đánh
giá năng lực; đánh giá kết quả học tập; chương trình giáo dục phổ thông môn Sinh
học lớp 11 nội dung sinh lí hô hap, tuần hoàn.
c Cách thức:
Tiền hành nghiên cứu thông tin tư liệu liên quan đến xây dựng và chuân hoá câu
hỏi trắc nghiệm đánh giá năng lực của học sinh; xây dựng ma trận dé thi, đặc tả nội
dung sinh lí hô hấp, tuần hoàn ở động vật dựa trên nội dung và yêu cầu cần đạt theo
chương trình 2018; xây dựng bộ câu hỏi trắc nghiệm đánh gia năng lực học sinh: phân
tích dit liệu thực nghiệm và điễn giải kết quả nghiên cứu
7.2 Phương pháp điều tra
Khảo sát ý kiến, nhu cầu sử dụng ngân hàng câu hỏi trắc nghiệm chuẩn hoá
trong giảng dạy và đánh giá năng lực học sinh của giáo viên bộ môn Sinh học.
c Cách thức Thực hiện khảo sát với 30 giáo viên tại các trường THPT và THCS trong khu vực TP Hỗ Chí Minh.
7.3 Phương pháp đo lường đánh giá kết quả
a Mục dich
Trang 15Phân tích được kết quả kiểm tra kết quả học tập của 200 ~ 300 học sinh lớp 11khu vực TP.HCM Dé đưa ra kết luận va có phương án điều chỉnh, sửa đồi.
§ Những đóng góp mới của khoá luận
Đề tài đã có những đóng góp cụ thê sau:
- Xây dựng và chuẩn hoá 2 bộ cầu hỏi nội dung “Sinh lí hô hap và tuần hoàn" lớp 11 môn Sinh học theo hướng đo lường và đánh giá năng lực học sinh, sử dụng Lý thuyết ứng đáp câu hỏi (IRT).
- Xây dựng được quá trình xây đựng và chuan hoá bộ câu hỏi có ứng dụng IRT.
Trang 16Chương 1 CƠ SỞ LÍ LUẬN VÀ THỰC TIỀN
1.1 Tổng quan nghiên cứu
1.1.1 Tong quan nghiên cứu ngoài nước
Cho đến nay có hai hệ lý luận chính dùng trong lý thuyết đo lường giáo dục,
đó là: lý thuyết trắc nghiệm cô điền (Classical Test Theory - CTT); lý thuyết ứng đápcâu hỏi (Item Response Theory - IRT) IRT ra đời sau CTT và hiện nay trên thế giới
IRT được áp dụng rộng rãi trong các hệ thông đánh giá giáo dục, đặc biệt là ớ Mỹ,
Australia và một số nước phát triên khác.
Bên cạnh về sự nghiên cứu và phát triển của lý thuyết khảo thí cô dién (CTT)
những năm đầu thé ki 20 ở châu Âu và Mỹ, từ thập niên 50 những công trình đầu tiên
về lý thuyết khảo thí hiện đại (IRT) đã được công bố Allen Birnbaum đã viết một
loạt các báo cáo kỹ thuật về các mô hình và mô hình kiểm tra đánh giá tham s6 vào
năm 1957 và 1958 George Rasch (1960) xuất bản cuốn sách của ông dé xuất một số mô
hình cho ứng đáp câu hỏi Trong những năm 1960, nhiều công việc trong lĩnh vực này
đã được đóng góp bởi Baker (1961) về so sánh thực nghiệm giữa các tiêu chí của bài thi.
Samejima dé xuất mô hình đa phân trong năm 1969 Nhóm học giả này đã mang lại các
kết qua đáng kể trong lĩnh vực này Thông qua những năm 1970 và 1980, một nhóm học giả mới nôi lên bao gồm Aldrich (1978), Anderson (1977, 1980), Hambleton và
Swaminathan (1986), Wright and Stone (1979) Swaminathan va Rogers (1981) và
Harris (1989), Cũng có những dong góp quan trong cho lý thuyết khảo thí hiện đại.
Vào những năm 2000, lĩnh vực IRT đã được thúc đây bởi một làn sóng các nhà
nghiên cửu mới những người không chỉ mở rộng các khía cạnh lý thuyết (dự toán,
xác định mô hình, và sự phù hợp), mà còn nâng cao các khía cạnh tính toán và ứng
dụng của nó Nghiên cứu sâu rộng về IRT trong 50 năm qua năm đã được thé hiện
bằng sự gia tăng số lượng các gói phần mềm được thiết kế để phân tích câu hỏi dữ
liệu phản hồi từ các khảo sát hoặc kiểm tra Nhiều phân mềm thương mại khác của
IRT cũng được tạo ra nhờ BILOG, MULTILOG, WINSTEPS, IRTPRO, MPLUS, QUEST, CONQUEST và HLM, là các ví dụ.
Trang 17Ngoài ra đã có những đầu sách nôi tiếng như: “Applications of RaschMeasurement in education” của tác giả Russell Waugh viết năm 2010; “Applications
of item response theory to practical testing” của tác giả Ronald K Hambleton viết
năm 2012; v.v
1.1.2 Tong quan nghiên cứu trong nước
Ở Việt Nam, mô hình IRT đã và đang được nhiều tác giả quan tâm và nghiên
cứu Vi dụ như Dương Thiệu Tổng , Lâm Quang Thiệp, Nguyễn Bảo Hoang Thanh,
Nguyễn Thị Ngọc Xuân, Nguyễn Thị Hồng Minh
Ngoài ra đã và đang có các dé tài nghiên cứu về khoa học đo lường hay xâydựng ngân hàng câu hỏi Ví dụ như bài báo “Phat triển ngân hàng câu hỏi trắc nghiệm
thích ứng đánh giá từ vựng tiếng anh thông dụng: áp dụng IRT và phương pháp cân
bằng dé” bao gồm các tác giả: Nguyễn Thái Ha, Bùi Thị Kim Phượng, Lê Thai Hung
đăng trên Tạp chí Giáo Dục (2023), tr § - 14.
1.2 Cơ sở lí luận
1.2.1 Năng lực và phẩm chất
Chương trình phô thông (CTPT) 2018 đám bao phát triển phẩm chat và nănglực người học thông qua nội dung giáo dục với những kiến thức, kĩ năng cơ bản, thiết
thực, hiện đại; hài hoà đức, trí, thẻ, mĩ; chú trọng thực thành, vận dụng kiến thức, kĩ
năng đã học dé giải quyết van dé trong học tập và đời sóng CTPT 2018 cụ thé hoámục tiêu giáo dục phô thông giúp học sinh làm chủ kiến thức phô thông, biết vậndụng hiệu quả kiến thức, kĩ năng đã học vào đời sống và tự học suốt đời, có địnhhướng lựa chọn nghề nghiệp phù hợp biết xây dựng và phát triển hài hoà các mốiquan hệ xã hội, có cá tính, nhân cách và đời sóng tâm hồn phong phú, nhờ đó có cuộc
song ý nghĩa và đóng góp tích cực vào sự phát triển của đất nước và nhân loại (theo
Chương trình tong thẻ 2018)
Pham chất là những tính tốt thé hiện ở thải độ, hành vi ứng xử của con người:
cùng với năng lực tạo nên nhân cách con người Năng lực là thuộc tính cá nhân được hình thành, phát triển nhờ tố chất sẵn có và quá trình học tập, rèn luyện, cho phép con người huy động tông hợp các kiến thức, kĩ năng vả các thuộc tính cá nhân khác như
Trang 18hứng thú, niềm tin, ý chí, thực hiện thành công một loại hoạt động nhất định, đạtkết quả mong muốn trong những điều kiện cụ thể Năng lực của HS là khả năng làmchủ những hệ thống kiến thức kỹ năng thái độ phù hợp với lứa tuôi và vận hành
(kết nỗi) chúng một cách hợp lý vào thực hiện thành công nhiệm vụ học tập, giải
quyết hiệu quả những van dé đặt ra cho chính các em trong cuộc sông (Theo mô đun
3).
Môn Sinh học, hình thành và phát triển ở học sinh các năng lực sinh học bao
gồm: nhận thức sinh học: tìm hiều thế giới sông: vận dụng kiến thức, kĩ năng đã học.
Ngoài ra còn góp phần với các môn học khác, hoạt động giáo dục khác hình thành
các năng lực và phẩm chất chung đặc biệt là phâm chất yêu nước
Với các thành phan năng lực sinh học sẽ có các biêu hiện khác nhau Năng lực
nhận thức sinh học được biéu hiện ở việc trình bay, phân tích được các kiến thức sinh
học cốt lõi và thành tựu công nghệ sinh học trong các lĩnh vực Cụ thê có thê như:
Nhận biết, kẻ tên, nêu được các đối tượng, khái niệm quy luật, quá trình sống; Biểu
hiện của năng lực tìm hiệu thé giới sống là thực hiện được quy trình tìm hiéu thể giới
song, cụ thé như: Dé xuất các van đẻ liên quan đến thé giới sông; đưa ra phán đoán
và xây dựng giả thuyết; lập kế hoạch thực hiện; thực hiện kế hoạch; Viết, trình bàybáo cáo và thảo luận Năng lực vận dụng kiến thức kĩ năng đã học được biểu hiện quaviệc học sinh có thẻ vận dụng được kiến thức kĩ năng đã học đề giải thích đánh giá
hiện tượng thường gặp trong tự nhiên và trong đời sông: có thái độ và hành vi ứng xử thích hợp.
1.2.2 Do lường, kiểm tra, đánh giá kết quả học tập và đánh giá năng lực
Do lường (Measurement) là một khái niệm chuyên dùng để chỉ sự so sánh mộtvật hay hiện tượng với một thước đo hay chuẩn mực có khả năng trình bảy kết qua
đưới dang thông tin định lượng hoặc định tính Nói cách khác, đo lường liên quan
đến việc sử dụng các con số vào quả trình lượng hoá các sự kiện, hiện tượng hay
thuộc tính (định lượng/đo lường về số lượng).
Trong lĩnh vực giáo dục, thước đo của đo lường thường là tiêu chuẩn hoặc tiêu chi Tham chiếu theo tiêu chuẩn là đôi chiêu kết qua đạt được của người này đôi với
Trang 19những người khác trong cùng một nhóm được đánh giá Ứng với loại tham chiếu này
là các dé thi chuẩn hoá (ví dụ IELTS, SAT) Tham chiếu theo tiêu chí là đối chiếu kếtquả đạt được của HS với mục tiêu, yêu cầu cần đạt của bài học, hoạt động giáo dục
Ứng với loại tham chiều này là các cầu hỏi, nhiệm vụ học tập, đề thi theo tiêu chí.
Kiểm tra là quá trình xem xét, tô chức thu thập thông tin và gắn với hoạt động
đo lường dé đưa ra các kết quả, so sánh, đối chiếu với yêu cầu, mục tiêu hay chuẩn
đã dé ra, với mục đích xác định xem cái gi đã đạt được, cai gi chưa đạt được, nhữngnguyên nhân, các yêu tô ảnh hưởng chỉ phối
Như vậy, trong giáo dục:
- Kiểm tra, đánh giá là một khâu không thé tách rời của quá trình dạy học:
- Kiểm tra, đánh giá là công cụ hành nghè quan trọng của GV;
- Kiểm tra, định giá là một bộ phận quan trọng của quản lý giáo dục, quản lý chất lượng dạy và học
(Theo Module 3).
Đánh giá kết quả học tập (assessment of learning) có mục tiêu chủ yếu là đánh
giá tông kết, xếp loại, lên lớp và chứng nhận kết quả Đánh giá này diễn ra sau khingười học học xong một giai đoạn học tập nhằm xác định xem các mục tiêu dạy học
có được thực hiện không và đạt được ở mức nào GV là trung tâm trong quá trình
đánh giá và người học không được tham gia vào các khâu của quá trình đánh giá.
Đánh giá năng lực: Đánh giá năng lực là đánh giá kiến thức, kĩ năng và thái độcủa người học trong một bối cánh có ý nghĩa Cụ thẻ là đánh giá khả năng của HSvận dụng các kiến thức, kĩ năng đã được học vào giải quyết các tình huống trong học
tập hoặc trong cuộc sống hang ngày Nhằm chứng minh người học có năng lực ở mức
độ nao thì can phải tạo ra bối cảnh, cơ hội, tình huống nhiệm vụ đề người học vận
dụng kiến thức, kĩ năng đã học cùng với các kinh nghiệm của bản thân dé giải quyết.
Thông qua việc hoàn thanh một nhiệm vụ trong bồi cảnh thực, có thẻ đánh giá được
khả năng nhận thức, kĩ năng thực hiện và những giá trị, tình cảm của người học.
Trang 201.2.3 Khái niệm và vai trò đặc tả đề kiểm tra đánh giá
Bản đặc tả đề kiểm tra là một bản mô tả chỉ tiết, có vai trò như một hướng dẫn
dé viết một đề thi hoàn chỉnh Bản đặc tả đề kiểm tra cung cấp thông tin về mục đích
và mục tiêu đánh giá, cau trúc đè, hình thức câu hỏi, số lượng câu hỏi ở mỗi loại, và
phân bố câu hỏi trên mỗi mục tiêu đánh giá
Bản đặc tả đề kiểm tra giúp người dạy thiết kế bài kiểm tra phù hợp với mục
tiêu cần đánh giá, có độ tin cậy, giá trị trong khoảng cho phép Giúp thiết kế các bài kiêm tra có độ đông nhất cao dé phục vụ cùng một mục đích đánh giá.
1.2.4 Các loại câu hỏi trắc nghiệm khách quan
Một trong những công cụ phô biến được dùng trong kiêm tra, đánh giá là câu hỏi Theo Trần Bá Hoành, câu hỏi là dạng cấu trúc ngôn ngữ, dién đạt một nhu cau,
một đòi hói hay một mệnh lệnh cần được giải quyết Khi thiết kế câu hỏi cần dựa vào
các yêu cầu cần dat, mức độ nhận thức, hiểu, vận dụng dé thiết kế cho phù hợp
Câu hoi trắc nghiệm khách quan có các loại sau:
Câu hỏi trắc nghiệm khách quan nhiều lựa chọn: Là dang câu hỏi bao gồm một
câu hỏi và các phương án trả lời Trong các phương án trả lời, có một phương án đúng
hoặc đúng nhất, các phương án còn lại là phương án sai/ phương án nhiễu Dạng câu
hỏi này có hai phần, phần dẫn và phương án trả lời Cụ thẻ như sau:
+ Câu dẫn thường là một câu hỏi, đưa ra một van dé, tình huéng (tranh ảnh, sơ
đô, mẫu vat, thí nghiệm ) yêu cầu HS giải quyết Câu dẫn cần phải rõ rang, ngắn gon
và cho phép HS biết chính xác họ được yêu cầu làm cái gì.
+ Phương án trả lời là những lựa chọn mà HS sẽ chọn ra một đáp đúng nhất
hoặc đúng nhất Trong các phương án trả lời, có hai dạng phương án: phương án
đúng/ chính xác nhất/ đúng nhất/ phù hợp nhat, và phương án nhiễu là những lựa
chọn sai, thiểu chính xác hoặc gần đúng Khi thiết kế phương án trả lời, GV phải chắc
chan có va chỉ có một phương án đúng hoặc đúng nhất Các phương án lựa chọn phải
phù hợp với câu dẫn về mặt ngữ pháp.
Trong câu hỏi trắc nghiệm khách quan nhiều lựa chọn, dạng câu hỏi chọn đáp
án đúng, là dang câu hỏi thường dùng dé kiểm tra mức độ “Biết” của HS và trong các
Trang 21phương án trả lời (A, B, C, D) sẽ có một phương án đúng, còn lại đều không đúng
với yêu cầu của hỏi
Loại câu đúng — sai: Thường bao gồm một câu phát biéu dé phán đoán va điđến quyết định là đúng hay sai
Loại câu điền vào chỗ trồng: Loại câu này đòi hỏi trả lời bằng một hay một cụm
từ cho một câu hỏi trực tiếp hay một câu nhận định chưa đầy đủ
Câu ghép đôi: Loại câu này thường bao gồm hai day thông tin gọi là các câudẫn và các câu đáp Hai day thông tin này có số câu không bằng nhau, một day làdanh mục gồm các tên hay thuật ngữ và một dãy là danh mục gồm các định nghĩa,
đặc điêm Nhiệm vụ của người làm bài là ghép chúng lại một cách thích hợp.
Trong bài luận văn này, tôi sử dụng hoàn toàn câu hỏi trắc nghiệm khách quan nhiều lựa chọn (4 lựa chọn) đề xây dựng hai ngân hàng câu hỏi, mỗi ngân hàng gồm
40 câu trắc nghiệm khách quan.
1.2.5 Lý thuyết đánh giá cỗ điển — Classical Test Theory (CTT)
Lý thuyết trắc trac nghiệm cô điền hay đánh giá cô điện (Classical Test Theory
—CTT là lý thuyết thuộc lĩnh vực đo lường giáo dục và tâm trắc học, làm cơ sở khoahọc cho việc thiết kế và đánh giá các công cụ đo lường năng lực hoặc trình độ của
đối tượng được đo.
Độ khó là chi mức độ khó của câu hỏi trắc nghiệm Độ khó là chỉ tiêu, mức độ
vừa phải đối với trình độ, khả năng nhận thức của người học về câu hỏi Độ khó của
câu hỏi không chi ảnh hưởng đến độ phân biệt của câu hỏi mà còn ảnh hưởng khá lớnđến độ giá trị
Khi số thí sinh khá nhiều, không thé sử dụng công thức cơ bản là P = b (với
P là độ khó; R là số người trả lời đúng: N là số người tham gia) vì dé xảy ra sai sót
Trang 22Lúc này có thê dùng cách phân nhóm cực đoan đề tính độ khó, đồng thời tính được
cả độ phan biệt.
Các bước cụ thê đê phân nhóm cực đoan:
(1) Dựa vào tông điểm trắc nghiệm, dựa vào trình tự từ cao đến thấp, lần lượt
xép hang cac bai thi
(2) Bắt đầu từ bài có điểm nhóm cao nhất lần lượt chọn ra 27% bài được điểm
cao và gọi là nhóm điểm cao.
(3) Bắt đầu từ bài có điểm thấp nhất lần lượt chọn ra 27% bai được điểm thấp
và gọi là nhóm điểm thấp.
(4) Tính độ khó dựa vào công thức sau đây:
Py Py P= +5
Trong do: P là độ khó
Py là độ khó nhóm diém cao
P, là độ khó nhóm điểm thấp
Từ công thức độ giá trị độ khó ở trên, chúng ta có thẻ rút ra được phạm vi giá
trị độ khó là 0 < P < 1 Độ khó vừa phải nam trong khoảng 0.3 đến 0,7
Độ phân biệt
Độ phân biệt là chỉ ra mức phân biệt đối với trình độ thực tế của các thí sinh, kí
hiệu là D Thí nghiệm có độ phân biệt tốt là trình độ thực tế giỏi thì điểm đạt được phải giỏi và ngược lại Nó là chỉ tiêu và căn cứ chủ yếu dé đánh giá chất lượng và lựa chọn dé thi.
Độ phan biệt chia thành độ phần biệt dương (D > 0); độ phan biệt bằng không
(D = 0) va độ phân biệt âm (D < 0) Độ phân biệt dương còn gọi là độ phân biệt tích
cực, độ phân biệt âm gọi là độ phân biệt tiêu cực.
Mức cao thấp của độ phân biệt ảnh hưởng trực tiếp đến độ tin cậy và tính giá trị
của dé thi trắc nghiệm Với giả định độ khó của đẻ thi là 0.50, R.L.Albert đưa ra bảng
“Mối quan hệ giữa độ phân biệt và độ tin cậy” vào năm 1962 như sau:
Trang 2313 Bang 1.1 Mối quan hệ giữa độ phân biệt và độ tin cậy (1962)
D6 phân biệt ở đây là giá trị trung bình Có thê thay răng, nẻu nghĩ tới độ tin
cậy của trắc nghiệm thì nâng cao độ phân biệt là một cách hay Ngoài ra môi quan hệ
giữa độ khó và độ phân biệt như sau:
Bảng 1.2 Mối quan hệ giữa độ khó và độ phân biệt
Trang 24Bảng 1.3 Tiêu chuẩn đánh giá độ phân biệt
Độ phân biệt Dánh giá
Độ tin cậy
Độ tin cậy là mức độ ôn định hoặc đáng tin cậy của kết qua đo lường, nó cũng
dm chỉ việc đo lường có cho kết quả chân thực, khách quan, phản ánh được đúng trình
độ thực tế của thí sinh hay không
Phải làm rõ 3 mặt dưới đây dé có cách nhìn chính xác nhất về độ tin cậy.
(1) Độ tin cậy cho biết mức độ sai số giữa quá trình đo lường thực tế và số đo
chính xác của sự vật.
(2) Độ tin cậy cho biết mức độ tiếp cận giữa tham số tông thé và tham số
mẫu.
(3) Độ tin cậy cho biết mức độ liên hệ giữa 2 lần đo trung lặp hoặc những
đăng trị đo lường.
Độ tin cậy là điều kiện tất yeu đề tiến hành bat kỳ hình thức đo lường nào Đốivới đo lường giáo dục, nó lại càng có ý nghĩa quan trọng bởi đối tượng được đo lườngchủ yếu là các hiện tượng tinh thần và đặc tính không dé nắm bắt Do đó, muốn đođược những điểm chính xác của đối tượng càng cần phải chú ý hơn đến độ tin cậy
Nhờ có độ tin cậy mới phán đoán chính xác giá trị của kết quả đo lường Độ tin
cậy là công cụ hữu hiệu của đo lường giáo dục Vì thé nếu thiểu nó kết quả đo lường
sẽ trở nên vô nghĩa, không có tác dụng.
Căn cứ cách lý giải về điểm số thu được trong thực tế của độ tin cậy, chúng ta
có thé đưa ra phương sai về điểm số thực như sau:
đệ = 07 + of
đ¿ : phương sai của điểm số thực
đệ : phương sai của độ sai số trong mỗi lần tiến hành đo lường Công thức tính toán độ tin cậy là:
Trang 25oF OF
m=—=1-—
* of đệ
Từ công thức trên có thé thay rằng: phương sai của điểm số chỉ sự sai số qua
mỗi lan đo lường càng nhỏ thì độ tin cậy của đo lường càng lớn Giá trị của độ tin cậyđược lấy trong khoảng [0,1], néu như phương sai của sai số do lường là 0 thì độ tincậy là 1; néu phương sai của sai số đo lường bằng phương sai của điểm số được quansát thì độ tin cậy bằng 0
Độ giá trị
Độ giá trị chỉ mức độ chuân xác và hữu dụng của kết quả đo lường, tức là muốn
nói đến đo lường có phải đã đạt được đến mục đích đẻ ra hay không
Phương sai điểm số thu được trong thực tế có thé phán tích cụ thể hơn nữa theo
biểu thức đưới đây:
đệ = đệ + đệ = đ¿ + để + đệ
Tiêm an trong phương sau điểm số: a2
Hệ thông phương sai biến thiên: a7Biến thiên phương sai theo đợt: af
Công thức của độ giá trị là:
Trong công thức nói trên, nêu như phương sai điểm số biến thiên theo đợt và
phương sai điểm số biến thiên hệ thông nhỏ độ giá trị sẽ cao
Quan hệ giữa việc xứ ly độ giá trị và độ tin cậy
Ví dụ, bài thi trắc nghiệm có tính chất giống nhau, số lượng câu hỏi giống nhau,
độ tin cậy cao nhưng độ giá trị sẽ thấp Bài thi trắc nghiệm có tính chất khác nhau sẽ
cho độ giá trị cao, độ tin cậy thấp Từ đó có thé thấy phương pháp dé nâng cao độ giátrị sẽ là: sử dụng những bài trắc nghiệm có tính chất không giéng nhau
Trang 26Các bài thi trắc nghiệm dai sẽ có độ tin cậy lớn, ma độ giá trị lại quan hệ với độ
tin cậy, đo đó muốn nâng cao được độ giá trị có thé kéo dai dung lượng của dé thitrắc nghiệm
Bảng 1.4 Quan hệ giữa độ tin cậy, độ giá trị với số lượng các câu hỏi
Sô lượng So sánh với số lượng các câu hỏi
các câu hỏi | trong bài thi trắc nghiệm đầu tiên
10
kể, với độ giá trị tăng 0.049 và độ tin cậy tăng 0.117 Vậy nên số lượng đề thi trắc
nghiệm tăng một cách thích hợp vừa có thé nâng cao độ tin cậy, vừa có thé nâng cao
độ giá trị.
1.2.6 Lý thuyết ứng đáp câu hỏi — Item Response Theory (IRT)
Đối sách với Lý thuyết Trắc nghiệm cổ điển là Lý thuyết Ung đáp câu hỏi (Item
Response Theory) Lý thuyết Ứng đáp câu hỏi là kết quả kế thừa và phát triển Lýthuyết trắc nghiệm cô điền Được xây dựng dựa trên mô hình toán học mô tả xác suất
làm đúng câu hỏi phụ thuộc vao năng lực người dự thi và các tham số đặc trưng của
câu hỏi.
Lịch sử nghiên cứu
Được xây dựng tir nửa sau thé ky XX, lý thuyết nay đòi hỏi nhiều tính toán,nhưng nhờ sự tiền bộ vượt bậc của công nghệ tính toán bằng máy tính điện tử vào
cuối thể kỷ XX - đầu thé ky XXI nên nó đã phát triển nhanh chóng, đạt được những
thành tựu quan trọng và giúp khoa học đo lường và đánh giá phát triển mạnh mẽ.
Trang 27Trong số các nhà nghiên cứu có nhiêu đóng góp ban đầu cho IRT có thé kẻ tên Lord,
F.M.; Rasch; v.v
Các tham số đặc trưng của câu hỏi trắc nghiệm
Trong những năm 1950 đến 1960, Geogre Rasch — nhà toán học Dan Mạch đã
đưa ra một loạt các mô hình đo lường Rasch đã đưa ra giả thiết cơ bản như sau: “Mộtngười có năng lực cao hơn một người khác thì xác suất dé người đó trả lời đúng một
câu hỏi bat kì phải lớn hơn xác suất của người khác đó” (Rash, 1960, tr 117) Từ gia thiết đó ông dé ra mô hình lý thuyết ứng đáp câu hỏi một tham số, còn gọi là mô hình
Rash như sau:
P(8): Xác suất trả lời đúng câu hỏi của mức năng lực đang xét
B: Độ khó của câu hỏi.
Nếu ta vẽ tham số P() như là chức năng của đánh giá năng lực, kết quả sẽ cho
ra một đường cong mềm mại hình chữ S như được biểu dién ở hình đưới
Hình 1.1.
Trang 28Khả năng trả lời đúng sẽ gan tiệm cận ở số 0 ở thi sinh có mức năng lực thấpnhất va đường cong này sẽ tăng din đến mức độ cao nhất của mức năng lực và khảnăng trả lời đúng sẽ ở gần số 1 Đường cong chữ S này thê hiện mối quan hệ giữa kha
năng trả lời đúng với thang đo đánh giá năng lực Trong lý thuyết ứng đáp câu hỏi,
nó được gọi la đường cong đặc tính câu hỏi Mỗi một câu hỏi trong bài kiêm tra sẽ có
đường cong đặc tính câu hỏi của riêng nó.
Đường cong đặc tính câu hỏi trong mô hình Rasch chỉ phản ánh mỗi tương
quan giữa năng lực của thí sinh với một tham số duy nhất là độ khó của câu hỏi mà
thiểu đi độ phân biệt của cầu hỏi như lý thuyết khảo thí cô điển Do đó mô hình nàyton tai nhitng han ché nhat định như độ phân biệt của mọi câu hoi trong dé thi là
như nhau, độ dốc phan giữa của đường cong cũng như nhau ở các câu hỏi.
Chính vì vay, nhiều nhà nghiên cứu đã đưa thêm tham số độ phân biệt (a) vào hàm đường cong đặc tính câu hỏi, với Allan Birnbaum (1968) là người đề xuất đầu tiên với mô hình hàm hai tham số như sau:
1+e#(8=0)
P(0) =
Chú thích: a: Độ phan biệt
Độ khó của câu hỏi sẽ quyết định xem câu hỏi năm ở mức độ nảo trên thang đo
đánh giá năng lực suy rộng ra độ khó của câu hỏi dé cập đến mức năng lực cần thiết
dé có 50% xác suất trả lời đúng một câu hỏi Độ khó của câu hỏi chính là điểm uốn của đường cong đặc tính câu hỏi Trong hình bên dưới, ba đường cong đặc tính cầu hỏi được biểu diễn trên một biểu đỏ, cả ba đường cong này có độ phân biệt tương
đương tuy nhiên khác nhau về mặt độ khó Đường cong màu xanh dương bên tay tráithê hiện một câu hỏi dễ bởi vì 50% khả năng trả lời đúng cao đối với các thí sinh cómức năng lực thấp là -1 Tương tự, đường cong màu đỏ bên phái thể hiện một câu hoi
ở mức khó hơn vì 50% khả năng trả lời đúng trở lên có ở những thí sinh có mức nang lực cao hơn là +].
Trang 29Đặc | độ phân biệt nhưng có độ khó khác nhau trưng thứ hai
của dudng cong đặc tính câu hỏi là độ phan biệt, thẻ hiện chức năng phân biệt thí sinh
có năng lực tốt và thí sinh có năng lực hạn chế Độ phân biệt rất cần thiết đề xây dựng
độ dốc của đường cong đặc tính câu hỏi ở phần giữa của đường cong này Đường
cong càng cong và dốc thì độ phân biệt càng cao và ngược lại Khái niệm độ phân
biệt được thé hiện ở hình bên dưới Hình này có chứa 3 đường cong đặc tính câu hỏi
có chung độ khó (6 = 1) nhưng khác biệt hoàn toàn về độ phân biệt Đường cong màu
đỏ trên cùng có độ phân biệt cao bởi vì đường cong khá dốc ở đoạn giữa và khả năng
trả lời đúng thay đối rất lớn khi mức năng lực tăng dan từ 0 đến 3 Đường cong màu
xanh dương không thê hiện độ phân biệt vì các thí sinh có mức năng lực khác nhau đều có 50% khả năng trả lời đúng.
— et
am or bh
—t:15
Hình 1.3 Ba đường cong đặc tính câu hoi có cùng
độ khó nhưng có độ phân biệt khác nhau.
Bảng sau đây phân loại các cấp độ khó khác nhau và các cấp độ phân biệt khác
nhau tương ứng theo giá trị tham số f và a
Trang 30Bang 1.5 Đây phân loại các cấp độ khó khác nhau và các cấp độ phân biệt
Độ phân biệt
[ GãmB | Mã [Gite
pe Rae | uc0 | Khôge
-Trong thực tế triển khai các bài thi trắc nghiệm chúng ta đều biết có khi nanglực của thí sinh rất thấp nhưng đo đoán mò hoặc trả lời hú hoạ một câu hỏi nên thí
sinh vẫn có một khả năng nảo đó trả lời đúng câu hỏi Trong trường hợp này, tung độ
tiệm cận trái của đường cong không phải bằng 0 mà bằng một giá trị xác định e nào
đó, với 0 < c < 1, Từ thực tế nêu trên, Allan Birnbaum tiếp tục đề xuất mô hình hàm
ba tham số với việc đưa thêm tham số ¢ phản ánh xác suất giả đoán vào hàm ứng đáp
câu hỏi như sau:
và trực quan hoá bằng đường cong đặc tính câu hỏi.
Đường cong đặc tinh đề thi Khi thực hiện các bài kiếm tra trắc nghiệm, điều thật sự quan tâm là kết quả
phản hồi của toàn bộ các câu trắc nghiệm có trong một bài thi ở một lần duy nhất.
Khi cham điểm phản hỏi của thí sinh sẽ được cham đúng/sai theo đáp án Đáp án đúng sẽ được 1 điểm va đáp án sai sẽ không nhận được điểm nào, va điểm thô sẽ
được tinh bằng cách cộng điểm của các câu hỏi đúng Điểm thô của thi sinh luôn làmột số nguyên và sẽ thuộc khoảng từ 0 đến N, tùy theo số lượng câu hỏi của đẻ thi.Nếu thí sinh làm lại đề thi, và cho rằng họ không nhớ cách họ đã từng trả lời câu hỏi
một điểm thô khác sẽ được ghi nhận và khác với lần thi đầu tiên Giả thiết một thí
Trang 31sinh làm đi làm lại một bài thi nhiều lần và nhận được nhiều điểm số khác nhau, từ
đó có thể đưa ra dy đoán rằng điểm số của anh ta sẽ xoay quanh một giá trị nảo đótrên thang đo năng lực Trong lý thuyết đo lường, giá trị này được biết đến là điểm
thật Trong lí thuyết ứng đáp câu hỏi, khái niệm điểm thật (true score) được sử dụng
dựa trên định nghĩa mả D N Lawley đưa ra, và được tính theo công thức sau:
TS)= Yj (4)
Trong đó:
TS; là điểm số thật của thí sinh với mức năng lực 4, 1 kí hiệu cho một câu hỏi
và P.(Ø,) phụ thuộc vào đường cong đặc tính dé thi duoc str dung.
Nhu vậy, khi ước lượng được mức năng lực của thi sinh (được trình bay ở nội dung sau) và dựa vào đường cong đặc tính từng câu hỏi ở trên, ta sẽ tính toan được xác suất trả lời đúng cho từng câu hỏi trong một dé thi Khi đó điểm số thật của thí
sinh chính là tông hoà của tat ca các xác suất ở các câu hoi Nêu biéu dién chúng trên
đô thị, điểm thật có thé được xem là chức năng của năng lực Trục tung sẽ thê hiện
điểm số thật và sẽ có giới hạn từ 0 đến số lượng câu hỏi trong bài thi, trong khi trục
hoành sẽ thang đo năng lực Và đường cong thé hiện quan hệ giữa chúng là đường
cong đặc tinh đề thi Hình đưới đây thé hiện mô hình đường cong đặc tinh dé thi cho
một đẻ thi có 10 câu hỏi
——— Đường cong đặc tính đẻ thi
- =
Hình 1.4 Đường cong đặc tính của đềthi có 10 câu hỏi trắc nghiệm
Trang 32Đường cong đặc tính dé thi là mối tương quan về mặt chức năng giữa điểm sốthật và thang đo năng lực Đối với bất kì mức năng lực nào, điểm thật cũng có thẻđược tìm thấy thông qua đường cong đặc tính câu hỏi Ví dụ trong hình trên, ta vẽ
một đường dọc ở mức năng lực 1 đi lên, cho đến khi nó giao nhau với đường cong
đặc tinh dé thi, sau đó, vẽ một đường ngang về hướng bên trái cho đến khi nó cắt trục
tung, đường này thê hiện mức điểm thật 7,4 ở mức năng lực 1.
Mục đích chính của đường cong đặc tinh đề thi trong lý thuyết ứng đáp câu hỏi
là cung cấp định nghĩa và cách thức chuyên đổi điểm năng lực thành diém thật Khi
mà chuyên đổi điểm năng lực thành điểm thật, người ra dé sẽ được cho một số liệuliên quan đến số câu hỏi trong đề thi Số liệu liên quan này là một thang điểm hoặc
thang tham khảo để người ra dé có thể tong hợp kết quả Đồng thời, đường cong đặc
tinh dé thi còn hữu hiệu trong việc điều chỉnh độ khó đề nữa Cũng cần thiết phải lưu
ý rằng dạng thức của đường cong đặc tính câu hỏi không phụ thuộc vào tan suất phân
bố của điểm năng lực thí sinh trên thang do năng lực Về mặt này, đường cong đặc
tính đề thi tương tự như đường cong đặc tính câu hỏi: cả hai đều có chức năng làm
mỗi tương quan giữa hai thang đo và không phụ thuộc vào sự phân bô điểm trên thang
đo năng lực.
Đường cong đặc tính đề thi có thé được tông hợp dựa trên công thức của
đường cong đặc tính câu hỏi Mức năng lực tương ứng với nửa điểm thật (số lượngcâu hỏi trong dé thi chia đôi, N/2) nằm đọc theo thang do năng lực sẽ phan ánh độ
khó của dé thi băng giá trị số học Mặt khác, độ dốc của đường cong đặc tính dé thi
sẽ liên quan đến giá trị của điểm thật dựa trên điểm năng lực Trong một sé trường
hợp, đường cong đặc tính dé thi có thé gần như là một đường thăng dọc theo thang
năng lực Trong phan lớn bài kiêm tra, đường cong đặc tính dé thi là một đường
không thăng và đốc mô tả sự giám dan ở các khoảng năng lực Bởi vì không có
công thức tính cho đường cong đặc tinh đề thi nên sẽ không có tham số cho đường
cong đặc tính dé thi Tuy nhiên, đối với đa số nhà khảo thí, có thé dựa vào mức
năng lực tương ứng với nửa điểm thật va độ dốc của đường cong là đủ dé có thé
Trang 33đánh giá, nhận xét đường cong đặc tính đề thi trong công cuộc hiệu chỉnh hoặc sửa
chữa đẻ.
1.2.7 Lý do sử dụng lý thuyết ứng đáp câu hỏi (IRT)
Dù Lý thuyết câu hỏi cô điển đã được sử dụng trong gần 100 năm, nó vẫn phô
biến bởi vi tính đơn giản trong việc áp dụng rộng rãi Tuy nhiên, phương pháp này
vẫn còn một số hạn chế nhất định như:
Một là không thể tách biệt năng lực của thí sinh và các tham số của câu hói (chăng hạn tham số độ khó của câu hỏi theo tỷ lệ thí sinh trả lời đúng, mà tỷ lệ do
phụ thuộc năng lực thí sinh; ngược lại, năng lực thí sinh được xác định theo mức độ
trả lời đúng các câu hỏi mà mức độ này phụ thuộc độ khó của câu hỏi).
Hai là việc xác định độ tin cậy của dé kiểm tra phải đựa vào các đề kiểm tra
tương đương là một yêu cầu rất khó thực hiện
Ba là sai số tiêu chuẩn của phép đo được cho là như nhau đối với mọi thí sinh ở các mức năng lực khác nhau là không hợp lý.
Bon 1a, Lý thuyết trắc nghiệm cô điền là lý thuyết dựa vào cap độ đề kiêm tra
chứ không phải cấp độ câu hỏi, do đó không cho phép tiên đoán được từng thí sinh
có thê đáp ứng thế nào với từng câu hỏi Các thiếu sót nêu trên được khắc phục phan
lớn ở Lý thuyết ứng đáp câu hỏi (IRT).
Điểm nỗi bật của IRT là mô tả được mỗi liên hệ giữa năng lực của mỗi thi sinhvới các tham số của các câu hỏi thông qua sự ứng đáp của mỗi thí sinh đối với mỗicâu hỏi trong đề thí Một điểm đặc biệt nữa là mô hình IRT tách biệt được các tham
số của các câu hỏi với mẫu thí sinh tham gia kiểm tra, cũng như năng lực tiểm tảngcủa mỗi thí sinh với đề thi Do đó các giáo viên cũng như các nhà quản lí giáo dục cóthê áp dụng mô hình IRT dé thiết kế các dé thi trắc nghiệm tiêu chuẩn có mức độ
tương đương cao và đo chính xác năng lực của thí sinh (Theo Doan Hồng Chương).
Từ cơ sở lý luận này, tôi quyết định sử dụng Lý thuyết ứng đáp câu hỏi (IRT)
dé thực hiện dé tài của mình
Trang 341.3 Cơ sở thực tiễn
1.3.1 Mục tiêu, nội dung, phương pháp
Phương pháp: Phương pháp điều tra
Mục tiêu:
Thu thập ý kiến của giáo viên bộ môn Sinh học về ngân hàng câu hỏi trắc
nghiệm chuẩn hoá và tình hình đánh giá kết học tập cũng như đánh giá năng lực học sinh ở các trường THPT.
Nội dung
Khảo sát ý kiến, nhu cầu sử dụng ngân hàng câu hỏi trắc nghiệm chuẩn hoá
trong giảng dạy và đánh giá năng lực học sinh của giáo viên bộ môn Sinh học.
Tất Thành (Yên Bái) THPT Tiên Lữ (Hưng Yên) Hầu hết các thầy cô có kinh
nghiệm lâu năm trong công tác giảng day, thời gian công tác từ 5 đến 27 năm.
Kết quả khảo sát thu được như sau:
Phần 1: Đánh giá kết quả học tập của học sinh theo phương pháp truyền
thống
Câu hỏi 1: Công cụ nao sau đây được các Thây/Cô sử dụng nhiều nhất dé đánh giákết quả học tập của học sinh?
Trang 3525 Hình 1.5 Biéu đồ thé hiện tỉ lệ công cụ đánh giá được sử dụng phố biến.
Nhận xét: Hau het các thay, cô sử dung câu hỏi khách quan 4 lựa chọn để đánh
giá kết quá học tập của học sinh với 85.7% Số ít thầy cô sử dụng câu hỏi điền khuyết
và sản phẩm học tập.
Cau hỏi 2: Trong thực tiền của quá trình dạy học, khi sử dụng công cụ bài thi
tric nghiệm khách quan 4 lựa chọn, phần kết quả mà Thay/C6 sử dụng nhiều nhất để
đánh giá kết quá học tập của học sinh là gì?
học sinh
Hình 1.6 Biéu đô thể hiện tỉ lệ các phương pháp tính điểm
được giáo viên sử dụng khi dùng bài thi trắc nghiệm
khách quan 4 lựa chọn.
Nhận xét: Hầu hết các thay, cô sử dung số câu trả lời đúng với mỗi học sinh,
phương pháp này chỉ phù hợp với quan điềm đánh giá kiến thức, kỳ năng
Câu hỏi 3: Theo các Thay/Cé, điểm số của 1 bài thi trắc nghiệm được tinh từ số
lượng câu hỏi trả lời đúng trên tong số câu hỏi sẽ phản ánh như thé nào vẻ năng lực
giải quyết bài thi của học sinh?
Trang 36Hình 1.7 Biểu đồ khảo sát ý kiến giáo viên về mức độ hiệu qua của
phương pháp tính điểm dựa trên tổng số câu hỏi trả lời đúng.
Nhận xét: Hầu hết các thầy, cô đều nhận thay số điểm dựa trên số lượng câu hỏi
chỉ có thé phan ánh một phan năng lực Có 7,1% nhận xét phan ánh chính xác năng lực
học sinh Như đã nêu trên số điểm được tính đựa trên số lượng câu hỏi trả lời đúng chưa thé phan ánh chính xác năng lực học sinh Tuy nhiên với học sinh có năng lực cao có thẻ
sẽ trả lời đúng phan lớn số câu hoi ké cả câu hỏi khó, nên có thé sẽ phản ánh một phan
năng lực của nhóm năng lực cao.
Câu hỏi 4: Khi thiết kế một bài thi trắc nghiệm đánh giá kết quả học tập của họcsinh, các Thầy/Cô có xây dựng bản đặc tả và ma trận dé thi dựa trên các yêu cầu cần
đạt theo các thành phần năng lực hay không?
@co
@ Không
Hình 1.8 Biểu đồ thể hiện tỉ lệ giáo viên xây dựng ban đặc tả khi thiết kế bài
thi trắc nghiệm
Trang 37Nhận xét: Hau hết thây, cô đều xây dựng bản đặc tả và ma trận dé thi dựa trên
các yêu cân đạt theo thành phần năng lực đẻ thiết kế một bài thi trắc nghiệm đánh giá
kết quả học tập của học sinh
Câu hỏi 5: Khi thiết kế bài thi trắc nghiệm, các Thầy/Cô có quan tâm đến các
thông số của từng câu hỏi được sử dụng như độ khó, độ phân biệt, độ tin cậy hay
không?
Nhận xét: Hầu hết các thầy, cô có nhu cầu ước lượng các thông số của từng câu hỏi như: độ khó, độ phan biệt, độ tin cậy.
Câu hỏi 6: Các Thây/Cô da từng được dao tạo, bồi dưỡng hoặc tập huấn về lí
thuyết trắc nghiệm cô điển (Classical Test Theory) dé chuẩn hoá một bài thi trắc nghiệm hay chưa?
Hình 1.10 Biểu đồ thé hiện tỉ lệ giáo viên được đào tạo, boi dưỡng hoặc tập
huấn về CTT
Trang 38Nhận xét: Có một nửa số thây cô thực hiện khảo sát vẫn chưa được đảo tạo hay
tập huấn vẻ lý thuyết trắc nghiệm cô điển Một phan tư số thay, cô được tập huấnnhưng chưa vận Chỉ có 7 giáo viên trong tông số 28 được tập huắn và sử dụng thường
xuyên Số lượng thay cô được tập huấn quá ít so với nhu cầu của thay, cô.
Cau 7: Các Thay/ Cô hãy cho biết mức độ thực hiện các nội dung công việc sau
đây khi thiết kế một bài thi trắc nghiệm:
Xác địnhnội Xaydyngban Xâydựngma Thiếtkế sưu Tốchứcchohọc Rà soátcác
mChưa bao giờ thực hiện 8 Chỉ thực hiện vải lần
ø Thực hiện thường xuyén # Thực hiện tốt và thành thạo
Hình 1.11 Biểu đồ thể hiện tỉ lệ giáo viên thực hiện các nội dung công việc khi
thiết kế bài thi trắc nghiệm.
Nhận xét: Công tác kiểm tra đánh giá trong quá trình giảng dạy ở giáo viên trung
học phé thông tại địa bàn TP.HCM va cả nước được thực hiện khá tốt Hau hết cácthầy cô đều thực hiện các bước như xác định nội dung đánh giá và yêu cầu cần đạt,xây dựng ban đặc ta và ma trận đề thi, hiệu chỉnh câu hoi sau đánh giá Trong số đó
có từ 21 đến 27 giáo viên trong tông số 28 giáo viên thực hiện thường xuyên và thựchiện thành thạo các bước này Gần 90% thây, cô quan tâm đến các thông số câu hỏi
như độ khó, độ phân biệt nhưng chỉ có 50% thầy, cô được tập huấn về lý thuyết câu
hỏi cô điển và chỉ có một nửa trong số đó thực hiện thường xuyên và thành thạo Có
thê thấy công tác tập huấn cho thây cô vẫn chưa đáp ứng được nhu cầu của thây, cô.Ngoài ra có thé thấy vướng mắt của thay cô rằng có đến hơn 92 giáo viên nhận xét
việc sử dụng phương pháp tính điểm dựa trên tông số câu hỏi đúng là chưa hoặc
Trang 39Cau |: Khi sử dụng bài thi trắc nghiệm làm công cụ đánh giá việc vận dụng các
quy trình kỳ thuật đánh giá theo hướng đo lường và lượng hoá được năng lực của
từng học sinh trên cùng một thang đo nhằm thay thể cho phương pháp truyền thông
có thật sự cần thiết hay không?
@ Không cân thiệt
@ RÁI cần thiết
Hình 1.12 Biểu đồ khảo sát ý kiến giáo viên về mức độ cần thiết của việc thay
thế phương pháp đánh giá truyền thống.
Nhận xét; 89,3% giáo viên thực hiện khảo sát cho rằng cần thay thé phương
pháp truyền thông bang các quy trình kỹ thuật đánh giá theo hướng đo lường va lượng
hoá năng lực của học sinh.
Cau 2: Khi sử dụng bài thi trắc nghiệm làm công cụ đánh giá việc vận dụng các
quy trình kỹ thuật đánh giá có thé ước tính được xác suất giả đoán (xác suất đoán mò đáp án) của từng thí sinh cho mỗi câu hỏi dé lượng hoá đúng năng lực của học sinh
có thật sự can thiết hay không?
Trang 40@ Không cdr triệt
@ Rit cần thik
Hình 1.13 Biểu đồ khảo sát ý kiến giáo viên về mức độ cần thiết của việc
ước tính xác suất giả đoán.
Nhận xét: Hầu hết giáo viên cho rằng việc ước lượng được xác suất giả đoán
của từng thí sinh là rất cần thiết.
Câu 3: Các Thày/Cô đã từng được dao tao, bồi dưỡng hoặc tập huấn vẻ lí thuyếtứng đáp câu hỏi (Item Response Theory) dé đánh giá kết quả học tập của học sinh
hay chưa?
@ Chưa bao git
@ Đã được tip huần nhưng chưa vận
đụng
@ Dã được tập huần và vận đụng thưởng
xuyén
Nhận xét: 60,7% giáo viên chưa bao giờ được đào tạo hay tập huấn về lí thuyết
ứng đáp câu hỏi Tỷ lệ này cao hơn cả tỷ lệ giáo viên chưa được tiếp cận lý thuyết
câu hỏi cô điền (CTT) là 10,7%.
Kết luận: Phân lớn giáo viên đồng ý răng cần thay thé phương pháp truyền thông trong đánh giá năng lực học sinh Có 96,4% giáo viên cho rằng việc ước lượng được
xác suất giả đoán của từng thí sinh là rất cần thiết Với lý thuyết ứng đáp câu hỏi —