d. Cõu trắc nghiệm điền khuyết (Completion items)
1.5.4. Áp dụng lý thuyết đỏp ứng cõu hỏ
Từ thập niờn 1970 lý thuyết đỏp ứng cõu hỏi được ỏp dụng ngày càng rộng rói để tớnh toỏn cỏc kết quả đo đạc năng lực bằng cỏc bài trắc nghiệm và định cỡ cỏc cõu trắc nghiệm (tớnh toỏn độ khú, độ phõn biệt). Trong cỏc mụ hỡnh đỏp ứng cõu hỏi, mụ hỡnh Rasch được sử dụng nhiều nhất vỡ nú mụ tả quỏ trỡnh đỏp ứng cõu hỏi
tương đối đơn giản nhưng kết quả tớnh toỏn khỏ phự hợp với thực tế. Việc tớnh toỏn theo mụ hỡnh Rasch thường được tiến hành như sau: Người ta lấy số liệu thực nghiệm từ kết quả trả lời cỏc cõu của một bài trắc nghiệm trờn một nhúm mẫu nào đú từ cỏc thớ sinh, từ đú phỏng tớnh cỏc số đo năng lực của mỗi thớ sinh và độ khú của từng cõu. Từ cỏc số đo phỏng tớnh này người ta tớnh toỏn cỏc đường cong đỏp ứng cõu hỏi, so sỏnh với cỏc đường cong được dựng từ số liệu thực nghiệm và xem xột độ phự hợp giữa chỳng theo một tiờu chuẩn nào đú. Nếu độ phự hợp cõu trắc nghiệm đạt mức chớnh xỏc quy định quỏ trỡnh tớnh toỏn được lặp lại cho đến lỳc đạt được sự phự hợp mong muốn. Cỏc phộp tớnh lặp lại được thực hiện nhanh chúng nhờ mỏy tớnh điện tử.
Thực tế ỏp dụng lý thuyết đỏp ứng cõu hỏi chứng tỏ lý thuyết này cho phộp tạo dựng cỏc phộp đo lường trong giỏo dục thỏa món hai yờu cầu được đặt ra với một sai số cú thể chấp nhận được trong thực tế. Đú là yờu cầu về cỏc đặc trưng của cõu trắc nghiệm xỏc định được qua phộp định cỡ khụng phụ thuộc vào mẫu thớ sinh (sample free) và mức năng lực xỏc định được khụng phụ thuộc vào bài trắc nghiệm (item free). Đú là tớnh bất biến quan trọng được đề ra đối với phộp đo lường mà mụ hỡnh Rasch cho phộp thỏa món.
Với việc ỏp dụng lý thuyết đỏp ứng cõu hỏi và mụ hỡnh Rasch người ta cú thể xõy dựng cỏc ngõn hàng cõu trắc nghiệm chứa cỏc cõu được định cỡ chớnh xỏc, từ đú lập cỏc đề trắc nghiệm cú khả năng đo lường năng lực với độ chớnh xỏc cao. Nhờ cỏc thành tựu này người ta cú thể thiết kế cỏc trắc nghiệm thớch nghi nhờ mỏy tớnh (Computer adaptive test – CAT) cho phộp đo lường chớnh xỏc năng lực với một số lượng khụng lớn cỏc cõu trắc nghiệm thớch hợp. Lý thuyết IRT khụng chỉ ỏp dụng để thiết kế cỏc đề thi trắc nghiệm đo được chớnh xỏc năng lực của thớ sinh, mà cũn cú thể ỏp dụng để nõng cao độ chớnh xỏc của cỏc điều tra tõm lý, dự bỏo xó hội, do đú nú trở thành một cụng cụ để thiết kế cỏc phộp đo lường quan trọng của khoa học xó hội núi chung. Cú thể núi, lý thuyết đỏp ứng cõu hỏi tạo một cuộc cỏch mạng thật sự trong phộp đo lường trong tõm lý và giỏo dục. Người ta đó soạn thảo nhiều phần mềm mỏy tớnh để tớnh toỏn cỏc phộp đo lường trong giỏo dục dựa vào cỏc mụ hỡnh
được xõy dựng bởi lý thuyết đỏp ứng cõu hỏi. Cỏc phần mềm được sử dụng phổ biến trờn thế giới như BIGSTEP, RASCAL, LOGIST, NOHARM (Mỹ), QUEST, CONQUEST (Úc), phần mềm xử lý số liệu thống kờ SPSS. Phần mềm QUEST do trung tõm ACER (Australian Center for Educational Reseach) sản xuất, đó được sử dụng nhiều ở Việt Nam trong mấy năm qua. Ở Việt Nam cũng cú nhiều phần mềm về trắc nghiệm như phần mềm Emsptest –Trường đại học kinh tế thành phố Hồ Chớ Minh, phần mềm Testpro - Trường Đại học kỹ thuật Hưng Yờn, phần mềm Lotus của Nguyễn Phỳ Pha – Trần Trung Ninh, phần mềm iBQ Cat của cụng ty cụng nghệ tin học nhà trường v.v., trong đú Vitesta là một chương trỡnh hỗ trợ phương phỏp trắc nghiệm được phỏt triển bởi Cụng ty CP EDTECH-VN. Đõy là một chương trỡnh phõn tớch đỏnh giỏ cõu hỏi, soạn đề thi, chấm thi trắc nghiệm…được xõy dựng dựa trờn Lý thuyết ứng đỏp cõu hỏi hiện đại [55].