1. Yờu cầu về tớnh khỏch quan của phộp đo dựng bài trắc nghiệm
Trắc nghiệm là một phộp đo. Cũng như mọi phộp đo khỏc trong khoa học và đời sống, ở phộp đo bằng trắc nghiệm ta cũng cú một thước đo và một đối tượng đo : thước đo là bài trắc nghiệm và đối tượng là khả năng nào đú của cỏc cỏ thể trong một nhúm thớ sinh. Phộp đo bằng trắc nghiệm phải cú độ giỏ trị, độ tin cậy trong một giới hạn sai số nào đú cú thể chấp nhận được.
Cũng như những phộp đo khỏc, phộp đo bằng trắc nghiệm cũng phải thoả món một số yờu cầu nào đú thỡ nú mới đảm bảo được độ giỏ trị, độ tin cậy. Từ đầu thế kỉ XX, một số nhà nghiờn cứu vềđo lường trong giỏo dục đó phỏt biểu yờu cầu của phộp đo trong giỏo dục. Trong quỏ trỡnh đo, đối tượng đo khụng được làm biến đổi thước đo và ngược lại, thước đo khụng được làm biến đổi kết quảđo được. Khi định cỡ cỏc cõu hỏi trắc nghiệm, mẫu thử khụng được ảnh hưởng lờn cỏc giỏ trị định cỡ, và khi sử dụng cỏc bài trắc nghiệm khỏc nhau được xõy dựng từ một ngõn hàng cõu hỏi đểđo năng lực của thớ sinh, kết quảđo được khụng phụ thuộc vào bài trắc nghiệm.
2. Lý thuyết ứng đỏp cõu hỏi
Trong thế kỉ XX, nhiều nhà nghiờn cứu về đo lường trong tõm lớ và giỏo dục đó nghiờn cứu mụ hỡnh hoỏ việc ứng đỏp cõu hỏi trắc nghiệm để cú thể tớnh toỏn, định lượng cỏc quỏ trỡnh này.
Trước hết, cú thể xem việc một người cú năng lực nào đú trả lời đỳng hay sai một cõu hỏi trắc nghiệm - là một điều ngẫu nhiờn, khụng thể núi trước một cỏch chắc chắn. Do đú, lớ thuyết đỏp ứng cõu hỏi (Iem Response Theory - IRT) phải xõy dựng trờn cơ sở khoa học về xỏc suất và thống kờ. Cỏc cụng trỡnh quan trọng của lớ thuyết này ra đời vào ba thập niờn cuối của thế kỉ XX, được ỏp dụng phổ biến trong thực tiễn và đó đạt được nhiều thành tựu đỏng kể.
3. Cỏc mối quan hệ nguyờn tố trong một phộp đo lường giỏo dục và mụ hỡnh Rasch mụ hỡnh Rasch
Giả sử ra một bài trắc nghiệm gồm 100 cõu hỏi cho một kỡ thi cú 500 thớ sinh tham gia để xỏc định năng lực của thớ sinh về một lĩnh vực nào đú, mỗi thớ sinh cú một mức năng lực βv nào đú về lĩnh vực được đo, và mỗi cõu hỏi trắc nghiệm cú một độ khú δi nào đú. Thớ sinh thứν cú năng lực βvđứng trước cõu hỏi thứ i cú độ khú δi sẽứng đỏp cõu hỏi đú như thế nào ? Trong thớ dụ rừ ràng cú 50 000 mối quan hệ nguyờn tố như vậy.
Nhà toỏn học Đan Mạch Georg Rasch, đó đưa ra một mụ hỡnh "ứng đỏp cõu hỏi" để mụ tả mối tương tỏc nguyờn tố giữa một thớ sinh với một cõu hỏi của bài trắc nghiệm, và dựng mụ hỡnh đú để phõn tớch cỏc dữ liệu thật của bài trắc nghiệm.
Rasch núi : "Một thớ sinh cú khả năng hơn thớ sinh khỏc phải cú một xỏc suất lớn hơn để trả lời đỳng một cõu hỏi bất kỡ. Cũng tương tự như vậy, một cõu hỏi khú hơn một cõu hỏi khỏc cú nghĩa là đối với bất kỡ thớ sinh nào xỏc suất để trả lời đỳng cõu hỏi sau là lớn hơn so với cõu hỏi trước"9.
Dựa trờn giả thiết đú, Rasch đó xõy dựng hàm ứng đỏp cõu hỏi và đường cong ứng đỏp cõu hỏi tương ứng. Để biểu diễn cỏc mối quan hệ này Rasch phải sử dụng cỏc thủ thuật để cú thể biểu diễn được năng lực và độ khú trờn cựng một thang đo : biểu diễn năng lực dưới dạng tỉđối và sử dụng hàm log để biến thương số thành hiệu số. Rasch đó biểu diễn hàm ứng đỏp cõu hỏi dưới dạng hàm mũ.11,12 Pi (βv- δi) = v i v i ( ) ( ) e [1 e ] β −δ β −δ +
trong đú Pi(βv - δi) là xỏc suất trả lời đỳng cõu hỏi, e là cơ số logarit tự nhiờn.
Hỡnh 2. Biểu diễn đường cong ứng đỏp cõu hỏi theo mụ hỡnh Rasch.
Mụ hỡnh Rasch ứng với hàm ứng đỏp cõu hỏi dạng đơn giản nhất, chỉ chứa một tham sốđộ khú. Nhiều nhà nghiờn cứu cũng đưa ra nhiều dạng hàm ứng đỏp cõu hỏi cú dạng phức tạp hơn, hàm chứa hai tham số phản ỏnh cảđộ phõn biệt của cõu hỏi, và hàm chứa ba tham số phản ỏnh cả kết quảđoỏn mũ khi trả lời cõu hỏi.
4. Áp dụng lớ thuyết ứng đỏp cõu hỏi
Từ thập niờn 70 của thế kỉ XX, lớ thuyết ứng đỏp cõu hỏi được ỏp dụng ngày càng rộng rói để tớnh toỏn cỏc kết quảđo đạc năng lực bằng cỏc bài trắc nghiệm và định cỡ cỏc cõu hỏi trắc nghiệm (tức là tớnh toỏn độ khú, độ phõn biệt của cõu trắc nghiệm). Trong cỏc mụ hỡnh ứng đỏp cõu hỏi, mụ hỡnh Rasch được sử dụng nhiều nhất vỡ nú mụ tả quỏ trỡnh ứng đỏp cõu hỏi tương đối đơn giản nhưng kết quả tớnh toỏn khỏ phự hợp với thực tế. Việc tớnh toỏn theo mụ hỡnh Rasch thường được tiến hành như sau : người
ta lấy số liệu thực nghiệm từ kết quả của cỏc cõu hỏi của một bài trắc nghiệm trờn một nhúm mẫu nào đú của thớ sinh, từ đú phỏng tớnh số đo năng lực của mỗi thớ sinh và độ khú của từng cõu hỏi. Từ cỏc số đo phỏng tớnh này, người tớnh toỏn cỏc đường cong ứng đỏp cõu hỏi so sỏnh với cỏc đường cong được dựng từ thực nghiệm và xem xột độ phự hợp giữa chỳng theo một tiờu chuẩn nào đú. Nếu độ phự hợp chưa đạt mức chớnh xỏc quy định, quỏ trỡnh tớnh toỏn được lặp lại cho đến khi cú được sự phự hợp mong muốn. Cỏc phộp tớnh lặp được thực hiện nhanh chúng nhưđược tớnh điện tử.
Thực tế ỏp dụng lớ thuyết ứng đỏp cõu hỏi chứng tỏ lớ thuyết này cho phộp tạo cỏc phộp đo lường trong giỏo dục thoả món hai yờu cầu được đặt ra với một sai số cú thể chấp nhận trong thực tế. Đú là yờu cầu : cỏc đặc trưng của cõu hỏi trắc nghiệm xỏc định qua phộp định cỡ khụng phụ thuộc vào mẫu thớ sinh (sample free) và mức năng lực xỏc định được khụng phụ thuộc vào bài trắc nghiệm (item free). Đú là tớnh bất biến quan
trọng được đề ra đối với phộp đo lường mà mụ hỡnh Rasch cho phộp thoả món11,12. Với việc ỏp dụng lớ thuyết ứng đỏp cõu hỏi và mụ hỡnh Rasch, người ta cú thể dựng cỏc ngõn hàng cõu hỏi trắc nghiệm chứa cỏc cõu hỏi được định cỡ chớnh xỏc, từ đú lập ra đề trắc nghiệm cú khả năng đo lường năng lực với độ chớnh xỏc cao. Nhờ cỏc thành tựu này người ta cú thể thiết kế cỏc trắc nghiệm thớch nghi nhờ mỏy tớnh (computer adapting test - CAT) cho phộp đo lường chớnh xỏc năng lực. Với một số lượng khụng lớn cỏc cõu hỏi trắc nghiệm khụng những cú thể đo được chớnh xỏc năng lực của thớ sinh, mà cũn cú thể ỏp dụng để nõng cao sự chớnh xỏc của cỏc điều tra tõm lớ, dự bỏo xó hội, do đú nú trở thành một cụng cụ để thiết kế cỏc phộp đo lường quan trọng của khoa học xó hội núi chung. Cú thể núi : Lớ thuyết ứng đỏp cõu hỏi tạo một cuộc cỏch mạng thật sự trong phộp đo lường trong tõm lớ và giỏo dục.
Người ta đó soạn thảo nhiều phần mềm mỏy tớnh để tớnh toỏn cỏc phộp đo lường trong giỏo dục dựa vào cỏc mụ hỡnh được xõy dựng bởi lớ thuyết ứng đỏp cõu hỏi. Cỏc phần mềm được sử dụng phổ biến trờn thế giới : BIGSTEP, PASCAL, LOGIST, NOHARM (Mĩ), QUEST, CONQUEST (Úc)12,13,15. Riờng phần mềm QUEST do trung tõm ACER (Australian Center for Educational Research) sản xuất đó được sử dụng nhiều ở Việt Nam trong mấy năm qua.