Tiếp đến, chọn một thuộc tính của CH để đối sánh với năng lực: tham số biểu diễn thuộc tính quan trọng nhất đó là độ khó b của CH cần lưu ý là đại lượng độ khó ở đây sẽ được xác định khá
Trang 1Lý thuyết Ứng đáp Câu hỏi
Trang 2Mục lục
1.1 Lịch sử 1
1.2 Ứng dụng 1
1.2.1 Bài toán lãi suất kép 1
1.2.2 Phép thử Bernoulli 1
1.2.3 Derangement 2
1.3 Số e trong giải tích 2
1.3.1 Các đặc điểm khác 2
1.4 Tính chất 3
1.4.1 Hàm tựa-mũ 3
1.4.2 Lý thuyết số 3
1.4.3 Số phức 3
1.5 Biểu diễn của số e 3
1.5.1 Biểu diễn số e dưới dạng liên phân số 3
1.5.2 Số chữ số thập phân đã biết 3
1.6 Số e trong văn hóa máy tính 3
1.7 Xem thêm 3
1.8 Ghi chú 3
1.9 am khảo 3
1.10 Liên kết ngoài 3
2 Lý thuyết Ứng đáp Câu hỏi 4 2.1 Việc ứng đáp câu hỏi nhị phân đối với mô hình đơn chiều 4
2.2 Về mô hình Rasch và vai trò của nó 6
2.3 Điểm thực và đường cong đặc trưng đề trắc nghiệm 6
2.4 Hàm thông tin của câu hỏi và của đề trắc nghiệm 7
2.5 Về việc ước lượng năng lực thí sinh và tham số câu hỏi 8
2.6 So bằng và kết nối các đề trắc nghiệm 9
2.7 Về trắc nghiệm đa phân và trắc nghiệm đa chiều 10
2.8 Tài liệu dẫn 11
2.9 Liên kết ngoài 12
2.10 Nguồn, người đóng góp, và giấy phép cho văn bản và hình ảnh 13
2.10.1 Văn bản 13
i
Trang 3ii MỤC LỤC
2.10.2 Hình ảnh 13 2.10.3 Giấy phép nội dung 13
Trang 4Chương 1
Sốe
Hằng số toán họce làcơ sốcủalogarit tự nhiên ỉnh
thoảng nó được gọi là số Euler, đặt theo tênnhà toán
học ụy Sĩ Leonhard Euler, hoặc hằng số Napier để
ghi công nhà toán họcScotland John Napierngười đã
phát minh ralogarit (e không được nhầm lẫn với γ
-hằng số Euler-Mascheroni, đôi khi được gọi đơn giản là
hằng số Euler) Số e là một trong những số quan trọng
nhất trong toán học[1] Nó có một số định nghĩa tương
đương, một số trong chúng sẽ được đưa ra dưới đây
Số này có tham gia vàođẳng thức Euler
Do e làsố siêu việt, và do đó làsố vô tỉ, giá trị của nó
không thể được đưa ra một cách chính xác dưới dạngsố
thập phân hữu hạnhoặc vô hạn tuần hoàn hoặcphân
số liên tục hữu hạnhay tuần hoàn Nó là mộtsố thực
và do đó có thể được biểu diễn bởi một phân số liên tục
vô hạn không tuần hoàn Giá trị số của e tới 20chữ số
thập phânlà:
2,71828 18284 59045 23536…
1.1 Lịch sử
Chỉ dẫn tham khảo đầu tiên tới hằng số này được xuất
bản vào 1618 trong bảng phụ lục của một công trình
về logarit củaJohn Napier ế nhưng, công trình này
không chứa hằng số e, mà đơn giản chỉ là một danh
sách các logarit tự nhiên được tính toán từ hằng số e.
Có thể là bảng này được soạn bởiWilliam Oughtred
Chỉ dẫn đầu tiên cho biết về hằng số e được phát hiện
bởiJacob Bernoulli, trong khi tìm giá trị của biểu thức:
lim
n →∞
(
1 + 1
n
)n
Việc sử dụng đầu tiên ta từng biết của hằng số, biểu
diễn bởi chữ cái b, là trong liên lạc thư từ giữaGofried
Leibniz và Christiaan Huygens giữa 1690 và 1691
Leonhard Eulerbắt đầu sử dụng chữ cái e cho hằng số
vào 1727, và việc sử dụng e lần đầu tiên trong một ấn
bản là cuốn Mechanica của Euler (1736) Trong những
năm sau đó một số nhà nghiên cứu sử dụng chữ cái c,
e trở nên phổ biến và cuối cùng trở thành tiêu chuẩn.
Lý do chính xác cho việc sử dụng chữ cái e vẫn chưa
được biết, nhưng có thể đó là chữ cái đầu tiên của từ
exponential (tiếng Anh: nghĩa thông thường là tăng nhanh chóng, nghĩa trong toán học làhàm mũ) Một khả năng khác đó là Euler sử dụng nó bởi vì nó là nguyên âmđầu tiên sau a, chữ cái mà ông đã sử dụng
cho một số khác, nhưng tại sao ông lại sử dụng nguyên
âm thì vẫn chưa rõ Dường như không phải Euler sử dụng chữ cái đó bởi vì nó là chữ cái đầu trong tên của ông, do ông là một người rất khiêm tốn, luôn cố gắng tuyên dương đúng đắn công trình của người khác.[2]
1.2 Ứng dụng
1.2.1 Bài toán lãi suất kép
Jacob Bernoulliđã khám phá ra hằng số này khi nghiên cứu vấn đề vềlãi suất kép
Một ví dụ đơn giản là một tài khoản bắt đầu với $1.00
và trả 100% lợi nhuận mỗi năm Nếu lãi suất được trả một lần, thì đến cuối năm giá trị là $2.00; nhưng nều lãi suất được tính và cộng hai lần trong năm, thì $1 được nhân với 1.5 hai lần, ta được $1.00×1.52= $2.25 Lãi kép hàng quý ta được $1.00×1.254 = $2.4414…, và lãi kép hàng tháng ta được $1.00×(1.0833…)12= $2.613035… Bernoulli để ý thấy dãy này tiến tới một giới hạn với
kì lãi kép càng ngày nhỏ dần Lãi kép hàng tuần ta được $2.692597… trong khi lãi kép hàng ngày ta được
$2.714567…, chỉ thêm được hai cent Gọi n là số kì lãi kép, với lãi suất 1/n trong mỗi kì, giới hạn của n rất lớn là một số mà bây giờ ta gọi là số e; với lãi kép liên
tục, giá trị tài khoản sẽ tiến tới $2.7182818… Tổng quát
hơn, một tài khoản mà bắt đầu bằng $1, và nhận được
(1+R) đô-la lãi đơn, sẽ nhận được e R đô-la với lãi kép liên tục
1.2.2 Phép thử Bernoulli
Số e cũng có ứng dụng tronglý thuyết xác suất, trong
đó nó phát triển theo cách mà không hiển nhiên liên quan đến độ tăng hàm mũ Giả sử rằng một con bạc chơi slot machine, một triệu lần,kỳ vọngđược thắng 1
Trang 52 CHƯƠNG 1 SỐE
một lần Khi đóxác suấtmà con bạc không thắng được
gì là (xấp xỉ) 1/e.
Đây là một ví dụ vềphép thử Bernoulli Mỗi lần con
bạc chơi một lượt, có thêm một trong một triệu cơ hội
thắng Việc chơi một triệu lần được mô hình hóa qua
phân phối nhị thức, có liên hệ mật thiết vớiđịnh lý nhị
thức Xác suất thằng k lần và thua các lần còn lại là
(
106
k
) (
10−6)k
(1− 10 −6)10 6−k . Đặc biệt, xác suất không thắng lần nào (k=0) là
(
106
)106
.
Số này rất gần với giới hạn sau ho 1/e
1
e = lim
n →∞
(
1− 1
n
)n
.
1.2.3 Derangement
1.3 Số e trong giải tích
Lý do chính để đưa ra số e, đặc biệt tronggiải tích, là
để lấyvi phânvàtích phâncủahàm mũvàlogarit.[3]
Một hàm mũ tổng quát y=a xcó đạo hàm dưới dạnggiới
hạn:
d
dx a
x= lim
h →0
a x+h − a x
h →0
a x a h − a x
x
( lim
h →0
a h − 1 h
)
.
Giới hạn ở bên phải độc lập với biến x: nó chỉ phụ thuộc
vào cơ số a Khi cơ số là e, giới hạn này tiến tới một, và
do đó e được định nghĩa bởi phương trình:
d
dx e
x = e x
Do đó, hàm mũ với cơ số e trong một số trường hợp
phù hợp để làm giải tích Chọn e, không như một số số
khác, là cơ số của hàm mũ làm cho tính toán chủ yếu
về đạo hàm đơn giản hơn rất nhiều
Một lý do khác đến từ việc xét cơ sốlogarita.[4] Xét
định nghĩa của đạo hàm của logₐx bởi giới hạn:
d
dxloga x = lim
h →0
loga (x + h) − log a (x)
1
x
( lim
u →0
1
uloga (1 + u)
)
.
Một lần nữa, có một giới hạn chưa xác định mà chỉ phụ
thuộc vào cơ số a, và nếu cơ số đó là e, giới hạn là một.
Vậy
d
dxloge x = 1
x .
Logarit trong trường hợp đặc biệt này được gọi là logarit tự nhiên(thường được ký hiệu là “ln”), và nó cũng dễ dàng lấy vi phân vì không có giới hạn chưa xác định nào phải thực hiện trong khi tính toán
Do đó có hai cách để chọn một số đặc biệt a=e Một cách là đặt sao cho đạo hàm của hàm số axlà ax Một
cách khác là đặt sao cho đạo hàm của logarit cơ số a
là 1/x Mỗi trường hợp đều đi đến một lựa chọn thuận
tiện để làm giải tích ực tế là, hai cơ số có vẻ rất khác
nhau này lại chỉ là một, số e.
1.3.1 Các đặc điểm khác
Một số đặc điểm khác của số e: một là vềgiới hạn dãy, một cái khác là vềchuỗi vô hạn, và vẫn còn một số khác
vềtích phân Trên đây ta đã giới thiệu hai tính chất:
1 Số e làsố thựcdương duy nhất mà
d
dt e t = e t :Đạo hàmcủahàm số mũcơ số e chính là hàm số đó
2 Số e là số thực dương duy nhất mà
d
dtloge t = 1
t .
Các tính chất khác sau đây cũng được chứng minh là tương đương:
3 Số e làgiới hạn
e = lim
n →∞
(
1 + 1
n
)n
4 Số e là tổng củachuỗi vô hạn
e =
∞
∑
n=0
1
n! =
1 0!+
1 1!+
1 2!+
1 3!+
1 4!+· · ·
trong đó n! làgiai thừacủa n.
5 Số e là số thực dương duy nhất mà
∫ e
1
1
t dt = 1
(nghĩa là, số e là số mà diện tích dướihyperbolf (t) =
1/t từ 1 tới e là bằng một)
Trang 61.7 XEM THÊM 3
1.4 Tính chất
1.4.1 Hàm tựa-mũ
1.4.2 Lý thuyết số
Chứng minh e là số vô tỉ
Giả sử e là số hữu tỉ, suy ra
e = p
q
Dựa vào công thức:
e =
∞
∑
n=0
1
n! =
1
0!+
1 1!+
1 2!+
1 3!+
1 4!+· · ·
e.q! = (1
0!+
1
1!+
1 2!+· · · ).q! = (1
0!+
1 1!+
1 2!+· · ·+1
q! ).q!+
1
q + 1+
1
(q + 1)(q + 2)+
1
(q + 1)(q + 2)(q + 3)+· · ·
e.q! là số nguyên dương, suy ra: 1
q+1 + (q+1)(q+2)1 +
1
(q+1)(q+2)(q+3)+· · · là số nguyên dương.
Mặt khác: 1
q+1+(q+1)(q+2)1 +(q+1)(q+2)(q+3)1 +· · · <
1
q+1+q+11 − 1
q+2 +q+21 − 1
q+3 + ≤ 2
q+1 ≤ 1
Suy ra điều mâu thuẫn
Vậy e là số vô tỉ
1.4.3 Số phức
1.5 Biểu diễn của số e
1.5.1 Biểu diễn số e dưới dạng liên phân số
e = [[2; 1, 2, 1, 1, 4, 1, 1, 6, 1, 1, 8, 1, , 1, 2n, 1, ]],
4 + 1
Như vây mặc dù e là số vô tỉ nhưng trong biểu diễnliên
phân sốlại phân phối theo quy luật tuyến tính:
2;1-2-1;1-4-1;1-6-1;1-8-1;…
1.5.2 Số chữ số thập phân đã biết
1.6 Số e trong văn hóa máy tính
1.7 Xem thêm
Số Pi
1.8 Ghi chú
[1] Howard Whitley Eves (1969) An Introduction to the History of Mathematics Holt, Rinehart & Winston [2] O'Connor, J.J., and Roberson, E.F.; e MacTutor History
of Mathematics archive: “e number e"; University of
St Andrews Scotland (2001)
[3] See, for instance, Kline, M (1998) Calculus: An intuitive
and physical approach, Dover, section 12.3 “e Derived
Functions of Logarithmic Functions.”
[4] is is the approach taken by Klein (1998)
[5] New Scientist, 21-7-2007, tr 40
[6] Byte Magazine, yển 6, số 6 (tháng 6 năm 1981) tr 392)
“e Impossible Dream: Computing e to 116,000 places with a Personal Computer”
[7] Notable Large Computations: EAlexander J Yee Cập nhật 7/3/2011
1.9 Tham khảo
• Maor, Eli; e: e Story of a Number,ISBN 0-691-05854-7
1.10 Liên kết ngoài
• Số e tới 1 triệu chữ số thập phânvà2 và 5 triệu chữ số thập phân
• Những cách sử dụng ban đầu cho ký hiệu của các hằng số
• e the EXPONENTIAL - the Magic Number
of GROWTH - Keith Tognei, University of Wollongong, NSW, Australia
• An Intuitive Guide To Exponential Functions & e
• Euler’s constanttrên PlanetMath
• E trên MathWorld
• e Approximations: giá trị gần đúng của số e
Trang 7Chương 2
Lý thuyết Ứng đáp Câu hỏi
Lý thuyết Ứng đáp Câu hỏi (Item Response eory
-IRT) là một lý thuyết của khoa học vềđo lường trong
giáo dục, ra đời từ nửa sau của thế kỷ 20 và phát
triển mạnh mẽ cho đến nay Trước đó,Lý thuyết Trắc
nghiệm cổ điển(Clasical Test eory – CTT), ra đời từ
khoảng cuối thế kỷ 19 và hoàn thiện vào khoảng thập
niên 1970, đã có nhiều đóng góp quan trọng cho hoạt
động đánh giá trong giáo dục, nhưng cũng thể hiện một
số hạn chế Các nhàtâm trắc học(psychometricians)
cố gắng xây dựng một lý thuyết hiện đại sao cho khắc
phục được các hạn chế đó Lý thuyết trắc nghiệm hiện
đại được xây dựng dựa trên mô hình toán học, đòi hỏi
nhiều tính toán, nhưng nhờ sự tiến bộ vượt bậc của
công nghệ tính toán bằng máy tính điện tử vào cuối
thế kỷ 20 – đầu thế kỷ 21 nên nó đã phát triển nhanh
chóng và đạt được những thành tựu quan trọng
Để đánh giá đối tượng nào đó CTT tiếp cận ở cấp độ
một đề kiểm tra, còn lý thuyết trắc nghiệm hiện đại tiếp
cận ở cấp độ từng câu hỏi, do đó lý thuyết này thường
được gọi là Lý thuyết Ứng đáp Câu hỏi Trong số các nhà
nghiên cứu có nhiều đóng góp ban đầu cho IRT có thể
kể các tên Lord, F.M.[1]; Rasch, G.[2], Wright, B.D.[3].v.v
2.1 Việc ứng đáp câu hỏi nhị phân
đối với mô hình đơn chiều
Chúng ta sẽ quy ước gọi một con người có thuộc tính
cần đo lường là thí sinh (person -TS) và một đơn vị của
công cụ để đo lường (test) là câu hỏi (item –CH) Để
đơn giản hóa cho mô hình nghiên cứu xuất phát có thể
đưa ra các giả thiết sau đây:
- Năng lực tiềm ẩn (latent trait) cần đo chỉ có một chiều
(unidimensionality), hoặc ta chỉ đo một chiều của năng
lực đó
- Các CH là độc lập địa phương (local independence),
tức là việc trả lời một CH không ảnh hưởng đến các
CH khác
Khi thỏa mãn hai giả thiết nêu trên thì không gian năng
lực tiềm ẩn đầy đủ chỉ chứa một năng lực Khi ấy, người
ta giả định là có một hàm đặc trưng câu hỏi (Hàm ĐTCH
- Item Characteristic Function) phản ánh mối quan hệ
giữa các biến không quan sát được (năng lực của TS)
và các biến quan sát được (việc trả lời CH) Đồ thị biểu
diễn hàm đó được gọi là đường cong đặc trưng câu hỏi
(Đường cong ĐTCH - Item Characteristic Curve) Đối với các cặp TS – CH, cần xây dựng một cái thang chung để biểu diễn các mối tương tác giữa chúng Trước hết giả sử ta có thể biểu diễn năng lực tiềm ẩn của các
TS bằng một biến liên tục θ dọc theo một trục, từ –∞ đến +∞ Khi xét phân bố năng lực của một tập hợp TS nào đó, ta gán giá trị trung bình của phân bố năng lực của tập hợp TS đó bằng không (0), làm gốc của thang
đo năng lực, và độ lệch tiêu chuẩn của phân bố năng lực bằng 1 Tiếp đến, chọn một thuộc tính của CH để đối sánh với năng lực: tham số biểu diễn thuộc tính
quan trọng nhất đó là độ khó b của CH (cần lưu ý là
đại lượng độ khó ở đây sẽ được xác định khác với trong CTT) Cũng theo cách tương tự có thể biểu diễn độ khó của các CH bằng một biến liên tục dọc theo một trục,
từ –∞ đến +∞ Khi xét phân bố độ khó của một tập hợp
CH nào đó, ta chọn giá trị trung bình của phân bố độ khó đó bằng không (0), làm gốc của thang đo độ khó,
và độ lệch tiêu chuẩn của phân bố độ khó CH bằng 1 Chúng ta sẽ bắt đầu bằng cách xây dựng một hàm đáp ứng CH cho một CH nhị phân, tức là CH mà câu trả lời chỉ có 2 mức: 0 (sai) và 1 (đúng) Giả thiết cơ bản sau đây của George Rasch, nhà toán học Đan Mạch, được đưa ra làm cơ sở để xây dựng mô hình hàm đáp ứng CH một tham số:
Một người có năng lực cao hơn một người khác thì xác suất để người đó trả lời đúng một câu hỏi bất kì phải lớn hơn xác suất của người sau; cũng tương tự như vậy, một câu hỏi khó hơn một câu hỏi khác có nghĩa là xác suất để một người bất kì trả lời đúng câu hỏi đó phải bé hơn xác suất để trả lời đúng câu hỏi sau (Rasch, 1960, tr 117)[2] Với giả thiết nêu trên, có thể thấy xác suất để một TS trả lời đúng một CH nào đó phụ thuộc vào tương quan giữa năng lực của TS và độ khó của CH Chọn Θ để biểu diễn năng lực của TS, và β để biểu diễn độ khó của CH Gọi P là xác suất trả lời đúng CH, xác suất đó sẽ phụ thuộc vào tương quan giữa Θ và β theo một cách nào
đó, do vậy ta có thể biểu diễn:
f (P ) = Θ
4
Trang 82.1 VIỆC ỨNG ĐÁP CÂU HỎI NHỊ PHÂN ĐỐI VỚI MÔ HÌNH ĐƠN CHIỀU 5
trong đó f là một hàm nào đó của xác suất trả lời đúng.
Lấy logarit tự nhiên của (1):
ln f (P ) = ln(Θ
β) = ln Θ− ln β = (θ − b)
(2)
Tiếp đến, để đơn giản, khi xét mô hình trắc nghiệm nhị
phân, Rasch chọn hàm f chính là mức được thua (odds)
O, hoặc khả năng thực hiện đúng (likelyhood ratio), tức
O = (1−P ) P , biểu diễn tỉ số của khả năng trả lời đúng
và khả năng trả lời sai
Như vậy:
(1−P ) = θ − b (3),
(1−P ) được gọi là logit (log odds unit).
Từ đó:
(1− P ) = e (θ −b)
và:
P (θ) = 1+e e (θ (θ −b) −b) (4)
Biểu thức (4) chính là hàm đặc trưng của mô hình ứng
đáp CH 1 tham số, hay còn gọi là mô hình Rasch, có thể
biểu diễn bằng đồ thị dưới đây (khi cho b = 0):
Hình 1 Đường cong ĐTCH một tham số
Tuy nhiên, như đã biết, trong CTT, người ta còn sử
dụng một tham số quan trọng thứ hai đặc trưng cho CH
là độ phân biệt, từ đó nhiều nhà nghiên cứu mong muốn
đưa đặc trưng đó vào mô hình đường cong ĐTCH
Muốn vậy, có thể đưa thêm tham số a liên quan đến
đặc trưng phân biệt của CH vào hệ số ở số mũ của hàm
e, kết quả sẽ có biểu thức:
P (θ) = e a(θ−b)
1+e a(θ−b) (5)
(5) chính là hàm ĐTCH 2 tham số Hệ số a biểu diễn độ
dốc của đường cong ĐTCH tại điểm có hoành độ θ= b
và tung độ P(θ) = 0,5
Hàm ĐTCH 2 tham số trình bày trên đây và hàm ĐTCH
1 tham số theo mô hình Rasch có cùng dạng thức, chỉ
khác nhau ở giá trị tham số a (đối với mô hình 1 tham
số a = 1) Hình 2 biểu diễn các đường cong ĐTCH theo
mô hình 2 tham số với b=0, và a lần lượt bằng 0,5; 1,0;
1,5; 2,0; 3,0 nên độ dốc của các đường cong ở đoạn giữa tăng dần
Hình 2 Các đường cong ĐTCH hai tham số với các giá trị a khác nhau (b = 0)
Có thể thấy rằng tung độ tiệm cận trái của các đường cong ĐTCH 1 và 2 tham số đều có giá trị bằng 0, điều
đó có nghĩa là nếu TS có năng lực rất thấp, tức là Θ →
0 và θ = ln Θ → -∞, thì xác suất P(θ) trả lời đúng CH cũng bằng 0 Tuy nhiên, trong thực tế triển khai trắc nghiệm, chúng ta đều biết có khi năng lực của TS rất thấp nhưng do đoán mò hoặc trả lời hú hoạ một CH nên TS vẫn có một khả năng nào đó trả lời đúng CH Trong trường hợp đã nêu thì tung độ tiệm cận trái của đường cong không phải bằng 0 mà bằng một giá trị xác
định c nào đó, với 0 < c < 1 Từ thực tế nêu trên, người
ta có thể đưa thêm tham số c phản ánh hiện tượng đoán
mò vào hàm ứng đáp CH để tung độ tiệm cận trái của đường cong khác 0 Kết quả sẽ thu được biểu thức:
P (θ) = c + (1 − c) e a(θ −b)
1+e a(θ−b) (6)
(6) chính là hàm ĐTCH 3 tham số Rõ ràng khi θ → -∞, hàm P(θ)→ c Trong trường hợp hàm ĐTCH 3 tham số
khi θ = b sẽ có P(θ) = (1+c)/2
Hình 3 biểu diễn các đường cong ĐTCH theo mô hình
3 tham số với a = 2 và các tham số c có giá trị bằng 0,1
và 0,2
Mô hình đường cong ĐTCH 2 và 3 tham số do Allan Birnbaum đề xuất đầu tiên[4], nên đôi khi được gọi là các mô hình Birnbaum
Trang 96 CHƯƠNG 2 LÝ THUYẾT ỨNG ĐÁP CÂU HỎI
Hình 3: Các đường cong ĐTCH 3 tham số với a = 2, c = 0,1 và
0,2.
2.2 Về mô hình Rasch và vai trò
của nó
Chúng ta đã chọn mô hình một tham số, mô hình
Rasch, làm mô hình trình bày đầu tiên trong các mô
hình đường cong ĐTCH vì mô hình này đơn giản nhất
và phản ánh tường minh nhất mối quan hệ giữa TS và
CH Tuy nhiên, như đã nói trên đây, trong tiến trình
lịch sử hình thành IRT, không phải mô hình Rasch xuất
hiện trước các mô hình khác Nhà toán học và tâm lý
học người Đan Mạch, George Rasch, đã có ý tưởng xây
dựng “một mô hình cấu trúc cho các CH trong một
đề trắc nghiệm” từ thập niên 1950, đề xuất mô hình
xác suất logistic đó từ 1953, nhưng ở Mỹ, người ta biết
đến công trình của ông từ khi ông công bố chính thức
trong một cuốn sách xuất bản năm 1960[2] Động cơ
của Rasch muốn thể hiện qua mô hình của mình là hạn
chế việc dựa vào tổng thể TS khi phân tích các đề trắc
nghiệm (ĐTN) eo ông, phân tích trắc nghiệm chỉ
đáng giá khi dựa vào từng cá nhân TS, với các thuộc
tính của TS và CH được tách riêng Để biện minh cho
quan điểm của mình, ông thường dẫn lời nhà tâm lý học
Skinner, người rất ghét việc căn cứ vào thống kê dựa
trên tổng thể để kết luận và thường triển khai nghiên
cứu thực nghiệm trên từng cá thể an điểm của Rasch
đã đánh dấu sự chuyển tiếp từ CTT, dựa trên tổng thể
với việc nhấn mạnh đến biện pháp tiêu chuẩn hoá và
ngẫu nhiên hoá, sang IRT với mô hình xác suất tương
tác giữa một TS và một CH Sự tồn tại của các số liệu
thống kê đầy đủ của các tham số của CH trong mô
hình Rasch có thể được sử dụng vào việc điều chỉnh
ước lượng các tham số năng lực theo một cách thức đặc
biệt
Cùng trong khoảng thời gian công bố công trình của
mình, Rasch được mời sang cộng tác nghiên cứu 3
tháng tại Viện Đại học Chicago Tại đây, B Wright
đã có rất nhiều đóng góp để nâng cao và phát triển
mô hình Rasch eo Wright, ý tưởng của Rasch về
việc chọn mô hình logistic với chỉ một tham số là độ
khó đã giải phóng được bế tắc của việc phát triển IRT
trong nhiều thập niên, vì nhiều nhà tâm trắc học từ các nghiên cứu của mình đã khẳng định rằng chỉ có độ khó
là có thể ước lượng được một cách ổn định và đầy đủ qua số liệu quan sát đối với loại CH trắc nghiệm nhị phân Do đó, hiện nay, tuy là mô hình ĐTCH đơn giản nhất trong các mô hình IRT, và có lẽ cũng chính vì tính đơn giản nhưng đầy đủ của nó, mô hình Rasch đã được
sử dụng nhiều nhất trong các nghiên cứu tâm lý và giáo dục Cũng theo Wright, mô hình Rasch là mô hình duy nhất thoả mãn các yêu cầu để xây dựng các phép đo lường khách quan trong khoa học xã hội nói chung, và Wright có ý kiến khá cực đoan rằng không nên sử dụng các mô hình khác trong các phép đo lường khách quan Một trong những ưu điểm lớn của mô hình Rasch là tách biệt được năng lực của TS và đặc trưng của CH (độ khó) trong phép đo lường ật vậy, nếu có hai TS
có năng lực θ1 và θ2 cùng ứng đáp một CH thì từ biểu thức (3) có thể thu được ln (O1/O2) = (θ1– θ2), tức là
có thể xác định các năng lực của TS không phụ thuộc
độ khó CH Vì tính đối xứng của biểu thức, cũng dễ thấy rằng, ngược lại, có thể xác định các độ khó của
CH không phụ thuộc năng lực TS Chính vì tính chất
cơ bản này nên có thể đặt năng lực của các TS và độ khó của các CH trên cùng một thang đo để so sánh chúng với nhau
Tuy nhiên, một số nhà nghiên cứu khác cho rằng về lý thuyết thì dạng toán học của mô hình Rasch có nhiều lợi thế, nhưng khi nói đến mô hình toán học, tức là nói đến một sự giả định, tiêu chuẩn để đánh giá hiệu quả của mô hình là sự phù hợp của chúng với số liệu thực nghiệm chứ không chỉ thuần túy ở dạng toán học Người ta thường gọi quan điểm của Wright là quan
điểm “dựa trên mô hình” (model–based), còn quan điểm ngược lại là quan điểm “dựa trên dữ liệu” (data–based).
2.3 Điểm thực và đường cong đặc trưng đề trắc nghiệm
Trong các phép đo lường, để xác định chính xác giá trị được đo và sai số của một phép đo người ta thường thực hiện phép đo đó nhiều lần Trong trắc nghiệm, thực tế không làm được như vậy, nhưng có thể quy ước định nghĩa về điểm trung bình của một TS qua hàng loạt phép đo bằng một ĐTN Điểm quan sát X của một ĐTN qua hàng loạt phép đo được xem là một biến ngẫu nhiên với một phân bố tần suất nào đó thường là không biết Giá trị trung bình (kì vọng toán học) của phân bố
đó được gọi là điểm thực τ của TS, có quan hệ như sau với các điểm quan sát X và sai số ε:
ε = X – τ. (7)
Trong CTT, điểm thực được định nghĩa trên đây là một
sự trừu tượng toán học, không có quy trình nào để xác định Cũng do đó, sai số của phép đo ε là một đại lượng
Trang 102.4 HÀM THÔNG TIN CỦA CÂU HỎI VÀ CỦA ĐỀ TRẮC NGHIỆM 7
có tính chất trung bình đối với toàn bộ dải năng lực của
TS Tuy nhiên trong IRT, có thể chứng minh được rằng
điểm thực được xác định bởi một ĐTN gồm n CH có
thể tính theo biểu thức sau đây:
τ =∑n
j=1 P (θ j) (8)
Tức là: điểm thực của một TS có năng lực θ là tổng của
các xác suất trả lời đúng của mọi CH của ĐTN tại giá
trị θ Như vậy, đối với mọi giá trị θ, nếu chúng ta tiến
hành cộng tất cả mọi đường cong ĐTCH trong ĐTN,
sẽ thu được đường cong đặc trưng của ĐTN, hoặc cũng
gọi là đường cong điểm thực Đường cong đặc trưng
của ĐTN là quan hệ hàm số giữa điểm thực và thang
năng lực: cho trước một mức năng lực bất kì có thể tìm
điểm thực tương ứng qua đường cong đặc trưng ĐTN
Minh họa trên Hình 4 cho thấy một đường cong đặc
trưng ĐTN thu được bằng cách cộng 5 đường cong
ĐTCH Vì là chồng chất của các đường cong ĐTCH
nên đường cong đặc trưng ĐTN cũng có dạng một hàm
đồng biến Tiệm cận phải của đường cong khi θ → +∞
bằng điểm thực tối đa, n, tức là bằng tổng số CH trong
ĐTN Tung độ tiệm cận trái của đường cong khi θ tiến
đến θ → -∞ bằng 0 đối với các mô hình 1 và 2 tham số,
và bằng giá trị tổng cộng các tham số đoán mò Σc của
toàn bộ n CH trong ĐTN đối với mô hình 3 tham số.
Độ nghiêng của phần giữa đường cong đặc trưng ĐTN
liên quan đến độ phân biệt của ĐTN Mức năng lực ứng
với trung điểm của thang điểm thực (n/2) xác định vị
trí của ĐTN trên thang năng lực Hoành độ của điểm
đó xác định độ khó của ĐTN Hai yếu tố độ dốc và mức
năng lực ở trung điểm thang điểm thực mô tả khá rõ
đặc tính của một ĐTN
Hình 4 Đường cong đặc trưng của ĐTN gồm 5 CH và 5 đường
cong ĐTCH tương ứng.
Một điều khá lý thú là, khi biết năng lực θ của một TS,
nhờ đường cong điểm thực của một ĐTN cụ thể có thể
xác định được điểm thực của TS thu được từ ĐTN đó
mà TS không cần phải làm ĐTN Từ đó có thể tiên đoán
điểm thực của TS hoặc tình trạng TS đạt hay không đạt
điểm cần thiết đối với một ĐTN mới
2.4 Hàm thông tin của câu hỏi và của đề trắc nghiệm
Mỗi một CH trắc nghiệm cung cấp một lượng thông tin nào đó về năng lực cần đo của các TS Birnbaum A
đã đề xuất biểu thức hàm hàm thông tin của CH (item
information function) được biểu diễn như sau:
I i (θ) = [P i ′ (θ)]2
P i (θ)Q i (θ) (9)
trong đó I(θ) là thông tin cung cấp bởi CH thứ i ở mức
năng lực θ, Q(θ)=1- P(θ), P'(θ)là đạo hàm của P(θ) theo θ
Từ biểu thức (9) có thể suy ra các biểu thức hàm thông tin tương ứng với các mô hình ứng đáp CH khác nhau Đối với mô hình tổng quát 3 tham số, ta có:
I i (θ) = a2i (P i (θ) −c i)2
(1−c i) 2
Q i (θ)
P i (θ) (10)
Vì tính độc lập địa phương của các CH trắc nghiệm, 'hàm thông tin của ĐTN' (Test information Function)
là tổng các hàm thông tin của các CH có trong ĐTN:
I(θ) =∑n
i=1 I i (θ) (11)
Ở Hình 5, đường cong nét đậm biểu diễn hàm thông tin của ĐTN, còn các đường cong nét nhạt là các hàm thông tin của các CH trắc nghiệm Mức thông tin chung của ĐTN cao hơn nhiều so với mức thông tin của từng
CH riêng rẽ, tức là một ĐTN sẽ đo năng lực chính xác hơn nhiều so với chỉ một CH trắc nghiệm Từ định nghĩa hàm thông tin theo công thức (11) có thể thấy rõ: ĐTN càng có nhiều CH thì giá trị của hàm thông tin càng cao, tức là một ĐTN dài thường đo năng lực chính xác hơn một ĐTN ngắn
Hình 5: Các đồ thị hàm thông tin của 5 CH trắc nghiệm và của ĐTN do 5 CH đó hợp thành
Tùy theo tính chất của các CH tạo nên ĐTN mà hàm thông tin sẽ có giá trị lớn (tức là đo chính xác) ở các