Có nhiều phương pháp khác nhau để đánh giá độ tin cậy của phép đo. Theo các chuyên gia thiết kế trắc nghiệm, có bốn nhóm phương pháp cơ bản sau: nhóm phương pháp đánh giá mức độ kiên định uễ điểm số giữa 107
hai ldn do (test-retest methods); nhém phương pháp sử dung form thay thé twong duong (alternate form methods);
nhóm phương pháp phân đôi số tem của trắc nghiệm (split-half methods); vd nhóm phương pháp đánh giá độ phi hop cua titng item (internal consistency methods).
Nhóm phương pháp thứ nhất: Đề đánh giá độ tin cậy của trắc nghiệm người ta thường so sánh tương quan điểm giữa hai lần đo của cùng một trắc nghiệm trên cùng một đối tượng (test-retest correlation). Một trắc nghiệm có độ tin cậy phải có tính ổn định, tức là có sự tương quan đáng kế giữa hai lần đo. Trong thống kê, nếu trắc nghiệm được thiết kế theo thang định khoảng hay thang định tỷ lệ và mối quan hệ điểm số trắc nghiệm giữa hai lần đo là quan hệ tuyến tính, thì người ta dùng tương quan Pearson (Pearson correlation coeffieient) để đánh giá hệ số tin cậy của trắc nghiệm. Còn nếu trắc nghiệm được thiết kế theo thang định hạng, hoặc mối quan hệ điểm số trắc nghiệm giữa hai lần đo không phải là quan hệ tuyến
tính, thì người ta dùng tương quan Spearman (Spearman rank correlation coefficient) dé đánh gia hệ số tin cậy của trắc nghiệm.
Vì cùng một trắc nghiệm đo bai lần trên cùng một
người, nên sự khác nhau về điểm số giữa hai lần đo được xem là “hoàn toàn do sai số của sự đo lường”.
Nếu có sự khác biệt nhỏ giữa hai lần đo thì người ta có thể kết luận là sai số của phép đo nhỏ và phép đo đó có độ tin cậy cao. Tuy nhiên nhóm phương pháp 108
này cũng có những vấn để (hạn chế), chẳng hạn khoảng cách về thời gian giữa hai lần đo thường có ảnh hưởng đến hệ số tương quan (đo thời gian làm biến đổi những đặc tính được đo) hoặc nghiệm thể có
thêm kinh nghiệm, nghiệm thể có thể quen, nhớ được các câu trả lời... Do vậy hệ số tương quan điểm giữa hai lần đo thường được gọi là hệ số én định của trắc nghiệm hơn là hệ số tin cậy. Tuy nhiên, nhóm phương pháp này đặc biệt có lợi khi người ta quan tâm đến tính ổn định tương đối của trắc nghiệm qua các lần đo (chẳng hạn những trắc nghiệm thăm dò thái độ của cử trì). Cũng tuỳ mục đích của trắc nghiệm và điều kiện thực tế mà khoảng cách giữa hai lần đo có thể được điều chỉnh từ vài ngày, vài tuần đến vài tháng.
Nhóm phương pháp thứ hai: Một trắc nghiệm sử dụng những form tương đương: như form A và form B có hình thức, câu chữ khác nhau nhưng có nội dung giống nhau hoặc tương đương và có những đặc tính thống kê
như nhau hoặc tương đương. Tương quan điểm số giữa form A (lần đo thứ nhất) và form B (lần đo thứ hai) được xem là hệ số tin cậy của trắc nghiệm. Về lý thuyết nhóm phương pháp này có thể khắc phục được những hạn chế ở nhóm phương pháp trước (trắc nghiệm được đo hai lần trên cùng một đối tượng) nhưng lại nảy sinh những vấn để mới. Chẳng hạn, rất tốn kém và rất khó thiết kế một
trắc nghiệm có nhiều form hoàn toàn tương đương.
Nhóm phương pháp thứ ba: Thường được dùng để đánh giá độ tin cậy của một trắc nghiệm khi ta không 199
có điểu kiện đo trắc nghiệm hai lần trên cùng một đối tượng và cũng không thiết kế được các trắc nghiệm tương đương, là phương pháp phân đôi số item của trắc nghiệm thành hai phần (thường chia theo số chẵn và số lẻ) rồi so sánh tương quan điểm giữa hai nửa trắc nghiệm. Đây gọi là phương pháp tính độ tin cậy phân đôi trắc nghiệm (split-half reliability). Vé ly
thuyết, hai nửa trắc nghiệm có thể được xem là hai form tương đương của cùng một trắc nghiệm. Do vậy tương quan điểm số của hai nửa này được xem là hệ số tin cậy của trắc nghiệm.
Công thức tính như sau:
(š X0XE) - (X0)ÄE) Ryoxg = TT ———————————
(Gxo)(Gxe)
XO = Cae item số lẻ XE = Các item số chẳn
Tuy nhiên, khi sử dụng phương pháp này hệ số tín cay sé giảm đi so với
tin cay that cua trắc nghiệm vì trắc nghiệm vốn có số item gấp 2 lần (mà theo lý thuyết,
trắc nghiệm càng có nhiều item thì độ tin cậy càng cao).
RẤt may trong thống kê có công thức khác của Spearman chuyển hệ số tin cậy phân đôi thành hệ số tin cậy của toàn bộ trắc nghiệm gọi là công thức Spearman-Brown prophesy:
(N)Rxx)
R= ——_—
1+ (N-1)(Ryx)
110
N=2
R= Hệ số tin cậy mới (đã được điều chỉnh)
Hạyy = Hệ số tin cậy hiện tại (hệ số tin cậy phân nửa trắc nghiệm, chưa điều chỉnh)
Phương pháp này thường thích hợp cho các thang đo định danh (các phép đo có item gồm 2 lựa chọn:
đúng, sai). Không thể áp dụng phương pháp này đánh giá độ tin cậy ở những trắc nghiệm có các item không tương đương (chẳng hạn các item có độ khó khác nhau).
Nhóm phương pháp thứ tử: Thường được dùng để đánh giá độ tin cậy của trắc nghiệm là các phương pháp đánh giá độ phù hợp của từng item Gnternal consistency methods) sử dụng mô hình hệ số tương quan alpha (Cronbach's Coefficient Alpha). Mé hinh nay danh gia độ tin cậy của phép đo dựa trên sự tính toán phương sai của từng item trong toàn phép đo và tính tương quan điểm của từng item với điểm của tổng các item còn lại của phép đo. Phương pháp này thích hợp cho việc xác định độ tin cậy của các loại trắc nghiệm có các item được thiết kế theo kiểu nhiều mức độ tính theo điểm số (kiểu thang định khoảng hay thang định tỷ lệ).
Công thức tính như sau:
K re";
Ry =a5———— (1-
K-1 đây
)
Ryy = Hé sé tuong quan a
K_ = Số các item của trắc nghiệm