Lý thuyết Ứng đáp Câu hỏi Lý thuyết Ứng đáp Câu hỏi (Item Response eory IRT) lý thuyết khoa học đo lường giáo dục, đời từ nửa sau kỷ 20 phát triển mạnh mẽ Trước đó, Lý thuyết Trắc nghiệm cổ điển (Clasical Test eory – CTT), đời từ khoảng cuối kỷ 19 hoàn thiện vào khoảng thập niên 1970, có nhiều đóng góp quan trọng cho hoạt động đánh giá giáo dục, thể số hạn chế Các nhà tâm trắc học (psychometricians) cố gắng xây dựng lý thuyết đại cho khắc phục hạn chế Lý thuyết trắc nghiệm đại xây dựng dựa mô hình toán học, đòi hỏi nhiều tính toán, nhờ tiến vượt bậc công nghệ tính toán máy tính điện tử vào cuối kỷ 20 – đầu kỷ 21 nên phát triển nhanh chóng đạt thành tựu quan trọng chung để biểu diễn mối tương tác chúng Trước hết giả sử ta biểu diễn lực tiềm ẩn TS biến liên tục θ dọc theo trục, từ –∞ đến +∞ Khi xét phân bố lực tập hợp TS đó, ta gán giá trị trung bình phân bố lực tập hợp TS không (0), làm gốc thang đo lực, độ lệch tiêu chuẩn phân bố lực Tiếp đến, chọn thuộc tính CH để đối sánh với lực: tham số biểu diễn thuộc tính quan trọng độ khó b CH (cần lưu ý đại lượng độ khó xác định khác với CTT) Cũng theo cách tương tự biểu diễn độ khó CH biến liên tục dọc theo trục, từ –∞ đến +∞ Khi xét phân bố độ khó tập hợp CH đó, ta chọn giá trị trung bình phân bố độ khó không (0), làm gốc thang đo độ khó, Để đánh giá đối tượng CTT tiếp cận cấp độ độ lệch tiêu chuẩn phân bố độ khó CH đề kiểm tra, lý thuyết trắc nghiệm đại tiếp Chúng ta bắt đầu cách xây dựng hàm đáp cận cấp độ câu hỏi, lý thuyết thường ứng CH cho CH nhị phân, tức CH mà câu trả lời gọi Lý thuyết Ứng đáp Câu hỏi Trong số nhà có mức: (sai) (đúng) Giả thiết sau nghiên cứu có nhiều đóng góp ban đầu cho IRT George Rasch, nhà toán học Đan Mạch, kể tên Lord, F.M.[1] ; Rasch, G.[2] , Wright, B.D.[3] v.v đưa làm sở để xây dựng mô hình hàm đáp ứng CH tham số: Một người có lực cao người khác xác Việc ứng đáp câu hỏi nhị phân suất để người trả lời câu hỏi phải lớn xác suất người sau; tương tự vậy, mô hình đơn chiều câu hỏi khó câu hỏi khác có nghĩa xác suất để người trả lời câu hỏi phải bé xác Chúng ta quy ước gọi người có thuộc tính suất để trả lời câu hỏi sau (Rasch, 1960, tr 117) [2] cần đo lường thí sinh (person -TS) đơn vị Với giả thiết nêu trên, thấy xác suất để TS công cụ để đo lường (test) câu hỏi (item –CH) Để trả lời CH phụ thuộc vào tương quan đơn giản hóa cho mô hình nghiên cứu xuất phát lực TS độ khó CH Chọn Θ để biểu đưa giả thiết sau đây: diễn lực TS, β để biểu diễn độ khó CH - Năng lực tiềm ẩn (latent trait) cần đo có chiều Gọi P xác suất trả lời CH, xác suất phụ (unidimensionality), ta đo chiều thuộc vào tương quan Θ β theo cách đó, ta biểu diễn: lực - Các CH độc lập địa phương (local independence), tức việc trả lời CH không ảnh hưởng đến CH khác f (P ) = Θ β (1) f hàm xác suất trả lời Khi thỏa mãn hai giả thiết nêu không gian lực tiềm ẩn đầy đủ chứa lực Khi ấy, người Lấy logarit tự nhiên (1): ta giả định có hàm đặc trưng câu hỏi (Hàm ĐTCH - Item Characteristic Function) phản ánh mối quan hệ ln f (P ) = ln( Θ β ) = ln Θ − ln β = (θ − b) biến không quan sát (năng lực TS) (2) biến quan sát (việc trả lời CH) Đồ thị biểu diễn hàm gọi đường cong đặc trưng câu hỏi Tiếp đến, để đơn giản, xét mô hình trắc nghiệm nhị (Đường cong ĐTCH - Item Characteristic Curve) phân, Rasch chọn hàm f mức thua (odds) Đối với cặp TS – CH, cần xây dựng thang O, khả thực (likelyhood ratio), tức VIỆC ỨNG ĐÁP CÂU HỎI NHỊ PHÂN ĐỐI VỚI MÔ HÌNH ĐƠN CHIỀU P O = (1−P ) , biểu diễn tỉ số khả trả lời khả trả lời sai Như vậy: P ln (1−P ) =θ−b (3) , P ln (1−P ) gọi logit (log odds unit) Từ đó: ln P = e(θ−b) (1 − P ) Hình Các đường cong ĐTCH hai tham số với giá trị a khác (b = 0) và: e(θ−b) 1+e(θ−b) Có thể thấy tung độ tiệm cận trái đường cong ĐTCH tham số có giá trị 0, điều Biểu thức (4) hàm đặc trưng mô hình ứng có nghĩa TS có lực thấp, tức Θ → đáp CH tham số, hay gọi mô hình Rasch, θ = ln Θ → -∞, xác suất P(θ) trả lời CH Tuy nhiên, thực tế triển khai trắc biểu diễn đồ thị (khi cho b = 0): nghiệm, biết có lực TS thấp đoán mò trả lời hú hoạ CH nên TS có khả trả lời CH Trong trường hợp nêu tung độ tiệm cận trái đường cong mà giá trị xác định c đó, với < c < Từ thực tế nêu trên, người ta đưa thêm tham số c phản ánh tượng đoán mò vào hàm ứng đáp CH để tung độ tiệm cận trái đường cong khác Kết thu biểu thức: P (θ) = (4) a(θ−b) e P (θ) = c + (1 − c) 1+e a(θ−b) Hình Đường cong ĐTCH tham số (6) (6) hàm ĐTCH tham số Rõ ràng θ → -∞, hàm P(θ)→ c Trong trường hợp hàm ĐTCH tham số θ = b có P(θ) = (1+c)/2 Tuy nhiên, biết, CTT, người ta sử Hình biểu diễn đường cong ĐTCH theo mô hình dụng tham số quan trọng thứ hai đặc trưng cho CH tham số với a = tham số c có giá trị 0,1 độ phân biệt, từ nhiều nhà nghiên cứu mong muốn 0,2 đưa đặc trưng vào mô hình đường cong ĐTCH Muốn vậy, đưa thêm tham số a liên quan đến đặc trưng phân biệt CH vào hệ số số mũ hàm e, kết có biểu thức: P (θ) = ea(θ−b) 1+ea(θ−b) (5) (5) hàm ĐTCH tham số Hệ số a biểu diễn độ dốc đường cong ĐTCH điểm có hoành độ θ= b tung độ P(θ) = 0,5 Hàm ĐTCH tham số trình bày hàm ĐTCH tham số theo mô hình Rasch có dạng thức, khác giá trị tham số a (đối với mô hình tham số a = 1) Hình biểu diễn đường cong ĐTCH theo Hình 3: Các đường cong ĐTCH tham số với a = 2, c = 0,1 mô hình tham số với b=0, a 0,5; 1,0; 0,2 1,5; 2,0; 3,0 nên độ dốc đường cong đoạn Mô hình đường cong ĐTCH tham số Allan tăng dần 3 Birnbaum đề xuất [4] , nên gọi Một ưu điểm lớn mô hình Rasch mô hình Birnbaum tách biệt lực TS đặc trưng CH (độ khó) phép đo lường ật vậy, có hai TS có lực θ1 θ2 ứng đáp CH từ biểu Về mô hình Rasch vai trò thức (3) thu ln (O1 /O2 ) = (θ1 – θ2 ), tức xác định lực TS không phụ thuộc độ khó CH Vì tính đối xứng biểu thức, dễ thấy rằng, ngược lại, xác định độ khó Chúng ta chọn mô hình tham số, mô hình CH không phụ thuộc lực TS Chính tính chất Rasch, làm mô hình trình bày mô nên đặt lực TS độ khó hình đường cong ĐTCH mô hình đơn giản CH thang đo để so sánh chúng phản ánh tường minh mối quan hệ TS với CH Tuy nhiên, nói đây, tiến trình Tuy nhiên, số nhà nghiên cứu khác cho lý lịch sử hình thành IRT, mô hình Rasch xuất thuyết dạng toán học mô hình Rasch có nhiều trước mô hình khác Nhà toán học tâm lý lợi thế, nói đến mô hình toán học, tức học người Đan Mạch, George Rasch, có ý tưởng xây nói đến giả định, tiêu chuẩn để đánh giá hiệu dựng “một mô hình cấu trúc cho CH mô hình phù hợp chúng với số liệu đề trắc nghiệm” từ thập niên 1950, đề xuất mô hình thực nghiệm không túy dạng toán học xác suất logistic từ 1953, Mỹ, người ta biết Người ta thường gọi quan điểm Wright quan đến công trình ông từ ông công bố thức điểm “dựa mô hình” (model–based), quan điểm sách xuất năm 1960 [2] Động ngược lại quan điểm “dựa liệu” (data–based) Rasch muốn thể qua mô hình hạn chế việc dựa vào tổng thể TS phân tích đề trắc nghiệm (ĐTN) eo ông, phân tích trắc nghiệm Điểm thực đường cong đặc đáng giá dựa vào cá nhân TS, với thuộc tính TS CH tách riêng Để biện minh cho trưng đề trắc nghiệm quan điểm mình, ông thường dẫn lời nhà tâm lý học Skinner, người ghét việc vào thống kê dựa Trong phép đo lường, để xác định xác giá tổng thể để kết luận thường triển khai nghiên trị đo sai số phép đo người ta thường cứu thực nghiệm cá thể an điểm Rasch thực phép đo nhiều lần Trong trắc nghiệm, đánh dấu chuyển tiếp từ CTT, dựa tổng thể thực tế không làm vậy, quy ước với việc nhấn mạnh đến biện pháp tiêu chuẩn hoá định nghĩa điểm trung bình TS qua hàng ngẫu nhiên hoá, sang IRT với mô hình xác suất tương loạt phép đo ĐTN Điểm quan sát X tác TS CH Sự tồn số liệu ĐTN qua hàng loạt phép đo xem biến ngẫu thống kê đầy đủ tham số CH mô nhiên với phân bố tần suất thường không hình Rasch sử dụng vào việc điều chỉnh biết Giá trị trung bình (kì vọng toán học) phân bố ước lượng tham số lực theo cách thức đặc gọi điểm thực τ TS, có quan hệ sau biệt với điểm quan sát X sai số ε: Cùng khoảng thời gian công bố công trình mình, Rasch mời sang cộng tác nghiên cứu tháng Viện Đại học Chicago Tại đây, B Wright có nhiều đóng góp để nâng cao phát triển mô hình Rasch eo Wright, ý tưởng Rasch việc chọn mô hình logistic với tham số độ khó giải phóng bế tắc việc phát triển IRT nhiều thập niên, nhiều nhà tâm trắc học từ nghiên cứu khẳng định có độ khó ước lượng cách ổn định đầy đủ qua số liệu quan sát loại CH trắc nghiệm nhị phân Do đó, nay, mô hình ĐTCH đơn giản mô hình IRT, có lẽ tính đơn giản đầy đủ nó, mô hình Rasch sử dụng nhiều nghiên cứu tâm lý giáo dục Cũng theo Wright, mô hình Rasch mô hình thoả mãn yêu cầu để xây dựng phép đo lường khách quan khoa học xã hội nói chung, Wright có ý kiến cực đoan không nên sử dụng mô hình khác phép đo lường khách quan ε = X – τ (7) Trong CTT, điểm thực định nghĩa trừu tượng toán học, quy trình để xác định Cũng đó, sai số phép đo ε đại lượng có tính chất trung bình toàn dải lực TS Tuy nhiên IRT, chứng minh điểm thực xác định ĐTN gồm n CH tính theo biểu thức sau đây: τ= ∑n j=1 P (θj ) (8) Tức là: điểm thực TS có lực θ tổng xác suất trả lời CH ĐTN giá trị θ Như vậy, giá trị θ, tiến hành cộng tất đường cong ĐTCH ĐTN, thu đường cong đặc trưng ĐTN, gọi đường cong điểm thực Đường cong đặc trưng 4 HÀM THÔNG TIN CỦA CÂU HỎI VÀ CỦA ĐỀ TRẮC NGHIỆM ĐTN quan hệ hàm số điểm thực thang θ lực: cho trước mức lực tìm Từ biểu thức (9) suy biểu thức hàm thông điểm thực tương ứng qua đường cong đặc trưng ĐTN tin tương ứng với mô hình ứng đáp CH khác Minh họa Hình cho thấy đường cong đặc Đối với mô hình tổng quát tham số, ta có: trưng ĐTN thu cách cộng đường cong ĐTCH Vì chồng chất đường cong ĐTCH i (θ)−ci ) Qi (θ) Ii (θ) = a2i (P(1−c (10) Pi (θ) i) nên đường cong đặc trưng ĐTN có dạng hàm đồng biến Tiệm cận phải đường cong θ → +∞ điểm thực tối đa, n, tức tổng số CH Vì tính độc lập địa phương CH trắc nghiệm, ĐTN Tung độ tiệm cận trái đường cong θ tiến 'hàm thông tin ĐTN' (Test information Function) đến θ → -∞ mô hình tham số, tổng hàm thông tin CH có ĐTN: giá trị tổng cộng tham số đoán mò Σc ∑n toàn n CH ĐTN mô hình tham số I(θ) = i=1 Ii (θ) (11) Độ nghiêng phần đường cong đặc trưng ĐTN liên quan đến độ phân biệt ĐTN Mức lực ứng Ở Hình 5, đường cong nét đậm biểu diễn hàm thông với trung điểm thang điểm thực (n/2) xác định vị tin ĐTN, đường cong nét nhạt hàm trí ĐTN thang lực Hoành độ điểm thông tin CH trắc nghiệm Mức thông tin chung xác định độ khó ĐTN Hai yếu tố độ dốc mức ĐTN cao nhiều so với mức thông tin lực trung điểm thang điểm thực mô tả rõ CH riêng rẽ, tức ĐTN đo lực xác đặc tính ĐTN nhiều so với CH trắc nghiệm Từ định nghĩa hàm thông tin theo công thức (11) thấy rõ: ĐTN có nhiều CH giá trị hàm thông tin cao, tức ĐTN dài thường đo lực xác ĐTN ngắn Hình Đường cong đặc trưng ĐTN gồm CH đường cong ĐTCH tương ứng Một điều lý thú là, biết lực θ TS, nhờ đường cong điểm thực ĐTN cụ thể xác định điểm thực TS thu từ ĐTN mà TS không cần phải làm ĐTN Từ tiên đoán điểm thực TS tình trạng TS đạt hay không đạt Hình 5: Các đồ thị hàm thông tin CH trắc nghiệm điểm cần thiết ĐTN ĐTN CH hợp thành Tùy theo tính chất CH tạo nên ĐTN mà hàm thông tin có giá trị lớn (tức đo xác) khoảng lực xác định giá trị bé (tức đo xác) khoảng lực khác Do đặc điểm nêu trên, hàm thông tin công cụ cực Mỗi CH trắc nghiệm cung cấp lượng thông kì quan trọng IRT, giúp thiết kế ĐTN cho tin lực cần đo TS Birnbaum A phép đo theo mục tiêu xác định Hàm thông tin đề xuất biểu thức hàm hàm thông tin CH (item lý tưởng ĐTN đường nằm ngang, tức information function) biểu diễn sau: phép đo có độ xác khoảng lực Tuy nhiên, ĐTN ′ [Pi (θ)] Ii (θ) = Pi (θ)Q (9) tốt mục tiêu cụ thể Chẳng hạn, (θ) i muốn thiết kế ĐTN để cấp học bổng, cần ĐTN I(θ) thông tin cung cấp CH thứ i mức đo xác khoảng hẹp mức lực lực θ, Q(θ)=1- P(θ), P'(θ)là đạo hàm P(θ) theo ranh giới TS không học Hàm thông tin câu hỏi đề trắc nghiệm bổng, tức hàm thông tin có đỉnh cực đại điểm cắt tập cụ thể phải trùng nhau); 2) điều kiện thống kê: (cut–off score), sai số lớn phép đo đường cong hàm thông tin ĐTN phải trùng khoảng lực chuyển TS từ loại khớp phạm vi sai số chấp nhận sang loại không học bổng ngược lại Sai số tiêu chuẩn ĐTN Sai số tiêu chuẩn việc ước lượng lực vị trí θ bằng: σ(θ) = √ I(θ) (12) Biểu thức (12) cho thấy hai đường cong hàm thông tin sai số tiêu chuẩn ĐTN có hình dạng gần đối xứng với qua đường nằm ngang Sự phụ thuộc sai số tiêu chuẩn vào lực θ có ý nghĩa quan trọng, rõ khác biệt CTT IRT Biểu thức (7) cho thấy CTT sai số ε phép đo đại lượng không đổi chung cho ĐTN TS có lực khác Trong đó, IRT, sai số phép đo ĐTN thay đổi theo mức lực Đây biểu việc “cá thể hoá" phép đo lường IRT mà đề cập bàn mô hình Rasch Sai số tiêu chuẩn (θ) việc ước lượng lực θ độ lệch tiêu chuẩn phân bố gần chuẩn ước lượng giá trị lực theo biến cố hợp lý cực đại giá trị lực θ Phân bố tiến đến dạng chuẩn ĐTN đủ dài Tuy nhiên, nhiều nghiên cứu cho thấy chí ĐTN ngắn cỡ 10 – 20 CH, phân bố gần chuẩn thoả mãn số mục đích Biên độ hàm sai số tiêu chuẩn nói chung phụ thuộc vào: 1) số CH ĐTN (số CH lớn sai số tiêu chuẩn bé); 2) chất lượng CH ĐTN (nói chung CH có độ phân biệt cao khả đoán mò thấp tạo sai số tiêu chuẩn bé); 3) độ khó CH gần với giá trị lực đo (tức ĐTN không khó không dễ) Việc tăng số CH ĐTN chọn CH với giá trị hàm thông tin lớn làm tăng giá trị thông tin ĐTN giảm sai số tiêu chuẩn; nhiên hàm thông tin vượt giá trị sai số tiêu chuẩn trở nên ổn định tăng tiếp tục hàm thông tin có tác động không lớn lên giá trị sai số tiêu chuẩn Áp dụng hàm thông tin vào việc khảo sát thiết kế ĐTN Hàm thông tin ĐTN có số ứng dụng quan trọng Trước hết, qua hàm thông tin biết mức độ xác phép đo ĐTN: Giá trị hàm thông tin lớn khoảng lực độ xác phép đo khoảng lực cao, ngược lại Một ứng dụng khác quan trọng hàm thông tin giúp thiết kế ĐTN có mức tương đương cao eo IRT, ĐTN tương đương phải thoả mãn hai điều kiện: 1) điều kiện nội dung mục tiêu, thể trùng hợp ma trận đặc trưng ĐTN (số lượng câu hỏi ô ứng với nội dung mục tiêu học Về việc ước lượng lực thí sinh tham số câu hỏi Như biết, mô hình IRT xét mối tương tác TS có lực θ với CH có tham số a, b, c Tuy nhiên, hoạt động đánh giá thực tế, mà thu trực tiếp từ số liệu kiểm tra việc trả lời CH TS qua trắc nghiệm Từ số liệu thu trực tiếp xác định tham số a, b, c' CH lực θ TS? Đó toán quan trọng IRT, lực TS cuối mà ta muốn biết, tham số CH cần thiết để sử dụng CH nhằm thiết kế công cụ thích hợp để đo lường xác lực TS Bài toán quan trọng giải thuật toán ước lượng lực TS tham số CH, việc tìm thuật toán tốt để giải toán mục tiêu quan trọng IRT, nói định thành công việc áp dụng IRT vào thực tế hoạt động đánh giá Tuy nhiên, muốn trình bày đầy đủ thuật toán nêu cần nhiều kiến thức toán học thống kê học Bạn đọc muốn sâu vào vấn đề tìm hiểu sơ [5] , đầy đủ [6] Ở xin giới thiệu khái quát chất thuật toán ước lượng nói trên, để dễ hiểu, phải hy sinh phần tính xác trình bày Giả sử cần dùng ĐTN gồm 100 CH để xác định lực tiếng Anh 200 TS Khi cho 200 TS làm ĐTN, thu làm chứa ứng đáp TS CH, kết gọi số liệu thực nghiệm Giả sử ứng đáp TS tuân theo quy luật xác định mô hình Rasch, biểu công thức (5) Các giá trị lực θν TS độ khó b CH (5) mà muốn ước lượng Đầu tiên chưa biết chúng, đoán nhận, gán cho chúng giá trị gọi giá trị tiên nghiệm (a priori), tính 100x200=20.000 giá trị xác suất P theo công thức (5); tập hợp xác suất gọi số liệu lý thuyết Bằng cách thức giải tích phiếm hàm, người ta tìm số đại diện cho số liệu thực nghiệm số tương ứng đại diện cho số liệu lý thuyết để so sánh số với Với giá trị gán cho số liệu lý thuyết, độ chênh (con số đại diện cho) số liệu lý thuyết (con số đại diện cho) số liệu thực nghiệm thường lớn uật toán phương hướng điều chỉnh giá trị θν b (5) cho sau lần tính lặp độ chênh số liệu lý thuyết số liệu thực nghiệm bé Nếu độ chênh lớn, người ta lại điều chỉnh giá trị θν b (5) tính lặp lần thứ hai Có thể quy ước xem số liệu lý thuyết trùng hợp với số liệu thực nghiệm độ chênh chúng bé giới hạn đó, chẳng hạn bé phần nghìn giá trị chúng Khi độ chênh chưa bé giới hạn đó, người ta tiếp tục trình tính lặp Việc tính lặp thực lần thứ ba, thứ tư,… lần thứ hàng trăm, hàng nghìn cho đạt giới hạn quy định Khi đạt giới hạn quy định độ chênh, chương trình lệnh dừng tính, giá trị θν b thu lần tính lặp cuối giá trị lý thuyết trùng hợp với giá trị thực nghiệm theo mô hình Rasch Với mô hình IRT tham số, trình ước lượng thực theo nguyên tắc tương tự mô tả đây, số tham số tính toán nhiều Một thuật toán thường sử dụng cho quy trình ước lượng nói thuật toán biến cố hợp lý cực đại nhiều thuật toán khác trình bày [6] SO BẰNG VÀ KẾT NỐI CÁC ĐỀ TRẮC NGHIỆM phép đo để xác định tham số Có thể nêu ví dụ đơn giản để minh họa: dùng thước đo dài mét (1 mét thuộc tính thước đo) để đo bàn dài mét (6 mét thuộc tính bàn) uộc tính thước đo thuộc tính bàn bất biến chúng, không thay đổi thực phép đo, tức áp thước vào để đo bàn Hiển nhiên lực TS thay đổi qua trình học tập; tượng không liên quan đến tính bất biến khẳng định Cũng cần lưu ý tính bất biến nói tuân thủ có phù hợp số liệu thực nghiệm mô hình; muốn vậy, điều kiện đề xây dựng mô hình phải thoả mãn (chẳng hạn, tính đơn chiều lực, tính độc lập địa phương CH) Khi phù hợp số liệu thực nghiệm mô hình bị vi phạm tính bất biến không Hơn nữa, tính bất biến đặc điểm mô hình tổng thể nghiên cứu (bởi có liên quan đến phép hồi quy thống kê toàn tổng thể mẫu thử (có thể tìm hiểu [5] ), mẫu thử khác nhau, tính bất biến bị vi phạm mức độ khác Vì việc thực toán ước lượng giá trị lực TS tham số CH phức tạp nên đa số bạn đọc thông thường không cần phải bận tâm nhiều đến thuật toán cụ thể, ngày có nhiều phần mềm chuyên dụng chuyên gia tâm trắc học xây dựng phục vụ toán ước lượng Chẳng hạn sau số phần mềm sử dụng tương đối phổ biến nay: CONQUEST Úc WINSTEPS Mỹ cho mô hình Rasch (một tham số) nhị phân So kết nối đề trắc đa phân, BILOG–MG3 Mỹ cho mô hình 1, 2, tham nghiệm số nhị phân, PARSCALS, MULTILOG cho mô hình đa phân,… Ở Việt Nam phần mềm phục vụ cho toán VITESTA, cho mô hình 1, 2, tham eo IRT, nguyên tắc, tham số CH xác định số nhị phân đa phân, công ty EDTECH–VN không phụ thuộc vào mẫu TS, lực TS đo không phụ thuộc vào ĐTN cụ thể Tuy nhiên xây dựng từ năm 2007 [7] tính chất lý tưởng, tuyệt đối tổng thể Tính bất biến lực thí sinh tham số câu hỏi khảo sát số liệu thực tế hoàn toàn phù hợp với mô Một nhược điểm CTT có phụ thuộc hình giả định, giả thiết khác mô hình tham số CH vào mẫu TS sử dụng để xác định tuân thủ Khi điều kiện nói phần bị vi phạm chúng, phụ thuộc lực đo bất biến tuyệt đối lực TS TS vào CH, tức vào ĐTN cụ thể sử dụng để tham số CH nữa, người ta phải có thao tác đo lường lực Một minh họa rõ ràng đưa giá trị tham số CH lực TS đưa CH trắc nghiệm cho hai nhóm TS làm, thang đo chung để so sánh chúng với nhóm có nhiều TS giỏi nhóm kia, độ khó ao tác đưa tham số CH lực CH xác định theo Lý thuyết trắc nghiệm cổ điển TS thang đo chung gọi so (equating) (tỷ số TS làm tổng số TS tham gia) tất yếu So yêu cầu quan trọng thực tiễn đánh khác nhau, tức giá trị độ khó phụ thuộc vào mẫu giá Chẳng hạn, có hai mẫu TS khác đánh TS dựa vào để xác định độ khó Nhược điểm giá hai ĐTN khác nhau, lực mẫu Lý thuyết Trắc nghiệm cổ điển gây khó khăn cho TS ĐTN đo lường thu điểm việc thiết kế ĐTN theo ý muốn, đặc biệt thiết kế Muốn hai điểm hai mẫu TS thu từ hai ĐTN ĐTN tương đương Với IRT, chứng minh từ so sánh với nhau, người ta phải chuyển lý thuyết kiểm chứng qua thực nghiệm nhược chúng thang đo chung, tức so Sau điểm khắc phục, có nghĩa phụ so bằng, lực TS hai mẫu đặt thuộc tham số CH vào mẫu TS dùng để xác thang đo nên so sánh với nhau, định chúng (sample–free) phụ từ giá trị lực chuyển thành điểm thuộc lực xác định TS vào ĐTN cụ thang điểm chung mong muốn thể dùng để đo lực (item–free) Tổng quát hơn, người ta nói tham số CH giá Cũng vậy, hai ĐTN triển khai hai nhóm TS khác để định cỡ (calibration) CH trắc trị lực TS bất biến (invariant) nghiệm, tức xác định tham số chúng, từ Cần hiểu rõ tính bất biến bất biến ĐTN thu tham số CH Muốn tham số CH ĐTN thu từ hai mẫu TS so sánh với người ta phải dùng thủ thuật so nhằm chuyển tham số CH thang đo chung Sau so bằng, giá trị tham số CH từ hai ĐTN đặt thang đo nên so sánh với nhau, chẳng hạn để lựa chọn CH có tham số thích hợp nhằm thiết kế ĐTN theo yêu cầu xác định Có nhiều thủ tục so khác Bạn đọc muốn tìm hiểu tham khảo [5] , tỉ mỉ [8] Về trắc nghiệm đa phân trắc nghiệm đa chiều Khi đặt vấn đề xây dựng mô hình toán phản ánh ứng đáp CH phần đầu viết, để đơn giản cho mô hình, giả thiết việc ứng đáp kiểu nhị phân (0,1) Hơn nữa, TS ta giả thiết lực có tính đơn chiều (hoặc xét chiều lực TS) Tuy nhiên, thực tế đánh giá người ta sử dụng loại CH với kiểu ứng đáp đa phân (polytomous) đánh giá lực đa chiều (multidimentionality) hay đánh giá đồng thời nhiều chiều lực Dưới giới thiệu khái quát trắc nghiệm đa phân đa chiều PCM, Masters xét CH có nhiều hạng (category) điểm để TS đạt được, giả định xác suất để TS đạt hai hạng điểm tuân theo quy luật mô hình Rasch nhị phân Dựa vào giả định nêu trên, CH thứ i đa phân với hạng điểm 0, 1, 2,…, m Masters thu xác suất để TS n đạt điểm x CH thứ i là: P r(Xni = x) = ∑ exp x (θ −δ ) k=0 ∑mi ∑h n ik k=0 (θn −δik ) h=0 exp (12) để tiện việc ký hiệu, quy định ∑đó, exp k=0 (θn − δik ) = Lưu ý biểu thức (13), δ đóng vai trò b mô hình Rasch nhị phân Với quan niệm Masters, mô tả diễn biến xác suất trả lời CH (đạt hạng điểm 1) theo lực θ mô hình Rasch nhị phân ứng biểu thức (4) đường cong P(X = 1) xác suất trả lời sai CH (đạt hạng điểm 0) đường cong P(X = 0) đồ thị Hình Về mô hình trắc nghiệm đa phân Ngoài loại trắc nghiệm nhiều lựa chọn mà trả lời theo hai trạng thái nhị phân (0,1), người ta sử dụng loại bảng hỏi (questionaire) với kiểu trả lời theo thang Likert: ‘’rất không đồng ý, không đồng ý, đồng ý, đồng ý’’ điều tra giáo dục xã hội học nói chung, câu hỏi tự luận bao gồm nhiều Hình Các đường cong ĐTCH trắc nghiệm nhị phân ứng với phần, phần định mức điểm khác nhau, xác suất trả lời sai P(X = 0) xác suất trả lời P(X = 1) gọi chung câu hỏi với ứng đáp đa phân (polytomous) Tương tự, trường hợp CH có hạng điểm 0, Trong thập niên 1970, nghiên cứu trắc nghiệm đường biểu diễn ứng với hạng điểm có dạng chủ yếu tập trung vào việc triển khai ứng dụng mô Hình hình nhị phân, số liệu liên quan đến tính đa phân nhị phân hoá để phân tích Tuy nhiên, số nhà nghiên cứu lưu ý đến mô hình trắc nghiệm đa phân từ cuối thập niên 1960 tập trung mạnh mẽ từ đầu thập niên 1980 Nhà nghiên cứu quan tâm đến mô hình đa phân sớm có lẽ Samejima F., người đưa vào mô hình ứng đáp đa cấp (graded response model) [9] Sau có hàng loạt mô hình đề xuất, tổng quát có lẽ mô hình định giá phần (Partial Credit Model – PCM) Master, G.N.[10] Các mô hình cho phép thu nhiều thông tin lực TS từ CH so với mô hình nhị phân Hình Các đường cong ĐTCH CH PCM có hạng Vì PCM ứng dụng nhiều thực tế, điểm (với δ1