2.1 .Bối cảnh nghiêncứu
2.4. Phân tích dữ liệu
2.4.1. Thẩm định thang đo bằng phương pháp định tính
Thang đo được thẩm định chủ yếu qua việc phỏng vấn lấy ý kiến chuyên gia về yếu tố nội dung, cấu trúc, sự phù hợp với các đối tượng và ngôn ngữ sử dụng, người nghiên cứu tiến hành phân tích ý kiến nhận định của các chuyên gia về sự phù hợp của từng tiêu chí với đánh giá năng lực giảng dạy giáo viên.
Có 03 chuyên gia là nhà quản lý giáo dục, làm công tác giảng dạy, người trực tiếp và có kinh nghiệm trong cơng tác quản lý đào tạo tham gia thẩm định các tiêu chí. Người thứ nhất, 56 tuổi là nhà quản lý giáo dục, lãnh đạo tổ chức, đồng thời cũng là giảng viên và phụ trách mảng công tác đảm bảo chất lượng. Người thứ hai, 49 tuổi là Trưởng phịng Khảo thí và đảm bảo chất lượng giáo dục. Người thứ ba, 35 tuổi, Phó trưởng Bộ mơn Lý luận chính
trị - Tâm lý, có kinh nghiệm cơng tác giảng dạy gần 10 năm. Kết quả thẩm định sẽ được trình bày ở chương sau.
2.4.2. Thẩm định thang đo bằng phương pháp định lượng
Dữ liệu nhận được từ quá trình khảo sát được làm sạch, người nghiên cứu đã tách dữ liệu của nhóm đối tượng học sinh và cán bộ quản lý, giáo viên ra thành 2 trường dữ liệu khác nhau, sau đó đưa vào các phần mềm SPSS, CONQUEST để chạy số liệu. Mơ hình lý thuyết áp dụng để thẩm định thang đo chủ yếu là lý thuyết đánh giá cổ điển (CCT).
Theo Lâm Quang Thiệp (2011) CCT hạn chế hơn IRT ở 5 đặc điểm: 1) Các đặc trưng câu hỏi khơng phụ thuộc nhóm người trả lời; 2) Các điểm mơ tả năng lực người trả lời không phụ thuộc vào bảng hỏi cụ thể mà người trả lời thực hiện; 3) Mơ hình xem xét ở cấp độ câu hỏi chứ không phải cấp độ cả bảng hỏi; 4) Mơ hình khơng địi hỏi các bảng hỏi hoàn toàn tương đương để đánh giá độ tin cậy; 5) Mơ hình cung cấp các sai số khác nhau của phép đo ở từng mức năng lực của người trả lời.
Tuy vậy, những chỉ số về độ khó, độ phân biệt, độ tin cậy và độ giá trị kết hợp với một số chỉ số khác có thể trả lời được câu hỏi nghiên cứu nên những hạn chế của CCT với IRT sẽ được khắc phục bằng cách phân tích thêm 1 số chỉ số trong IRT.
Theo Phạm Xuân Thanh (2011), một số chỉ số thống kê có thể chỉ ra những thuộc tính cụ thể của câu hỏi thi kiểm tra, qua đó chúng ta biết được những câu hỏi tốt và chưa tốt. Đối chiếu với nghiên cứu, có thể hiểu rằng, qua các chỉ số thống kê có thể biết được rằng, những tiêu chí nào phù hợp (câu hỏi tốt) và tiêu chí nào chưa phù hợp (câu hỏi chưa tốt).