Những trắc nghiệm này được phát triển với một tốc độ rất nhanh chóng trong nhiều lĩnh vực nghiên cứu liên quan đến con người, đặc biệt ở Mỹ và các nước phương Tây.Đầu tiên có thể kể đến
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘITRƯỜNG ĐẠI HỌC KHOA HỌC XÃ HỘI VÀ NHÂN VÃN
TÊN ĐỂ TÀI:
XÂY DỤNG MỘT HỆ THỐNG CÂU HỎI TRẮC NGHIỆM KHÁCH QUAN (TEST) DÙNG ĐỂ ĐÁNH GIÁ KẾT QUẢ HỌC TẬP MÔN TÂM LÝ HỌC ĐẠI CƯƠNG CỦA SINH VIÊN ĐẠI HỌC QUỐC GIA HÀ NỘI
Mả sô: QX 2000 - 1 3
Họ và tên chủ trì: TS Nguyễn Hồi Loan
ĐAI H O C Q U Ố C G IA HÁ N ỏ i TRUNG TẨM t h ò n g tin thự v iê n
DT /IrCỊG
Hà Nội, tháng 7 năm 2004
Trang 2ĐẠI HỌC QUỐC GIA HÀ NỘITRƯỜNG ĐẠI HỌC KHOA HỌC XÃ HỘI VÀ NHÂN VĂN
T Ê N Đ Ê TÀI:
XÂY DỰNG MỘT HỆ THỐNG CÂU HỎI TRẮC NGHIỆM KHÁCH QUAN (TEST) DÙNG ĐỂ ĐÁNH GIÁ KẾT QUẢ HỌC TẬP MÔN TÂM LÝ HỌC ĐẠI CƯƠNG CỦA SINH VIÊN ĐẠI HỌC QUỐC GIA HÀ NỘI
Mã sô: QX 2000 - 13
Họ và tên chủ trì: TS N guyễn H ồi Loan
Cán bộ phối hợp nghiên cứu:
Trang 3Chương 1 cơ sở lý luận về việc xây dựng và đánh giá trắc nghiệm 4
1.1 Sơ lược về việc hình thành và phát triển các trắc nghiệm trên thế 4giới
1.2 Việc sử dụng và xủy dựng trắc nghiệm ở Việt Nam 10
1.4 Các bước tiến hành khi xây dựng một trắc nghiệm theo tiêu chí 16(Criterion - referenced test)
1.5 Đánh giá các item của trác nghiệm thông qua phân tích thống kê 23
Chương 2 tổ chức và quá trình nghiên cứu xây dựng trắc nghiệm 42
2.2.2 Quá trình thực hiện xây dựng trắc nghiệm 42
Trang 4J u4
* f\ A
109112oản chất hiện 112
Jng pháp nghiên 118
nãng của các hiện 122lượng tui
3.2.4 Khối kiến li Kinh của các hiện tượng 129tâm lý người
3.2.5 Khối kiến thức thứ năm: Hệ tiK hiệu và phản xạ 1353.2.6 Khối kiến thức thứ sáu: Các trường phái tâm lý học hiện đại 1403.2.7 Khối kiến thức thứ bảy: Sự nảy sinh, hình thành và phát triển 149tâm lý, ý thức
3.2.9 Khối kiến ihức thứ chín: Hoạt động và giao tiếp 1623.2 ] 0 Khối kiến thức thứ mười: Nhân cách ] 663.2 ỉ 1 Khối kiến thức thứ mười một: Cảm giác và Tri giác 173
3.2.13 Khối kiến thức thứ mười ba: Tư duy và Tưởng tượng 2163.2.14 Khối kiến Ihức thứ mười bốn: Ngôn ngữ 2383.2.15 Khối kiến thức thứ mười lăm: Xúc cảm và tình cảm 2433.2.16 Khối kiến thức thứ mười sáu: ý chí và hành động ý chí 249
Trang 5Kết luận và kiến nghị 253
Trang 6Mỏ ĐẦU
1 Tính cấp thiết của đề tài.
Trong lịch sử phát triển của tâm lý học, các nhà tâm lý học luôn trăn trở với ý tưởng cần phải đo lường được một cách khách quan những hiện tượng lâm lý của con người Tư tưởng này đã được hiện thực hoá bằng các trắc nghiệm (test) và các trắc nghiệm này trở thành một công cụ hữu hiệu để đo lường và đánh giá về trí tuệ, tài năng và nhân cách Trắc nghiệm ngày càng được hoàn thiện và phát triển trong nhiều lĩnh vực nghiên cứu các mặt khác nhau của con người, đặc biệt là ở Mỹ và các nước phương Tây,
Tuy vậy, việc sử dụng và đưa trắc nghiệm vào thực tiễn ở Việt Nam còn nhiều hạn chế Chúng ta thường thích nghi hoá các trắc nghiệm của nước ngoài vào việc đo lường các hiện tượng tâm Ịý của người Việt Nam, do vây có những hạn chế nhất định
Trong công tác đào tạo và giáo dục,các loại trắc nghiệm đã được phát triển rộng rãi để đánh giá kỹ năng và kiến thức của học sinh trong mọi môn học Các nhóm trắc nghiệm về thành tích học tập của học sinh được sử dụng rộng rãi ở rất nhiều nước trên thế giới và đã khẳng định vai trò quan trọng của trắc nghiệm trong việc đánh giá và đo lường kết quả của quá trình đào tạo, giáo
Trên cơ sở đó, chúng tôi đã mạnh dạn xây dựng trắc nghiệm khách quan
để đánh giá kết quả học tập mồn Tâm lý học đại cương của sinh viên trường Đại học Khoa học Xã hội và Nhân vãn Việc đưa trắc nghiệm này vào quá trình đánh giá kết quả học tập của sinh viên là một việc làm hết sức cần thiết
và sẽ góp phần nâng cao chất lượng đào tạo của trường Đánh giá kết quả học tập bằng trắc nghiệm sẽ khắc phục được tình trạng sinh viên “học vẹt”, “học tủ” đồng thời sẽ là nhân tố tích cực tác động làm thay đổi cách học của sinh vicn hiện nay
Trang 7Bởi lẽ đó mà chúng tôi đã lựa chọn đề tài nghiên cứu này là bước khởi điiu đưa trắc nghiệm vào nghiên cứu, ứng dụng trong công tác đào tạo và nghiên cứu khoa học của khoa Tâm lý học.
3 Nhiệm vụ nghiên cứu.
- Nghiên cứu những vấn đề lý luận và kỹ thuật làm cơ sở cho việc xây dựng trắc nghiệm đánh giá kết quả học tập môn Tâm lý học đại cương
- Xây dụng bộ trắc nghiệm để đánh giá kết quả học tập môn Tâm lý học đại cương (loại 3 ĐVH T và 4 ĐVHT) của sinh viên trường Đại học Khoa học
Xã hội và Nhân vãn
- Đưa ra các kiến nghị về việc sử dụng trắc nghiệm này để góp phần nâng cao chất lượng đào tạo
4 Giả thuyết nghiên cứu.
Có thể xây dựng được trắc nghiệm khách quan đánh giá kết quả học tập môn Tâm lý học đại cương của sinh viên trường Đại học Khoa học Xã hội và Nhân văn Từ đó, có thể thay thế cách đánh giá bằng trắc nghiệm thay cho cách đánh giá kết quả học tập bằng cách thi viết
5 Phương pháp nghiên cứu.
- Phương pháp nghiên cứu tài liệu: Nhằm tập hợp thông tin, phân tích và tổng hợp những tài liệu trong và ngoài nước để hình thành cơ sở lý luận của đề lài, kỹ thuật xây dựng một trắc nghiệm tâm lý
- Phương pháp thiết kế và kiểm nghiệm trắc nghiệm:
+ Xây dựng các tiêu chí và thiết kế trắc nghiệm
Trang 8+ Thử nghiệm trắc nghiêm để xác định những item phù hợp với đối tượng nghiên cứu.
- Phương pháp chuyên gia: Góp phần làm sáng rõ các vấn đề nghiên cứu
về lý luận và xây dựng trắc nghiệm
- Phương pháp thống kê toán học: Để xử lý số liệu cũng như đánh giá trác nghiệm qua khảo sát
6 Đối tượng, khách thể và phạm vi nghiên cứu.
- Đối tượng nghiên cứu: Nội dung, kỹ thuật, chất lượng của một trắc nghiêm đánh giá kết quả học tập môn học Tâm lý học đại cương của sinh viên Trường Đại học Khoa học Xã hội và Nhân văn
- Khách thể nghiên cứu: 335 sinh viên thuộc các lớp K45, K46, K47, K48 khoa Tâm lý học và sinh viên K48 khoa Xã hội học - Trường Đại học Khoa học Xã hội và Nhân văn
- Phạm vi nghiên cứu: Do điều kiên và thời gian, chúng tôi chỉ tiến hành thử nghiệm test trên 4 lớp sinh viên nêu trên
3
Trang 9tư tưởng đo lường trong tâm lý học đã được nêu ra và ngày càng được thực hiện hoá bằng các trắc nghiêm (Test) về trí tuệ, tài nãng, nhân cách Những trắc nghiệm này được phát triển với một tốc độ rất nhanh chóng trong nhiều lĩnh vực nghiên cứu liên quan đến con người, đặc biệt ở Mỹ và các nước phương Tây.
Đầu tiên có thể kể đến nhà tâm lý học Anh Francis Galton (1822-1911) Năm 1882, ông đã xây dựng một phòng thí nghiệm trong một viện bảo tàng ở Luân Đôn Ở đây, từ những nghiên cứu về nhân trắc (Anthropometry) và sinh trắc (Biometry), ông đã chuyển sang nghiên cứu về tâm trắc (Psychometry) Cống hiến to lớn của ông là đã xây dựng nên kỹ thuật nghiên cứu những khác biệt cá nhân trên cơ sở sử dụng phương pháp thống kê Ông đã cố gắng tìm r a , một phương pháp mô tả toán học quy luật chi phối những khác biệt cá nhân Lần đầu tiên F Galton đã gọi những thử nghiệm được tiến hành tại phòng thí nghiệm của mình là các trắc nghiệm tâm lý (Test)
Nhưng Gustav Fechner (1802-1887) là người đầu tiên thực hiện những đo đạc trong tâm vật lý (1859) Ông đã công bố những kết quả đo đạc về ngưỡng cảm giác và tri g iá c trong cuốn sách "Tâm vât lý học" xuất bản năm 1861
Trang 10Sau đó 20 năm (1879) phòng thí nghiệm tâm lý đầu tiên trên thế giới ra
đời do W undt (1863-1920) sáng lập ở Leipzig (Đức) M ột số đo đạc đầu tiên
này được gọi dưới cái tên chung là trắc nghiệm, nhưng không phải với nghĩa như trắc nghiệm hiện nay, đơn thuần đó chỉ là những đo đạc thực nghiệm theo đúng nghĩa gốc của từ trắc nghiệm: phép thử, thử nghiệm Mục tiêu ban đầu của Wundt không phải là đo lường sự khác biệt ở người mà chủ yếu đo đạc để
mô tả đại cương về hành vi của con người nói chung
Những tư tưởng của W undt đã được J.M.Catell (1860-1944), một học trò
của F.Galton, truyền bá rộng rãi ở Mỹ và chính ở đây, các trắc nghiệm đã phát
triển mạnh mẽ nhất trong suốt hơn một thế kỷ qua Ngay từ những năm 1895-
1896 ở Mỹ đã thành lập hai hội đồng quốc gia để thống nhất những nỗ lực của các nhà trắc nghiệm và đem lại phương hướng chung cho các công trình nghiên cứu của họ Thuật ngữ trắc nghiệm tâm lý được sử dụng rộng rãi sau khi cuốn sách "Các trắc nghiệm và đo lường trí tuệ" của J.M Catell ra đời năm
1890 ở New York Trong lời bạt của cuốn sách này, F Galton đã viết: "Tâm lý
học sẽ không thể trở thành vững chấc và chính xác như các khoa học vật lý, nếu nó không dựa trên thực nghiệm và đo lường Bước quyết định theo hướng này có thể thực hiện được bằng sự vận dụng các loạt trắc nghiệm trí tuệ đối với một số lượng lớn cá thể Các kết quả đó có thể có một giá trị khoa học rõ rệt trong việc vạch ra sự hằng định của các quá trình tâm lý, sự phụ thuộc lẫn nhau
và những biến đổi của chúng trong các hoàn cảnh khác nhau" Trong cuốn sách này, J.Caltell đã đưa ra làm mẫu 50 trắc nghiệm về đo lường trí tuệ
Bước sang thế kỷ 20, thay cho việc chẩn đoán đánh giá các chức năng tâm
lý riêng lẻ, C h.spearm an là người đầu tiên phát triển phương pháp thống kê toán học trong việc xử lý số liệu các nghiên cứu về tâm lý học với công trình
"Trí tuệ chung đã được xác định và đo một cách khách quan" (1905) (General Intelligence Objectively Determined and M easured) Từ đó, người ta chú ý đến mặt lượng hoá các kết quả nghiên cứu của tâm lý học (như khả năng, năng lực,
5
Trang 11thái đ ộ ) thành các con số, số lượng, các chỉ số khách quan và từ đây các trắc nghiệm tâm lý mới thật sự mang những tính chất như nó đang tồn tại hiện nay.Việc sử dụng trắc nghiệm được phát triển rộng rãi trên thế giới kể từ
1905, khi nhà tâm lý học Pháp Alfred Binet (1857-1911) cộng tác với bác sĩ lâm Ihần Theodre Simon (1873-1961) thực hiện trắc nghiệm nghiên cứu năng lực trí tuệ của trẻ em Sau khi đã thực hiện trên nhiều đối tượng và tổng kết iheo các tiêu chuẩn thống kê, những kết quả này đã trở thành trắc nghiệm để xác định mức độ phát triển trí tuệ, được gọi là thang đo lường trí tuệ Binet- Simon Bộ trắc nghiệm xuất bản lần đầu tiên gồm 50 bài tập dùng cho trẻ 3-11 tuổi (1905) Lần xuất bản thứ hai (1908), bộ trắc nghiệm được sửa chữa với số lượng hài tập tăng lên và phạm vi lứa tuổi cũng mở rộng đến 13 tuổi Lần xuất bản thứ ba (1911) bộ trắc nghiệm về căn bản không có gì đổi khác, chỉ tăng Ihêm số lượng bài tập cho phép mở rộng thêm giới hạn độ tuổi đến 15
Đây là trác nghiệm được tiêu chuẩn hoá đầu tiên không chỉ về sự thống nhất hoá các bài tập và thủ tục thực hiện chúng, mà cả về việc đánh giá các tài liệu thu được Trong trắc nghiệm này, tác giả đã đưa ra khái niệm "tuổi trí khôn" Trắc nghiệm này được phổ biến rộng rãi trên thế giới với một đặc điểm
cơ bản là một phương pháp để sớm phát hiện ra những trẻ chậm phát triển trí
Trong thời kỳ chiến tranh thế giới thứ nhất và thứ hai, nhiều nhiệm vụ khó khàn và mới mẻ được đặt ra Quân đội cần tuyển chọn những người thích hợp
để học tập và sử dụng những phương tiện kỹ thuật mới và phức tạp Vì vậy, những trắc nghiệm cho các đám đông ra đời (các trắc nghiệm "Anpha lục quán" và "Bêta lục quân" phát triển ở Mỹ) Trong chiến tranh th ế giới lần thứ nhất, các nhà tâm lý học M ĩ đã dùng trắc nghiệm để nghiên cứu 1.750.000 tân binh và trong chiến tranh thế giới II, con số này đã lên đến 20.000.000 người Đây là một bước ngoặt trong sự phát triển trắc nghiệm đánh dấu sự ứng dụng rộng rãi và chẩn đoán tâm lý trong cuộc sống thực của con người
Trang 12Năm 1912, nhà tâm lý học Đức V.Stem đã đưa ra khái niệm hộ số thông minh (Intelligence Quotient) viết tắt là IQ và nó được coi là chỉ số về nhịp độ phát triển trí tuệ dặc trưng cho một đứa trẻ.
Từ cuối những năm 1930, xuất hiện xu thế sử dụng các trắc nghiệm nhiều mặt, liên hợp hoá hay các tổng nghiệm (Test Batteries) Mỗi tổng nghiêm bao gồm nhiều tiểu nghiệm (Subtests), mỗi tiểu nghiệm lại bao gồm nhiều bài tập (Items) Các trác nghiệm trí tuệ của David W eschler (1869-1981), nhà tâm lý trưởng của bệnh viện tâm thần Bellevue kiêm giáo sư tâm lý học lâm sàng của trường Đại học Y khoa New York, thuộc loại những tổng nghiệm đầu tiên về trí tuệ Ông đã đưa ra "Thang W echsler Bellevue" dùng cho người lớn Năm
1049, ông đưa ra trắc nghiệm wise đành cho trẻ 5-15 tuổi Đến năm 1955, ông lại đưa ra trắc nghiệm WAIS dành cho những người từ 16 tuổi trở lên Và đến năm 1967, lại có thêm trắc nghiệm WPPSI (The W echsler Preschool and Primary Scale of Intelligence) dành cho trẻ em 4-6 tuổi Khi sử dụng ở nhiều nước trên thế giới các trắc nghiệm của W echsler đã được thích nghi hoá, cải biên và bổ xung thêm nhiều
Bên cạnh những trắc nghiệm sử dụng ngôn ngữ, một số trắc nghiệm có Ihế không cần sử dụng ngôn ngữ cũng ra đời, ví dụ như trắc nghiệm "Khuôn hình tiếp diễn" của J.C.Raven (Anh) năm 1936 Bộ trắc nghiệm này chia thành
5 loạt A,B,C,D,E Mỗi loạt đều gồm những hình vẽ có những mối liên hệ nào
đó Qua đó, khả năng tri giác, tư duy logic, hệ thống v.v của nghiệm thể được đánh giá
Dựa trên ý tưởng của Binet-Simon, bộ test Kramer do J.Kram er soạn thảo
dã được Viện Giáo dục học, giáo dục học trị liệu và tâm lý học ứng dụng thuộc trường Đại học tổng hợp Freiburg (Thụy Sĩ) lần đầu ấn hành năm 1972 Bộ trắc nghiệm này đã được sử dụng rộng rãi ở Châu Âu và đã được cải tiến, sửa đổi llico thời gian Có test K ramer lời (sử dụng ngôn ngữ) và test Kramer hình
7
Trang 13(không sử dụng ngôn ngữ) Đây là bộ trắc nghiệm trí tuệ dùng cho trẻ 3-15 tuổi.
Với trẻ nhỏ, bên cạnh những bộ test để đánh giá sự phát triển trí tuệ của trẻ nói riêng, những gần đây còn có những test đánh giá sự phát triển chung của trẻ Trong số đó có thể kể đến test Denver (Denver Development Screening Test) của các tác giả W illiam, Frankenburg, Josian, B.Dodd và Alma W.Fandal thuộc trường đại học của Trung tâm y học Denver Colorado (Mỹ) xuất hiện vào những nãm 60 của th ế kỷ XX và hiện nay vẫn được áp dụng ở rất nhiều nước để phát hiện sớm những trẻ nhỏ chậm phát triển Trắc nghiệm này sử dụng những phương tiện đơn giản, đễ kiếm nhung có thể giúp phát hiện sớm những trẻ MN lừ 2 tuần đến 72 tháng tuổi chậm phát triển
Trong trường phổ thông, các loại trắc nghiệm đã được phát triển rộng rãi
dể đánh giá kỹ năng và kiến thức của học sinh trong mọi môn học Các nhóm trắc nghiệm về thành tích học tập của trẻ (Batteries of Achievement Tests) được sử dụng rộng rãi ở rất nhiều nước trên thế giới đã chứng minh vai trò quan trọng của trắc nghiệm trong việc đánh giá và giáo dục trẻ em
Như vậy, trong suốt hơn một thế kỷ qua, trắc nghiệm đã phát triển rất nhanh để đánh giá con người ở mọi lứa tuổi và trong mọi lĩnh vực của cuộc sống Trắc nghiệm được phát triển rộng rãi ở Mỹ và các nước phương Tây
Ở Liên Xô (cũ), việc phát triển các trắc nghiệm có thể chia thành ba thời
kỳ Thời kỳ thứ nhất 1917-1936: Trong thời kỳ này, các trắc nghiệm được sử dụng nhiều, chủ yếu là sự vay mượn thường là không phê phán các trắc nghiệm của nước ngoài, thiếu những căn cứ lý luận và thực nghiệm chặt chẽ, dẫn đến việc tuyệt đối hoá các kết quả trắc nghiêm để phân chia một cách vô cân cứ học sinh thành những em "có năng lực" và "không có năng lực" Kết quả là nghị quyết của Ban chấp hành Trung ương Đảng cộng sản Liên Xô "Về những
sự xuyên tạc của Nhi đồng học trong hệ thống Hội đồng dân uỷ giáo dục" (1936) Sau đó, là thời kỳ từ 1936 đến 1960, trắc nghiệm hầu như không được
Trang 14sử dụng ở Liên Xô nữa Thời kỳ thứ ba bắt đẩu từ 1960, các nhà nghiên cứu lại hướng vào vận dụng và xây dựng lại một hệ thống các phương pháp chẩn đoánlâm lý phù hợp với các nguyên tắc cùa tâm lý học Xô Viết Ở các nước XHCN (cũ), việc sử dụng và phát triển trắc nghiệm cũng có những bước thăng trầm và
ít nhiều bị ảnh hưởng bởi các quan điểm của tâm lý học Xô Viết về vấn đề này Nhimg càng ngày trắc nghiệm càng được sử dụng và phát triển một cách đúng đắn và thích hợp hơn
Tóm lại, khi mới xuất hiện, các trắc nghiệm được phát triển ồ ạt, được sử dụng rộng rãi va thậm chí hơi thái quá Các kết quả trắc nghiêm được chấp nhận dễ dàng, không có sự phân tích, suy xét toàn diện và được xem như là cơ
sở cho rất nhiều đánh giá, thẩm định về tâm lý cá nhân Xuất hiện những người
"sùng bái" trắc nghiệm Họ cho rằng trắc nghiệm là phương pháp vạn năng để nghiên cứu tâm lý, vấn đề gì cũng có thể dùng trắc nghiệm để đo và tuyệt đối hoá các số liệu đo bằng trắc nghiệm
Sau một thời gian, vấn đề trắc nghiệm đã được nhìn nhận lại Càng ngày càng có nhiều người chỉ trích gay gắt việc đánh giá chỉ dựa vào các trắc nghiệm Những quan điểm về việc sử dụng điểm số trắc nghiệm làm cơ sở cho việc phân nhóm học sinh, dựa vào hệ số IQ để đánh giá năng lực của trẻ và cho rằng trẻ em ở các tầng lớp xã hội thấp do tính quy định di truyền ít có khả năng vượt qua các kỳ thi tuyển cao bằng trắc nghiệm đã bị phản đối gay gất nhất Sự phê bình còn nhằm vào mối quan hệ giữa số lượng và chất lượng biểu hiện ra thành những con số về kết quả của trắc nghiệm và việc sử dụng những con số này để hiểu diễn các đặc điểm tâm lý phức tạp và có tính chất tổng hợp của con người
Với thời gian, trắc nghiệm ngày càng được nhìn nhận một cách đúng đắn hơn Trắc nghiệm không còn được coi là công cụ vạn nãng để đánh giá mọi sự phát triển, mọi đặc điểm tâm lý phức tạp của con người, nhưng nó là một công
cụ quan Irọng cùa khoa học chẩn đoán tâm lý và tiên đoán những hành vi của
9
Trang 15con người Trắc nghiêm giúp cho tâm lý học không còn là một môn khoa học thuần tuý lý thuyết mà có những ứng dụng hữu hiệu trong cuộc sống thực tế, Nếu được sử dụng một cách đúng mức, kết hợp với các phương pháp đánh giá khác thì trắc nghiệm có thể giúp chúng ta nhìn nhân một cách sát thực hơn về
sự phát triển của trẻ, về các kỹ năng và kiến thức mà chúng đã lĩnh hội được trong quá trình giáo dục
1.2 Viẽc sử dung và xây dưng trác nghiêm ở Viêt N am
Trắc nghiệm bắt đầu được sử dụng ờ Việt Nam từ khi nào thì khó có thể
xác định chính xác được Tuy nhiên, ngay từ những năm đầu thập kỉ 1950, nhiều học sinh Việt Nam đã được làm quen với trắc nghiệm qua các cuộc khảo sát về ngoại ngữ do các cơ quan quốc tế tại Việt Nam tổ chức Nhưng trong lliập kỷ 1960, trắc nghiệm vẫn còn là một khái niệm khá mơ hồ với các nhà
nghiên cứu ở Việt Nam Chỉ có một vài bài viết trên các tập san giáo dục xuất
ban ở miền Nam là để cập một cách sơ sài đến vấn đề trắc nghiệm
Trong thập kỉ 1970, ở một số khoa thần kinh của các bệnh viện lớn ở Hà
Nội đã sử dụng phổ biến các trắc nghiệm tâm lý để chẩn đoán bộnh (Ví dụ như khoa Thần kinh bệnh viện Bạch Mai đã sử dụng test Denver và một số test khác để chẩn đoán sự chậm phát triển của trẻ nhỏ) Sau đó, các trắc nghiệm về trí tuệ cũng được nghiên cứu và sử dụng tại Viện nhi Hà Nội Các bác sĩ quân đội cũng dùng các trắc nghiệm tâm lý trong công tác chữa bệnh và khám tuyển
Cuối năm 1969 và đầu năm 1970, các môn trắc nghiệm thành qua học tập
và thống ké trong khoa học giáo dục được giảng dạy ở các lớp cao học, tiến sĩ giáo dục tại Đại học Sư phạm Sài Gòn Trong thời gian này, một số trắc nghiệm tâm lý nước ngoài cũng được dịch và xuất bản ở miền Nam (Ví dụ cuốn "Trắc nghiệm tâm lí Roschach" của Nguyễn Văn Thành, "Trắc nghiệm trí thông minh" của Lê Quang L iêm .)• Năm 1972, các nhà giáo dục ở miền Nam
đã quan tâm nhiều hơn đến những vấn để trắc nghiệm thành quả học tập và sau
Trang 16hai năm nghiên cứu thì những bài thi trắc nghiệm tiêu chuẩn hoá đầu tiên đã được áp dụng cho hai khoa thi tú tài tại miền Nam năm 1974.
Trong những năm 1970, ở trường Đại học Sư phạm Hà Nội 1, một số bộ môn đã sử dụng trác nghiệm để nghiên cứu trình độ nắm khái niệm của sinh viên (Trần Bá Hoành, 1971) Nhưng phải đến năm 1984, chuyên đề chẩn đoán tâm lý do PGS Trần Trọng Thuỷ phụ trách mới bắt đầu được giảng dạy cho hệ sau đại học của khoa tủm lý học và cuốn sách "Khoa học chẩn đoán tam lí" do ông viết và xuấl bản 1992 là một tài liệu tổng quan về vấn đề này
Ở Viện Khoa học Giáo dục, trắc nghiệm và việc chẩn đoán tâm lí cũng được nghiên cứu từ cuối những năm 1970 và đến 1984, phòng Chẩn đoán tâm
I í và tư vấn học đường do PGS.TS Lê Đức Phúc phụ trách đã ra đời và áp dụng nhiều trắc nghiệm trong lĩnh vực nghiên cứu học sinh phổ thông Các trác nghiệm "Đến tuổi học" đã được chú ý nghiên cứu ở Trung tâm tâm lí học - sinh lí học lứa tuổi và một trong những nghiên cứu theo hướng này là cồng trình "Góp phần hoàn thiện bộ trắc nghiệm đo lường mức độ sẵn sàng đi học của trẻ 6 tuổi vào lớp một" của Nguyễn Thị Hồng Nga công bố năm 1996 trong khuôn khổ của một luân án tiến sĩ tâm lí học tại Viện Khoa học Giáo dục
Trong những năm 1972-1975, bác sĩ Vũ Thị Chín và các cộng sự ở phòng
nghiên cứu của Ưỷ ban Bảo vệ bà mẹ và Trẻ em Trung ương đã nghiên cứu (hang Brunet-Lezin để đánh giá sự phát triển tâm vận động của trẻ từ 1 tháng đến 3 năm tuổi; và sau đó bà và các cộng sự ở Trung tâm N-T tại nghiên cứu sử dụng thang này với trẻ 2,5 tuổi - 5 tuổi trong những năm 1990
Phòng tâm lý thuộc Viện Nghiên cứu trẻ em trước tuổi học đã áp dụng lest Denver trên gần 4000 trẻ em 0-6 tuổi ở Việt Nam và đã đưa ra những sô' liệu có ý nghĩa về sự phát triển tâm vận động của trẻ em Việt Nam so với trẻ
em thế giới
11
Trang 17Trong những nãm 90 của thế kỉ qua, vấn để trắc nghiệm đã được nghiên cứu và sử dụng rộng rãi hơn trong các lĩnh vực của tâm lí và giáo dục học Bộ Giáo dục và Đào tạo cũng quan tâm hơn đến việc nghiên cứu và sử dụng trắc nghiệm trong việc đánh giá, kiểm tra, thi cử Một số luận án tiến sĩ tâm lí học
về đề lài trắc nghiệm đã được bảo vệ trong năm 2001 như: luận án của Nguyễn Thị Thuý Vân "Xây dựng bài trắc nghiệm để đánh giá kết quả học tập môn Toán và để chấn đoán năng lực tư duy toán của học sinh lớp 5" và luận án của Đoàn Văn Điều "Nghiên cứu trí lực và mối quan hệ của nó với khả năng học Toán ở học sinh trưng học cơ sở" Các dự án Giáo dục Tiểu học, Giáo đục Trung học cơ sở vay vốn của Ngân hàng thế giới và Ngân hàng Châu Á cũng
sử dụng trắc nghiệm trong việc đánh giá thành tích học tập của bọc sinh Vào cuối năm 2000, đề tài nghiên cứu khoa học cấp Bộ, mã số B98-49-56 "Nghiên cứu ứng dụng bộ trắc nghiệm sáng tạo TSD-Z của Klaus K.Urban trên trẻ em tuổi học sinh tiểu học Việt Nam" do TS Nguyễn Huy Tú làm chủ nhiệm cũng
đã hảo vệ thành công
Nhìn chung, vấn đề nghiên cứu và sử dụng trắc nghiêm vẫn còn là mới
mẻ ở nước ta, nhưng các nhà tâm lí, giáo dục học Việt Nam không chỉ quan tủm đến trắc nghiệm chung chung mà đã chú ý thích nghi một số trắc nghiệm liêu biểu trên thế giới và bắt đầu tạo ra những trắc nghiệm riêng, phù hợp với điều kiện Việt Nam, đáp ứng được những đòi hỏi của thực tiễn Tuy nhiên, việc nghiên cứu lý luận và xây dựng các trắc nghiệm ở nước ta vẫn đang ở giai đoạn hắt đầu, nhưng với sự phát triển của mạng thông tin toàn cầu (Internet) và những cố gắng hội nhập của chúng ta vào nền kinh tế, khoa học thế giới thì công việc này hứa hẹn sẽ có những thành công, đóng góp tích cực vào sự phát triển của khoa học tam lý nói riêng và nền giáo dục nước ta nói chung
1.3 Khái niêm trắc nghiêm
1.3.1 Trắc nghiệm là gì?
Trang 18Theo nghĩa chữ Hán "trắc" có nghĩa là "đo lường", "nghiêm" là "suy xét, chứng thực" Với tiếng Anh trắc nghiệm (Test) là phép thử mà người đầu tiên tlùng thuật ngữ này là nhà tâm lý học Anh Francis Galton (1822-1911).
Cho đến nay, có rất nhiều định nghĩa khác nhau về trắc nghiệm Có những định nghĩa rất rộng, cho rằng trắc nghiệm là "bất cứ một loạt các câu hỏi hay bài tập hay một phương tiện nào để đo kỹ xảo, trí thức, trí tuệ, năng lực hay tài năng của một cá nhân hay nhóm" (từ điển W ebster's Collegiate) [đẫn theo 36,tr.37] Rõ ràng định nghĩa này không thể hiện được đạc trưng của trắc nghiệm là một công cụ chẩn đoán tâm lí X.L.Rubinstêin (1940) đã khắc phục nhược điểm trên bằng định nghĩa: "Trắc nghiệm là sự thử nghiệm Nó nhầm mục đích phân bậc, xác định vị trí xếp hạng của nhân cách trong nhóm haỷ tập thể, xác lập trình độ của vị trí ấy Trắc nghiệm hướng vào nhân cách, nó phải là một phương tiện chẩn đoán và dự đoán" Định nghĩa này đã chú ý đến chức năng của trắc nghiệm, nhưng lại không nêu được tính chất đặc thù của nó Trong sách Từ điển tâm lý, ông Nguyễn Khắc Viện cho rằng: "Trong tâm ]ý học, test là một hệ thống biện pháp đã được chuẩn hoá về kỹ thuật, được quy định về nội dung và cách làm, nhằm đánh giá ứng xử và kết quả hoạt động của một người hay một nhóm người, cung cấp một chỉ báo vẻ tâm lý (trí lực, cảm xúc, năng lực, nét nhân c á c h ) trên cơ sở đối chiếu với môt thang đo đã được tiêu chuẩn hoá hoặc với một hệ thống phân loại trên những nhóm mẫu khác nhau về phương diện xã hội” Định nghĩa này đã chú ý đến chức năng của trắc nghiệm cũng như những yêu cầu kỹ thuật của nó Đây có thể coi là một định hướng cho các nhà nghiên cứu trong việc xây dựng các trắc nghiệm tâm lí.Trắc nghiệm tiêu chuẩn hoá (Standardized Test) là một bài trắc nghiệm đã được các chuyên gia nghiên cứu kỹ, đã được kiểm nghiệm để đạt những tiêu chuẩn của một bài trắc nghiệm trước khi công bố
1.3.2 Các đặc điểm cơ bản của trắc nghiệm tiêu chuẩn hoá.
Trắc nghiệm tiêu chuấn hoá có những đặc điểm sau:
13
Trang 19- Tính tiêu chuẩn hoá nghĩa là các hướng dẫn cụ thể và chi tiết về cách thực hiện và cách chấm điểm trắc nghiệm đã được xác định rõ ràng.
- Tính khách quan là tính khổng phụ thuộc của kết quả trắc nghiêm vào anh hưởng của tình huống thực nghiệm và nhân cách của trắc nghiệm viên
- Tính đối chiếu là kết quả trắc nghiệm của mỗi cá nhân có thể so sánh được với kết quả thu được từ một nhóm mẫu khá tiêu biểu cho những người có điều kiện tương lự như cá nhân đó
1.3.3 Phân loại trắc nghiệm.
Ngày nay trên thế giới có hàng vạn trắc nghiệm các loại Vì vậy, các trắc nghiệm cần được phân loại để tiện sử dụng Hội Tâm ]ý học Mỹ đã xuất bản cuốn "Các tiêu chuẩn của các bài trắc nghiệm giáo dục, tâm lý học và các sách hưởng dãn" (The Standards for Educational and Psychological Tests and Manuals) để cung cấp chỉ dẫn cho việc nghiên cứu các cẩm nang hướng dẫn chi tiết các trắc nghiệm cụ thể
Các trắc nghiệm có thể chia thành nhiều loại theo các tiêu chuẩn khác nhau Có thể kể ra một số cách phân loại chính như sau:
- Căn cứ vào kiểu loại trắc nghiệm, người ta phân thành hai loại chính là trắc nghiệm không định chuẩn (informal test) ví dụ như: phiếu quan sát, phiếu kiểm tra, các thang đ o và trắc nghiệm định chuẩn (formal hay standardized test) Trắc nghiệm định chuẩn lại được chia thành hai loại là: trắc nghiệm theo chuẩn (norm - referenced test) và trắc nghiệm theo tiêu chí (criterion- referenced test) Trắc nghiêm theo chuẩn cho biết thông tin về cá nhân so sánh với những cá nhân khác Trắc nghiệm theo tiêu chí cho biết thông tin về cá nhân theo một hệ thống những tiêu chuẩn hay tiêu chí nhất định
- Căn cứ vào kiểu loại các thuộc tính tâm lý cá nhân cần đo đạc, người ta phân thành trác nghiệm thành tích và trắc nghiệm nhân cách Trắc nghiệm ihành tích lại được phân ra các loại: Trí tuệ, thành tích học tập, sáng tạo, nhận
Trang 20ihức, nãng lực học, sức tập trung chú ý, cảm giác vận động Trắc nghiệm nhân cách được phân ra các loại: Thái độ, tính cách, động cơ, hứng thú và khí chất.
- Căn cứ vào thể chế và hình thức thực hiện, người ta phân thành trắc nghiệm cá thể và trắc nghiệm nhóm
- Căn cứ vào mức độ phụ thuộc ngôn ngữ, người ta phân thành trắc nghiêm ngôn ngữ và trắc nghiệm phi ngôn ngữ
- Căn cứ vào cấu trúc hình thức, người ta phân thành trắc nghiệm đơn giản
VÌ1 trắc nghiệm phức hợp hay tổng nghiệm (Test Batteries) v.v
1.3.4 Những ưu, nhược điểm của trắc nghiệm.
Trắc nghiệm phát triển rất mạnh mẽ trong thế kỷ qua, nhng lịch sử cũngcho thấy đó không phải là một phương pháp nghiên cứu tâm lý vạn năng.Những ưu, nhược điểm của trắc nghiệm đã được nhà tâm lý học Nga V.A.Kruchetxki đúc kết ngắn gọn như sau:
ưu điểm của trắc nghiêm là:
1 - Tính chất ngắn gọn của trắc nghiệm
2 - Tính tiêu chuẩn hoá của nó
3 - Tính đơn giản về kỹ thuật và thiết bị
4 - Sự biểu đạt kết quả dưới hình thức định lượng
5 - Tính tiện lợi đối với việc xử lý toán học
Nhược điểm của các trắc nghiệm là:
1 - Tính chất không rõ ràng về bản chất tâm lý của cái được xác định hằng trắc nghiệm
2 - Chỉ quan tâm đến kết quả thống kê, mà không chú ý đến quá trình dẫn đến kết quả
3 - Dễ bị đánh tráo đối tượng nghiên cứu
4 - Không tính đến sự phát triển cùa các năng lực nói riêng và tâm lý nói chung
15
Trang 21Tuy có những nhược điểm như trên, nhưng hơn một thế kỷ qua, trắc nghiệm đã phát triển rất nhanh chóng Nó đã tiến công vào mọi lĩnh vực mà con người sống và hoạt động Trắc nghiệm đã trở thành một phương tiện đánh giá và đo lường cần thiết trong một xã hội khoa học và tiến bộ Trắc nghiệm giúp cho việc nghiên cứu các biến đổi tâm lý bên trong con người được thể hiện một cách cụ thể bằng số lượng chứ không chỉ bằng cảm giác trừu tượng nữa Trắc nghiệm là một phương pháp nghiên cứu tâm ]ý tương đối khách quan, góp phần làm phong phú thêm các phương pháp nghiên cứu tâm lý con người Sự thành công của phương pháp trắc nghiệm đã góp phần tách tâm lý học khỏi triết học, làm cho nó trở thành một khoa học độc lập, góp phần thiết thực vào sự phát triển của xã hội hiện đại
1.4 Các hước tiến hành khi xây dưng mốt trác nghiêm theo tiêu chí (Criterion - referenced test).
Các trắc nghiệm theo tiêu chí, thường được tiến hành theo các bước cơ bản sau:
Bước 1: Xác định mục tiêu và các tiêu chí của trắc nghiệm.
Muốn một công việc đạt kết quả tốt thì trước khi bắt tay vào việc, chúng
ta cần xác định rõ đích mà ta cần đạt tới là gì? và đạt tới đích đó bằng cách nào? Cũng như vậy, để xây dựng một trắc nghiệm theo tiêu chí, trước tiên chúng ta phải xác định rõ mục đích của trắc nghiệm là gì? trong mục đích này cần chỉ rõ Irắc nghiệm sẽ nhằm đánh giá cái gì? (Ví dụ đánh giá về trí tuê, nhân cách, sự phát triển tâm lý trẻ v.v ) và đánh giá đối tượng nào? (Ví dụ đánh giá trẻ sơ sinh, trẻ cuối độ tuổi nhà trẻ, trẻ 1 tháng đến 6 tu ổ i ) Mục đích chung này chính là cái đích mà ta cần tới Việc xác định rõ ràng mục đích trác nghiệm sẽ giúp người xây dựng trác nghiệm tìm ra được phương hướng và con đường đúng đắn để đi tới đích
5 - Không lính đến tất cả các nhân tố đa dạng có thể ảnh hưởng đến kết
Trang 22Con đường đi tới đích được vạch ra dựa trên những lý luận về cách đánh giá và đặc điểm của đối tượng cần đánh giá Thế nào là một trắc nghiệm được
xây dựng tốt? Câu trả lời khá đơn giản nhưng việc thực hiện lại không dễ dàng
Một trắc nghiệm theo tiêu chí được xây dựng tốt cần thực hiên hai bước: 1) Xác định rõ mục tiêu và các tiêu chí của trắc nghiệm, 2) Viết được trắc nghiệm với những item (câu hỏi, bài tập) phù hợp với các tiêu chí này
Hệ thống các tiêu chí của trắc nghiệm chính là một sơ đồ đơn giản về trắc nghiệm như là một tổng thể Sơ đồ này cần bao gồm các tiêu chí không nhất Ihiết Ihật chi tiết, nhưng ít ra cũng khái quát ở mức độ có thể đo lường được Yếu tố tiêu chí trác nghiệm cần được diễn tả để có thể đo lường được là một vấn đề tương đối khó xác định đối với người soạn thảo trắc nghiệm Khó khăn
ở đây chính là do các đặc điểm phát triển tâm lý hay các mục tiêu giáo dục thường được phát triển ở dạng tổng quát, có thể hiểu theo nhiều cách và đôi khi không rõ ràng, không thể đánh giá được
Như vây, mục tiêu và tiêu chí của một trắc nghiệm tâm lý cần được phát hiểu một cách rõ ràng, cụ thể và có thể đo lường được dựa trên các đặc điểm phát triển tâm lý và các mục tiêu giáo dục trẻ
Các mục tiêu khác hoặc các đặc điểm tâm lý không thể đo lường được nhưng có mối quan hệ tích cực với tiêu chí đã được nêu ra để đánh giá thì có the coi là những yếu tố song hành, "tiềm tàng" trong sự phát triển của trẻ, chúng có khả năng trở thành hiện thực khi các mục tiêu, các tiêu chí của trắc nghiệm đã đạt được
Bước 2: Thiết k ế trắc nghiệm đầu tiên.
Dựa vào các tiêu chí đánh giá như một sơ đồ lý thuyết về trắc nghiệm cần thiết kế, nguời xây dựng trắc nghiệm cần thiết kế được một trắc nghiệm đầu tiên Trắc nghiệm này là sự cụ thể hoá các tiêu chí đánh giá trên thành những câu hỏi, bài tập (item) có thể đo lường được trên trẻ Nên lựa chọn để trắc
£)A i H O C u o c G>IA h A N C 1 ; tf?UNG TÃr / t h õ n g T i n :><■; V IFr ! Ị
17
Trang 23nghiệm này có hình thức (cá nhân hay nhóm, ngôn từ hay hành đ ộ h g ) phù hợp nhất với nhóm đối tượng cần đánh giá.
Khi xày dựng trắc nghiệm đổu tiên, người nghiên cứu cần căn cứ vào các trắc nghiệm, các bài tập dành cho nhóm đối tượng mà mình định nghiên cứu hoặc kinh nghiệm của mình để đưa ra tập hợp những item có thể sử dụng được lương ứng với các tiêu chí đã được xác định (items pool) Trong một số trường hợp, việc sử dụng (mượn) các item của các bộ trắc nghiệm khác có hiệu quả hơn là xây dựng các item mới vì các item "mượn" này đã được thực nghiệm và chứng tỏ sự phù hợp với đối tượng đánh giá Tìm được tất cả các item tương ứng với các tiêu chí đã xác định là một trong những vấn đề khó khăn nhất đối với người soạn thảo trắc nghiệm
Sau khi tập hợp những item có thể sử dụng cho trắc nghiệm đã được xác
dị nil, nhà nghiên cứu cần tiến hành một quá trình sàng lọc để tìm ra những hem phù hợp nhất với các tiêu chí của trắc nghiệm Điều này đòi hỏi nhà nghiên cứu phải có kinh nghiệm và nắm vững đối tượng nghiên cứu Nhimg nếu ta thiết lập được một sơ đồ trắc nghiệm, nghĩa là có được hệ thống các tiêu chí tốt và phân bố số item hợp lý cho các phần cần đánh giá thì cũng có nhiều
hy vọng lựa chọn được số item "đại diện" thích hợp vào trắc nghiệm Trong quá trình lựa chọn các item, các vấn đề sau cần được quan tâm:
- Đánh giá bản chất, nội dung của từng item: Mỗi item chỉ nên tập trung
vào một nội dung thật cụ thể và chỉ bao hàm một phạm vi rất hẹp các vấn đề cần đánh giá Loại bỏ những item có nội dung không cụ thể, không thích hợp
và kết hợp những item có nội dung gần trùng nhau thành một item có tính đại diện hơn
- Đánh giá kiểu, hình thức item: Những kiểu item nào thích họp nhất, có
tính dơn nghĩa và có thể phát hiện được thực chất, tránh được sự giả dối của dối tượng khi thực hiện nó Những item có nội dung tốt nhưng hình thức khồng
Trang 24thích hợp (đa nghĩa, khó hiểu, đối tượng không muốn trả lờ i ) cần được viết lại, cấu Irúc lại.
của những đặc điểm tâm lý định đo không Những đặc điểm tâm lý cơ bản có gồm nhiều item để đánh giá hơn những đặc điểm tâm lý khác không Nếu cấu trúc đặc điểm tâm lý cần đánh giá được chia thành nhiều cấu trúc nhỏ thì cần xét xem các item trong từng cấu trúc nhỏ có tính đổng nhất không, có mâu Ihuẫn với nhau không
Sau khi lựa chọn xong, trắc nghiệm đầu tiên phải bao gồm những item bao quát hết được các tiêu chí đánh giá đã xác định Số lượng các item trong trác nghiệm giả định phải nhiều hơn số các item đã sử dụng trong trắc nghiệm chính thức và có mức độ khó khác nhau, để sau khi thử nghiệm, nếu loại bỏ những item không đạt yêu cầu thống kê thi vẫn còn đủ item cho trắc nghiệm chính thức
Một số điều cần lưu ý thêm là: trong trắc nghiệm, thứ tự của các item phải gủy được không khí tự nhiên, tạo sự chuyển tiếp nhẹ nhàng từ ý này sang ý khác Các item phải dễ hiểu và nếu chúng gây được hứng thú thì càng tốt Những item khó nên sắp xếp sau cùng
lĩtrớc 3: Thử nghiệm trắc nghiệm đầu tiên và chỉnh sửa lại các item của trắc nghiệm.
Sau khi đã thiết kế xong trắc nghiệm đầu tiên, chúng ta cần thử nghiệm
nó trên một nhóm đối tượng có những đặc điểm tương tự nhóm đối tượng mà ta định nghiên cứu (Pretest) Mục đích của thử nghiệm là xác định xem các item của trắc nghiệm có phù hợp để đánh giá trên nhóm đối tượng đó khồng Số lượng của nhóm đối tượng cho thử nghiệm thường không lớn lắm (khoảng SO
SO người) Nếu số item của trắc nghiệm đầu tiên quá nhiểu thì ta có thể chia ihành hai phần để thử nghiệm cho phù hợp với khả năng tâp trung chú ý cùa trẻ Làm sao để kết quả thử nghiệm các item phản ánh đúng khả năng của trẻ,
19
Trang 25chứ khống phải là những kết quả do trẻ một mỏi, không thích làm nữa mà trả lời hoặc làm "bừa" cho xong.
Sau khi thử nghiệm, kết quả của các item cần được đánh giá bằng các phương pháp thống kê toán học để xem item nào phù hợp thì giữ lại trong trắc nghiệm và item nào không phù hợp thì loại bỏ hoặc chỉnh sửa cho phù hợp hơn Ngoài ra, những item đòi hỏi nhiều thời gian mới thực hiện xong, do đó, ảnh hưởng đến thời gian hoàn thành toàn bộ trắc nghiệm cũng có thể bị loại
Trắc nghiệm khi đó sẽ bao gồm những item đã được chỉnh sửa qua thử nghiệm dựa theo các tiêu chuẩn thống kê Trắc nghiệm này phải phù hợp với
sơ đổ trắc nghiệm là tập hợp các tiêu chí đánh giá đã được xác định ban đầu và không nên quá dài để thời gian làm trắc nghiệm phù hợp với khả năng tập trung chú ý của đối tượng nghiên cứu
Bước 4: Soạn thảo các tài liệu trác nghiệm.
Sau khi xác định được hệ thống các item của trắc nghiệm, người xây dựng trắc nghiệm cần soạn thảo các tài liệu để chuẩn bị cho việc thực nghiệm trắc nghiệm này Những tài liệu đó bao gồm: Bản hướng dẫn chỉ tiết cho việc tiến hành trắc nghiệm (Ví dụ như: các công việc cần chuẩn bị, cách xác định đối tượng thực nghiệm, thời gian trắc nghiệm, công cụ, cách cho điểm, đánh giá và những lưu ý để trắc nghiệm đạt kết quả tốt )- Các loại phiếu để ghi kết quả trắc nghiệm Các loại phiếu để thu thập thông tin cần thiết chuẩn bị cho trắc nghiệm Các tài liệu này cần được viết rõ ràng, cụ thể và tiện lợi cho việc sử dụng
Một điẻu rất quan trọng khi soạn thảo tài liệu hướng dẫn trắc nghiệm là phải tránh tối đa những tác động chủ quan của nghiệm viên trong khi làm trắc nghiệm Để làm được điều này thì trong bản hướng dẫn mọi lời nói, việc làm của nghiệm viên: từ cách nêu nhiệm vụ trắc nghiệm, cách hướng đẫn làm các item, cách giải thích hoặc tổ chức tình huống trắc nghiệm đều phải được viết ra
Trang 26rất tường minh, sao cho những người hướng dẫn khác nhau đều phải tuân theo cùng một cách thức, một quy trình hoàn toàn giống nhau.
Trong bản hướng dẫn trắc nghiệm cũng cần lưu ý các nghiệm viên nên ghi lại những biểu hiện hành vi hay phản ứng của nghiệm thể trong quá trình trắc nghiệm có liên quan đến các đặc điểm tâm lý cần đánh giá
Tóm lại, để bảo đảm tính khách quan của trắc nghiệm, nhà nghiên cứu phải căn cứ vào quá trình thử nghiệm để soạn thảo ra một bản hướng đẫn trắc nghiệm thật chi tiết, cố gắng để mỗi lời nói, mỗi hành động của nghiệm viên
và của nghiệm thể đều được quy định rõ ràng, lần lượt theo thời gian để giảm Ihiểu những tác động chủ quan của các nghiệm viên đến kết quả trắc nghiệm
Bước 5: Kiêm nghiệm trắc nghiệm.
Khi đã hoàn chỉnh những tài liệu trắc nghiệm, người xây dựng trắc nghiệm nên tập huấn cho các nghiệm viên về cách tiến hành và những điểm càn chú ý khi làm trắc nghiệm Việc tập huấn này cần được tiến hành một cách cẩn thận, kỹ lưỡng để mỗi nghiệm viên đều hiểu rõ những vấn đề cơ bản cùa trác nghiệm và nắm chắc những công việc sẽ phải làm với các nghiệm thể irong quá trình kiểm nghiệm trắc nghiệm
Nếu các nghiệm viên là những người còn ít kinh nghiệm làm các trắc nghiệm tương tự thì trong khi tập huấn không nên chỉ có nghe giảng và xem biểu diễn cách làm, mà mỗi nghiêm viên nên được làm thử trắc nghiệm trên ít nhất 4-5 đối tượng để nắm chác cách tiến hành trắc nghiệm Nếu có vấn đề gì nay sinh thì các nghiệm viên có thể bàn bạc trong nhóm hoặc trao đổi với người huấn luyện trắc nghiệm để có những cách giải quyết thống nhất trong quá trình thực nghiệm sau này
Đế chuẩn bị ticn hành thực nghiệm, một việc cũng rất quan trọng là chọn nhóm mẫu nghiên cứu Một mẫu nghiên cứu tốt có ảnh hưởng nhiều đến kết quả nghiên cứu và tính chính xác của các kết luận được rút ra trong nghiên cứu Mẫu được chọn phải có tính đại diện cho nhóm đối tượng cần nghiên cứu
21
Trang 27Tính đại diện của mẫu phụ thuộc chủ yếu vào kích cỡ mẫu và tính đồng nhất của mẫu Mẫu càng lớn, càng đồng nhất thì tính đại diện càng cao Mẫu phải được chọn theo những tiêu chuẩn nhất định, tốt nhất là chọn được mẫu xác suất.
Khi tiến hành trắc nghiệm với trẻ, nghiệm viên phải tuân thủ những hướng dẫn về trắc nghiệm Nghiệm viên cần khuyên khích để trẻ cố gắng hết mức Ihực hiện trắc nghiệm Trong khi làm trắc nghiệm với cá nhân, đặc biệt với trẻ nhỏ, nếu trẻ tỏ ra chán, không muốn làm hoặc không thể tập trung để thực hiện các nhiệm vụ được giao thì nghiệm viên nên dừng trắc nghiệm đợi khi lie ựip trung lại mới làm tiếp
Bước 6: Xử lý kết quả kiểm nghiệm và chỉnh sửa trắc nghiệm lần
Cllối
Sau khi kiểm nghiệm xong, các nhà nghiên cứu cần xử lý và phân tích kết quả để xem trắc nghiêm có đạt được các yêu cầu kỹ thuật và có chất lượng khóng Đồng thời, họ cũng nên phân tích các kết quả trắc nghiệm theo đặc điểm của nhóm mẫu, chỉnh sửa một số bài tập của trắc nghiêm nếu cần thiết.Việc kiểm định các thuộc tính đo lường của một trắc nghiệm bao gồm việc đánh giá các item thông qua phân tích thống kê, việc đánh giá độ tin cậy
và độ hiệu lực của trắc nghiệm
Nếu trắc nghiệm đã bảo đảm các tiêu chuẩn kỹ thuật trên thì người xây dựng trắc nghiệm có thể đưa ra thêm các thông tin khác về trắc nghiệm để người đọc tham khảo và chuẩn bị cho quá trình chuẩn hoá trác nghiệm nếu có điều kiện sau này Các thồng tin về trắc nghiệm có thể là: sự khác nhau về kết quá Irắc nghiệm theo giới tính, theo lứa tuổi, theo tình trạng kinh tế, theo vùng địa lý v.v
Dựa vào những nhận xét khi tiến hành kiểm nghiệm và việc xừ lý các kết quả kiểm nghiêm, người soạn thảo trắc nghiệm có thể chỉnh sửa một số item nếu Ihấy cẩn thiết Tuy nhiên, việc chỉnh sửa này chỉ là những sửa chữa nhỏ
Trang 28đối với một số item, ví dụ như: với một số item sửa lại các câu hỏi và cách hướng dẫn cho dễ hiểu, chính xác hơn, sửa lại cách cho điểm, đánh giá cho thích hợp hơn với đối tượng Việc chỉnh sửa lần này không thể là sự thay đổi lớn về nội đung hay cấu trúc của trắc nghiệm đến mức có thể tạo ra một trắc nghiệm mới, đòi hỏi phải được kiểm nghiệm lại về nó.
1,5 Đánh giá các item của trác nghiêm thống qua phân tích thống kẽ.
Các item của trắc nghiệm sau khi đã được thử nghiệm hay kiểm nghiệm cẩn được xử lý và đánh giá theo các tiêu chuẩn thống kê để xác định xem chúng có phù hợp không, có phải cấu trúc lại hoặc loại bỏ không
Có hai cách phân tích item trắc nghiệm phổ biến nhất trên thế giới hiện nay là: cách thứ nhất là đánh giá item dựa vào độ khó (Difficulty) và độ phân biêt (Discrimination) của nó và cách thứ hai là đánh giá item dựa vào mô hình
do lường của G.Rasch
1.5.1 Đánh giá các item của trắc nghiệm dựa vào độ khó và độ phân biệt.
Việc đánh giá các item dựa vào kết quả tính độ khó và độ phân biệt của chúng là một phương pháp để chọn lựa và loại bỏ các item sau khi thực nghiệm Theo phương pháp này thì sau khi tính toán với các công thức thống
kè, các item có độ khó và độ phân biệt trong khoảng cho phép sẽ được giữ lại, còn những item có độ khó hoặc độ tin cậy ngoài khoảng cho phép sẽ bị loại bỏ hoặc phải sửa chữa lại cho phù hợp Phương pháp này đã được tiến hành từ lâu với cách tính tay và đến nay vẵn còn được áp dụng với sự trợ giúp rất hiệu quả của máy tính Sau đây, khái niệm và các phương pháp tính độ khó và độ phân biệt của các item sẽ được trình bày
1.5.1.1 Độ khó của item và các bài trắc nghiệm.
* Độ khó của item:
Khi phải làm một bài trắc nghiệm, các nghiệm thể thường chỉ nhận llìấy một cách khái quát là bài ấy dễ khi họ làm được hầu hết các item, và ngược lại,
23
Trang 29bài ây là khó khi họ không làm được phần lớn các item Nhiều người trong số
họ sẽ khó trả lời được câu hỏi: tại sao một số item này lại khó hơn những item
khác Các nhà đo lường tâm lý, giáo dục cũng gặp khó khăn như vậy trong việc giải Ihích và định nghĩa tính chất dễ - khó của các item trắc nghiêm căn cứ vào đặc tính nội tại của chúng Và hơn nữa, nếu xác định độ khó dựa vào chính nội dung của các item trắc nghiệm thì sẽ dẫn đến chỗ với mỗi loại item, mỗi loại vấn đề lại có những cách xác định độ khó khác nhau Điều này sẽ gây rắc rối
vô cùng cho các nhà nghiên cứu Chính vì vậy, một cách xác định độ khó tiện lợi và đơn giản hơn nhiểu đã được công nhận từ lâu Đó là cách tính độ khó của item trắc nghiệm dựa vào số người trả lời đúng item ấy Nếu có rất nhiều người trả lời đúng một item thì item ấy được coi là dễ, và ngược lại, nếu có rất
ít người trả lời đúng một item nào đó thì item ấy bị coi là khó
Vây, độ khó của một item được xác định bằng tỷ lộ người làm đúng item trcn tổng số người đã làm item đó
Do đó, công Ihức tính độ khó của một item sẽ là: p = Đ/N (1.1)
Trong đó: p = Độ khó của item ,
Đ = Số người làm đúng item
N = Tổng số người làm item
p có giá trị lừ 0,0 đến 1,0 Giá trị của p tỷ lệ nghịch với độ khó của item, nghĩa là giá trị p càng gần 0 thì độ khó của item càng tăng, còn giá trị p càng gần 1 thì độ khó của item càng giảm
Để tính giá trị p thì kết quả thực hiện các item cần được lượng hoá bàng điểm số Làm đúng item được 1 điểm và sai là 0 điểm Nếu item được cho bàng nhiều mức điểm (Ví dụ: 0-4 điểm) thì người biên soạn cần ấn định mức điểm đúng (chẳng hạn 2-4 điểm) và mức điểm sai (chẳng hạn 0-1 điểm), rồi sau khi quy chuyển kết quả của những người làm trắc nghiệm về thang điểm: đúng = 1 điểm và sai = 0 điểm thì mới tính được giá trị p theo công thức 1.1
Trang 30Độ khó của tùng item có quan hệ với độ tin cậy và độ hiệu lực của trắc nghiệm [36] Chẳng hạn, một trắc nghiệm đánh giá năng lực toán gồm 30 item
trong đó có 10 item quá khó, tất cả mọi người làm trắc nghiệm đều bị điểm 0 ờ
item này Như vậy, phân bố điểm của trắc nghiệm gồm 30 item này cũng giống như phân bố điểm của một trắc nghiệm chỉ gồm 20 item Độ khó của các item đã thực sự làm giảm độ dài của trắc nghiệm, v ề mặt lý thuyết, độ dài của irắc nghiệm giảm sẽ làm giảm độ tin cậy của trắc nghiệm và cũng làm giảm độ hiệu lực của trắc nghiệm đó
* Độ khó vừa phải của item :
Một trắc nghiệm được gọi là tốt không phải là trắc nghiệm gồm toàn những item khó hay toàn những item dễ, mà nó phải gồm những item có mức
độ khó trung bình hay mức độ khó vừa phải
Nhưng thế nào là độ khó vừa phải? Thông thường, những item có độ khó
là 0,5 (hay 50%), nghĩa là 50% người làm trắc nghiệm làm đúng và 50% làm sai được coi là những item có độ khó vừa phải Nhung do học sinh làm đúng item trắc nghiệm có thể không phải do chúng hiểu đúng nó mà do chúng đoán
mò, do may rủi mà chúng lựa chọn được các câu trả lời đúng Do đó chúng ta phai tính đến một yếu tố nữa là tỷ lệ may rủi mong đợi (Expected Chance Propotion) khi xem xét độ khó vừa phải của các item Tỷ lệ này thay đổi tuỳ, iheo sô' phương án lựa chọn của mỗi item Nếu item trắc nghiêm có hai lựa chọn thì tỷ lệ may rủi mong đợi là 50% Như vậy thì độ khó vừa phải của item trắc nghiệm này phải là trung bình cộng giữa tỷ lệ may rủi mong đợi và 100%, nghĩa là độ khó vừa phải của item trắc nghiệm hai lựa chọn là: (!00+50):2=75(% )
Tương tự như vậy, tỷ lệ may rủi mong đợi của item với bốn lựa chọn sẽ là: 100:4=25(%), nên độ khó vừa phải của các item trắc nghiệm bốn lựa chọn sẽ là: (100+25):2=62,5(% )
25
Trang 31Riêng với các item thuộc loại "trả lời tự do" như item điền th ế hoặc item huộc Irẻ phải tự tìm ra cách giải mà khồng có đáp án sẵn để cho chúng lựa chọn Ihì độ khó vừa phải của loại item trắc nghiệm này sẽ là 50%.
Khi lựa chọn những item trắc nghiệm căn cứ vào độ khó của chúng, trước liên, ta phải gạt đi những item mà tất cả học sinh đều không trả lời được, VÌ đó
là những item quá khó Đồng thời, ta cũng phải gạt đi những item mà tất cả học sinh đều trả lời được vì đó là những item quá dễ Những item này vô dụng
vì không giúp phân biệt được học sinh giỏi và học sinh kém Một bài trắc nghiệm có hiệu lực và đáng tin cậy thường bao gồm những câu hỏi có độ khó xấp xỉ hay bằng độ khó vừa phải
Cách phân tích độ khó của item phù hợp với những trắc nghiệm đánh giá thành tích hay năng khiếu Đó là những trắc nghiệm nhằm đánh giá năng lực tối đa của người làm trắc nghiệm Với những trắc nghiệm đánh giá nhân cách, hứng Ihú, quan điểm, thái độ thì cách phân tích độ khó không thích hợp mà người la ihường sử dụng những kỹ thuật khác như kỹ thuật tính phần trăm của
sự nhất trí hoặc thang L ikelihood
* Độ khó của bài trắc nghiệm:
Có thể kể ra một số cách xác định độ khó của cả bài trắc nghiệm như sau:
Cách thứ nhất: Đối chiếu điểm số trung bình của bài trắc nghiệm với
điểm số trung bình lý tưởng Điểm trung bình lý tưởng là trung bình cộng của điểm số tối đa có thể có được và điểm may rủi mong đợi Điểm may rủi mong dợi bằng số câu hỏi của bài trắc nghiệm chia cho số lựa chọn của mỗi câu
Ví dụ, với các bài trắc nghiệm 50 câu hỏi, mỗi câu có 5 lựa chọn, thì điểm may rủi mong đợi là 50:5=10 và trung bình lý tưởng sẽ là: (10+50):2=30 Nếu trung hình thực sự của bài trắc nghiệm ấy trên hay dưới 30 quá xa, thì bài trắc nghiệm ấy có thể quá đễ hay quá khó
Trang 32Sở dĩ lấy điểm trung bình để xác định mức độ khó hay dễ của bài trắc nghiệm, là vì điểm trung bình bị chi phối hoàn toàn bởi độ khó trung bình của các cảu hỏi tạo thành bài trắc nghiệm ấy.
Cách thứ hai' Quan sát sự phân phối điểm số của bài trắc nghiệm ấy Nếu
trung bình của bài trắc nghiệm nằm xấp xỉ hay ngang với trung điểm của khoảng giữa điểm cao nhất và thấp nhất, và nếu không câu trác nghiệm nào bị điểm 0 hoặc điểm tối đa thì ta có thể nói rằng bài trắc nghiệm đó là thích hợp cho nhóm học sinh mà ta khảo sát Ví dụ: Với một bài trắc nghiệm 80 câu hỏi,
ta có điểm trung bình là 42 và phân bố điểm số của các học sinh là từ 10 điểm (điểm thấp nhất) đến 75 điểm (điểm cao nhất) Các dữ kiện ấy cho phép la kết luận rằng bài trắc nghiệm có độ khó vừa phải với học sinh lớp ấy Nhưng nếu cũng bài trắc nghiệm ấy lại ra cho một lớp khác, mà điểm trung bình là 69 và phân bố điểm số của các học sinh là từ 50 đến 80 điểm thì chứng tỏ ràng bài trắc nghiệm là quá dễ đối với nhóm học sinh này Ngược lại, nếu ở nhóm học sinh khác ta có điểm trung bình là 15 và phân bố điểm số của các học sinh là
lừ 10 đến 40 điểm thì ta có thể tin ràng bài trắc nghiệm này là quá khó đối với chúng
Ngoài hai cách xác định độ khó của bài trắc nghiệm như trên, còn có các cách xác định khác như cách xác định độ khó của bài trắc nghiêm dựa trên sự tương ứng giữa thành tích của người làm trắc nghiệm và độ khó của các item
Đó là cách phân tích câu trắc nghiệm theo mồ hình Rasch
1.5.1.2 Độ phân biệt của item
Bên cạnh việc xét xem những item của trắc nghiệm là dễ hay khó đối với nghiệm thể, chúng ta còn cần biết có sự khác nhau giữa những người giỏi và người kém trong việc trả lời các item đó không Hay nói cách khác, chúng ta cần xác định độ phân biệt của item
27
Trang 33Phân tích độ phân biệt của item thích hợp với hầu hết các kiểu trắc nghiệm Việc phân tích này sẽ cho biết có sự khác nhau giữa những kiểu người khác Irong việc ihực hiện các item hay không.
Với những trắc nghiệm đánh giá kết quả bộc lộ đặc trưng (Typical Performance Tests) như các trắc nghiệm về nhân cách, hứng thú, thái độ, việc phân tích độ phân biệt của item nhằm đánh giá xem có sự khác biệt trong cách thực hiện lừng item giữa những người có một đặc điểm đặc trưng nào đó với những người chưa có đặc điểm đó không Ví dụ: một trắc nghiệm đo về khả năng hướng ngoại của con người Trắc nghiệm đó nên được thiết kế để gồm những item mà những người hướng nội và những người hướng ngoại sẽ có khuynh hướng khác nhau khi trả lời các item đó Nếu trắc nghiêm này được soạn Ihảo tốt thì mỗi item đểu phải có kết quả phân biệt giữa hai nhóm người này và kết quả chung cùa việc thực hiện tất cả các item sẽ cho biết ai là người hướng ngoại và ai không có đặc tính này
Với những trắc nghiệm đánh giá năng lực (còn gọi là trắc nghiệm đánh giá kết quả bộc lộ tối đa - Maximal Performance Tests) Sự phân tích độ phân biệt của item nhằm xác định từng item có khả năng phân biệt giữa những người làm tốt trắc nghiệm và những người làm không tốt trắc nghiệm không Một bài trắc nghiệm năng lực được soạn thảo tốt phải khó đối với những người kém hơn là đối với những người giỏi Vì vậy, mỗi câu trắc nghiêm cũng phải khó với nhóm người có nãng lực kém hơn là nhóm người có năng lực tốt
"Câu hỏi được coi là có khả nâng phân biệt tốt nếu những người làm tốt toàn bộ bài trắc nghiệm cũng sẽ làm tốt câu hỏi đó hơn so với những người làm kém"
Nếu bài trắc nghiệm được đánh giá bàng điểm thì một item nào đó được coi là có độ phán biệt tốt nếu những người đạt tổng điểm trắc nghiệm cao cũng đạt điếm cao ở item đó hơn những người có tổng điểm trắc nghiệm thấp
Trang 34Có rãi nhiều cách tính độ phân biệt của item Dưới đây sẽ trình bày các phương pháp Ihông dụng nhất để tính độ phân biệt của item: Cách thứ nhất là dựa vào chỉ số phân biệt item (Item Discrimination Index) Cách này thường được sử dụng khi không có máy tính Cách thứ hai là dựa vào đánh giá tương quan item - tổng điểm (Item - Total Correlation) Tương quan này được xác định dễ dàng và nhanh chóng với những phần mềm thống kê máy tính đang thông dụng hiện nay.
* Đánh giá độ phân biệt dựa vào chỉ số phân biệt item: Cách đánh giá này
áp dụng với những trắc nghiệm mà các item của nó có thể xác định được một cách làm (hay một câu trả lời) là đúng
Công thức tính chỉ số phân biệt item là: D = (C-T)/N (1.2)
Trong đó: D = Chí số phân biệt item
c = Số trả lời đúng ở nhóm điểm cao
T = Số trả lời đúng ở nhóm điểm thấp
N = Số người ở nhóm điểm cao hoặc nhóm điểm thấp
Số người ờ nhóm điểm cao và nhóm điểm thấp được chọn bằng nhau và
có thể từ 25% đến 35% tổng số người làm trắc nghiệm Những tỷ lệ trong
khoảng 25%-35% sẽ cho ta những chỉ số phân biệt không khác nhau bao
nhiêu Nhưng tốt nhất là nên chọn mỗi nhóm gồm 27% tổng số người làm trắc nghiệm vì 27% là sự dung hoà tốt nhất giữa hai mục đích mà ta mong muốn đại ctưực nhưng không nhất quán với nhau: Một là, ta muốn có hai nhóm cao
và thấp càng đỏng càng tốt, hai là, ta lại muốn cho hai nhóm ấy có sự khác biệt nhau Khi ta sử dụng hai nhóm cao - thấp, mỗi nhóm gồm 27% của tổng số người làm trắc nghiệm thì la có the nói một cách chắc chắn rằng những người trong nhóm cao có khả năng cao hơn những người trong nhóm thấp Mặt khác, nếu ta chi lấy 10% chomoix nhóm thôi thì hiệu số về mức khả năng trung bình của hai nhóm sẽ cao hơn, nhưng số người trong mỗi nhóm sẽ ít hơn nhiều Vì vậy, ta không biết chắc chắn mức khả nãng trungbình của hai nhóm thực sự là
29
Trang 35hao nhiêu Do đó, ta ít chắc chắn hơn rằng nhóm cao có khả năng hơn nhóm (hấp.
Giá trị D (chỉ số phân biệt item) có thể trong khoảng từ -1,0 đến +1,0 Giá trị D thay đổi được giải thích như sau: Nếu item có câu trả lời khó cho nhũng người ở nhóm điểm thấp mà dễ cho những người ở nhóm điểm cao thì khi đó chỉ số D gần bằng 1,0 (item có độ phân biệt lý tưởng) Nếu item có câu trả lời ngang bằng cho cả hai nhóm thì chỉ số D gần bằng 0,0 (item không có độ phân biệt) Nếu item có câu trả lời dễ cho những người ở nhóm điểm thấp nhưng lại khó cho nhũng người ở nhóm điểm cao thì chỉ số D gần bằng -1,0 (item có độ phân biệt lý tưởng nhưng không giống với mong đợi) Tuy nhiên, hiếm khi D
có ba giá trị là -1,0; 0 và 1,0
Giá trị D bao nhiêu được coi là tốt? Căn cứ vào kinh nghiệm với rất nhiều loại trác nghiệm khác nhau, các chuyên gia đã đưa ra một thang đánh giá chỉ
số phủn biệt như dưới đây để giúp lựa chọn các câu trắc nghiệm:
Bảng 1.2: Đ án h giá độ p h ân biệt của item dự a vào chỉ sô phân biệtChỉ sô p h â n biệt Đ ánh giá độ p h ân biệt của item
Trong khi lựa chọn các item dựa vào chỉ số phân biệt (D), ta chỉ cần nhớ một điều là giá trị D càng cao thì càng tốt Với hai bài trắc nghiệm tương tự như nhau, bài trắc nghiệm nào có chỉ số phân biệt trung bình cao hơn là đáng tin cậy hơn
Giá trị độ phân biệt còn nói lên tính hiệu lực của trắc nghiệm Nếu trắc nghiệm và item đo cùng một đặc tính thì những ai có kết quả điểm thấp trên trác nghiệm cũng là những người có kết quà điểm thấp tren item hoặc ngược
Trang 36lại Như vậy, chỉ số phân biệt dương phù hợp tiêu chuẩn này Nếu một trácnghiệm chỉ gồm toàn các item có giá trị D dương, tức là nó gồm toàn nhữngitem đo cùng một đặc tính với trắc nghiệm Ngược lại, một trắc nghiệm có những item với chỉ số D âm, tức là trắc nghiệm gồm cả những item không cùng đo một đặc tính với trắc nghiệm.
Cách tính độ phân biệt cho các trắc nghiêm đánh giá nhân cách, hứng thú, thái độ với item có nhiều mức độ cũng có thể sử dụng kỹ thuật tính toán như các trác nghiệm đánh giá năng lực Tuy nhiên, sự giải thích về độ phân biệt của từng item có những điểm khác Không giống như các trắc nghiệm đánh giá năng lực, các item tốt thường có độ phân biệt D là số dương, còn ở các trắc nghiệm đánh giá về nhân cách, hứng thú, thái độ, các item tốt có thể có độ pliân biệt D là những số âm (nếu D = -1,0, item đó vẫn có độ phân biệt "lý tưởng" vì nó vẫn tách biệt các kiểu người khác nhau, tuy nhiên quan hệ giữa item và trác nghiệm không giống như inong đợi)
* Cách tính chỉ s ổ phân biệt của item :
Sau khi chấm điểm bài trắc nghiệm, để tính chỉ số phân biệt của item theo công thức (1.2), ta có thể áp dụng các bước đơn giản sau:
(1) Xếp tổng điểm của những người làm trắc nghiệm theo thứ tự từ cao đến llìâp
(2) Chọn ra hai nhóm dựa vào tổng điểm trắc nghiệm của họ: Nhóm điểm cao (gọi là nhóm C) gồm 27% số người có tổng điểm trắc nghiệm cao nhất và nhóm diêm Ihấp (gọi là nhóm T) gồm 27% số người có tổng điểm trắc nghiệm thấp nhất
(3) Tính số trả lời đúng ở nhóm c và nhóm T đối với item mà ta định tính chỉ số phân biệt D
(4) Ẩp dụng công thức (1.2) để tính giá trị D
31
Trang 37Ví dụ: Ta làm Irắc nghiệm với một nhóm gồm 37 học sinh Sau khi chấm điểm và xếp thứ tự lổng điểm trắc nghiệm, ta chọn ra nhóm c gồm 10 em điểm cao nhất và nhóm T gồm 10 em điểm thấp nhất, vì 37 X 27% = 10 (em).
Giả sử với một item cụ thể nào đó, 9 em ở nhóm c và 5 em ở nhóm T trả lcri đúng; áp dụng công thức (1.2), ta có: D = (9-5): 10=0,4 Do đó, ta có thể nói rằng: chí số phân biệt của item đó là tương đối tốt
Cách lính độ phản biệl của item dựa vào chỉ số phân biệt được áp dụng rất nhiều khi máy tính chưa phát triển Người giáo viên có thể dễ dàng tính được giá trị D cho những bài trắc nghiệm ở lớp học của mình, nhưng trong 1-2 thập
kỉ gần đây, với sự trợ giúp của máy tính, người ta lại thường tính độ phân biệt dựa vào các hộ số tương quan như: hệ số Pearson, Chi bình phương, Flanagan Davis V V Những cách lính này rất nhanh và tiện lợi với các phần mềm thống
kê phổ biến hiện nay Phần dưới đây sẽ giới thiệu một phương pháp thông dụng nhất trong các phương pháp tính hệ số tương quan trên - Đó là đánh giá lương quan item - tổng điểm dựa vào hệ số tương quan Pearson
Với các kết quả trắc nghiệm, ta có thể coi hệ số tương quan Pearson như
hệ số tương quan giữa điểm của mỗi người ở từng item và tổng điểm trắc nghiệm của họ
Tương quan item - tổng điểm (r pearson) được giải thích y hệt như chỉ sô' phân biệl D Một hệ số tương quan item - tổng điểm dương (+) cho biết rằng item ấy phàn biệt được học sinh làm giỏi và học sinh làm kém Quan trọng hơn nữa, nó cho thấy rằng item ấy và bài Irấc nghiệm đều đo lường cùng một đặc lính Mộl hệ số tương quan zero (0) có nghĩa là với item ấy không có sự trả lời phân biệt giữa những người làm giỏi và làm kém trắc nghiệm Một hệ số tương quan ăm cho biết rằng điểm của item và tổng điểm không tương hợp với nhau Những người làm dúng item trắc nghiệm ấy lại là những người làm kém toàn thể bài trắc nghiệm
Trang 38ư u thế chính của các phương pháp đánh giá dựa vào hệ số tương quan là
độ phân biột của item được xác định rất nhanh nhờ máy tính - một phương tiện khá phổ biến hiện nay và tính ý nghĩa của các hệ số tương quan cũng có được ngay nhờ máy tính với các chương trình phần mềm thống kê thông dụng Điều
mà chúng ía không làm được khi tính độ phân biệt dựa vào chỉ số phân biệt D
khi đã xử lý các số liệu thử nghiêm hay kiểm nghiệm, ta sẽ được những item
có độ khó vừa phải và độ phân biệt tốt Những item này nên được giữ nguyên cho trắc nghiệm Bên cạnh đó, ta có cả những item không thoả mãn một trong hai điều kiện trên Những item này cần phải loại bỏ hoặc sửa chữa cho thích hợp Nhưng làm thế nào để chỉnh sửa được các item này?
Muốn tăng hay giảm độ khó của item, ta cần giảm hay tăng độ phức tạp của nó Công việc này có thể nhờ các chuyên gia có kiến thức và kinh nghiệm chuyên môn irong lĩnh vực đang được đánh giá đảm nhiệm
Còn để làm tãng độ phân biệt của item, ta cần có số liệu thống kê của những người làm trắc nghiệm về các item phải sửa chữa Ta sẽ xem xét những
số liệu và thay đổi ccc phương án trả lòi đúng của item để item có độ phân biệt lốt hơn, thu hút được những người giỏi hơn lựa chọn Đồng thời ta cũng có thể lliay đổi các phương án nhiễu (distractor) của item để chúng có sức thu hút hơn với những người không nắm chắc lĩnh vực này
1.6 Độ tin cậy của bài trắc nghiệm.
Phần trên, chúng ta đã bàn đến việc phân tích và chỉnh sửa các item của trắc nghiệm, nhưng khi nói đến tính hữu dụng của một bài trắc nghiệm, chúng
ta không thể không nói tới độ tin cậy và độ hiệu lực của nó Một trắc nghiệm được coi là tốt nếu nó vừa có hiệu lực và vừa đáng tin cậy Hay nói cách khác, vấn đề quan trọng nhất để đánh giá một trắc nghiệm là xác định độ tin cậy và
độ hiệu lực của nó
33
Trang 39Sau đây, chúng ta sẽ xét đến những vấn đề liên quan đến độ tin cậy của một trắc nghiệm,.
1.6.1 Độ tin cậy là gì?
Một bài trác nghiệm được coi là đáng tin cậy khi những kết quả của bài trắc nghiệm đó có tính vững chắc hay tính ổn định tương đối Điều này là do các phép đo chỉ có giá trị khi nó đo một đặc điểm gì đó tương đối ổn định và
do đó ban Ihân phép đo cũng phải có tính ổn định tương đối Điều này có nghĩa
là "một test được coi là có tính đích xác (hay tính tin cậy) nếu công cụ này ở lần đo lặp lại, dưới những điều kiện như cũ, vẫn cho kết quả đo như trước" Hay nói cách khác, một trắc nghiệm được coi là có độ tin cậy khi nếu một nhóm Irẻ được làm trắc nghiệm ấy nhiều lần, trong những điều kiện tương tự, thì ở mỗi lần trắc nghiệm, từng trẻ vẫn giữ được thứ hạng tương đối của mình trong nhóm đó
Một trắc nghiệm là đáng tin cậy khi điểm số của một người sau hai lần làm trắc nghiêm chỉ có những thay đổi đáng kể khi bản thân họ có sự thay đổi llurc sự giữa hai lần trắc nghiệm về hiểu biết, kỹ n â n g liên quan đến đặc tính được đo ở trắc nghiệm
Về mặt lý thuyết, độ tin cậy có thể được xem như là một số đo về sự sai khác giữa điểm số quan sát được và điểm số thực Điểm số quan sát được là điểm số mà nghiệm thể đã đạt được, còn điểm số thực là điểm số lý thuyết mà người đó sẽ đạt được nếu không mắc sai số trong đo lường Điểm số quan sát được cũng có thể coi là điểm số mà người đã đạt được khi làm một bài trắc nghiệm riêng biệt trong số muôn vàn các bài trắc nghiệm có thể có về lĩnh vực
đó, còn điểm số thực là điểm số trung bình mà người đó đạt được từ muôn vàn
bài trác nghiệm thuộc lĩnh vực đó Điểm số thực được ước tính trên cơ sở điểm
quan sát được
Trang 40Các lý thuyết về trắc nghiệm đểu cho ràng điểm số của trắc nghiệm đo
lường một đặc tính, phẩm chất hay năng lực nào đó của một cá nhân bằng điểm thực của cá nhân cộng với điểm lỗi của sự đo lường
X = T + E Trong đó: X = Điểm trắc nghiệm
T = Điểm thực
E = Sai số của phép đo Điểm thực được xác định như là điểm trung bình của vô số những lần đo của trắc nghiệm trên một cá nhân Còn sai số của sự đo lường là sự khác hiệt ở mỗi lần đo do các yếu tố cá nhân (động cơ, xúc cảm, tâm t hế Do các yếu tố tình huống, hoàn cảnh ảnh hương (tiếng ổn, ánh sáng, lời hướng d ẫ n ), nhưng chúng ta chưa bao giờ đo được chính xác điểm trắc nghiệm thực cho một cá nhân Như vậy để đánh giá độ tin cậy của trắc nghiệm, người ta phải dựa vào kết quả làm trắc nghiệm của một nhóm người (điểm trắc nghiệm cùa mẫu) nhằm xác định tỉ lộ thành phần của điểm thực và sai số trong kết quả điểm trắc nghiệm của cả nhóm Nói một cách cụ thể hơn, đánh giá độ tin cây là tìm cách xác định mức độ trên đó sự khác biệt điểm số trắc nghiệm phản ánh sự khác biệl điểm thực ở nhóm người làm trắc nghiệm
Như vậy, độ tin cậy là một khái niệm lý thuyết, là thuật ngữ có nghĩa rộng bao hàm nhiều loại mức độ chính xác trong đo lường Các sách giáo khoa về
đo lường đã đưa ra nhiều phương pháp để xác định các mức độ chính xác đó Dưới đây, chúng ta sẽ xem xét các phương pháp thống kê thực hành để đánh giá một vài khía cạnh của độ tin cậy
1.6.2 Một sô' phương pháp cơ bản để đánh giá độ tin cậy của trác nghiệm.
Trong thống kê, độ tin cậy của một bài trắc nghiêm có thể coi như độ lương quan giữa hai hay nhiều bộ điểm số của bài trắc nghiệm đối với cùng một nhóm đối tượng nghiên cứu Những bộ điểm số này có thể thu được bàng
35