Luận văn thạc sĩ : Nghiên cứu chương trình đánh giá mục tiêu học tập
Trang 15 Khách thể và đối tượng nghiên cứu 6
6 Phương pháp nghiên cứu 6
7 Nhiệm vụ nghiên cứu 7
8 Cấu trúc của luận văn 8 CHƯƠNG 1 CƠ SỞ LÍ LUẬN VÀ THỰC TIỄN 9 1.1 Đo lường và đánh giá trong giáo dục 9
1.1.1 Khái niệm về đo lường và đánh giá trong giáo dục 9 1.1.2 Phân loại các mục tiêu giáo dục và các mức độ của lĩnh vực nhận thức 10
1.1.2.2 Các mức độ của lĩnh vực nhận thức 10
1.1.3.2 Mục đích của việc đánh giá kết quả học tập 12
1.1.3.3 Cơ sở của việc đánh giá kết quả học tập 13
1.1.4 Phương pháp trắc nghiệm đánh giá kết quả học tập của học sinh 14
1.1.5.1 Phân loại công cụ đo 15 1.1.5.2 So sánh phương pháp trắc nghiệm khách quan và tự luận 16
1.1.6 Yêu cầu của công cụ đo lường và đánh giá trong giáo dục 18
1.1.7.1 Tiêu chí để đánh giá câu hỏi trắc nghiệm khách quan 18
1.1.7.2 Phân tích câu hỏi trắc nghiệm khách quan 19
1.1.9 Lý thuyết khảo thí hiện đại 21 1.1.10 Ngân hàng câu hỏi trắc nghiệm khách quan 24
1.1.11 Quy trình thiết kế câu hỏi trắc nghiệm khách quan 25 1.1.12 Quy trình chuẩn bị và triển khai một kỳ thi trắc nghiệm
1.2 Tình hình nghiên cứu về khoa học đo lường đánh giá trên thế giới và Việt Nam 28 1.3 Công tác đánh giá trong trường THPT hiện nay 30
Trang 21.3.1 Những bất cập trong đo lường và đánh giá ở trường THPT 30
1.3.2 Một số giải pháp cho những bất cập 31 1.4 Đổi mới kiểm tra đánh giá trong trường THPT 32
CHƯƠNG 2 XÂY DỰNG NGÂN HÀNG CÂU HỎI
2.2 Thực hiện quy trình thiết kế câu hỏi trắc nghiệm khách quan 39
2.2.2 Mức độ kiến thức dùng để đo lường 41 2.2.3 Xác định nội dung chi tiết bài kiểm tra Lập bảng trọng số 42
3.1 Xây dựng ngân hàng câu hỏi trắc nghiệm khách quan môn Toán 12 62 3.2 Sử dụng ngân hàng câu hỏi trắc nghiệm khách quan 76 3.3 Nâng cao kỹ năng ra đề kiểm tra của giáo viên 76
Trang 3CÁC CHỮ VIẾT TẮT
HH: Hình học HK: Học kỳ
IRT: Lý thuyết hồi đáp GT: Giải tích
GTLN: Giá trị lớn nhất GTNN: Giá trị nhỏ nhất NHCH: Ngân hàng câu hỏi TNKQ: Trắc nghiệm khách quan TL: Tự luận
THPT: Trung học phổ thông
Trang 4MỞ ĐẦU
1 Lý do chọn đề tài
Một trong những mục tiêu của công cuộc cải cách giáo dục ở nước ta là đổi mới giáo dục phổ thông trong đó có đổi mới giáo dục trung học phổ thông “Mục tiêu của việc đổi mới chương trình giáo dục phổ thông là xây dựng nội dung chương trình, phương pháp giáo dục, sách giáo khoa phổ thông mới nhằm nâng cao chất lượng giáo dục toàn diện thế hệ trẻ, đáp ứng yêu cầu phát triển nguồn nhân lực phục vụ công nghiệp hóa, hiện đại hóa đất nước, phù hợp với thực tiễn và truyền thống Việt Nam; tiếp cận trình độ giáo dục phổ thông ở các nước phát triển trong khu vực và thế giới” (Nghị quyết số 40/2000/Quốc hội 10, ngày 9/12/2000) Đổi mới chương trình giáo dục phổ thông phải là một quá trình từ đổi mới mục tiêu, nội dung, phương pháp đến phương tiện giáo dục, đánh giá chất lượng giáo dục Điều này được thể hiện trong Luật giáo dục: “Chương trình giáo dục phổ thông thể hiện mục tiêu giáo dục; quy định chuẩn kiến thức, kỹ năng, phạm vi và cấu trúc nội dung giáo dục phổ thông; phương pháp và hình thức tổ chức hoạt động giáo dục, cách thức đánh giá kết quả giáo dục đối với mỗi môn học ở mỗi lớp và mỗi cấp học của giáo dục phổ thông” (Điều 29, mục II - Luật Giáo dục - 2005) Vai trò của kiểm tra đánh giá trong tiến trình đổi mới nền giáo dục nhằm nâng cao chất lượng đào tạo đã được khẳng định như một chiến lược, một chính sách giáo dục quốc gia
Thực tiễn công tác kiểm tra, đánh giá ở trường phổ thông hiện nay cho ta thấy tình trạng đánh đồng việc cho điểm với đánh giá năng lực học sinh; có xu hướng chú trọng kiến thức ghi nhớ hơn là rèn kỹ năng và năng lực học sinh; công tác kiểm tra, đánh giá chịu sức ép của thi cử và bệnh thành tích; các kết quả kiểm tra thường để xếp loại học sinh hơn là tìm ra điểm mạnh yếu của học sinh để giúp học sinh tiến bộ và định hướng cho giáo viên trong việc cải tiến nội dung và phương pháp giảng dạy; giáo viên và nhà quản lý còn yếu về năng lực đánh giá trong giáo dục
Các giải pháp cải tiến thực trạng trên đang được tập trung vào các vấn đề lớn là: xây dựng cơ chế đào tạo đội ngũ chuyên gia về đánh giá trong giáo dục và bồi dưỡng năng lực đánh giá cho giáo viên; tạo sự thay đổi mạnh mẽ về nhận thức đối với công tác kiểm tra đánh giá; cải tiến phương pháp kiểm tra đánh giá phù hợp với những định hướng của giáo dục Việt Nam
Trang 5Đánh giá trong giáo dục là công cụ để xác định năng lực nhận thức người học, điều chỉnh quá trình dạy học Đổi mới phương pháp dạy học được chú trọng để đáp ứng những yêu cầu mới của mục tiêu giáo dục nên việc kiểm tra, đánh giá phải chuyển biến mạnh theo hướng phát triển trí thông minh, sáng tạo của học sinh, khuyến khích vận dụng linh hoạt các kiến thức, kỹ năng đã học vào những tình huống thực tế, làm bộc lộ khả năng của học sinh Đánh giá không chỉ thực hiện ở thời điểm cuối cùng của mỗi giai đoạn giáo dục mà trong cả quá trình giáo dục
Hướng tới yêu cầu kiểm tra đánh giá công bằng, khách quan kết quả học tập của học sinh, ngoài phương pháp đánh giá bằng quan sát và vấn đáp, trong phương pháp viết người ta bổ sung các hình thức đánh giá khác như đưa thêm các dạng câu hỏi trắc nghiệm khách quan; chú ý hơn tới việc đánh giá cả quá trình lĩnh hội tri thức của học sinh, quan tâm tới việc tích cực hoá hoạt động học tập của học sinh Trên cơ sở nắm chắc kiến thức đo lường và đánh giá trong giáo dục, cần tiến hành xây dựng ngân hàng câu hỏi trắc nghiệm (gồm cả câu hỏi TNKQ và TL) chuẩn hoá cho từng môn học của mỗi cấp học hay bậc học Sử dụng ngân hàng này, học sinh có thể tự ôn tập kiểm tra kiến thức, giáo viên có thể sử dụng để kiểm tra đánh giá học sinh Để làm được điều này, phải bắt đầu từ việc đào tạo đội ngũ chuyên gia về đánh giá trong giáo dục và bồi dưỡng các kiến thức về khoa học đo lường đánh giá trong giáo dục cho giáo viên ở mọi cấp học, bậc học
Công cuộc đổi mới công tác kiểm tra đánh giá ở THPT hiện nay đang được ngành giáo dục đặc biệt quan tâm, các giáo viên THPT được tập huấn về đổi mới phương pháp kiểm tra đánh giá, tuy nhiên hiệu quả chưa cao Đa số giáo viên chưa có nhận thức đúng đắn về công tác kiểm tra đánh giá, phần lớn vẫn quan niệm rằng kiểm tra chỉ để cho điểm và xếp hạng học sinh Các câu hỏi trắc nghiệm khách quan do giáo viên soạn không được phân tích, đánh giá nên các đề kiểm tra do giáo viên soạn cũng chưa có hiệu quả Các trường THPT có đội ngũ giáo viên đông đảo giảng dạy ở từng bộ môn, nếu có kiến thức chuyên môn sâu sắc cộng với kiến thức về đo lường đánh giá, chắc chắn việc cùng nhau góp phần thành lập ngân hàng câu hỏi trắc nghiệm dùng để kiểm tra đánh giá kết quả học tập của học sinh là việc làm không khó, nhưng sẽ mất nhiều thời gian và công sức
Trước tình hình như vậy, là một giáo viên dạy Toán THPT, tôi chọn đề tài
luận văn: “Nghiên cứu, xây dựng ngân hàng câu hỏi trắc nghiệm khách quan
dùng để kiểm tra đánh giá kết quả học tập môn Toán lớp 12 tại trường THPT
Trang 6phần vào quá trình đổi mới phương pháp kiểm tra đánh giá kết quả học tập của học sinh ở bậc THPT, đồng thời nâng cao kỹ năng của giáo viên trong việc thiết kế câu hỏi TNKQ dùng để kiểm tra đánh giá kết quả học tập của học sinh
2 Mục đích nghiên cứu của đề tài
• Nghiên cứu để xây dựng ngân hàng câu hỏi trắc nghiệm khách quan môn Toán lớp 12 dùng trong kiểm tra đánh giá kết quả học tập của học sinh
3 Giới hạn, phạm vi nghiên cứu
• Đề tài nghiên cứu, xây dựng khoảng 400 câu hỏi TNKQ nhiều lựa chọn đưa vào ngân hàng câu hỏi TNKQ dùng để kiểm tra, đánh giá kết quả học tập môn Toán 12 tại trường THPT Bến Tre - Tỉnh Vĩnh Phúc
• Nghiên cứu thử nghiệm sử dụng câu hỏi TNKQ vào kiểm tra đánh giá kết quả học tập môn Toán cho học sinh lớp 12A1 trường THPT Bến Tre, Tỉnh Vĩnh Phúc
4 Câu hỏi nghiên cứu/ giả thuyết nghiên cứu của đề tài
4.1 Câu hỏi nghiên cứu
• Làm thế nào để xây dựng ngân hàng câu hỏi TNKQ cho môn Toán 12?
• Định hướng sử dụng ngân hàng câu hỏi TNKQ trong kiểm tra đánh giá kết quả học tập của học sinh như thế nào?
4.2 Giả thuyết nghiên cứu
• Việc xây dựng, thử nghiệm và phân tích câu hỏi trong ngân hàng câu hỏi trắc nghiệm khách quan môn Toán dựa trên cơ sở khoa học đo lường đánh giá sẽ góp phần xây dựng được bộ câu hỏi trắc nghiệm khách quan phục vụ hiệu quả cho công tác kiểm tra đánh giá kết quả học tập môn Toán của học sinh • Có thể sử dụng các câu hỏi trong ngân hàng câu hỏi TNKQ môn Toán để
thiết kế các đề kiểm tra đánh giá kết quả học tập của học sinh
5 Khách thể và đối tượng nghiên cứu 5.1 Khách thể nghiên cứu
• Học sinh lớp 12A1 trường THPT Bến Tre thuộc Sở GD – ĐT Vĩnh Phúc
5.2 Đối tượng nghiên cứu
• Nghiên cứu xây dựng ngân hàng câu hỏi trắc TNKQ môn Toán 12
6 Phương pháp nghiên cứu 6.1 Nghiên cứu lý thuyết
Trang 7• Nghiên cứu các tài liệu về đường lối giáo dục, phương hướng phát triển giáo dục, các Nghị quyết, chỉ thị của Bộ GD&ĐT về đổi mới chương trình giáo dục phổ thông
• Nghiên cứu các tài liệu về đo lường đánh giá trong giáo dục
• Nghiên cứu bộ sách giáo khoa môn Toán bậc trung học phổ thông
chương trình phân ban và không phân ban
6.2 Nghiên cứu thực nghiệm
• Quan sát: quan sát quá trình thực hiện đổi mới kiểm tra đánh giá của giáo viên và học sinh, quá trình thử nghiệm xây dựng ngân hàng câu hỏi
TNKQ
• Điều tra: bằng phiếu hỏi và phỏng vấn để tìm hiểu ý kiến của học sinh về môn học và các hình thức kiểm tra đánh giá mà giáo viên đang sử dụng giúp giáo viên kịp thời điều chỉnh phương pháp dạy học và kiểm tra đánh giá
• Thực nghiệm: góp phần đổi mới phương pháp đánh giá ở bậc THPT thông qua việc thiết kế và thử nghiệm công cụ đánh giá: thiết kế câu hỏi TNKQ, đề kiểm tra TNKQ; tổ chức thi-kiểm tra; đánh giá câu hỏi TNKQ, đề TNKQ; thiết lập ngân hàng câu hỏi TNKQ
• Phân tích và tổng kết kinh nghiệm
• Phương pháp chuyên gia: tiếp thu ý kiến của các chuyên gia, đồng nghiệp, học sinh trong quá trình thiết kế, thử nghiệm, phân tích đánh giá câu hỏi TNKQ
6.3 Phương pháp Toán học
• Sử dụng phần mềm SPSS phân tích số liệu thống kê • Sử dụng phần mềm chuyên dụng Quest, ConQuest • Sử dụng phần mềm trộn câu hỏi trắc nghiệm McMIX
7 Nhiệm vụ nghiên cứu
• Nghiên cứu cơ sở lý luận để lựa chọn phương pháp xây dựng ngân hàng câu TNKQ dùng trong việc kiểm tra đánh giá kết quả học tập của học sinh
• Xây dựng ngân hàng câu hỏi TNKQ dùng để kiểm tra đánh giá kết quả học tập của học sinh trường THPT Bến Tre - Vĩnh Phúc
Trang 8• Thử nghiệm các câu hỏi TNKQ đã xây dựng để phân tích chọn lựa các
câu hỏi có chất lượng
• Đánh giá câu hỏi TNKQ để bổ sung vào ngân hàng câu hỏi TNKQ
8 Cấu trúc của luận văn Mở đầu
Chương 1 Cơ sở lý luận và thực tiễn
Chương 2 Xây dựng ngân hàng câu hỏi trắc nghiệm khách quan môn Toán 12
Chương 3 Kết quả nghiên cứu
Kết luận và khuyến nghị
Phụ lục
Trang 9CHƯƠNG 1 CƠ SỞ LÍ LUẬN VÀ THỰC TIỄN
1.1 Đo lường và đánh giá trong giáo dục
1.1.1 Khái niệm về đo lường và đánh giá trong giáo dục
Đánh giá là một khâu quan trọng trong quá trình giáo dục Quá trình giáo dục nào mà một con người tham gia cũng nhằm tạo ra những biến đổi nhất định trong con người đó Muốn biết những biến đổi đó xảy ra ở mức độ nào phải đánh giá hành vi của người đó trong một tình huống nhất định Sự đánh giá cho phép chúng ta xác định mục tiêu giáo dục được đặt ra có phù hợp hay không và có đạt được hay không, việc giảng dạy có thành công hay không, người học có tiến bộ hay không [16]
- Đo lường (Measurement) là quá trình thu thập thông tin một cách định lượng (số
đo) về các đại lượng đặc trưng của đào tạo năng lực (nhận thức, tư duy, kỹ năng và phẩm chất nhân văn) trong quá trình giáo dục [12]
- Kiểm tra/Lượng giá (Assessment) là việc đánh giá năng lực hoặc phẩm chất của
sản phẩm đào tạo trong quá trình giáo dục theo các hệ thống quy tắc hoặc tiêu chuẩn nào đó, căn cứ vào các thông tin định tính hoặc định lượng (số đo) Lượng giá có thể thực hiện đầu quá trình giảng dạy để giúp tìm hiểu và chẩn đoán (diagnostic) về đối tượng giảng dạy, có thể triển khai trong tiến trình (formative) giảng dạy để tạo những thông tin phản hồi giúp điều chỉnh quá trình dạy và học, cũng có thể thực hiện lúc kết thúc (summative) để tổng kết Trong giảng dạy ở nhà trường, các đo lường trong tiến trình thường gắn chặt với người dạy, tuy nhiên các đo lường kết thúc thường bám sát vào mục tiêu dạy học đã được đề ra, và có thể tách khỏi người dạy
- Đánh giá (Evaluation) là việc căn cứ vào các số đo và các tiêu chí xác định, đánh
giá năng lực và phẩm chất của sản phẩm đào tạo để nhận định, phán đoán và đề xuất các quyết định nhằm nâng cao không ngừng chất lượng đào tạo Đánh giá có thể là định lượng dựa vào các con số hoặc định tính dựa vào các ý kiến và giá trị [16] Trong giáo dục, có 6 loại đánh giá chính [12]:
1- Đánh giá mục tiêu đào tạo đáp ứng với yêu cầu của kinh tế-xã hội 2- Đánh giá chương trình/nội dung đào tạo
3- Đánh giá sản phẩm đào tạo đáp ứng mục tiêu đào tạo
4- Đánh giá quá trình đào tạo (bao gồm đánh giá chuẩn đoán, đánh giá hình thành, đánh giá tổng kết)
5- Đánh giá tuyển dụng
Trang 106- Đánh giá kiểm định công nhận cơ sở đào tạo
1.1.2 Phân loại các mục tiêu dạy học và các mức độ của lĩnh vực nhận thức 1.1.2.1 Mục tiêu dạy học
Benjamin S Bloom và các cộng tác viên đã xây dựng một hệ thống phân loại các mục tiêu của quá trình giáo dục Ba lĩnh vực của các hoạt động giáo dục đã được xác định đó là:
+ Lĩnh vực nhận thức thể hiện ở khả năng suy nghĩ, lập luận, bao gồm việc thu thập các sự kiện, giải thích, lập luận theo kiểu diễn dịch và quy nạp và sự đánh giá có phê phán
+ Lĩnh vực hành động liên quan đến những kỹ năng đòi hỏi sự khéo léo về chân tay, sự phối hợp các cơ bắp từ đơn giản đến phức tạp
+ Lĩnh vực cảm xúc liên quan đến những đáp ứng về mặt tình cảm, bao hàm cả những mối quan hệ như yêu ghét, thái độ nhiệt tình, thờ ơ, cũng như sự cam kết với một nguyên tắc và sự tiếp thu các ý tưởng [16]
Mục tiêu dạy học là những gì học sinh cần đạt được sau khi học xong môn học, bao gồm:
- Hệ thống kiến thức khoa học và cả phương pháp nhận thức chung - Hệ thống các kĩ năng
- Khả năng vận dụng vào thực tế
- Thái độ, tình cảm đối với khoa học và xã hội
1.1.2.2 Các mức độ của lĩnh vực nhận thức
Bloom cũng xây dựng nên các cấp độ của các mục tiêu giáo dục trong lĩnh
vực nhận thức được chia thành các mức độ hành vi từ đơn giản nhất đến phức tạp
nhất như sau:
- Biết (Knowledge): là sự nhớ lại các dữ liệu đã học được trước đây Điều đó có
nghĩa là một người có thể nhắc lại một loạt dữ liệu, từ các sự kiện đơn giản đến các lý thuyết phức tạp, tái hiện trong trí nhớ những thông tin cần thiết Đây là cấp độ thấp nhất của kết quả học tập trong lĩnh vực nhận thức
- Hiểu (Comprehension): là khả năng nắm được ý nghĩa của tài liệu Điều đó có thể
thể hiện bằng việc chuyển tài liệu từ dạng này sang dạng khác (từ các từ sang số liệu), bằng cách giải thích tài liệu (giải thích hoặc tóm tắt) và bằng cách ước lượng xu hướng tương lai (dự báo các hệ quả hoặc ảnh hưởng) Kết quả học tập ở cấp độ này cao hơn so với nhớ, và là mức thấp nhất của việc thấu hiểu sự vật
Trang 11- Vận dụng (Application): là khả năng sử dụng các tài liệu đã học vào một hoàn
cảnh cụ thể mới Điều đó có thể bao gồm việc áp dụng các quy tắc, phương pháp, khái niệm, nguyên lý, định luật và lý thuyết Kết quả học tập trong lĩnh vực này đòi hỏi cấp độ thấu hiểu cao hơn so với cấp độ hiểu trên đây
- Phân tích (Analysis): là khả năng phân chia một tài liệu ra thành các phần của nó
sao cho có thể hiểu được các cấu trúc tổ chức của nó Điều đó có thể bao gồm việc chỉ ra đúng các bộ phận, phân tích mối quan hệ giữa các bộ phận, và nhận biết được các nguyên lý tổ chức được bao hàm Kết quả học tập ở đây thể hiện một mức độ trí tuệ cao hơn so với mức hiểu và áp dụng vì nó đòi hỏi một sự thấu hiểu cả nội dung và hình thái cấu trúc của tài liệu
- Tổng hợp (Synthesis): là khả năng sắp xếp các bộ phận lại với nhau để hình thành
một tổng thể mới Điều đó có thể bao gồm việc tạo ra một cuộc giao tiếp đơn nhất (chủ đề hoặc bài phát biểu), một kế hoạch hành động (dự án nghiên cứu), hoặc một mạng lưới các quan hệ trừu tượng (sơ đồ để phân lớp thông tin) Kết quả học tập trong lĩnh vực này nhấn mạnh các hành vi sáng tạo, đặc biệt tập trung chủ yếu vào việc hình thành các mô hình hoặc cấu trúc mới
- Đánh giá (Evaluation): là khả năng xác định giá trị của tài liệu (tuyên bố, tiểu
thuyết, thơ, báo cáo nghiên cứu) Việc đánh giá dựa trên các tiêu chí nhất định Đó có thể là các tiêu chí bên trong (cách tổ chức) hoặc các tiêu chí bên ngoài (phù hợp với mục đích), và người đánh giá phải tự xác định hoặc được cung cấp các tiêu chí [16]
Bảng tóm tắt dưới đây cho biết các mức độ của mục tiêu giáo dục trong lĩnh vực nhận thức Giáo dục có thể nhằm vào các mục tiêu rất thấp như giúp người học nhận biết sự vật hiện tượng cho đến đánh giá tức là có năng lực phán xét, phê phán
Bảng 1.1 Bảng tóm tắt các mức nhận thức theo quan niệm của Bloom Các mức Nội dung của các mức
Đánh giá Phán xét, phê phán, so sánh, phân biệt, biện luận, đưa ra kết luận, hỗ trợ
Tổng hợp Kết hợp, sáng tạo, công thức hoá, thiết kế, sáng tác, xây dựng, sắp xếp lại, sửa chữa
Phân tích Phân biêt, biểu đồ hoá, ước lượng, phân chia, suy luận, sắp xếp trật tự, chia nhỏ ra
Áp dụng Trình diễn, tính toán, giải quyết, điều chỉnh nhỏ, sắp
Nhận thức cao
Trang 12xếp đơn giản, thao tác, liên hệ
Hiểu Phân loại, giải thích, tổng hợp lại, biến đổi, dự đoán, phân biệt sự khác nhau giữa hai sự vật, hiện tượng hay vấn đề
Nhận biết Định dạng, gọi tên, xác định, mô tả, liệt kê, kết nối, lựa
Ngày nay, nhiều nhà khoa học còn đề nghị bổ sung hai mức nhận thức là khả năng chuyển giao và khả năng sáng tạo Tuy nhiên, đối với giáo dục Việt Nam thì 6 mức nhận thức trên đủ để đánh giá nhận thức của học sinh [14]
Các công cụ đánh giá có hiệu quả phải giúp xác định được kết quả học tập ở mọi cấp độ nói trên để đưa ra một nhận định chính xác về năng lực của người được đánh giá về chuyên môn liên quan
1.1.3 Đánh giá kết quả học tập của học sinh 1.1.3.1 Kết quả học tập của học sinh
Có thể được hiểu theo hai cách khác nhau về kết quả học tập của học sinh tuỳ
theo mục đích của việc đánh giá
• Kết quả học tập được coi là mức độ thành công trong học tập của học sinh,
được xem xét trong mối quan hệ với mục tiêu đã xác định, chuẩn kiến thức và kĩ năng cần đạt được và thời gian bỏ ra
• Kết quả học tập cũng được coi là mức độ thành tích đã đạt được của một
học sinh so với các bạn cùng học
Đánh giá kết quả học tập là quá trình thu thập và xử lí thông tin về trình độ, khả năng thực hiện mục tiêu học tập của học sinh, về tác động và nguyên nhân của tình hình đó nhằm tạo cơ sở cho những quyết định sư phạm của giáo viên và nhà trường, cho bản thân học sinh để họ học tập ngày một tiến bộ hơn
1.1.3.2 Mục đích của việc đánh giá kết quả học tập
Theo Popham (1999), đánh giá kết quả học tập của học sinh nhằm các mục đích sau:
Đối với giáo viên:
- Dự đoán những điểm mạnh và điểm yếu của học sinh nhằm để giáo viên có
cơ hội giúp học sinh khắc phục những yếu kém của họ và tránh giảng dạy lại hoặc giảng dạy quá kỹ những điều học sinh đã biết
Trang 13- Giám sát quá trình tiến bộ của học sinh và giúp giáo viên thấy được sự tiến
bộ đó có tương xứng với mục tiêu đề ra hay không
- Giúp giáo viên có cơ sở cho điểm hay xếp loại học sinh
Đối với học sinh:
- Làm cho học sinh hiểu rõ mục tiêu cụ thể của việc học tập
- Giúp học sinh phát huy điểm mạnh và khắc phục những điểm yếu - Phát huy tính tích cực trong học tập
Đối với nhà quản lý:
- Xác định tính hiệu quả của chương trình học tập và cung cấp thông tin phản
hồi cho nhà quản lý và những người thiết kế chương trình
- Khẳng định với xã hội về chất lượng hiệu quả giáo dục
- Hỗ trợ việc đánh giá giáo viên thông qua kết quả giảng dạy [29] 1.1.3.3 Cơ sở của việc đánh giá kết quả học tập
Đánh giá kết quả học tập là quá trình đo lường mức độ đạt được của học sinh về các mục tiêu và nhiệm vụ của quá trình dạy học, là mô tả một cách định tính và định lượng: tính đầy đủ, tính đúng đắn, tính chính xác, tính vững chắc của kiến thức, mối liên hệ của kiến thức với đời sống, các khả năng vận dụng kiến thức vào thực tiễn, mức độ thông hiểu, khả năng diễn đạt bằng lời nói, bằng văn viết, bằng chính ngôn ngữ chuyên môn của học sinh v.v và cả thái độ của học sinh trên cơ sở phân tích các thông tin phản hồi từ việc quan sát, kiểm tra, đánh giá mức độ hoàn thành nhiệm vụ được giao, đối chiếu với những chỉ tiêu, yêu cầu dự kiến, mong muốn đạt được của môn học
Quy trình đánh giá gồm những công đoạn sau:
1- Phân tích mục tiêu học tập qua các kiến thức, kĩ năng trang bị cho người học
2- Đặt ra các yêu cầu về mức độ đạt được các kiến thức, kĩ năng dựa trên những dấu hiệu có thể đo lường hoặc quan sát được
3- Tiến hành đo lường các dấu hiệu đó để đánh giá mức độ đạt được về các yêu cầu đặt ra, biểu thị bằng điểm số
4- Phân tích, so sánh các thông tin nhận được với các yêu cầu đặt ra rồi đánh giá, xem xét kết quả học tập của học sinh, xem xét mức độ thành công của phương pháp giảng dạy của giáo viên để từ đó cải tiến, khắc phục những nhược điểm
Điều quan trọng trong đánh giá là quán triệt nguyên tắc vừa sức, bám sát yêu
Trang 14học sẽ nhận những thông tin phản hồi chính xác nhằm bổ sung, hoàn thiện quá trình dạy học
1.1.4 Phương pháp trắc nghiệm đánh giá kết quả học tập của học sinh
Trắc nghiệm là một loại công cụ đo lường, là phép lượng giá cụ thể mức độ khả năng thể hiện hành vi của một người nào đó, trong một lĩnh vực nào đó Theo tác giả Lâm Quang Thiệp [16], có thể phân chia các phương pháp trắc nghiệm theo các hình thức sau:
Về cách thực hiện trắc nghiệm, có thể phân chia các phương pháp trắc
nghiệm ra làm ba loại lớn: loại quan sát, loại vấn đáp và loại viết
- Loại quan sát giúp đánh giá các thao tác, các hành vi, các phản ứng vô thức,
các kỹ năng thực hành và cả một số kỹ năng về nhận thức, chẳng hạn cách giải quyết vấn đề trong một tình huống đang được nghiên cứu
- Loại vấn đáp có tác dụng tốt để đánh giá khả năng đáp ứng các câu hỏi được
nêu một cách tự phát trong một tình huống cần kiểm tra, cũng thường được sử dụng khi sự tương tác giữa người hỏi và người đối thoại là quan trọng, chẳng hạn để xác định thái độ người đối thoại
- Loại viết thường được sử dụng nhiều nhất Trắc nghiệm viết lại được chia
thành hai nhóm chính:
+ Nhóm các câu hỏi tự luận (essay test): Các câu hỏi buộc phải trả lời
theo dạng mở, thí sinh phải tự mình trình bày ý kiến, đưa ra câu trả lời trong một bài viết để giải quyết vấn đề mà câu hỏi nêu ra
+ Nhóm các câu hỏi trắc nghiệm khách quan (objective test): Đề thi
thường bao gồm rất nhiều câu hỏi, mỗi câu nêu lên vấn đề và những thông tin cần thiết để thí sinh có thể lựa chọn câu trả lời cho từng câu một cách ngắn gọn
Về cách chuẩn bị đề trắc nghiệm, có thể phân chia trắc nghiệm tiêu chuẩn
hoá và trắc nghiệm dùng ở lớp học
- Trắc nghiệm tiêu chuẩn hoá thường do các chuyên gia trắc nghiệm soạn thảo,
thử nghiệm, tu chỉnh, do đó mỗi câu trắc nghiệm được gắn với các chỉ số cho biết thuộc tính và chất lượng của nó (độ khó, độ phân biệt, phản ánh nội dung và mức độ kỹ năng nào), mỗi đề thi trắc nghiệm có gắn với một độ tin cậy xác định, ngoài ra có những chỉ dẫn cụ thể về cách triển khai trắc nghiệm và giải thích kết quả trắc nghiệm
- Trắc nghiệm dùng ở lớp học (hoặc trắc nghiệm do giáo viên soạn) là trắc
Trang 15thử nghiệm và tu chỉnh công phu, thường chỉ sử dụng trong các kỳ kiểm tra với số lượng học sinh không lớn và không thật quan trọng
Về việc đảm bảo thời gian để làm trắc nghiệm, có thể phân chia loại trắc
nghiệm theo tốc độ và trắc nghiệm không theo tốc độ
- Trắc nghiệm theo tốc độ thường hạn chế thời gian, chỉ một ít thí sinh làm
nhanh mới có thể làm hết số câu của bài trắc nghiệm, nhằm đánh giá khả năng làm nhanh của thí sinh
- Trắc nghiệm không theo tốc độ thường cung cấp đủ thời gian cho phần lớn
sinh có thể kịp suy nghĩ để làm hết bài trắc nghiệm
Về phương hướng sử dụng kết quả trắc nghiệm, có thể phân chia ra trắc
nghiệm theo chuẩn (norm-referrenced test) và trắc nghiệm theo tiêu chí
(criterion-referrenced test)
- Trắc nghiệm theo chuẩn: là trắc nghiệm được sử dụng để xác định mức độ
thực hiện của một cá nhân nào đó so với các các nhân khác cùng làm một bài trắc nghiệm
- Trắc nghiệm theo tiêu chí: là trắc nghiệm được sử dụng để xác định mức độ
thực hiện của một cá nhân nào đó so với tiêu chí xác định cho trước
1.1.5 Công cụ đo lường kết quả học tập 1.1.5.1 Phân loại công cụ đo
Các nhà giáo dục phân chia câu hỏi kiểm tra thành hai dạng:
- Dạng câu hỏi yêu cầu lựa chọn câu trả lời có sẵn gọi là câu hỏi TNKQ,
thường gọi tắt là câu hỏi trắc nghiệm TNKQ là phương pháp kiểm tra đánh giá kết quả học tập của học sinh bằng hệ thống câu hỏi TNKQ, gọi là “khách quan” vì cách cho điểm khách quan không phụ thuộc vào người chấm Đề thi sử dụng toàn câu hỏi TNKQ được gọi là đề TNKQ hoặc gọi tắt là đề trắc nghiệm
- Dạng câu hỏi yêu cầu trả lời theo cấu trúc, câu trả lời không có sẵn thí sinh
phải viết câu trả lời gọi là câu hỏi trắc nghiệm tự luận, thường gọi tắt là câu hỏi tự luận Trắc nghiệm tự luận là phương pháp đánh giá kết quả học tập bằng việc sử dụng công cụ đo lường là các câu hỏi đóng hoặc mở, học sinh trả lời dưới dạng bài viết bằng chính ngôn ngữ của học sinh trong một khoảng thời gian đã định trước Đề thi sử dụng toàn câu hỏi tự luận được gọi là đề trắc nghiệm tự luận hay gọi tắt là đề TL
Trong thực tế ngoài việc sử dụng đề TNKQ và đề TL, người ta còn sử dụng
Trang 16Tuỳ theo mục đích sử dụng mà các câu hỏi cũng được phân chia thành hai nhóm:
- Nhóm câu hỏi nhằm mục đích đo lường, đánh giá kiến thức - Nhóm câu hỏi nhằm mục đích đo lường, đánh giá kỹ năng [14]
Bảng 1.2 Bảng phân loại câu hỏi trắc nghiệm dùng để đo lường và đánh giá trong giáo dục
Câu hỏi nhằm mục đích đo lường, đánh giá kiến thức
1 Nhiều lựa chọn 2 Ghép đôi
3 Lựa chọn đúng sai 4 Bộ câu hỏi dựa vào hoàn cảnh cụ thể
1 Điền câu trả lời: + Tự luận trả lời ngắn + Tự luận trả lời dài 2 Tự luận miệng 3 Tự luận làm ở nhà
Câu hỏi nhằm mục đích đo lường, đánh giá kỹ năng
Bộ câu hỏi dựa vào hoàn cảnh cụ thể
Câu hỏi yêu cầu thao tác hay trình diễn
1.1.5.2 So sánh phương pháp trắc nghiệm khách quan và tự luận
Cả hai phương pháp, TNKQ và TL, đều là những phương pháp hữu hiệu để đánh giá kết quả học tập Cần nắm vững bản chất từng phương pháp và công nghệ
triển khai cụ thể để có thể sử dụng mỗi phương pháp đúng lúc, đúng chỗ [14]
Bảng 1.3 So sánh phương pháp TNKQ và TL
Hình thức câu hỏi / đề thi
- Một bộ câu hỏi trong đó mỗi câu
hỏi đều kèm theo các phương án trả lời cho sẵn để học sinh lựa chọn
phương án trả lời
- Một bộ câu hỏi trong đó mỗi câu hỏi không kèm theo các phương án trả lời mà học sinh phải tự luận để đưa ra câu trả lời
- Dễ sai về diễn đạt, nội dung câu hỏi thiếu chính xác (vì có nhiều câu hỏi nên khó rà soát)
- Ít bị sai sót về diễn đạt, nội dung rõ ràng
Mức độ phức tạp khi viết câu hỏi và tổ hợp đề
- Dễ chuẩn bị đáp án, hướng dẫn chấm
- Khó xây dựng đáp án, hướng dẫn chấm, xây dựng đáp án phức tạp
Trang 17- Có nhiều câu hỏi nên khó nhớ, dễ bảo mật
- Khó bảo mật đề thi do có ít câu hỏi
- Tốn ít thời gian làm bài, đề kiểm tra có thể phủ toàn bộ chương trình
- Phải dành nhiều thời gian cho học sinh làm bài, khó kiểm tra toàn bộ chương trình
- Tốn nhiều thời gian cho việc in ấn, nhân đề
- Không tốn nhiều công sức in ấn đề
Mức độ phức tạp khi tổ chức thi-
kiểm tra - Học sinh khó sử dụng tài liệu, loại trừ tiêu cực trong thi cử
- Học sinh dễ quay cóp sử dụng tài liệu, tiêu cực trong thi cử
Vấn đề đoán mò phương án trả lời đúng
- Học sinh có thể đoán mò - Học sinh không đoán được câu trả lời đúng
Độ tin cậy của đề thi
- Có thể đánh giá đầy đủ các mức nhận thức nếu các câu hỏi được soạn kỹ
- Dễ đánh giá được các mức nhận thức cao (phân tích, tổng hợp, đánh giá)
Tính giá trị
của đề thi - Bao quát toàn bộ chương trình nên đánh giá chính xác hơn, có thể có độ giá trị cao hơn
- Không bao quát toàn bộ chương trình nên độ giá trị có thể không cao
Sự phức tạp của việc chấm điểm
- Chấm điểm khách quan, công bằng - Chấm điểm phụ thuộc vào ý chủ quan của người chấm
Mức độ phức tạp khi phân tích, đánh giá câu hỏi thi
- Có nhiều phần mềm để phân tích, đánh giá câu hỏi, lựa chọn những câu hỏi có chất lượng
- Khó phân tích, đánh giá câu hỏi
Trang 181.1.6 Yêu cầu của công cụ đo lường và đánh giá trong giáo dục
Các đề thi-kiểm tra là công cụ để đo lường thành quả học tập của học sinh Theo Gronlund (1998) và Linn & Gronlund (1995), bộ công cụ để đo lường đánh giá trong giáo dục cần phải đảm bảo các yêu cầu sau:
- Có các khái niệm rõ ràng về các kết quả học tập dự định đánh giá (mong muốn học sinh đạt được mức kiến thức kỹ năng nào, phân bậc các kiến thức và kỹ năng đó, các tiêu chí đánh giá)
- Đề thi-kiểm tra đáp ứng được mục tiêu của kỳ thi-kiểm tra
- Sử dụng các dạng thức thi-kiểm tra khác nhau để loại trừ được nhược điểm của từng dạng thức
- Dạng thức thi-kiểm tra phải phù hợp với các kết quả học tập dự định đo lường, với các thông tin dự định phản hồi với học sinh
- Có số lượng câu hỏi – bài tập thích hợp để đánh giá đầy đủ và chính xác nhận thức của học sinh
- Quy trình thi-kiểm tra phải công bằng với học sinh
- Có các tiêu chí cụ thể để phân tích, lý giải các kết quả đạt được của học sinh - Có thông tin phản hồi kịp thời cho học sinh, nhấn mạnh những điểm mạnh
cần phát huy và điểm yếu cần khắc phục
- Kết quả đo lường phải hỗ trợ cho việc chấm điểm (đối với người học) và hỗ trợ hệ thống báo cáo của nhà trường
1.1.7 Đánh giá câu hỏi trắc nghiệm khách quan
1.1.7.1 Tiêu chí để đánh giá câu hỏi trắc nghiệm khách quan
Để có thể đo được chính xác kết quả học tập của học sinh thì cần phải có bộ công cụ đo lường - các đề thi đảm bảo độ tin cậy và có tính giá trị, điều đó chỉ có thể thực hiện được khi các câu hỏi trắc nghiệm được thiết kế, thử nghiệm và đánh giá bằng khoa học đo lường Đánh giá câu hỏi trắc nghiệm dựa trên các tiêu chí sau:
- Mục đích chính của kỳ thi - kiểm tra và mục tiêu kiểm tra của từng câu hỏi cần được xác định rõ
- Mỗi câu hỏi phải nhằm đạt được mục đích chính của kỳ thi - kiểm tra - Dạng thức của câu hỏi phải phù hợp với kỳ thi - kiểm tra
- Mỗi câu hỏi phải đảm bảo tính đồng nhất (sự ổn định) và tính độc lập cục bộ (độ phân biệt)
- Các câu hỏi phải được diễn đạt rõ ràng, đúng chính tả
Trang 191.1.7.2 Phân tích câu hỏi trắc nghiệm khách quan
Phân tích câu hỏi thi là một quá trình xem xét chúng một cách kỹ lưỡng có phê phán Phân tích câu hỏi thi nhằm làm tăng chất lượng của chúng, loại bỏ những câu quá tồi, sửa chữa những câu hỏi có thể sửa được và giữ lại những câu đáp ứng yêu cầu
Phân tích câu hỏi thi có thể thực hiện theo hai phương pháp: phương pháp chuyên gia và phương pháp định lượng (phân tích số liệu) [14]
Một số thống kê có thể chỉ ra những thuộc tính của câu hỏi thi, qua đó chúng ta biết được câu hỏi tốt và chưa tốt Các nhà nghiên cứu (Crocker & Algina, 1986) đã phân loại các chỉ số thường được sử dụng trong phân tích định lượng như sau: 1- Những chỉ số mô tả sự phân bố trả lời của các thí sinh về một câu hỏi cụ thể (trung bình cộng và phương sai)
2- Những chỉ số mô tả mức độ của mối quan hệ giữa sự trả lời của học sinh về một câu hỏi và những tiêu chí cụ thể đang được quan tâm
3- Những chỉ số liên quan đến phương sai của câu hỏi thi kiểm tra và mối liên hệ với những tiêu chí cụ thể
Một thống kê thường được sử dụng để mô tả các thông số trên câu hỏi thi kiểm tra là giá trị p (độ khó của câu hỏi), phương sai, một số chỉ số phân biệt như hệ số tương quan poin-biserial, hệ số tương quan biserial, hệ số tương quan phi Mỗi chỉ số thống kê này đều quan trọng với những mục tiêu cụ thể khi phân tích câu hỏi thi kiểm tra
Trong những bài kiểm tra TNKQ dùng trong lớp học, giáo viên thường quan tâm đánh giá câu hỏi qua hai đại lượng độ khó và độ phân biệt của câu trắc nghiệm Khi soạn xong một câu hoặc một bài trắc nghiệm người soạn chỉ có thể ước lượng độ khó hoặc độ phân biệt của nó bằng cảm tính Độ lớn của các đại lượng đó chỉ có thể tính được cụ thể bằng phương pháp thống kê sau lần trắc nghiệm thử trên một mẫu thí sinh, dựa vào kết quả thu được từ các câu trắc nghiệm và bài làm của thí sinh
Để xác định độ khó, độ phân biệt thường được tiến hành như sau: chia mẫu học sinh tham gia làm bài kiểm tra thành 3 nhóm :
+ Nhóm điểm cao H: Từ 25% đến 27% số học sinh đạt điểm cao nhất + Nhóm điểm thấp L: Từ 25% đến 27% số học sinh đạt điểm thấp nhất + Nhóm điểm trung bình M: Từ 46% đến 50% số học sinh còn lại
Trang 20Tuy nhiên, nếu trong lớp học với số lượng học sinh không đông, có thể chỉ chia thành hai nhóm: nhóm điểm thấp (50%) và nhóm điểm cao (50%)
Thống kê độ khó:
Độ khó của câu hỏi (giá trị p) bằng tỷ số phần trăm thí sinh làm đúng câu trắc
nghiệm đó trên tổng số thí sinh tham gia trả lời câu hỏi (%)100×++=
Trong đó:
N: tổng số học sinh tham gia làm bài kiểm tra
NH: tổng số học sinh ở nhóm giỏi trả lời đúng câu hỏi NL: tổng số học sinh ở nhóm kém trả lời đúng câu hỏi
NM : tổng số học sinh ở nhóm trung bình trả lời đúng câu hỏi Các chuyên gia biên soạn câu hỏi TNKQ thường lựa chọn câu hỏi có hệ số p với 0,25 ≤ p ≤ 0,75 đối với các bài trắc nghiệm dùng trong lớp học
Thống kê độ phân biệt:
Khi ra một câu hoặc một bài trắc nghiệm cho một nhóm thí sinh nào đó, người ta thường muốn phân biệt trong nhóm ấy những người có năng lực khác nhau (giỏi, trung bình, kém v.v), khả năng của câu trắc nghiệm thực hiện được sự phân
biệt ấy được gọi là độ phân biệt
Độ phân biệt của một câu hỏi được tính bằng công thức:
D H − L
=D: độ phân biệt ( -1 ≤ D ≤ 1)
Các chuyên gia biên soạn câu hỏi TNKQ thường lựa chọn câu hỏi có hệ số phân biệt D với 0,25 ≤ D ≤ 0,75, tuy nhiên cũng có thể xem xét các câu hỏi có D≥0,2
Độ phân biệt của một câu liên quan đến độ khó Thật vậy, nếu một câu trắc nghiệm dễ đến mức mọi thí sinh đều làm tốt, thì độ phân biệt của nó rất kém, vì mọi thí sinh đều có phản ứng như nhau đối với câu trắc nghiệm đó Cũng vậy, nếu một câu trắc nghiệm khó đến mức mọi thí sinh đều làm không được, các điểm số đạt được chụm ở phần điểm thấp, thì độ phân biệt của nó cũng rất kém Muốn có độ phân biệt tốt thì câu trắc nghiệm nên có độ khó ở mức trung bình
Trang 211.1.8 Đánh giá bài trắc nghiệm khách quan
Hai đại lượng đặc trưng rất quan trọng để đánh giá chất lượng bài trắc nghiệm đó là độ tin cậy và độ giá trị của bài trắc nghiệm
Độ tin cậy:
Trắc nghiệm là một phép đo mà thước đo là bài trắc nghiệm dùng để đo lường
một năng lực nào đó của thí sinh Độ tin cậy của bài trắc nghiệm chính là đại lượng
biểu thị mức độ chính xác của phép đo nhờ bài trắc nghiệm [6]
Các phương pháp ước lượng độ tin cậy là: phương pháp thi hai lần; dùng các bài trắc nghiệm tương đương; phương pháp dùng phép tính phương sai; phương pháp phân đôi bài trắc nghiệm; phương pháp Kuder – Richardson [6]
Độ giá trị:
Yêu cầu quan trọng nhất của bài trắc nghiệm với tư cách là một phép đo lường trong giáo dục là phép đo ấy đo được cái cần đo Nói cách khác, phép đo ấy
cần phải đạt được mục tiêu đề ra cho nó Độ giá trị của bài trắc nghiệm là đại lượng
biểu thị mức độ đạt được mục tiêu đề ra cho phép đo nhờ bài trắc nghiệm
Các loại tính chất giá trị: giá trị tiên đoán; giá trị so với tiêu chí cho sẵn; giá trị nội dung
Để bài trắc nghiệm có độ giá trị cao, cần phải xác định tỉ mỉ mục tiêu cần đo qua bài trắc nghiệm và bám sát mục tiêu đó trong quá trình xây dựng ngân hàng câu hỏi trắc nghiệm cũng như khi tổ chức triển khai kỳ thi Nếu thực hiện các quá trình nói trên không đúng thì có khả năng kết quả của phép đo sẽ phản ánh một cái gì khác chứ không phải cái mà ta muốn đo nhờ bài trắc nghiệm
Qua định nghĩa về độ tin cậy và độ giá trị ta có thể thấy rõ mối tương quan giữa chúng Khi bài trắc nghiệm không có độ thi cậy, tức là phép đo nhờ bài trắc nghiệm rất kém chính xác, thì chúng ta không thể nói đến độ giá trị của nó Nói cách khác, khi bài trắc nghiệm không có độ tin cậy thì nó cũng không thể có độ giá trị Đôi khi phép đo nhờ bài trắc nghiệm có thể đo chính xác, nhưng nó đo một cái gì khác chứ không phải cái nó cần đo, trong trường hợp đó thì bài trắc nghiệm có độ tin cậy cao nhưng độ giá trị rất thấp [16]
1.1.9 Lý thuyết khảo thí hiện đại
Người ta thường phân chia lý thuyết trắc nghiệm ra làm hai loại, lý thuyết khảo thí cổ điển và lý thuyết khảo thí hiện đại với việc sử dụng lý thuyết hồi đáp IRT (viết tắt của Item Response Theory) Trong luận văn này, ta quan tâm đến các
Trang 22học về xác suất và thống kê Các công trình quan trọng của lý thuyết này ra đời vào 3 thập niên cuối của thế kỷ vừa qua và đạt được nhiều thành tựu quan trọng, được công nhận và áp dụng phổ biến trong thực tiễn IRT đã đạt những thành tựu quan trọng nâng cao độ chính xác của trắc nghiệm
Lý thuyết hồi đáp bao gồm một hệ thống các định đề liên quan đến từng cá nhân trả lời câu hỏi:
1- Đại lượng cần đo được hình dung như một đường nào đó (thẳng hoặc cong) và kết quả đo lường được mô tả như một điểm đặt trên đường đó Do đó, đại lượng cần đo được giả thiết là phân bố liên tục Tuy nhiên, chưa có một dạng phân bố cụ thể nào được chỉ ra
2- Điều kiện cốt yếu để thí sinh trả lời được câu hỏi được xem xét qua hai đại lượng: - Năng lực của thí sinh (tham biến năng lực hay tham biến thí sinh)
- Độ khó của câu hỏi (tham biến độ khó hay tham biến câu hỏi)
Năng lực của thí sinh và độ khó của câu hỏi là những đại lượng được phân bố trên đường đặc trưng có tính liên tục bao gồm các giá trị của đại lượng cần đo Thông thường, với các câu hỏi được sử dụng để định cỡ, thì độ khó của các câu hỏi giữ vai trò thang giá trị thể hiện dọc theo đường đặc trưng của đại lượng cần đo 3- Lý thuyết hồi đáp quan tâm đến xác suất trả lời đúng đối với một câu hỏi Xác suất đó được thể hiện là một hàm số của năng lực thí sinh và độ khó câu hỏi và có thể có thêm một số tham biến khác (ví dụ: mức độ đoán mò)
Những hàm số xác suất khác nhau (thể hiện mối quan hệ giữa năng lực thí sinh và độ khó câu hỏi) dẫn đến những mô hình lý thuyết hồi đáp khác nhau, ví dụ: mô hình logistic đơn giản – mô hình Rasch một thông số, mô hình Rasch hai thông số, mô hình Rasch ba thông số, mô hình Partial credit
4- Xác suất trả lời đúng một câu hỏi được biểu thị bằng một hàm số liên quan đến
năng lực của thí sinh θ là hàm P(θ) – một đường cong đặc trưng của câu hỏi (Item Characteristic Curves - ICC)
- Đường cong đi lên khi θ tăng (năng lực của thí sinh θ tăng thì xác suất trả lời đúng P(θ) tăng)
- Đường cong nằm giữa hai đường thẳng y=0 và y=1
- Đường cong nhận hai đường thẳng y=0 và y=1 làm tiệm cận ngang P(θ) tiến đến 0 khi θ→ - ∞ và P(θ) tiến đến 1 khi θ→+∞
5- Xác suất biểu thị hàm số độ khó câu hỏi cho đường cong đặc trưng thí sinh là
Trang 236- Ở trên đã giả thiết xác suất trả lời là một hàm số đặc trưng đơn giản cho năng lực thí sinh Để IRT có thể áp dụng được với các bài test, các câu hỏi phải là các đơn thứ nguyên (unidimensional)
7- Nếu năng lực θ của thí sinh i đã được xác định, khi đó sự hiểu biết của thí sinh i để trả lời câu hỏi j không ảnh hưởng đến khả năng có được câu trả lời đúng đối với
câu hỏi khác
P[ xij = 1 | θ, xik = 1 ] = P[ xij = 1 | θ ]
Nếu điều đó sai, nghĩa là câu trả lời đối với câu hỏi j phụ thuộc vào điều gì
đó ngoài năng lực θ Sự không phụ thuộc này được gọi là sự độc lập cục bộ hay sự độc lập có điều kiện, và là kết quả của tính đơn thứ nguyên Điều đó có nghĩa là:
P[ xij = 1, i=1,2,…,I | θ] = P[ x1 | ]
θ - δ Trong mô hình logistic đơn giản (mô hình Rasch):
Xác suất để thí sinh i trả lời đúng câu j là:
P[ xij = 1 | θ ]
9- Các kết quả làm bài của thí sinh (kết quả trả lời câu hỏi) có được sau khi tổ chức làm một bài kiểm tra được sử dụng để tính tham biến năng lực và độ khó Phương pháp sử dụng để tính các tham biến đó là phương pháp có khả năng tối đa (Maximum likelihood)
10- Sự tính toán đã cố định những vị trí tương đối của các tham số, nhưng đó không phải là những vị trí thực
( θ - δ ) = ( θ + c ) – ( δ + c) Sai số của sự tính toán này có thể tính được
So với lý thuyết khảo thí cổ điển, lý thuyết khảo thí hiện đại với IRT có những ưu việt quan trọng Trong lý thuyết trắc nghiệm cổ điển, độ khó và độ phân biệt của các câu hỏi tính được sẽ phụ thuộc vào mẫu thí sinh được chọn để thử nghiệm, và năng lực xác định được của thí sinh phụ thuộc vào đề trắc nghiệm mà thí sinh làm [14]
Với IRT, các tham số đặc trưng của câu hỏi (liên quan đến độ khó, độ phân biệt, mức độ đoán mò) không phụ thuộc mẫu thử để định cỡ câu hỏi (sample-free)
Trang 24và năng lực đo được của thí sinh không phụ thuộc vào bài trắc nghiệm cụ thể free) được lấy từ NHCH đã được định cỡ
Theo IRT, mỗi câu hỏi có các thuộc tính đặc trưng cho nó, và mỗi thí sinh ở một trình độ nào đó có một năng lực tiềm ẩn xác định, các thuộc tính và đặc trưng này không phụ thuộc vào phép đo, hoặc nói cách khác, chúng là các bất biến (invariance)
IRT cho phép tính các hàm thông tin của từng câu hỏi và của cả đề trắc nghiệm và sai số chuẩn của phép đo theo các mức năng lực tiềm ẩn chứ không phải một sai số chuẩn trung bình chung cho cả phép đo như trắc nghiệm cổ điển Từ đó có thể thiết kế một đề trắc nghiệm cho phép đo chính xác khoảng năng lực nào mà ta mong muốn
Hơn nữa, IRT cho phép thiết kế các đề trắc nghiệm với mức độ tương đương rất cao để đảm bảo các đề trắc nghiệm khác nhau có thể cho cùng một kết quả như nhau khi đánh giá năng lực của một thí sinh nào đó
Áp dụng lý thuyết khảo thí hiện đại, ứng dụng công nghệ thông tin, hiện nay có rất nhiều các phần mềm toán học có thể giúp ta nhanh chóng phân tích câu hỏi trắc nghiệm Hiện nay chúng ta thường sử dụng phần mềm Quest (phiên bản mới có tên ConQuest) được soạn thảo ở Úc Phần mềm này có thể tính toán cho ra kết quả về độ khó, độ phân biệt của câu trắc nghiệm và khả năng của người làm trắc nghiệm, phân tích sự phù hợp của câu trắc nghiệm và của người làm trắc nghiệm, đồng thời cũng có thể chỉ ra kết quả bất thường của người làm câu trắc nghiệm nếu có Hiện nay ở Việt Nam có chương trình VITESTA là một chương trình hỗ trợ phương pháp trắc nghiệm được phát triển bởi Công ty trách nhiệm hữu hạn EDTECHDP Đây là một chương trình phân tích đánh giá câu hỏi thi, soạn đề thi, chấm thi trắc nghiệm v.v được xây dựng dựa trên lý thuyết hồi đáp IRT
Các thành tựu quan trọng đó của IRT đã nâng độ chính xác của phép đo lường trong giáo dục lên một tầm cao mới về chất so với các lý thuyết đo lường cổ điển Từ thành tựu tổng quát đó của IRT, người ta có thể đưa ra các quy trình để xây dựng NHCH (item banking), phân tích các kết quả TNKQ để hiệu chỉnh NHCH, chủ động thiết kế các đề trắc nghiệm theo các mục đích đặt ra [16]
1.1.10 Ngân hàng câu hỏi trắc nghiệm khách quan
Ngân hàng câu hỏi TNKQ là một tập hợp các câu hỏi TNKQ và đáp án Nó sẽ là một công cụ để đổi mới phương pháp dạy học, kiểm tra đánh giá và quản lý
Trang 25- Trong giảng dạy: giáo viên căn cứ vào NHCH để thực hiện phương pháp dạy học tích cực trong quá trình dạy thu thập thông tin, dạy năng lực xử lý thông tin và năng lực giải quyết vấn đề
- Trong học tập: giúp học sinh xác định kiến thức chuẩn môn học mình cần phải nắm; giúp học sinh tự học và tự kiểm tra nhận thức của mình, mở rộng kiến thức qua các tài liệu tham khảo khác nhau; giúp học sinh có thể học nhóm, trao đổi thảo luận trên cơ sở các câu hỏi có sẵn trong ngân hàng
- Trong kiểm tra đánh giá: sử dụng ngân hàng câu hỏi TNKQ có sẵn giúp tiện lợi cho việc ra đề thi kiểm tra; hạn chế tiêu cực trong thi cử
- Sử dụng ngân hàng câu hỏi TNKQ cũng là giải pháp đa dạng hoá các loại hình đào tạo (tại chức, từ xa, e-learning v.v), nhằm mở rộng quy mô đào tạo mà vẫn giữ vững và từng bước nâng cao chất lượng đào tạo [12]
1.1.11 Quy trình thiết kế câu hỏi trắc nghiệm khách quan Bước 1: Xác định mục đích sử dụng đề thi-kiểm tra
- Sử dụng vào việc theo dõi, giám sát kết quả học tập - Để phân loại học sinh
- Để tuyển sinh v.v
Bước 2: Xác định cấu trúc đo
- Cấu trúc kết quả học tập - Cấu trúc năng lực
Phân tích
Tổng hợp
Đánh giá
Trang 26Bước 5: Thiết kế câu hỏi thi
- Lựa chọn dạng câu hỏi thi
- Kiểm tra lại xem dạng câu hỏi thi đã được lựa chọn có tính khả thi không - Lựa chọn và tập huấn những người tham gia viết câu hỏi thi để thống nhất cách viết
- Viết câu hỏi thi
- Giám sát tiến độ của người viết câu hỏi thi và chất lượng câu hỏi
Bước 6: Rà soát, xem xét lại câu hỏi thi
- Tập hợp các chuyên gia để rà soát nội dung và cách diến đạt câu hỏi
Bước 7: Thử nghiệm
Bước 8: Phân tích câu hỏi thi Bước 9: Sửa chữa và hoàn thiện Bước 10: Bảo mật và tổ chức thi
Để có một NHCH gồm các câu hỏi có chất lượng cần lặp đi lặp lại các bước 5 đến bước 10 [14]
1.1.12 Quy trình chuẩn bị và triển khai một kỳ thi trắc nghiệm khách quan tiêu chuẩn hoá
Có thể áp dụng phương pháp trắc nghiệm để tổ chức thi, kiểm tra ở các lớp học thông thường với số thí sinh không đông; cũng có thể áp dụng ở các kỳ thi quy mô lớn hàng nghìn, hàng vạn thí sinh Để triển khai một kỳ thi quy mô lớn người ta phải chuẩn bị hết sức cẩn thận về đề thi, quy trình thi, thể thức chấm điểm, cách công bố kết quả v.v Quá trình chuẩn bị đó hết sức công phu và tốn kém mà một kỳ thi thông thường ở lớp học không thể làm nổi Kỳ thi được chuẩn bị công phu như
vậy được gọi là kỳ thi tiêu chuẩn hóa Các câu hỏi trong một đề thi tiêu chuẩn hóa là
các câu đã được thử nghiệm, phân tích để xác định được độ khó, độ phân biệt của từng câu và độ tin cậy, độ giá trị của cả bài Quy trình tổ chức một kỳ thi trắc nghiệm tiêu chuẩn hóa rất phức tạp Có thể tóm tắt các bước của quy trình đó như sau:
Bước 1: Xác định môn thi và những nội dung tổng quát cần kiểm tra Đồng thời,
định ra yêu cầu về các mức kỹ năng, chẳng hạn: biết, hiểu, vận dụng, phân tích, tổng hợp, đánh giá Để thực hiện bước này người ta thường lập một ma trận 2 chiều: các dòng phân theo các phần nội dung, các cột phân theo các mức kỹ năng, trong mỗi ô ghi số câu hỏi cần thiết (hoặc tỷ lệ phần trăm) của phần nội dung và mức kỹ năng
Trang 27Bước 2: Phân công cho các giáo viên, mỗi người viết một số câu trắc nghiệm theo
các yêu cầu cụ thể về nội dung và mức kỹ năng đã xác định
Bước 3: Trao đổi trong nhóm đồng nghiệp Lấy ý kiến chuyên gia Kinh nghiệm cho
thấy quá trình trao đổi này rất quan trọng, giúp tác giả phát hiện và sửa chữa được nhiều sai sót mà bản thân không nhận thấy
Bước 4: Biên tập và đưa các câu trắc nghiệm vào “ngân hàng” có thể lưu trong máy
tính Phụ trách biên tập phải là người am hiểu cả về chuyên môn lẫn kỹ thuật viết trắc nghiệm Ngân hàng câu hỏi được quản lý bằng một phần mềm tin học chuyên dụng
Bước 5: Lập đề thi và tổ chức thi thử trên một số nhóm thí sinh; các nhóm này là
“mẫu” đại diện cho đối tượng thí sinh chung làm bài trắc nghiệm
Bước 6: Chấm thi và phân tích thống kê các kết quả thi thử Phương pháp thống kê
cho phép xác định các đặc trưng của mỗi câu trắc nghiệm như độ khó, độ phân biệt, qua đó có thể đánh giá độ tin cậy của bài trắc nghiệm, phân loại chất lượng các câu trắc nghiệm
Bước 7: Gia công các câu hỏi kém chất lượng và thay các câu đã được gia công vào
ngân hàng
Bước 8: Ra đề thi chính thức: căn cứ vào dàn bài (phân bố câu theo nội dung và
mức độ kỹ năng tương ứng với bảng đặc trưng hai chiều), nhờ phần mềm tin học để chọn một cách ngẫu nhiên từ ngân hàng số câu hỏi cần thiết với các đặc trưng xác định (độ khó, độ phân biệt, mức kỹ năng) để lập nên một đề thi Phần mềm tin học có thể tạo ra các đề thi tương đương có cùng nội dung nhưng khác nhau về hình thức bằng cách đảo lộn thứ tự các câu hỏi (khi có thể đảo lộn) và các phương án trả lời A, B, C, D v.v
Bước 9: In đề thi và tổ chức thi: đề thi được in sẵn, phát cho từng thí sinh trong
phòng thi Thí sinh điền vào phiếu trả lời câu hỏi
Bước 10: Chấm và phân tích thống kê các kết quả thi: có thể chấm bài trắc nghiệm
trên các hệ thống tự động gồm một máy quét quang học và một máy tính có phần mềm tin học hỗ trợ việc chấm thi Cũng có phần mềm tin học thực hiện các phép phân tích thật tỉ mỉ về chất lượng các câu trắc nghiệm và nhiều yếu tố liên quan đến bài làm của thí sinh
Bước 11: Công bố kết quả thi
Trong toàn bộ quy trình, các bước từ 2 đến 7 phải lặp lại nhiều lần để hoàn
Trang 28sức quan trọng của các kỳ thi đại trà bằng trắc nghiệm tiêu chuẩn hóa là: những thông tin thu được qua việc phân tích thống kê toàn bộ bài làm của thí sinh qua các kỳ thi là những số liệu hết sức quý báu để đánh giá định lượng về tình hình giáo dục của từng khu vực, từng cộng đồng, từng nhóm thí sinh và đánh giá xu thế phát triển của chất lượng giáo dục theo thời gian, mục tiêu mong muốn [16]
1.2 Tình hình nghiên cứu về khoa học đo lường đánh giá trên thế giới và Việt Nam
Khoa học về đo lường đánh giá trong giáo dục bắt đầu cách đây hơn một thế kỷ được bắt đầu ở châu Âu từ đầu thế kỷ 20, cho đến nay đã phát triển mạnh và có nhiều thành công trong lĩnh vực đo lường, đánh giá trong giáo dục Đặc biệt là ở Mỹ, lĩnh vực khoa học đo lường phát triển mạnh vào thời kỳ từ trước và sau thế chiến thứ hai với những dấu mốc quan trọng như trắc nghiệm trí tuệ Stanford-Binet xuất bản năm 1916, bộ trắc nghiệm thành quả học tập tổng hợp đầu tiên Stanford Achievement Test ra đời vào năm 1923 Với việc đưa vào chấm trắc nghiệm bằng máy của IBM năm 1935, việc thành lập National Council on Measurement in Education (NCME) vào thập niên 1950 và ra đời Educational Testing Services (ETS) năm 1947, một ngành công nghiệp trắc nghiệm đã hình thành ở Mỹ Từ đó đến nay khoa học về đo lường trong tâm lý và giáo dục đã phát triển liên tục, những phê bình, đóng góp đối với khoa học này xuất hiện thường xuyên làm cho nó tự điều chỉnh và phát triển mạnh mẽ hơn Hiện nay ở Mỹ ước tính mỗi năm số lượt trắc nghiệm tiêu chuẩn hoá cỡ 1/4 tỷ và trắc nghiệm do giáo viên soạn lên đến con số 5 tỷ [16] Tương ứng với ngành công nghiệp trắc nghiệm đồ sộ và sự phát triển của công nghệ thông tin, lý thuyết về đo lường trong tâm lý giáo dục cũng phát triển nhanh Trên cơ sở IRT công nghệ trắc nghiệm thích ứng nhờ máy tính (Computer Adaptive Test – CAT) ra đời Ngoài ra, trên cơ sở những thành tựu của IRT, công nghệ E-RATE chấm tự động các bài tự luận tiếng Anh nhờ máy tính của ETS đã được triển khai nhờ mạng Internet trong nhiều năm qua
Đề thi cho các kỳ thi tuyển đại học được Mỹ, Nhật, Thái Lan sử dụng toàn bộ bằng phương pháp TNKQ, Trung Quốc cũng đã sử dụng phương pháp TNKQ vào các kỳ thi tuyển sinh từ nhiều năm nay [16]
Khoa học về đo lường và đánh giá trong giáo dục ở nước ta trong tình trạng lạc hậu và phát triển chậm hơn một số nước đang phát triển khác Trước năm 1975, ở Miền Nam nước ta có một vài người được đào tạo về khoa học này từ các nước
Trang 29bằng phương pháp TNKQ Vào những năm sau 1975, ở miền Bắc có một số cán bộ nghiên cứu về khoa học đo lường trong tâm lý Đến năm 1993, Bộ GD & ĐT đã mời một số chuyên gia nước ngoài phổ biến về khoa học này, đồng thời cử một số cán bộ ra nước ngoài học tập Từ đó một số trường đại học có tổ chức các nhóm nghiên cứu áp dụng các phương pháp đo lường trong giáo dục để thiết kế các công cụ đánh giá, soạn thảo các phần mềm hỗ trợ, mua máy quét quang học chuyên dụng (OMR) để chấm thi Kỳ thi tuyển đại học thí điểm được tổ chức tại trường đại học Đà Lạt vào tháng 7 năm 1996 bằng phương pháp TNKQ Kỳ thi này có 7200 thí sinh dự tuyển, 2 loại đề TNKQ và TL được sử dụng để thí sinh tự chọn Có khoảng 70% lượt thí sinh chọn đề TNKQ, bài thi được chấm bằng máy Opscan-7, trong khoảng 60 trường hợp vi phạm kỷ luật thi do quay cóp thì chỉ có 4 thí sinh từ nhóm làm đề TNKQ
Từ năm 1997 các hoạt động đổi mới phương pháp đo lường và đánh giá trong giáo dục lắng xuống Cho đến mùa thi tuyển đại học năm 2002, Bộ Giáo dục và Đào tạo đã tổ chức kỳ thi tuyển đại học theo hình “3 chung” Năm 2002, Bộ GD & ĐT đã quan tâm tới việc thành lập “Phòng kiểm định chất lượng chất lượng đào tạo” nằm trong Vụ Đại học Ngày 18/7/2003, Cục Khảo thí và Kiểm định chất lượng giáo dục được thành lập theo Nghị định số 85/2003/NĐ-CP Quyết định thành lập Cục khảo thí và kiểm định chất lượng giáo dục đánh dấu một thời kỳ mới của sự phát triển hệ thống đảm bảo chất lượng và kiểm định chất lượng giáo dục ở Việt Nam Thực hiện chức năng và nhiệm vụ của mình, từ khi được thành lập các hoạt động của Cục Khảo thí và Kiểm định chất lượng giáo dục đã đáp ứng được phần nào nhu cầu đổi mới của công tác kiểm định chất lượng giáo dục của nước ta hiện nay Đồng thời các Trung Tâm Khảo thí và Kiểm định chất lượng giáo dục của các trường Đại học, các Phòng Khảo thí và Kiểm định chất lượng giáo dục của các Sở GD-ĐT cũng được thành lập, bước đầu đã thực hiện được các chức năng và nhiệm vụ của mình Đặc biệt từ năm 2005 đến nay, Đại học Quốc gia Hà Nội liên tiếp mở lớp đào tạo thạc sĩ về Đo lường đánh giá trong giáo dục, đây có thể chính là cái nôi để đào tạo các cán bộ có kinh nghiệm trong lĩnh vực Đo lường đánh giá phục vụ nền giáo dục nước nhà
Để cải tiến công tác thi cử và đánh giá chất lượng giáo dục, Bộ GD & ĐT quyết định sẽ dùng phương pháp TNKQ để làm đề thi một số môn trong kỳ tuyển sinh đại học năm 2005 Đồng thời dần đưa phương pháp TNKQ vào kiểm tra đánh
Trang 30thi TNKQ trong các kỳ thi tốt nghiệp THPT và tuyển sinh đại học cho các môn thi Ngoại ngữ, Vật lý, Hóa học, Sinh học Riêng đối với môn Toán, Bộ GD-ĐT dự định triển khai dùng đề thi TNKQ trong hai kỳ thi tốt nghiệp THPT và tuyển sinh đại học năm 2008, nhưng còn nhiều ý kiến của các chuyên gia cho rằng, câu hỏi TNKQ không đo lường hết mức độ nhận thức của học sinh, hơn nữa vì chưa thật sự chuẩn bị tốt nên việc sử dụng đề thi TNKQ môn Toán trong hai kỳ thi này bị dừng lại Nếu chúng ta làm tốt khâu thiết kế câu hỏi TNKQ và các đề thi TNKQ được đánh giá đúng mức theo khoa học đo lường thì đề thi TNKQ môn Toán có thể được sử dụng trong các kỳ thi lớn trong thời gian sắp tới
1.3 Công tác đánh giá trong trường THPT hiện nay
1.3.1 Những bất cập trong đo lường và đánh giá ở trường THPT
• Mục đích đánh giá không được giáo viên xác định rõ ràng
• Quá trình đánh giá ở trường phổ thông hiện nay thường chỉ dừng lại ở khâu lượng giá, ít khi đánh giá và ra quyết định
• Giáo viên không được hiểu một cách đầy đủ và toàn diện về công tác đo lường, đánh giá trong giáo dục
• Giáo viên thường không xác định rõ mục đích của đánh giá, thường chỉ hiểu đơn giản là việc cho điểm học sinh Học sinh thường ít được phản hồi về kết quả học tập của mình để kịp thời điều chỉnh
• Các đề kiểm tra do giáo viên soạn không được phân tích, đánh giá nên có nhiều câu hỏi kém chất lượng không đo lường được kiến thức của học sinh • Giáo viên thường chỉ cho học sinh làm đề kiểm tra tự luận, ngại ra các đề trắc
nghiệm khách quan Đặc biệt với môn Toán nhiều ý kiến cho rằng đề thi trắc nghiệm khách quan không đo lường hết các mức độ nhận thức của học sinh • Đề thi TNKQ đã được sử dụng trong thi tốt nghiệp THPT và thi đại học ở
một số môn thi Giáo viên cũng bắt đầu sử dụng đề kiểm tra TNKQ để kiểm tra kết quả học tập của học sinh Tuy nhiên vì không có kinh nghiệm trong việc ra đề nên các đề thi do giáo viên soạn sử dụng các câu hỏi chưa được tốt, không thoả mãn các tiêu chuẩn về độ khó và độ phân biệt Nhiều khi giáo viên phải điều chỉnh thang điểm bằng cách cho học sinh làm được đúng nhiều nhất ứng với 100% và chia lại thang điểm
• Phần lớn đề thi đánh giá tiếp thu môn học đều nhằm đánh giá ở mức nhận thức thấp, tức là kiểm tra thuộc kiến thức là chính (biết, hiểu, vận dụng) nên
Trang 31người học có thể quay cóp mà không cần tư duy trả lời
• Giáo viên chưa có kinh nghiệm ra đề kiểm tra, đặc biệt là đề trắc nghiệm khách quan nên các đề kiểm tra do giáo viên soạn thường thiết kế trong thời gian rất ngắn, các câu hỏi không được phân tích để chỉnh sửa, thường không được thử mà cho học sinh làm luôn
• Giáo viên không biết sử dụng hợp lý các dạng thức thi-kiểm tra
• Giáo viên chấm và trả bài không đúng tiến độ, không thông tin kịp thời những yếu kém của học sinh để giúp họ tiến bộ
• Các đề TNKQ khi thiết kế thường mất thời gian nên phần lớn giáo viên ngại ra đề theo hình thức này
1.3.2 Một số giải pháp cho những bất cập
• Nhanh chóng xác lập các thang bậc chất lượng cho từng bậc học và phổ biến rộng rãi khoa học đo lường và đánh giá trong giáo dục cho toàn bộ đội ngũ giáo viên, các nhà quản lý, học sinh, phụ huynh để cùng tham gia thanh tra, kiểm tra để đạt chất lượng mong muốn
• Cần phân biệt các cuộc thi đánh giá trình độ học vấn và thi tuyển chọn để đánh giá cho đúng Đặc biệt, nếu thực hiện gộp hai kỳ thi tốt nghiệp THPT và thi tuyển sinh đại học làm một thì khâu thiết kế đề thi là việc vô cùng quan trọng
• Trên cơ sở nắm chắc kiến thức đo lường và đánh giá trong giáo dục, cần tiến hành xây dựng NHCH trắc nghiệm (gồm cả câu hỏi TNKQ và TL) chuẩn hoá cho từng môn học của mỗi cấp học hay bậc học
Cần thành lập ngân hàng câu hỏi môn học nhằm:
1 Dùng ngân hàng câu hỏi làm chuẩn kiến thức cho môn học để thầy và trò biết dạy và học như thế nào là đạt chuẩn
2 Giáo viên dùng để đổi mới phương pháp dạy: thay độc thoại bằng đối thoại, dạy năng lực tư duy bậc cao Đảm bảo chất lượng giảng dạy của các giáo viên không chuyên hay mới tuyển nhờ có ngân hàng câu hỏi trắc nghiệm 3 Người học đổi mới phương pháp học: tự học, thảo luận nhóm theo câu hỏi
chuẩn
4 Dùng ngân hàng câu hỏi để ra đề thi môn học, làm khách quan hoá khâu ra đề thi, giảm tối đa tiêu cực trong thi cử và kiểm tra đánh giá môn học trong giai đoạn hiện nay [12]
Trang 321.4 Đổi mới công tác kiểm tra đánh giá trong trường THPT 1.4.1 Mục đích đánh giá
- Đối với học sinh: Cung cấp cho họ thông tin ngược về quá trình học tập của
bản thân để họ tự điều chỉnh quá trình học tập, kích thích hoạt động học tập, khuyến khích năng lực tự đánh giá
- Đối với giáo viên: Cung cấp cho giáo viên những thông tin cần thiết nhằm
xác định đúng hơn về nhận thức của học sinh trong học tập từ đó đề xuất kịp thời các biện pháp điều chỉnh hoạt động dạy học, thực hiện mục đích dạy học
1.4.2 Quá trình đánh giá
Theo Bary-King 1993, quá trình đánh giá thông thường gồm các khâu: Lượng hoá (đo lường) - Lượng giá - Đánh giá - Ra quyết định
Việc lượng hoá (đo lường) có thể thể hiện theo ba cách :
• Xếp loại: sử dụng thang định danh chia đối tượng học sinh theo giới tính, vùng miền hoặc theo các mức độ giỏi, khá, trung bình, yếu, kém
• Sắp thứ tự: sử dụng thang thứ tự sắp xếp các học sinh theo thứ tự nhất, nhì, ba…
• Cho điểm: sử dụng thang tỉ lệ phải thoả mãn yêu cầu mức độ kiến thức được đo lường của học sinh tỉ lệ với điểm số
Việc lượng hoá (đo lường) kết quả học tập của học sinh phổ thông thông thường là việc cho điểm
Việc lượng giá ở trường THPT thông thường là việc lượng giá theo tiêu chí
Đó là sự giải thích thông tin về trình độ kiến thức, kỹ năng hoặc thái độ của học sinh đối chiếu với những tiêu chí nhất định
Đánh giá là một mắt xích quan trọng trong quá trình đánh giá
• Đánh giá khởi sự được thiết kế để xác định điểm xuất phát của người học, trước khi học một chủ đề nào đó, giúp giáo viên định hướng dạy học
• Đánh giá theo tiến trình được thực hiện trong quá trình dạy học nào đó, giúp giáo viên và học sinh nắm được thông tin ngược về quá trình học tập, làm căn cứ cho việc điều chỉnh kịp thời hoạt động dạy của thầy và hoạt động học của trò để có thể thực hiện mục tiêu đã đặt ra
• Đánh giá tổng kết được thực hiện sau quá trình dạy học (tức là sau khi kết thúc khoá học, môn học v.v), hướng vào thành phẩm cuối cùng nhằm hiểu
Trang 33được mức độ thực hiện mục tiêu và đánh giá tổng quát kết quả học tập của học sinh
Những thông tin thu thập được trong quá trình đánh giá sẽ làm căn cứ cho việc ra quyết định Giáo viên, học sinh, nhà quản lý, phụ huynh học sinh sẽ phải có những quyết định kịp thời để phát huy điểm mạnh và khắc phục những điểm yếu
• Câu hỏi và bài tập phải được phát biểu chính xác, rõ ràng để học sinh có thể hiểu một cách đơn trị
• Bên cạnh những câu hỏi, bài tập hướng vào các yêu cầu cơ bản, cần chuẩn bị cả những câu hỏi đào sâu, vận dụng kiến thức một cách tổng hợp, khuyến khích học sinh suy nghĩ tích cực
Việc đánh giá kết quả không chỉ là việc cho điểm mà cần nhận xét về nội dung, hình thức trình bày, phương pháp học tập, đề xuất được phương hướng, kế hoạch giúp học sinh khắc phục những yếu kém, giúp giáo viên điều chỉnh phương pháp giảng dạy
1.4.3.1 Biện pháp đánh giá
• Biện pháp 1: Kiểm tra thông qua hình thức kiểm tra bài cũ
• Biện pháp 2: Kiểm tra trong khi học sinh học nội dung mới, khi giải bài tập, khi ôn tập
• Biện pháp 3: Kiểm tra khi học sinh tiến hành bài kiểm tra định kỳ
1.4.3.2 Công cụ đánh giá
Các công cụ đánh giá sử dụng trong đánh giá kết quả học tập THPT hiện nay là:
• Quan sát (đo lường, đáng giá kỹ năng): giúp đánh giá các thao tác, các hành
vi, các phản ứng vô thức, các kỹ năng thực hành và cả một số kỹ năng về nhận thức, chẳng hạn cách giải quyết vấn đề trong một tình huống đang được nghiên cứu
• Vấn đáp (tự luận miệng - đo lường đánh giá kiến thức): có tác dụng tốt để
đánh giá khả năng đáp ứng các câu hỏi được nêu một cách tự phát trong một tình
Trang 34huống cần kiểm tra, cũng thường được sử dụng khi sự tương tác giữa người hỏi và người đối thoại là quan trọng, chẳng hạn để xác định thái độ người đối thoại
• Viết: Kiểm tra, đánh giá kết quả học tập của học sinh nhờ sử dụng các công
cụ đánh giá là các đề TNKQ, đề TL hoặc đề hỗn hợp gồm cả câu hỏi TNKQ và TL Ở trường phổ thông hiện nay, kiểm tra viết là hình thức kiểm tra 15 phút, 1 tiết (45 phút) và kiểm tra học kì (45 phút trở lên)
Bảng 1.4 Bảng so sánh công tác đánh giá ở trường THPT [15]
Mục đíchđánh giá
- Đánh giá để chứng minh, nhận định về kết quả học tập của học sinh
- Đánh giá để nhận định về kết quả học tập của học sinh và đề xuất những biện pháp nhằm cải thiện thực trạng, nâng cao chất lượng học tập của học sinh
Lĩnh vực đánh giá
- Đánh giá cả kiến thức, kỹ năng, thái độ nhưng thiên về khả năng tái hiện kiến thức
- Chú trọng tới cả kiến thức, kỹ năng, thái độ Kết hợp giữa khả năng tái hiện kiến thức và khả năng vận dụng sáng tạo của học sinh
Cách đánh giá
- Đánh giá bằng điểm - Đánh giá mang nặng tính đồng loạt
- Đánh giá bằng điểm và đánh giá bằng nhận xét.- Chú ý tới đánh giá từng cá nhân
Người đánh giá
- Giáo viên đánh giá học sinh
- Giáo viên đánh giá học sinh - Học sinh đánh giá học sinh
Công cụ đánh giá
- Đề kiểm tra viết, chủ yếu bằng câu hỏi tự luận
- Đề kiểm tra trắc ngiệm khách quan - Đề tự luận
- Kết hợp cả tự luận và trắc nghiệm khách quan
1.5 Tình hình công tác kiểm tra đánh giá tại trường THPT Bến Tre tỉnh Vĩnh Phúc
Trường THPT Bến Tre là một trường lớn của tỉnh Vĩnh Phúc Năm học 2007-2008, trường có 29 lớp học sinh, khối 12 có 10 lớp học theo chương trình không phân ban, khối lớp 10 và 11 học theo chương trình phân ban Các giáo viên của nhà trường hàng năm được tập huấn về đổi mới phương pháp kiểm tra đánh giá, nhưng kiến thức về khoa học đo lường đánh giá trong giáo dục không được tiếp thu
Trang 35một cách đầy đủ, không áp dụng vào thực tế nên kết quả đánh giá chưa chính xác Các tổ chuyên môn với đội ngũ giáo viên có trình độ chuyên môn tốt, nhà trường có cán bộ chuyên trách về công tác thi cử, nhưng chưa thành lập được ngân hàng câu hỏi TNKQ cho mỗi môn học dùng cho việc kiểm tra đánh giá kết quả học tập của học sinh Các đề kiểm tra do giáo viên soạn không được thử nghiệm, phân tích, đánh giá đã được sử dụng để kiểm tra kiến thức học sinh Do vậy chỉ mới thực hiện việc đánh giá xếp loại học sinh theo điểm số, lấy điểm số của các bài kiểm tra để xét thành tích của học sinh
Đối với công tác kiểm tra đánh giá môn Toán của nhà trường, các đề kiểm tra định kỳ do giáo viên soạn thường là các đề tự luận, một số ít giáo viên có sử dụng đề TNKQ và đề kiểm tra kết hợp các câu hỏi TNKQ và câu hỏi TL Kết quả kiểm tra môn Toán thường chỉ là lấy điểm chứ không chú trọng đến việc phân tích, đánh giá câu hỏi kiểm tra Bởi vậy các câu hỏi TNKQ mặc dù được giáo viên sử dụng nhiều lần để kiểm tra đánh giá kết quả học tập của học sinh nhưng không được phân tích, đánh giá theo khoa học đo lường để biết chất lượng câu hỏi Hơn nữa, phần lớn giáo viên đều không hiểu rõ ý nghĩa của công việc phân tích câu hỏi thi-kiểm tra, không quan tâm đến độ tin cậy và tính giá trị của bài kiểm tra, do đó kết quả kiểm tra đôi khi không phản ảnh đúng thực chất trình độ của học sinh Mặt khác, mỗi giáo viên Toán của nhà trường, trung bình mỗi năm học phải ra khoảng 20 đề kiểm tra, cùng với việc soạn bài và chấm bài đã tốn quá nhiều thời gian và công sức, bởi vậy việc đầu tư thời gian để đánh giá câu hỏi và đề kiểm tra là việc làm khó thực hiện Để giảm bớt khó khăn trong công tác ra đề thi kiểm tra, tổ chuyên môn Toán của nhà trường đã đề xuất việc cùng nhau xây dựng ngân hàng câu hỏi môn Toán dùng để kiểm tra, đánh giá kết quả học tập của học sinh Công việc này đòi hỏi phải có kiến thức về khoa học đo lường đánh giá, phải tốn nhiều thời gian và công sức Tuy nhiên, các giáo viên Toán vừa là chuyên gia về môn học, nếu có thêm kiến thức về đo lường đánh giá chắc chắn sẽ góp phần đổi mới công tác kiểm tra đánh giá của nhà trường
Trang 36Kết luận chương 1
Đo lường, đánh giá là khâu quan trọng không thể thiếu trong quá trình giáo dục Tiến hành đổi mới phương pháp kiểm tra đánh giá kết quả học tập của học sinh đang là một trong những mục tiêu quan trọng trong công cuộc đổi mới giáo dục phổ thông Việc áp dụng khoa học đo lường đánh giá trong giáo dục vào công cuộc đổi mới phương pháp kiểm tra đánh giá ở THPT hiện nay còn nhiều hạn chế, một phần là do giáo viên và nhà quản lý chưa có năng lực trong công tác đánh giá Việc sử dụng các công cụ đánh giá (trong đó có đề thi TNKQ và TL) không được thực hiện nghiêm túc từ khâu thiết kế đến việc phân tích đánh giá dẫn đến việc đánh giá không được chính xác
Giáo viên cần phải có kiến thức về đo lường đánh giá trong giáo dục, nắm được quá trình đánh giá, biết xây dựng công cụ đánh giá, tiến hành đánh giá, ra quyết định; biết phân tích câu hỏi thi và đề kiểm tra mới có được những đánh giá chính xác kết quả học tập của học sinh
Để xây dựng ngân hàng câu hỏi TNKQ dùng trong kiểm tra đánh giá kết quả học tập của học sinh đòi hỏi người thiết kế phải có kiến thức về kiểm tra đánh giá, phải thiết kế, thử nghiệm và phân tích câu hỏi TNKQ, phân tích công cụ đánh giá đồng thời phải trải qua quá trình tích luỹ lâu dài mới có thể có được ngân hàng câu hỏi
Trang 37CHƯƠNG 2 XÂY DỰNG NGÂN HÀNG CÂU HỎI TRẮC NGHIỆM KHÁCH QUAN MÔN TOÁN 12
2.1 Chương trình toán 12 (không phân ban)
Sách giáo khoa thí điểm hợp nhất năm 2000 môn Toán 12 gồm: Giải tích 12 và Hình học 12
2.1.1 Nội dung chương trình
- Chương 1 - Đạo hàm (20 tiết): Định nghĩa và ý nghĩa của đạo hàm; Các quy tắc
tính đạo hàm; Đạo hàm của các hàm số sơ cấp cơ bản; Đạo hàm cấp cao; Vi phân
- Chương 2 - Ứng dụng của đạo hàm (26 tiết): Điều kiện để hàm số đồng biến,
nghịch biến; Cực đại và cực tiểu; Giá trị lớn nhất, giá trị nhỏ nhất; Tính lồi lõm và điểm uốn của đồ thị hàm số; Tiệm cận; Khảo sát hàm số
- Chương 3 - Nguyên hàm và tích phân (23 tiết): Nguyên hàm; Tích phân; Các
phương pháp tính tích phân; Một số ứng dụng của tích phân
- Chương 4 - Đại số tổ hợp (13 tiết): Quy tắc cộng, quy tắc nhân; Hoán vị, chỉnh
hợp, tổ hợp; Nhị thức Niutơn
2 Hình học:
- Chương 1 - Phương pháp toạ độ trong mặt phẳng (29 tiết): Hệ trục toạ độ,
toạ độ của véctơ và của điểm; Véctơ pháp tuyến của đường thẳng Phương trình tổng quát của đường thẳng; Véctơ chỉ phương của đường thẳng Phương trình tham số của đường thẳng; Vị trí tương đối của hai đường thẳng, chùm đường thẳng; Góc và khoảng cách; Đường tròn; Elip; Hypepol; Parabol; Về các đường conic; Phương trình tiếp tuyến của các đường conic
- Chương 2 - Phương pháp toạ độ trong không gian (19 tiết): Véctơ và các
phép toán véctơ trong không gian; Hệ trục toạ độ Đềcac vuông góc trong không gian; Biểu thức toạ độ của tích vô hướng Tích có hướng của hai véctơ và ứng dụng; Phương trình tổng quát của mặt phẳng; Vị trí tương đối giữa hai mặt phẳng Chùm mặt phẳng; Phương trình của đường thẳng trong không gian; Vị trí tương đối giữa đường thẳng và mặt phẳng; Góc và khoảng cách; Mặt cầu;
2.2.2 Phân phối các bài kiểm tra theo chương trình
Vụ THPT ban hành tài liệu Hướng dẫn phân phối các bài kiểm tra định kỳ
Trang 38môn toán ở lớp 12 thể hiện trong bảng sau:
Bảng 2.1 Bảng phân phối các bài kiểm tra định kỳ trong năm học
HK1: 17 tuần GT: 61 tiết HH: 24 tiết
+ 1 bài 15 phút
+ 1 bài kiểm tra chương 1 + 1bài kiểm tra chương 2 + 1 bài kiểm tra học kỳ
+ 1 bài 15 phút
+ 1 bài kiểm tra giữa chương 1 + 1 bài kiểm tra học kỳ
HK2: 16 tuần GT: 46 tiết HH: 34 tiết
+ 1 bài 15 phút
+ 1 bài kiểm tra chương 3 + 1 bài kiểm tra chương 4 + 1 bài kiểm tra học kỳ
+ 1 bài 15 phút
+ 1bài kiểm tra giữa chương 2 + 1 bài kiểm tra học kỳ
Cả năm 8 bài kiểm tra Giải tích 6 bài kiểm tra Hình học
Thực hiện theo phân phối chương trình, các giáo viên bậc THPT thường sử dụng hình thức kiểm tra TL để tiến hành kiểm tra, đánh giá kết quả học tập của học sinh Tại trường THPT Bến Tre, ngoài việc giáo viên thực hiện kiểm tra định kì theo quy định, nhà trường tổ chức thêm một kỳ kiểm tra cuối năm cho học sinh lớp 12 Điểm của bài kiểm tra cuối năm không tính vào điểm trung bình chung của cả năm học, nhà trường chỉ lấy kết quả đó để đánh giá học sinh
Bảng 2.2 Bảng phân phối các bài kiểm tra định kỳ môn Toán 12 năm học 2007-2008 của trường THPT Bến Tre
Trang 392.2 Thực hiện quy trình thiết kế câu hỏi trắc nghiệm khách quan
Để xây dựng ngân hàng câu hỏi TNKQ môn Toán 12, tiến hành thực hiện theo quy trình sau:
2.2.1 Mục đích đánh giá
- Đề kiểm tra là một công cụ để đánh giá kết quả học tập sau khi học xong một chủ đề, một chương, một học kỳ, cả năm học Khi tiến hành lựa chọn công cụ đánh giá là các đề kiểm tra Một mặt tôi tiến hành bài kiểm tra TL kiểm tra kiến thức học sinh và tính điểm trung bình theo quy định của Bộ GD-ĐT đối với chương trình không phân ban Các tiết kiểm tra được tiến hành vào các giờ học chính khoá buổi sáng Mặt khác, tôi sử dụng các bài kiểm tra TNKQ để thử nghiệm câu hỏi TNKQ Các bài kiểm tra TNKQ được tiến hành vào các tiết học chuyên đề buổi chiều theo
quy định của nhà trường
Bảng 2.3 Bảng tổng hợp các bài kiểm tra tự luận của lớp 12A1
Dạng bài Thời gian Số bài Số câu/bài Tổng số câu hỏi
Bảng 2.4 Bảng tổng hợp các bài kiểm tra TNKQ của lớp 12A1
Dạng bài Thời gian Số bài Số câu/bài Tổng số câu hỏi
Trang 40Xác định mục đích đánh giá qua các bài kiểm tra TNKQ được thực hiện trong năm học (xem 1.1.3.2):
Với mục đích cung cấp cho học sinh thông tin phản hồi kịp thời về kết quả học tập của học sinh để học sinh kịp thời điều chỉnh những hạn chế và giúp giáo viên điều chỉnh nội dung và phương pháp giảng dạy Các bài kiểm tra định kỳ trong
năm học còn có các mục đích cụ thể sau:
Các bài kiểm tra giải tích:
- Mục đích đánh giá qua bài kiểm tra 15 phút GT học kỳ 1: Đánh giá kết quả học tập của học sinh sau khi học xong các phần: Định nghĩa và ý nghĩa của đạo hàm; Các quy tắc tính đạo hàm; Đạo hàm của các hàm số sơ cấp cơ bản
- Mục đích đánh giá qua bài kiểm tra 15 phút GT học kỳ 2: Đánh giá kết quả học tập của học sinh sau khi học xong các phần: Nguyên hàm; Tích phân; Các phương pháp tính tích phân
- Mục đích đánh giá qua bài kiểm tra Chương 1 GT: Đánh giá kết quả học tập của học sinh sau khi học xong Chương 1- Đạo hàm
- Mục đích đánh giá qua bài kiểm tra chương 2 GT: Đánh giá kết quả học tập của học sinh sau khi học xong Chương 2 - Ứng dụng của đạo hàm
- Mục đích đánh giá bài kiểm tra Chương 3 GT: Đánh giá kết quả học tập của học sinh khi học xong Chương 3 - Nguyên hàm và Tích phân
- Mục đích đánh giá qua bài kiểm tra Chương 4 GT: Đánh giá kết quả học tập của học sinh khi học xong Chương 4 - Đại số tổ hợp
Các bài kiểm tra Hình học:
- Mục đích đánh giá qua bài kiểm tra 15 phút HH kỳ 1: Đánh giá kết quả học tập của học sinh khi học xong các phần: Hệ trục tọa độ, tọa độ của véctơ và của điểm; Véctơ pháp tuyến của đường thẳng, phương trình tổng quát của đường thẳng; Véctơ chỉ phương của đường thẳng, phương trình tham số của đường thẳng
- Mục đích đánh giá qua bài kiểm tra 15 phút HH kỳ 2: Đánh giá kết quả học tập của học sinh sau khi học xong các phần: Phương trình đường thẳng trong không gian; Vị trí tương đối của các đường thẳng và mặt phẳng; Khoảng cách, góc - Mục đích đánh giá qua bài kiểm tra giữa Chương 1 HH: Đánh giá kết quả học
tập của học sinh khi học xong các phần: Hệ trục toạ độ, toạ độ của véctơ và của điểm; Véctơ pháp tuyến của đường thẳng Phương trình tổng quát của đường