BỘ GIÁO DỤC VÀ ĐÀO TẠOTRƯỜNG ĐẠI HỌC THĂNG LONG ---Họ và tên học viên: Nguyễn Thị Phương Thư XÂY DỰNG , THỬ NGHIỆM ĐỀ THI BAO GỒM CÁC CÂU HỎI TRẮC NGHIỆM VÀ TỰ LUẬN MÔN TOÁN LỚP 8 VÀ PHÂ
Trang 2BỘ GIÁO DỤC VÀ ĐÀO TẠOTRƯỜNG ĐẠI HỌC THĂNG LONG -
Họ và tên học viên:
Nguyễn Thị Phương Thư
XÂY DỰNG , THỬ NGHIỆM ĐỀ THI BAO GỒM CÁC CÂU HỎI TRẮC NGHIỆM VÀ TỰ LUẬN MÔN TOÁN LỚP 8 VÀ PHÂN TÍCH THEO MÔ HÌNH ĐỊNH GIÁ TỪNG PHẦN
LUẬN VĂN THẠC SĨ TOÁN HỌC
Hà Nội – Năm 2015
1
Trang 3BỘ GIÁO DỤC VÀ ĐÀO TẠOTRƯỜNG ĐẠI HỌC THĂNG LONG -
Họ và tên học viên:
Nguyễn Thị Phương Thư
XÂY DỰNG , THỬ NGHIỆM ĐỀ THI BAO GỒM CÁC CÂU HỎI TRẮC NGHIỆM VÀ TỰ LUẬN MÔN TOÁN LỚP 8 VÀ PHÂN TÍCH THEO MÔ HÌNH ĐỊNH GIÁ TỪNG PHẦN
LUẬN VĂN THẠC SĨ TOÁN HỌC
CHUYÊN NGÀNH : PHƯƠNG PHÁP TOÁN SƠ CẤP
MÃ SỐ: 60460113NGƯỜI HƯỚNG DẪN KHOA HỌC :GS.TSKH Lâm Quang Thiệp
Hà Nội – Năm 2015
2
Thang Long University Libraty
Trang 4MỤC LỤC
5
Mở đầu ………
Chương 1: Tổng quan về các phương pháp đo lường trong giáo dục và mô hình định giá từng phần ………
I Các loại phương pháp đo lường trong giáo dục………
II Mô hình định giá từng phần ………
Chương 2: Xây dựng và triển khai một đánh giá tiêu chuẩn hóa
1 Hai loại hình đánh giá cơ bản trong hệ thống giáo dục………
2 Đánh giá trong tiến trình và đánh giá tổng kết….………
3.Các công đoạn xây dựng và triển khai đánh giá tiêu chuẩn hóa Chương 3: Thực hành đánh giá môn toán học kỳ 1 lớp 8 bằng đề kiểm tra hỗn hợp trắc nghiệm và tự luận ……
1 Giới thiệu chương trình toán lớp 8 ………
2 Đánh giá thí sinh ………
3 Xây dựng bảng đặc trưng câu hỏi cho đề kiểm tra dự kiến bao gồm câu hỏi tự luận và trắc nghiệm ………
4 Thử nghiệm đề kiểm tra dự kiến ………
5 Xây dựng đề kiểm tra chính thức ………
Kết luận và khuyến nghị ………
Tài liệu tham khảo ………
Phụ lục ………
1.Đề kiểm tra môn toán học kỳ 1 lớp 8 năm học 2014-2015(Dự kiến)………
2.Đề kiểm tra môn toán học kỳ 1 lớp 8 năm học 2014-2015 (Chính thức) ………
3 Dữ liệu kết quả làm bài của thí sinh với đề chính thức ………
4 Kết quả phân tích câu hỏi của đề chính thức ………
3 6 6 25 30 30 31 32 37 37 38 38 44 48 63 64 65 65 70 75 81 5 Kết quả thí sinh làm đề chính thức ……… 96
4
Thang Long University Libraty
Trang 6triển lý luận làm cho hai phương pháp hội tụ vào nhau: có thể xem trắc nghiệm(nhị phân) là trường hợp riêng của tự luận (đa phân) Mô hình định giá từng phần
(partial credit model - PCM) giúp phân tích kết hợp trắc nghiệm với tự
luận
Chính vì những lý do trên mà em chọn đề tài "Xây dựng, thử nghiệm đềthi bao gồm các câu hỏi trắc nghiệm và tự luận môn Toán lớp 8 và phân tíchtheo mô hình định giá từng phần (PCM)", nhằm áp dụng PCM vào thực tế
giảng dạy
2 Mục đích nghiên cứu: Thử nghiệm kiểm tra , đánh giá được trình độcủa học sinh , đo được năng lực tiềm ẩn đơn chiều của học sinh bằng đề kiểm tra
bao gồm các câu hỏi nhị phân và các câu hỏi tự luận có kiểu ứng đáp đa
phân
3 Đối tượng và phạm vi nghiên cứu: Học sinh khối lớp 8 trường THCS
Lê Chân – Quận Lê Chân – Thành phố Hải Phòng Học sinh được làm đề kiểmtra đánh giá môn Toán lớp 8 học kỳ 1 năm học 2014-2015
4 Phương pháp nghiên cứu:
- Nghiên cứu tài liệu để hiểu các vấn đề liên quan phương pháp đo lường
Trang 7Chương 1 TỔNG QUAN
VỀ CÁC PHƯƠNG PHÁP ĐO LƯỜNG TRONG GIÁO DỤC
VÀ MÔ HÌNH ĐỊNH GIÁ TỪNG PHẦN
Từ buổi sơ khai của lịch sử loài người, trong quá trình lao động và giaotiếp, con người đã phải thực hiện các phép đo lường Đo lường là phép so sánhmột đại lượng nào đó với một vật chuẩn đã biết, và kết quả là đưa ra các con số
để đánh giá Khi khoa học còn sơ khai thì phép đo cũng thô thiển Với sự pháttriển của một khoa học nào đó, độ chính xác của phép đo trong khoa học ấy cũng
ngày càng được nâng cao Trong giáo dục cũng vậy, việc đánh giá học sinh phải
được thực hiện một cách chính xác, đánh giá đúng năng lực học
sinh
Sau đây là tổng quan một số phương pháp đánh giá thường dùng trong giáo
dục
I CÁC LOẠI PHƯƠNG PHÁP ĐO LƯỜNG TRONG GIÁO DỤC
Ngày nay người ta thường phân chia các phương pháp đo lường trong giáo
dục thành 4 nhóm: đánh giá kiểu lựa chọn trả lời (selected response
các phương pháp có liên quan đến luận văn
1 Phương pháp đánh giá kiểu lựa chọn trả lời (trắc nghiệm khách quan)
1.1 Các dạng câu hỏi trắc nghiệm khách quan
Trong nhóm trắc nghiệm khách quan có 5 dạng câu hỏi chính:
a Câu nhiều lựa chọn:
Câu nhiều lựa chọn đưa ra một nhận định và một số phương án trả lời, thísinh phải chọn để đánh dấu vào một phương án đúng hoặc phương án tốt nhất.Câu trắc nghiệm nhiều lựa chọn có hai phần, phần đầu được gọi là câu dẫn, nêu
6
Thang Long University Libraty
Trang 8vẫn đề, cung cấp thông tin cần thiết hoặc nêu một câu hỏi; phần sau là cácphương án chọn, thường được đánh dấu bằng các chữ cái A, B, C, D, hoặc cácchữ số 1, 2, 3, 4, Kiểu câu hỏi nhiều lựa chọn đơn giản nhất quy định trongcác phương án chọn chỉ có một phương án đúng duy nhất hoặc một phương ánđúng nhất; các phương án khác gọi là phương án nhiễu, được đưa vào để gâynhiễu đối với những thí sinh không nắm chắc vấn đề.
b Câu đúng/ sai
Câu đúng/ sai đưa ra một nhận định, thí sinh phải lựa chọn một trong haiphương án trả lời để khẳng định nhận định đó là đúng hay sai, hoặc có haykhông Dễ dàng thấy rằng khi một người hoàn toàn không có hiểu biết chỉ đánhdấu hú họa để trả lời một câu hỏi nhiều lựa chọn với n phương án trả lời thì xácsuất để làm đúng câu hỏi đó là
để làm đúng là 50%
c Câu ghép đôi
Câu ghép đôi đòi hỏi thí sinh phải ghép một dòng ở cột bên trái với mộtdòng ở cột bên phải sao cho phù hợp theo một yêu cầu nào đó Như vậy câu ghép
đôi gồm 3 phần: phần nêu yêu cầu ghép đôi, phần mở ở cột bên trái và phần đóng
d Câu điền khuyết và câu trả lời ngắn
Câu điền khuyết là câu nêu một mệnh đề với một bộ phận để khuyết, thísinh phải nghĩ ra nội dung thích hợp để điền vào chỗ trống
Câu trả lời ngắn là câu đòi hỏi trả lời bằng một từ hoặc cụm từ chỉ một khái
niệm nào đó, rất ngắn
1 ; còn để trả lời một câu hỏi đúng/sai thì xác suấtn
7
Hai loại điền khuyết và trả lời ngắn được ghép với nhau vì chúng cùng làcâu hỏi mở, nhưng được trả lời bằng một từ hoặc cụm từ rất ngắn, chỉ thể hiệnmột ý nào đó chứ không có cấu trúc bố cục như bài tự luận Loại câu hỏi này cóthể được quan niệm như phần giao nhau giữa trắc nghiệm khách quan và tự luận
e Câu thí sinh tự tạo đáp án
Là loại câu hỏi có đáp án bằng số mà trắc nghiệm SAT cải tiến mới đưavào vào năm 2005 để giảm bớt sự lệ thuộc của thí sinh vào cái khung trả lời định
sẵn Thí sinh có thể tô giá trị trả lời bằng số vào phiếu trả lời có dạng thức xácđịnh, do đó có thể chấm bằng máy
1.2 Khi nào thì đánh giá bằng phương pháp trắc nghiệm khách quan?
Mức mục tiêu học tập cụ thể phù hợp nhất để đánh giá bằng phương pháptrắc nghiệm khách quan là mức làm chủ kiến thức, và sau đó là trình độ suy luận
Phương pháp trắc nghiệm khách quan có thể sử dụng rất tốt để đánh giá mộtlượng yếu tố kiến thức lớn phân tán và phủ kín cả các mục tiêu học tập cần đánh
giá Phương pháp này cũng cho phép đánh giá kiểu suy luận hoàn toàn tự do, vì
dù sao việc trả lời các câu hỏi trắc nghiệm khách quan cũng được giới hạn trong
nhiều yếu tố kiến thức, được yêu cầu trả lời trong một thời gian tương đối ngắn.Ngoài ra, việc sử dụng công nghệ chấm điểm tự động, sử dụng các công nghệ đo
lường hiện đại để thử nghiệm, tu chỉnh câu hỏi và thiết kế các đề kiểm tra phùhợp cũng là một ưu thế lớn của phương pháp này
Phương pháp trắc nghiệm khách quan chỉ thể hiện tính khách quan ở khâu
chấm điểm, thường bằng cách so sánh các đáp án có sẵn với bài làm của thí sinh,
người chấm điểm không cần có phán xét chủ quan nào, chính vì vậy có thể chấm
điểm bằng máy
8
Thang Long University Libraty
Trang 101.3 Thiết kế và triển khai đánh giá bằng trắc nghiệm khách quan
a Vạch kế hoạch đánh giá
Để xây dựng kế hoạch đánh giá cần trả lời 4 câu hỏi: 1) Vì sao đánh giá?,2) Đánh giá cái gì?, 3) Đánh giá như thế nào?, và 4) Mức độ quan trọng của từng
nội dung và mục tiêu học tập cụ thể?
1) Vì sao đánh giá? Mục đích của việc đánh giá là gì? Nếu đánh giá nhằmđiều chỉnh cải tiến việc học tập thì là để chẩn đoán hay lập kế hoạch cho ai: giáo
viên, người học hay ai khác? Nếu là đánh giá bản thân việc học tập thì dùng kếtquả để giải trình cho ai hoặc để quyết định gì? Kết quả đánh giá sẽ giúp chongười học?
2) Đánh giá cái gì? Phải nêu rõ các nội dung học tập tổng quát và mục tiêu
học tập cụ thể cần được đánh giá, các nội dung và mục tiêu đó là các nguyên liệu
được sử dụng để thiết kế công cụ đánh giá Một biện pháp được sử dụng có hiệu
quả để thiết kế công cụ đánh giá là lập bảng đặc trưng của một đề kiểm
tra
3) Đánh giá như thế nào? Cần khẳng định lại việc sử dụng phương pháptrắc nghiệm khách quan là thích hợp trong trường hợp này Sau đó xem xét cácloại câu hỏi nào trong các kiểu câu hỏi trắc nghiệm khách quan được sử dụng là
thích hợp nhất để đánh giá
4) Mức độ quan trọng của loại nội dung và mục tiêu học tập? Xác địnhmức độ quan trọng của từng ô nội dung và mục tiêu học tập cụ thể để phân bốcác con số trong bảng đặc trưng Các hàng của bảng đặc trưng được ghi các phần
nội dung môn học Các cột của bảng đặc trưng được ghi các mục tiêu học tập cụ
thể muốn đánh giá Các con số trong mỗi ô nêu mức quan trọng của nội dung và
mục tiêu học tập đó trong đề kiểm tra, chúng cũng phải tương thích với thời gian
và công sức dành để giảng dạy cũng như khối lượng phần nội dung tương ứngtrong giáo trình Các con số này cũng biểu diễn số câu hỏi ttrong một đề trắcnghiệm khách quan hoặc số điểm số dự định phân bố cho các mục tiêu và nộidung tương ứng với các ô đó
đánh giá khác nhau với một yêu cầu thống nhất
b Xây dựng công cụ đánh giá
Trong giai đoạn này cần xác định: 1) Đánh giá cái gì? 2) Chế tác loại câuhỏi nào? và 3) Cách kết hợp thành một đề trắc nghiệm
1) Lựa chọn mẫu nội dung cụ thể cần đánh giá Tuy đã xác định các mảngnội dung, mục tiêu học tập cụ thể cần đánh giá và mức độ quan trọng của từngmục tiêu và từng mảng nội dung, nhưng một môn học thường bao gồm rất nhiều
nội dung nên cần chọn một mẫu nội dung cụ thể nào để đánh giá Đây là côngđoạn cần lựa chọn thận trọng Tuy rằng mọi người thường gọi phương pháp đang
xét là trắc nghiệm khách quan, nhưng công đoạn này mang tính chủ quan củangười lựa chọn: chọn mảng nội dung, chọn sách giáo khoa, chọn nhà xuất bản
Tính chủ quan này sẽ không ảnh hưởng nhiều đến độ giá trị của đề trắc nghiệmnếu mục tiêu học tập được xác định cẩn thận và rõ
ràng
Mỗi một nội dung cụ thể cần đánh giá được viết ra thành một câu thiết kế.Câu thiết kế là các phát biểu về các sự việc, khái niệm hoặc hiểu biết đòi hỏi học
sinh phải nắm được và do đó cần trắc nghiệm Có hai loại câu thiết kế: câu thiết
kế liên quan đến các yếu tố nội dung quan trọng và câu thiết kế liên quan đến loại
lập luận cần thể hiện Mỗi câu thiết kế là một đơn vị để có thể dựa vào đó chế tác
một loại câu hỏi trắc nghiệm khách quan xác định Cần dựa vào các bảng đặctrưng để liệt kê ra các ý cần viết câu thiết kế, và số câu thiết kế nên xây dựngnhiều hơn số lượng được ghi trong mỗi ô, vì trong tương lai cần xây dựng các đề
trắc nghiệm tương đương và cũng có thể phải chế tác các câu hỏi theo phươngpháp khác Cần lưu ý rằng để đánh giá trình độ lập luận, nên đưa ra các tình
10
Thang Long University Libraty
Trang 12huống khác với tình huống thí sinh đã thực hiện trong quá khứ, vì nếu như vậy sẽ
chỉ đánh giá được khả năng nhớ lại các lập luận cũ trước đây
Đối với câu hỏi nhiều lựa chọn, một trong những khó khăn lớn của ngườiviết là tìm được các phương án nhiễu “ hợp lý” Khó khăn này có thể giải quyếtnhờ phương pháp trình bày ở cuối mục tiếp theo
2) Chế tác các loại câu hỏi: Khi đã có các câu thiết kế, có thể dựa vào cáccâu thiết kế để chế tác thành một loại câu hỏi trắc nghiệm khách quan nào đấy
3) Kết hợp các câu hỏi thành một đề trắc nghiệm: Nên bố trí các câu hỏi dễ
ở đầu đề trắc nghiệm để nâng cao độ tự tin của thí sinh khi bắt đầu làm bài Chú ý
phân bố các câu hỏi theo từng loại câu hỏi hoặc từng loại mục tiêu học tập Nên
cho thí sinh biết điểm dự định đối với câu hỏi để họ ưu tiên chú ý các câu hỏiđiểm cao Khi in đề kiểm tra, các phần của một câu hỏi nên bố trí nằm trên cùng
một trang
Về thời gian trắc nghiệm khách quan nghiệm:
Cần ước lượng đúng thời gian tối thiểu cần thiết để hoàn thành bài trắcnghiệm khách quan nghiệm Thông thường đối với học sinh phổ thông, một lầnkiểm tra không quá 45’ Học sinh có thể trả lời 25-90 câu hỏi một lần thi tùy theo
sự phức tạp của câu hỏi Các câu hỏi nhiều lựa chọn cần 30-60 giây để trả lời
Nếu thời gian quy định để làm bài không đủ, có thể điều chỉnh bằng cáchbiện pháp sau:
- Chuyển một số loại câu hỏi cần nhiều thời gian thành các câu hỏi đúng/sai
- Chỉ kiểm tra một số mục tiêu học tập bằng cách chọn ngẫu nhiên
- Tích hợp các mục tiêu học tập thành một nhóm mục tiêu
Đảm bảo đủ thời gian để mọi học sinh có thể làm hết mọi câu hỏi trong đềkiểm tra là một yêu cầu rất quan trọng đối với các đề kiểm tra thông thường Nếu
không đủ thời gian thì kết quả đánh giá sẽ sai lệch Do đó, trừ khi có nhu cầu đo
tốc độ sử lý bằng các đề trắc nghiệm tốc độ, thông thường cần tính toán để đảm
bảo đủ thời gian cho mọi thí sinh làm hết các câu hỏi trong đề kiểm
tra
11
c Xem xét lại công cụ đánh giá
Việc nhận xét, phê phán công cụ đánh giá được triển khai từ hai phươngdiện: 1) nó có đáp ứng tốt kế hoạch đánh giá thiết kế hay không; và 2) chất lượng
các câu hỏi được chế tác như thế nào
d Thực hiện việc đánh giá, xem xét các vấn đề và điều chỉnh nếu
- Lưu ý những câu hỏi mà thí sinh yêu cầu giải thích do không hiểu đểchỉnh lý nhằm sử dụng lại sau này
Chế tác các câu hỏi trắc nghiệm phục vụ cho việc giảng dạy và đánh giámôn học là một việc làm tốn nhiều công sức Năng lực chuyên môn là quan trọng
để có thể chế tác các câu hỏi trắc nghiệm có nội dung tốt, nhưng đó mới chỉ làđiều kiện cần chứ chưa đủ Muốn chế tác các câu hỏi trắc nghiệm tốt cần làmnhiều để thu được nhiều kinh nghiệm Khi viết xong một câu hỏi trắc nghiệmđừng nghĩ là công việc đã xong, dù bạn vừa lòng với câu hỏi đã viết Sau mộtthời gian đọc lại, bạn sẽ phát hiện những thiếu sót Do đó có người cho rằng viết
câu hỏi trắc nghiệm phải tỉ mỉ như người thợ thủ công, phải cân nhắc từng câuchữ như người làm thơ
Tuy nhiên, khi bạn đã xây dựng cho môn học của mình một tập hợp câu hỏi
trắc nghiệm khách quan tốt thì bạn sẽ được đền đáp: việc giảng dạy và đánh giá
của bạn trở nên hết sức thuận lợi
Các chuyên gia đánh giá cho rằng phương pháp trắc nghiệm khách quannên dùng trong những trường hợp sau:
Khi số thí sinh rất đông;
Khi muốn chấm bài nhanh;
Khi muốn có điểm số đáng tin cậy, không phụ thuộc vào người chấm bài;
12
Thang Long University Libraty
Trang 14Khi phải coi trọng yếu tố công bằng, vô tư, chính xác và muốn ngăn chặn
sự gian lận khi thi;
Khi muốn đề thi có độ an toàn cao về nội dung và đảm bảo tính bí
mật;
Khi muốn kiểm tra một phạm vi hiểu biết rộng, muốn ngăn ngừa nạn học
tủ, học vẹt và giảm thiểu sự may rủi
2 Phương pháp đánh giá nhờ bài viết đủ dài (tự luận)
2.1 Khi nào thì đánh giá bằng phương pháp tự luận
với nhau, các ý tưởng có quan hệ với nhau
- Phương pháp tự luận có thể được sử dụng thuận lợi để đánh giá trình độsuy luận, và đây chính là thế mạnh của phương pháp này Chúng ta không thểnhìn thấy quá trình suy luận trong đầu thí sinh như thế nào, nhưng có thể buộc họ
viết ra suy nghĩ của họ hoặc những lí lẽ khi họ trả lời
- Để đánh giá năng lực thực hành, phương pháp tự luận chỉ đánh giá đượcviệc nắm vững các kiến thức phức tạp, thậm chí trình độ giải quyết vấn đề là tiên
quyết để thực hành, chứ không đánh giá được trực tiếp kỹ năng thực
hành
- Để đánh giá khả năng tạo sản phẩm, phương pháp tự luận cũng chỉ chophép đánh giá việc thí sinh nắm vững kiến thức và có trình độ suy luận như là các
đòi hỏi tiên quyết để tạo sản phẩm, nhưng đây chỉ là điều kiện cần chứ không đủ
để tạo sản phẩm Muốn đánh giá khả năng thực hành tạo sản phẩm phải sử dụng
Trang 15nội dung, cần xây dựng tiêu chí đánh giá mức độ nắm vững kiến thức và chấtlượng suy luận của thí sinh Về hình thức, cần có tiêu chí đánh giá cách chọn từ,
diễn đạt câu, bố cục,
Bảng 1.2.1 Nêu tóm tắt về sự phù hợp của phương pháp đánh giá bằng
tự luận với các mục tiêu học tập cụ thể nêu trên đây
Mục tiêu học tập cụ thể Đánh giá bằng phương pháp tự luận
Tự luận có thể nhấn mạnh đánh giáBiết và hiểu việc hiểu các mối quan hệ giữa các yếu
tố kiến thức
Bài viết mô tả cách giải quyết các vấn
Trình độ suy luận đề phức tạp có thể giúp đánh giá trình
độ suy luận Đây là thế mạnh củaphương pháp
Tự luận có thể đánh giá sự nắm vững
Kĩ năng thực hành các kiến thức tiên quyết cần cho kĩ
năng thực hành, nhưng không đánh giáđược trực tiếp kĩ năng thực hành
Tự luận có thể đánh giá trình độ viết vầNăng lực tạo sản phẩm sự nắm vững các kiến thức cần thiết để
- Thí sinh phải có trình độ viết tối thiểu;
- Giáo viên có đủ thời gian để chấm bài;
14
Thang Long University Libraty
Trang 16- Các bài tự luận đòi hỏi việc chấm bài phải nhất quán, cho nên chỉ nêndùng phương pháp này khi các hướng dẫn chấm bài được chuẩn bị tốt và cácbảng điểm được qui định là nhất quán.
1.2 Thiết kế đánh giá bằng phương pháp tự luận
a Vạch kế hoạch đánh giá
Cũng như đối với phương pháp trắc nghiệm khách quan, để xây dựng kếhoạch đánh giá bằng phương pháp tự luận cũng cần phải trả lời 4 câu hỏi: 1) Vìsao đánh giá? 2) Đánh giá cái gì? Đánh giá như thế nào? và 4) Quan trọng nhưthế nào?
- Vì sao đánh giá? Thiết kế đánh giá phải đáp ứng nhu cầu xác định củangười sử dụng thông tin Dù sao trước hết cần xác định là việc đánh giá nằm điều
chỉnh cải tiến việc học tập hay đánh giá bản thân việc học tập Nếu là đánh giánhằm điều chỉnh cải tiến việc học tập, thì cần xem xét việc đánh giá đó chỉ giúp
giáo viên ra quyết định hay giúp cả học sinh?
- Đánh giá cái gì? Phải nêu rõ các nội dung cần được đánh giá, kể cả cácmối liên hệ giữa chúng Về trình độ suy luận, cần chú ý cách suy luận nào? Danh
mục các nội dung và mục tiêu học tập đó là các nguyên liệu được sử dụng đểthiết kế công cụ đánh giá
- Đánh giá như thế nào? Cần khẳng định lại các mục tiêu học tập muốnđánh giá là phù hợp với phương pháp tự luận
- Mức độ quan trọng? Xác định mức độ quan trọng của từng ô nội dung vàmục tiêu học tập để phân bố các con số trong bảng đặc trưng Lưu ý là mức độquan trọng này phải tương thích với thời gian và công sức dành để giảng dạy.Các con số này phù hợp với tổng điểm được chấm sẽ phân bố theo các ô ứng với
nội dung và mục tiêu học tập đã cho
b Xây dựng công cụ đánh giá
Công cụ đánh giá theo phương pháp tự luận gồm hai phần: các câu hỏi của
đề tự luận và thang điểm, cách cho điểm
* Xây dựng một câu hỏi tự luận
15
Trang 17Để có một câu hỏi tự luận tốt cần phải:
1) Mô tả rõ tình huống mà từ đó nảy sinh yêu cầu giải quyết;
2) Xác định rõ thể loại lập luận cần sử dụng (phân tích, suy diễn, sosánh, );
3) Chỉ rõ cách viết một bài bám sát yêu cầu (có thể nêu rõ tiêu chí đánh giá
các phần của bài tự luận)
* Xác định thang điểm và qui trình chấm bàiQua bài làm của học sinh, cần đánh giá bài làm đó có thể hiện được ba chất
lượng khác nhau: 1) hiểu biết vững vàng; 2) lập luận chặt chẽ; 3) diễn đạt tốt cần
lưu ý rằng không thể thả nổi tiêu chí để đánh giá bài tự luận sau khi xem các bài
làm của học sinh mới xây dựng mà phải xác định trước
Mỗi đề tự luận có một thang điểm và qui trình chấm bài riêng, tuy nhiêncũng có thể đưa ra các tiêu chí chung làm mẫu để có thể áp dụng với nhiều nộidung khác nhau Chẳng hạn thang điểm để đánh giá việc thí sinh hiểu một góikiến thức nào đó có thể theo bảng 1.2.2 sau đây
Cần lưu ý là các hướng dẫn tiêu chí cho điểm phải tính đến nhiều mặt chất
lượng, không nên soạn thảo các hướng dẫn theo kiểu đếm ý để tính điểm, vì làm
như vậy có thể biến một đề tự luận tốt thành một đề trắc nghiệm khách quan tồi
Bảng 1.2.2 Tiêu chí mẫu cho thang điểm về mức độ hiểu vẫn đề
Trả lời rõ ràng, tập trung, chính xác
3 Các ý bổ sung hỗ trợ tốt Rút ra được
các mối quan hệ tốt và hiểu rõ bảnchất Sử dụng ngữ pháp đúng
Trả lời rõ ràng, tương đối tập trung
trợ hạn chế Nêu các mối quan hệ mờnhạt, không giúp nhận thức được bản16
Thang Long University Libraty
Trang 18chất Sử dụng ngữ pháp có chỗ đúng,
có chỗ sai
Trả lời lạc đề, chứa các thông tinkhông chính xác, đôi khi chứng tỏ
1 không nắm vững dữ liệu Không có các
ý bổ sung, không hỗ trợ được hoặckhông gắn với bản chất Sử dụng ngữpháp thường không đúng
Trong trường hợp muốn đánh giá trình độ lập luận của học sinh với cáckiến thức đã cho trong đầu bài thì tiêu chí mẫu phải phản ánh khả năng lập luận
Chẳng hạn, để đánh giá khả năng khái quát hóa có thể sử dụng tiêu chí mẫu ởbảng 1.2.3 sau đây
Bảng 1.2.3 Tiêu chí mẫu cho thang điểm về khả năng khái quát hóa
Phát biểu là đúng đối với nội dung đã
- Phát biểu là đúng đối với nội dung đãcung cấp nhưng áp dụng đối với cáctrường hợp khác ít thuyết phục
- Phát biểu là đúng đối với nội dung đã
17
Trang 19cung cấp nhưng không mở rộng ra cácYếu
- Phát biểu là không đúng đối với nộidung đã cung cấp
c Xem xét lại các công cụ đánh giá
Khi đã soạn thảo xong sơ bộ công cụ đánh giá, cần xem lại và nhận xét, phê
phán công cụ đánh giá đó Muốn vậy, một trong những cách tốt nhất là giáo viên
thử dựa vào đề tự luận và thang điểm để đưa ra một dàn ý cho bài viết, xem thử
có vướng mắc ở đâu không Có thể tóm tắt các ý cần xem xét trong bảng hướng
dẫn để kiểm tra chất lượng của một công cụ đánh giá bằng phương pháp tự luận
như ở bảng 1.2.2
d Thực hiện đánh giá, phát hiện thiếu sót và cải tiến
Khi triển khai việc đánh giá, cần đảm bảo cho thí sinh giữ được tâm trạngthoải mái để tập trung suy nghĩ làm bài Chấm bài tự luận là công đoạn dễ bị ảnh
hưởng bởi chủ quan của người chấm, do đó mọi người chấm cần trao đổi cẩnthận về tiêu chí và thang điểm Để đảm bảo sự nhất quán và công bằng, trong quá
trình chấm bài nên triển khai chấm từng câu hoặc từng chủ đề của câu hỏi đồng
thời đối với mọi thí sinh Sau khi triển khai đánh giá, cho điểm và giải thích cáckết quả, nếu phát hiện thấy các thiếu sót thì cần xem xét kĩ để điều chỉnh côngcụ
đánh giá và cải tiến việc giảng dạy trong tương lai
18
Thang Long University Libraty
Trang 20Bảng 1.2.4 Hướng dẫn kiểm tra chất lượng của công cụ đánh giá bằngphương pháp tự luận
Chất lượng các câu hỏi trong đề tự luận
Có đúng tự luận là phương pháp đánh giá tốt nhất cho các mục tiêu họctập mong muốn không?
Các câu hỏi có gợi ra các câu trả lời nhanh chóng và tập trung không? Các kiến thức muốn thể hiện có rõ ràng không?
Các cách lập luận cần thiết có được nêu rõ không?
Các câu hỏi có đòi hỏi kỹ năng viết quá mức tối thiểu hay không?
Có câu hỏi nào gây khó khăn cho các nhóm học sinh bị thiệt thòi khi họ đủkiến thức và khả năng lập luận?
Để tự luận có đủ câu hỏi để đảm bảo đánh giá được kiến thức và khả nănglập luận cần thiết của học sinh không?
Chất lượng của thang điểm qui định
Các chuyên gia giỏi về lĩnh vực đề cập có đồng ý với việc xác định chấtlượng của bài làm hay không?
Về lĩnh vực kiến thức, tiêu chí đánh giá có rõ ràng hay không?
Về khả năng lập luận, bảng hướng dẫn tổng quát có thể hiện được bản chất
của suy luận có chất lượng hay không?
Thang điểm có phù hợp với đề tự luận hay không?
Điều kiện chấm bài
Số người chấm có bảo đảm để đánh giá công bằng mọi bài làm của thísinh hay không?
Có đủ thời gian dành cho mỗi người chấm bài để đọc và đánh giá mọi bàilàm hay không?
Mọi người chấm bài có được tập huấn như nhau hay không – họ có nhấttrí với cách chấm bài hay không?
19
Trang 21Nhiều khi thang điểm không chỉ thuần túy là chỉ đếm ý để tính điểm màcòn mở cho người chấm một khoảng tự do để đánh giá về hình thức bài viết vàmức độ sáng tạo của học sinh Kết quả đánh giá này phần lớn phụ thuộc chủ quan
của người chấm điểm; người chấm có trình độ càng cao thì việc đánh giá càngchính xác
2.3.Một số nguyên nhân làm giảm chất lượng đánh giá bằng tự luận và cáchkhắc phục
Bảng 1.2.3 dưới đây sẽ nêu tóm tắt những lý do làm giảm chất lượng việcđánh giá bằng phương pháp tự luận và cách khắc
phục
Nguyên nhân làm giảm chất lượng
Không xác định rõ mục tiêu học tập
- Kiến thức làm nên không rõ Nghiên cứu kỹ tài liệu cần nắm vững
và phác họa các cấu trúc kiến thức cầnđánh giá
- Không nói rõ kiểu suy luận Xác định kiểu suy luận được đánh giá
giúp thí sinh viết tốt hơn
Số lượng các câu hỏi không phù hợp Chọn một mẫu đại diện có độ dài tài
liệu vừa đủ để giúp thí sinh có thể trảlời đạt yêu cầu về nội dung và hìnhthức
Cách khắc phục
20
Thang Long University Libraty
Trang 22Các câu hỏi tự luận có chất lượng kém
Hướng dẫn chấm điểm có chất lượng
Soạn thảo theo đúng hướng dẫn
Điều chỉnh tiêu chí cho phù hợp vớinội dung và trình độ suy luận mongmuốn
Viết rõ ra các kỳ vọng đối với thí sinh
điểm cho mọi người tham gia chấm.Tìm thêm người chấm hoặc sử dụngphương pháp khác
Bảng 1.2.3
- Không đủ tời gian để đọc và cho Tập huấn dùng đúng tiêu chí chấm
Tóm lại tự luận là một phương pháp tốt để đánh giá các gói kiến thức liênkết với nhau và các trình độ suy luận phức tạp Tuy nhiên, đánh giá bằng tự luận
dễ mang tính chủ quan Để giảm tính chủ quan, cần phải thiết kế các câu hỏi tự
luận theo một qui trình hợp lý, thiết kế các hướng dẫn tiêu chí chấm điểm cẩnthận, và làm cho mọi người chấm hiểu rõ cách áp dụng các tiêu chí
đó
Các chuyên gia đánh giá cho rằng phương pháp tự luận nên dùng trongnhững trường hợp sau:
Khi thí sinh không quá đông;
Khi muốn khuyến khích và đánh giá cách diễn đạt;
Khi muốn tìm hiểu ý tưởng của thí sinh hơn là khảo sát thành quả học tập;
Khi có thể tin tưởng khả năng chấm tự luận của giáo viên là chính
Trang 23Các nghiên cứu về đánh giá bằng trắc nghiệm phát triển từ khoảng đầu thế
kỷ 20, đến thập niên 1970 thì hoàn thiện trong một lý thuyết mà ngày nay người
ta gọi là lý thuyết trắc nghiệm cổ điển Tuy đóng góp rất nhiều cho phát triển giáo
dục, lý thuyết trắc nghiệm có nhiều thiếu sót, đặc biệt là sự phụ thuộc lẫn nhaugiữa công cụ đánh giá (đề thi) và đối tượng được đánh giá (mẫu thí sinh) Từ thập
niên 1970 đến nay một lý thuyết đo lường mới được xây dựng, dựa trên mô hình
toán học, được gọi là Lý thuyết Ứng đáp Câu hỏi (IRT)
IRT dựa trên hai giả thiết:
- Sự ứng đáp của một thí sinh đối với một câu hỏi có thể được tiên đoánbằng năng lực tiềm ẩn của thí sinh;
- Quan hệ giữa sự ứng đáp câu hỏi của thí sinh và năng lực tiềm ẩn làm cơ
sở cho sự ứng đáp đó có thể mô tả bằng một hàm đặc trưng câu hỏi đồng biến
Để xây dựng một mô hình toán diễn tả một mối quan hệ phải xuất phát từmột tiền đề nào đó Nhà toán học Đan Mạch, George Rasch, đã xây dựng đượcmột mô hình hàm đặc trưng câu hỏi đơn giản nhất nhưng cho đến nay cũng được
sử dụng nhiều nhất trong công nghệ trắc nghiệm Để biểu diễn câu hỏi, Rasch chỉ
chọn một tham số: độ khó của câu hỏi Trong mô hình này thì xác suất để một thí
sinh trả lời đúng một câu hỏi nào đó phụ thuộc vào tương quan giữa năng lực của
thí sinh và độ khó của câu hỏi Chúng ta chọn để biểu diễn năng lực của thí để biểu diễn năng lực của thísinh, và để biểu diễn độ khó của câu hỏi Theo Rasch, xác xuất P để trả lờiđúng câu hỏi phụ thuộc vào tương quan giữa và , tức là ta có thể biểu để biểu diễn năng lực của thí
diễn:
trong đó f là một hàm nào đó của xác suất trả lời đúng
Vấn đề là chọn hàm f(P) như thế nào để có biểu diễn hợp lý nhất Trướchết, vì mối quan hệ cộng trừ đơn giản hơn mối quan hệ về nhân chia nên Raschlấy logarit tự nhiên của (1.3.1):
lnf(P)= ln[Θ ] = ln - ln = - b để biểu diễn năng lực của thí - b
Trang 24Tiếp đến để đơn giản, khi xét mô hình trắc nghiệm nhị phân, Rasch chọn
P hàm f chính là
1- P , bằng biểu thức mức được thua (odds) hoặc khả năng thực
hiện đúng (likelyhood ratio), tức là tỷ số của khả năng xảy ra sự kiện khẳng định
so với khả năng xảy ra sự kiện phủ định Như vậy:
(1.3.4)
trong đó P( ) là xác suất trả lời đúng câu hỏi của thí sinh, là năng lực thí sinh, - b - bb
độ khó của câu hỏi
Biểu thức (1.3.4) là hàm đặc trưng của mô hình ứng đáp câu hỏi một tham
số, hay còn gọi là mô hình Rasch
4 Trắc nghiệm nhị phân và đa phân
Một mô hình trắc nghiệm được sử dụng phổ biến trong quá khứ là mô hìnhcác câu hỏi có kiểu ứng đáp nhị phân (dichotomous), tương ứng hai mức điểm là
0 và 1, để đo lường chỉ một năng lực tiềm ẩn, hoặc nói cách khác, đo lường năng
lực tiềm ẩn đơn chiều
Ngoài mô hình các câu hỏi có đáp ứng nhị phân, người ta còn sử dụngnhiều loại câu hỏi có ứng đáp đa phân (polytomous), tức là thí sinh có thể ứngđáp không chỉ theo hai mức điểm 0 và 1, mà theo nhiều mức điểm khác nhau Có
thể nêu ví dụ đơn giản về các mô hình ứng đáp đa phân ở các bảng hỏi với cácmức trả lời : rất không đồng ý, không đồng ý, không có ý kiến, đồng ý, rất đồngý
23
Trong các mô hình trắc nghiệm đa phân, mô hình định giá từng phần(partial credit model -PCM) được đặc biệt chú ý vì tính tổng quát và khả năngứng dụng rộng rãi của nó
24
Thang Long University Libraty
Trang 26II MÔ HÌNH ĐỊNH GIÁ TỪNG PHẦN
1 Thiết lập biểu thức
Masters xét câu hỏi có nhiều hạng điểm để thí sinh đạt được, và giả địnhxác suất để thí sinh đạt hai hạng điểm kế tiếp nhau tuân theo quy luật của môhình Rasch nhị phân Biểu thức của mô hình Rasch đơn giản cho trường hợp câu
(trong đó P( ) là xác suất trả lời đúng câu hỏi của thí sinh, là năng lực thí sinh, - b - b
b độ khó của câu hỏi) hay có thể viết lại
e θ-δ
Pr X 1
1 e θ-δ
(1.3.1b)
Ở đây, chúng ta hiểu hàm đặc trưng câu hỏi chính là hàm xác suất để đạthạng điểm 1 của một câu hỏi nhị phân có hai hạng điểm 0 và 1, nhưng thay kýhiệu độ khó bi của câu hỏi thứ i bằng ký hiệu δi cho thống nhất với cách ký hiệucủa nhiều sách nước ngoài khi mô tả trắc nghiệm đa
Trang 27 1 exp - b 1 exp - b (1 2 )
Từ đó, tổng quát hơn, khi câu hỏi thứ i là đa phân với các hạng điểm 0, 1,
2, …, mi thì xác suất để thí sinh n đạt điểm x của câu hỏi thứ i sẽ
là:
26
Thang Long University Libraty
Trang 28Mô hình Rasch nhị phân là một trường hợp riêng của PCM.
Các hạng điểm của PCM là có thứ tự để phản ánh sự tăng dần của mộtnăng lực tiềm ẩn nào đó PCM giả định rằng các thí sinh có năng lực cao hơn sẽ
có khả năng nhiều hơn để đạt các hạng điểm cao hơn của câu
hỏi
Tuy nhiên PCM không phải là mô hình có bước tuần tự: việc xây dựngPCM chỉ xác định xác suất có điều kiện của hai hạng điểm kế tiếp nhau PCMkhông có đòi hỏi nào về việc phải có một quá trình tuần tự theo các bước để đạt
được các hạng điểm Điều đó có nghĩa là PCM không buộc thí sinh phải làmđược mọi nhiệm vụ với hạng điểm thấp hơn thì mới làm được các nhiệm vụ vớihạng điểm cao hơn
3.Các đường cong đặc trưng câu hỏi theo PCM và ý nghĩa của k
Việc thiết lập PCM dựa vào mô hình Rasch nhị phân đối với hai hạng điểm
kế tiếp nhau thường gây hiểu lầm rằng k là độ khó của bước thứ k được xemnhư một câu hỏi độc lập Việc giải thích k sẽ được làm rõ ở chương 3 qua các đồ
thị biểu diễn đường cong đặc trưng câu hỏi
Các đường cong đặc trưng câu hỏi theo PCM là đồ thị biểu diễn xác suấtđạt được mỗi hạng điểm phụ thuộc vào năng lực - b
4.Một vài tham số khác được sử dụng trong PCM
27
Trang 29Từ các tham số chính của câu hỏi PCM nhiều tác giả đề nghị sử dụng cácdạng thức biến đổi khác của tham số để dễ giải thích kết quả
- Khoảng cách k từ các k đến giá trị trung bình :
- Các đường cong xác suất tích lũy và các tham số ngưỡng Thurstone :Như đã nói ở trên, trong PCM, các tham số không phản ánh độ khó đểđạt các hạng điểm Đối với các câu hỏi PCM, để đạt được hạng điểm 2 nói
Ngưỡng Thurstone đối với một hạng điểm được xác định như là năng lực
để từ đó xác suất để có được hạng điểm đó hoặc cao hơn đạt giá trị
0,5
5 Mô hình định giá từng phần tổng quát
Việc lập luận để đưa ra mô hình PCM hoàn toàn xuất phát từ mô hìnhRarch cho câu hỏi nhị phân, tức là chỉ quan tâm đến độ khó của câu hỏi, khôngxét đến độ phân biệt Một số tác giả mong muốn xây dựng mô hình đa phân có sử
dụng cả độ phân biệt của câu hỏi Yen, W.M[29] và Muraki, E.[26] đã đưa ra môhình định giá từng phần tổng quát, trong đó ngoài tham số phản ánh độ khó của
câu hỏi còn sử dụng cả tham số phản ánh độ phân biệt Biểu thức tổng quát vềxác suất ứng đáp câu hỏi đa phân cho mô hình định giá từng phần tổng quát(GPCM) có dạng như sau:
Pih θ = exp Z h ik θ
l=1
k-1 l
exp Z
ik θ k-1
28
Thang Long University Libraty
Trang 30trong đó mi là số lượng hạng điểm của câu hỏi GPCM thứ i; Zik= aik( - - b i +ik),với ai đặc trưng cho độ phân biệt, được gọi là tham số độ dốc ( slope
parameter),
i được gọi là tham số định vị câu hỏi (item location), còn ik được gọi là tham sốngưỡng của hạng điểm (category threshold)
6 Giới thiệu phần mềm CONQUEST
Phần mềm CONQUEST là phần mềm của Austrailian Council of
Educational Research – ACER, do Margaret L.Wu, Raymond J.Adams viết
CONQUEST là phần mềm được xây dựng theo IRT với mô hình Rasch đa chiềutổng quát Trong trường hợp một chiều CONQUEST cho phép phân tích cả môhình Rasch đơn giản và mô hình PCM, trong đó mô hình trước là một trường hợp
riêng của mô hình sau
Kết luận chương
Như vậy với sự phát triển của khoa học về đo lường trong giáo dục có thểthấy có sự hội tụ của hai phương pháp trắc nghiệm khách quan và tự luận, hoặc
mô hình nhị phân và đa phân: mô hình nhị phân là một trường hợp riêng của mô
hình đa phân Mô hình định giá từng phần là một mô hình kết hợp tốt hai
phương pháp đánh giá đó Ngoài ra, CONQUEST là phần mềm hỗ trợ áp dụngkết hợp hai phương pháp đánh giá nói trên trong thực
tiễn
29
Trang 31Chương 2 XÂY DỰNG VÀ TRIỂN KHAI MỘT ĐÁNH GIÁ
TIÊU CHUẨN HÓA
Bất kỳ một quá trình giáo dục nào tác động lên một con người cũng nhằmtạo ra những biến đổi nhất định trong con người đó Muốn biết những biến đổixảy ra ở mức độ nào, phải đánh giá hành vi của người đó trong một tình huốngnhất định Sự đánh giá cho phép chúng ta xác định, một là mục tiêu giáo dục đặt
ra có phù hợp không và có đạt được hay không, hai là việc giảng dạy có hiệu quả
hay không, người học có tiến bộ hay không Như vậy, đánh giá phải được xem là
một khâu quan trọng và một bộ phận hợp thành quá trình giáo dục – đào tạo.Không có đánh giá thì không thể biết việc học và việc dạy xảy ra như thế nào,thậm chí có thực sự xảy ra không, và kết quả đạt được như thế
nào
1 Hai loại hình đánh giá cơ bản trong hệ thống giáo dục
1.1 Đánh giá tiêu chuẩn hóa quy mô lớn
Đánh giá tiêu chuẩn hóa quy mô lớn là loại hình đánh giá mà mục tiêuđánh giá, công cụ đánh giá và quá trình đánh giá được thiết kế công phu theo các
tiêu chuẩn xác định, thường triển khai trên một số đông người được đánh giá(chúng ta quy ước gọi chung là thí sinh) Đánh giá tiêu chuẩn hóa thường đượcxây dựng dựa trên nội dung và mục tiêu giáo dục đối với môn học hay chươngtrình học của cả nước hay của một vùng nào đó, thường do các chuyên gia trắcnghiệm soạn thảo, được thử nghiệm và phân tích công phu để xác định tham số
đặc trưng của từng câu hỏi và chỉnh sửa hoàn thiện các câu hỏi Các đề kiểm tra
tiêu chuẩn hóa được thiết kế theo phân bố nội dung và mục tiêu học tập cụ thểcần đo lường, và cả đặc trưng thống kê của từng câu hỏi Đánh giá tiêu chuẩn hóa
quy mô lớn có mục tiêu tìm hiểu chính xác đối tượng được đánh giá (các cá nhân
hoặc các nhóm người) về một năng lực tách biệt nào đó tương đối ổn
định
30
Thang Long University Libraty
Trang 32theo thời gian, phân loại đối tượng được đánh giá nhằm đưa ra các phán quyếtliên quan đến từng đối tượng đánh giá hoặc các quyết định về chính sách cho hệ
thống giáo dục Nói cách khác đánh giá tiêu chuẩn hóa quy mô lớn nhằm đảmbảo duy trì các tiêu chuẩn cao của mục tiêu giáo dục Thiết kế và phân tích kếtquả các đánh giá tiêu chuẩn hóa quy mô lớn thường do các chuyên gia về đánhgiá trong giáo dục đảm nhiệm Việc sử dụng kết quả đánh giá này thường ở nhiều
cấp độ khác nhau, mà trước hết là bởi những người hoạch định chính sách giáodục, chứ không phải bởi những người trực tiếp triển khai đánh giá Đánh giá tiêu
chuẩn hóa quy mô lớn thường tập trung vào một số lĩnh vực mục tiêu giáo dụcxác định, và khi tiến hành đánh giá cũng không thể sử dụng nhiều loại phươngpháp phong phú đa dạng, vì người thiết kế phải xét đến tính khả thi và giá thành
của việc đánh giá
Quy mô và địa bàn của đánh giá tiêu chuẩn hóa quy mô lớn có thể khácnhau: quốc tế, quốc gia, địa phương hoặc thậm chí trong một trường
học
1.2 Đánh giá ở lớp học
Đánh giá ở lớp học là loại hình đánh giá mà mục tiêu quan trọng nhất làkiểm tra và hướng dẫn việc học tập, được sử dụng thường xuyên trong quá trình
dạy và học Đánh giá ở lớp học thường được triển khai trên đối tượng không quá
đông nên có thể sử dụng nhiều phương pháp phong phú, đa dạng: đối thoại tạichỗ giữa người dạy và người học; ra các bài làm ngắn gọn để học sinh làm ngaytại lớp; giao các bài tập hoặc nhiệm vụ để người học thực hiện ở nhà; quan sátngười học khi thao tác thực nghiệm hoặc khi họ thảo luận với nhau; xem xét các
hoạt động của người học qua hoạt động thực tập thực tế;… Việc thiết kế và triển
khai trực tiếp đánh giá ở lớp học thường do người dạy và phần nào do người học;
còn việc phân tích, xử lý kết quả và sử dụng kết quả cũng chủ yếu bởi người dạy
2 Đánh giá trong tiến trình (FOR learning) và đánh giá tổng kết (OF
Trong giảng dạy ở nhà trường các đánh giá trong tiến trình thường gắn chặt vớigiáo viên, mục tiêu học tập cụ thể cần đánh giá tùy giáo viên quy
định
2.2 Đánh giá tổng kết
Đánh giá tổng kết nhằm tổng kết những gì người học đạt được, xếp loạingười học, lựa chọn người học thích hợp để tiếp tục đào tạo hoặc sử dụng trongtương lai, phán xét hiệu quả của khóa học và việc giảng dạy của giáo viên, đề ra
mục tiêu tương lai cho người học Kết quả của đánh giá tổng kết thường được sử
dụng để giải trình cho các phía liên quan: người học, phụ huynh, các cấp quản lý
giáo dục Trong giảng dạy ở nhà trường các đánh giá tổng kết thường bám sátvào mục tiêu học tập đã được đề ra trong chương trình giáo dục, và việc đánh giá
thường tách khỏi giáo viên Các đánh giá tổng kết quan trọng, cuối kỳ học haynăm học, được triển khai trong phạm vi nhiều lớp nên xây dựng theo kiểu đánhgiá tiêu chuẩn hóa
3 Các công đoạn xây dựng và triển khai đánh giá tiêu chuẩn hóa
3.1 Xây dựng bảng đặc trưng nội dung/mục tiêu
Bảng đặc trưng của đề kiểm tra được biểu diễn tổng quát ở Bảng 2.1 Bảng
đặc trưng có các dòng là các phần nội dung, còn các cột là các mục tiêu học tập
cụ thể cần đánh giá Mỗi ô của bảng đặc trưng được ghi bằng các con số chỉ rõ số
câu hỏi (nếu là đề trắc nghiệm khách quan) hoặc điểm số (nếu là đề tự luận) được
phân bố tùy theo mức độ quan trọng của nội dung và mục tiêu học tập tương ứng
với từng ô
32
Thang Long University Libraty
Trang 34Bảng 2.1.Bảng đặc trưng của đề kiểm traMục tiêu học
tập cụ thể Mục tiêu học
tập 1Nội dung
3.2 Viết các câu hỏi
Phân công giáo viên mỗi người chế tác một số câu hỏi theo các yêu cầugắn với các ô ma trận kiến thức, tùy theo sở trường của từng người , sao cho tổng
số câu hỏi chế tác sẽ phủ kín ma trận Việc chế câu hỏi trắc nghiệm của mỗi cánhân là một quá trình lao động rất công phu, tỉ mỉ, người chế tác phải đọc đi, đọc
lại và chỉnh sửa nhiều lần
Trao đổi các câu hỏi trong nhóm đồng nghiệp Kinh nghiệm cho thấy việctrao đổi này rất quan trọng, giúp người chế tác thấy được nhiều sai sót mà bảnthân không tự phát hiện được vì những đường mòn trong suy
nghĩ
Tổ chức đọc duyệt, biên tập và đưa các câu hỏi lưu vào các kho dữ liệutrong máy tính Phải chọn người đọc duyệt là người vừa nắm vững chuyên môncủa môn học và tương đối thành thạo trong việc chế tác câu hỏi trắc nghiệm Khi
phát hiện sai sót về chuyên môn hoặc về quy tắc chế tác câu hỏi trắc nghiệm,người đọc duyệt trao đổi lại với tác giả để tác giả chỉnh sửa Cuối bước này sẽ thu
được một tập hợp các câu hỏi trắc nghiệm đã được chỉnh sửa công phu lưu trong
33
Mục tiêu họctập 2
Mục tiêu họctập …
Mục tiêu họctập n
máy tính Tuy nhiên, đó chưa phải là ngân hàng câu hỏi vì các câu hỏi chưa được
thử nghiệm để xác định tham số
3.3 Thử nghiệm các câu hỏi
Lập các đề kiểm tra thử và tổ chức trắc nghiệm thử trên các nhóm thí sinh
đại diện cho tổng thể đối tượng sẽ được kiểm tra Các đề kiểm tra thử thườngtương đối ngắn, cần đảm bảo thời gian đủ cho thí sinh hoàn
thành
3.4 Phân tích kết quả thử nghiệm và tu chỉnh câu hỏi
Chấm và phân tích thống kê các kết quả trắc nghiệm thử để định cỡ cáccâu hỏi Việc sử dụng công nghệ trắc nghiệm nào, cổ điển hay hiện đại, để phân
tích kết quả định cỡ câu hỏi sẽ được thể hiện ở khâu này Quá trình phân tích,thống kê và định cỡ câu hỏi trắc nghiệm sẽ cho hai loại kết quả: một là cung cấp
tham số của câu hỏi trắc nghiệm, hai là phát hiện các câu hỏi có chất lượng kém
Xử lý các câu hỏi có chất lượng kém: hoặc là sửa đổi tu chỉnh, hoặc là loại
bỏ nếu chất lượng kém không thể sửa đổi được Các câu hỏi được tu chỉnh xonglại được đưa vào kho lưu trữ Qua bước này một ngân hàng câu hỏi bắt đầu hình
thành Việc tổ chức trắc nghiệm thử và chỉnh sửa các câu hỏi trắc nghiệm có thể
tổ chức rất nhiều lần, qua mỗi một lần một số câu hỏi trong ngân hàng câu hỏiđược chỉnh sửa, hoàn thiện và ngân hàng câu hỏi được bổ
sung
3.5 Lập đề chính thức, triển khai đánh giá
Khi đã yên tâm về số lượng và chất lượng các loại câu hỏi trong ngân hàng
câu hỏi có thể thiết kế các đề kiểm tra cho các kỳ thi chính thức Cấu trúc củamột đề kiểm tra chính thức phải được thể hiện bằng một ma trận kiến thức tương
ứng Tính chất của một đề kiểm tra chính thức phải phụ thuộc vào mục tiêu của
kỳ thi: Lập đề kiểm tra theo chuẩn hay theo tiêu chí, cần đo lường chính xác dải
năng lực như thế nào … Có thể thiết kế một đề kiểm tra cung cấp kết quả đo ứng
với một hàm thông tin hay một đường đặc trưng đề trắc nghiệm thích hợp Cũng
như ở khâu phân tích kết quả kiểm tra, chính khâu thiết kế đề kiểm tra này thểhiện lý thuyết trắc nghiệm nào, CTT hay IRT
34
Thang Long University Libraty
Trang 36Đối với một đề kiểm tra tiêu chuẩn hóa, trước khi sử dụng đại trà cần xâydựng một nhóm chuẩn mực và thử nghiệm đề kiểm tra trên nhóm chuẩn mực đó.
Phân tích kết quả kiểm tra và xây dựng bảng mô tả các đặc trưng của nhómchuẩn mực
Khi xây dựng được đề tiêu chuẩn hóa đạt yêu cầu mong muốn, kiểm trachính thức được triển khai Sau khi kiểm tra chính thức cũng tiến hành phân tích
kết quả như ở kiểm tra thử Quá trình này nhằm hai mục tiêu Một là thu các kết
quả của kỳ thi, các điểm đánh giá năng lực của từng thí sinh, mục tiêu quan trọng
hàng đầu của kỳ thi Hai là tiếp tục phát hiện các câu hỏi để tu chỉnh và tiếp tục
đưa vào ngân hàng câu hỏi, thậm chí nếu có một vài câu quá xấu thì có thể loại
chúng ra khỏi số liệu chấm điểm chính thức Việc sử dụng các điểm thô (theotổng các câu hỏi tả lời đúng) hoặc chuyển đổi tham số năng lực sang các thamđiểm mong muốn được thực hiện theo các quy tắc của lý thuyết trắc nghiệmtương ứng
3.6 Công bố kết quả, đánh giá đề để rút kinh nghiệm
- Điểm được công bố cho TS trong một kỳ đánh giá tiêu chuẩn hóa thường
là điểm năng lực θ chứ không phải điểm thô, vì đánh giá tiêu chuẩn hóa cần cómức độ chính xác cao Từ điểm θ (giả sử có phân bố chuẩn với giá trị trung bình
và độ lệch tiêu chuẩn σ) có thể chuyển sang một thang điểm tùy ý nhờ phép
có độ phân biệt âm thì loại câu đó không tính điểm cho thí
sinh
36
Thang Long University Libraty
Trang 38Chương 3 THỰC HÀNH ĐÁNH GIÁ MÔN TOÁN HỌC KỲ 1 LỚP 8
BẰNG ĐỀ KIỂM TRA HỖN HỢP TRẮC NGHIỆM VÀ TỰ LUẬN
Để đánh giá được học sinh sau mỗi một đơn vị kiến thức, sau một chương,
một học kỳ hay một năm học, một cấp học… thì cần phải xây dựng một đề kiểm
tra được bao trùm toàn bộ kiến thức theo mục tiêu đánh giá đề
ra
1 Giới thiệu chương trình toán lớp 8
1.1 Phần đại số:
Chương trình đại số lớp 8 gồm 4 chương:
- Chương 1: Phép nhân và phép chia đa thức bao gồm các nội dung kiếnthức: hằng đẳng thức đáng nhớ; các phương pháp phân tích đa thức thành nhân
tử; chia đa thức
- Chương 2: Phân thức đại số bao gồm các nội dung kiến thức: Phân thức,tính chất cơ bản, rút gọn phân thức; các phép tính về phân thức; biến đổi đồngnhất các biểu thức hữu tỷ
- Chương 3: Phương trình bậc nhất một ẩn bao gồm các nội dung kiếnthức: Khái niệm về phương trình; phương trình bậc nhất một ẩn; phương trìnhtích; phương trình chứa ẩn ở mẫu; toán bậc nhất một
ẩn
- Chương 4: Bất phương trình bậc nhất một ẩn bao gồm các nội dung kiếnthức: Liên hệ giữa thứa tự và phép cộng, phép nhân; bất phương trình bậc nhấtmột ẩn; phương trình chứa ẩn trong dấu giá trị tuyệt
- Chương 2: Đa giác Diện tích đa giác bao gồm các nội dung kiến thức: Đa
giác; đa giác đều; diện tích hình chữ nhật; diện tích tam giác; diện tích hìnhthang; diện tích hình thoi; diện tích đa giác
- Chương 3: Tam giác đồng dạng bao gồm các nội dung kiến thức: Định lý
Ta lét trong tam giác; định lý đảo và hệ quả của định lý Ta lét; tính chất
đươnggf
phân giác của một tam giác; khái niệm tam giác đồng dạng; các trường hợp đồng
dạng của tam giác thường, tam giác vuông
- Chương 4: Hình lăng trụ đứng – hình chóp đều bao gồm các nội dungkiến thức: Hình hộp chữ nhật; diện tích xung quanh và thể tích của hình hộp chữ
nhật; hình lăng trụ đứng; diện tích xung quanh và thể tích của hình lăng trụ đứng;
hình chóp đều và hình chóp cụt đều; diện tích xung quanh hình chóp đều; thể tích
hình chóp đều
2 Đánh giá thí sinh
Nhóm thí sinh được đánh giá là nhóm thí sinh đại trà gồm toàn bộ 7 lớphọc sinh khối 8 trường Trung học cơ sở Lê Chân quận Lê Chân thành phố HảiPhòng Mục tiêu đánh giá là năng lực toán của học sinh đạt được sau học kỳ 1.Công cụ đánh giá được chọn là một đề kiểm tra phối hợp bao gồm cả trắc nghiệm
và tự luận trong thời gian 90 phút, bao trùm các nội dung kiến thức của học kỳ 1
là chương 1 và chương 2 cả hình học và đại số vì thời điểm học sinh được khảosát năng lực qua bài kiểm tra này mới học xong kiến thức toán của học kỳ 1 lớp8
3 Xây dựng bảng đặc trưng câu hỏi cho đề kiểm tra dự kiến bao gồm câu
hỏi tự luận và trắc nghiệm
38
Thang Long University Libraty
Trang 403.1 Xây dựng bảng đặc trưng nội dung/mục tiêu cho phần câu hỏi trắcnghiệm
Bảng 3.3.1.Bảng đặc trưng nội dung/mục tiêu cho đề kiểm tra trắcnghiệm (TN) toán lớp 8 học kỳ năm học 2014-2015
12
7
330
Vận dụng