Kiểmtratiêuchuẩnhóatrongkỳthitheotiêuchuẩnsat Có ý kiến cho rằng thử nghiệm được tiêuchuẩnhóa và ảnh hưởng của nó và thử nghiệm tiêuchuẩnhóa và chính sách công được sáp nhập vào bài viết này. ( Thảo luận ) đề xuất kể từ tháng Hai năm 2011. Thanh niên ở Ba Lan ngồi để kỳthi Matura . Các Matura là tiêuchuẩn để các trường đại học có thể dễ dàng so sánh kết quả từ các sinh viên trên toàn quốc. Bất kỳ thử nghiệm, trong đó cùng một thử nghiệm được đưa ra theo cách tương tự cho tất cả các thí sinh là một thử nghiệm tiêuchuẩn hóa. Kiểmtratiêuchuẩnhóa không cần phải là cao cổ phần kiểmtra , kiểmtra giới hạn thời gian, hoặc kiểmtra trắc nghiệm .Đối diện của một bài kiểmtratiêuchuẩnhóa là một thử nghiệm không chuẩn . Kiểmtra không được tiêuchuẩnhóa cho các bài kiểmtra khác nhau đáng kể để thí sinh khác nhau, hoặc cung cấp cho các thử nghiệm cùng một trong các điều kiện khác nhau đáng kể (ví dụ, một nhóm được cho phép thời gian ít để hoàn thành các bài kiểmtra hơn so với nhóm tiếp theo), hoặc đánh giá họ khác nhau (ví dụ, cùng một câu trả lời đúng được tính cho một học sinh, nhưng sai cho học sinh khác). Kiểmtratiêuchuẩnhóa được coi như là công bằng hơn so với các bài kiểmtra không được tiêuchuẩn hóa. Tính nhất quán cũng cho phép so sánh các kết quả đáng tin cậy hơn trên tất cả các thí sinh. Lịch sử Trung Quốc Bài viết chính: kiểmtra Imperial Bằng chứng sớm nhất của thử nghiệm tiêuchuẩn là trong Trung Quốc , [ 1 ] , nơi thi của triều đình bao phủ Sáu Nghệ thuật bao gồm âm nhạc, bắn cung và cưỡi ngựa, số học, viết, và kiến thức về các nghi thức và nghi lễ của cả hai phần công cộng và tư nhân. Sau đó, các phần về chiến lược quân sự, pháp luật dân sự, doanh thu và thuế, nông nghiệp và địa lý đã được thêm vào thử nghiệm. Trong hình thức này, các kỳthi đã được thể chế hóatrong hơn một thiên niên kỷ. Anh Thử nghiệm tiêuchuẩn được đưa vào châu Âu trong những năm đầu thế kỷ 19, theo mô hình Trung Quốc quan kiểm tra, [ 2 ] thông qua sự vận động của chính quyền thực dân Anh, hầu hết các "dai dẳng" trong số đó là lãnh sự của Anh trong Quảng Châu , Trung Quốc , Thomas Taylor Meadows. [ 2 ] Meadows đã cảnh báo về sự sụp đổ của Đế chế Anh nếu thử nghiệm tiêuchuẩnhóa không được thực hiện trong suốt đế chế ngay lập tức. [ 2 ] Trước khi nhận con nuôi, thử nghiệm tiêuchuẩn không phải là truyền thống là một phần của phương pháp sư phạm phương Tây, dựa trên truyền thống hoài nghi và mở cuộc tranh luận thừa hưởng từ Hy Lạp cổ đại, học viện phương Tây ủng hộ đánh giá không chuẩn bằng cách sử dụng các bài tiểu luận bằng văn bản của học sinh. Đó là bởi vì điều này mà việc thực hiện châu Âu đầu tiên của thử nghiệm tiêuchuẩn đã không xảy ra ở châu Âu thích hợp, nhưng trong Ấn Độ thuộc Anh . [ 3 ] Lấy cảm hứng từ Trung Quốc sử dụng thử nghiệm tiêu chuẩn, trong những năm đầu thế kỷ 19, các nhà quản lý người Anh "công ty thuê và phát huy nhân viên dựa trên các kỳthi cạnh tranh để ngăn chặn tham nhũng và thiên vị. " [ 3 ] Điều này thực tế thử nghiệm tiêuchuẩnhóa sau đó được thông qua vào cuối thế kỷ 19 bởi các lục địa của Anh. Các cuộc tranh luận của quốc hội mà xảy ra sau đó khiến nhiều tài liệu tham khảo để "hệ thống quan Trung Quốc". [ 2 ] Đó là từ Anh, mà tiêuchuẩn xét nghiệm lây lan, không chỉ ở khắp các bang của Anh , nhưng đến châu Âu và sau đó Mỹ. [ 2 ] lây lan của nó đã được thúc đẩy bởi sự cách mạng công nghiệp .Với số lượng lớn các học sinh trung học trong và sau khi cuộc cách mạng công nghiệp , khi giáo dục bắt buộc luật tăng số học sinh, đánh giá mở của tất cả học sinh giảm. Hơn nữa, việc thiếu một quy trình chuẩn giới thiệu một nguồn đáng kể của sai số đo, như học sinh lớp có thể cho thấy sự thiên vị hoặc có thể không đồng ý với nhau về giá trị tương đối của các câu trả lời khác nhau. Gần đây, nó đã được định hình trong một phần bởi sự dễ dàng và chi phí thấp của phân loại kiểmtra trắc nghiệm bằng máy tính. Phân loại các bài tiểu luận bằng máy tính là khó khăn hơn, nhưng cũng được thực hiện. Trong những trường hợp khác, các bài tiểu luận và phản ứng mở khác được phân loại theo một đánh giá xác định trước phiếu đánh giá của học sinh lớp đào tạo. HoaKỳ Thông tin chi tiết: Danh sách các bài kiểmtratiêuchuẩn ở Mỹ Việc sử dụng các thử nghiệm tiêuchuẩn tại HoaKỳ là một hiện tượng của thế kỷ 20 với nguồn gốc của nó trong Thế chiến I và Quân đội Alpha và Beta thử nghiệm được phát triển bởi Robert Yerkes và đồng nghiệp. [ 4 ] Tại Hoa Kỳ, sự cần thiết của chính phủ liên bang để so sánh có ý nghĩa trên một (kiểm soát tại địa phương) hệ thống giáo dục công cộng cao de-tập trung cũng đã góp phần vào cuộc tranh luận về thử nghiệm tiêu chuẩn, bao gồm Đạo luật Tiểu học và Trung học phổ thông năm 1965 với yêu cầu tiêuchuẩnhóakiểmtratrong các trường công. Mỹ Công Luật 107-110, được gọi là No Child Left Behind Act năm 2001, mối quan hệ tiếp tục tài trợ các trường công lập để thử nghiệm tiêu chuẩn. Thiết kế và chấm điểm Một số thử nghiệm tiêuchuẩn sử dụng kiểmtra trắc nghiệm, tương đối rẻ tiền để ghi bàn, nhưng bất kỳ hình thức đánh giá có thể được sử dụng. Thử nghiệm tiêuchuẩn có thể bao gồm câu hỏi trắc nghiệm, câu hỏi đúng-sai, câu hỏi tiểu luận, đánh giá xác thực , hoặc gần như bất cứ một sự đánh giá. Nhiều lựa chọn và đúng-sai mục thường được chọn vì chúng có thể được đưa ra và ghi bàn không tốn kém và nhanh chóng bằng cách ghi tờ câu trả lời đặc biệt của máy tính hoặc qua kiểmtra máy tính thích nghi . Một số xét nghiệm tiêuchuẩn có câu trả lời ngắn hoặc bài luận thành phần văn bản được gán một số điểm đánh giá độc lập bởi người sử dụng chữ đỏ (quy định hoặc hướng dẫn) và các giấy tờ chuẩn (ví dụ giấy tờ cho mỗi điểm có thể) để xác định các lớp được trao cho một phản ứng. Hầu hết các đánh giá, tuy nhiên, không ghi được bởi những người, những người được sử dụng để vật phẩm không thể được ghi dễ dàng bằng máy tính (ví dụ, các bài tiểu luận) ghi bàn. Ví dụ, thi Graduate Record là một đánh giá máy tính thích nghi mà không cần điểm bởi những người (trừ phần văn bản). [ 5 ] Vấn đề điểm Điểm con người thường có thể thay đổi, đó là lý do tại sao máy tính chấm điểm được ưa thích khi có thể. Ví dụ, một số người tin rằng nhân viên được trả lương sẽ ghi các bài kiểmtra nặng. [ 6 ] Hiệp định giữa cầu thủ ghi bàn có thể thay đổi từ 60 đến 85 phần trăm, tùy thuộc vào các bài kiểmtra và các phiên ghi bàn. Đôi khi tiểu bang trả tiền để có hai hoặc nhiều cầu thủ ghi bàn đọc từng bài;. Nếu điểm số của họ không đồng ý, sau đó giấy được truyền cho cầu thủ ghi bàn thêm [ 6 ] Các thành phần mở-kết thúc các bài kiểmtra thường chỉ một phần nhỏ của thử nghiệm. Phổ biến nhất là một thử nghiệm quan trọng bao gồm cả phần máy tính ghi con người ghi bàn và. Các xét nghiệm này lớn không đánh giá khả năng tổng thể của học sinh trong học tập. Điểm Điểm mẫu cho các câu hỏi lịch sử: Điều gì gây ra chiến tranh thế giới II ? Câu trả lời của học sinh Phân loại tiêuchuẩn Phân loại phi tiêuchuẩn Phân loại phiếu đánh giá : Câu trả lời phải được đánh dấu chính xác nếu họ đề cập đến ít nhất một trong những điều sau đây: xâm lược Ba Lan, cuộc xâm lược của Trung Quốc của Nhật Bản, hoặc các vấn đề kinh tế của Đức. Không có tiêuchuẩn phân loại. giáo viên tuy nhiên anh / cô ấy muốn, xem xét các yếu tố như câu trả lời, tiềm năng học tập của học sinh, và thái độ. Sinh viên # 1: Thế chiến II là do Hitler và Đức xâm lược Ba Lan. Giáo viên # 1: Câu trả lời này đề cập đến một trong những mặt hàng cần thiết, vì vậy nó là chính xác. Giáo viên 2: Câu trả lời này là đúng. Giáo viên # 1: Tôi cảm thấy như câu trả lời này là đủ tốt, vì vậy tôi sẽ đánh dấu nó chính xác. viên 2: Câu trả lời này là chính xác, nhưng sinh viên tốt này sẽ có thể làm tốt hơn thế, vì vậy tôi sẽ chỉ cung cấp cho một phần tín dụng. Sinh viên # 2: Thế chiến II đã được gây ra bởi nhiều yếu tố, bao gồm cả cuộc Đại suy thoái và tình hình kinh tế nói chung, sự gia tăng của chủ nghĩa dân tộc, chủ nghĩa phát xít, chủ nghĩa bành trướng đế quốc và, và oán giận chưa được giải quyết liên quan đến Thế chiến I. Cuộc chiến tranh ở châu Âu đã bắt đầu với cuộc xâm lược của Đức Ba Lan. Giáo viên # 1: Câu trả lời này đề cập đến một trong những mặt hàng cần thiết, vì vậy nó là chính xác. Giáo viên 2: Câu trả lời này là đúng. Giáo viên # 1: Tôi cảm thấy như câu trả lời này là chính xác và đầy đủ, vì vậy tôi sẽ cung cấp tín dụng đầy đủ. Giáo viên # 2: Tôi cảm thấy như câu trả lời này là chính xác, vì vậy tôi sẽ cung cấp cho toàn bộ số điểm. Sinh viên # 3: Thế chiến II đã được gây ra bởi các vụ ám sát hoàng tử nước Áo Ferdinand. Giáo viên # 1: Câu trả lời này không đề cập đến bất kỳ các mặt hàng cần thiết. . Không có điểm giáo viên # 2: Câu trả lời này là sai. Không có tín dụng. Giáo viên # 1: Câu trả lời này là sai. Không có điểm. Giáo viên 2: Câu trả lời này là sai, nhưng học sinh này đã rất cố gắng và bản án là đúng ngữ pháp, vì vậy tôi sẽ cung cấp cho một điểm cho nỗ lực. Có hai loại tiêuchuẩn điểm thi giải thích: một tiêuchuẩn tham khảo giải thích điểm hoặc một tiêu chí tham khảogiải thích điểm. • Giải thích điểm chuẩn tham khảo so sánh thí sinh đến một mẫu của các đồng nghiệp . Mục đích là để xếp hạng sinh viên được tốt hơn hoặc tồi tệ hơn các sinh viên khác. Tiêuchuẩn tham khảo cách giải thích số điểm kiểmtra có liên quan đến giáo dục truyền thống . Sinh viên thực hiện tốt hơn so với những người khác vượt qua các kiểm tra, và sinh viên thực hiện tồi tệ hơn những người khác không kiểm tra. • Giải thích số điểm dựa trên tiêuchuẩn so sánh thí sinh một tiêuchuẩn (một định nghĩa chính thức của nội dung), không phụ thuộc vào điểm số của các thí sinh khác. Đây cũng có thể được mô tả như đánh giá dựa trên tiêuchuẩn , khi chúng được liên kết với cáccải cách giáo dục dựa trên tiêuchuẩn phong trào. [ 7 ] giải thích điểm Tiêu chí tham khảo có liên quan duy nhất với có hay không câu trả lời của học sinh đặc biệt này là chính xác và đầy đủ. Trong các hệ thống dựa trên tiêu chuẩn, nó có thể cho tất cả học sinh vượt qua các kiểm tra, hoặc cho tất cả học sinh không kiểm tra. Một trong những hệ thống có thể được sử dụng trong thử nghiệm tiêu chuẩn. Điều quan trọng để thử nghiệm tiêuchuẩn là liệu tất cả học sinh được yêu cầu câu hỏi tương đương, trong trường hợp tương đương, và phân loại bằng nhau. Trong một thử nghiệm tiêuchuẩn hóa, nếu một câu trả lời được đưa ra là chính xác cho một học sinh, nó là chính xác cho tất cả học sinh. Học sinh lớp tôi không chấp nhận một câu trả lời như đủ tốt cho một sinh viên nhưng từ chối câu trả lời tương tự như không đủ cho một sinh viên khác. Tiêuchuẩn Các cân nhắc về giá trị và độ tin cậy thường được xem là yếu tố quan trọng để xác định chất lượng của bất kỳ bài kiểmtrachuẩn hóa. Tuy nhiên, các hội nghề nghiệp và học viên thường xuyên đã đặt những mối quan tâm trong bối cảnh rộng lớn hơn khi phát triển các tiêuchuẩn và làm cho bản án tổng thể về chất lượng của bất kỳ bài kiểmtratiêuchuẩnhóa như một toàn thể trong một bối cảnh nhất định. Tiêuchuẩn đánh giá Trong lĩnh vực đánh giá , và đặc biệt là đánh giá giáo dục , các Uỷ ban Hỗn hợp về tiêuchuẩn đánh giá cho giáo dục [ 8 ] đã công bố ba bộ tiêuchuẩn đánh giá. Các tiêuchuẩn đánh giá nhân sự [ 9 ] được xuất bản năm 1988, Tiêuchuẩn đánh giá Chương trình (2 phiên bản) [ 10 ] được xuất bản vào năm 1994, và Tiêuchuẩn đánh giá sinh viên [ 11 ] được xuất bản vào năm 2003. Mỗi ấn phẩm trình bày và trau chuốt một bộ tiêuchuẩn để sử dụng trong một loạt các môi trường giáo dục. Các tiêuchuẩn hướng dẫn cho việc thiết kế, thực hiện, đánh giá và cải thiện các hình thức xác định đánh giá. Mỗi phòng trong số các tiêuchuẩn đã được đặt trong một trong bốn loại cơ bản để thúc đẩy giáo dục đánh giá thành phần phù hợp, hữu ích, khả thi, và chính xác.Trong các bộ tiêu chuẩn, giá trị và độ tin cậy cân nhắc được bảo hiểm theo chủ đề chính xác. Ví dụ, các tiêuchuẩn chính xác sinh viên giúp đảm bảo rằng các đánh giá sinh viên sẽ cung cấp âm thanh, chính xác và đáng tin cậy thông tin về học tập và thành tích học sinh. Tiêuchuẩn thử nghiệm Trong lĩnh vực psychometrics , các tiêuchuẩn về giáo dục và tâm lý kiểmtra [ 12 ] tiêuchuẩn nơi về tính hợp lệ và độ tin cậy, cùng với các lỗi đo lường và các vấn đề liên quan đến nơi ăn nghỉcủa các cá nhân khuyết tật . Chủ đề lớn thứ ba và cuối cùng bao gồm các tiêuchuẩn liên quan đến các ứng dụng thử nghiệm, Khả năng , cộng với thử nghiệm trong đánh giá chương trình vàchính sách công . Ưu điểm [ sửa ] Một trong những ưu điểm chính của thử nghiệm tiêuchuẩn là kết quả có thể được ghi lại theo kinh nghiệm, vì vậy, các điểm thi có thể được chứng minh là có một mức độ tương đối của giá trịvà độ tin cậy , cũng như kết quả là khái quát và có thể nhân rộng. [ 13 ] Đây là thường tương phản với lớp trên một bảng điểm học, được sự phân công của giáo viên cá nhân. Nó có thể là khó khăn để giải thích cho sự khác biệt về văn hóa giáo dục trên toàn trường, khó khăn của chương trình đào tạo giáo viên cho trước, sự khác biệt trong phong cách giảng dạy, và kỹ thuật và những thành kiến có ảnh hưởng đến xếp hạng. Điều này làm cho các bài kiểmtratiêuchuẩn hữu ích cho mục đích nhập học trong giáo dục đại học, trong đó một trường học đang cố gắng để so sánh sinh viên đến từ khắp các quốc gia hoặc trên toàn thế giới. Một lợi thế là tập hợp. Một thử nghiệm tiêuchuẩnhóa cũng được thiết kế cung cấp một đánh giá của một cá nhân làm chủ của một lĩnh vực kiến thức hoặc kỹ năng mà ở một mức độ của sự kết hợp sẽ cung cấp thông tin hữu ích. Đó là, trong khi đánh giá cá nhân có thể không đủ chính xác cho các mục đích thực tế, điểm trung bình của lớp học, trường học, chi nhánh của một công ty, hoặc các nhóm khác cũng có thể cung cấp thông tin hữu ích vì giảm lỗi thực hiện bằng cách tăng kích thước mẫu. Kiểmtratiêu chuẩn, mà theo định nghĩa cho tất cả các thí sinh cùng một thử nghiệm trong cùng điều kiện (hoặc hợp lý bằng nhau), cũng được xem như là công bằng hơn so với đánh giá có sử dụng câu hỏi khác nhau hoặc các điều kiện khác nhau cho sinh viên theo chủng tộc, tình trạng kinh tế xã hội, hoặc cân nhắc khác. Nhược điểm và phê bình "Bài kiểmtratiêuchuẩnhóa không thể đo lường chủ động, sáng tạo, trí tưởng tượng, tư duy khái niệm, sự tò mò, nỗ lực, sự mỉa mai, sự phán xét, cam kết, sắc thái, thiện chí, phản ánh đạo đức, hoặc một loạt các khuynh hướng khác có giá trị và các thuộc tính. Những gì họ có thể đo đếm là những kỹ năng bị cô lập, sự kiện và chức năng cụ thể, nội dung kiến thức, ít nhất là thú vị và các khía cạnh quan trọng nhất của việc học tập. " - Bill Ayers [ 14 ] Kiểmtratiêuchuẩnhóa là những công cụ hữu ích để đánh giá thành tích học sinh, và có thể được sử dụng để tập trung hướng dẫn về kết quả mong muốn, chẳng hạn như kỹ năng đọc và toán. [ 15 ] Tuy nhiên, các nhà phê bình cảm thấy rằng sử dụng quá nhiều và lạm dụng các xét nghiệm tác hại giảng dạy và học tập bằng cách thu hẹp chương trình giảng dạy . Theo nhómFairTest , khi kiểmtratiêuchuẩnhóa là yếu tố chính trong trách nhiệm, trường học sử dụng các xét nghiệm để xác định chương trình giảng dạy trong gang tấc và hướng dẫn tập trung.FairTest nói rằng hậu quả tiêu cực của việc lạm dụng xét nghiệm bao gồm thu hẹp chương trình giảng dạy, giảng dạy để thử nghiệm, thúc đẩy học sinh ra khỏi trường học, giáo viên lái xe ra khỏi nghề nghiệp, và phá hoại sự tham gia của sinh viên và khí hậu học. Những người chỉ trích nói rằng " dạy để kiểmtra "disfavors học tập bậc cao. Mặc dù có thể sử dụng một bài kiểmtratiêuchuẩnhóa mà không cho phép nội dung của nó xác định chương trình đào tạo và giảng dạy, thường xuyên, những gì không được thử nghiệm không được dạy, và làm thế nào vấn đề này được kiểmtra thường xuyên sẽ trở thành một mô hình cho cách dạy chủ đề này. Sử dụng không phê phán của điểm thitiêuchuẩn để đánh giá giáo viên và học hiệu suất là không phù hợp, bởi vì học sinh điểm bị ảnh hưởng bởi ba điều: những gì học sinh học ở trường, những gì học sinh học bên ngoài trường học, và các sinh viên 'bẩm sinh thông minh . [ 16 ] Các trường chỉ có quyền kiểm soát một trong ba yếu tố này. giá trị gia tăng mô hình đã được đề xuất để đối phó với những lời chỉ trích này bằng cách kiểm soát thống kê cho khả năng bẩm sinh và out-of-học yếu tố hoàn cảnh. [ 17 ] Trong một hệ thống giá trị gia tăng của việc giải thích thử nghiệm điểm, các nhà phân tích ước tính một số điểm dự kiến cho mỗi học sinh, dựa trên các yếu tố như điểm số của học sinh riêng trước kiểm tra, ngôn ngữ chính, hoặc tình trạng kinh tế xã hội. Sự khác biệt giữa số dự kiến của học sinh và điểm số thực tế được coi là chủ yếu là do những nỗ lực của giáo viên. Ủng hộ thử nghiệm tiêuchuẩntrả lời rằng đây không phải là lý do để từ bỏ thử nghiệm tiêuchuẩn ủng hộ của một trong hai kiểmtra không chuẩn hoặc không đánh giá ở tất cả, nhưng thay vì chỉ trích chế độ thử nghiệm được thiết kế kém. Họ cho rằng thử nghiệm không và nên tập trung nguồn lực giáo dục về các khía cạnh quan trọng nhất của giáo dục - truyền đạt một bộ được xác định trước về kiến thức và kỹ năng - và các khía cạnh khác hoặc là ít quan trọng, hoặc cần được bổ sung vào chương trình thử nghiệm. Trong cuốn sách của mình, Bây giờ bạn thấy nó , Cathy Davidson chỉ trích bài kiểmtrachuẩn hóa. Bà mô tả trẻ của chúng ta là "trẻ em dây chuyền lắp ráp trên một mô hình dây chuyền lắp ráp," có nghĩa là việc sử dụng các bài kiểmtratiêuchuẩnhóa như một phần của một mô hình giáo dục một kích cỡ phù hợp cho tất cả. Cô cũng chỉ trích chật hẹp của kỹ năng đang được thử nghiệm và trẻ em ghi nhãn mà không có những kỹ năng như thất bại hoặc là học sinh khuyết tật. [ 18 ] gian lận rộng rãi và tổ chức đã được một nền văn hóa phát triển trong cải cách hiện nay của trường. [ 19 ] Ghi mất thông tin Một câu hỏi kiểmtra có thể yêu cầu một học sinh để tính toán diện tích của một tam giác . So sánh thông tin được cung cấp trong hai câu trả lời này. Diện tích = 7,5 cm 2 Cơ sở = 5 cm; Chiều cao = 3 cm Diện tích = 1 / 2 (Base × Chiều Cao) = 1 / 2 (5 cm x 3 cm) = 7,5 cm 2 Các chương trình đầu tiên ghi được mất thông tin. Giáo viên biết xem học sinh có câu trả lời đúng, nhưng không biết làm thế nào sinh viên đến câu trả lời. Nếu câu trả lời là sai, giáo viên không biết liệu các sinh viên đã đoán, thực hiện một lỗi đơn giản, hoặc về cơ bản hiểu sai chủ đề. Khi thử nghiệm được ghi phải sai , một giả định quan trọng đã được thực hiện về học tập. Số lượng ngay câu trả lời hoặc tổng điểm mục (trong đó tín dụng một phần được đưa ra) được giả định là các biện pháp thích hợp và đầy đủ về tình trạng hoạt động hiện tại. Ngoài ra, một giả định thứ được thực hiện mà không có thông tin có ý nghĩa trong saicâu trả lời. Ở nơi đầu tiên, một câu trả lời chính xác có thể đạt được bằng cách sử dụng ghi nhớ mà không cần bất kỳ sự hiểu biết sâu sắc về nội dung cơ bản hoặc cấu trúc khái niệm của vấn đề đặt ra. Thứ hai, khi có nhiều hơn một bước để giải quyết được yêu cầu, thường có nhiều cách tiếp cận để trả lời đó sẽ dẫn đến một chính xác kết quả. Thực tế là câu trả lời là đúng không chỉ ra của một số thủ tục có thể được sử dụng. Khi học sinh cung cấp câu trả lời (hoặc cho công việc) thông tin này là có sẵn từ các tài liệu ban đầu. Thứ hai, nếu sai câu trả lời là mù đoán, sẽ không có thông tin được tìm thấy trong số những câu trả lời. Mặt khác, nếu sai câu trả lời phản ánh khởi hành giải thích từ một trong những mong đợi, những câu trả lời sẽ hiển thị một mối quan hệ đã ra lệnh cho bất cứ kiểmtra toàn bộ được đo. Khởi hành này nên được phụ thuộc vào mức độ trưởng thành psycholinguistic của học sinh lựa chọn hoặc đưa ra các câu trả lời bằng tiếng bản xứ, trong đó kiểmtra được bằng văn bản. Trong trường hợp thứ hai này chúng ta có thể giải nén theo thứ tự này từ các phản ứng với các bài kiểm tra. [ 20 ] quá trình khai thác như vậy, các mô hình Rasch ví dụ, là tiêuchuẩn cho phát triển sản phẩm giữa các chuyên gia.Tuy nhiên, do sai câu trả lời sẽ bị loại bỏ trong quá trình chấm điểm, cố gắng để giải thích những câu trả lời cho các thông tin mà họ có thể chứa được ít khi thực hiện. Thứ ba, mặc dù điểm thi này dựa trên chủ đề đôi khi được cung cấp, việc thực hành phổ biến hơn là báo cáo tổng số điểm hoặc một phiên bản sửa lại của nó. Rescaling này là nhằm so sánh các điểm đến một tiêuchuẩn của một số loại. Này sụp đổ tiếp theo của kết quả kiểmtra có hệ thống loại bỏ tất cả các thông tin về những sản phẩm riêng biệt đã bị bỏ lỡ. Do đó, ghi được một bài kiểmtra phải sai mất 1) làm thế nào sinh viên đạt được của họ chính xác câu trả lời, 2) những gì khiến họ lạc lối hướng tới câu trả lời không thể chấp nhận và 3), nơi trong cơ thể của các thử nghiệm này khởi hành từ kỳ vọng xảy ra. Bài bình luận này cho thấy rằng các thủ tục ghi bàn hiện tại che giấu sự năng động của quá trình làm bài thi và làm lu mờ khả năng của sinh viên được đánh giá. Thực hành điểm hiện tại oversimplifies những dữ liệu này trong bước điểm ban đầu. Là kết quả của lỗi thủ tục này là để che khuất các thông tin chẩn đoán có thể giúp giáo viên phục vụ học sinh của họ tốt hơn. Nó tiếp tục ngăn cản những người siêng năng chuẩn bị các xét nghiệm từ việc có thể để quan sát các thông tin mà nếu không sẽ thông báo cho họ sự hiện diện của lỗi này. Một giải pháp cho vấn đề này, được gọi là đáp ứng Spectrum Đánh giá (RSE), [ 21 ] hiện đang được phát triển có vẻ có khả năng phục hồi tất cả ba trong số các hình thức mất mát thông tin, trong khi vẫn cung cấp một số quy mô để xác định tình trạng hoạt động hiện tại và để theo dõi sự thay đổi hiệu suất. Cách tiếp cận RSE này cung cấp một giải thích các quá trình suy nghĩ đằng sau mỗi câu trả lời (cả hai bên phải và những cái sai) mà nói với giáo viên làm thế nào họ đã suy nghĩ cho mỗi câu trả lời mà họ cung cấp. [ 22 ] Trong số những phát hiện khác, chương này báo cáo rằng các thông tin thu hồi giải thích giữa hai và ba lần của sự thay đổi thử nghiệm hơn xem xét chỉ câu trả lời đúng. Này mất lớn thông tin có thể được giải thích bởi thực tế là các câu trả lời "sai" được loại bỏ từ các thông tin kiểmtra được thu thập trong quá trình chấm điểm và không còn có sẵn để lộ ra lỗi thủ tục vốn có trong điểm phải sai. Các thủ tục bỏ qua những hạn chế sản xuất bởi sự phụ thuộc tuyến tính vốn có trong dữ liệu thử nghiệm. Kiểmtra thiên vị xảy ra khi một thử nghiệm hệ thống ủng hộ một nhóm khác hơn, mặc dù cả hai nhóm đều bình đẳng về đặc điểm các biện pháp kiểm tra. Những người chỉ trích cáo buộc rằng các nhà sản xuất kiểmtra và hỗ xu hướng đại diện cho một tầng lớp trung lưu, nền trắng. Các nhà phê bình cho rằng thử nghiệm tiêuchuẩn phù hợp với các giá trị, thói quen, và ngôn ngữ của các nhà sản xuất kiểmtra [ cần dẫn nguồn ] . Tuy nhiên, là hầu hết các bài kiểmtra đến từ một màu trắng, tầng lớp trung lưu nền, điều quan trọng cần lưu ý là các nhóm điểm cao nhất không phải là người của nền tảng đó, nhưng thay vì có xu hướng đến từ dân cư châu Á. Không phải tất cả các bài kiểmtra là tốt bằng văn bản, ví dụ, có chứa câu hỏi trắc nghiệm với câu trả lời không rõ ràng, hoặc bảo hiểm nghèo của chương trình mong muốn. Một số xét nghiệm tiêuchuẩn bao gồm các câu hỏi bài luận, và một số người đã chỉ trích hiệu quả của các phương pháp phân loại. Gần đây, chấm điểm trên máy vi tính một phần của bài tiểu luận đã được giới thiệu cho một số xét nghiệm, mà thậm chí còn gây nhiều tranh cãi. [ 23 ] Quyết định giáo dục Điểm thi là trong một số trường hợp sử dụng như một tiêuchuẩn duy nhất, bắt buộc, hoặc chính cho nhập học hoặc giấy chứng nhận. Ví dụ, một số tiểu bang HoaKỳ yêu cầu các kỳthi tốt nghiệp trung học . Điểm số đầy đủ về các kỳthi ra được yêu cầu để tốt nghiệp trung học. Các phát triển giáo dục chung thử nghiệm thường được sử dụng như là một thay thế cho một bằng tốt nghiệp trung học. Các ứng dụng khác bao gồm theo dõi (quyết định một sinh viên phải được ghi danh vào "nhanh" hay "chậm" phiên bản của một khóa học) và trao học bổng. Tại Hoa Kỳ, nhiều trường cao đẳng và đại học tự động dịch điểm trên Advanced Placement kiểmtra vào tín chỉ đại học, đáp ứng yêu cầu tốt nghiệp, hoặc vị trí trong các khóa học nâng cao hơn. Kiểmtra tổng quát như SAT hoặcGRE thường được sử dụng như một biện pháp trong số nhiều, khi đưa ra quyết định nhập học. Một số tổ chức công cộng có điểm cắt cho kỳthi SAT, điểm trung bình , hoặc cấp bậc lớp học, để tạo các lớp của ứng tự động chấp nhận hoặc từ chối. Phụ thuộc nhiều vào các bài kiểmtratiêuchuẩn để ra quyết định là thường gây tranh cãi, vì những lý do đã nói ở trên. Các nhà phê bình thường đề nghị nhấn mạnh các biện pháp tích lũy hoặc thậm chí không số, chẳng hạn như lớp lớp học hoặc đánh giá cá nhân ngắn gọn (viết bằng văn xuôi) từ giáo viên. Người ủng hộ cho rằng điểm thi cung cấp một-rõ ràng, tiêuchuẩn khách quan để giảm thiểu khả năng ảnh hưởng chính trị hay thiên vị. Viện hàn lâm Khoa học khuyến cáo rằng quyết định giáo dục chính không được chỉ dựa trên điểm kiểm tra. [ 24 ] Việc sử dụng tối thiểu cắt điểm cho lối vào hoặc tốt nghiệp không bao hàm một tiêuchuẩn duy nhất, kể từ khi kết quả kiểmtra gần như luôn luôn kết hợp với tối thiểu khác các tiêu chí như số lượng các khoản tín dụng, các khóa học điều kiện tiên quyết, tham dự, vv điểm kiểmtra thường được coi là "tiêu chuẩn duy nhất" đơn giản chỉ vì họ là những khó khăn nhất, hoặc việc thực hiện các tiêuchuẩn khác được tự động giả định. Một ngoại lệ cho quy tắc này làGED , đã cho phép nhiều người có kỹ năng của họ được công nhận mặc dù họ không đáp ứng được các tiêu chí truyền thống .