Theo [3], trên thế giới việc học và thi diễn ra hàng nghìn năm trƣớc đây (ở Trung Quốc từ khoảng năm 2000 TCN), nhƣng một khoa học đo lƣờng trong giáo dục thật sự có thể xem nhƣ bắt đầu cách đây chỉ khoảng một thế kỷ. Ở châu Âu và đặc biệt là Mỹ lĩnh vực khoa học này phát triển mạnh vào thời kỳ từ trƣớc và sau thế chiến thứ hai với những dấu mốc quan trọng nhƣ Trắc nghiệm trí tuệ Stanford- Binet xuất bản năm 1916, bộ trắc nghiệm thành quả học tập tổng hợp đầu tiên Stanford Achievement Test ra đời vào 1923. Với việc đƣa vào chấm trắc nghiệm bằng máy của IBM năm 1935, việc thành lập National Council on Measurement in Education (NCME) vào thập niên 1950 và ra đời Educational Testing Services (ETS) năm 1947, một ngành công nghiệp trắc nghiệm (test industry) đã hình thành ở Mỹ. Từ đó đến nay khoa học về đo lƣờng trong tâm lý và giáo dục đã phát triển liên tục, những phê bình chỉ trích đối với khoa học này cũng xuất hiện thƣờng xuyên nhƣng chúng không đánh đổ đƣợc nó mà chỉ làm cho nó tự điều chỉnh và
phát triển mạnh mẽ hơn. Hiện nay ở Mỹ ƣớc tính mỗi năm số lƣợt trắc nghiệm tiêu chuẩn hoá cỡ 1/4 tỷ và trắc nghiệm do giáo viên soạn lên đến con số 5 tỷ. Tƣơng ứng với ngành công nghiệp trắc nghiệm đồ sộ và sự phát triển của công nghệ thông tin, lý thuyết về đo lƣờng trong tâm lý giáo dục cũng phát triển nhanh. Lý thuyết ứng đáp câu hỏi (Item Response Theory-IRT) đã đạt những thành tựu quan trọng nâng cao độ chính xác của trắc nghiệm, và trên cơ sở IRT công nghệ trắc nghiệm thích nghi nhờ máy tính (Computer Adaptive Test – CAT) ra đời. Ngoài ra, trên cơ sở những thành tựu của IRT và ngôn ngữ học máy, công nghệ E-RATE chấm tự động các bài tự luận tiếng Anh nhờ máy tính của ETS đã đƣợc triển khai nhờ mạng Internet trong mấy năm qua.
Theo [3], đề thi cho các kỳ thi tuyển đại học ở một số nƣớc nhƣ Mỹ, Nhật, Thái Lan... đƣợc soạn toàn bộ dựa trên phƣơng thức trắc nghiệm khách quan. Để tuyển sinh đại học, ở Mỹ các trƣờng đại học không tổ chức thi tuyển mà dựa vào kết quả của các kỳ thi trắc nghiệm do các công ty ngoài nhà nƣớc tổ chức để xét tuyển. Có dịch vụ thi phục vụ công việc này, đó là SAT (Scholastic Assesment Test) do công ty ETS tổ chức, và ACT do Chƣơng trình ACT (American College Testing Program) triển khai. SAT cho thi 2 môn, Tiếng Anh và toán, còn ACT cho thi 4 môn, ngoài Tiếng Anh và Toán còn thi thêm đọc hiểu và suy luận khoa học. Cả SAT và ACT thƣờng tổ chức thi mỗi năm 4 lần, cho các học sinh ở những năm cuối bậc phổ thông trung học. Hiện nay hàng năm có khoảng 1,8 triệu thí sinh thi SAT và 1,6 triệu thí sinh thi ACT. Học sinh Mỹ thƣờng gửi đơn dự tuyển đến 5, 6 trƣờng đại học, các trƣờng căn cứ trên điểm SAT (hoặc ACT), điểm trung bình học tập ở phổ thông trung học (GPA) và một số nhân tố khác liên quan đến từng cá nhân (phỏng vấn, hoạt động xã hội, thƣ đề nghị..) để xét tuyển.
Trắc nghiệm cũng đƣợc áp dụng cho các kỳ thi sau đại học. Ở Mỹ, công ty ETS tổ chức các kỳ thi Graduate Record Examination (GRE). GRE gồm trắc nghiệm tổng quát (General Test - GRE GT) về Tiếng Anh, Toán, và khả năng phân tích. Ngoài ra còn các trắc nghiệm môn học (Subject Test - GRE ST) cho 16 môn khác nhau, mỗi môn học có liên quan với lĩnh vực của chƣơng trình sau đại học tƣơng ứng. Ngoài các GRE, đối với chƣơng trình cao học quản trị kinh doanh (MBA) ETS còn tổ chức riêng Chƣơng trình trắc nghiệm tuyển sinh sau đại học về Quản lý (Graduate Management Admision Test - GMAT).
Các kỳ thi trắc nghiệm tiêu chuẩn hoá ở Mỹ đƣợc chuẩn bị rất công phu và khoa học, do đó, tính chính xác và khách quan của chúng khá cao.
Bên cạnh đó, phƣơng thức trắc nghiệm đặc biệt phù hợp cho các hình thức sát hạch lấy chứng chỉ và đƣợc áp dụng rộng rãi trên thế giới. Chẳng hạn, các chứng chỉ TOEFL (Test of English as Foreign Language), ICDL (International Computer Driving Licience), TOEIC (Test of English for International Communication), IELTS ... đều đƣợc tổ chức thông qua phƣơng thức thi trắc nghiệm.