6. Kết cấu của luận văn
1.3 Tỏc động của giỏo dục đến sự tham gia lao động của cỏ nhõn
1.3.1 Đo lường giỏo dục
Đo lường giỏo dục là một nhỏnh khoa học sử dụng việc đỏnh giỏ và phõn tớch số liệu đỏnh giỏ trong giỏo dục để suy ra năng lực, trỡnh độ của người được đỏnh giỏ (thớ sinh).
Việc học và thi trờn thế giới đó diễn ra hàng nghỡn năm trước đõy, nhưng khoa học về đo lường trong giỏo dục thật sự cú thể xem như bắt đầu cỏch đõy hơn một thế kỷ. Và đến thời điểm hiện nay, cú hai lý thuyết được ỏp dụng trong khoa học đo lường giỏo dục là lý thuyết trắc nghiệm cổ điển (CTT) và lý thuyết trắc nghiệm hiện đại (IRT).
Lý thuyết trắc nghiệm cổ điển (Classical Test Theory, CTT)
Phỏt triển từ khoảng đầu thế kỉ XX cho đến thập niờn 1970, lý thuyết trắc nghiệm Cổ điển (CTT) đạt được nhiều thành tựu, tạo cơ sở khoa học để thiết kế cỏc phộp đo tương đối chớnh xỏc. Nội dung cơ bản của lý thuyết này là nghiờn cứu định lượng tỉ mỉ cỏc cõu hỏi hoặc đề trắc nghiệm dựa vào cỏc tham số đặc trưng như độ khú của cõu hỏi; độ dễ phõn biệt của cõu hỏi; độ tin cậy của đề trắc nghiệm; độ giỏ trị của đề trắc nghiệm. Qua đú đỏnh giỏ một đề trắc nghiệm bằng việc phõn tớch cõu hỏi trắc nghiệm; tớnh độ tớn cậy của đề trắc nghiệm; xem xột giỏ trị của đề trắc nghiệm. Mặt khỏc, lý thuyết cổ điển cũng đưa ra cỏc loại điểm như điểm thụ; điểm tiờu chuẩn tuyệt đối; cỏc loại điểm chuẩn tương đối để đưa ra đỏnh giỏ.
Tuy nhiờn lớ thuyết đú cũn bị nhiều hạn chế. CTT khụng tỏch biệt được cỏc đặc trưng của thớ sinh độc lập với cỏc đặc trưng của đề trắc nghiệm, đặc trưng này chỉ cú thể giải thớch trong mối quan hệ với đặc trưng kia.
khuụn khổ CTT, năng lực được diễn tả bởi điểm của thớ sinh mà một đề trắc nghiệm cụ thể đo được. Khi đề trắc nghiệm “khú”, thớ sinh sẽ thể hiện năng lực thấp; khi đề trắc nghiệm “dễ”, thớ sinh sẽ thể hiện năng lực cao. Nhưng đề trắc nghiệm thế nào là “khú” hoặc “dễ”? Độ khú của một cõu hỏi được định nghĩa là “tỉ số thớ sinh làm đỳng cõu hỏi trờn nhúm thớ sinh tham gia”, tức là độ khú cõu hỏi tuỳ thuộc năng lực của cỏc thớ sinh được đo. Thật quỏ vũng vo! Độ phõn biệt của cõu hỉ cũng như độ tin cậy và độ giỏ trị của đề trắc nghiệm cũng được xỏc định phụ thuộc vào một nhúm thớ sinh cụ thể được đo. Cỏc đặc trưng của cõu hỏi và đề trắc nghiệm thay đổi khi tỡnh trạng thớ sinh thay đổi, và cỏc đặc trưng của thớ sinh thay đổi khi tỡnh trạng đề trắc nghiệm thay đổi. Kết quả là rất khú so sỏnh cỏc thớ sinh khi họ làm cỏc đề trắc nghiệm khỏc nhau cũng như rất khú so sỏnh cỏc cõu hỏi khi chỳng được trả lời bởi cỏc nhúm thớ sinh khỏc nhau. Cuối cựng cú thể núi: về nguyờn tắc, khụng thể thực hiện cỏc so sỏnh đú. Dự cỏc chuyờn gia đo lường cố gắng tỡm cỏch xử lớ khú khăn đó nờu như thế nào nhưng vẫn khụng giải quyết được vấn đề từ bản chất.
Trước hết chỳng ta hóy xem xột hậu quả thực tiễn của việc đặc trưng cõu hỏi phụ thuộc vào nhúm thớ sinh được đưa vào để xỏc định chỳng. Sự phụ thuộc đú hạn chế việc ứng dụng cỏc đề trắc nghiệm cho cỏc nhúm thớ sinh khỏc với nhúm mà đó dựa vào đú để thu cỏc đặc trưng cõu hỏi. Hạn chế đú ảnh hưởng nhiều đến việc xõy dựng ngõn hàng cõu hỏi, cụng cụ quan trọng để thiết kế đề trắc nghiệm. Thật vậy, việc mở rộng một ngõn hàng cõu hỏi sẽ gặp khú khăn nếu cỏc đặc trưng của nhúm cõu hỏi bổ sung thu được nhờ một nhúm thớ sinh khỏc với nhúm thớ sinh đó được dựa vào để xỏc định cỏc đặc trưng của ngõn hàng cõu hỏi cũ. Bõy giờ hóy xột đến việc năng lực xỏc định đượccủa thớ sinh phụ thuộc vào đề trắc nghiệm. Rừ ràng khi ấy rất khú so sỏnh điểm biểu diễn năng lực của cỏc thớ sinh làm cỏc đề trắc nghiệm khỏc nhau: cỏc điểm đú được đặt trờn cỏc thang khỏc nhau và khụng cú một mối quan hệ hàm số nào giữa cỏc thang điểm. Thậm chớ khi cỏc nhúm thớ sinh được cho làm cỏc đề trắc nghiệm tương đương vấn đề vẫn tồn tại, vỡ khi cỏc nhúm thớ sinh cú năng lực khỏc nhau (tức là đề trắc nghiệm là khú hơn đối với một nhúm thớ sinh so với nhúm thớ sinh kia), thỡ cỏc điểm thu được của họ từ cỏc đề trắc nghiệm
đú cú sai số khỏc nhau.
Một hạn chế khỏc của CTT nằm ở định nghĩa của độ tin cậy. Theo CTT, độ tin cậy là “tương quan giữa cỏc điểm của hai đề trắc nghiệm tương đương”. Trong thực tế khụng thể cú cỏc đề trắc nghiệm thoả món tiờu chớ tương đương. Liờn quan với độ tin cậy là sai số tiờu chuẩn của phộp đo năng lực thớ sinh: CTT quan niệm cỏc sai số tiờu chuẩn ấy là như nhau, trong khi thực tế độ chớnh xỏc của phộp đo năng lực là khỏc nhau đối với cỏc thớ sinh cú năng lực khỏc nhau.
Thờm một hạn chế nữa của CTT là lớ thuyết này xem xột việc ứng đỏp ở mức độ đề trắc nghiệm chứ khụng phải ở mức độ cõu hỏi trắc nghiệm. Định nghĩa khỏi niệm điểm thực trong trắc nghiệm cổ điển khụng lưu ý tới việc thớ sinh ứng đỏp một cõu hỏi như thế nào. Do đú khụng cú cơ sở để xỏc định xem một thớ sinh nào đú ứng đỏp tốt ra sao đối với một cõu hỏi đặt ra cho anh ta. Cụ thể hơn, CTT khụng cho phộp dự bỏo về một thớ sinh hoặc một nhúm thớ sinh nào ứng đỏp một CH đó cho ra sao. Cõu hỏi “xỏc suất để một thớ sinh ứng đỏp đỳng một cõu hỏi xỏc định là bao nhiờu?” là rất quan trọng trong nhiều ứng dụng trắc nghiệm, thỡ khụng trả lời được trong khuụn khổ CTT.
Từ những giới hạn đó nờu trờn đõy, cú thể thấy CTT khụng cho phộp giải quyết tốt một số vấn đề trong thực tiễn trắc nghiệm – như thiết kế đề trắc nghiệm, xỏc định cỏc cõu hỏi gõy thiờn lệch, trắc nghiệm thớch ứng, so bằng cỏc điểm trắc nghiệm.
Lý thuyết hiện đại (Item Response Theory, IRT)
IRT xõy dựng cỏc mụ hỡnh toỏn để xử lý dữ liệu dựa trờn việc nghiờn cứu mọi cặp tương tỏc nguyờn tố “thớ sinh – cõu hỏi” (TS - CH) khi triển khai một trắc nghiệm khỏch quan. Mỗi TS đứng trước một cõu hỏi sẽ ứng đỏp như thế nào, điều đú phụ thuộc vào năng lực tiềm ẩn của thớ sinh và cỏc đặc trưng của cõu hỏi.
Hiện nay cú 3 mụ hỡnh toỏn phổ biến nhất trong IRT: mụ hỡnh 1 tham số (mụ hỡnh Rasch) chỉ xột đến độ khú của cõu hỏi, mụ hỡnh 2 tham số cú xột đến độ phõn biệt của cõu hỏi, và mụ hỡnh 3 tham số xột thờm mức độ đoỏn mũ của thớ sinh khi trả lời cõu hỏi.
So với lý thuyết trắc nghiệm cổ điển, Lý thuyết trắc nghiệm hiện đại với IRT cú những ưu việt quan trọng.
Trong lý thuyết trắc nghiệm cổ điển cổ điển độ khú, độ phõn biệt của cỏc cõu hỏi tớnh được sẽ phụ thuộc vào mẫu thớ sinh được chọn để thử nghiệm, và năng lực xỏc định được của thớ sinh phụ thuộc vào đề trắc nghiệm mà thớ sinh làm. Với IRT, cỏc tham số đặc trưng của cõu hỏi (liờn quan đến độ khú, độ phõn biệt, mức độ đoỏn mũ) khụng phụ thuộc mẫu thử để định cỡ cõu hỏi (sample-free), và năng lực đo được của thớ sinh khụng phụ thuộc vào bài trắc nghiệm cụ thể (item-free) được lấy từ ngõn hàng cõu hỏi (NHCH) đó được định cỡ. Như vậy, theo IRT, mỗi cõu hỏi cú cỏc thuộc tớnh đặc trưng cho nú, và mỗi thớ sinh ở một trỡnh độ nào đú cú một năng lực tiềm ẩn xỏc định, cỏc thuộc tớnh và đặc trưng này khụng phụ thuộc vào phộp đo, hoặc núi cỏch khỏc, chỳng là cỏc bất biến (invariance). Cũng tương tự như trong phộp đo độ dài: mỗi cỏi thước dựng để đo cú kớch thước và kiểu khắc độ xỏc định, mỗi vật để đo cú chiều dài xỏc định, phộp đo là sự so sỏnh cỏi thước với vật được đo để biết được chiều dài vốn cú của vật được đo, cỏc phộp đo khỏc nhau khụng được làm thay đổi cỏc thuộc tớnh vốn cú của cỏi thước cũng như độ dài của vật được đo.
Thành tựu căn bản núi trờn của IRT cũng đem lại số ưu điểm quan trọng cho trắc nghiệm hiện đại. IRT cho phộp tớnh cỏc hàm thụng tin của từng cõu hỏi và của cả đề trắc nghiệm và sai số chuẩn của phộp đo theo cỏc mức năng lực tiềm ẩn chứ khụng phải một sai số chuẩn trung bỡnh chung cho cả phộp đo như trắc nghiệm cổ điển. Từ đú cú thể thiết kế một đề trắc nghiệm cho phộp đo chớnh xỏc khoảng năng lực nào mà ta mong muốn.
Hơn nữa, IRT cho phộp thiết kế cỏc đề trắc nghiệm với mức độ tương đương rất cao để đảm bảo cỏc đề trắc nghiệm khỏc nhau cú thể cho cựng một kết quả như nhau khi đỏnh giỏ năng lực của một thớ sinh nào đú.
Cỏc thành tựu quan trọng đú của IRT đó nõng độ chớnh xỏc của phộp đo lường trong tõm lý và giỏo dục lờn một tầm cao mới về chất so với cỏc lý thuyết đo lường cổ điển. Từ thành tựu tổng quỏt đú của IRT, người ta cú thể đưa ra cỏc quy trỡnh để
xõy dựng NHCH (item banking), phõn tớch cỏc kết quả TNKQ để tu chỉnh NHCH, chủ động thiết kế cỏc đề trắc nghiệm (ĐTN) theo cỏc mục tiờu mong muốn.
Trong nghiờn cứu giỏo dục hiện đại
Trong thực tiến nghiờn cứu, giỏo dục đưuọc đo bằng nhiều thước đo hay cỏc biến đại diện khỏc nhau. Nếu xột giỏo dục chung của địa phương hay của quốc gia thỡ giỏo dục cú thể đưuọc đo bằng:
- Tỷ lệ biết đọc biết viết của người lớn. Chỉ tiờu này đó đưuọc sử dụng rộng rói trong việc tớnh toỏn chỉ số giỏo dục và kể cả là đó từng được sử dụng trong tớnh toản chỉ số phỏt triển con người trước đõy.
- Tỷ lệ học sinh nhập học trong độ tuổi. Chỉ tiờu này đưuọc đo bằng tỷ số giữa số trẻ em trong độ tuổi đi học (đến trường) với tổng số trẻ em trong độ tuổi. Cũng tương tự tỷ lệ biết đọc biết viết của người lớn, tỷ lệ học sinh nhập học trong độ tuổi cũng đó từng được sử dụng trong tớnh toỏn chỉ số phỏt triển con người.
Ở giỏc độ cỏ nhõn, giỏo dục của cỏ nhõn được đo bằng một số chỉ tiờu, trong đú hai chỉ tiờu quan trọng đú là:
- Bằng cấp cao nhất mà cỏ nhõn nhận được. Chỉ tiờu này sẽ xỏc định cấp học cao nhất mà mỗi cỏ nhõn thu được. Tuy nhiờn, cỏch đo lường giỏo dục này khụng thể phản ỏnh chớnh xỏc giỏo dục của cỏ nhõn. Chẳng hạn, cú nhiều cỏ nhõn đó học hết lớp 11 hoặc 12 nhưng khụng thi đưuọc bằng tốt nghiệp Trung học phổ thụng thỡ lại chỉ đưuọc xếp vào nhúm cú bằng cấp cao nhất là Trung học cơ sở, nhưng thực chất cỏc cỏ nhõn này cú giỏo dục cao hơn nhiều so với bằng cỏp mà họ giữ.
- Số năm học của cỏ nhõn. Đõy là một chỉ tiờu phản ỏnh chớnh xỏc hơn giỏo dục của mỗi cỏ nhõn. Chỉ tiờu này được đo bằng số năm học thực tế mà mỗi cỏc nhõn đến trường. Đõy là chỉ tiờu quan trọng và phản ỏnh tốt về thực tế giỏo dục của mỗi cỏ nhõn và chỉ tiờu này hiện đang được sử dụng để tớnh số năm học trung bỡnh của dõn số trong tớnh toỏn chỉ số giỏo dục, một bộ phận cấu thành của chỉ số phỏt triển con người.