CƠ SỞ LÝ THUYET

Một phần của tài liệu Khóa luận tốt nghiệp Hệ thống thông tin: Xây dựng hệ thống câu hỏi và thi trắc nghiệm trực tuyến theo thang đo nhận thức Bloom (Trang 24 - 46)

TOM TAT KHÓA LUẬN

Chương 2. CƠ SỞ LÝ THUYET

2.1. Thang đo nhận thức của Bloom

2.1.1. Thang đo Bloom truyền thống

Trong lĩnh vực giáo dục, thang cấp độ tư duy có thể được xem là một công cụ nền tang dé từ đó xây dung, do lường, sắp xếp các mục tiêu của các chương trình giáo dục và quy trình đào tạo. Thang đo về các cấp độ tư duy đầu tiên được Benjamin

S.Bloom, một nhà tâm lý học người Mỹ đưa ra vào năm 1956 [3]. Trong thang đo

này, ông đưa ra 6 cấp độ nhận thức từ đơn giản đến phức tạp. Có thể tóm lược như

sau:

Cấp độ Hành vi của nhận thức

Kiến thức Sự ghi nhớ tới các chủ đề phô biến và đặc biệt, các phương (Knowledge) | pháp, quá trình, và sự ghi nhớ các mô hình, cấu trúc, bối cảnh

Lĩnh hội Khả năng năm bắt thông tin, hiểu nội dung, diễn giải, diễn

(Comprehension) | dịch, suy diễn

Ứng dụng | os , ơ cờ SA

ơ Ung dụng kiờn thức vào tỡnh huụng mới dộ giải quyết võn dộ

(Application)

Phân tích Xác định được hình thái cấu trúc của sự vật, xác định các bộ (Analysis) phận, mối quan hệ, nguyên tắc tổ chức

Tổng hợp Kha năng sap xếp các bộ phận lại với nhau dé hình thành một (Synthesis) | tổng thể mới

Đánh giá Đánh giá vé chat lượng của sự vật dựa trên giá tri, điêu kiện

(Evaluation) cần và đủ, logic hoặc công dụng

Bảng 2.1: Hành vi theo từng cấp độ nhận thức của thang đo Bloom

2.1.2. Thang đo Bloom tu chính

Thang đo Bloom truyền thống được sử dụng rộng rãi trong giảng dạy khoảng 50 năm trước khi được đề xuất điều chỉnh vào năm 2001 bởi 2 tác giả chính là Lorin

W.Anderson và David R.Krathwohl [4]. Trong thang đo Bloom tu chính, các tác gia

đã đề xuất các mức độ nhận thức lần lượt là: nhớ (remembering), hiểu

(understanding), vận dung (applying), phân tích (analyzing), đánh giá (evaluating)

và sáng tạo (creating). Có ba sự thay đổi đáng lưu ý trong sự điều chỉnh này so với thang đo Bloom truyền thống: cấp độ tư duy thấp nhất là Nhớ thay vì Biết, cấp Tổng hợp được bỏ đi va đưa thêm Sang tạo vào mức cao nhất, các danh động từ

thay cho các danh từ.

1956 2001

Hình 2.1: Sự khác nhau giữa thang đo Bloom truyền thống và tu chính

Bảng sau đây cung cấp nội dung giải thích gắn gọn, đồng thời cho một số ví dụ và

từ khóa thường dùng đối với mỗi cấp độ trên thang Bloom tu chính (Bloom’s

Revised Taxonomy).

Cấp độ Ví dụ & Từ khóa

Nhớ: khôi phục, ghi nhận và nhớ

lại các kiên thức có liên quan

Ví dụ: viết lại công thức, đọc lại một bài thơ,

mô tả lại một sự kiện, nhận biết phương án

đúng

Từ khóa: nhắc lại, mô tả, liệt kê, trình bày,

chọn lựa, gọi tên, nhận diện

Hiểu: nam bat được ý nghĩa của

thông tin, thể hiện qua khả năng

diễn giải, suy diễn, liên hệ, khái

quất

Vi dụ: giải thích một định luật, phân biệt cách

sử dụng các thiết bị, viết tóm tắt một bài báo, trình bày một quan điểm

Từ khóa: giải thích, tóm tắt, phân biệt, mở

rộng, khái quát hóa, cho ví dụ, nhận định, so sánh, sap xêp

Vận dụng: áp dụng thông tin đã

biết vào một tình huống, điều kiện

mới

Ví dụ: vận dụng một định luật dé giai thich một hiện tượng, ap dụng một công thức dé

tính toán, thực hiện một thi nghiệm dựa trên quy trình

Từ khóa: vận dụng, áp dụng, tính toán, chứng

minh, giải thích, xây dựng, lập kế hoạch

Phân tích: chia thông tin, kiến

thức thành các phần nhỏ, sau đó

xác định cách các thành phần nhỏ

đó liên quan với nhau và với một

câu trúc hoặc mục đích tông thê

Ví dụ: lý giải nguyên nhân thất bại của một doanh nghiệp, hệ thống hóa các văn bản pháp qui, xây dựng biểu đồ phát triển một doanh

nghiệp.

Từ khóa: Phân tích, lý giải, so sánh, lập biêu

đồ, phân biệt, minh họa, xây dựng mối liên

hệ, hệ thống hóa

Đánh giá: đưa ra nhận định, phán

quyết của bản thân đối với thông

tin dựa trên các chuân mực, tiêu

Ví dụ: phản biện một nghiên cứu, bài báo;

đánh giá khả năng thành công của một giải

10

chí pháp; chỉ ra các điêm yêu của một lập luận

Từ khóa: Đánh giá, cho ý kiến, bình luận, tổng hợp, so sánh

Sáng tạo: xác lập thông tin, sự vật | Ví dụ: thiết kế một mẫu nhà mới, xây dựng

mới trên cơ sở những thông tin, sự | một công thức mới, sáng tạo một bài hát, ...

vật đã có Từ khóa: thiết lập, tổng hợp, xây dựng, thiết

kê, sáng tác, đê xuât

Bảng 2.2: Bảng định nghĩa, phân loại từng cấp độ của thang đo Bloom 2.1.3. Ứng dung thang do Bloom trong kiểm tra, đánh giá năng lực

Dé có thé ứng dụng thang đo Bloom vào giáo dục, chúng ta nên sử dụng các động

từ có tính nhấn mạnh đề chỉ mục tiêu hoặc khả năng phải làm được một việc gì đó [5]. Sau đây liệt kê một SỐ động từ thường được sử dụng cho từng bậc của quá trình nhận thức đã được đề cập theo thang đo Bloom tu chính nêu trên (mục 2.1.2)

e Nhớ (Remember): trích dan (cite), định nghĩa (define), mô tả (describe), xác

định (identify), liệt kê (list), gọi tên (name), phác thao (outline), nhắc lại (recall), tường thuật (report), tái tạo (reproduce), thể hiện (show), chọn lựa

(select), liên hệ (relate), ...

e Hiểu (Understand): phân loại (classify), so sánh (compare), đối chiếu

(contrast), chứng minh (demonstrate), giải thích (explain), mở rộng (extend),

minh hoa (illustrate), suy luận (infer), giải thích — làm sáng tỏ (interpret),

phác thao (outline), liên hệ (relate), diễn đạt lại (rephrase), tóm tắt

(summarize), dịch (translate), ...

e Van dung (Apply): ứng dung (apply), xây dung (build), lựa chon (choose),

vẽ - dựng (construct), phát triển (develop), xác định (identify), chất van (interview), tổ chức (organ1ze), lập kế hoạch (plan), chọn lua (select), giải quyét (solve), tối ưu (utilize), ...

lãi

e Phân tích (Analyze): phân tích (analyze), sắp xếp (arrange), phân loại

(categorize, classify), so sánh (compare), kết luận (conclusion), phân giải (deconstruct), đò tim (detect), vẽ biểu đồ (diagram), phân biệt (differentiate,

discriminate, distinguish), giải thích (explain), xem xét (examine), quan sat (inspect), khảo sat (survey), ...

e Đánh giá (Evaluate): đánh giá (appraise, assess), tranh luận (argue), so sánh

(compare), kết luận (conclude), xem xét (consider), đối chiếu (contrast), thuyết phục (convince), phê bình (criticize), xác định (determine), chứng minh (justify), xếp hang (rank), đề xuất (recommend), ...

e Sang tao (Create): sap xép (arrange), tap hop (assemble), xay dung (build),

thu thap (collect), két hop (combine), tao nén (create), thiét ké (design), phat

trién (develop), tao ra (generate), đưa ra gia thuyét (hypothesize), tích hợp

(integrate), phát minh (invent), ...

2.2. Tong quan về trac nghiệm khách quan

2.2.1. Tw luận và trắc nghiệm khách quan

TN theo nghĩa rộng là một hoạt động được thực hiện để đo lường năng lực của các đối tượng nào đó nhằm mục đích xác định.

Trong giáo dục, TN được tiến hành thường xuyên ở các kỳ thi, kiểm tra để đánh giá kết quả học tập, giảng dạy đối với một phần của môn học, toàn bộ môn học, đối voi cả một cấp học, hoặc dé tuyển chọn một số người có năng lực nhất vào một

khóa học.

TN viết thường được chia thành 2 loại: trắc nghiệm tự luận và trắc nghiệm khách

quan.

2.2.1.1. Trắc nghiệm tự luận

Là phương pháp kiểm tra gồm các câu hỏi dạng mở (loại câu hỏi này không

chỉ có một câu trả lời hay một kiêu trả lời mà có thê có nhiêu cách, nhiêu hướng

12

trình bay) mà học sinh phải tự mình trình bày ý kiến trong một bài viết dai dé giải quyết vấn đề mà câu hỏi nêu ra.

2.2.1.2. Trắc nghiệm khách quan

Là nhóm các câu hỏi trong đó một câu nêu ra một vẫn đề cùng một thông tin can thiết đòi hỏi học sinh phải viết câu trả lời ngắn hoặc lựa chọn một câu trả lời, hay phải điền thêm một vai từ.

2.2.1.3. So sánh trắc nghiệm tự luận và trắc nghiệm khách quan

Loại câu hỏi tự luận thường đòi hỏi học sinh phải viết nhiều câu dé trả lời, nó không có một câu trả lời đúng hay một kiêu dé trả lời. Dé đánh giá được một cách chính xác và có chất lượng, một bài tự luận phải được chấm bởi người có kinh nghiệm và biểu biết về lĩnh vực của môn học tương ứng. Bài trắc nghiệm tự luận không thê đánh giá một cách tuyệt đối là đúng hay sai.

Trong khi đó TNKQ thì có các ưu điểm như: khảo sát được số lượng lớn thí sinh, kết quả nhanh, điểm số đáng tin cậy, khách quan vì không phụ thuộc vào người chấm. Bên cạnh những ưu điểm thì TNKQ cũng có một vài hạn chế chăng hạn như: thí sinh có khuynh hướng đoán mò đáp án, không thấy rõ diễn biến tư duy

của thí sinh, khó soạn đê và tôn công sức.

Bảng so sánh dưới đây sẽ cung câp cái nhìn rõ ràng hơn giữa tự luận và trắc nghiệm:

Vấn đề Ưu thé thuộc về

phương pháp

Trắc Tự luận

nghiệm

Ít tốn công ra đề x

Đánh giá được kha năng diễn dat, đặc biệt là diễn đạt tư

x

duy trừu tượng

13

Việc sáng tạo khi trả lời không bị hạn chế bởi một

khung câu hỏi có sẵn

Đề thi phủ kín nội dung học x

It may rủi do trúng tủ hay trật tủ x

It tốn công cham thi x

Khach quan trong cham thi x

Áp dụng được công nghệ mới trong việc nâng cao chất

lượng đề thi, giữ bi mật dé thi, hạn chế quay cóp khi thi,

hạn chế tiêu cực trong chấm thi và giúp phân tích kết

quả thi

Bảng 2.3: So sánh giữa tự luận và trắc nghiệm 2.2.2. Một số dạng câu hỏi trắc nghiệm khách quan thường gặp

2.2.2.1. Trắc nghiệm đa lựa chọn (multiple-choice question)

Là dang TN thông dụng nhất hiện nay. Loại này có một câu phát biéu căn bản gọi là câu dẫn và có nhiều câu trả lời để học sinh lựa chọn, trong đó chỉ có một câu trả lời đúng nhất hay hợp lý nhất còn lại đều là sai, những câu trả lời sai là câu môi

hay câu nhiễu

- Ưuđiểm:

+ Có thé tiến hành kiểm tra đánh giá (KTĐG) trên diện rộng trong thời

gian ngắn + Yếu tổ đoán mò, may rủi giảm nhiều nên học sinh phải xét đoán và

phân biệt kĩ càng trước khi trả lời, vì thế loại câu này có độ tin cậy cao.

+ Đảm bảo tính khách quan khi cham

+ Phân tích được tính chat “môi” của câu hỏi

14

+ Tính chất gia tri tốt hơn, có thé do được kha năng nhớ, vận dụng, khả

năng suy diễn, tong quát hóa ... tạo điều kiện cho học sinh tự đánh giá kết quả học tập của mình một cách chính xác

+ Có thé sử dụng phương tiện hiện đại để chấm bài và phân tích kết qua

- Nhược điểm:

+ Khó khăn trong việc biên soạn các câu hỏi, tôn nhiêu thời gian

+ Không đo được khả năng khéo léo, sáng tao của học sinh

- Phạm vi sử dụng: có thé dùng cho mọi hình thức KTĐG. Rat thích hợp

cho việc đánh giá, xếp loại học sinh 2.2.2.2. Trắc nghiệm đúng sai (true-false question)

Loại câu này được trình bày dưới dạng một phát biểu và học sinh phải trả lời bằng cách chọn đúng hay sai

- Ưu điểm: đưa ra nhiều nội dung trong một thời gian ngắn, dé biên soạn

- Nhược điểm: có thé khuyến khích sự đoán mò nên khó có thể xác định sai

lầm chủ yếu của học sinh khi học một kiến thức cụ thê, độ tin cậy thấp

- Phạm vi sử dụng: thích hợp cho kiểm tra van đáp nhanh. Thường sử dụng

khi không tìm được đủ phương án cho câu hỏi nhiều lựa chọn 2.2.2.3. Trắc nghiệm điền khuyết (filling question)

Có thể có 2 dạng, chúng có thé là những câu hỏi với giải đáp ngắn, hay cũng

có thé gồm những câu phát biểu với một hay nhiều chỗ trống mà học sinh phải điền

vào một từ hay một cụm từ.

- Ưu điểm: dễ xây dựng và hoc sinh có cơ hội trình bày những câu trả lời

khác thường, phát huy sáng kiến, suy luận và khảo sát được khả năng luyện trí nhớ. Học sinh mất cơ hội đoán mò, nên câu hỏi có độ tin cậy cao hơn

- Nhược điểm: cách chấm điểm khó khăn và tốn nhiều thời gian, chủ yếu

kiểm tra khả năng ghi nhớ và nhận biết

- Phạm vi: thích hợp cho các môn ngoại ngữ, xã hội và nhân van

15

2.2.2.4. Trắc nghiệm ghép đôi (matching question)

Đây là loại hình đặc biệt của loại câu hỏi nhiều lựa chọn, trong đó học sinh

tìm cách ghép các câu trả lời ở trong cột này với câu hỏi ở cột khác sao cho phù hợp.

- Ưu điểm: câu hỏi ghép đôi dễ xây dựng, hữu hiệu trong việc đánh giá khả

năng nhận biết các hệ thức hay lập các mối tương quan

- Nhược điểm: dễ trả lời thông qua việc loại trừ, không phù hợp cho việc

thâm định các khả năng như sắp đặt và vận dụng các kiến thức

- Phạm vi sử dụng: thích hợp với việc kiểm tra kiến thức cơ bản sau khi học

xong một chương, một chủ đề 2.2.3. Độ tin cậy và độ giá trị của bài trắc nghiệm

Đề đánh giá chất lượng bài thi trắc nghiệm cần dựa trên nhiều yếu tố, trong đó độ tin cậy và độ giá trị là những yếu tố đánh giá quan trọng của một đề thi.

2.2.3.1. Độ tin cậy (Reliability)

Trắc nghiệm là một phép do: dùng thước đo là bai trắc nghiệm dé do lường một năng lực nào đó của học sinh. Độ tin cậy của bài trắc nghiệm chính là đại lượng biểu thị mức độ chính xác của phép đo nhờ bài trắc nghiệm.

Độ tin cậy của bài TNKQ được xem như là một số đo về sự sai khác giữa điểm số quan sát được và điểm số thực của học sinh.

2.2.3.2. Độ giá trị (Validity)

Độ giá trị của đề trắc nghiệm là đại lượng biểu thị mức độ đạt được mục tiêu

đề ra cho phép đo nhờ đề trắc nghiệm.

Đề đề trắc nghiệm có độ giá trị cao cần phải xác định tỉ mỉ mục tiêu cần đo qua đề trắc nghiệm và bám sát mục tiêu đó khi xây dựng câu hỏi TNKQ.

16

Đề đảm bảo tính giá trị của bài kiểm tra cần phải quan tâm đến tính toàn diện của nó tức là cả chất lượng và số lượng. Trong quá trình KTĐG phải đánh giá một

cách trung thực, khách quan và chính xác.

2.3. Xử lý ngôn ngữ tự nhiên

Xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP) là một trong những

lĩnh vực quan trọng của trí tuệ nhân tạo, được phát triển nhằm xây dựng các chương trình máy tính có khả năng phân tích, xử lý và hiểu ngôn ngữ con người [6]. Một số ứng dụng quan trọng của NLP có thể chỉ ra như: nhận dạng tiếng nói, tổng hợp tiếng nói, truy xuất thông tin, trích chọn thông tin, tóm tắt văn bản tự động, ... Các phần sau đây sẽ mô tả một vài kỹ thuật sử dụng trong các bài toán xử lý ngôn ngữ

tự nhiên.

2.3.1. Trích chọn đặc trưng TF-IDF

Thuật ngữ Term Frequency — Inverse Document Frequency (TF-IDF) là một

phương thức thống kê được biết đến rộng rãi dé xác định độ quan trong của một từ trong đoạn văn bản trong một tập nhiều đoạn văn bản khác nhau.

TF-IDF xác định trọng số của một từ trong văn bản thu được qua thống kê thé

hiện mức độ quan trọng của từ này trong một văn bản, mà bản thân văn bản đang

xét năm trong một tập hợp các văn bản [7, 8]. Giá trị của TF-IDF cao thể hiện độ quan trọng cao và nó phụ thuộc vào số lần từ xuất hiện trong văn bản nhưng bù lại bởi tần suất của từ đó trong tập dữ liệu. Một vài biến thể của TF-IDF thường được

sử dụng trong các hệ thông tìm kiếm như một công cụ chính dé đánh giá và sắp xếp

văn bản dựa vào truy vân của người dùng.

Term Frequency (TF): là tan suất xuất hiện của một từ trong một đoạn văn bản.

Vì các văn bản có thé có độ dai ngắn khác nhau nên một số từ có thể xuất hiện nhiều lần trong một văn ban dai hon là một văn bản ngắn. Như vậy, TF thường được chia cho độ dài văn bản (tổng số từ trong một văn bản).

17

ƒŒ,3)

TƯŒ, 4) = max/f(w,d):w € d (1)

Trong đó:

e TF(t,d) — Tần suất xuất hiện của từ t trong văn bản d.

e f(t,d) — Số lần suất hiện của từ trong văn bản d.

e max{f(w,d):w € đ} — Số lần xuất hiện của từ có số lần xuất hiện

nhiều nhất trong văn bản d.

Inverse Document Frequency (IDF): là nghịch dao tần suất của văn bản, giúp đánh giá tầm quan trọng của một từ. Khi tính tần số xuất hiện TF thì các từ đều được coi là quan trọng như nhau. Tuy nhiên có một số từ thường được sử dụng nhiều nhưng không quan trọng dé thê hiện ý nghĩa của đoạn văn. Vì vậy ta cần giảm

đi mức độ quan trọng của những từ đó bằng cách sử dụng IDE:

“Id ePD:t e a)|

IDF(t,D) =

Trong đó:

e IDF(t,D) — Giá trị IDF của từ t trong tập văn bản D.

e |D| — Tổng số văn bản trong tập D.

e l{d€D:t € d}| — Thẻ hiện số văn bản trong tập D có chứa từ t.

Cơ số logarit trong công thức này không làm thay đổi giá trị IDE của từ mà chỉ thu hẹp khoảng giá trị của từ đó. Việc sử dụng logarit nhằm giúp giá trị TF-IDF của

một từ nhỏ hon, do công thức tính TF-IDF của một từ trong một văn ban là thích của TF và IDF cua từ đó. Công thức tính TF-IDF được xác định như sau:

TF — IDF(t,d,D) = TF(t,d) x IDF(t,D) (3)

Từ (3) cho thay những từ có giá trị TF-IDF cao là những từ xuất hiện nhiều trong văn bản này, và xuất hiện ít trong các văn bản khác. Việc này giúp lọc ra những từ

phô biên va g1ữ lại những từ có giá trị cao chính là các từ khóa của văn ban đó.

18

Một phần của tài liệu Khóa luận tốt nghiệp Hệ thống thông tin: Xây dựng hệ thống câu hỏi và thi trắc nghiệm trực tuyến theo thang đo nhận thức Bloom (Trang 24 - 46)

Tải bản đầy đủ (PDF)

(130 trang)