1. Trang chủ
  2. » Luận Văn - Báo Cáo

Khóa luận tốt nghiệp Hệ thống thông tin: Xây dựng hệ thống câu hỏi và thi trắc nghiệm trực tuyến theo thang đo nhận thức Bloom

130 2 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Xây dựng Hệ thống Câu Hỏi và Thi Trắc Nghiệm Trực Tuyến Theo Thang Đo Nhận Thức Bloom
Tác giả Cái Ngọc Anh Tài, Võ Thị Duy Thảo
Người hướng dẫn Th.S Vũ Minh Sang
Trường học Trường Đại học Công nghệ Thông tin
Chuyên ngành Hệ thống Thông tin
Thể loại Khóa luận tốt nghiệp
Năm xuất bản 2021
Thành phố TP. Hồ Chí Minh
Định dạng
Số trang 130
Dung lượng 57,28 MB

Nội dung

Đề tài này nhằm xây dựng hệ thống quản lý câu hỏi theo sáu cấp độtrong thang đo nhận thức Bloom nhớ, hiểu, vận dụng, phân tích, đánh giá, sángtạo và tổ chức thi trắc nghiệm trực tuyến gi

Trang 1

ĐẠI HỌC QUOC GIA TP HO CHÍ MINH

TRUONG DAI HOC CONG NGHE THONG TIN

KHOA HE THONG THONG TIN

CAI NGỌC ANH TÀI - 17520996

VÕ THỊ DUY THẢO — 17521071

KHÓA LUẬN TÓT NGHIỆP

NGHIỆM TRỰC TUYẾN THEO THANG ĐO NHẬN

THỨC BLOOM

Building question bank — online multiple-choice examination system

based on Bloom’s Taxonomy

KY SU NGANH HE THONG THONG TIN

TP HO CHÍ MINH, 2021

Trang 2

ĐẠI HỌC QUOC GIA TP HO CHÍ MINH

TRUONG DAI HOC CONG NGHE THONG TIN

KHOA HE THONG THONG TIN

CAI NGỌC ANH TÀI - 17520996

VÕ THỊ DUY THẢO — 17521071

KHÓA LUẬN TÓT NGHIỆP

XÂY DỰNG HE THONG CÂU HOI VA THI TRAC NGHIEM TRUC TUYEN THEO THANG DO NHAN

THUC BLOOM

Building question bank — online multiple-choice examination system

based on Bloom’s Taxonomy

KY SU NGANH HE THONG THONG TIN

GIANG VIEN HUONG DAN

THAC Si VU MINH SANG

TP HO CHÍ MINH, 2021

Trang 3

THONG TIN HOI DONG CHAM KHÓA LUẬN TOT NGHIỆP

Hội đồng cham khóa luận tốt nghiệp, thành lập theo Quyết định số

TigầYy của Hiệu trưởng Trường Đại học Công nghệ Thông tin.

Trang 4

LỜI CẢM ƠN

Đầu tiên, chúng tôi xin chân thành cảm ơn Khoa Hệ Thống Thông tin,trường Đại học Công nghệ Thông tin, Đại học Quốc gia Thành phố Hồ ChíMinh đã tạo điều kiện thuận lợi cho chúng tôi trong việc học tập và thực hiện đềtài tốt nghiệp này

Chúng tôi xin bày tỏ lòng biết ơn sâu sắc đến Thay Th.S Vũ Minh Sang

đã tận tình hướng dẫn, chỉ bảo trong suốt thời gian học tập và quá trình thựchiện đề tài

Chúng tôi xin chân thành cảm ơn các Thầy, Cô thuộc Khoa Hệ ThốngThông Tin nói riêng và các Thầy, Cô trường Đại Học Công Nghệ Thông Tin nóichung đã tận tình giảng dạy, trang bị cho chúng tôi những kiến thức quý báu

trong thời gian học tập tại trường.

Xin gửi lời cảm ơn chân thành đến gia đình và bạn bè vì đã luôn là nguồnđộng viên to lớn, giúp đỡ chúng tôi vượt qua những khó khăn trong suốt quá

trình học tập.

Mặc dù đã cố gắng hoàn thành khóa luận trong phạm vi và khả năng cho

phép nhưng chắc chăn sẽ không tránh khỏi những thiếu sót Chúng tôi rất mongnhận được sự thông cảm, góp ý và tận tình chỉ bảo của quý Thầy Cô và các bạn

Nhóm chúng tôi xin trân trọng cảm on!

Thành phố Hồ Chí Minh, thang 06 năm 2021

Nhóm sinh viên thực hiện

Cái Ngọc Anh Tai — Võ Thị Duy Thao

Trang 5

MỤC LỤC

Chương 1 TÔNG QUAN DE TÀI 2-2 Sc+E22EE£EEEEEE+EEEEEEEEEEEerrkerkervee 3

1.1 Tên để tài cccc nh ngư nhe 3

1.5 Giả thuyết khoa hỌC - 2c ©5£+S2+EE£EEEEEEEEE2E127127121121171171 11.1 .EEctxeeU 5

1.6 Phương pháp nghiÊn CỨU ¿25c 32c 3223323131 E3EEEEEEEEEEErrrsrrrserrsrre 6

1⁄7 Đóng góp của đề tài - ¿2+ 2k2 2212212112111 2111111 re 6

1.8 Cấu trúc của để tài che 6

Chuong 2 CO SỞ LÝ THUYÊT - 5-2 SE+EE+EE+EE£EE2EEEEEEEEEEEEEerkrreree 8

2.1 Thang do nhận thức của BÌOOIm - - 5 5+ 1E veEEekrreeserrseerre 8

2.1.1 Thang đo Bloom truyền thống -2- 2-2 2+5£+E£+E+£E+£E+Exerzrszes 8

2.1.2 Thang do Bloom tu chính - 5 +3 kEkksskEsseseerkesee 9

2.1.3 Ứng dụng thang đo Bloom trong kiểm tra, đánh giá năng lực 11

2.2 Tổng quan về trắc nghiệm khách quat c.csccccescsssessssessessesessesseeseeseeseseses 12

2.2.1 _ Tự luận và trắc nghiệm khách quan -: -: 2 ©5z2cxz2cs+e- 12

2.2.1.1 Trắc nghiệm tự luận ¿¿22+ E++E+£E++EE+EEtEErEerrkrrkerkerxee 12

2.2.1.2 Trắc nghiệm khách quan - + + +2 ++S+2E£+E££EerEerxerxzrxzrs 132.2.1.3 So sánh trắc nghiệm tự luận và trắc nghiệm khách quan 132.2.2 Một số dạng câu hỏi trắc nghiệm khách quan thường gặp 14

2.2.2.1 Trắc nghiệm đa lựa chon (multiple-choice question) 14

Trang 6

2.2.2.2 Trắc nghiệm đúng sai (true-false question) . -.: ‹:-: 152.2.2.3 Trắc nghiệm điền khuyết (filling question) .: - 152.2.2.4 Trắc nghiệm ghép đôi (matching question) - 5-5 5s 162.2.3 Độ tin cậy và độ giá tri của bai trắc nghiệm ++-«<++<<+ 16

2.2.3.1 Độ tin cậy (ReliabiÏity) ch HH 16

2.3 Xu ly 0i 0i (ni ái a 17

2.3.1 Trích chọn đặc trưng TTF-IDE 5c 35 S3 * + skrerreerrrererrre 17 2.3.2 Stemming va LemmatfIZAfIOI -. s5 + xi 19

2.3.2.1 SŠf{eImming .c- ck kxHHHnnHHHknr, 20

2.3.3 Part of Speech - LH HH HH HH 21

2.4 Một số mô hình học máy trong bài toán phân loại - 2-52: 21

2.4.1 _ Thuật toán Naive Bay€s Ăn HH HH gi, 21

2.4.2 Thuat toan May Vector hé tro (Support Vector Machine) 23

2.4.3 Thuật toán Passive AQSressive ccesccessceseeetseeseeeeseeeeaeeeseeeesneeaes 25 2.5 Phương pháp Ensemble LearnIng - «+ seeeeeereereersersee 25

2.5.1 Giới thiệu Ensemble Learn1ng - «+ s + + + +ssesseeeeseeseeers 25

2.5.2 Phương pháp kết hợp đơn giản - 2-52 s+c++s£+Eezxerxerxerseree 26

Trang 7

2.5.3.2 Boosting (tăng CƯỜNB) SÁT HH ng ng y 28

2.5.3.3 Stacking (xếp chồng) ¿©2+c 222x222 EEEEEcrkrrrree 282.6 Phương pháp huấn luyện lại mô hình thuật toán ¿2-5 s2 5+: 28Chuong 3 | KHAO SÁT, PHAN TÍCH THIET KE HỆ THÓNG 30

3.1 Khảo sát và phân tích các nghiên cứu liên quan - -5+s5<+ss5+ 30

3.2 Xác định chức năng cho đề tài - ¿5+ E+EE+EE+E2EE2E2EEEEerkerkerkrrree 31

3.3 Sơ đỗ tổng thỂ ¿22 5++SEEE2E12E12717112112112717112112111111.11E 11110 33

3.3.1 _ Sơ đồ phân rã chức năng - 2c ++E£+E++EEeEEerEzrrrkerkerree 34

3.3.2 Sơ đồ usecase tổng quát -¿©-+++c++2xtvrktsrkrsrkrrrrerkrerxee 34

3.4 Module quan lý câu hỏi - - c5 1 112319111 1 1 ng ng ni, 35

Trang 8

3.4.4.2 Biểu đồ tuần tự -.- St tt Sv St E211 1121111111111 exe 453.4.4.3 Biểu đỗ lớp c- 2c 222k 2212211271211 211 22121121111 ke 463.5 Module quản lý để thi - :- 2 s52 ESESE£EEEEEEEEEEE2E12112112121 11111 xe, 46

3.5.1 — Tạo đề thi - 7c 2t 2k2 2 E2 212112111121 46

3.5.1.1 Đặc tả USCCASC cccccccccsessssecceceessseeececeeessseeeceseesseeecceseesseeeeeeeeaas 46

3.5.1.2 Biểu đỗ tuần tự + x22 EEkEEEEEEEEerkrrrrererrrei 49

3.5.1.3 Biểu đỗ lớp -c- 5c 2s k EE2212211211 2112212112111 xe 50

3.5.2 — Sửa đề thi 2.2 HH HH Hee 50

3.5.2.1 Đặc td USCCASC QQQ TH HS SH TT ng ng kg kế 50

3.5.2.2 Biểu đồ tuần tự cccStc c2 2 111121 21etxerrrei 523.5.2.3 Biểu dO lớp St 2s 21 E212 122121111211111 21.11111111 533.5.3 Xóa đã đe <@ \ ẦẲƒ/ 53

3.6.2.2 Biểu đỗ tuần tự - kcSkc2E2 2212121121121 1121211 ekrre, 62

3.6.2.3 Biểu dO lớp -c- tt E21 E121212121111211211 21.11111111 63

Trang 9

3.7 Thiết kế cơ sở dữ liệu -¿©:-k+ESxSESESEEEESEEEEEE2EEE1E12E5E111111111 1112k 64

3.7.1 Mô hình quan hỆ 2¿©++++£+EE++EE2EEEEEESEEEEEECEEErrrkrrkerrkee 64

3.7.2 Ánh xạ cơ sở dữ liệu -©cc+ckc2EEtEEEEEECEEECEEkrrrkerkerrkee 64

3.8 Thiết kế luồng màn hình 2-2 2 £+E+E£EE£EE#EE+EEEEE2EEEErEeEkerkrrkrrkee 66Chương 4 XÂY DUNG MÔ HÌNH PHAN LOẠI CÂU HỎI 68

AL Mô tả bộ dữ liệu 2 2-©5£+SE2EEEEEE9711271211711271.21121111 1111 ecrei 68

4.2 Mô hình hoạt động - +2 S1 SE 9 91H TH TH ng ngư, 70

4.2.1 — Sơ đồ xử lý 2.2 TH HH rerrree 70

42.2 Mô tả tiền xử lý dữ liệu - + +2Ec2E2EEEEeEEerErrrrrrkerkerreee 71

4.2.3 Mô tả trích chọn đặc trưng TF-IIDE - 55s £+<£+see+eseeeses 71

4.3 Triển khai mô hình phân loại câu hỏi ¿2-2-2 s2 2+££+£2+Ee£E+zx+zszcez 72

4.3.1 Tổng hợp các mô hình phân loại sử dụng . : : 72

4.3.2 Kết hợp các mô hình (ensemble) 2-2 ssz+s+x+zx+zx+zxzxxee 73

4.3.3 Đánh giá mô hỉnh -++++2EE+EESEEEEErEEkerkerrkerrkeee 74

4.4 Huấn luyện lại mô hìnhh ¿2-2 E2+2E++EE+EE£EEEEEEEEEEEEEEErEkrrkerkrres 75

4.4.1 Online LearnIng cv HH ngư 75

4.4.2 Model Retraining ce eeecseeceeseceseeeececeeeeceseceaeeeeeeeceaeceseeeeeeaeees 77

4.5 Kết QUA ¡0ì 211 ỀỒỀ 4 77

4.5.1 Tinh năng phân loại cau hỏi - 525 S2 **++seseereeereererrrse 77

4.5.2 Tính năng huấn luyện lại mô hinh.e ceececccsecssesseesseessesstesstesseessees 77Chương 5 TRIÊN KHAI HE THONG wu ecceecececseeseessecseeseessessessesseesessesseeseees 80

5.1 Triển khai hệ thống 2¿- 2¿©2+2+++EE+2EE2EEEEEEEEESEEEEEEEEEEErkerkrrrrres 80

5.1.1 _ Kiến trúc hạ tầng của hệ thống -¿ 2+c++cxczxzrsrxerxerree 80

5.1.2 Công nghé sử dụng - + St S2 SH rệt 81

Trang 10

5.2 Tích hop và triển khai liên tục (CI/CD) -¿- 2 + ++E£+EetEerkerxerxerszrs 815.3 Kết quả dat QUOC ccecccsccssssssssssesssesssessussssessscssecsseesscssesssecsusssesssecssecseseseessecs 82

5.4 Hướng dan sử dunng c.ccccccccccccscsscsscsssscsscsesscssssessssessssessescsessescsscsesscseeseseesess 83

5.4.1 Soạn câu NOL - c1 1111922311111 11292311111 ng vn ket 83

5.4.2 Import câu hỏi - cà S3 HH giết 86

5.4.3, Soạn đề thi n.cccccccccccccssesssessesseessessuessesssessessusessesseessecssecseesseesseessesses 87

93

5.4.5 Thống kê E222 EE21121121127111211 111 EExcxe 97

Chương 6 KÉT LUẬN VÀ HƯỚNG PHAT TRIEN : -: 99

6.1 CAC << 996.2 Khó khăn và hạn chế cccecceccccscssesssssessessesssessessessessssesecsecsecsusssssseesecsesseeess 1006.3 Hướng phát triỂn 2¿©2+¿22++2E+2EESEkEEEEEEEEEESEEEEEkErkrerkrree 101TÀI LIEU THAM KHẢO 2: 2222 S£22E2E2EEESEE2EEE2E1E711221221 21121 re 102PHU LUC A: Usecase phân rã của các chức năng chính trong hệ thống 106PHU LUC B: Một số hình ảnh của hệ thống 2-2-2 2+£++£x22Ezz£z+csez 111

Trang 11

DANH MỤC HÌNH

Hình 2.1: Sự khác nhau giữa thang đo Bloom truyền thống và tu chính 9

Hình 2.2: Kỹ thuật Stemming và Lemimaf1ZafIOn c5 + £++£sekssesseesee 19 Hình 2.3: Minh hoạ kỹ thuật Stemming - - <2 1x k** E+kEsskEskesskeskrree 20

Hình 2.4: Minh họa kỹ thuật LemmatiZa(1OI - - 5 5 2c 3+ +*se+seexeeerseesrs 21

Hình 2.5: Siêu mặt phẳng SVM -¿- 2-©22222222E22122112711211 2112211211211 crk 24

Hình 2.6: Mô hình tổng quát phương pháp Ensemble Learning - 26

Hình 2.7: So sánh tương quan giữa phân loại riêng lẻ với bagging và boosting 28

Hình 3.1: Sơ đồ phân rã chức năng 2-2-2 £+£+EE+EE£EE+2EE+EEEEEtrEerrkrrkerkerex 34Hình 3.2: Sơ đồ usecase tổng quát của hệ thống ¿- ¿+ s++cx2zxvrxesrez 34

Hình 3.3: Đặc ta usecase thêm câu hỎI - - 22 SE S221 EE++£szeeeeeezsz 35

Hình 3.4: Biểu đồ tuần tự thêm câu hỏi 7c55ccccverrrrrrkkrrrrrrrirrrrrrrieg 36Hình 3.5: Biểu đồ lớp thêm câu hỏi - 2: 2¿22£2S£2E£+EE£2EE2EEtEEE+Exezrxerxesree 37

Hình 3.6: Đặc ta usecase import câu hỎi - s22 S< s32 EE+eExeereeereeereerererrre 38

Hình 3.7: Biểu đồ tuần tự import câu hỏi ¿2-2 E+SE+EE+E£+E+E+Eerkerxerxersrree 39Hình 3.8: Biểu đồ lớp import câu hỏi -2¿©2¿©5+22S+2£+2E++£x++zxezrxerxesrxe 40

Hình 3.9: Đặc tả usecase chỉnh sửa câu hỎi - - - 5555555 + *+++££++zee+eszeeeese 41

Hình 3.10: Biểu đồ tuần tự chỉnh sửa câu hỏi c5c-c55cccccxerrrrtrrrrrkrrree 42Hình 3.11: Biểu đồ lớp chỉnh sửa câu hỏi 5: 5£ S5 E2 ££2££+E£EerEerxerxerszxee 43

Hình 3.12: Đặc ta usecase xóa câu hỏỎi + 1111111222111 111 9 11 key, 44

Hình 3.13: Biểu đồ tuần tự xóa câu hỏi -cccccccvtterrttrrrrtirrrrrirrrrrrree 45Hình 3.14: Biểu đồ lớp xóa câu hỏi 22 5¿©5+2E++EE+2Ext2EEtrEterxezrxerreeree 46Hình 3.15: Đặc tả usecase tạo đề thi - :-cccccccxtttrttirtrrirrrtiirrrrirrirrieo 47

Hình 3.16: Biểu đồ tuần tự tạo để thi -¿ ccscctcrrrrtrrrrrtrirrrrrriirrrrririrrrre 49

Hình 3.17: Biểu d6 lớp tạo đề thi -¿- 2-52 2E SEeEEEEEEEEEEEEEEEEEEEEEEEEEEkerkerkrree 50Hình 3.18: Đặc tả usecase chỉnh sửa dé thi - - 5-5 s+x+EEE+E+EEEE+E+EeEErkeEereresree 51Hình 3.19: Biểu đồ tuần tự chỉnh sửa để thi cccc-c5ccccccxerrrrtrrerrrrrrre 52Hình 3.20: Biểu đồ lớp chỉnh sửa đề thi . 2: 22 5222+2E+tzxerxezrxerreeree 53

Hình 3.21: Đặc tả usecase xóa đề thi - 5c tt x EEEkEEEEEEEEEEEEEEkrrrkrrerkrry 54

Trang 12

Hình 3.22: Biểu đồ tuần tự xóa đề thi ccccccvttttktirtrrtrrrrtrirrrriirrrrrrieo 55

Hình 3.23: Biểu đồ lớp xóa đề thi ¿2-52-5222 E2EEEEEEEEE2E122121 21121121 re, 56

Hình 3.24: Đặc tả usecase thi trực tuyến bac caeeeeeesaacececeeessaeeeceseesseeececeessaaeececeeestaeeeeeees 57

Hình 3.25: Biéu đồ tuần tự thi trực tuyến oe.ecceeeeccsseessessecsessesseeseessessesseeseseeseeseess 58

Hình 3.26: Biểu đồ lớp thi trực tuyến - 2-2 £+E+SE+EE+EE£EEEEEEEEEEerEerkerkerkrree 59 Hình 3.27: Đặc tả usecase thống kê kết Qua 2-2 2 2+E£+E£EerEerxerxersrree 61 Hình 3.28: Biểu đồ tuần tự thống kê kết quả -¿ 2¿2+¿©2++2x+2cx+zxezresrez 62 Hình 3.29: Biểu đồ lớp thong kê kết quả - 2:2 5¿2++2++2x++£x+rxzxesrez 63

Hình 3.30: Mô hình thực thé kết hợp (ERD), 2- 2 2 2+5£+s£+E+zx+zxerxersxez 64

Hình 3.31: Luồng màn hình tông quan của quản trị viên và giáo viên 66

Hình 3.32: Luồng màn hình tông quát của thí sinh 2-2 2s szx+z++zszs+2 67 Hình 4.1: Sơ đồ xử lý của thuật todtt.c.cccccecccccccssesesseseesessessessessessessessssssessesseesesseeee 70 Hình 4.2: Tổng hợp độ chính xác của 7 mô hình phân loại -‹ «+ 74

Hình 4.3: Tổng hợp F1-Score của 7 mô hình phân loại ¿2 s2 szsz>s+ 75 Hình 4.4: Mô tả cách xử lý điểm dữ liệu mới 5-2 2 ++s£+x+zxezx+zxezsse2 76 Hình 4.5: Tính năng tự động phân loại trong soạn thảo câu hỏi - 77

Hình 4.6: Giao diện huấn luyện mô hình theo phương pháp Online Learning 78

Hình 4.7: Giao diện chọn câu hỏi từ ngân hàng câu hỏi dé huấn luyện mô hình 78

Hình 4.8: Giao diện tổng quan theo dõi các yếu tô của mô hình . - 79 Hình 5.1: Sơ đồ kiến trúc hệ thống 2-22 2¿©5+2E++EE+2EEt2EEtEEEerxezrxerresree 80

Hình 5.2: Quy trình CI/CD trên gitlab - óc 3 3211311111 rrrierrrerkrree 81

Hình 5.3: Website dành cho quan tri viÊn/g1áo VIÊN ¿5c + stress 82

Hình 5.4: Website dành cho học sinh 5 <2 5 S322 EE+ssseeeeeeeeezse 82

Hình 5.5: Giao diện quản lý danh sách câu hỏi 5c 5c S<£+sc<sessssesses 83

Hình 5.6: Lựa chọn loại câu hỏi cần thêm - - 6 SE t+E£EE+E£EE+EvEEeEerxererrers 84 Hình 5.7: Kết quả phân loại tự động câu hỏi -¿¿©+2©s++x++zxzxesrsz 84

Hình 5.8: Giao diện Preview câu hỎi - 2< 2S 21119221312 ng ng nen 85 Hình 5.9: Giao diện sau khi tạo câu hỏi thành công 55 ++<*++s+sxxsxs 85

Hình 5.10: Giao diện import câu hỎI c1 3+ 133113 EESESEerseereeereere 86

Trang 13

Hình 5.11: Kết quả sau khi import câu hỏi 2-2 5¿©2+¿2++2x+2£x++zxezxesrsz 87Hình 5.12: Giao điện quản lý để thicsc ceeccccccccccessesssesssessssseessecsusssessecssecsuessesssecsseess 87Hình 5.13: Giao diện tao template để thi eee ceccecccccsecsssesessecsessssesetsecersessesesseeeseesenes 88Hình 5.14: Giao diện điền thông tin đề thi - 2-22 S¿22x2E£t£x+ezxezrxrrreeree 88

Hình 5.15: Giao diện chọn nhóm, thí sinh cho đề thi -c-ccc+ccscce+ 89

Hình 5.16: Giao diện chọn thi sinh dé GIAO bài th1 - c ĂS St ssereeeree 89Hình 5.17: Giao điện chọn câu hỏi cho để thi 6-5 s5 +x£EE+E£EE+EvExeEerxerrxers 90Hình 5.18: Giao điện chọn câu hỏi cho dé thi theo cách thủ CÔNnG - 90Hình 5.19: Giao điện tạo đề thi tự động ¿2 + x+EE+EE+E+EEEEEerkerkerkerkrree 91Hình 5.20: Giao diện chon template cho đề thi -2- 22 5 ©+2x+2zx2z++zx+srsz 91Hinh 5.21: Giao dién cai dat cac yếu tỐ CỦa đỀ con HT 1 E111 11x cExrkrkee 92Hình 5.22: Giao diện hién thị kết quả sau khi tạo đề thi -. ¿52 5 5552552 92Hình 5.23: Giao diện các đề thi được giao cho thí sinh -«++s<<+ex+secses 93Hình 5.24: Hướng dẫn và quy chế thi - 2-2: s¿©5+2++£x+2Ext2EEtEx+erxesrxerreeree 93

Hình 5.25: Giao diên thi trực tuyến -¿ 2© +2+EE+EE+EEEEESEEEEEerEkrrkerkerkrrex 94

Hình 5.26: Giao diện làm bài và nut submit đỀ thi - - - + 2s +£e+x+Eez+zxzxez 94

Hình 5.27: Giao diện hiên thị kết quả sau khi thi - 2-2 2 s2 + s+z++£sss2 95

Hình 5.28: Giao diện quản lý lịch sử tH1 - 5 5-5535 ****++‡EE+veeEeeeeeeeerseeers 95

Hình 5.29: Giao diện chỉ tiết lịch sử thi theo từng đề - 5c ©cz+cs+cx+cxczsz 96Hình 5.30: Giao điện xem lại kết quả làm bai th1 - 555 £<+sscxseeseerss 96Hình 5.31: Giao diện xem kết quả chi tiết sau thi -2- 2 + x+2s£+£z+£x+zxzsz 97Hình 5.32: Thống kê điểm số theo từng đề thi 2- 2 2 2 2+s2+E+£x+£x+rxerssez 97Hình 5.33: Thống kê phan trăm mức độ hoàn thành câu hỏi theo thang đo 98Hình 5.34: Thống kê tỉ lệ sử dung và tỉ lệ trả lời đúng/sai của câu hỏi 98

Hình A.1: Phân ra usecase quan ly câu hỏi - - «+ set 106

Hình A.2: Phân rã usecase quản lý đề thi - 2 5¿2c++2x++zx+zzxzrxerseee 106

Hình A.3: Phân rã usecase quản lý môn học + + +s + + *sskrsereerseerreeres 107

Hình A.4: Phân rã usecase quản lý người dùng - - 5c + sssetrserreerresrs 107

Hình A.5: Phân rã usecase quản lý thí sinh - -. 55+ ++s + *++s++eeeeeeeeersesss 108

Trang 14

Phân rã usecase quan lý nhóm thí sinh 5+ «<++£+<x+e<+s 108

Phân rã usecase quản ly phân quyên : 2 5¿+++z++zx+zcxzz 109Phân rã usecase huấn luyện mô hình -2- 2 ¿+2+zcs+z 109Phân rã usecase làm bài thi trực tuyến -¿©2+s+cs+cxzxezrsrred 110

Giao diện trang dashbOar - -< + 311323119 ve riep 111

Giao điện trang quan lý người dùng của hệ thong wees 112Giao diện trang tạo người dùng hệ thống ¿ 2 5255552 112

Giao diện trang quản lý thí sinhh 5 55 + x2 gi rerey 113

Giao diện trang quản lý nhóm thi sinh 5++-s++ss+sx+eseersexrs 113

Giao diện quản lý phân quyềhn - 22 2 2+E+£E2E£EEeEErEzrerrxee 114

Giao diện quản lý môn học - ¿+ S+ + + *+E+veeeereerrereerrexrs 114

Trang 15

DANH MUC BANG

Hành vi theo từng cấp độ nhận thức của thang do Bloom 8Bảng định nghĩa, phân loại từng cap độ của thang đo Bloom 11

So sánh giữa tu luận va trac nghiỆm 5 + * + series 14

Bảng ví dụ phương pháp Max Voting ccSccsssssseeresseres 26 Bang ví dụ phương pháp AV€ragð1ng -s csknhnnnnnngngiey 27

Bang vi dụ phương pháp Weighted AveragIng cccccsssssss 27

Tổng hợp các chức năng của hệ thống liên quan -. 5- 5+: 31

Các tác nhân của hệ thống -¿ 2¿- 2£ 522+22EE2EEtEEEtEE+2EEvzrxerxecree 31Danh sách các chức năng của hệ thống -. ¿ 5¿©2s©z++cxz+cse2 33

Sự phân bố theo các mức độ của bộ dữ liệu sử dung cho thuật toán 69Mau câu hỏi từ hai tập dữ liệu đầu tiên 2 5¿©cs©ccccxzccxe2 70

Tổng hợp kết quả huấn luyện với 6 mô hình . ¿ ¿5252 73

Kết quả khi thực hiện tối ưu hóa tham số cho mô hình 73

So sánh kết quả mô hình PA, SGD va Ensemble - 2-5 25s 74

Trang 16

DANH MỤC TỪ VIET TAT

STT Ký hiệu chữ viết tắt Ý nghĩa

1 KTDG Kiểm tra đánh giá

2 NLP Nature Language Processing

3 NLTK Natural Laguage Tool Kit

4 PA Passive Aggressive

5 SGD Stochastic Gradient Descent

6 SVM Support Vector Machine

7 TE-IDF Term Frequency — Inverse

Document Frequency

8 TN Trắc nghiệm

9 TNKQ Trac nghiém khach quan

Trang 17

TOM TAT KHÓA LUẬN

Trong lĩnh vực giáo dục, các hệ thống quản lý ngân hàng câu hỏi và đềthi hiện nay cần phải giải quyết rất nhiều về chuẩn mực của đề thi và thang đocâu hỏi Đề tài này nhằm xây dựng hệ thống quản lý câu hỏi theo sáu cấp độtrong thang đo nhận thức Bloom (nhớ, hiểu, vận dụng, phân tích, đánh giá, sángtạo) và tổ chức thi trắc nghiệm trực tuyến giúp đảm bảo được các yếu tố về sự

hiệu quả, tính khách quan và độ tin cậy trong việc đánh giá thí sinh Từ đó có

thê phân tích, thống kê kết quả ra đầu ra một cách hiệu quả nhằm cải thiện, nâng

cao phương pháp dạy và học.

Hệ thống quản lý muốn hướng đến quản trị viên, giáo viên trong trườnghọc, giúp cho các Thay, Cô thuận tiện trong việc quan lý ngân hang câu hỏi, déthi, kỳ thi đễ dàng và nhanh chóng Phân hệ thi trực tuyến của hệ thống hỗ trợhọc sinh có thé kiểm tra trực tuyến, dé dang làm bài thi và xem kết qua sau khikiểm tra

Trong quá trình thực hiện đề tài, chúng tôi đã tìm hiểu và sử dụng các

thuật toán học máy khác nhau kết hợp với các phương pháp xử lý ngôn ngữ tự

nhiên như kỹ thuật phân loại từ trong câu (Part of Speech), kỹ thuật biến đổi từ

về dạng gốc (Stemming), bé ngữ (Lemmatization) dé ap dung vao bai toan tu

động phân loại câu hỏi theo thang do Bloom Sau quá trình áp dung, phân tích

và so sánh giữa các thuật toán khác nhau, nhóm chúng tôi đã lựa chọn sử dụng

thuật toán Passive Aggressive kết hợp với thuật toán Stochastic GradientDescent dé tạo ra mô hình có độ chính xác cao nhất là 80%

Cuối cùng sau khi hoàn thành, chúng tôi đã xây dựng được hệ thống quản

lý ngân hàng câu hỏi và đề thi trên nền tảng website Áp dụng được thuật toán

máy học vào bai toán phân lớp văn bản, hỗ trợ tự động phân loại các câu hỏi

theo các mức độ của thang đo Bloom, ngoài ra hệ thống còn cho phép mở rộng

và huấn luyện lại mô hình từ nguồn dữ liệu mới Đồng thời xây dựng một hệ

thống thi trực tuyến cho phép thi sinh có thé thi và rèn luyện kỹ năng theo từng

Trang 18

đề tài, từ đó thống kê, phân tích để có thể đánh giá một cách chính xác nhất kết

quả học tập.

Đề tài này là phần nhỏ đóng góp cải tiễn trong hoạt động giáo dục nhưng

van còn nhiều hạn chế, mong quý Thay, Cô và các bạn đón nhận, đánh giá vàgóp ý chân thành dé đề tài được hoàn thiện hơn

Trang 19

Chương 1 TONG QUAN DE TÀI

1.1 Tén dé tai

Tên tiếng việt: Xây dựng hệ thống câu hỏi và thi trac nghiệm trực tuyến theo thang

đo nhận thức Bloom.

Tên tiếng anh: Building question bank and online multiple-choice examination

system based on Bloom’s Taxonomy.

1.2 Dat van dé

Trong những năm gan đây, hình thức thi cử ở nước ta đã có nhiều thay đổi dé đápứng được chủ trương đổi mới việc kiểm tra, đánh giá kết quả học tập của Bộ Giáo

dục và Đào tạo, tiêu biểu là việc áp dụng phương thức thi trắc nghiệm khách quan

(TNKQ) ở các bậc học trong hệ thống giáo dục [1] Đề thi TNKQ có phạm vi rộng,bao quát nội dung của chương trình học vì thế tránh được tình trạng học tủ, học vẹt,ngoai ra còn có thể kiểm tra được nhiều kiến thức, nhiều khía cạnh trong một thờigian ngắn Do đó thông qua đề thi trắc nghiệm (TN), người học có thể tự đánh giálại bản thân để có những thay đôi tích cực trong học tập và các nhà giáo dục dễ

dàng đánh giá được trình độ số đông, có cái nhìn khách quan hơn về nội dung

chương trình và các thức tô chức đào tạo

Tuy nhiên đối với xu thế phát triển của nền giáo dục hiện đại, người học không chỉcần lĩnh hội các kiến thức mà còn phải biết vận dụng kiến thức đã học hữu hiệu,ứng dụng và sáng tạo trong chính cuộc sống thực tế hằng ngày Chính vì thế cácchuẩn kết quả năng lực và đánh giá học tập cần xây dựng trên một hệ thống cóthang bậc khoa học được công nhận và ứng dụng sao cho có thê phản ánh được mức

độ đạt được mục tiêu của chương trình học là cần thiết

Thang đo phân loại nhận thức của Bloom đã ra đời từ lâu và được ứng dụng nhiều

trong các lĩnh vực của giáo dục Vận dụng thang đo này vào phương pháp TNKQ sẽ

giúp giáo viên đễ dàng xây dựng được hệ thống ngân hàng câu hỏi đáp ứng được

các yêu câu của đê kiêm tra, chuân kêt quả năng lực và đánh giá kêt quả.

Trang 20

Bên cạnh việc đổi mới các phương pháp giảng day và đánh giá thì việc ứng dụng

Công nghệ thông tin cũng được xác định là một trong những nhiệm vụ trọng tâm dé

đổi mới và phát triển giáo dục [2] Tin học hóa sẽ góp phan nâng cao chất lượng dạy

và học Trong khoa cử cũng vậy, dé đảm bao chất lượng của một kỳ thi, tính kháchquan, chính xác và khoa học phải được đặt lên hàng đầu

Sự kết hợp giữa phương pháp TNKQ và tin học hóa không những đáp ứng được cácyếu tô đó mà còn giúp tiết kiệm thời gian, chi phí trong công tác tổ chức và quan lý,đồng thời kết quả mang lại sẽ rất nhanh chóng và chính xác

Một trong những thành phần quan trọng ảnh hưởng trực tiếp đến kết quả, chất lượngcâu hỏi là giai đoạn phân loại câu hỏi Đã có nhiều phương pháp tiếp cận được đưa

ra cho bài toán này, tuy nhiên phương pháp áp dụng mô hình học máy vào phân loại

câu hỏi được áp dụng nhiều hơn cả Chính vì lý do đó nhóm chúng tôi nghiên cứu

và xây dựng một số mô hình phân loại câu hỏi vào đề tài này làm công cụ hỗ trợ để

hệ thống được vận hành một cách khoa học, dễ dàng

Với những lý do trên, nhóm tác giả đã chọn dé tài: “Xây dựng hệ thống quan lýcâu hỏi, tổ chức thi trắc nghiệm trực tuyến theo thang đo nhận thức củaBloom” làm khóa luận tốt nghiệp

1.3 Mục tiêu nghiên cứu của đề tài

Từ những phân tích trên, nhóm chúng tôi xác định mục tiêu nghiên cứu của đề tài

như sau:

- Đối với hệ thống quản lý câu hỏi và thi trực tuyến:

+ Nghiên cứu tổng quan về lý thuyết TNKQ, các loại câu hỏi được sử dụng

để xây dựng dé thi TNKQ

+ Tim hiểu, khảo sát hệ thống tương tự dé nghiên cứu, xây dựng hệ thống hỗ

trợ bộ phận quan tri viên của các cơ sở đào tạo, trường học trong việc quan

ly câu hỏi và tô chức thi trac nghiệm trực tuyên.

- Đối với việc phân loại theo thang đo Bloom:

Trang 21

+ Ung dụng tiêu chuẩn của thang đo nhận thức Bloom trong quá trình tạo lập

ra bộ câu hỏi, đê thi đê nâng cao chuân đánh giá học tập của người học.

+ Nghiên cứu, tạo ra công cụ dé hỗ trợ tự động phân loại câu hỏi theo các

mức độ nhận thức của thang đo.

1.4 Đối tượng và phạm vi nghiên cứu của đề tài

1.4.1 Đối tượng nghiên cứu

- Hệ thống quan lý muốn hướng đến quản trị viên, giáo viên trong trường học,

giúp cho các Thay, Cô thuận tiện trong việc quản lý ngân hàng câu hỏi, đề thi

dễ dàng và nhanh chóng.

- Phân hệ thi trực tuyến của hệ thong hỗ trợ học sinh có thé kiểm tra trực tuyến

Dé dang làm bài thi và xem kết quả sau khi kiểm tra

1.4.2 Pham vi nghiên cứu

- Tìm hiểu về các loại câu hỏi TNKQ

- Tìm hiểu, ứng dụng các tiêu chuân của thang đo nhận thức Bloom vào việc

xây dựng câu hỏi.

- Xây dựng và phát triển hệ thống trên nền tảng website với các chức năng cơ

bản:

+ Quản lý danh sách môn học theo từng chương

Quản lý ngân hàng câu hỏi

+ Quản lý ngân hàng đề thi

Tổ chức thi trực tuyến

- Tìm hiểu các thuật toán máy học dé hỗ trợ trong việc tự động phân loại câu

hỏi theo từng thang đo nhận thức.

1.5 Giá thuyết khoa học

Nếu có một hệ thống quản lý ngân hàng câu hỏi TNKQ và tổ chức thi trực tuyến

được lưu trữ theo chuẩn thang do Bloom phù hợp với nội dung của chương trình cácmôn học thì sẽ góp phần nâng cao hiệu quả kiêm tra và đánh giá chất lượng

Trang 22

1.6 Phương pháp nghiên cứu

- Phương pháp nghiên cứu lý thuyết:

+ Phương pháp thu thập tài liệu: thông qua quá trình thu thập tải liệu từ các

nguôn như sách báo, mạng internet, tong hợp, nghiên cứu các tài liệu, ngôn

ngữ và công nghệ liên quan.

+ Phương pháp phân tích, thiết kế hệ thống: dựa trên những thông tin thu

được dé tiến hành phân tích, thiết kế hệ thống cho những chức năng chínhcủa website, từ đó xây dựng thông qua quá trình mô hình hóa hệ thống,

chuẩn hóa cơ sở đữ liệu một cách phù hợp

- Phương pháp nghiên cứu thực nghiệm:

+ Phân tích yêu cầu thực tế và xây dựng các bước phân tích hệ thống dé hỗ

trợ lập trình, xây dựng ứng dụng Đánh giá kết quả đạt được, triển khai và

bảo trì.

1.7 Đóng góp của đề tài

- Làm tài liệu tham khảo trong việc đôi mới kiểm tra và đánh giá trong giáo duc

- Sử dụng hệ thống dé lưu trữ ngân hàng câu hỏi theo chuẩn thang do Bloom, cho

phép người học có thé tự kiểm tra, đánh giá được kết quả học tập của mình

- Hỗ trợ công cụ phân loại câu hỏi tự động theo thang đo Bloom

1.8 Câu trúc của dé tai

Từ những mục tiêu trên, chúng tôi đã thực hiện các công việc và kêt quả được thê hiện trong báo cáo luận văn này theo câu trúc như sau:

Chương 1 Tổng quan đề tai: tìm hiểu nhu cau thực tế và lý do thực hiện đề

tài, đồng thời giới thiệu sơ lược vê đê tài và mục tiêu phải đạt được.

Chương 2 Cơ sở lý thuyết: mô tả những lý thuyết liên quan về thang đo

nhận thức Bloom, các loại câu TNKQ, những kiến thức nền tảng về các phương

pháp xử lý ngôn ngữ và thuật toán máy học sử dụng trong việc xây dựng mô hình phân loại câu hỏi.

Trang 23

Chương 3 Khảo sát, phân tích thiết kế hệ thống: tìm hiểu, đánh giá các đềtài nghiên cứu và hệ thống liên quan Từ đó xác định cụ thé các chức cần có dé thựchiện phân tích thiết kế và vẽ sơ đồ chức năng của hệ thống.

Chương 4 Xây dựng mô hình phân loại câu hỏi: mô tả các phương pháp

xây dựng mô hình thuật toán máy học dùng đề phân loại câu hỏi trong đề tài

Chương 5 Triển khai hệ thống: mô tả các bước trién khai hệ thống và trình

bày một số kết quả đạt được sau quá trình thực hiện đề tải

Chương 6 Kết luận và hướng phát triển: tóm lại các vấn đề đã giải quyết,

nêu ra những khó khăn và mặt hạn chế của dé tài và đề xuất hướng phát trién trong

tương lai.

Trang 24

Chương 2 CƠ SỞ LÝ THUYET

2.1 Thang đo nhận thức của Bloom

2.1.1 Thang đo Bloom truyền thống

Trong lĩnh vực giáo dục, thang cấp độ tư duy có thể được xem là một công cụ nền

tang dé từ đó xây dung, do lường, sắp xếp các mục tiêu của các chương trình giáodục và quy trình đào tạo Thang đo về các cấp độ tư duy đầu tiên được Benjamin

S.Bloom, một nhà tâm lý học người Mỹ đưa ra vào năm 1956 [3] Trong thang đo

này, ông đưa ra 6 cấp độ nhận thức từ đơn giản đến phức tạp Có thể tóm lược như

sau:

Cấp độ Hành vi của nhận thức

Kiến thức Sự ghi nhớ tới các chủ đề phô biến và đặc biệt, các phương(Knowledge) | pháp, quá trình, và sự ghi nhớ các mô hình, cấu trúc, bối cảnh

Lĩnh hội Khả năng năm bắt thông tin, hiểu nội dung, diễn giải, diễn

(Comprehension) | dịch, suy diễn

Đánh giá Đánh giá vé chat lượng của sự vật dựa trên giá tri, điêu kiện

(Evaluation) cần và đủ, logic hoặc công dụng

Bảng 2.1: Hành vi theo từng cấp độ nhận thức của thang đo Bloom

Trang 25

2.1.2 Thang đo Bloom tu chính

Thang đo Bloom truyền thống được sử dụng rộng rãi trong giảng dạy khoảng 50năm trước khi được đề xuất điều chỉnh vào năm 2001 bởi 2 tác giả chính là Lorin

W.Anderson và David R.Krathwohl [4] Trong thang đo Bloom tu chính, các tác gia

đã đề xuất các mức độ nhận thức lần lượt là: nhớ (remembering), hiểu

(understanding), vận dung (applying), phân tích (analyzing), đánh giá (evaluating)

và sáng tạo (creating) Có ba sự thay đổi đáng lưu ý trong sự điều chỉnh này so vớithang đo Bloom truyền thống: cấp độ tư duy thấp nhất là Nhớ thay vì Biết, cấpTổng hợp được bỏ đi va đưa thêm Sang tạo vào mức cao nhất, các danh động từ

thay cho các danh từ.

1956 2001

Hình 2.1: Sự khác nhau giữa thang đo Bloom truyền thống và tu chính

Bảng sau đây cung cấp nội dung giải thích gắn gọn, đồng thời cho một số ví dụ và

từ khóa thường dùng đối với mỗi cấp độ trên thang Bloom tu chính (Bloom’s

Revised Taxonomy).

Cấp độ Ví dụ & Từ khóa

Trang 26

Nhớ: khôi phục, ghi nhận và nhớ

lại các kiên thức có liên quan

Ví dụ: viết lại công thức, đọc lại một bài thơ,

mô tả lại một sự kiện, nhận biết phương án

đúng

Từ khóa: nhắc lại, mô tả, liệt kê, trình bày,

chọn lựa, gọi tên, nhận diện

Hiểu: nam bat được ý nghĩa của

thông tin, thể hiện qua khả năng

diễn giải, suy diễn, liên hệ, khái

quất

Vi dụ: giải thích một định luật, phân biệt cách

sử dụng các thiết bị, viết tóm tắt một bài báo,trình bày một quan điểm

Từ khóa: giải thích, tóm tắt, phân biệt, mở

rộng, khái quát hóa, cho ví dụ, nhận định, so sánh, sap xêp

minh, giải thích, xây dựng, lập kế hoạch

Phân tích: chia thông tin, kiến

thức thành các phần nhỏ, sau đó

xác định cách các thành phần nhỏ

đó liên quan với nhau và với một

câu trúc hoặc mục đích tông thê

Ví dụ: lý giải nguyên nhân thất bại của mộtdoanh nghiệp, hệ thống hóa các văn bản pháp

qui, xây dựng biểu đồ phát triển một doanh

nghiệp.

Từ khóa: Phân tích, lý giải, so sánh, lập biêu

đồ, phân biệt, minh họa, xây dựng mối liên

hệ, hệ thống hóa

Đánh giá: đưa ra nhận định, phán

quyết của bản thân đối với thông

tin dựa trên các chuân mực, tiêu

Ví dụ: phản biện một nghiên cứu, bài báo;

đánh giá khả năng thành công của một giải

10

Trang 27

chí pháp; chỉ ra các điêm yêu của một lập luận

Từ khóa: Đánh giá, cho ý kiến, bình luận,tổng hợp, so sánh

Sáng tạo: xác lập thông tin, sự vật | Ví dụ: thiết kế một mẫu nhà mới, xây dựng

mới trên cơ sở những thông tin, sự | một công thức mới, sáng tạo một bài hát,

vật đã có Từ khóa: thiết lập, tổng hợp, xây dựng, thiết

kê, sáng tác, đê xuât

Bảng 2.2: Bảng định nghĩa, phân loại từng cấp độ của thang đo Bloom

2.1.3 Ứng dung thang do Bloom trong kiểm tra, đánh giá năng lực

Dé có thé ứng dụng thang đo Bloom vào giáo dục, chúng ta nên sử dụng các động

từ có tính nhấn mạnh đề chỉ mục tiêu hoặc khả năng phải làm được một việc gì đó

[5] Sau đây liệt kê một SỐ động từ thường được sử dụng cho từng bậc của quá trình

nhận thức đã được đề cập theo thang đo Bloom tu chính nêu trên (mục 2.1.2)

e Nhớ (Remember): trích dan (cite), định nghĩa (define), mô tả (describe), xác

định (identify), liệt kê (list), gọi tên (name), phác thao (outline), nhắc lại(recall), tường thuật (report), tái tạo (reproduce), thể hiện (show), chọn lựa

(select), liên hệ (relate),

e Hiểu (Understand): phân loại (classify), so sánh (compare), đối chiếu

(contrast), chứng minh (demonstrate), giải thích (explain), mở rộng (extend),

minh hoa (illustrate), suy luận (infer), giải thích — làm sáng tỏ (interpret),

phác thao (outline), liên hệ (relate), diễn đạt lại (rephrase), tóm tắt

(summarize), dịch (translate),

e Van dung (Apply): ứng dung (apply), xây dung (build), lựa chon (choose),

vẽ - dựng (construct), phát triển (develop), xác định (identify), chất van

(interview), tổ chức (organ1ze), lập kế hoạch (plan), chọn lua (select), giảiquyét (solve), tối ưu (utilize),

lãi

Trang 28

e Phân tích (Analyze): phân tích (analyze), sắp xếp (arrange), phân loại

(categorize, classify), so sánh (compare), kết luận (conclusion), phân giải(deconstruct), đò tim (detect), vẽ biểu đồ (diagram), phân biệt (differentiate,

discriminate, distinguish), giải thích (explain), xem xét (examine), quan sat (inspect), khảo sat (survey),

e Đánh giá (Evaluate): đánh giá (appraise, assess), tranh luận (argue), so sánh

(compare), kết luận (conclude), xem xét (consider), đối chiếu (contrast),thuyết phục (convince), phê bình (criticize), xác định (determine), chứngminh (justify), xếp hang (rank), đề xuất (recommend),

e Sang tao (Create): sap xép (arrange), tap hop (assemble), xay dung (build),

thu thap (collect), két hop (combine), tao nén (create), thiét ké (design), phat

trién (develop), tao ra (generate), đưa ra gia thuyét (hypothesize), tích hợp

(integrate), phát minh (invent),

2.2 Tong quan về trac nghiệm khách quan

2.2.1 Tw luận và trắc nghiệm khách quan

TN theo nghĩa rộng là một hoạt động được thực hiện để đo lường năng lực của

các đối tượng nào đó nhằm mục đích xác định

Trong giáo dục, TN được tiến hành thường xuyên ở các kỳ thi, kiểm tra để đánh

giá kết quả học tập, giảng dạy đối với một phần của môn học, toàn bộ môn học, đối

voi cả một cấp học, hoặc dé tuyển chọn một số người có năng lực nhất vào một

khóa học.

TN viết thường được chia thành 2 loại: trắc nghiệm tự luận và trắc nghiệm khách

quan.

2.2.1.1 Trắc nghiệm tự luận

Là phương pháp kiểm tra gồm các câu hỏi dạng mở (loại câu hỏi này không

chỉ có một câu trả lời hay một kiêu trả lời mà có thê có nhiêu cách, nhiêu hướng

12

Trang 29

trình bay) mà học sinh phải tự mình trình bày ý kiến trong một bài viết dai dé giảiquyết vấn đề mà câu hỏi nêu ra.

2.2.1.2 Trắc nghiệm khách quan

Là nhóm các câu hỏi trong đó một câu nêu ra một vẫn đề cùng một thông tincan thiết đòi hỏi học sinh phải viết câu trả lời ngắn hoặc lựa chọn một câu trả lời,hay phải điền thêm một vai từ

2.2.1.3 So sánh trắc nghiệm tự luận và trắc nghiệm khách quan

Loại câu hỏi tự luận thường đòi hỏi học sinh phải viết nhiều câu dé trả lời, nókhông có một câu trả lời đúng hay một kiêu dé trả lời Dé đánh giá được một cáchchính xác và có chất lượng, một bài tự luận phải được chấm bởi người có kinh

nghiệm và biểu biết về lĩnh vực của môn học tương ứng Bài trắc nghiệm tự luận

không thê đánh giá một cách tuyệt đối là đúng hay sai

Trong khi đó TNKQ thì có các ưu điểm như: khảo sát được số lượng lớn thísinh, kết quả nhanh, điểm số đáng tin cậy, khách quan vì không phụ thuộc vàongười chấm Bên cạnh những ưu điểm thì TNKQ cũng có một vài hạn chế chănghạn như: thí sinh có khuynh hướng đoán mò đáp án, không thấy rõ diễn biến tư duy

của thí sinh, khó soạn đê và tôn công sức.

Bảng so sánh dưới đây sẽ cung câp cái nhìn rõ ràng hơn giữa tự luận và trắc nghiệm:

Trang 30

Việc sáng tạo khi trả lời không bị hạn chế bởi một

khung câu hỏi có sẵn

Đề thi phủ kín nội dung học x

It may rủi do trúng tủ hay trật tủ x

It tốn công cham thi x

Khach quan trong cham thi x

Áp dụng được công nghệ mới trong việc nâng cao chất

lượng đề thi, giữ bi mật dé thi, hạn chế quay cóp khi thi,

hạn chế tiêu cực trong chấm thi và giúp phân tích kết

quả thi

Bảng 2.3: So sánh giữa tự luận và trắc nghiệm

2.2.2 Một số dạng câu hỏi trắc nghiệm khách quan thường gặp

2.2.2.1 Trắc nghiệm đa lựa chọn (multiple-choice question)

Là dang TN thông dụng nhất hiện nay Loại này có một câu phát biéu căn bảngọi là câu dẫn và có nhiều câu trả lời để học sinh lựa chọn, trong đó chỉ có một câutrả lời đúng nhất hay hợp lý nhất còn lại đều là sai, những câu trả lời sai là câu môi

hay câu nhiễu

- Ưuđiểm:

+ Có thé tiến hành kiểm tra đánh giá (KTĐG) trên diện rộng trong thời

gian ngắn+ Yếu tổ đoán mò, may rủi giảm nhiều nên học sinh phải xét đoán và

phân biệt kĩ càng trước khi trả lời, vì thế loại câu này có độ tin cậy cao

+ Đảm bảo tính khách quan khi cham

+ Phân tích được tính chat “môi” của câu hỏi

14

Trang 31

+ Tính chất gia tri tốt hơn, có thé do được kha năng nhớ, vận dụng, khả

năng suy diễn, tong quát hóa tạo điều kiện cho học sinh tự đánh giá

kết quả học tập của mình một cách chính xác

+ Có thé sử dụng phương tiện hiện đại để chấm bài và phân tích kết qua

- Nhược điểm:

+ Khó khăn trong việc biên soạn các câu hỏi, tôn nhiêu thời gian

+ Không đo được khả năng khéo léo, sáng tao của học sinh

- Phạm vi sử dụng: có thé dùng cho mọi hình thức KTĐG Rat thích hợp

cho việc đánh giá, xếp loại học sinh2.2.2.2 Trắc nghiệm đúng sai (true-false question)

Loại câu này được trình bày dưới dạng một phát biểu và học sinh phải trả lời

bằng cách chọn đúng hay sai

- Ưu điểm: đưa ra nhiều nội dung trong một thời gian ngắn, dé biên soạn

- Nhược điểm: có thé khuyến khích sự đoán mò nên khó có thể xác định sai

lầm chủ yếu của học sinh khi học một kiến thức cụ thê, độ tin cậy thấp

- Phạm vi sử dụng: thích hợp cho kiểm tra van đáp nhanh Thường sử dụng

khi không tìm được đủ phương án cho câu hỏi nhiều lựa chọn2.2.2.3 Trắc nghiệm điền khuyết (filling question)

Có thể có 2 dạng, chúng có thé là những câu hỏi với giải đáp ngắn, hay cũng

có thé gồm những câu phát biểu với một hay nhiều chỗ trống mà học sinh phải điền

vào một từ hay một cụm từ.

- Ưu điểm: dễ xây dựng và hoc sinh có cơ hội trình bày những câu trả lời

khác thường, phát huy sáng kiến, suy luận và khảo sát được khả năng luyệntrí nhớ Học sinh mất cơ hội đoán mò, nên câu hỏi có độ tin cậy cao hơn

- Nhược điểm: cách chấm điểm khó khăn và tốn nhiều thời gian, chủ yếu

kiểm tra khả năng ghi nhớ và nhận biết

- Phạm vi: thích hợp cho các môn ngoại ngữ, xã hội và nhân van

15

Trang 32

2.2.2.4 Trắc nghiệm ghép đôi (matching question)

Đây là loại hình đặc biệt của loại câu hỏi nhiều lựa chọn, trong đó học sinh

tìm cách ghép các câu trả lời ở trong cột này với câu hỏi ở cột khác sao cho phù

hợp.

- Ưu điểm: câu hỏi ghép đôi dễ xây dựng, hữu hiệu trong việc đánh giá khả

năng nhận biết các hệ thức hay lập các mối tương quan

- Nhược điểm: dễ trả lời thông qua việc loại trừ, không phù hợp cho việc

thâm định các khả năng như sắp đặt và vận dụng các kiến thức

- Phạm vi sử dụng: thích hợp với việc kiểm tra kiến thức cơ bản sau khi học

xong một chương, một chủ đề2.2.3 Độ tin cậy và độ giá trị của bài trắc nghiệm

Đề đánh giá chất lượng bài thi trắc nghiệm cần dựa trên nhiều yếu tố, trong đó độtin cậy và độ giá trị là những yếu tố đánh giá quan trọng của một đề thi

2.2.3.1 Độ tin cậy (Reliability)

Trắc nghiệm là một phép do: dùng thước đo là bai trắc nghiệm dé do lườngmột năng lực nào đó của học sinh Độ tin cậy của bài trắc nghiệm chính là đại lượngbiểu thị mức độ chính xác của phép đo nhờ bài trắc nghiệm

Độ tin cậy của bài TNKQ được xem như là một số đo về sự sai khác giữađiểm số quan sát được và điểm số thực của học sinh

2.2.3.2 Độ giá trị (Validity)

Độ giá trị của đề trắc nghiệm là đại lượng biểu thị mức độ đạt được mục tiêu

đề ra cho phép đo nhờ đề trắc nghiệm

Đề đề trắc nghiệm có độ giá trị cao cần phải xác định tỉ mỉ mục tiêu cần đoqua đề trắc nghiệm và bám sát mục tiêu đó khi xây dựng câu hỏi TNKQ

16

Trang 33

Đề đảm bảo tính giá trị của bài kiểm tra cần phải quan tâm đến tính toàn diện

của nó tức là cả chất lượng và số lượng Trong quá trình KTĐG phải đánh giá một

cách trung thực, khách quan và chính xác.

2.3 Xử lý ngôn ngữ tự nhiên

Xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP) là một trong những

lĩnh vực quan trọng của trí tuệ nhân tạo, được phát triển nhằm xây dựng các chươngtrình máy tính có khả năng phân tích, xử lý và hiểu ngôn ngữ con người [6] Một số

ứng dụng quan trọng của NLP có thể chỉ ra như: nhận dạng tiếng nói, tổng hợp

tiếng nói, truy xuất thông tin, trích chọn thông tin, tóm tắt văn bản tự động, Cácphần sau đây sẽ mô tả một vài kỹ thuật sử dụng trong các bài toán xử lý ngôn ngữ

tự nhiên.

2.3.1 Trích chọn đặc trưng TF-IDF

Thuật ngữ Term Frequency — Inverse Document Frequency (TF-IDF) là một

phương thức thống kê được biết đến rộng rãi dé xác định độ quan trong của một từtrong đoạn văn bản trong một tập nhiều đoạn văn bản khác nhau

TF-IDF xác định trọng số của một từ trong văn bản thu được qua thống kê thé

hiện mức độ quan trọng của từ này trong một văn bản, mà bản thân văn bản đang

xét năm trong một tập hợp các văn bản [7, 8] Giá trị của TF-IDF cao thể hiện độ

quan trọng cao và nó phụ thuộc vào số lần từ xuất hiện trong văn bản nhưng bù lại

bởi tần suất của từ đó trong tập dữ liệu Một vài biến thể của TF-IDF thường được

sử dụng trong các hệ thông tìm kiếm như một công cụ chính dé đánh giá và sắp xếp

văn bản dựa vào truy vân của người dùng.

Term Frequency (TF): là tan suất xuất hiện của một từ trong một đoạn văn bản

Vì các văn bản có thé có độ dai ngắn khác nhau nên một số từ có thể xuất hiệnnhiều lần trong một văn ban dai hon là một văn bản ngắn Như vậy, TF thường

được chia cho độ dài văn bản (tổng số từ trong một văn bản)

17

Trang 34

TƯŒ, 4) = max/f(w,d):w € d (1)

Trong đó:

e TF(t,d) — Tần suất xuất hiện của từ t trong văn bản d

e f(t,d) — Số lần suất hiện của từ trong văn bản d

e max{f(w,d):w € đ} — Số lần xuất hiện của từ có số lần xuất hiện

nhiều nhất trong văn bản d

Inverse Document Frequency (IDF): là nghịch dao tần suất của văn bản, giúpđánh giá tầm quan trọng của một từ Khi tính tần số xuất hiện TF thì các từ đều

được coi là quan trọng như nhau Tuy nhiên có một số từ thường được sử dụng

nhiều nhưng không quan trọng dé thê hiện ý nghĩa của đoạn văn Vì vậy ta cần giảm

đi mức độ quan trọng của những từ đó bằng cách sử dụng IDE:

“Id ePD:t e a)|

IDF(t,D) =

Trong đó:

e IDF(t,D) — Giá trị IDF của từ t trong tập văn bản D.

e |D| — Tổng số văn bản trong tập D

e l{d€D:t € d}| — Thẻ hiện số văn bản trong tập D có chứa từ t.

Cơ số logarit trong công thức này không làm thay đổi giá trị IDE của từ mà chỉthu hẹp khoảng giá trị của từ đó Việc sử dụng logarit nhằm giúp giá trị TF-IDF của

một từ nhỏ hon, do công thức tính TF-IDF của một từ trong một văn ban là thích của TF và IDF cua từ đó Công thức tính TF-IDF được xác định như sau:

Trang 35

2.3.2 Stemming và Lemmatization

Trong quá trình xử lý ngôn ngữ tự nhiên, chúng ta sẽ có nhu cầu so sánh các từ(token) với nhau, tuy nhiên không thể so sánh token đơn giản như việc so sánh hai

chuỗi “==” với nhau Đối với một số ngôn ngữ, tiêu biểu là tiếng Anh, mỗi từ có thé

có nhiều biến thé khác nhau Điều này làm cho việc so sánh giữa các từ là không thé

mặc dù về mặc ý nghĩa cơ bản là như nhau Ví dụ các từ “walks“, “walking“,

“walked” đều là các biến thé của từ “walk” và đều mang ý nghĩa là “đi bộ Dé giảiquyết cho những trường hợp này Lemmatization và Stemming chính là 2 kỹ thuật

Trang 36

2.3.2.1 Stemming

Stemming là kỹ thuật dùng để biến đổi 1 từ về dạng gốc (được gọi là stemhoặc root form) băng cách loại bỏ 1 số ký tự nằm ở cuối từ mà nó nghĩ rang là biến

thé của từ Người ta gọi các bộ xử ly stemming là Stemmer

Vi dụ: Sử dụng thư viện Natural Language Tool Kit (NLTK) dé so sánh việc

xử ly của các loại Stemmer phổ biến hiện nay bao gồm: PosterStemmer,

LancasterStemmer và SnowballStemmer.

from nltk.stem import PorterStemmer

from nltk.stem import LancasterStemmer

from nltk.stem.snowball import SnowballStemmer

for word in word_list:

print("{@:20}{1:20}{2:20}{3:26}".format(word, porter.stem(word),lancaster.stem(word), englishStemmer.stem(word))

Word Porter Stemmer lancaster Stemmer Snowball Stemmer

friend friend friend friend

friendship friendship friend friendship

friends friend friend friend

friendships friendship friend friendship

stabil stabil stabl stabil

destabilize destabil dest destabil

misunderstanding misunderstand misunderstand misunderstand

railroad railroad railroad railroad

moonlight moonlight moonlight moonlight

football footbal footbal footbal

Hình 2.3: Minh hoạ kỹ thuật Stemming

- Ưu điểm: đơn giản nên xử lý nhanh

- Nhược điểm: đối với những từ biến thể khác thì kế quả lại không mong

muốn như: go, went, goes

2.3.2.2 Lemmatization

Lemmatization cũng là kỹ thuật biến đổi một từ về dang gốc bang cách loại

bỏ một số ký tự cuối cùng Tuy nhiên Lemmatization sẽ xử lý thông minh hơn băng

33 66.

một bộ từ điên đê xử lý những từ như “goes”, “went” sẽ trả vê “go”.

20

Trang 37

import nltk

from nltk.stem import WordNetLemmatizer

from nltk.tokenize import sent_tokenize, word_tokenize

print(”{@:28}{1:26}”.format( “word”, ”Lemma”) )

for word in word_list:

print ("{@:20}{1:26}".format(word,wordnet_lemmatizer.lemmatize(word, pos="v")))

Hinh 2.4: Minh hoa ky thuat Lemmatization

- Ưu diém: xử ly trả về két quả chính xác

- Nhược điểm: vì phải tra cứu từ điên nên xử lý chậm

2.3.3 Part of Speech

Part-of-speech (hay con gọi là POS) là việc phan loại các từ trong một câu (danh

từ, trạng từ, tính từ, động từ) dé giúp máy tính hiểu được nghĩa của từ Từ đó hiểu

được ý nghĩa của cả câu Kỹ thuật part-of-speech thường sử dụng làm nền tảng chocác kỹ thuật khác về xử lý ngôn ngữ tự nhiên

2.4 Một số mô hình học máy trong bài toán phân loại

2.4.1 Thuật toán Naive Bayes

Trong học máy, phân loại Naive Bayes là một thành viên trong nhóm các phân

loại có xác suất dựa trên việc áp dụng định lý Bayes khai thác mạnh giả định độclập giữa các hàm, hay đặc trưng Mô hình Naive Bayes cũng được biết đến vớinhiều tên khác nhau ví dụ: Simple Bayes hay independence Bayes hay phân loại

Bayes.

21

Trang 38

Phân loại Naive Bayes được đánh giá cao khả năng mở rộng, đòi hỏi một số

thông số tuyến tính trong số lượng các biến (các tính năng/ tổ dự báo) trong nhiều

lĩnh vực khác nhau.

Thuật toán Naive Bayes (Mitchell, 1997) là một thuật toán phổ biến trong máy

học được McCallum and Nigam (1998) và Yang and Liu (1999) đánh giá là một

trong những phương pháp có hiệu năng cao nhất khi thực hiện phân lớp văn bản [9]

Ý tưởng cơ bản của cách tiếp cận này là sử dụng xác suất có điều kiện giữa từ hoặc

cụm từ và chủ đề đề dự đoán xác suất chủ đề của một tài liệu cần phân loại

Thuật toán Naive Bayes dựa trên định ly Bayes được phat biểu như sau:

P(xy) _ P(x|y)P@)

_—_PŒ@) - P(x)

Ap dung trong bài toán phân loại, các đữ kiện gồm có: D: tap dữ liệu huấn luyện

đã được vector hóa dưới dạng 3 = (x1,x2, xn) Ci: phân lớp i, với ¡= {1, 2, ,

m}; các thuộc tính độc lập điều kiện đôi một với nhau Theo định lý Bayes:

P(x|Ci)P Ci)P(Ci|x) = P(x)

Tính chat độc lập điều kiện:

Trang 39

e Bước 1: Huấn luyện Naive Bayes (dựa vào tập dữ liệu) tính P(Ci)va

P(xkICi)

e Bước 2: Phân lớp X"” = (xl, x2, xn), ta cần tinh xác suất thuộc

từng phân lớp khi đã biết trước Xnew Xnew được gán vào lớp có

xác suât cao nhât theo công thức

max [reo [| Pele)

= k=1

2.4.2 Thuật toán Máy Vector hỗ trợ (Support Vector Machine)

Thuật toán máy SVM được Cortes and Vapnik (1995) giới thiệu lần đầu tiên.SVM rất hiệu quả để giải quyết các bài toán với dữ liệu có số chiều lớn như các

véc-tơ biêu diễn văn ban SVM được xem là bộ phân lớp chính xác nhất cho bàitoán phân lớp văn bản (Chakrabarti, 2003) do tốc độ phân lớp rất nhanh và hiệu quả

đối với bài toán phân lớp văn bản

Ý tưởng của phương pháp này là cho trước một tập huấn luyện được biểu diễn

trong không gian véc-tơ, trong đó mỗi văn bản được xem là một điểm trong khônggian này Phương pháp này tìm ra một mặt siêu phăng h quyết định tốt nhất có thểchia các điểm trên không gian này thành hai lớp riêng biệt tương ứng, gọi là lớpdương (+) và lớp âm (-) Như vậy, bộ phân loại SVM là một mặt siêu phăng tách

các mẫu thuộc lớp dương ra khỏi các mẫu thuộc lớp âm với độ chênh lệch lớn nhất

Độ chênh lệch này hay còn gọi là khoảng cách biên được xác định bằng khoảngcách giữa mẫu (+) và mẫu (-) gần mặt siêu phăng nhất Khoảng cách này càng lớnthì các mẫu thuộc hai lớp càng được phân chia rõ ràng, nghĩa là sẽ đạt được kết quả

phân loại tốt Mục tiêu của thuật toán SVM là tìm được khoảng cách biên lớn nhất

để tạo được kết quả phân loại tốt [10]

Phương trình mặt siêu phăng chứa vector x trong không gian đối tượng như sau:

w.x +b =0

Trong đó, w là vector trong số, b là độ lệch/thiên vị Hướng và khoảng cách từ

sốc tọa độ đến siêu mặt phẳng thay đổi khi w và b thay đồi

23

Trang 40

Bộ phân lớp SVM được định nghĩa như sau: f(x) = sign(w.x +b)

f(@) = +1, w.x+b>0

Trong đó : ey = —Lw.x+b<0

Goi y mang giá tri +1 hoặc -1 Nếu yi = +1 thi x thuộc về lớp (+), ngược lai yi

=—1 thi x thuộc về lớp (—) Hai mặt siêu phẳng tách các mẫu thành hai phần được

mô tả bởi các phương trình w.x + b = 1 và w.x + b =—I Bằng hình học có thể tính

khoảng cách giữa hai mặt phăng này là: m

Dé khoảng cách biên lớn nhất cần phải tìm giá trị nhỏ nhất của ||w||, đồng thờingăn chặn các điềm dữ liệu rơi vào vùng bên trong biên, cần thêm ràng buộc sau:

Ngày đăng: 02/10/2024, 05:10

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w