5 XÂY DỰNG MƠ HÌNH PHẢN HỒI CỦA NGƯỜI HỌC
4.5 Cấu trúc mạng nơ-ron tích chập
cùng được kết thừa từ cấu trúc mạng VGG16 và VGG19. Số lớp đầu ra là 8 lớp tương ứng với số hành động trong lớp học.
Việc so sánh kết quả nghiên cứu trên các bộ dữ liệu khác nhau sẽ là không phù hợp và khách quan. Do vậy nghiên cứu này chỉ đưa ra các thơng số về độ chính xác của phương pháp để chứng minh các kết quả đạt được là chấp nhận được và có thể áp dụng trong thực tế. Trong thử nghiệm này, độ chính xác đạt được là 80.8%, so với nghiên cứu của Fang [32] đạt được là 72%. Thực nghiệm của Klein [56] có độ chính xác đạt 89.7%, tác giả thực hiện sau 20,000 vòng lặp và trên bộ dữ liệu lớn với hơn 200,000 ảnh.
Hình 4.6a and 4.6b biểu diễn hai đương cong lần lượt là đường cong hàm mất mát thông tin và đường cong giá trị độ chính xác. Sau khoảng 80 vịng lặp, giá trị validating loss/accuracy khơng giảm/tăng. Q trình dừng sớm sẽ được kích hoạt để ngăn chặn việc quá khớp, việc quá khớp này có thể dẫn đến việc dự đốn nhầm các giá trị nhiễu dẫn đến chất lượng dự đốn khơng cịn tốt trên dữ liệu kiểm thử nữa.
1 10 20 30 40 50 60 70 80 0 0.5 1 1.5 2 2.5 Epoch Loss Train Loss Valid Loss
(a)Đường cong hàm mất mát của quá trình huấn luyện và kiểm thử.
1 10 20 30 40 50 60 70 80 0 0.2 0.4 0.6 0.8 1 Epoch A ccuracy Train Accuracy Valid Accuracy
(b) Đường cong độ chính xác trong q trình huấn luyện và q trình kiểm thử.
Hình 4.6. Quá trình huấn luyện sẽ được dừng sớm nếu khơng có sự thay đổi giá trị độ chính xác trong một khoảng lặp nhất định, điều này ngăn chặn quá trình quá khớp xảy ra. Đường cong kiểm thử và đường cong huấn luyện tương tự nhau cho thấy khơng có sự quá khớp xảy ra ở đây.
pháp đề xuất chưa được cao bởi sự nhập nhằng giữa các hành động trong lớp học của người học. Hành vi "cúi đầu" và "đang đọc" khá tương đồng nhau (thực tế giáo viên trong lớp học cũng có thể bị nhầm lẫn) dẫn
Bảng 4.2. So sánh độ chính xác giữa các phương pháp. Kết quả đạt được bởi phương pháp mà nghiên cứu này đề xuất đã cải thiện khá nhiều đối với bài toán nhận dạng hành vi trong lớp học.
Phương pháp Độ chính xác
Fang [32] 72.0%
Zaletelj [137] 75.3%
Huấn luyện CNN từ đầu 68.8%
Huấn luyện CNN có học trước từ VGG16 74.9% Huấn luyện CNN có học trước từ VGG19 76.0% Huấn luyện CNN có học trước từ VGG19
và áp dụng học chuyển giao 80.8%
đến mạng nơ-ron tích chập đã phân loại nhầm giữa chúng (Hình 4.7).
Đây là một trong những vấn đề đặt ra để nghiên cứu sinh tiếp tục phát triển thuật toán và tối ưu bài toán trong ngữ cảnh nhận dạng hành vi trong lớp học.
Hình 4.7. Các hình ảnh được trích xuất từ cơ sở dữ liệu bị phân loại nhầm. Từ trái qua phải: "Cúi đầu" bị nhận dạng là "Đang đọc", "Đang đọc" lại bị nhận dang sang "Cúi đầu", "Sử dụng điện thoại" bị nhầm sang "Đang đọc".
Bảng 4.3. Ma trận nhầm lẫn của các phân lớp trên bộ dữ liệu kiểm thử.
Thực tế Tập trung Khơng tập trungDự đốn
Tập trung 51 9
4.4 Kết chương
Hành vi và cử chỉ là các thành tố cơ bản liên quan đến các thể hiện của sinh viên trong lớp học, có ảnh hưởng trực tiếp đến tâm lý, trạng thái của người học. Trong các hệ thống dạy học thơng minh trong tương lai, khả năng phân tích và đo lường các giá trị này có thể trợ giúp một cách tích cực cho cả người học và người dạy.
Nghiên cứu này đã mô tả chi tiết việc áp dụng học sâu trong việc phát hiện độ tập trung của người học dựa trên hành vi và cử chỉ của sinh viên trong lớp học. Kết quả của nghiên cứu cho thấy rõ ràng rằng việc áp dụng các mạng nơ-ron tích chập và các phương pháp học chuyển giao có thể phân loại khá tốt hành vi của người học áp dụng trên bộ dữ liệu nhỏ, dễ xây dựng và có thể tiến phân loại hành động của người học theo thời gian thực.
Trong thời gian tiếp theo, để nâng cao độ tin cậy của quá trình phân lớp, bộ dữ liệu huấn luyện cần được làm giàu thêm bằng cách thu thập thêm dữ liệu, nâng số lượng hành động trong lớp học để bao quát được nhiều hành vi trong lớp học hơn, đồng thời phân loại cụ thể hơn giúp hệ thống dạy học thông minh ứng xử hợp lý với từng tình huống. Bên cạnh đó, để nâng cao hơn độ chính xác, nghiên cứu sinh cũng đã thực hiện nghiên cứu đa mạng nơ-ron tích chập với mỗi luồng sẽ mang các đặc trưng khác nhau và được kết hợp bởi phương pháp hòa hợp (ensemble) các mạng nơ-ron tích chập để tăng độ chính xác kết quả phân lớp. Kết quả này cũng đã được cơng bố trong cơng trình khoa học số 3.
Kết quả của quá trình nhận dạng là một mắt xích quan trọng trong tiến trình xây dựng một hệ thống dạy học thơng minh. Việc tích hợp kết quả của nghiên cứu này để xây dựng một mơ hình hồn chỉnh cho bài tốn xây dựng mơ hình phản hồi của người học trong các hệ thống dạy học thông minh là không thể thiếu nhằm cung cấp các cơ chế phản hồi cho hệ thống dạy học hoặc hỗ trợ giáo viên trong lớp học hay trong các môi trường học tập trực tuyến.
Kết quả nghiên cứu nêu trên được cơng bố tại kỷ yếu có phản biện của Hội nghị quốc tế The 7th International Conference on Com- puter and Communication Engineering (ICCCE2018) tại Malaysia (cơng trình khoa học số 3), Kỷ yếu có phản biện của Hội nghị quốc tế "The 23th International Computer Science and Engineering Conference (IC- SEC2019)" tại Thái Lan năm 2019 (cơng trình khoa học số 4) và Kỷ yếu có phản biện của Hội nghị quốc tế "The 6th NAFOSTED Conference on Information and Computer Science NICS2019" (Cơng trình khoa học số 5).
Chương 5
XÂY DỰNG MƠ HÌNH PHẢN HỒI CỦA NGƯỜI HỌC
Trong chương này, nghiên cứu sinh xây dựng mơ hình người học dựa cách tiếp cận sử dụng mạng Bayes và mơ hình phủ. Đây là mơ hình được sử dụng phổ biến nhất trong việc thiết kế mơ hình người học bởi tính tự nhiên và trực quan của nó cũng như khả năng biểu diễn tri thức trong một hệ thống dạy học thơng minh. Nội dung chính của chương được nghiên cứu sinh tập trung vào mơ tả q trình mơ hình hóa tri thức, mối quan hệ giữa nội dung mơn học và các ràng buộc giữa chúng, đồng thời đưa ra các thuật tốn tối ưu q trình học. Bên cạnh đó, quá trình thực nghiệm để đánh giá mơ hình được nghiên cứu sinh phân tích và làm rõ trong chương.
5.1 Đề xuất mơ hình phản hồi của người học
Mơ hình phản hồi của người học dựa vào các thông tin cá nhân của người học và quá trình đánh giá liên tục trong suốt thời gian người học tương tác với hệ thống để cập nhật, phản hồi, đồng thời đưa ra các gợi ý học hoặc tự động điều chỉnh quá trình học và dạy.
5.1.1 Các tham số đầu vào của mơ hình
• Năng lực người học • Phong cách học • Độ tập trung
Mơ hình này có tính linh hoạt cao, tùy từng điều kiện áp dụng, cho phép người sử dụng có thể thêm hoặc bớt các tham số đầu vào, hoặc
trong quá trình vận hành, các tham số đầu vào có thể bỏ qua, tạo sự uyển chuyển của mơ hình. Bên cạnh đó việc lựa chọn đầu ra cũng linh hoạt dựa theo khả năng xây dựng mỗi bài học, tài nguyên hiện có của hệ thống, khả năng xây dựng các bài học nhằm cá biệt hóa q trình học tập.
Mơ hình phản hồi được xem như một bước chuyển trong suốt đối với người học, với các giá trị đầu vào cho trước, mơ hình sẽ tìm các bước đi phù hợp tiếp theo trong tiến trình học tập của người học (Hình 5.1).
Trong thực nghiệm này, các tham số đầu vào được lựa chọn bao gồm:
MƠ HÌNH PHẢN HỒI Năng lực Phong cách học Độtập trung Học liệu dạng Video Học liệu dạng văn bản
Học liệu dạng câu hỏi tương tác Học liệu dạng bài luận
Hình 5.1. Mơ hình phản hồi của người học.
• Năng lực học tập: Giá trị khởi tạo của người học đối với bài học được đánh giá bằng 0. Trong quá trình học tập, năng lực này được ước lượng lại dựa trên quá trình làm các bài kiểm tra trắc nghiệm, làm các bài dạng câu hỏi tương tác, bài luận. Đối với các bài kiểm tra trắc nghiệm, năng lược được ước lượng bằng mơ hình ước lượng cực đại hợp lý, được trình bày chi tiết trong Chương 2.
• Phong cách học: Được xác định bằng việc thực hiện khảo sát theo bộ tiêu chí đánh giá của Felder-Soloman được trình bày trong Chương 3. Người học trước đó được thực hiện bài đánh giá phong
cách học, các giá trị thu được đã được lưu vào hồ sơ học tập của người học.
được đánh giá, phân loại dựa trên mạng học sâu, đã được trình bày chi tiết trong Chương 4.
5.1.2 Các lựa chọn đầu ra của mơ hình
Trong tiến trình học, mỗi chủ đề được xây dựng dưới nhiều dạng học liệu khác nhau. Trong khuôn khổ của nghiên cứu này, nghiên cứu sinh lựa chọn các đối tượng học (learning object) phổ biến nhất để xây dựng các học liệu này bao gồm:
• Học liệu dạng video: Học liệu dạng video dễ dàng tiếp cận với người học ở mọi cấp độ, lứa tuổi. Người học dễ dàng tập trung vào bài học, dễ khơi dậy tính tị mị ở người học. Bên cạnh đó, học liệu dạng video dễ dàng minh họa các ví dụ, minh chứng giúp người học dễ hiểu hơn. Các hình thức biểu đạt trong các video cịn làm cho người học thêm hứng thú, tạo động lực cho người học trong việc cải thiện khả năng tiếp thu.
• Học liệu dạng văn bản: Học liệu dạng văn bản dễ dàng cho người học tìm kiếm, sắp xếp, phân loại. Là loại tài liệu phổ biến nhất từ trước đến nay và là loại học liệu truyền thống. Người học với khả năng tập trung cao có thể khai thác hiệu quả tri thức từ nguồn học liệu này.
• Học liệu dạng câu hỏi tương tác: Học liệu này giúp sinh viên dễ dàng xác định được kiến thức nào họ biết hay chưa biết. Nó giúp tăng sự tương tác giữa người học và người dạy (hoặc các hệ thống dạy học tự động) đồng thời tăng khả năng tập trung của người học vào bài học. Bên cạnh đó nó giúp người học định hướng lại cũng như điều chỉnh lại nội dung học nhằm đáp ứng được quá trình trả lời các câu hỏi tương tác [72].
• Học liệu dạng bài luận: Các bài luận cho phép người học tổng hợp lại kiến thức và nâng cao kỹ năng trình bày, phân tích. Bài luận
cũng sẽ giúp cho người học nhìn nhận lại khối kiến thức của mình cịn thiếu để từ đó có kế hoạch bù đắp lại lượng kiến thức thiếu hụt. Người học thông qua các bài luận tăng khả năng nghiên cứu, khả năng tổng quát hóa các vấn đề và tập trung đúng vào nội dung học tập.
Tương ứng với các dạng thức học liệu khác nhau, các biến cho mỗi chủ đề được xác định như sau:
• TiV: Chủ đề được thể hiện dưới dạng video, hình thức thể hiện này thích hợp với người học có phong cách học Chủ động, Trực quan, Hình ảnh, Tổng thể.
• TiT: Chủ đề được thể hiện dưới dạng văn bản, hình thức biểu diễn này thích hợp với người học có phong cách học tương ứng là Lời nói, Thụ động, Tuần tự, Trực quan.
• TiQ: Người học sẽ tham gia làm các trắc nghiệm, câu hỏi nhanh để kiểm tra trình độ, đánh giá năng lực. Hình thức này phù hợp với người học có thiên hướng về các chiều Hình ảnh, Chủ động, Tổng thể, Trực quan.
• TiA: Người học sẽ làm các bài luận, các bài tự luận để đánh giá trình độ, năng lực. Biến này ưu tiên cho người học có xu hướng học theo Lời nói, Thụ động, Tuần tự, Cảm quan.
Như vậy mỗi chủ đề Ti sẽ bao gồm {TiV, TiT, TiQ, TiA} (Hình 5.2).
Trong sơ đồ tiến trình người học (Hình 5.3), mơ hình lựa chọn cho người
học một tiến trình phù hợp nhất tại mỗi bước. Tại bước Bắt đầu, mơ hình sẽ đánh giá các trạng thái khởi tạo của người học để lựa chọn một trong các phương thức học tiếp theo. Bảng trọng số cho các thang đo này được xây dựng như Bảng 5.1
Ti TiV TiT TiQ TiA Hình 5.2. Mỗi chủ đề bao gồm một số thành phần: {TiV, TiT, TiQ, TiA},
các thành phần này có thể mở rộng hoặc lược bỏ bớt trong mỗi chủ đề.
Bắt đầu Kết thúc T1 T2 T3 T4 T5 T6 T7 T9 T10 T8 Tiến trình học
Điều kiện tiên quyết
Hình 5.3. Sơ đồ tiến trình học tập: T1, T2, ..., T10 là các chủ đề của mônhọc. học.
5.1.3 Biến đo năng lực và tri thức của người học
Để xây dựng một mạng Bayes [129] cho mơ hình người học, cần thiết phải xây dựng hệ thống các biến đo năng lực và tri thức của người
Bảng 5.1. Bảng trọng số mơ hình học. Vis: Visual - Hình ảnh, Ver: Verbal - Lời nói, Act: Active - Chủ động, Ref: Reflective - Thụ động, Seq: Sequence - Tuần tự, Glo: Global - Tổng thể, Sen: Sensing - Trực quan, Int: Intuitive - Cảm quan, IN: interest - Độ tập trung. Các biến SV, ST, SQ, SA đo mức độ ảnh hưởng của phong cách học đối với người học.
Phong cách học Độ tập trung
Vis Ver Act Ref Seq Glo Sen Int IN
SV 0.5 0 0.4 0.5 0.1 0.4 0.2 0.4 0.1
ST 0 0.5 0.1 0.5 0.4 0.1 0.3 0.1 0.5
SQ 0.1 0.5 0.6 0.1 0 0.3 0.1 0.5 0.2
SA 0.1 0.7 0.1 0.5 0.5 0.1 0.6 0.1 0.3
học. Để đo các giá trị này, nghiên cứu sử dụng các biến ở các mức độ chi tiết khác nhau. Bao gồm:
• Khái niệm: Là một thành phần cơ bản của tri thức, nó khơng thể chia nhỏ hơn nữa, mỗi khái niệm là một đơn vị kiến thức. Ký hiệu khái niệm là C. Để biểu diễn khái niệm C, chúng ta sử dụng một biến C với một phân phối Bernoulli (là một phân phối xác suất rời rạc của biến ngẫu nhiên chỉ nhận hai giá trị 0 hoặc 1). Nếu sinh viên đã biết khái niệm thì C sẽ mang giá trị 1, nếu chưa biết C
mang giá trị 0. Khi đó phân phối xác xuất của C sẽ là:
P(C = x) = px(1−p)1−x, (5.1) với p là xác suất sinh viên biết khái niệm C, x mang hai giá trị 0 và 1.
• Chủ đề: Một chủ đề là một cặp (C, w) với:
– C là tập các khái niệm C = C1, ..., Cn, các khái niệm con là độc lập.
– w = (w1, ..., wn) là các vector trọng số để đo mối tương quan giữa các khái niệm trong một chủ đề. Khơng mất tính
tổng quát, ta giả sử rằng tổng các giá trị w này bằng 1.
Pn
j=1wjCj = 1.
Để đo tri thức của người học về một chủ đề, nghiên cứu sử dụng một biến được định nghĩa như sau:
τ = Pn
j=1wjCj
• Mơn học: Là một cặp (T, α), trong đó:
– T là một tập các chủ đề độc lập với nhau, T = T1, ..., Ts.
– α = (α1, ..., αs) là một vector trọng số đo mức độ quan
trọng tương đối của chủ đề đó đối với mơn học. Giả sử rằng
Ps
i=1αi = 1.
Như vậy, theo định nghĩa trên, mỗi chủ đề bao gồm tập các khái niệm độc lập với các trọng số tương ứng, có nghĩa là với mỗi
i = 1, ..., s thì chủ đề Ti được tạo thành bởi tập các khái niệm
Cij, j + 1, ..., ni và một vector trọng số w = (wi1, ..., wini) được xác định bởi biểu thức:
Ti = Xni
j=1
wijCij
Để biểu diễn tri thức của người học về một mơn học A nào đó, ta sử dụng một biến ngẫu nhiên A được định nghĩa như sau: