Để trả lời cho câu hỏi nghiên cứu, luận văn tiến hành xây dựng mô hình dự báo kết quả học tập của sinh viên tập trung vào hai định hướng chính đó là: (1) dự báo kết quả học tập của sinh viên dựa trên các yếu tố là kết quả từ sự tương tác giữa người học với hệ thống, (2) dự báo kết quả thi cuối kỳ dựa trên các bài kiểm tra đánh giá.
Với hướng thứ nhất, để dự báo kết quả học tập của sinh viên dựa trên các hoạt động tương tác, tôi xây dựng mô hình dựa trên kỹ thuật học máy hồi quy với công cụ R. Đây là một phương pháp đơn giản nhưng lại khá hiệu quả thường xuyên được các nghiên cứu sử dụng cho các hệ thống dự đoán. Trong mô hình, các hoạt động tương tác được chọn làm nhân tố là các biến độc lập, biến dự báo là điểm tổng kết khóa học của sinh viên. Để có thể chọn được các tham số phù hợp nhất cho mô hình thì chúng ta cần phải chọn mô hình hồi quy tốt và chọn được các nhân tố tốt cho mô hình đó. Cụ thể, nghiên cứu sẽ dựa vào 6 biến độc lập thể hiện cho 6 hoạt động tương tác thu thập được trong tập dữ liệu, bao gồm:
- Số lượt xem: tổng số lượt truy cập vào khóa học trực tuyến của mỗi sinh viên, mỗi lượt xem là một lần sinh viên đăng nhập và kích vào liên kết để mở khóa học.
- Số lượng bài viết: là tổng số lượng bài viết của mỗi sinh viên vào khóa học trực tuyến
- Số lượt xem diễn đàn: mỗi lớp môn học sẽ có một khu vực được gọi là diễn đàn để các sinh viên và giảng viên trao đổi tất cả các thông tin liên quan về khóa học. Số lượt xem diễn đàn chính là tổng số lượt mà mỗi sinh viên truy cập vào diễn đàn này để đọc thông tin.
- Số lượng bài viết trên diễn đàn: là tổng số bài mà mỗi sinh viên đăng lên diễn đàn của lớp môn học.
- Số lượng bài tập nộp đúng hạn: trong suốt khóa học, sinh viên sẽ được làm nhiều bài tập để nộp hàng tuần. Tham số này đếm số lượng bài tập mà sinh viên đã nộp và trong đúng thời hạn quy định của giảng viên đề ra.
- Số lượng bài tập nộp quá hạn: tương tự tham số trên, tham số này đếm số lượng bài tập mà sinh viên nộp quá hạn quy định của giảng viên, bao gồm cả bài tập mà sinh viên không nộp.
Từ sáu biến độc lập thu được từ tập dữ liệu, nghiên cứu tiến hành hồi quy với tất cả các tập con của sáu biến này để chọn ra các mô hình tốt nhất cho các tham số khác nhau. Kết quả thu được các mô hình dự đoán điểm dựa trên sự tương quan với một nhân
tố, hai nhân tố, ba nhân tố và bốn nhân tố. Kết quả chi tiết sẽ được trình bày trong chương 3 của luận văn.
Với hướng thứ hai, để dự báo kết quả điểm thi cuối kỳ dựa trên kết quả các bài tập trong quá trình học, tôi sẽ thử nghiệm với bốn mô hình dự đoán: mô hình Hồi quy tuyến tính, mô hình SVR, mô hình KNR, và mô hình Bayesian Ridge trên dữ liệu là điểm của các bài kiểm tra trong suốt quá trình sinh viên tham gia vào khóa học kết hợp.