Phân bố các mức điểm trên tập kiểm tra của Khoa Cơng nghệ

Một phần của tài liệu Xây dựng mô hình tìm kiếm và gợi ý tài nguyên học tập (Trang 112 - 114)

Ngồi ra, kết quả dự đốn cĩ hiệu suất thấp ở tập dữ liệu của Khoa Phát triển Nơng thơn cĩ thể là do dữ liệu trong tập train thậm chí cịn ít số mẫu trong tập test: tập train cĩ 101.039, chiếm tỷ lệ 49,52% so với tập test cĩ 102.994 mẫu, chiếm tỷ lệ 50,48%. Điều này cĩ thể mơ hình khơng cĩ đủ dữ liệu để học, dẫn đến hiệu quả dự đốn thấp hơn các tập dữ liệu khác.

Với phép biến đổi QTF, hàm tối ưu RMSprop và Adam, mơ hình sử dụng mạng nơ-ron tích chập CNN cũng được thực nghiệm để dự đốn kết quả học tập trên tồn bộ tập dữ liệu chứa hơn 3,8 triệu mẫu tin được thu thập từ tất cả các đơn vị đào tạo của Trường Đại học Cần Thơ. Tập huấn luyện bao gồm 2.584.462 mẫu (67,5%) là điểm sinh viên từ năm 2007 đến 2016, và tập kiểm tra gồm 1.244.417 mẫu (32,5%) là điểm từ năm 2017 đến 2019. Kết quả thực nghiệm đánh giá mơ hình với độ đo MAE được trình bày như Hình 5.7.

Kết quả cho thấy, sử dụng hàm tối ưu Adam cho kết quả tốt hơn so với hàm tối ưu RMSprop khi sử dụng mơ hình dự đốn với kiến trúc mạng nơ-ron tích chập CNN. Điều này cĩ thể được lý giải khi chúng ta sử dụng tồn bộ tập dữ liệu thì tính chất trình tự của dữ liệu bị hạn chế, vì vậy hàm RMSprop chưa phát huy được thế mạnh của nĩ.

Hình 5.7: Độ đo MAE sử dụng mạng CNN với hàm tối ưu RMSprop và Adam trên

tồn tập dữ liệu

Mặc dù vậy, các kết quả thực nghiệm này thấy rằng mơ hình dự đốn kết quả học tập sử dụng mạng nơ-ron tích chập CNN cho kết quả dự đốn khá tốt, với độ đo MAE đều nhỏ hơn 0,65 (trên thang điểm 4). Tùy theo tập dữ liệu chúng ta cĩ thể tìm kiếm các siêu tham số để mơ hình dự đốn cho kết quả tối ưu, chẳng hạn tìm kiếm hàm tối ưu, kỹ thuật tiền xử lý và biến đổi dữ liệu, các tham số học của mơ hình dự đốn sử dụng kỹ thuật học sâu,…

Tuy nhiên, việc sử dụng một mơ hình cho tất cả sinh viên cĩ thể gặp phải vấn đề là dùng dữ liệu của sinh viên cĩ kết quả học tập kém để dự đốn cho sinh viên cĩ kết quả học tập tốt, từ đĩ kết quả cĩ thể sẽ giảm mức độ chính xác. Vì thế, luận án đề xuất xây dựng mơ hình dự đốn kết quả học tập dựa theo các nhĩm năng lực học tập của sinh viên. Mơ hình này sẽ trình bày ở phần tiếp theo.

5.4. Mơ hình dự đốn kết quả học tập theo nhĩm năng lực học tập

Phần trước chúng tơi đã đề cập mơ hình dự đốn kết quả học tập trên tồn bộ dữ liệu sinh viên, bao gồm dữ liệu tách theo từng đơn vị đào tạo và dữ liệu của cả trường

trong trường đại học đa ngành. Nghiên cứu này đề xuất cách tiếp cận xây dựng các mơ hình dự đốn kết quả học tập theo từng nhĩm năng lực học tập của sinh viên.

Trong cách tiếp cận này, một kỹ thuật học sâu khác với mạng nơ-ron truyền thẳng đa tầng (Multilayer Perceptron - MLP) được đề xuất sử dụng để xây dựng mơ hình dự đốn kết quả học tập sinh viên trong các học kỳ tiếp theo dựa trên kết quả đạt được của các học kỳ trước đĩ. Chúng tơi đề xuất kỹ thuật học sâu này lý do MLP thích hợp cho các vấn đề dự đốn phân loại. Ngồi ra, kiến trúc MLP khá phù hợp với dữ liệu dạng bảng (tabular format), chẳng hạn tập tin dạng CSV như tập dữ liệu cho mơ hình này (Brownlee, 2018).

5.4.1. Mơ hình đề xuất

Một cách tiếp cận của mơ hình dự đốn được đề xuất như sơ đồ tổng quát ở Hình 5.8. Đầu tiên, các tập dữ liệu thực tại hệ thống quản lý sinh viên của một trường đại học được thu thập, sau đĩ dữ liệu được tiền xử lý để loại bỏ nhiễu cũng như các thuộc tính dư thừa. Cách tiếp cận truyền thống thường sử dụng tồn bộ tập dữ liệu để xây dựng mơ hình dự đốn (như mơ tả ở dưới cùng của Hình 5.8) nhằm dự đốn cho tất cả các sinh viên (ký hiệu là MLP).

Tuy nhiên, cần cĩ cách tiếp cận mới để dự đốn theo từng nhĩm học lực của sinh viên, tránh việc sử dụng dữ liệu một cách "cào bằng" dẫn đến các trường hợp sử dụng dữ liệu của sinh viên cĩ thành tích tốt dự đốn cho sinh viên cĩ thành tích kém và ngược lại. Nghiên cứu này đề xuất sử dụng bốn mơ hình dự đốn cho bốn nhĩm sinh viên cĩ học lực tương tự dựa trên điểm số mà sinh viên đạt được (như mơ tả ở phần trên của Hình 5.8).

Một phần của tài liệu Xây dựng mô hình tìm kiếm và gợi ý tài nguyên học tập (Trang 112 - 114)

Tải bản đầy đủ (DOCX)

(159 trang)
w