Nghiên cứu về dự đốn xếp hạng và gợi ý

CHƯƠNG 2 CƠ SỞ LÝ THUYẾT VÀ CÁC NGHIÊN CỨU LIÊN QUAN

2.6. Các nghiên cứu liên quan

2.6.3. Nghiên cứu về dự đốn xếp hạng và gợi ý

Dự đốn kết quả học tập trở thành nhu cầu quan trọng đối với các trường đại học để hỗ trợ cho người học hay sinh viên đạt được kết quả cao nhất trong học tập. Từ một nghiên cứu tổng quan, một nhĩm tác giả tổng hợp nhiều kết quả nghiên cứu cho thấy cĩ nhiều kỹ thuật khác nhau được áp dụng cho dự đốn kết quả học tập như trí tuệ nhân tạo (artificial intelligence), học máy (machine learning), lọc cộng tác (collaborative filtering), mạng nơ-ron nhân tạo (artificial neural networks) (Rastrollo- Guerrero et al., 2020).

Dự đốn kết quả học tập là một nhiệm vụ quan trọng trong khai thác dữ liệu giáo dục. Từ ý tưởng kiến thức của người học cĩ thể được cải thiện và tích lũy theo thời gian, nhĩm tác giả đã đề xuất một cách tiếp cận sử dụng kỹ thuật phân rã ma trận ba chiều gồm người học, mơn học và yếu tố thời gian, để dự đốn kết quả học tập của sinh viên

(Thai-Nghe et al., 2011). Với cách tiếp cận này, nhĩm tác giả đã cá nhân hĩa dự đốn cho từng người học cụ thể. Kết quả thực nghiệm trên các tập dữ liệu lớn cho thấy việc kết hợp các kỹ thuật phân rã ma trận để dự đốn là một cách tiếp cận hiệu quả.

Thực tế các đánh giá đều cĩ những thiên vị (bias) về người dùng và mục tin đánh giá, tức là cĩ người dùng dễ hoặc khĩ tính, cũng cĩ những mục tin được đánh giá cao chỉ vì người dùng này thấy người dùng khác đánh giá cao. Vì thế, nhĩm tác giả Huynh-Ly and Thai-Nghe (2013) đã phát triển một hệ thống dự đốn kết quả học tập của sinh viên sử dụng kỹ thuật phân rã ma trận thiên vị BMF (Biased Matrix Factorization) để dự đốn kết quả học tập, từ đĩ giúp sinh viên lựa chọn các mơn học phù hợp hơn. Kết quả thực nghiệm sử dụng mã nguồn mở MyMediaLite cho thấy kỹ thuật BMF cho kết quả cải thiện so với kỹ thuật phân rã ma trận chuẩn MF do giải quyết được tình trạng thiên vị nĩi trên.

Khả năng kết hợp giữa các phương pháp dự đốn cũng được các nhà nghiên cứu tận dụng. Một nhĩm nghiên cứu đã xây dựng mơ hình dự đốn kết quả học tập của sinh viên dựa trên sự kết hợp phương pháp xấp xỉ Taylor với các mơ hình xám (grey models) để thu được các giá trị dự đốn tối ưu nhất bằng cách tính gần đúng nhiều lần nhằm cải thiện độ chính xác của dự đốn (Hai et al., 2015). Kết quả nghiên cứu giúp cho giáo viên và nhà quản lý giáo dục cĩ giải pháp phù hợp nhằm cải thiện kết quả học tập của sinh viên cĩ quá trình học tập khơng ổn định. Trong khi đĩ, một nhĩm tác giả đã sử dụng các kỹ thuật lọc cộng tác (CF), kỹ thuật phân rã ma trận chuẩn MF và kỹ thuật restricted boltzmann machines (RBM) để phân tích một cách cĩ hệ thống dữ liệu được thu thập từ một trường đại học (Iqbal et al., 2017). Kết quả cho thấy kỹ thuật RBM dự đốn kết quả học tập của sinh viên tốt hơn so với các kỹ thuật cịn lại.

Trên thực tế, các kỹ thuật lọc cộng tác (CF) thường được sử dụng trong các hệ thống gợi ý do tính đơn giản của nĩ. Tuy nhiên, dữ liệu thưa (sparse) làm hạn chế tính hiệu quả của các giải thuật này. Do đĩ, các mơ hình kết hợp giữa thuật tốn lọc cộng tác với kỹ thuật học sâu được quan tâm nhiều hơn. Một nghiên cứu đã đề xuất một mơ hình dựa trên mơ hình hồi quy đa thức bậc hai (quadratic polynomial regression model) để thu được các đặc trưng tiềm ẩn chính xác hơn bằng cách cải thiện giải thuật phân rã ma trận truyền thống MF (Zhang, L. et al., 2018). Sau đĩ, các đặc trưng tiềm ẩn là dữ liệu đầu vào của mơ hình mạng nơ ron sâu (deep neural network model). Các thực nghiệm cho thấy mơ hình này cải thiện hiệu quả dự đốn khá tốt so với mơ hình sử dụng kỹ thuật phân rã ma trận chuẩn MF. Một số cách tiếp cận khác kết hợp mơ hình lọc cộng tác với học sâu cũng được đề cập (Fu et al., 2019). Với cách tiếp cận này, trong giai đoạn dự đốn, một mạng nơ-ron truyền thẳng (feed-forward neural networks) được sử dụng để mơ phỏng tương tác giữa người dùng (user) và mục tin (item), trong đĩ các véc-tơ đặc trưng ở giai đoạn tiền xử lý được sử dụng làm đầu vào cho mạng nơ-ron. Các thực nghiệm dựa trên hai tập dữ liệu (MovieLens 1M và MovieLens 10M) đã chứng minh hiệu quả của phương pháp này và cho kết quả hồn tồn khả thi.

Trên thực tế, bài tốn dự đốn xếp hạng (rating prediction) và gợi ý (recommendation) khơng thể tách rời nhau. Để gợi ý thì cần cĩ kết quả dự đốn xếp hạng, từ kết quả dự đốn cĩ thể chọn ra các kết quả cĩ hạng thuộc tốp đầu để gợi ý. Trong lĩnh vực giáo dục, để gợi ý tài nguyên học tập thì cần dự đốn kết quả sử dụng tài nguyên (hay kết quả học tập). Kết quả của hoạt động dự đốn làm tiền đề cĩ thể sử dụng cho gợi ý được hiệu quả và chính xác hơn.

Hiện nay, cĩ nhiều hệ thống dự đốn xếp hạng và gợi ý với các cách tiếp cận khác nhau. Tuy nhiên, các hệ thống dự đốn xếp hạng và gợi ý trong lĩnh vực giáo dục, đặc biệt là sử dụng nguồn dữ liệu thực tế về kết quả học tập của sinh viên, chưa được quan tâm nhiều. Dựa trên các nghiên cứu trước đây, các kỹ thuật mới cĩ thể đề xuất, đặc biệt là các kỹ thuật học sâu để xây dựng mơ hình dự đốn xếp hạng và gợi ý tài nguyên học tập phù hợp với dữ liệu cụ thể của một trường đại học, trong đĩ cĩ trường đại học đa ngành, cũng như các nguồn tài nguyên học tập khác.

Nghiên cứu về dự đốn xếp hạng và gợi ý

Nghiên cứu về phân loại văn bản

Nghiên cứu về tìm kiếm tài liệu