Trong bài viết này, các tác giả đề xuất xây dựng một hệ thống gợi ý nhằm giúp các sinh viên Trường Đại học Sư phạm Hà Nội (HNUE) lựa chọn môn học tự chọn sao cho phù hợp khả năng của mình, giúp các em lập kế hoạch học tập tốt hơn.
JOURNAL OF SCIENCE OF HNUE Educational Sci., 2015, Vol 60, No 7A, pp 204-214 This paper is available online at http://stdb.hnue.edu.vn DOI: 10.18173/2354-1075.2015-0068 HỆ THỐNG GỢI Ý LỰA CHỌN MÔN HỌC TỰ CHỌN CHO SINH VIÊN TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI Lê Thị Đào1 , Lê Thị Tú Kiên2 Khoa Khoa Khoa học Tự nhiên, Trường Sĩ quan Lục quân 1; Công nghệ Thông tin, Trường Đại học Sư phạm Hà Nội Tóm tắt Hiện nay, hệ thống gợi ý (Recommender System - RS) bước trở thành lĩnh vực nghiên cứu quan trọng ứng dụng thành công thực tiễn, giúp người dùng đối phó với vấn đề tải thông tin Trong số nghiên cứu gần đây, hệ thống RS bắt đầu quan tâm ứng dụng vào lĩnh vực giáo dục Trong viết này, đề xuất xây dựng hệ thống gợi ý nhằm giúp sinh viên Trường Đại học Sư phạm Hà Nội (HNUE) lựa chọn môn học tự chọn cho phù hợp khả mình, giúp em lập kế hoạch học tập tốt Chúng áp dụng phương pháp Biased Matrix Factorization (BMF) để dự đoán kết học tập cho sinh viên dựa sở liệu điểm thu thập từ hệ thống quản lí kết học tập trường Đại học Sư phạm Hà Nội Dựa kết thực nghiệm từ liệu khoa Công nghệ thông tin khoa Tốn-tin, chúng tơi thấy phương pháp BMF mà lựa chọn cho độ lỗi thấp so với hai phương pháp khác Global Average (GA) Matrix Factorization (MF) Bên cạnh đó, đánh giá thấy giá trị của nhân tố tiềm ẩn K ảnh hưởng đến kết dự đoán thuật toán Cuối cùng, hệ thống chúng tơi tư vấn mơn học tùy chọn cho sinh viên đầu học kì Từ khóa: Hệ thống gợi ý, Phân rã ma trận, Dự đoán kết học tập, Lựa chọn môn học tự chọn, Học máy Mở đầu Cơ sở liệu điểm số sinh viên lưu trữ trường đại học cao đẳng lớn Tuy nhiên nguồn thông tin to lớn thường sử dụng để quản lí tổng hợp đánh giá kết học tập sinh viên cách đơn giản mà chưa khai thác triệt để nhằm mang lại thơng tin hữu ích phục vụ cho sinh viên Hiện với hình thức đào tạo theo tín việc lựa chọn mơn học không phù hợp nguyên nhân khiến số lượng sinh viên bị cảnh cáo buộc thơi học có chiều hướng gia tăng Vì vấn đề đặt cần phải có hệ thống dự đốn lực sinh viên đơn giản dự đoán điểm số sinh viên để từ đưa định hướng, gợi ý giúp sinh viên có lựa chọn mơn học phù hợp học tập tốt Ngày nhận bài: 7/7/2015 Ngày nhận đăng: 15/11/2015 Liên hệ: Lê Thị Đào, e-mail: ledaolq5982@gmail.com 204 Hệ thống gợi ý lựa chọn môn học tự chọn cho sinh viên Trường Đại học Sư phạm Hà Nội Một số nghiên cứu trước giải vấn đề dự đoán kết học tập theo hướng tiếp cận luật kết hợp Một số nghiên cứu khác lại tập trung phân tích kĩ thuật khai phá liệu dựa toán dự đoán kết học tập sinh viên [4,6] Nhưng nói chung, nghiên cứu thường đánh giá quy luật chung lực học tập cho sinh viên chưa dự đoán cho sinh viên cụ thể Hệ thống gợi ý ứng dụng rộng rãi nhiều lĩnh vực Gần đây, số hướng tiếp cận Recommender System Lọc cộng tác, K-Nearest-Neighbor (KNN), Matrix Factorization [1,2,3] ứng dụng vào lĩnh vực giáo dục để giải toán dự đoán lực học tập cho sinh viên Tuy nhiên, nghiên cứu tập trung vào đánh giá, so sánh độ xác giải thuật mà chưa áp dụng vào phân thích giải tốn cụ thể Trường Đại học Sư Phạm Hà Nội (ĐHSPHN) 19 trường đại học trọng điểm hệ thống giáo dục Việt Nam Hiện nay, trường có tổng số 23 khoa với quy mô đào tạo 12000 sinh viên đại học quy Năm 2009 trường ĐHSPHN bắt đầu áp dụng hình thức đào tạo tín cho sinh viên quy hệ đại học để thay cho hình thức đào tạo liên chế trước Với hình thức đào tạo tín chỉ, sinh viên tự lập kế hoạch học tập cho phù hợp với khả thời gian riêng Tuy nhiên, khơng có kinh nghiệm nên nhiều sinh viên lựa chọn số môn học không phù hợp với lực dẫn đến kết học tập bị dừng học Trong nghiên cứu này, đề xuất xây dựng hệ thống gợi ý nhằm tư vấn lựa chọn môn học tự chọn cho sinh viên trường ĐHSPHN Dựa nghiên cứu trước đó, chúng tơi lựa chọn phương pháp Bias Matrix Factorization để dự đoán kết học tập sinh viên từ đưa gợi ý lựa chọn môn học tự chọn để hỗ trợ cho em 2.1 Nội dung nghiên cứu Bài toán gợi ý môn học tự chọn Hiện hầu hết trường đại học đào tạo theo hình thức tín Trong học kì, sinh viên phải học số môn học bắt buộc số môn học tự chọn Ví dụ, trường đại học có khoảng 10.000 đến 40.000 sinh viên, sinh viên học kì phải lựa chọn khoảng mơn học 19 môn học tự chọn Đa số sinh viên phân vân lựa chọn môn học phù hợp với khả Khi đó, hệ thống RS trợ giúp sinh viên giải vấn đề Đầu tiên, hệ thống RS khai thác thơng tin điểm số sinh viên để từ đưa kết dự đoán cho sinh viên theo học kì, trước sinh viên tham gia lập kế hoạch học tập đầu học kì Từ kết dự đoán, hệ thống cung cấp gợi ý nên chọn môn học môn tự chọn áp dụng cho chương trình đào tạo Ví dụ, có năm sinh viên sv1, sv2, sv3, sv4 sv5 học môn môn1, môn 2, mơn 3, mơn 4, mơn trình bày ma trận Hình 1, ma trận chứa số điểm sinh viên học môn học tương ứng, sinh viên chưa học môn điền giá trị dấu chấm hỏi “ ? ” Trong năm mơn học có ba môn học tự chọn môn 3, môn 4, môn Sinh viên cần chọn hai môn ba môn học tự chọn cho phù hợp với (có khả đạt điểm cao) Như vậy, hệ thống RS cần gợi ý cho sinh viên sv5 nên học hai môn ba môn môn 3, môn 4, môn Để gợi ý lựa chọn môn học cho sinh viên, hệ thống RS cần dự đoán dấu “?” ma 205 Lê Thị Đào, Lê Thị Tú Kiên Hình1 Dữ liệu điểm với ba mơn cần dự đốn sinh viên sv5 trận số có giá trị từ đến 4, Hình Sau đó, dựa ràng buộc tổng số tín hay số mơn học tự chọn mà sinh viên cần học học kì, hệ thống RS đưa đưa gợi ý lựa chọn mơn học cho sinh viên Trở lại ví dụ trên, hệ thống cần gợi ý hai môn học tự chọn cho sinh viên sv5 hai môn môn mơn Vì hai mơn học có số điểm dự đốn cao mơn (3 > 2) Hình Bảng điểm sau dự đốn hướng gợi ý Như vậy, toán gợi ý lựa môn học bao gồm hai pha Pha thứ dự đoán kết học tập pha thứ hai gợi ý môn học tùy chọn dựa vào kết dự đoán pha thứ ràng buộc khác Để thực pha thứ nhất, sử dụng giải thuật MatrixFactorization kết hợp lượng giá trị lệch (Bias Matrix Factorization) [1,5] Trong phần tiếp, theo bày chi tiết giải thuật 2.2 Giải thuật Bias Matrix Factorization 2.2.1 Giải thuật Matrix Factorization (MF) Giải thuật phân rã ma trận Matrix Factorization phương pháp phân rã ma trận X ∈ thành hai ma trận có kích thước nhỏ W H [1] cho xây dựng lại ma trận X từ hai ma trận nghĩa X ≈ W H T , minh họa Hình Trong đó, W ∈ ℜ|U | × K ma trận mà dòng véc tơ bao gồm K nhân tố tiềm ẩn mô tả người dùng u H ∈ ℜ|I|× K ma trận mà dòng véc tơ bao gồm K nhân tố tiềm ẩn (latent factors) mô tả cho item i, thông thường K