(Item-based CF)
Mô hình Item-based CF nghiên cứu trong phần này về cơ bản là tương tự với mô hình User-based CF. Điểm khác biệt của Item-based CF là nó dự đoán kết quả học tập dựa trên độ tương tự giữa các môn học thay vì dựa trên độ tương tự giữa các sinh viên như trong mô hình User-based CF. Điều đó có nghĩa là điểm môn học cần dự đoán của sinh viên sẽ dựa vào điểm các môn học mà sinh viên đã đạt được trước đó và độ tương tự giữa các môn học này với nhau.
Giống mô hình User-based CF, để tính được độ tương tự của hai môn học bất kỳ, ta coi nó là độ tương tự giữa hai vector điểm của hai môn đó. Và tương tự, ta cũng cần loại bỏ đi các phần tử rỗng ở trong ma trận G trước khi tính độ tương tự của hai môn học. Như đã trình bày ở phần Tiền xử lý dữ liệu trong mô hình User-based CF, có hai phương pháp để điền giá trị vào các phần tử rỗng của ma trận G. Và vì với mô hình Item-based CF tính dựa trên độ tương tự giữa các môn học nên luận văn sẽ áp dụng phương pháp thứ hai là điền giá trị trung bình cột, hay còn gọi là điểm trung bình mà các sinh viên đạt được với môn học đó.
Huấn luyện
Mô hình Item-based CF khác với mô hình User-based CF đã trình bày ở trên là có thể tính độ tương tự trong giai đoạn huấn luyện mà không cần tới điểm tổng kết môn của sinh viên đang muốn dự đoán. Ta vẫn sử dụng hai phương pháp tính độ tương tự cosine và tương quan pearson để tính ma trận tương tự giữa các môn học với nhau, và coi ma trận tương tự tính được trên tập dữ liệu huấn luyện là ma trận tương tự cố định trong các lần dự đoán. Công thức để tính độ tương tự giữa các môn học giống với ở mô hình User-based CF nhưng thay thế ma trận G bằng ma trận chuyển vị của ma trận G là GT.
Dự đoán kết quả học tập
Với x, y là hai môn học bất kỳ có trong dữ liệu huấn luyện và sim(x, y) là độ tương tự của hai môn học này, ta sẽ dự đoán điểm môn x của sinh viên a theo công thức:
𝑝𝑟𝑒(𝑎, 𝑥) = 𝐺𝑇 𝑥 +∑ (sim(𝑥,𝑦)(𝑔𝑎𝑦−𝐺 𝑇 𝑦)) 𝑦∈𝐶 [𝑔′𝑎𝑦≠𝑛𝑢𝑙𝑙] ∑𝑦∈𝐶sim(𝑥,𝑦)[𝑔′𝑎𝑦≠𝑛𝑢𝑙𝑙] (2.4)