Thuật toán lọc cộng tác đơn giản

Một phần của tài liệu Tư vấn học tập trong giáo dục điện tử (Trang 43)

4.2.1.1. Thuật toán tính toán độ tƣơng tự

Mô ̣t bước quan tro ̣ng trong các thuâ ̣t toán lo ̣c cô ̣ng tác dựa trên mô hình là tính toán độ tương tự giữa các khóa học và sau đó lựa chọn các khóa học có độ tương tự cao nhất. Ý tưởng chính trong việc tính toán độ tương tự giữa hai khóa học ij là phải tách đươ ̣c những sinh viên đã đánh giá cho cả hai khóa ho ̣c và sau đó áp du ̣ng kỹ thuâ ̣t tính đô ̣ tương tự để quyết đi ̣nh đô ̣ tương tự s ij. Cách thức tính độ tương tự chúng tôi lựa cho ̣n là đô ̣ tương tự dựa trên tương quan (correlation).

Độ tương tự giữa hai khóa ho ̣c ij được đo bằng cách tính tương quan Pearson-r corrij. Trướ c hết, chúng tôi phải cô lập những sinh viên đã đánh giá cả hai sản phẩm. Tâ ̣p những sinh viên đã đánh giá cả hai khóa ho ̣c ij kí hiệu là U , khi đó đô ̣ tương tự tương quan được cho bởi công thức:

            U u u j j U u ui i U u ui i u j j j i R R R R R R R R corr j i sim 2 , 2 , , , , ) ( ) ( ) )( ( ) , (

Trong đó, Ru,i là đánh giá của sinh viên u đối với khóa học i, Ri là đánh giá trung bình của khóa học i.

4.2.2. Thuật toán tính toán dự đoán

Bước quan tro ̣ng nhất trong các hê ̣ thống tư vấn dựa trên lo ̣c cô ̣ng tác là sinh ra các kết quả dưới dạng dự đoán . Sau khi, đã tách được tâ ̣p những khóa ho ̣c tương t ự nhất dựa trên đô ̣ đo tương quan, chúng ta sẽ tìm trong cá c đánh giá của sinh viên hiê ̣n tại và sử dụng kỹ thuâ ̣t sinh dự đoán dựa trên tro ̣ng số:

Kỹ thuật này sẽ tính toán dự đoán cho một khóa học i đối vớ i sinh viên u bằng cách tính tổng các đánh giá mà sinh viên đã đưa ra cho các khóa học tương tự với i . Mỗi đánh giá được gán cho tro ̣ng số chính bằng đô ̣ tương tự giữa s ij giữa hai khóa ho ̣c i và j. Mô ̣t cách hình thức, dự đoán được kí hiê ̣u Pu,i:

     N ngtu khoahoctuo iN N ngtu khoahoctuo iN uN i u S R S P , , , , , , ) ( ) * (

Về cơ bản , thuâ ̣t toán nà y cố gắng tìm ra cách thức sinh viên hiê ̣n ta ̣i đánh giá các khóa học tương tự . Tổng có tro ̣ng số chia cho tổng số các đô ̣ tương tự để thu được dự đoán trong khoảng cho trước.

4.2.3. Xác định đánh giá trong hệ tƣ vấn

Lọc cộng tác là môi trường trong đó một cộng đồng người tụ lại để cùng chia sẻ gánh nặng chọn lọc thông tin. Ví dụ, mô ̣t hê ̣ thống ho ̣c trực tuyến với 50 khóa học. Bất kỳ sinh viên nào cũng không thể có thời gian học hết 50 khóa học đó, nhưng có mô ̣t nhóm 50 sinh viên , mỗi sinh viên của nhóm có thể ho ̣c mô ̣t khóa học và thẩm định chất lươ ̣ng của khóa học đó. Chúng tôi cho rằng sinh viên đánh giá khóa học có nghĩa là họ đưa cho chúng ta một đánh giá - Rating. Nếu đánh giá của sinh viên cho khóa học đó đủ cao thì khóa học đó sẽ được tư vấn có các sinh viên còn lại. Nếu lần lượt học từng khóa học , sinh viên sẽ mất nhiều thời gian để ho ̣c 50 khóa học đó và tìm những thứ bổ ích trong các môn đ ó. Trong thực tế, không mô ̣t sinh viên nào có thể có cùng những sở thích hay sự quan tâm của mình cho sinh viên khác . Ví dụ, chúng tôi kiểm tra sự đánh giá của mô ̣t sinh viên là A, và tìm ra 10 sinh viên khác trong nhóm có những đáng giá tương tự như sinh viên A, là những người cũng học khoảng 3 khóa học như A và có cùng đánh giá với A. Ví dụ Sinh viên A có thể tham gia đăng ký vào Bộ môn Công nghê ̣ phần mềm và rất quan tâm đến các khóa học trong đó , do vâ ̣y sinh viên A sẽ ho ̣c và đánh giá tốt các khóa học khác liên quan đến bộ môn đó. Sinh viên A có thể có sự tương tự với 10 sinh viên khác có cùng quan tâm tới các khóa học và đánh giá có chất lượng tốt các khóa học đó. Và chúng tôi gọi những sinh viên đó là “láng giềng” của sinh viên A . Khi chúng tôi đã xác nhâ ̣n được “ láng giềng” của sinh viên A, chúng tôi có thể xem xét các khóa học đã được đánh giá có chất lượng đó qua “láng giềng” của sinh viên A , mà sinh viên A chưa tham gia vào . Sau đó chúng tôi sẽ tư vấn những khóa học đó cho sinh viên A để có thể tham gia vào khóa học đó. Mô ̣t danh sách các khóa học như vâ ̣y được biết như là mô ̣t tâ ̣p các tư vấn.

4.2.4. Các phƣơng phá p thể hiê ̣n cho viê ̣c đánh giá

Hê ̣ tư vấn đưa ra các đánh giá như là đầu vào và sau đó đưa ra sự tư vấn và đoán trước ở kết quả, E-Recommedner có 3 phương pháp cho viê ̣c đánh giá.

 Đánh giá dữ liê ̣u đa giá tri ̣: Mỗi mô ̣t đánh giá là mô ̣t số trong mô ̣t tỉ lê ̣ đã được đi ̣nh nghĩa trước . Mức thấp chỉ cho thấy là khóa học đó ít được quan tâm và sinh viên cảm thấy rằng khóa học đó không phù hợp . Còn ở mức cao chỉ cho thấy khóa học đó có giá trị cao và được quan tâm nhiều . Đánh giá đa giá tri ̣ đưa ra trong hê ̣ tư vân này có tỷ lê ̣ là từ 1 đến 5.

 Dữ liêu nhi ̣ phân: Mỗi đánh giá sẽ là 0 hoă ̣c 1, ví dụ chúng tôi có thể đưa ra một

số các câu hỏi để hỏi sinh viên “Ba ̣n có muốn ho ̣c mô ̣n ho ̣c đó không ?” Trả lời. Có hoặc không? Nếu có thì đánh giá là 1, còn không thì đánh giá là 0.

 Dữ liê ̣u đơn phân (Unary): Dữ liê ̣u này đòi hỏi phức ta ̣p . Nếu ba ̣n là mô ̣t quản

trị trong hệ học tập trực tuyến, bạn sẽ phải đưa ra các bản ghi liên quan đến sinh viên của ba ̣n . Và bạn biết chính xác rằng khóa học nào mà họ tham gia . Thực tết rằng mô ̣t sinh viên có thể tham gia vào mô ̣t khóa học được chỉ dẫn là có khả năng xẩy ra cao mà sinh viên tham gia và ho ̣c khóa học đó. Do đó chúng tôi sẽ phải có một sự đánh giá chắc chắn . Tuy nhiên, vì sinh viên không tham gia vào khóa học cụ thể nào , nên chúng tôi thực sự sự không thể hướng dẫn rằn g ho ̣ không thích khóa học đó. Do đó đây thực ra chỉ là mô ̣t giá tri ̣ đánh giá và dữ liê ̣u thì không phải là nhi ̣ phân.

Hiê ̣n ta ̣i E-Recommender được thiết kế và thử nghiê ̣m tốt nhất cho viê ̣c đánh giá dữ liê ̣u đa giá tri ̣. Tuy nhiên nó cũng có thể rất thành công với dữ liê ̣u nhi ̣ phân . Còn dữ liê ̣u đơn phân thì là vấn đề rất khó. E-Recommender sẽ chỉ làm việc với dữ liệu đơn phân nếu chúng ta chuyển dữ liê ̣u về da ̣ng nhi ̣ phân hoă ̣c dữ liê ̣u đánh giá đa giá tri ̣.

Một phần của tài liệu Tư vấn học tập trong giáo dục điện tử (Trang 43)

Tải bản đầy đủ (PDF)

(64 trang)