Các yếu tố ảnh hưởng đến độ chính xác tư vấn

Một phần của tài liệu tìm hiểu phương pháp lọc cộng tác dựa trên item (Trang 43 - 45)

- Ảnh hưởng của dữ liệu đầu vào: Trong nhiều hệ thống tư vấn, số những đánh giá thu được thường rất nhỏ so với số những đánh giá cần có cho dự đoán. Sự thành công của hệ thống tư vấn lọc cộng tác phụ thuộc vào giá trị của đại đa số những người dùng chính. Chẳng hạn, trong hệ thống tư vấn điện ảnh, có rất nhiều bộ phim đã được đánh giá chỉ bởi một vài người và những bộ phim này khả năng được tư vấn là rất ít, thậm chí ngay cả khi trong số đó có những người dùng đưa ra đánh giá rất cao về chúng. Cũng như vậy, đối với những người dùng mà thị hiếu của họ khác thường so với một số đông người khác thì sẽ không có người dùng nào

được tư vấn về những thị hiếu giống họ, dẫn đến việc tư vấn nghèo nàn. Một phương pháp vượt qua tính thưa thớt trong đánh giá là sử dụng thông tin cá nhân của người dùng khi tính toán sự tương đồng giữa những người dùng. Hai người dùng được xem là giống nhau không khi được đánh giá có sở thích về các bộ phim là giống nhau mà chúng còn phải thuộc cùng một đối tượng. Chẳng hạn, sử dụng giới tính, tuổi, địa chỉ khu vực, nền giáo dục và thông tin công việc của những người dùng trong việc tư vấn nhà hàng. Sự mở rộng của những kỹ thuật lọc cộng tác thường được gọi là “lọc demographic” .

Một vấn đề trước khi xây dựng ma trận đánh giá, với những sản phẩm ít được đánh giá, hoặc những người dùng ít đánh giá sản phẩm, những người dùng và sản phẩm này sẽ không hữu ích trong quá trình tư vấn. Vấn đề cần chọn lọc ra những sản phẩm và người dùng để tham gia trong quá trình tư vấn. Rõ ràng những sản phẩm mới hoặc người dùng mới không thể tham gia trong quá trình dự đoán, hoặc những sản phẩm hay người dùng có đánh giá ít hơn 1 ngưỡng nào đó cũng được loại ra.

- Ảnh hưởng của thuật toán tính độ tương tự: Để xây dựng ma trận tương tự, các giá trị được tính toán theo một công thức được đề xuất ở trên hoặc một công thức khác. Các công thức tính toán khác nhau sẽ cho ra các ma trận đánh giá khác nhau, dẫn đến kết quả tư vấn không đồng nhất. Nhiều chuyên gia đánh giá, với thuật toán có sự tham gia của đánh giá trung bình sẽ có kết quả tốt hơn. Chương 3 sẽ thí nghiệm kết quả tư vấn với các thuật toán tính độ tương tự và đưa ra nhận xét về độ chính xác của kết quả tư vấn khi áp dụng các độ tương tự khác nhau.

- Ảnh hưởng của số lượng lân cận tham gia vào dự đoán: Thông qua quá trình tính ma trận tương tự, hệ thống tư vấn sử dụng những sản phẩm lân cận nhất với sản phẩm đang xét để đưa vào dự đoán, số lượng lân cận ảnh hưởng đến chất lượng của kết quả tư vấn. Chọn số lượng lân cận có thể dựa vào số lượng lân cận của sản phẩm hoặc dựa vào giá trị của độ đo tương tự. Ví dụ: Trong hệ thống tư vấn phim với số bộ phim là 1000 bộ phim, khi cần tư vấn 1 bộ phim, có thể sẽ xét trên 100 bộ phim lân cận với bộ phim đang xét, hoặc là xét với những bộ phim lân cận

có độ tương tự lớn 0.75. Số lượng lân cận tham gia vào dự đoán ảnh hưởng đến quá trình đưa ra dự đoán, nhiều chuyên gia lựa chọn những sản phẩm có độ tương tự 0.75 để tham gia vào dự đoán.

Một phần của tài liệu tìm hiểu phương pháp lọc cộng tác dựa trên item (Trang 43 - 45)

Tải bản đầy đủ (DOC)

(60 trang)
w